Xem mẫu

  1. Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hệ Thống Hỗ Trợ Nông Dân Trên Thiết Bị Di Động: Nhận Dạng Cua Giống Nguyễn Thiện An và Nguyễn Thái Nghe Khoa CNTT&TT, Trường Đại học Cần Thơ Email: ntankg@gmail.com; ntnghe@cit.ctu.edu.vn Tóm tắt - Bài viết này là một phần trong giải pháp xây dựng hệ cho mỗi lần bán. Chính vì thế, người dân đang rất cần một thống hỗ trợ nông dân trên thiết bị di động mà nhóm chúng tôi phương pháp hiệu quả hơn. đề xuất. Trong phạm vi của nghiên cứu này, chúng tôi đề xuất xây dựng mô hình “Nhận dạng cua giống” trên nền thiết bị di Bên cạnh đó, công nghệ Xử lý ảnh và Thị giác máy tính đã động, trước mắt là các thiết bị chạy hệ điều hành Android. Mô được áp dụng rộng rãi trong rất nhiều lĩnh vực, như: Y học, hình nhận dạng được xây dựng dựa trên giải thuật Boosting phân Giáo dục, Thiên văn, Công nghiệp, Nông nghiệp,…Một số tầng có sử dụng đăc trưng Haar-like. Thông qua ảnh chụp từ ứng dụng tiêu biểu như: Xử lý ảnh trong Y học (McAuliffe et thiết bị di động (ví dụ, chụp ảnh chậu chứa cua giống), hệ thống al., 2001) (Pierre et al., 2002), xử lý ảnh vệ tinh trong Thiên sẽ lọc nhiễu theo phương pháp lọc trung vị (Median Filter) để văn (John R. Jensen and Dr. Kalmesh Lulla, 1987), nhận dạng nâng cao chất lượng ảnh, loại bỏ các chi tiết không cần thiết. Kế đến, dựa trên đặc trưng Haarlike kết hợp với giải thuật Boosting dấu vân tay trong Khoa học Hình sự (Hong L., Yifei Wan, phân tầng, hệ thống sẽ nhận dạng và đếm số lượng cua giống có Jain A., 1998), nhận dạng mặt người (Châu Ngân Khánh, trong ảnh. Kết quả thực nghiệm bước đầu đã cho thấy việc nhận Đoàn Thanh Nghị, 2014), nhận dạng chữ viết tay (Phạm Anh dạng cua giống dựa trên mô hình đã xây dựng là rất khả quan. Phương et al., 2009), nhận dạng biển số xe (Nguyễn Thái Mô hình này sẽ được cải tiến hơn nữa để có thể áp dụng vào thực Nghe et al., , 2014), nhận dạng biển báo giao thông (Bahlmann tế. et al., 2005), Robot thu hoạch nông sản trong Nông nghiệp (Bulanon et al., 2002) (Wei et al., 2012),… Từ khóa- Xử lý ảnh, thị giác máy tính, đặc trưng Haar-like, nhận dạng cua giống, nhận dạng trên thiết bị di động. I. GIỚI THIỆU Đồng bằng sông Cửu Long là vùng rất phát triển nghề nuôi trồng thuỷ sản. Đặc biệt, ở một số tỉnh giáp biển như: Cà Mau, Bạc Liêu, Kiên Giang, Trà Vinh,… do đất sản xuất bị nhiễm mặn nên việc trồng lúa nước cho sản lượng không cao, chất lượng lại thấp. Vì vậy, từ nhiều năm nay nghề nuôi thuỷ sản nơi đây đã trở thành nghề chủ đạo thay cho trồng lúa nước, trong đó nuôi cua biển là ngành kinh tế mang lại thu nhập khá cao cho nông dân. Hàng năm, khi đến thời điểm thả con giống, người nông dân thường ra trại cua (là nơi sản xuất cua con) để mua cua giống (cua con, kích thước nhỏ, như minh họa trong Hình 1 phần trên) về nuôi. Cua giống có kích thước nhỏ nhưng lại được bán theo đơn vị “con” và cách xác định số lượng chủ yếu là đếm và ước lượng là chính. Do đó, số lượng cua thực tế sẽ ít hơn số lượng cua được ước lượng rất nhiều. Chẳng hạn, nếu người mua muốn mua 1000 con, người bán sẽ đếm 100 con cho vào một chậu nhỏ làm “chậu mẫu”, sau đó dùng 1 chậu khác có kích thước giống chậu mẫu và cho cua vào đó đến khi thấy màu sắc, số lượng giống như chậu mẫu thì xem như chậu đó cũng chứa 100 con, như minh họa trong Hình 1 (trên). Lặp lại tương tự với các chậu khác cho đến khi đủ 10 chậu, tức là đã đủ 1000 con. Qua tìm hiểu từ những người nông dân có kinh nghiệm thì tỷ lệ cua được mua thực tế khoảng 80% so với tỷ lệ ước lượng. Hình 1. Cua giống được đếm khi bán (ảnh trên) và cua trưởng Tức là khi người mua mua 1000 con thì số lượng thực tế chỉ thành (ảnh dưới) khoảng 800 con, điều này đã gây thiệt thòi khá nhiều cho nông dân, mặc dù người bán cũng đã có “bù thêm” một số lượng ISBN: 978-604-67-0635-9 159
  2. Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Từ những phân tích trên, chúng tôi thấy rằng việc áp dụng công nghệ xử lý ảnh vào Nông nghiệp, đặc biệt là ngành nuôi trồng Thuỷ sản là rất cần thiết nhưng vẫn chưa được nghiên cứu tốt. Trong bài viết này, chúng tôi đề xuất xây dựng mô hình “Nhận dạng và đếm số lượng cua giống” trên thiết bị di động nhằm hỗ trợ nông dân một cách đếm khác thay cho cách đếm truyền thống khi đi mua cua giống. Đây cũng là cách giúp người Nông dân bảo vệ quyền lợi cũng như tạo ra sự công bằng khi mua bán. Hình 3. Các đặc trưng Haar-like mở rộng II. CÁC NGHIÊN CỨU LIÊN QUAN Giá tri ̣ của đặc trưng Haar-like là sự chênh lệch giữa tổ ng các Nhận dạng là lĩnh vực đang rất được quan tâm trong nghiên điể m ảnh của các vùng đen và các vùng trắ ng theo công thức: cứu khoa học cũng như thương mại. Kết quả của các công f(x)=Sumblack rectangle (pixel gray level) – Sumwhite rectangle (pixel trình nghiên cứu về nhận dạng đã được thương mại hoá trong gray level) các sản phẩm điện tử tiêu biểu như: máy ảnh kỹ thuật số, điện thoại thông minh,… với tính năng xác định gương mặt, nụ Như vậy, để tính toán các giá trị của đặc trưng Haar-like ta cười khi chụp ảnh. Hay chức năng Tag ảnh trong các mạng xã phải tính tổng các vùng pixel trên ảnh. Nếu muốn tính các giá hội nổi tiếng như: Facebook, Twitter, Instagram,… với chức trị của các đặc trưng cho tất cả các vùng trên ảnh ta phải tốn năng nhận dạng gương mặt. Ngoài ra, còn rất nhiều nghiên chi phí tính toán khá lớn, không thể đáp ứng cho các ứng dụng cứu khoa học về nhận dạng như: nhận dạng chữ viết tay, nhận chạy thời gian thực. Do đó, để có thể tính nhanh các đặc trưng dạng biển số xe, nhận dạng mặt người… này, Viola và Jones (2001; 2004) giới thiệu khái niệm ảnh tích phân (Integral Image). Integral Image là một mảng hai chiề u Trong rất nhiều nghiên cứu về nhận dạng vẫn chưa thấy với kích thước bằ ng kích thước của ảnh cầ n tính giá tri ̣ đặc nghiên cứu nào liên quan đến vấn đề nhận dạng cua giống trưng Haar-like, với mỗi phần tử của mảng này được tính bằng trong ngành nuôi trồng Thuỷ sản. Vì vậy mô hình “Nhận dạng cách tính tổng của điểm ảnh phía trên (dòng-1) và bên trái cua giống” sẽ góp phần làm phong phú thêm các lĩnh vực có (cột-1) của nó. Bắt đầu từ vị trí trên, bên trái đến vị trí dưới, thể áp dụng kỹ thuật nhận dạng và đặc biệt là việc ứng dụng bên phải của ảnh, việc tính toán này đơn thuần chỉ dựa trên công nghệ cao phục vụ Nông Nghiệp - Nông dân – Nông thôn. phép cộng số nguyên đơn giản, do đó tốc độ thực hiện rất nhanh. III. ĐẶC TRƯNG HAAR-LIKE VÀ GIẢI THUẬT BOOSTING PHÂN TẦNG A. Đặc trưng Haar-like Đặc trưng Haar-like (Paul A. Viola and Michael J. Jones, 2001) đươ ̣c sử du ̣ng trong việc nhận da ̣ng đố i tươṇ g trong ảnh số . Mỗ i đặc trưng Haar-like là sự kế t hơ ̣p gồ m 2 hoặc 3 hình chữ nhật đen, trắng với nhau theo một trật tự, một kích thước Hình 4. Tính giá trị ảnh tích phân tại điểm có toạ độ P(x,y) nào đó. Những khố i chữ nhật này thể hiện sự liên hệ tương quan giữa các bộ phận trong ảnh mà bản thân từng giá tri ̣pixel Giá trị của điểm P có toạ độ (x,y) được tính theo công thức không thể diễn đa ̣t đươ ̣c. Có 4 đặc trưng Haar-like cơ bản thể sau: hiện ở Hình 2 như sau Sau khi đã tính được ảnh tích phân, việc tính tổng giá trị mức xám của vùng ảnh bất kỳ nào đó ta tính được dễ dàng như sau: Giả sử ta cần tính tổng giá trị mức xám của vùng D như trong Hình 2. Đặc trưng Haar-like cơ bản Hình 5, ta tính như sau: Từ 4 đặc trưng cơ bản, đặc trưng Haar-like còn được mở rộng D = A + B + C + D – (A+C) – (A+B) + A thành nhóm các đặc trưng đường, đặc trưng cạnh, đặc trưng tâm (Lienhart, Kuranov, Pisarevky, 2002; Lienhart, Maydt, 2002). Hình 5. Tính nhanh giá trị mức xám vùng ảnh D 160
  3. Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Với A+B+C+D là giá trị tại điểm P4 trên Integral Image, đố i tươ ̣ng nhận diện) mà tầ ng trước nó nhận da ̣ng sai, tức là nó tương tự như vậy A+C là giá trị tại điểm P3, A+B là giá trị tại sẽ tập trung ho ̣c từ các mẫu background khó hơn, do đó sự kế t điểm P2, và A là giá trị tại điểm P1. Vậy ta có thể viết lại biểu hơ ̣p các tầ ng AdaBoost này la ̣i sẽ giúp bộ phân loa ̣i giảm thiể u thức tính D ở trên như sau: nhận da ̣ng lầ m. Với cấ u trúc này, những mẫu background dễ nhận da ̣ng sẽ bi ̣ loa ̣i ngay từ những tầ ng đầ u tiên, giúp đáp 𝐷𝐷 = (𝑥𝑥4 , 𝑦𝑦4 ) − (𝑥𝑥3 , 𝑦𝑦3 ) − (𝑥𝑥2 , 𝑦𝑦2 ) + (𝑥𝑥1 , 𝑦𝑦1 ) ứng tố t nhấ t thời gian xử lý và vẫn duy trì đươ ̣c hiệu quả phát hiện đố i tươ ̣ng (Châu Ngân Khánh, Đoàn Thanh Nghị, 2014). B. Thuật toán Adaboost Thuật toán Adaboost (Adaptive Boosting) là thuật toán máy học được cải tiến từ thuật toán Boosting (Freund, Schapire, 1995) được giới thiệu vào năm 1995. Adaboost là một bộ phân loại phi tuyến phức, hoạt động theo nguyên tắc kết hợp tuyến Hình 6. Mô hình Cascade of Boosted Classifiers (Javier, tính các bộ phân lớp yếu (weak classifiers) thành một bộ phân 2006) lớp mạnh (Strong Classifiers). AdaBoost sử du ̣ng tro ̣ng số để đánh dấ u các mẫu khó nhận da ̣ng. Trong quá trình huấ n luyện cứ mỗ i bộ phân loa ̣i yế u đươc̣ xây dựng thì thuật toán sẽ tiế n IV. ĐỀ XUẤT MÔ HÌNH NHẬN DẠNG hành cập nhật la ̣i tro ̣ng số để chuẩ n bi ̣ cho việc xây dựng bộ phân loa ̣i tiế p theo. Cập nhật bằ ng cách tăng tro ̣ng số của các mẫu nhận da ̣ng sai và giảm tro ̣ng số của các mẫu đươ ̣c nhận Hệ thống “Nhận dạng và đếm số lượng cua giống” được xây da ̣ng đúng bởi bộ phân loa ̣i yế u vừa xây dựng. Bằ ng cách này dựng qua 2 bước. Thứ nhất, xây dựng mô hình nhận dạng đối thì bộ phân loa ̣i sau có thể tập trung vào các mẫu mà bộ phân tượng sử dụng giải thuật Boosting phân tầng và đặc trưng loa ̣i trước nó làm chưa tố t. Cuố i cùng các bộ phân loa ̣i yế u sẽ Haar-like. Thứ hai, triển khai mô hình đã xây dựng lên thiết bị đươ ̣c kế t hơ ̣p la ̣i tùy theo mức độ tố t của chúng để ta ̣o nên một di động nền tảng Android để nhận dạng và đếm số lượng cua bộ phân loa ̣i ma ̣nh. giống. Bộ phân loại hk được biểu diễn như sau: A. Xây dựng mô hình nhận dạng cua giống 1 𝑛𝑛ế𝑢𝑢 𝑝𝑝𝑘𝑘 𝑓𝑓𝑘𝑘 (𝓍𝓍) < 𝑝𝑝𝑘𝑘 𝜃𝜃𝑘𝑘 Quy trình nhận dạng cua giống thông qua các bước chính như ℎ𝑘𝑘 (𝑥𝑥) = { mô tả trong Hình 7. 0 𝑛𝑛ế𝑢𝑢 𝑛𝑛gược 𝑙𝑙ạ𝑖𝑖 Với x là cửa sổ con cần xét, 𝜃𝜃𝑘𝑘 là ngưỡng, 𝑓𝑓𝑘𝑘 là giá trị đặc trưng Haar-like và 𝑝𝑝𝑘𝑘 hệ số quyết định chiều của phương trình (Châu Ngân Khánh, Đoàn Thanh Nghị, 2014). C. Mô hình phân tầng Cascade Mô hình phân tầng Cascade (Cascade of Boosted Classifiers) là mô hình phân tầ ng với mỗ i tầ ng là một mô hình AdaBoost sử du ̣ng bộ phân lớp yế u là cây quyế t đinh ̣ với các đặc trưng Haar-like . Trong quá trình huấ n luyện, bộ phân lớp phải duyệt qua tấ t cả các đặc trưng của mẫu trong tập huấ n luyện. Việc này tố n rấ t nhiề u thời gian. Tuy nhiên, trong các mẫu đưa vào, không phải Hình 7: Mô hình nhận dạng cua giống mẫu nào cũng thuộc loa ̣i khó nhận da ̣ng, có những mẫu background rấ t dễ nhận ra (go ̣i đây những mẫu background Để hệ thống nhận dạng được đối tượng, trước hết cần phải thu đơn giản). Đố i với những mẫu này, chỉ cầ n xét một hay một thập dữ liệu đầu vào để tạo tập dữ liệu học. Trong bài viết này, vài đặc trưng đơn giản là có thể nhận da ̣ng đươ ̣c chứ không dữ liệu đầu vào chính là ảnh cua giống. Có 2 lớp ảnh cần thu cầ n xét tấ t cả các đặc trưng. Nhưng đố i với các bộ phân loa ̣i thập là lớp dương (Positive - ảnh chứa cua giống) và lớp âm thông thường thì cho dù mẫu cầ n nhận da ̣ng là dễ hay khó nó (Negative - ảnh bất kỳ nhưng không chứa cua giống). Ảnh lớp vẫn phải xét tấ t cả các đặc trưng mà nó rút ra đươ ̣c trong quá dương được cắt ra sao cho mỗi ảnh chỉ chứa 1 đối tượng. trình ho ̣c. Do đó, chúng tố n thời gian xử lý một cách không Chúng tôi sử dụng 1.460 ảnh có kích thước 20x20 pixels làm cầ n thiế t. lớp dương và 12.638 ảnh kích thước 320x240 pixels làm lớp Mô hình Cascade of Classifiers đươ ̣c xây dựng nhằ m rút ngắ n âm. thời gian xử lý, giảm thiể u nhận da ̣ng lầ m (False Alarm) cho Khi đã có đủ 2 lớp ảnh, chúng tôi thực hiện giai đoạn tạo mẫu bộ phân loa ̣i. Cascade trees gồ m nhiề u tầ ng (stage hay còn go ̣i theo các bước được trình bày dưới đây. là layer), mỗ i tầ ng là một mô hình AdaBoost với bộ phân lớp yế u là các cây quyế t đinh. ̣ Một mẫu để đươ ̣c phân loa ̣i là đố i tươ ̣ng thì nó cầ n phải đi qua hế t tấ t cả các tầ ng. Các tầ ng sau Bước 1: Tạo tập tin mô tả đối tượng lớp dương, đây là tâp tin đươ ̣c huấ n luyện bằ ng những mẫu âm (Negative – không chứa …. 161
  4. Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) text có cấu trúc: - vec: thư mục chứa tập tin kết quả - 7000: số lượng mẫu Trong đó: - opencv_createsamples: tiện ích tạo mẫu của thư viện - Tên_ảnh_1, Tên_ảnh_n: ảnh thứ nhất, ảnh thứ n có OpenCV chứa đối tượng - -w 20 -h 20: kích thước chiều rộng, cao của ảnh. - Số_đối_tượng: số lượng đối tượng có trong ảnh Sau khi thực hiện Bước 3 chúng tôi thu được các tập tin - x1, y1: toạ độ (tính từ góc trên bên trái) của đối tượng *.vec trong thư mục vec. thứ nhất Bước 4: Tạo tập tin mô tả các tập tin *.vec tương tự như cách - width, height: chiều rộng, cao của hình chữ nhật bao tạo tập tin mô tả đối tượng lớp âm ở Bước 2. Sau bước này quanh đối tượng chúng tôi thu được tập tin vec.txt. Tập tin mô tả đối tượng sau khi tạo có cấu trúc như Hình 8: Bước 5: Sử dụng chương trình mergevec.cpp được viết bởi Natoshi Seo (http://note.sonots.com/) để kết hợp các tập tin *.vec với nhau thành một tập tin vector phục vụ cho bước huấn luyện. Câu lệnh: $ mergevec vec.txt samples.vec Hình 8. Tập tin mô tả đối tượng lớp dương Trong đó: - mergevec: tên chương trình kết nối tập tin *.vec Bước 2: Tạo tập tin mô tả đối tượng lớp âm, đây là tập tin dạng text chứa tên ảnh có cấu trúc: - vec.txt: tập tin mô tả các tập tin *.vec - samples.vec: tập tin kết quả …. Bước 6: Huấn luyện dữ liệu học cho mô hình từ tập tin samples.vec được tạo ở Bước 5. Chúng tôi sử dụng tiện ích opencv_traincascade trong thư viện OpenCV để huấn luyện. Tập tin mô tả đối tượng sau khi tạo có cấu trúc như Hình 9: Câu lệnh: $ ./opencv_traincascade -data trainCascade -vec samples.vec -bg negative.txt -numPos 7000 -numNeg 12638 -numStages 25 -w 20 -h 20 -minHitRate 0.995 -maxFalseAlarmRate 0.5 - percalcValBufSize 2000 -percalcIdxBufSize 2000 -mode ALL Trong đó: Hình 9. Tập tin mô tả đối tượng lớp âm - opencv_traincascade: tên chương trình huấn luyện dữ liệu Trong đó: - -data trainCascade: thư mục chứa tập tin kết quả - Tên_ảnh_1: tên ảnh âm thứ nhất - -vec samples.vec: tập tin vector tạo ở Bước 5 - Tên_ảnh_n: tên ảnh âm thứ n - -bg negative.txt: tập tin mô tả đối tượng lớp âm được tạo ở Bước 2 Bước 3: Tạo mẫu bằng tiện ích opencv_createsamples và createtrainsamples.pl: - -numPos 7000: số lượng mẫu lớp dương - -numNeg 12638: số lượng mẫu lớp âm Tiện ích createtrainsamples.pl được viết bởi Natoshi Seo (http://note.sonots.com, 2015). Tiện ích này cung cấp chức - -numStage 25: số bước huấn luyện năng xoay ảnh theo các trục x, y, z để vét cạn các trường hợp - -w 20 –h 20: kích thước rộng, cao của ảnh khi đối tượng trong ảnh không nằm theo hướng thẳng đứng. - minHitRate 0.995: tỷ lệ nhận dạng đúng thấp nhất Câu lệnh: - -maxFalseAlarmRate 0.5: tỷ lệ cảnh báo sai cao nhất $ perl createtrainsamples.pl positive.txt negative.text vec 7000 - -percalcValBufSize 2000, -percalcIdxBufSize 2000: tỷ lệ “./opencv_createsamples -w 20 -h 20” Ram (MB) được sử dụng khi huấn luyện dữ liệu Trong đó: Khi quá trình huấn luyện kết thúc, chúng tôi thu được tập tin - createtrainsamples.pl: tiện ích xoay ảnh khi tạo mẫu cascade.xml. Đây là tập tin chứa dữ liệu học để giúp hệ thống nhận dạng đối tượng khi triển khai xây dựng hệ thống. Tập tin - positive.txt, negative.txt: tập tin mô tả đối tượng lớp cascade.xml có cấu trúc như Hình 10: dương và lớp âm được tạo ở Bước 2 162
  5. Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) ảnh đã chụp. Hình 10. Cấu trúc tập tin cascade.xml B. Xây dựng hệ thống nhận dạng và đếm cua giống Mô hình tổng quát của hệ thống Nhận dạng và đếm số lượng cua giống được mô tả như Hình 11: Hình 11. Mô hình tổng quát của hệ thống Nhận dạng và đếm số lượng cua giống Sau khi xây dựng xong mô hình nhận dạng, chúng tôi cài đặt mô hình vào ứng dụng chạy trên thiết bị di động, trước mắt là hệ điều hành Android do các thiết bị chạy Android khá phổ biến và giá thành cũng phù hợp với phần lớn người dùng, đặc biệt là nông dân. Hình 12. Kết quả nhận dạng và đếm cua giống. Những con đã được hệ thống nhận dạng được bao trong ô hình chữ nhật. Sau khi cài đặt, ứng dụng cho phép người dùng chụp ảnh chậu chứa cua giống và lưu ảnh vào bộ nhớ điện thoại. Sau đó, hệ Hình 13 minh hoạ kết quả nhận dạng khi chụp cùng bức ảnh ở thống thực hiện tiền xử lý ảnh bằng các phép toán lọc ảnh để Hình 12 nhưng ở góc độ nghiêng. Hệ thống nhận dạng đúng khử nhiễu trước khi tiến hành nhận dạng. Kết quả đầu ra của 245 con trong số 270 con được nhận dạng (ảnh thực là 375 hệ thống là số lượng cua giống được xác định sau khi nhận con). Tuy nhiên độ chính xác thấp hơn nhiều (đạt 65.33%) do dạng bằng mô hình do chúng tôi xây dựng. một đối tượng bị khuất hoặc quá nhỏ. Yếu tố (chủ quan) này sẽ được khắc phục đơn giản bằng cách hướng dẫn người dùng V. KẾT QUẢ MINH HỌA chụp trực diện hình ảnh thay vì chụp nghiêng để có kết quả tốt Trong giai đoạn xây dựng và huấn luyện mô hình, chúng tôi hơn. dùng 12638 ảnh âm (ảnh bất kỳ không phải con cua) và 1460 Thử nghiệm trong môi trường thực tế, chúng tôi đã chụp 9 ảnh ảnh dương (các con cua) để trích xuất 7000 đặc trưng phục vụ sau đó lấy kết quả trung bình, độ chính xác đạt 81.86%. Chúng quá trình huấn luyện. Sau khi huấn luyện xong, mô hình được tôi sẽ tiếp tục việc kiểm thử trên nhiều ảnh khác trong tương lai. triển khai trên thiết bị di động chạy hệ điều hành Android. Từ ảnh chụp các con cua trong chậu, hệ thống tự động nhận VI. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN dạng, đếm và hiển thị số con như minh họa trong Hình 12. Chúng tôi đã đề xuất xây dựng mô hình Nhận dạng cua giống Trong hình này, hệ thống đã nhận dạng và đếm là 356 con. trên thiết bị di động dựa trên giải thuật Boosting phân tầng và Trong đó nhận dạng đúng là 334 con, nhận dạng nhầm là 22 đặc trưng Haar-like. Nghiên cứu này sẽ là tiền đề cho các con trong tổng số lượng cua thực tế trong ảnh là 375, với độ nghiên cứu ứng dụng công nghệ cao để phục vụ Nông nghiệp chính xác tương ứng là 89%. Để độ chính xác được khách – Nông dân – Nông thôn, đặc biệt là các ứng dụng trên nền quan hơn, người sử dụng có thể chụp nhiều lần ở nhiều góc độ thiết bị di động. Kết quả bước đầu đã cho thấy mô hình đề khác nhau, sau đó hệ thống sẽ cho kết quả trung bình trên số 163
  6. Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) xuất là rất khả thi, mặc dù độ chính xác của mô hình chưa 2. Bulanon D.M., Kataoka T., Ota Y., Hiroma T., 2002. được như mong muốn. Automation and Emerging Technologies: A Segmentation Algorithm for the Automatic Recognition of Fuji Apples at Chúng tôi sẽ tiếp tục cải tiến các thuật toán và tập dữ liệu học Harvest. Biosystems Engineering 83(4): 405-412. để tăng độ chính xác cho kết quả nhận dạng. Sau đó phát triển 3. Châu Ngân Khánh, Đoàn Thanh Nghị, 2014. Nhận dạng mặt trên các hệ điều hành thông dụng khác như iOS, Windows người với giải thuật Haar Like Feauture – Cascade of Boosted Phone. Classifiers và đặc trưng SIFT. Tạp chí khoa học Đại học An Giang 3(2): 15-24. 4. Freund, Y., Robert E.Schapire, 1995. A decision- theoretic generalization of on-line learning and an application to boosting. AT&T Labs, New Jersey. 5. Hong L., Yifei Wan, Jain A., 1998. Fingerprint image enhancement: algorithm and performance evaluation. Pattern Analysis and Machine Intelligence, IEEE Transactions 8: 777- 789. 6. Javier Ruiz-del-Solar, Rodrigo Verschae, 2006. Object detection using cascades of boosted classifiers. Universidad de Chile, Chile. 7. John R. Jensen and Dr. Kalmesh Lulla, 1987. Introductory digital image processing: A remote sensing perspective. Geocarto International 1: 65. 8. Lienhart, R., Kuranov, A., & Pisarevsky, V., 2002. Empirical Analysis of Detection Cascades of Boosted Classifiers for Rapid Object Detection. Microprocessor Research Lab, USA. 9. Lienhart, R., Maydt, R., 2002. An Extended Set of Haar-like Features for Rapid Object Detection. Intel Labs, Intel Corporation, Santa Clara, USA. 10. McAuliffe M.J., Lalonde F.M., McGarry D., Gandler W., Csaky K., Trus B.L, 2001. Medical Image Processing, Analysis and Visualization in clinical research. Computer-Based Medical Systems, IEEE Symposium: 381-386. 11. Nguyễn Thái Nghe, Nguyễn Văn Đồng, Võ Hùng Vĩ, 2014. Một giải pháp trong xây dựng hệ thống hỗ trợ giữ xe thông minh. Tạp chí khoa học Trường Đại học Cần Thơ 35: 17-30. 12. Paul A. Viola and Michael J. Jones, 2001. Rapid Object Detection using a Boosted Cascade of Simple Features. IEEE Conference on Computer Vision and Pattern Recognition. 13. Phạm Anh Phương, Ngô Quốc Tạo, Lương Chi Mai, 2009. Kết hợp các bộ phân lớp SVM cho việc nhận dạng chữ Việt viết tay rời rạc. Tạp chí Tin học và Điều khiển học 25(1): 88-97. 14. Pierre Jannin, J Michael Fitzpatrick, David Hawkes, Xavier Pennec, Ramin Shahidi, et al.., 2002. Validation of medical image processing in image-guided therapy. IEEE Transactions on Medical Imaging, Institute of Electrical and Electronics Hình 13. Minh họa kết quả nhận dạng và đếm cua giống Engineers (IEEE) 21(12): 1445-9. khi chụp ở góc nghiêng. 15. Viola, P., Jones, M., 2001. Robust Real-time Object Detection. International Journal of Computer Vision. 16. Viola, P., Jones, M., 2004. Robust Real-time Face Detection. International Journal of Computer Vision, Netherlands. 17. Wei Ji, Dean Z., Fengyi C., Bo Xu, Ying Z., Jinjing Wan, 2012. Automatic recognition vision system guided for apple harvesting robot. Computers &Electrical Eng., 38(5): 1186- 1195. TÀI LIỆU THAM KHẢO 1. Bahlmann C., Ying Zhu, Ramesh V., Pellkofer M., Koehler T., 2005. A system for traffic sign detection, tracking, and recognition using color, shape, and motion information. Intelligent Vehicles Symposium, IEEE: 255-260. 164
nguon tai.lieu . vn