Xem mẫu

  1. CHƯƠNG 1. TỔNG QUAN Chương 1. TỔNG QUAN 1.1 ĐẶT VẤN ĐỀ Theo Tổng cục Thống kê lượng thủy sản nuôi trồng 6 tháng đầu năm 2018 đạt 1.793,5 nghìn tấn, tăng 6,4% so với cùng kỳ năm trước, trong đó cá đạt 1.310,2 nghìn tấn, tăng 6,1%; tôm đạt 292,6 nghìn tấn, tăng 11,2%. Nuôi cá tra là sản phẩm chủ lực của ngành Thuỷ sản Việt Nam sau con tôm. Nhiều năm qua, nghề nuôi cá tra gặp thuận lợi về giá, người nuôi có lãi nên diện tích nuôi được mở rộng. Tính chung 6 tháng, diện tích nuôi cá tra của cả nước ước tính đạt 14,3 nghìn ha, tăng 6,8% so với cùng kỳ năm trước, trong đó diện tích nuôi cá tra thâm canh, bán thâm canh đạt 4,5 nghìn ha, tăng 10,2%; diện tích nuôi cá tra quảng canh và quảng canh cải tiến 9,8 nghìn ha, tăng 5,3%. Sản lượng cá tra 6 tháng ước tính đạt 603,1 nghìn tấn, tăng 8,1% so với cùng kỳ năm trước, trong đó Đồng Tháp đạt 191,8 nghìn tấn, tăng 4,5%; An Giang 159,8 nghìn tấn, tăng 14,7%. Qua đó, số lượng cá giống đã tăng nhanh chóng về chất lượng và số lượng. Toàn vùng đồng bằng sông Cửu Long có 108 cơ sở cho sinh sản nhân tạo cá tra và gần 1.900 hộ ương dưỡng cá giống với diện tích trên 1.500 ha, sản lượng cá bột sản xuất ước đạt 16,5 tỷ con, tập trung tại các tỉnh như: An Giang, Đồng Tháp, Cần Thơ… Trong đó An Giang là tỉnh sản xuất và cung ứng cá tra giống chủ yếu của khu vực đồng bằng sông Cửu Long. Hầu hết giao dịch mua bán cá bột, cá hương, cá giống hiện nay trên thị trường vẫn còn sử dụng phương pháp thủ công để ước lượng và đếm mẫu. Đối với cá bột có 3 cách: cách thứ nhất là dùng cân (loại cân 2 đĩa, cân được 1g trở lên), cân bì trước. Bì là cốc, chậu thuỷ tinh hay bát có chứa một ít nước sạch. Dùng vợt rớt cá bột để bắt cá, giữ vợt để cá vừa ráo nước. Cân 2-5 gam cá thả vào bát nước sạch. Dùng thìa canh múc đếm số cá vừa cân. Lặp lại vài lần như thế, để lấy số trung bình (số con/gam). Biết số lượng cá bán, sẽ tính được khối lượng cá (bao gam), để cân và giao cho nguời mua cá. Cách thứ hai: nhiều địa phương đã tự làm lấy những dụng cụ đặc biệt, chuyên để đong cá bột, goi là cái giăng. Đây là một cái thìa đặc biệt, có hình dạng nửa quả cầu, đục thủng nhiều lỗ nhỏ để thoát nước. Giăng có nhiều cỡ to, BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 1
  2. CHƯƠNG 1. TỔNG QUAN nhỏ tương ứng với số lượng cá bột nhiều hay ít đã được tính sẵn. Cách thứ ba: đổ vào cốc thuỷ tinh có chia độ 3-4 cc nước. Sau đó đổ một ít cá bột đã róc nước vào cốc cho nước dâng lên 2-3 cc. Đếm số cá bột trong cốc và tính ra 1 cc có bao nhiêu cá bột. Từ đó sẽ suy ra số cá bột định mua tương ứng với số cc. Đối với cá hương, cá giống: dùng phương pháp cân mẫu để 100 gam hay 1000 gam có bao con cá. Từ số lượng cá mua bán, sẽ biết được tổng số cân cá, phải giao cho người mua cá. Các phương pháp này tốn nhiều nhân công, sức khỏe cá giống, đặc biệt có sự sai số trong quá trình đếm, như vậy khó có sự minh bạch giữa người bán và người mua. Vì vậy, tự động hóa quá trình nhận dạng và đếm số lượng cá giống là một nhu cầu thực tế. Xuất phát từ chính nhu cầu thực tế đó mà nhóm đã đưa ra quyết định chọn đề tài: “Thiết kế và thi công hệ thống đếm số lượng cá giống” để tiến hành nghiên cứu và thực hiện. Để đảm bảo việc thi công mạch theo như ý tưởng, chuẩn xác và không xảy ra sự cố bắt buộc ta phải tính toán và thiết kế. Nên nhóm đề ra mục tiêu chính là thi công được hệ thống có thể đếm được số lượng cá giống trong ảnh hiển thị ra màn hình. Tính toán, thiết kế từng khối của hệ thống như: khối nguồn, khối xử lý trung tâm, khối led, khối camera, khối hiển thị. 1.2 MỤC TIÊU Thiết kế hệ thống (raspberry, camera và lcd) đếm số lượng cá giống. Sử dụng mã nguồn mở OpenCV vào xử lý ảnh. 1.3 NỘI DUNG NGHIÊN CỨU 1.3.1 Kết nối thiết bị - Tìm hiểu thông tin linh kiện sản phẩm, thông số kỹ thuật. - Kết nối các module. - Cài đặt hệ điều hành, chương trình sử dụng, thư viện cho raspberry. 1.3.2 Tiến hành xử lý - Xử lý chụp, lấy ảnh đầu vào. - Đọc và hiển thị hình ảnh (ảnh xám): sử dụng matplotlib để đọc file. - Tạo mặt nạ nhị phân cho ảnh: dùng phương pháp Otsu. BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 2
  3. CHƯƠNG 1. TỔNG QUAN - Làm sạch mặt nạ: loại bỏ các đóm chấm nhỏ như rong rêu, rác… - Phân đoạn nền, tìm biên của cá. - Đếm số lượng cá. - Hiển thị ra màn hình. 1.3.3 Tiến hành thử nghiệm trên hồ cá có sẵn - Thu nhận, xử lý kết quả đạt được. - Cân chỉnh phù hợp. 1.3.4 Thiết kế thi công môi trường đếm - Chọn hồ chứa cá có màu nền, cân chỉnh mực nước phù hợp. - Điều chỉnh ánh sang (không mờ, chóa) đảm bảo ảnh chụp tốt nhất. - Lắp ráp thiết bị, hoàn thiện hệ thống. 1.3.5 Thu thâp nhận xét kết quả - Lấy kết quả so sánh với thực tế tính toán sai số. - Nhận xét nêu ưu nhược điểm của hệ thống. - Nêu hướng phát triển. 1.3.6 Viết báo cáo - Thu thập kết quả viết đề cương báo cáo. - Viết báo cáo. - Chỉnh sửa, kiểm tra lần cuối trước khi nôp quyển báo cáo. - Tiến hành báo cáo. 1.4 GIỚI HẠN - Số lượng lần đếm nhỏ hơn 50 cá thể. - Kích thước cá thể từ 1-2cm. 1.5 BỐ CỤC  Chương 1: Tổng quan Đặt vấn đề liên quan đến đề tài, tìm hiểu những lý do và sự cần thiết để thực hiện đề tài, mục tiêu hoàn thành, giới hạn cũng như những bước đi từ cơ bản đến cụ thể mà nhóm sẽ thực hiện trong quá trình nghiên cứu đề tài. BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 3
  4. CHƯƠNG 1. TỔNG QUAN  Chương 2: Cơ sở lý thuyết Trình bày các kiến thức về ngôn ngữ Python, lý thuyết về Raspberry Pi 3, lý thuyết về module camera pi, lý thuyết về màn hình lcd 16x2 được áp dụng trong đề tài.  Chương 3: Tính toán và Thiết kế Trình bày sơ đồ khối của hệ thống, tính toán thiết kế cho từng khối.  Chương 4: Thi công hệ thống Thi công bể chứa cá. Thi công mạch theo thiết kế. Lập trình điều khiển cho Pi. Kiểm tra, chạy thử nghiệm và tinh chỉnh lỗi.  Chương 5: Kết quả, Nhận xét và Đánh giá Trình bày kết quả đã đạt được và đưa ra những bàn luận về sản phẩm.  Chương 6: Kết luận và hướng phát triển Kết luận chung về đề tài và hướng phát triển của nó. BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 4
  5. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Chương 2. CƠ SỞ LÝ THUYẾT 2.1 GIỚI THIỆU VỀ HỆ THỐNG XỬ LÝ ẢNH 2.1.1 Giới thiệu chung Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó. Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục năm nay. Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở khác. Đầu tiên phải kể đến xử lý tín hiệu số là một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn… Thứ hai, các công cụ toán như đại số tuyến tính, sác xuất, thống kê. Một số kiến thứ cần thiết như trí tuệ nhân tạo, mạng nơron nhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh. Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân đôn đến New York từ những năm 1920. Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh sô thuận lợi. Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan. Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh. Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như camera, máy chụp BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 5
  6. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT ảnh). Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại camera ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh. Hình 2.1. Các bước cơ bản trong xử lý ảnh Sơ đồ này bao gồm các thành phần sau: a. Phần thu nhận ảnh (Image Acquisition) Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã số hoá (như loại CCD – Change Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường dùng là loại quét dòng; ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh) b. Tiền xử lý (Image Processing) Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn. c. Phân đoạn (Segmentation) hay phân vùng ảnh Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 6
  7. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. d. Biểu diễn ảnh (Image Representation) Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác. e. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản: - Nhận dạng theo tham số. - Nhận dạng theo cấu trúc. Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người… f. Cơ sở tri thức (Knowledge Base) Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 7
  8. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người. 2.1.2 Các khái niệm cơ bản trong xử lý ảnh a. Điểm ảnh (Picture Element) Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính (số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y). Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh. b. Độ phân giải của ảnh Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều. c. Mức xám của ảnh Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó. Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong xử lý ảnh. BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 8
  9. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó. Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255). Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau. Ảnh có thể biểu diễn dưới dạng tín hiệu tương tự hoặc tín hiệu số. Trong biểu diễn số của các ảnh đa mức xám, một ảnh được biểu diễn dưới dạng một ma trận hai chiều. Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường độ của ảnh tại vị trí đó. Hình 2.2. Biểu diễn mức xám của ảnh số Trong hình 2.2, một lưới chia ô vuông tưởng tượng được đặt lên ảnh. Độ lớn mỗi ô vuông của lưới xác định kích thước của một điểm ảnh. Mức xám của một điểm được tính bằng cường độ sáng trung bình tại mỗi ô vuông này. Mắt lưới càng nhỏ thì chất lượng ảnh càng cao. Trong kỹ thuật truyền hình tiên tiến, (mục đích là cung cấp cho người xem), hình ảnh cần chất lượng cao với độ phân giải gấp hai lần so với các chuẩn hiện nay. Trong kỹ thuật tương tự, một bức ảnh thường được biểu diễn dưới dạng các dòng nằm ngang kế tiếp nhau. Mỗi dòng là một tín hiệu tương tự mang theo các BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 9
  10. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT thông tin về cường độ sáng dọc theo một đường nằm ngang trong ảnh gốc. Ảnh trên một chiếc TV được hiện lên qua các dòng quét này. Mặc dù thuật ngữ "tương tự" được dùng để mô tả cho các ảnh quét liên tiếp nhưng thực tế ảnh chỉ tương tự dọc theo hướng nằm ngang. Nó là rời rạc khi xét theo hướng dọc và chính vì vậy mà tín hiệu ảnh là tín hiệu lai nửa tương tự, nửa số. Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng. Người ta phân mức đen trắng đó thành L mức nếu sử dụng số bit B=8 bit để mã hóa mức đen trắng (hay mức xám) thì L được xác định: L=2B (trong ví dụ của ta L=28= 256 mức) (2.1) Nếu L bằng 2, B=, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh nhị phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn hơn 2 ta có ảnh đa cấp xám. Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit, còn với ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit. Như vậy, với ảnh đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có thể biểu diễn được là 256. Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất. Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử logic. Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác. Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈ 16,7 triệu màu. d. Ảnh số Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật. e. Đo khoảng cách giữa các điểm ảnh. BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 10
  11. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Giả sử có điểm ảnh p tại toạ độ (x, y). P có 4 điểm lân cận gần nhất theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc). {(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N4 (p) (2.2) Trong đó: số 1 là giá trị logic; N4 (p) tập 4 điểm lân cận của p. Hình 2.3. Lân cận các điểm ảnh của tọa độ (x, y) Các lân cận chéo: các điểm lân cận chéo NP (p) (có thể coi lân cận chéo là 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc). NP (p) = {(x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)} (2.3) Tập kết hợp: N8 (p) = N4 (p) + NP (p) là tập hợp 8 lân cận của điểm ảnh p. Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh. Định nghĩa: Khoảng cách D (p, q) giữa hai điểm ảnh p toạ độ (x, y), q toạ độ (s, t) là hàm khoảng cách (Distance) hoặc Metric nếu: 1. D (p, q) ≥ 0 (Với D (p, q) = 0 nếu và chỉ nếu p=q). 2. D (p, q) = D (q, p). 3. D (p, z) ≤ D (p, q) + D (q, z); z là một điểm ảnh khác. Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x, y) và q(s, t) được định nghĩa như sau: De (p, q) = [(x - s) 2+ (y - t) 2] 1/2 (2.4) BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 11
  12. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Khoảng cách khối: Khoảng cách D4 (p, q) được gọi là khoảng cách khối đồ thị (CityBlock Distance) và được xác định như sau: D4 (p, q) = | x - s | + | y - t | (2.5) Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm ảnh từ tâm điểm ảnh đến tâm điểm ảnh q khác. Ví dụ: Màn hình CGA 12” (12”*2,54cm = 30,48cm = 304,8mm) độ phân giải 320*200; tỷ lệ 4/3 (Chiều dài/Chiều rộng). Theo định lý Pitago về tam giác vuông, đường chéo sẽ lấy tỷ lệ 5 phần (5/4/3: đường chéo/chiều dài/chiều rộng màn hình); khi đó độ dài thật là (305/244/183) chiều rộng màn hình 183mm ứng với màn hình CGA 200 điểm ảnh theo chiều dọc. Như vậy, khoảng cách điểm ảnh lân cận của CGA 12” là ≈ 1mm. Khoảng cách D8 (p, q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p, q được xác định như sau: D8 (p, q) = max (| x-s |, | y-t |) (2.6) 2.1.3 Các vấn đề khác trong xử lý ảnh a. Thu nhận ảnh Thu nhận ảnh: hai thành phần cho công đoạn này là linh kiện nhạy với phổ năng lượng điện từ trường, loại thứ nhất tạo tín hiệu điện ở đầu ra tỷ lệ với mức năng lượng mà bộ cảm biến (đại diện là camera); loại thứ hai là bộ số hoá. Máy chụp ảnh, camera có thể ghi lại hình ảnh (phim trong máy chụp, vidicon trong camera truyền hình). Có nhiều loại máy cảm biến (Sensor) làm việc với ánh sáng nhìn thấy và hồng ngoại như: Micro Densitometers, Image Dissector, Camera Divicon, linh kiện quang điện bằng bán dẫn. Các loại cảm biến bằng chụp ảnh phải số hoá là phim âm bản hoặc chụp ảnh. Camera divicon và linh kiện bán dẫn quang điện có thể cho ảnh ghi trên băng từ có thể số hoá. Trong Micro Densitometer phim và ảnh chụp được gắn trên mặt phẳng hoặc cuốn quang trống. Việc quét ảnh thông qua tia sáng (ví dụ tia Laser) trên ảnh đồng thời dịch chuyển mặt phim hoặc quang trống tương đối theo tia sáng. Trường hợp dùng phim, tia sáng đi qua phim. Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử lý tiếp theo hay truyền đi. Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tại BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 12
  13. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng IMG), ảnh đa cấp xám cho đến ảnh màu: (BMP, GIF, JPEG…). Tuy các định dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất. Nhìn chung, một tệp ảnh bất kỳ thường bao gồm 3 phần: header, data compression, palette color. b. Nhiễu Ảnh sau quá trình thu nhận thường không tránh khỏi nhiễu, nhiễu gây ra bởi ánh sáng tác động lên chính bản thân chất liệu và trong đó một phần nhỏ do thiết bị thu nhận ảnh đã tạo nên các đặc trưng riêng cho mỗi chất liệu. Có thể nói, nhiễu được xem như thành phần không mong muốn có trong ảnh, nhiễu là một hiện tượng ngẫu nhiên luôn luôn có mặt trên mọi hệ thống xử lí tín hiệu thực. Nhiễu xuất hiện trong ảnh bởi nhiều nguyên nhân như do sự thay đổi độ nhạy của đầu dò, do sự biến đổi của môi trường, do chính bản thân chất liệu sinh ra, do sai số lượng tử hóa hay sai số truyền... Tất cả các nguyên nhân gây ra nhiễu ở trên đã sinh ra nhiễu được phân thành các loại chính như sau: Nhiễu độc lập với dữ liệu ảnh (Independent Noise): là một loại nhiễu cộng (additive noise) ảnh thu được f(i,j) là tổng của ảnh đúng (true image) và nhiễu n(i,j): f(i,j) = s(i,j) + n(i,j). Nhiễu phụ thuộc vào dữ liệu (Data dependent noise): nhiễu xuất hiện khi có sự bức xạ đơn sắc nằm rải rác trên bề mặt ảnh, độ lởm chởm trên bề mặt tùy thuộc vào bước sóng của điểm ảnh. Do có sự giao thoa giữa các sóng ảnh nên làm xuất hiện những vết lốm đốm trên ảnh. Nhiễu Gauss: nhiễu này có được do bản chất rời rạc của bức xạ (hệ thống ghi ảnh bằng cách đếm các photon (lượng tử ánh sáng). Là nhiễu cộng và độc lập (independent, additivenoise) – nhiễu n (i, j) có phân phối Gauss (trung bình = zero) được mô tả bởi độ lệch chuẩn (standard deviation), hay phương sai. Mỗi pixel trong ảnh nhiễu là tổng giá trị pixel đúng (true pixel) và pixel ngẫu nhiên BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 13
  14. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Nhiễu muối – tiêu (Salt & Pepper noise): nhiễu này sinh ra do xảy ra sai số trong quá trình truyền dữ liệu. Những pixel đơn được đặt luân phiên mang giá trị zero hay giá trị maximum tạo ra hình chấm dạng muối tiêu trên ảnh. Đã có nhiều phương pháp đã được đề xuất để loại bỏ nhiễu ra khỏi ảnh. Trong đó, phương pháp lọc trung vị (Median filter) đầu tiên mang lại hiệu suất lọc khá tốt. Tiếp sau đó là các bộ lọc phát triển dựa trên Median filter như Adaptive Median filter, Weighted Median filter, Center-Weighted Median filter, Alpha-Trim Mean filter… Dù đã có nhiều cải tiến nhưng những bộ lọc này vẫn còn nhiều nhược điểm là xử lý toàn bộ các pixel trong ảnh và vì vậy làm mất hoặc mờ đi các chi tiết ảnh. 2.1.4 Các phương pháp xử lý đối tượng trong ảnh Nâng cao chất lượng ảnh là bước cần thiết trong xử lý ảnh nhằm hoàn thiện một số đặc tính của ảnh. Nâng cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng cường ảnh và khôi phục ảnh. Tăng cường ảnh nhằm hoàn thiện các đặc tính của ảnh như: - Lọc nhiễu, hay làm trơn ảnh. - Tăng độ tương phản, điều chỉnh mức xám của ảnh. - Làm nổi biên ảnh. Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ thuật trong miền điểm, không gian và tần số. a. Chuyển qua ảnh xám Đơn vị cơ bản của một bức ảnh là điểm ảnh (pixel), mỗi điểm ảnh có thể được biểu diễn bằng n bytes dưới các hệ màu khác nhau. Việc chuyển đổi giữa các hệ màu thông thường được thực hiện thông qua các phép biến đổi ma trận. Xét đến phương thức chuyển đổi từ ảnh 24 bit RGB sang ảnh 8 bit đa mức xám, để thực hiện yêu cầu trên, thông thường ta sử dụng cách chuyển đổi từ ảnh 24 bit RGB sang ảnh 8bit GrayScale. BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 14
  15. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT GrayScale: là một hệ thống màu có mô hình màu đơn giản nhất với 256 cấp độ xám biến thiên từ màu đen đến màu trắng. Sản phẩm được xuất ra sẽ có màu trắng đen. Được sử dụng cả trong công nghiệp in lẫn dùng trong việc thể hiện ảnh lên các thiết bị số. Ảnh xám (Gray image) hay còn gọi là ảnh đơn sắc (Monochromatic), mỗi giá trị điểm ảnh (Pixel) trong ma trận điểm ảnh mang giá trị từ 0 đến 255. Trong không gian màu RGB, để có một ảnh xám cần có phải có giá trị kênh màu Red(x, y) = Green(x, y) = Blue(x, y). (Với x, y lần lượt là tọa độ của điểm ảnh). Hình 2.4. Chuyển đổi hệ thống màu RGB sang Grayscale Công thức tính cường độ sáng tại một điểm ảnh từ ảnh RGB: Ix, y = 0.3086 * Redx, y + 0.6094 * Greenx, y + 0.0820 * Bluex, y (2.7) Ix, y = 0.299 * Redx, y + 0.587 * Greenx, y + 0.114 * Bluex, y (2.8) BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 15
  16. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Phân tích: I(x, y): Là cường độ sáng tại điểm ảnh (x, y) của ảnh xám. Red(x, y): Là giá trị của kênh màu Red (Đỏ) tại điểm ảnh (x, y) của ảnh màu (RGB). Green(x, y): Là giá trị của kênh màu Green (Xanh lá cây) tại điểm ảnh (x, y) của ảnh màu (RGB). Blue(x, y): Là giá trị của kênh màu Blue (Xanh lơ) tại điểm ảnh (x, y) của ảnh màu (RGB). Tôi có công thức khác tính cường độ sáng tại một điểm ảnh từ ảnh RGB: I(x, y) = (2 * Red(x, y) + 5 * Green(x, y) + 1 * Blue(x, y)) / 8 (2.9) Chú ý: Các phép toán trong số nguyên (Int) nhanh hơn rất nhiều trong số thực (Float). Trong OpenCV, hệ thống màu có thứ tự các kênh màu là Blue-Green-Red. Các thông số dùng để tính toán cường độ sáng cho ảnh xám như: 0.3086, 0.6094, 0.0820… Được coi là những con số đẹp do người ta nghiên cứu ra. Các con số này có thể thay đổi. Chúng ta hoàn toàn có thể chọn một giá trị một kênh màu hoặc chia trung bình cộng của 3 kênh màu để tìm cường độ sáng tại một điểm ảnh (Pixel). Lưu ý rằng giá trị mỗi điểm ảnh I(x, y) hay còn gọi là cường độ sáng (Luminance Intensity) trong ảnh đa mức xám tính được là tổng trọng số khác nhau của mỗi thành phần màu trong hệ màu RGB. Một trong những lý do của việc này là nếu chúng ta sử dụng cùng trọng số, ví dụ (R + G + B) / 3 thì màu đỏ, màu xanh nước biển hay màu xanh da trời sẽ có cùng mức xám sau khi chuyển đổi. Mặt khác khoa học đã chứng minh thì mắt người nhạy cảm hơn với thành phần màu xanh lá cây và màu đỏ so với xanh da trời. BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 16
  17. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Hình 2.5. Ảnh minh họa nàng Lena b. Phân ngưỡng (Threshold) Khi xử lý trực tiếp ảnh từ không gian màu (RGB, HIS…) hoặc ảnh xám (gray) đôi khi chúng ta phải tiếp nhận một số lượng lớn thông tin từ ảnh. Điều này có thể gây khó khăn cho việc xây dựng thuật toán và làm giảm tốc đọ xử lý. Vì thế có lớp thuật toán phân ngưỡng để chuyển ảnh đầu vào (ảnh màu hoặc ảnh xám) về không gian ảnh nhị phân: chỉ gồm hai giá trị 0 hoặc 1, hoặc 0 và 255 tùy theo quy định của cấu trúc ảnh. Theo đó, giá trị 0 sẽ là giá trị ứng với những điểm đen trên ảnh và giá trị 1 (hoặc 255) sẽ là giá trị ứng với những điểm trắng. Nhằm làm đơn giản hóa quá trình tính xử lý. Phân ngưỡng với ngưỡng cố định: nếu pixel có giá trị lớn hơn giá trị ngưỡng thì nó được gán 1 giá trị (thường là 1), ngược lại nhỏ hơn giá trị ngưỡng thì nó được gán 1 giá trị khác (thường là 0). Hàm sử dụng là threshold, tham số đầu tiên là 1 ảnh xám, tham số thứ 2 là giá trị ngưỡng, tham số thứ 3 maxval là giá trị được gán nếu giá pixel lớn hơn giá trị ngưỡng, tham số thứ 4 là loại phân ngưỡng. Tùy theo các loại phân ngưỡng mà pixel được gán giá trị khác nhau:  THRESH_BINARY Nếu giá trị pixel lớn hơn ngưỡng thì gán bằng maxval Ngược lại bằng gán bằng 0  THRESH_BINARY_INV BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 17
  18. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Nếu giá trị pixel lớn hơn ngưỡng thì gán bằng 0 Ngược lại bằng gán bằng maxval  THRESH_TRUNC Nếu giá trị pixel lớn hơn ngưỡng thì gán giá trị bằng ngưỡng Ngược lại giữ nguyên giá trị  THRESH_TOZERO Nếu giá trị pixel lớn hơn ngưỡng thì giữ nguyên giá trị Ngược lại gán bằng 0  THRESH_TOZERO_INV Nếu giá trị pixel lớn hơn ngưỡng thì gán giá trị bằng 0 Ngược lại giữ nguyên Hình 2.6. Ví dụ minh họa với ngưỡng bằng 127 Ưu điểm của thuật toán đơn giản dễ lập trình. BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 18
  19. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Nhược điểm là khó chọn ngưỡng thích nghi với nhiều loại ảnh trong các điều kiện ánh sáng khác nhau. Adaptive Thresholding (phân ngưỡng thích nghi): phương pháp phân ngưỡng ở trên không phù hợp cho nhiều trường hợp, như là ánh sáng không đồng đều trên ảnh. Trong trường hợp đó chúng ta dùng hàm adaptive Threshold. Phương thức này tính giá trị trung bình của các n điểm xung quanh pixel đó rồi trừ cho C chứ không lấy ngưỡng cố định (n thường là số lẻ, còn C là số nguyên bất kỳ). Ngoài các tham số giống như phân ngưỡng thường, adaptiveThreshold có thêm các tham số:  ADAPTIVE_THRESH_MEAN_C: giá trị của pixel phụ thuộc vào các pixel lân cận  ADAPTIVE_THRESH_GAUSSIAN_C: giá trị của pixel cũng phụ thuộc vào các pixel lân cận, tuy nhiên được khử nhiễu  Block Size: số pixel lân cận dùng để tính toán  C: hằng số trừ đi giá trị trung bình Hình 2.7. Ví dụ minh họa cho các phương pháp phân ngưỡng khác nhau Phân ngưỡng Otsu: Otsu là tên một nhà nghiên cứu người Nhật đã nghĩ ra ý tưởng cho việc tính ngưỡng T một cách tự động (adaptive) dựa vào giá trị điểm ảnh BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 19
  20. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT của ảnh đầu vào nhằm thay thế cho việc sử dụng ngưỡng cố định (fixed hay const). Phương pháp này cho kết quả là mỗi ảnh khác nhau có một ngưỡng tương ứng khác nhau bằng các bước xử lý như sau:  Chọn một giá trị khởi tạo cho T (nên chọn giá trị mang tính công thức, ví dụ T = (min + max) / 2, T = giá trị trung bình... tránh dùng các giá trị mang tính định lượng thiết lập cứng).  Phân hoạch ảnh sử dụng T. kết quả của bước này sẽ tạo ra 2 nhóm điểm ảnh: G1 chứa tất cả các điểm ảnh với giá trị (intensity) > T và G2 chứa các điểm ảnh với giá trị (intensity)
nguon tai.lieu . vn