Xem mẫu
- Hội Hội
Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Hệ Thống Mã Hoá Và Nhận Dạng Mẫu Hai Chiều Ứng Dụng Trong In Ấn Và Tra Cứu
Thông Tin
Hoàng Anh Tuấn, Nguyễn Hữu Phương, Bùi Trọng Tú
Trường Đại học Khoa học Tự Nhiên Thành phố Hồ Chí Minh
Email: hatuan@fetel.hcmus.edu.vn, nhphuong@hcmus.edu.vn, bttu@hcmus.edu.vn
Tóm Tắt—Hệ thống Mã hoá (MH) và Nhận dạng mẫu (NDM) hai
chiều (2D) được coi như là một kỹ thuật tiềm năng trong lĩnh vực xử
lý thông tin. Nó được ứng dụng trong khá nhiều ngành kỹ thuật phục
vụ mục đích ẩn dữ liệu và khôi phục thông tin. Trong bài báo này,
một cơ chế mã hoá được đề xuất để phục vụ tốt hơn cho nhóm
ngành in ấn và tra cứu thông tin từ nhưng sản phẩm in ấn. Để tương
tác nhận dạng các mẫu được mã hoá này, một số thuật toán về trích
xuất dữ liệu ảnh màu, lọc tín hiệu cũng như cơ chết phân ngưỡng
Hình 1: Vị trí thông thường chứa ảnh nên được mã hoá
động được áp dụng cho phần nhận dạng mẫu Bài bào này cũng đưa Các ảnh nền chứa một tập hợp các khối dữ liệu mã hoá
ra mô hình kiểm nghiệm thực tế từ những mẫu được in ấn, kết hợp được đặt sát nhau tạo nên một mảng ma trận các chấm tròn li
với việc mô phỏng trên nền tảng FPGA nhằm tối ưu thuật toán, làm ti. Mỗi khối dấu chấm tròn là một ma trận gồm 16 dấu chấm
tiền đề cho việc thiết kế ASIC khối nhận dạng mẫu. tròn được phân bố đều theo kiểu 4x4. Kích thước mỗi khối
4x4 dấu chấm tròn nhỏ là 2 mm x 2 mm. Ở nghiên cứu này,
Từ khoá- MH, NDM, 2D, FPGA.
việc thực hiên với kích thước này là để đạt được hiệu qua cao
nhất cả cho việc mã hoá và nhận dạng.
I. GIỚI THIỆU Dữ liệu được mã hoá trong 16 dấu chấm tròn này theo
những mức xám khác nhau. Trong 16 chấm này dữ liệu thức
tế chỉ nằm trong 9 dấu chấm, còn 7 dấu chấm còn lại được sử
Các công nghê nhận dạng mẫu dựa trên xử lý ảnh đã và
dụng cho những mục đích khác, ví dụ: canh chuẩn xoay ảnh,
đang được ứng dụng nhiều trong thực tế, phổ biến nhất là mã chọn mức ngưỡng cao nhất và thấp nhất. 9 trên 16 dấu chấm
vạch, mã QR Code,… Để có được kết quả nhận dạng mẫu tốt thực hiện mã hoá dữ liệu theo 3 mức xám.
cần phải có phương pháp mã hóa mẫu tốt và thuật toán nhận
dạng tốt. Bài báo này tập trung vào yếu tố đầu, đó là đưa ra Các dấu Mức 3: #B0B0B0
một phương pháp mã hoá mẫu và thuật toán tương ứng để chấm này
nhận dạng mẫu nhằm ứng dụng trong lĩnh vực lưu trữ thông dung cho mã Mức 2: #808080
tin và truy xuất thông tin tự động. Nó là một phần của lĩnh hoá dữ liệu
vực nhận dạng hình ảnh nhưng ở đây không phải ảnh mặt Mức 1: #505050
người, ảnh sinh học hay ảnh viễn thám mà là ảnh nền của một
văn bản hay một tài liệu có chứa thông tin mã hoá thông tin. Hình 2: Định vị dấu chấm mã hoá và cơ chế mức xám của nó
Kết quả của đề tài này có thể được nguyên cứu và phát triển Theo phương pháp thông kê thì với số lượng dấu chấm là
để ứng cũng trong lĩnh vực giáo dục với các mô hình giảng 9 và mỗi dấu có thể có 1 trong 3 mức xám khác nhau thì tổ
dạy và học tập thông minh. Một số lĩnh vực khác có nhu cầu hợp các trạng thái có tể đạt được là: =19683.Với số lượng
về mã hoá thông tin để sau đó truy xuất từ cơ sở dữ liệu trả ra mẫu này thì phục vụ tương đối cho việc mã hoá dữ liệu
kết quả cũng có thể ứng dụng phương pháp mà đề tài này đã
đề xuất. III. PHƯƠNG PHÁP NHẬN DẠNG MẪU
Mẫu mã hoá cũng như nhận dạng của đề tài này là một Quá trình xử lý ảnh nhận dạng được trải qua các bước sau:
mẫu hình ảnh hai chiều được chụp từ các loại máy chụp ảnh,
hoặc cảm biến lấy ảnh.
II. TỔNG QUAN VỀ CƠ CHẾ MÃ HOÁ
Không gian chứa dữ liệu mã hoá là một mẫu dữ liệu được
in ấn lên các chất liệu in ấn bình thường. Các mẫu chứa thông
tin mã hoá được ghép sát nhau liên tục để tạo thành một mảng
ảnh nền trước khi được in ra.
Hình 3: Mô hình xử lý mẩu nhận dạng
186
ISBN: 978-604-67-0635-9 186
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Ảnh sau khi được chụp từ camera là một ảnh có kích thước tế với mỗi ảnh nhận được do nhiễu nên dữ liệu nhận được đối
64x64 pixel sẽ trải qua 3 bước xử lý chính để cho ra được dữ với mức đen nhất không còn là 0 nữa mà có thể là 1, 2, 3
liệu sau cùng là mã mức xám được luu trữ trong các dấu hoặc cao hơn. Tương tự như vậy thì màu trắng nhất không
chấm tròn. Vì mẫu mã hoá được thu từ camera trong điều còn là 255 nữa mà có thể thấp hơn 254, 253, 252 hoặc thấp
kiện thực tế sẽ không chuẩn như thiết kế mẩu đã nói ở phần hơn.
trên nên các bộ lọc trung vị và phép phân chia ngưỡng động
được dùng để xử lý mẫu thực. Cụ thể các bước như sau.
A. Xử lý ảnh màu thành ảnh đa mức xám
Đơn vị cơ bản của một bức ảnh là điểm ảnh (pixel), mỗi
điểm ảnh có thể được biểu diễn bằng n bytes dưới các hệ màu
khác nhau. Việc chuyển đổi giữa các hệ màu thông thường
được thực hiện thông qua các phép biến đổi ma trận. Trong
bài viết này tôi sẽ giới thiệu phương thức chuyển đổi từ ảnh
24 bits RGB sang ảnh 8 bits đa mức xám. Để thực hiện yêu
cầu trên, thông thường ta sử dụng một trong những công thức
sau đây, áp dụng cho từng điểm ảnh [x,y]: Hình 5: Mô hình phân chia ngưỡng theo thiết kế
I(x,y) =0.3086*R(x,y)+ 0.6094*G(x,y) + 0.0820* B(x,y)
I(x,y) =0.299 *R(x,y) + 0.587 * G (x,y) + 0.114 * B (x,y)
B. Lọc nhiễu với lọc trung vị (Median Filter)
Lọc trung vị là phép lọc phi tuyến được sủ dụng phổ biến
do khả năng khử nhiễu ngẫu nhiên tốt, và ít bị nhoè hơn so
với phép lọc trung bình.Ý tưởng thuận toán này là sắp xếp
các giá trị điểm ảnh trong cửa sổ xử lý tăng hoặc giảm dần so
với trung vị. Kích thước cửa sổ được chon sao cho số điểm
ảnh trong cửa sổ là một số lẻ. thường là 3x3= 9 điểm ảnh,
5x5= 25 điểm ảnh.Thay thế giá trị trung tâm bằng giá trị giữa
của danh sách.
Hình 5: Mô hình phân chia ngưỡng động theo thực tế
Từ các ngưỡng mới này ta mới có thể xem xét chính xác
hơn một dấu chấm thực tế thuộc vùng nào và từ đó sẽ cho ra
dữ liệu nhận dạng được chính xác và đúng thực tế hơn.
IV. MÔ HÌNH PHẦN CỨNG THUẬT TOÁN NHẬN
DẠNG MẪU
Mô hình thiết kế phần cứng cho thuật toán xử lý dữ liệu đã
Hình 4: Mô hình xử lý của thuật toán Median Filter phân tích ở phần III được thiết kế và thực hiện trên board DE0
Giả sử A= là các giá trị pixel trong cửa sổ Nano. Project đã hoàn thành và chạy thành công trên board
lân cận với DE0 Nano.
Một mẫu dữ liệu được xử lý theo phương pháp sau
Thì Median (A)
Ví dụ ta có A ={1,2,5,5,6,7,10,12,13} -> Median (A) =6
C. Định mức ngưỡng xám dựa trên dự liệu thực
Cơ sở khoa học của phương pháp này là sử dụng các dấu
chấm không chứa dữ liệu để xác định hai mức xám cao nhất
và thấp nhất theo ảnh thực tế nhận được. Theo lý thuyết
chuyển đổi mức xám ở phần phần A thì ảnh sau khi chuyển Hình 6 : Mô hình dữ liệu thực hiện
đổi từ ảnh màu RGB sang ảnh đa mức xám thì dữ liệu ảnh tại
Ảnh được chụp từ camera, sau đó được lưu trên máy tính.
mỗi điểm ảnh sẽ còn là 8 bit Grayscale thay vì 24 bit RGB.
Máy tính thực hiện việc chuyển ảnh xuống board nhúng để
Đo đó giá trị mức xám sẽ thay đổi từ 0 tới 255 tương ứng với
chạy thuật toán xừ lý nhận dạng. Kết quả nhận dạng sẽ được
màu đen nhất là 0 và màu trắng nhất là 255. Nhưng trên thực trả về máy tính để hiển thị và lưu trữ. Quá trình giao tiếp dữ
187
187
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
liệu giữa máy tính và board được thực hiện qua chuẩn giao CORE hoạt động gồm 3 công đoạn chính: chuyển màu
thức USB 2.0 RGB sang mức xám, lọc Median, phân chia ngưỡng động để
lấy giá trị 16 điểm, so sánh lấy ra kết quả. Trong cá khối xử lý
Sơ đồ khối của hệ thống phần cứng được xây dựng như sau: này thì khối lọc Median khá quan trọng trong việc xử lý với
mẩu thực tế. Mô hình lọc median để trích giá trị trung vị
(med) từ 9 giá trị của cửa sổ lọc (p0->p8) được thực hiện qua
một loại khối so sánh tuần tự giá trị lớn đi đường trên và giá
trị nhỏ đi đường dưới, từ đó chọn được giá trị trung vị.
Hình 7: Sơ đồ khối hệ thống phần cứng
Hình ảnh ban đầu được chứa trong PC. CPU NiosII trong Hình 9: Mô hình các bộ so sánh để lấy giá trị của lọc Median
FPGA thông qua hệ thống JTAG-UART để đọc file hình từ
PC ghi vào hệ thống để tiến hành xử lý. Sau khi thực hiện việc V. KẾT QUẢ THỰC NGHIỆM
tính toán xong, FPGA sẽ trả kết quả lại cho PC. Board FPGA Hệ thống được triển khai thử nghiệm trên số lượng mẫu
sử dụng cho đề tài này là board DE0 nano của Terasis với chip thực tế được in ra và chụp lại khoảng gần 1000 mẫu và kế
FPGA là Cyclone IV của Altera.Các thành phần IP chức năng
quả thu được khá tốt với sai số nhỏ hơn
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
: TÀI LIỆU THAM KHẢO
[1] R.N. Bracewell, Two-Dimensional Imaging, Prentice Hall, 1995
[2] R.C. Gonzalez, R.E. Woods, Digital Image Processing,Prentice Hall,
1992
[3] Haykin, Adaptive Filter Theory Fourth Edition, Prentice Hall, 2006
[4] C.D. Munson, S.T. Huang, C.A. Bovik, “The Effect of Median
Hình 11: Kết quả nhận dạng của một mẫu ví dụ Filtering on Edge Estimation and Detection,” IEEE Transactions on
Pattern Analysis and Machine Intelligence, pages.181-194, 1987
Chuỗi kết quả này được xử lý từ một ảnh thực tế, 9 giá trị [5] Bae K.S., Kim K.K., Chung Y.G., Yu W.P., “Character recognition
tất cả [1 2 3 3 2 1 1 2 3] được trích xuất từ 16 dấu chấm của system for cellular phone with camera”, Computer Software and
một mẫu bất kì nào đó ở đây là mẫu dữ liệu ví dụ trong kho Applications Conference (COMPSAC). pages.539 – 544, 2005
dữ liệu mẫu được tạo sẵn. [6] Jain, A.K., Duin, R.P.W. ; Jianchang Mao. “Statistical Pattern
Recognition: A Review”, IEEE Transactions on Pattern Analysis and
Hệ thống mã hoá và nhận dạng này được thực hiện trên số Machine Intelligence, Volume:22 , Issue: 1, pages. 4-37, 2000
lượng dữ liệu mẫu khoảng 1000 mấu. Và ngày càng mở rộng [7] Khodaskar.A.A, Ladhake.S.A.” Pattern recognition: Advanced
development, techniques and application for image retrieval”,
thêm để kiểm chứng. Kết quả kiểm chứng tạm thời cho sai số International Conference on Communication and Network
khá tốt 0.1%. Sau đây là bảng so sánh kết quả với hệ thống Technologies (ICCNT), pages.74 – 78, 2014
mã hoá và nhận dạng loại hai chiều dùng dấu chấm (dot [8] Yu.F.T.S, Gregory.D.A, “Optical pattern recognition: architectures and
matrix) hiện tại mà các công ty công nghê đang nắm giữ: techniques”, Proceedings of the IEEE, pages.733 – 752, 1996
[9] Selvarajan S, Sri Ramakrishna, Palanisamy V. , Mathivanan B.,
“Human identification and recognition system using more significant
hand attributes” International Conference on Computer and
Communication Engineering (ICCCE), pages.1211 – 1216, 2008
[10] Sameer Singh, “2D spiral pattern recognition with possibilistic
measures”, Elsevier Pattern Recognition Letters, pages.141–147, 1998
[11] Yuning Xie, Xiaoguo Zhang, Zhu Zhu, Qing Wang, “An adaptive
median filter using local texture information in image”, International
Conference on Computer and Information Science (ICIS), pages.177 –
180, 2014
[12] OPTICAL ID IMAGE Decoder Specifications [ 2ndgeneration ], sonix
technology co., ltd
[13] Tung-Tsai Liao, Shih-Chien Lin, Yu-Tang Chang,” Method for coding
two dimensional optical identification with the same gray level and
printing product thereof”, Generalplus Technology Inc., 2010
Bảng 1: So sánh kết quả bài báo với một số công nghệ khác [14] http://www.sonix.com.tw/
Từ các kết quả trên đây dễ nhận thấy là đề tài đạt được
những kết quả tương đượng hoặc tốt hơn so với các công
nghệ hiện tại đang được sử dụng. Nhưng để triển khai tốt hơn
trong thực tế cần một số cải tiến và tối ưu hơn nữa.
Kết quả được thực hiện cho hệ thống thực tế bao
gồm một camera thu nhận ảnh với độ phân giải 64x64 pixel
và một Chip xử lý nhận dạng. Kết quả nhận dạng được kết
hợp với cơ sở dữ liệu có sẵn để cho ra kết quả thích hợp theo
mô hình sau
Hình 12: Mô hình triển khai thực tế của kết quả đề tài
189
189
nguon tai.lieu . vn