Xem mẫu
- MỘT SỐ PHƯƠNG PHÁP
TRÍCH CHỌN ĐẶC TRƯNG KHUÔN MẶT VÀ ỨNG DỰNG
Tác Giả: Tạ Tiến Thành- Quách Thu
Thảo
Lớp K36 tin
Tóm tắt bài báo: Vấn đề an ninh và bảo mật ngày nay đang được quan tâm và chú ý đến,
các phương pháp trích chọn đặc trưng và khuôn mặt giúp chúng ta nhận dạng mặt người,
tìm kiếm thông tin… và được ứng dụng rất nhiều trên các lĩnh vực.
Từ Khóa: “Trích trọn đặc trưng khuôn mặt”
1. Mở đầu
Hiện nay, cùng với sự phát triển của xã hội, vấn đề an ninh bảo mật đang được yêu
cầu khắt khe tại mọi quốc gia trên thế giới. Các hệ thống nhận dạng mặt người được ra
đời với độ tin cậy ngày càng cao. Một trong những bài toán nhận dạng mặt người đang rất
được quan tâm hiện nay là nhận dạng khuôn mặt. Bên cạnh đó, năm 2011 được coi là năm
phát triển vô cùng mạnh mẽ của các thiết bị di động như: smartphone, tablet…và còn hứa
hẹn phát triển rất nhiều và đa dạng trong các năm tiếp theo, và các thiết bị đó dần trở
thành không thể thiếu của mỗi người, và có thể đảm nhiệm được những công việc của
những chiếc máy tính để bàn hay laptop thời nay. Do đó, cần các cơ chế để bảo vệ việc
truy cập các thiết bị đó, và nhận dạng khuôn mặt cũng là một cách thức đảm bảo an toàn
hơn rất nhiều cho việc truy cập thiết bị, so với các cách thức thông thường khác. Do vậy,
chúng em đã lựa chọn đề tài: “các phương pháp trích chọn đặc trưng khuôn mặt và ứng
dụng”.
2. Một số phương pháp trích chọn đặc trưng khuôn mặt và ứng dụng
2.1. Phương pháp trích chọn đặc trưng hình học
Đặc trưng hình học là hướng tiếp cận dựa vào các bức ảnh trực diện khuôn mặt lấy
từ khâu phát hiện khuôn mặt, trích chọn đặc trưng về hình học biểu diễn hình dáng, vị trí
các phần của khuôn mặt như mắt, mũi, miệng, lông mày. Cụ thể xác định một số các điểm
đặc trưng trên khuôn mặt: 2 mống mắt, điểm chính giữa miệng, khóe miệng, một số các
điểm khác ở vùng trán, mắt,…
2.1.1 Xác định các điểm đặc trưng trên khuôn mặt
Yang đã phát triển một hệ thống thời gian thực để xác định các điểm đặc trưng như
mống mắt, khóe miệng hay lỗ mũi. Phương pháp tìm kiếm 2 vùng mắt là 2 vùng tối nhất
và sử dụng các điều kiện về hình học như vị trí bên trong mặt, kích thước và hình dáng để
- xác định. Phương pháp dùng phép lặp lấy ngưỡng để phát hiện ra vùng tối nhất với điều
kiện ánh sáng thay đổi. Xác định lỗ mũi cũng tương tự như xác định 2 mống mắt.
Hình 1: Lặp để xác định ngưỡng trên cửa sổ tìm kiếm
Để xác định khóe môi, xác định vị trí theo chiều dọc sử dụng phép chiếu toàn bộ theo trục
x. Vị trí theo trục x được xác định bằng phép chiếu toàn bộ trên ảnh của cạnh miệng.
Hình 2: Phép chiếu toàn bộ
Để dò tìm khóe miệng sử dụng hai phương pháp:
+ Tìm điểm ảnh có độ xám lớn nhất trong các vùng dự kiến sau đó tìm xác định điểm khóe
miệng sẽ nằm trên đường giữa 2 môi.
+ Tìm phần có giá trị điểm ảnh tối nhất trên đường giữa hai môi, chắc chắn khoảng cách
giữa 2 vùng đảm bảo điều kiện thỏa mãn về khoảng cách giữa 2 khóe miệng trên thực tế
và chọn vị trí có độ tương phản là cao nhất.
Phương pháp trên có một số những ưu điểm như thỏa mãn điều kiện thực thi với thời gian
thực. Một số phương pháp có thể áp dụng với những độ phân giải khác nhau (với cả độ
phân giải thấp), tuy nhiên vẫn có trường hợp phát hiện ra lông mày thay vì mắt. Tian đã
giải quyết vấn đề bằng cách phát hiện cả vùng mắt và lông mày. Bằng cách đó, không chỉ
trích chọn được thêm đặc trưng mà tỷ lệ chính xác còn được tăng lên. Đối với xác định
khóe miệng, trường hợp sai là khi miệng không ở trạng thái bình thường và phương pháp
áp dụng đối với mặt trực diện hoặc gần trực diện. Vukadinovic và Pantic sử dụng Gabor –
wavalets và Gentle – Boost để xây dựng hệ thống nhận dạng tự động 20 điểm đặc trưng.
Trong phương pháp, họ chia khuôn mặt thành 20 vùng nhỏ và mỗi vùng ứng với một điểm
đặc trưng. Mỗi một vector đặc trưng ứng với vùng ảnh kích thước 13x13 pixel, có độ lớn
là 13x13x(18+1) = 8281. Những vector đặc trưng được sử dụng để xây dựng một mô hình
- và dự đoán một điểm có là điểm đặc trưng hay không. Trong khi huấn luyện, mô hình đặc
trưng Gentle – boost sử dụng các vector đặc trưng trích chọn từ các ví dụ huấn luyện.
Trong khi kiểm tra, một của sổ kích thước 13x13 pixel được quét trên toàn bộ vùng quan
tâm. Với mỗi một vị trí của cửa sổ trượt, so sánh sự giống nhau giữa giá trị của cửa sổ
trượt và mô hình mẫu. Sau khi quét hết vùng quan tâm thì điểm có độ lệch với mẫu là nhỏ
nhất sẽ được chọn.
Hình 3: Sơ đồ hệ thống tự động xác định điểm đặc trưng
2.1.2. Phát hiện hình dáng các bộ phận trên khuôn mặt
Tian phát triển phương pháp nhiều trạng thái để trích chọn đặc trưng hình học trong
hình Hình 4. Một mô hình môi 3 trạng thái miêu tả trạng thái của môi: mở, đóng, ngậm
chặt. Mô hình 2 trạng thái được dùng cho mỗi mắt, mô hình một trạng thái cho má và lông
mày. Một số đặc trưng diện mạo sử dụng mô hình 2 trạng thái: có thể hiện và vắng mặt.
Đường viền của các đặc trưng và thành phần được điều chỉnh bằng tay trong bước khởi
tạo. Sau khi khởi tạo, tất cả các thay đổi của đặc trưng sẽ được dò tìm và phát hiện trong
chuỗi ảnh. Thuật toán sử dụng các trạng thái dò tìm khác nhau là cải tiến của thuật toán
Lucas-Kanade. Tuy nhiên có giới hạn là chuyển động của đầu. Phương pháp có thể phát
hiện 16 Aus với độ chính xác là 95.5% trên bộ cơ sở dữ liệu Cohn – Kanade.
- Hình 4: Mô hình nhiều trạng thái với mặt trực diện
2.2. Phương pháp trích chọn đặc trưng diện mạo
Đặc trưng diện mạo là hướng tiếp cận dựa vào cấu trúc phân bổ của cường độ sáng
của điểm ảnh trên bề mặt của bức ảnh để trích chọn các đặc trưng. Một dạng khác của
trích chọn đặc trưng là trích trọn đặc trưng diện mạo để xác định những thay đổi trên
khuôn mặt. Một số phương pháp tiêu biểu như: Principle Component Analsys (PCA), Gabor
Wavelet Analysis và Local Binary Pattern và được áp dụng trên toàn bộ bề mặt bức ảnh
hoặc một phần để trích ra các đặc trưng và phát hiện sự thay đổi của khuôn mặt.
2.2.1. Mã LBP
LBP (Local Binary Pattern) là mẫu nhị phân địa phương được Ojala trình bày vào
năm 1996 như là một đơn vị đo độ tương phản cục bộ của ảnh. Giá trị LBP được xác định
bằng cách nhân các giá trị ngưỡng với trọng số ứng với mỗi điểm ảnh sau đó cộng tổng
lại. Hình dưới minh họa cách tính độ tương phản trực giao (C) là hiệu cấp độ xám trung
- bình của các điểm ảnh lớn hơn hoặc bằng ngưỡng với các điểm ảnh thấp hơn ngưỡng.
Phân phối hai chiều của mã LBP và độ tương phản cục bộ được lấy làm đặc trưng gọi là
LBP/C.
Hình 5: Ví dụ về LBP và độ tương phản cục bộ C
Nguồn gốc: Dãy LBP được Ojala trình bày vào năm 2002. Định nghĩa một cấu trúc điểm
ảnh T là một phân phối đại số của cấp độ xám của P +1 (P > 0) điểm ảnh.
T = t(gc,g0,…,gp-1)
Với gc ứng với cấp độ xám của điểm ảnh trung tâm Ptt , gp (p = 0,…,1) tương ứng với P
điểm ảnh xung quanh, P điểm ảnh này nằm trên đường tròn bán kính R và tâm là Ptt .
Hình 6: Tập hợp các điểm xung quanh Ptt
Không mất thông tin, có thể trừ gp đi một lượng là gc
T = t(gc,g0 – gc ,…,gp – gc)
Giả sử sự sai số giữa gp và gc là độc lập với gc, ta có thể nhân tử hóa gc như sau:
T = t(gc)t(g0- gc,…,gp-1- gc)
t(gc) biểu thị xu hướng độ sáng tối của cả bức ảnh nên không liên quan đến kết cấu của
ảnh cục bộ do đó có thể bỏ qua
T~t((g0 – gc),…,(gp-1 – gc))
Mặc dù tính bất biến ngược với độ thay đổi tỷ lệ xám của điểm ảnh, sự khác biệt ảnh
hưởng bởi tỷ lệ. Để thu được đặc điểm bất biến với bất kỳ một sự thay đổi nào của ảnh
đen trắng (gray scale) chỉ quan tâm đến dấu của độ lệch:
- 2.3.1. Giới thiệu chung về thuật toán PCA
PCA (Principle Components Analysic) là một thuật toán được sử dụng để tạo ra một
ảnh mới từ ảnh ban đầu. Ảnh mới này có kích thước nhỏ hơn nhiều so với ảnh ban đầu
nhưng vẫn mang những đặc trưng cơ bản nhất của ảnh cần nhận dạng. PCA không cần
quan tâm đến việc tìm ra các đặc điểm cụ thể của thực thể cần nhận dạng và mối quan hệ
giữa các đặc điểm đó. Tất cả các chi tiết đó đều được thể hiện ở ảnh mới được tạo ra từ
PCA. Về bản chất, PCA tìm ra một không gian mới theo hướng biến thiên mạnh nhất của
một tập hợp các vector trong không gian cho trước. Trong không gian mới, người ta hi vọng
rằng việc phân loại sẽ mang lại kết quả tốt hơn so với không gian ban đầu.
Ưu điểm của phương pháp PCA :
+ Tìm được các đặc tính tiêu biểu của đối tượng cần nhận dạng mà không cần phải xác
định các thành phần và mối quan hệ giữa các thành phần đó.
+ Thuật toán có thể thực hiện tốt với các cảnh có độ phân giải cao, do PCA sẽ thu gọn ảnh
thành một ảnh có kích thước nhỏ hơn.
+ PCA có thể kết hợp với các phương pháp khác như mạng Nơron, Support Vector
Machinge… để mạng lại hiệu quả nhận dạng cao hơn.
Nhược điểm của PCA :
+ PCA phân loại theo chiều lớn nhất của tập vector. Tuy nhiên, chiều phân bố lớn nhất
không phải lúc nào cũng mang lại hiệu quả tốt nhất cho bài toán nhận dạng. Đây là nhược
điểm cơ bản của PCA.
+ PCA rất nhạy với nhiễu.
2.3.2. Nội dung thuật toán PCA
Không gian mới được tạo bởi PCA được cấu thành từ k vector đơn vị có chiều là N.
Mỗi vector được gọi là một Eigenface.
Phép biến đổi :
A= W = với K
- Trung bình của các vector đầu vào
Xtb =
Sai lệch so với tâm:
Φi = xi - xtb
Gọi A=[ Φ1, Φ2,… ,ΦM ] ta có ma trận tương quan của A là :
C= = A.AT
Gọi các giá trị riêng của C là : λ1, λ2,…, λn sắp xếp theo thứ tự giảm dần, tương ứng với N
vector riêng u1, u2,…, uN. Các vector riêng này trực giao từng đôi một, riêng ui được gọi là một
eigenface. Tập hợp các vector ban đầu được biểu diễn trong không gian tạo bởi n eigenface
theo mô tả :
x-xtb = w1u1+ w2u2+…+ wNuN =
Chọn lấy K vector riêng u tương ứng với K giá trị riêng λ lớn nhất, ta có :
x-xtb = w1u1+ w2u2+…+ wNuN= với K
- Khâu quan trọng nhất trong bài toán nhận dạng đó là trích chọn vector đặc tính. Các bước
trích chọn bao gồm :
+ Tạo một tập X gồm M ảnh (ảnh học), mỗi ảnh có kích thước N, các ảnh được chuyển
thành vector N chiều.
X = {x1, x2, …,xM }
+ Tính trung bình của tập trên :
Xtb =
+ Tính sai lệch của ảnh đầu vào với giá trị trung bình trên:
Φi = xi - xtb
+ Tìm một tập M vector trực giao u biểu diễn phân bố mạnh nhất của tập dữ liệu X. Tập
các vector u được gọi là eigenface của tập dữ liệu học.
+ Xây dựng các ảnh mới vi theo M vector u :
vi = uitΦi
Ω=[v1, v2,… ,vM]T
Trong đó, vi = uitΦi là vector đặc tính của ảnh thứ I trong không gian mới. Ω ở đây là tập các
eigenface, các thành phần cơ bản cho bức ảnh cần nhận dạng.
Sau khi trích chọn được các vector đặc tính, cần đối chiếu vector này với cơ sở dữ liệu, từ
đó đưa ra kết quả nhận dạng. Trong bài toán, kết quả nhận dạng sẽ là nhận biết được
hoặc chưa nhận biết được.
Để thực hiện phân loại có rất nhiều phương pháp như khoảng cách Euclid, mạng Noron…
trong đó khoảng cách Euclid là phương pháp đơn giản nhất. Nó cho kết quả tốt đối với
trường hợp đối tượng đã được tạo thành các nhóm cách xa nhau. Vector đặc tính của đối
tượng được tạo thành các nhóm cách xa nhau.
Vector đặc tính của đối tượng cần nhận dạng sẽ được so sánh lần lượt với vector đặc tính
của từng ảnh mẫu trong tập các ảnh học. Các khoảng cách ngắn nhất sẽ được lưu lại:
εk= || Ω- Ωk || với k=1,..,M
Ở đây Ωk là vector của khuôn mặt thứ k trong CSDL. Nếu εk nhỏ hơn một số được xác định
trước thì bức ảnh được nhận dạng là khuôn mặt thứ k trong CSDL.
2.3.Ứng dụng của một số phương pháp trích chọn đặc trưng bằng khuôn mặt
+ Hệ thống tương tác giữa người và máy: giúp những người bị tật hoặc khiếm khuyết có
thể trao đổi. Những người dùng ngôn ngữ tay có thể giao tiếp với những người bình
thường. Những người bị bại liệt thông qua một số ký hiệu nháy mắt có thể biểu lộ những
gì họ muốn. + Nhận dạng người A có phải là tội phạm truy nã hay không? Giúp cơ quan an
- ninh quản lý tốt con người. Công việc nhận dạng có thể ở trong môi trường bình thường
cũng như trong bóng tối (sử dụng camera hồng ngoại).
+ Hệ thống quan sát, theo dõi và bảo vệ.
+ Lưu trữ (rút tiền ATM, để biết ai rút tiềnvào thời điểm đó
+ Thẻ căn cước, chứng minh nhân dân.
+ Điều khiển vào ra: văn phòng, công ty, trụ sở, máy tính,…
+ An ninh sân bay, xuất nhập cảnh
+ Tương lai sẽ phát triển các loại thẻ thông minh có tích hợp sẵn đặc trưng của người
dùng trên đó, khi bất cứ người dùng khác dùng để truy cập hay xử lý tại các hệ thống sẽ
được yêu cầu kiểm tra các đặc trưng khuôn mặt so với thẻ để biết nay có phải là chủ thẻ
hay không.
+ Tìm kiếm và tổ chức dữ liệu liên quan đến con người thông qua khuôn mặt người trên
nhiều hệ cơ sở dữ liệu lưu trữ thật lớn, như internet, các hãng truyền hình.
+ Hiện nay có nhiều hướng tiếp cận để xác định một ảnh có phải là ảnh khỏa thân hay
không?
+ Ứng dụng trong video phone.
+ Phân loại trong lưu trữ hình ảnh trong điện thoại di động.
+ Kiểm tra trạng thái người lái xe có ngủ gật, mất tập trung hay không, và hỗ trợ thông báo
khi cần thiết.
+ Phân tích cảm xúc trên khuôn mặt.
+ Trong lãnh vực thiết kế điều khiển robot.
3. Kết luận
Trong bài viết này chúng em đã tìm hiểu, phân tích một số phương pháp trích chọn
đặc trưng khuôn mặt: Phương pháp trích chọn đặc trưng hình học, diện mạo và phương
pháp trích chọn đặc trưng khuôn mặt bằng PCA. Đồng thời đưa ra được các ứng dụng
thực tế đối với một số phương pháp trích chọn đặc trưng khuôn mặt. Trong thời gian học
tập và nghiên cứu tại trường chúng em sẽ mở rộng nghiên cứu để đề tài có thể được phát
triển thành một phần mềm nhận dạng mặt người tốt hơn, bằng cách kết hợp với một số
thuật toán nhận dạng và xử lý ảnh hiện đại hơn. Cho ra kết quả chính xác hơn.
- LỜI CẢM ƠN
Qua thời gian học tập và tiếp thu kiến thức tại trường. Với sự cố gắng, nỗ lực của
mình và sự giúp đỡ của các thầy cô và các bạn chúng em đã hoàn thành bài báo của mình.
Do kiến thức và thời gian còn hạn chế nên bài báo không tránh khỏi những thiếu sót, chúng
em rất mong được sự đóng góp ý kiến của các thầy cô và các bạn để bài báo cáo được
hoàn thiện hơn.
Chúng em xin cảm ơn cô Lưu Thị Bích Hương đã tạo điều kiện cho chúng em
được học tập, trau rồi kiến thức và thực hiện ý tưởng để chúng em hoàn thành bài báo một
cách đúng thời hạn.
- TÀI LIỆU THAM KHẢO
1. Bài tập lớn xử lý ảnh- Đại Học Bách Khoa Hà Nội
2. Bài tập lớn phương pháp tính toán mềm - Đại Học Công Nghiệp Hà Nội
3. Bài tập lớn Nhận dạng mặt người bằng Matlab- Đại Học Quốc Gia TP. Hồ Chí Minh
4. Giáo trình xử lý ảnh - Đỗ Năng Toàn, Phạm Việt Bình
5. Tổng quan các phương pháp xác định khuôn mặt người – Phạm Thế Bảo
6. http://timtailieu.vn
7. http://tailieutonghop.com
8. http://luanvan.co
nguon tai.lieu . vn