- Trang Chủ
- Hệ điều hành
- Xây dựng công cụ nhận dạng khuôn mặt theo thời gian thực hiện trên nền hệ điều hành mã nguồn mỡ
Xem mẫu
- Nghiªn cøu khoa häc c«ng nghÖ
X©y dùng c«ng cô nhËn D¹ng khu«n mÆt
theo thêi gian thùc trªn nÒn hÖ ®iÒu hµnh
m· nguån më
NguyÔn B¸ §¹i*, D¬ng Quèc Dòng**
Tãm tắt: Bµi b¸o tr×nh bµy kÕt qu¶ nghiªn cøu x©y dùng phÇn mÒm nhËn diÖn
khu«n mÆt theo thêi gian thùc trªn hÖ ®iÒu hµnh m· nguån më ¸p dông ph¬ng
ph¸p trÝch rót c¸c thµnh phÇn chÝnh ma trËn ®Æc trng, ®Æc tÝnh mµu cña ¶nh.
PhÇn mÒm ®îc thö nghiÖm trªn kÝt ph¸t triÓn Pandaboard cña h·ng Texas
Instrument sö dông chip 02 lâi ARM-Cotex A9 víi hÖ ®iÒu hµnh Linux. KÕt qu¶ thö
nghiÖm ban ®Çu cho thÊy c«ng cô ®· lµm viÖc kh¸ hiÖu qu¶ vµ cã kh¶ n¨ng ¸p dông
vµo thùc tiÔn trªn nhiÒu lÜnh vùc.
Tõ khãa: ThÞ gi¸c m¸y, Xö lý ¶nh, NhËn d¹ng ®èi tîng, M· nguån më, NhËn d¹ng mÆt, PCA.
1. ®Æt vÊn ®Ò
Khu«n mÆt ngêi ®ãng vai trß quan träng trong c¸c t¬ng t¸c x· héi cña chóng
ta, cho phÐp chóng ta nhËn d¹ng ®îc ngêi nµy víi ngêi kh¸c. ViÖc nhËn d¹ng
®èi tîng dùa vµo khu«n mÆt nhËn ®îc sù quan t©m ®¸ng kÓ trong nh÷ng n¨m gÇn
®©y do tiÒm n¨ng cña nã cho hµng lo¹t c¸c øng dông trong ®iÒu khiÓn robot, trong
c¸c øng dông an ninh nh xuÊt nhËp c¶nh, qu¶n lý tßa nhµ, qu¶n lý c¸c ca kÝp lµm
viÖc trong c¸c ph©n xëng, nhËn d¹ng vµ truy b¾t téi ph¹m NhËn d¹ng mÆt ngêi
(Face Recognition) lµ mét lÜnh vùc nghiªn cøu cña ngµnh thÞ gi¸c m¸y (Computer
Vision) vµ cã liÖn hÖ mËt thiÕt víi c¸c nghiªn cøu cña ngµnh sinh tr¾c häc. Nã cã
nhiÒu ®iÓm t¬ng tù víi c¸c nghiªn cøu nhËn diÖn mèng m¾t hay nhËn d¹ng v©n
tay mµ c¸c nghiªn cøu ®· ®¹t ®Õn sù chÝn muåi. Tuy nhiªn nhËn khu«n mÆt vÉn cßn
lµ mét vÊn ®Ò phøc t¹p, khoa häc ®ang gÆp nhiÒu khã kh¨n khi gi¶i quyÕt nã ®Æc
biÖt lµ bµi to¸n x©y dùng hÖ thèng lµm viÖc theo thêi gian thùc do c¸c giíi h¹n vÒ
tèc ®é, bé nhí lu tr÷ ®èi víi c¸c Board ho¹t ®éng ®éc lËp.
HÖ thèng nhËn d¹ng khu«n mÆt thêi gian thùc lµ hÖ thèng nhËn d¹ng khu«n mÆt
tõ nh÷ng h×nh ¶nh video mµ ®îc cung cÊp bëi camera. Nh vËy, hÖ thèng nµy sö
dông cïng lóc hai kü thuËt ®ã lµ kü thuËt nhËn diÖn khu«n mÆt vµ kü thuËt nhËn
d¹ng, ph©n líp ®èi tîng.
Ngµy nay, c¸c hÖ thèng nhóng ph¸t triÓn m¹nh mÏ vµ ®îc øng dông rÊt réng r·i
trong c¸c hÖ thèng kü thuËt còng nh c¸c thiÕt bÞ cÇm tay. HÖ thèng nhóng víi hÖ
®iÒu hµnh ®ãng vai trß quan träng trong qu¸ tr×nh ph¸t triÓn ®ã. Cã rÊt nhiÒu c¸c hÖ
®iÒu hµnh nhóng ®îc ra ®êi nh c¸c hÖ ®iÒu hµnh Windows CE, VxWorks (Wind
River Systems), Windows NT, QNX RTOS vµ Linux.
Trong nh÷ng hÖ ®iÒu hµnh trªn, hÖ ®iÒu hµnh m· nguån më Linux ®îc ®Æc biÖt
quan t©m v× søc m¹nh còng nh tµi nguyªn to lín cña nã cho viÖc ph¸t triÓn c¸c hÖ
thèng nhóng víi CPU ®a lâi. Mét thùc tÕ kh«ng thÓ phñ nhËn lµ Linux hay nãi
chung c¸c dßng hÖ ®iÒu hµnh ph¸t triÓn tõ Unix lµ tèc ®é xö lý nhanh h¬n h¼n c¸c
Window bëi lý do Linux ®¹t ®îc hiÖu qu¶ cao trong viÖc qu¶n lý vµ sö dông tµi
nguyªn hÖ thèng. Ngoµi ra nã lµ hÖ ®iÒu hµnh miÔn phÝ víi m· nguån më, cho phÐp
T¹p chÝ Nghiªn cøu KH&CN Qu©n sù, Sè 29, 02 - 2014
53
- Kü thuËt ®iÖn tö & Khoa häc m¸y tÝnh
ngêi dïng can thiÖp s©u, tèi u hãa c¸c phÐp to¸n ®Ó t¨ng kh¶ n¨ng tÝnh to¸n, ®¸p
øng yªu cÇu thêi gian thùc trong mét sè bµi to¸n.
Môc tiªu cña ®Ò tµi lµ nghiªn cøu x©y dùng c«ng cô nhËn d¹ng mÆt trªn c¸c thiÕt
bÞ cã tèc ®é xö lý còng nh tµi nguyªn h÷u h¹n ®Ó ¸p dông cho c¸c bµi to¸n thùc
tiÔn cô thÓ lµm viÖc theo thêi gian thùc, vÝ dô nh c¸c bé chÊm c«ng cho nh©n viªn
c«ng ty, nhµ m¸y; thiÕt bÞ gi¸m s¸t vµo ra cho c¸c ®¬n vÞ cã tÝnh an ninh, b¶o mËt
cao...ThiÕt bÞ ph¶i ®¶m b¶o gän nhÑ, ho¹t ®éng æn ®Þnh vµ nhËn diÖn ®îc c¸c ®èi
tîng ®ang di chuyÓn ë tèc ®é cña ngêi ®i bé b×nh thêng. Trong ph¹m vi bµi b¸o,
t¸c gi¶ nghiªn cøu øng dông c¸c kü thuËt nhËn diÖn ®èi tîng, ph¬ng ph¸p sö
dông khu«n mÆt ®Æc trng (Eigenfaces) kÕt hîp víi ph¬ng ph¸p so s¸nh t¬ng
quan ®Ó so khíp vµ nhËn d¹ng ®èi tîng. Trong ®ã, t¸c gi¶ tËp trung nghiªn cøu
kh¶ n¨ng øng dông cña ph¬ng ph¸p mÆt ®Æc trng (Eigenfaces) cho bµi to¸n x©y
dùng bé ®Æc trng nhËn d¹ng mÆt, ®ång thêi xem xÐt c¸c th«ng sè ¶nh hëng ®Õn
thêi gian tÝnh tÝnh to¸n, íc lîng ®Ó ®a ra bé th«ng sè ¶nh ®Çu vµo ®¶m b¶o tèc
®é tÝnh to¸n ®¸p øng yªu cÇu bµi to¸n thêi gian thùc trªn board nhóng. Tõ c¸c
th«ng sè thu ®îc, t¸c gi¶ ®· tiÕn hµnh thö nghiÖm trªn kÝt ph¸t triÓn Pandaboard
cña h·ng Texas Instrument sö dông chip 02 lâi ARM-Cotex A9 víi hÖ ®iÒu hµnh
Linux vµ thu ®îc kÕt qu¶ kh¶ quan.
2. néi dung gi¶i quyÕt
2.1. Lùa chän ph¬ng ph¸p
Nh ®· nãi ë trªn, ®Ó gi¶i quyÕt bµi to¸n nhËn d¹ng mÆt ngêi theo thêi gian
thùc, cÇn gi¶i quyÕt c¸c vÊn ®Ò vÒ nhËn diÖn khu«n mÆt vµ nhËn d¹ng, ph©n líp ®èi
tîng.
§Ó gi¶i quyÕt bµi to¸n nhËn d¹ng khu«n mÆt ngêi, hiÖn t¹i cã hai híng chÝnh
®îc sö dông lµ:
NhËn d¹ng dùa trªn c¸c ®Æc trng cña c¸c phÇn tö trªn khu«n mÆt (Feature
Based Face Fecognition). Khi ®ã, c¸c chi tiÕt trªn khu«n mÆt (nh vÞ trÝ, diÖn tÝch,
h×nh d¹ng cña m¾t, mòi, miÖng) vµ mèi quan hÖ h×nh häc gi÷a chóng (nh kho¶ng
c¸ch cña hai m¾t, kho¶ng c¸ch hai l«ng mµy, t¬ng quan gi÷a c¸c bé phËn ) ®îc
sö dông lµm ®Æc trng cho bµi to¸n so khíp ®èi tîng ë giai ®o¹n tiÕp theo. Ph¬ng
ph¸p nµy cã u ®iÓm lµ gÇn víi c¸ch con ngêi sö dông ®Ó nhËn biÕt khu«n mÆt,
ngoµi ra ph¬ng ph¸p nµy lo¹i bá ®îc c¸c sai sè trong c¸c trêng hîp nh ¶nh bÞ
nghiªng hay nhiÔu do ®iÒu kiÖn ¸nh s¸ng. Tuy nhiªn nhîc ®iÓm lín nhÊtcña
ph¬ng ph¸p nµy lµ thuËt to¸n kh¸ phøc t¹p, khèi lîng tÝnh to¸n lín vµ kÕt qu¶ xö
lý thÊp ®èi víi c¸c ®èi tîng ë kho¶ng c¸ch xa.
NhËn d¹ng dùa trªn tæng thÓ khu«n mÆt (Appearance Based Face Recognition).
Lóc nµy qu¸ tr×nh nhËn d¹ng kh«ng ®i xÐt c¸c chi tiÕt trªn khu«n mÆt n÷a, mµ
chóng ta xem khu«n mÆt lµ mét vector trong kh«ng gian nhiÒu chiÒu tõ ®ã cã thÓ
®¸nh gi¸ t¬ng quan cña c¸c ®èi tîng th«ng qua ®¸nh gi¸ vÞ trÝ t¬ng quan cña
c¸c vector. Tuy nhiªn viÖc sö dông tÊt c¶ c¸c d÷ liÖu trong ¶nh ®Ó dïng cho bµi
to¸n nhËn d¹ng, ph©n líp lµ kh«ng cÇn thiÕt, ®Æc biÖt ®èi víi nhãm d÷ liÖu cã cïng
chiÒu híng biÕn ®æi nh mÆt ngêi, nªn ph¬ng ph¸p ph©n tÝch thµnh phÇn chÝnh
®îc ®Ò xuÊt vµ ®îc sö dông phæ biÕn cho líp bµi to¸n nµy. ¦u ®iÓm cña ph¬ng
ph¸p ph©n tÝch thµnh phÇn chÝnh (Principal Companent Analysis – PCA) ®îc t¸c
Herve Abdi vµ Lynne J.William tæng hîp trong nghiªn cøu cña m×nh [1] lµ cã thÓ
lo¹i bá mét sè chiÒu cña kh«ng gian d÷ liÖu mµ vÉn duy tr× sù biÕn ®æi nhiÒu nhÊt
54 N.B. §¹i, D.Q. Dòng , “X©y dùng c«ng cô nhËn d¹ng khuôn mÆt... mã nguồn mở”
- Nghiªn cøu khoa häc c«ng nghÖ
cña tËp hîp c¸c vector d÷ liÖu ban ®Çu. Tõ ®ã, Matthew A. Turk vµ Alex P.
Pentland ®· ph¸t triÓn ph¬ng ph¸p nhËn d¹ng mÆt sö dông khu«n mÆt ®Æc
trng[2], lµ ph¬ng ph¸p cô thÓ cho bµi to¸n nhËn d¹ng mÆt mµ t¸c gi¶ sö dông cho
viÖc x©y dùng c«ng cô. Khi ®ã, bµi to¸n sÏ ®îc gi¶i quyÕt qua c¸c bíc chÝnh nh
sau:
1. Khëi t¹o: tÝnh to¸n khu«n mÆt ®Æc trng tõ tËp ¶nh d÷ liÖu ®Çu vµo vµ x©y
dùng kh«ng gian ®Æc trng nhiÒu chiÒu míi cho bé ¶nh ®Æc trng.
2. §èi víi ¶nh cÇn nhËn d¹ng, thùc hiÖn viÖc biÓu diÔn trªn kh«ng gian ®Æc
trng, tÝnh to¸n ®é t¬ng quan víi c¸c vector cña tËp d÷ liÖu.
3. §¸nh gi¸ ®é t¬ng quan ®Ó truy xuÊt kÕt qu¶.
2.2. C¸c bíc tiÕn hµnh
X©y dùng kh«ng gian ®Æc trng cho tËp ¶nh d÷ liÖu
Gi¶ sö c¸c ¶nh mÆt I(x,y) biÓu diÔn thµnh c¸c m¶ng gi¸ trÞ cêng ®é s¸ng hai
chiÒu cã kÝch thíc lÇn lît lµ W vµ H, nÕu biÓu diÔn thµnh d¹ng vector trong
kh«ng gian, th× kÝch thíc cña vector hay nãi c¸ch kh¸c chiÒu cña kh«ng gian sÏ lµ
WH. VÝ dô, nÕu ¶nh d÷ liÖu cã d¹ng h×nh vu«ng kÝch thíc 256, th× sè chiÒu cña
kh«ng gian ®Ó biÓu diÔn ¶nh trªn ®ã sÏ lµ 65,536.
NÕu tËp ¶nh ®Çu vµo cña chóng ta gåm m phÇn tö, mçi phÇn tö ®îc biÓu diÔn ë
d¹ng vector cét Xi, khi ®ã ta cã gi¸ trÞ trung b×nh c¸c ¶nh mÆt sÏ lµ:
1 m
X Xi (1)
m i 1
Sai kh¸c gi÷a c¸c mÆt víi gi¸ trÞ trung b×nh ®îc tÝnh theo c«ng tøc:
i X i X (2)
Tõ ®ã, tËp hîp c¸c gi¸ trÞ sai kh¸c cña tËp ¶nh d÷ liÖu so víi gi¸ trÞ trung b×nh
t¹o thµnh ma trËn A cã d¹ng:
A 1 2 ... m (3)
Tõ ®©y x©y dùng ma trËn hiÖp ph¬ng sai. Ở ®©y ta sö dông mét thñ thuËt cña
Mathew A.Turk vµ Alex P.Pentland [2] lµ ®¶o chiÒu nh©n ma trËn lµm gi¶m ®¸ng
kÓ sè chiÒu cña ma trËn ®Ó t×m c¸c vector vµ gi¸ trÞ riªng dÔ dµng h¬n mµ vÉn hiÖu
qu¶ tèt lµ : C AT * A trong ®ã AT lµ ma trËn chuyÓn vÞ cña ma trËn d÷ liÖu ®Çu
vµo A, C lµ ma trËn hiÖp ph¬ng sai. Khi ®ã c¸c gi¸ trÞ riªng x¸c ®Þnh ®îc chØ cßn
lµ 1 2 ... m 0 , vector riªng a1 ,..., am ,thùc hiÖn ®¸nh gi¸ vµ lùa chän sè
trÞ riªng vµ vector riªng lµm c¬ së trùc chuÈn cho kh«ng gian míi. Gäi ma trËn c¬
së trùc chuÈn cho kh«ng gian míi lµ ME. C¸c vector d÷ liÖu ban ®Çu ®îc biÓu
diÔn trong kh«ng gian ®Æc trng th«ng qua phÐp to¸n quay:
MF ME T * A (4)
Trong ®ã MF lµ ma trËn chøa täa ®é c¸c vector ¶nh cña tËp d÷ liÖu trong kh«ng
gian míi.
TÝnh to¸n ®é t¬ng quan cña ¶nh nhËn d¹ng víi tËp ¶nh d÷ liÖu
§èi víi c¸c ¶nh nhËn d¹ng: ¶nh ®îc chuÈn hãa kÝch thíc so víi tËp d÷ liÖu
¶nh c¬ së. Mçi ¶nh ®Çu vµo cña qu¸ tr×nh nhËn d¹ng cã d¹ng lµ vector cét X cã cì
kÝch thíc WH
Sai kh¸c gi÷a ¶nh ®Çu vµo vµ gi¸ trÞ trung b×nh tËp d÷ liÖu:
T¹p chÝ Nghiªn cøu KH&CN Qu©n sù, Sè 29, 02 - 2014
55
- Kü thuËt ®iÖn tö & Khoa häc m¸y tÝnh
X X (5)
To¹ ®é cña vector ¶nh ®Çu vµo biÓu diÔn trong kh«ng gian ®Æc trng cã d¹ng:
IF ME T * (6)
§é t¬ng quan Si gi÷a ¶nh cÇn nhËn d¹ng vµ tËp ¶nh d÷ liÖu ®îc x¸c ®Þnh
th«ng qua kho¶ng c¸ch Euclide cña vector IF víi c¸c cét cña ma trËn MF:
1
Si (7)
1 IF MFi
Gi¸ trÞ Si cµng lín th× ¶nh ®Çu vµo cµng gièng víi thµnh phÇn Fi cña ma trËn
MF, tõ ®ã ta cã thÓ ®a ra kÕt luËn cho ¶nh cÇn nhËn d¹ng.
3. X©y dùng c«ng cô vµ lùa chän tham sè
3.1. Ph¬ng ph¸p, c«ng cô thùc hiÖn
C«ng cô ®îc x©y dùng trªn nÒn hÖ ®iÒu hµnh m· nguån më Ubuntu víi sù hç
trî cña th viÖn xö lý ¶nh OpenCV. C¸c ¶nh cña tËp huÊn luyÖn còng nh ¶nh nhËn
d¹ng thu ®îc tr¶i qua qu¸ tr×nh nhËn diÖn, tiÒn xö lý vµ chuÈn hãa kÝch thíc
t¬ng tù nhau vµ t¬ng tù víi c¸c ®iÒu kiÖn khi tiÕn hµnh nhËn d¹ng. ViÖc nhËn
diÖn sù cã mÆt cña mÆt ®èi tîng trong ¶nh ®îc tiÕn hµnh dùa vµo viÖc sö dông
c¸c líp ®èi tîng Haar Cascade trong OpenCV.
Trong ch¬ng tr×nh, chóng t«i thö nghiÖm nhËn diÖn c¸c ®ång nghiÖp trong c¬
quan, mçi ®èi tîng nhËn d¹ng ®a vµo c¬ së d÷ liÖu 5 ¶nh, ë c¸c tr¹ng th¸i kh¸c
nhau cïng víi mét sè lîng c¸c ¶nh ®îc download tõ internet. Sè lîng ®èi tîng
®îc sö dông cho cho viÖc nhËn d¹ng thö nghiÖm lµ 50 ngêi, sè ¶nh trong c¬ së
d÷ liÖu lµ 500. ViÖc tiÒn xö lý d÷ liÖu c¬ së ban ®Çu, tÝnh to¸n ma trËn t¬ng quan
vµ c¸c gi¸ trÞ riªng ®îc t¸c gi¶ sö dông c¸c c«ng to¸n hç trî qu¸ tr×nh tÝnh to¸n vµ
chØ thùc hiÖn khi khëi ®éng ch¬ng tr×nh. C¸c kÕt qu¶ thu ®îc sÏ ®îc lu tr÷ vµo
file vµ truy xuÊt trong qu¸ tr×nh tÝnh to¸n. Nhê c¸ch xö lý nµy lµm gi¶m ®¸ng kÓ
thêi gian tÝnh to¸n.
H×nh 1. Lưu đồ thuật toán chương trình nhận dạng.
Tõ thuËt to¸n trªn, t¸c gi¶ ®· x©y dùng ®îc c«ng cô phÇn mÒm ch¹y trªn
Pandaboard ARM-Cotex A9, giao diÖn ®îc thÓ hiÖn ë h×nh díi.
56 N.B. §¹i, D.Q. Dòng , “X©y dùng c«ng cô nhËn d¹ng khuôn mÆt... mã nguồn mở”
- Nghiªn cøu khoa häc c«ng nghÖ
H×nh 2. Giao diÖn chÝnh cña hÖ nhËn d¹ng khu«n mÆt.
Giao diÖn gồm có 4 phần chính:
1. Vùng hiển thị tín hiệu video từ camera
2. Vùng khuôn mặt được phát hiện và cắt phục vụ cho quá trình nhận dạng
3. Vùng hiển thị kết quả khuôn mặt sau khi nhận dạng
4. Vùng hiển thị c¸c th«ng sè qu¸ tr×nh nhËn d¹ng bao gåm thêi gian tÝnh to¸n,
chØ sè mÆt t¬ng quan lín nhÊt vµ gi¸ trÞ t¬ng quan. Vïng này được thể hiện
dưới dạng text và chỉ thay đổi khi cã sù xuÊt hiÖn cña mÆt ngêi trong trêng
quan s¸t cña camera.
Tuy nhiªn, trong qu¸ tr×nh thùc hiÖn, ®èi víi mét thiÕt bÞ phÇn cøng cô thÓ, ë
®©y sö dông Pandaboard ARM-Cotex A9, t¸c gi¶ nhËn thÊy cã rÊt nhiÒu yÕu tè ¶nh
hëng tíi c¸c ®Æc tÝnh ho¹t ®éng cña ch¬ng tr×nh nh thêi gian tÝnh to¸n, kho¶ng
c¸ch tíi ®èi tîng khi ch¬ng tr×nh b¾t ®Çu nhËn diÖn, ®é chÝnh x¸c cña thuËt to¸n.
Ngoµi c¸c yÕu tè thuéc vÒ tÝnh n¨ng cña thiÕt bÞ nh tèc ®é xö lý cña chip vµ thuËt
to¸n ch¬ng tr×nh ®· ®îc tèi u hãa, th× kÝch thíc cña tËp ¶nh d÷ liÖu vµ ¶nh
nhËn d¹ng cã lµ yÕu tè cã ¶nh hëng lín tíi c¸c ®Æc tÝnh ho¹t ®éng. Râ rµng lµ khi
kÝch thíc ¶nh gi¶m xuèng, thêi gian tÝnh to¸n sÏ gi¶m, tuy nhiªn viÖc gi¶m chiÒu
d÷ liÖu sÏ lµm mÊt ®i kh¸ nhiÒu th«ng tin trong ¶nh, nh thÕ hiÓn nhiªn sÏ lµm ®é
chÝnh x¸c nhËn d¹ng còng gi¶m xuèng. Nh vËy ®Ó ®¶m b¶o yªu cÇu lµm viÖc theo
thêi gian thùc vµ ®é chÝnh x¸c khi lµm viÖc cña thiÕt bÞ, cÇn c©n nh¾c kü ®Ó lùa
chän kÝch thíc ¶nh hîp lý. NhËn thÊy viÖc tÝnh to¸n thêi gian xö lý cña ch¬ng
tr×nh theo kÝch thíc cña ¶nh mét c¸ch chÝnh x¸c lµ hÕt søc khã kh¨n, t¸c gi¶ ®Ò
xuÊt t×m th«ng sè kÝch thíc ¶nh hîp lý nhÊt th«ng qua viÖc thö nghiÖm c¸c bé gi¸
trÞ kh¸c nhau. Ngoµi ra, tõ viÖc thö nghiÖm ta cßn ®¸nh gi¸ ®îc mét sè ®Æc tÝnh
cña ch¬ng tr×nh thay ®æi theo kÝch thíc ¶nh.
T¹p chÝ Nghiªn cøu KH&CN Qu©n sù, Sè 29, 02 - 2014
57
- Kü thuËt ®iÖn tö & Khoa häc m¸y tÝnh
B¶ng 1. KÕt qu¶ thö nghiÖm thuËt to¸n víi c¸c kÝch thíc ¶nh kh¸c nhau.
KÝch thíc ¶nh
40x44 80x88 100x110 150x165 200x220 232x256
mÆt(pixel)
Thêi gian tÝnh trung
4 9 12 23 31 39
b×nh (ms)
Kho¶ng c¸ch trung
b×nh b¾t ®Çu qu¸ tr×nh 3.5 2.5 2.2 1.8 1.5 1.2
nhËn diÖn(m)
§é chÝnh x¸c 64.6% 78.7% 82.3% 88.2% 92.2% 94.1%
Trong qu¸ tr×nh truy xuÊt kÕt qu¶, ®Ó tr¸nh x¶y ra c¸c ®iÓm bÊt thêng, t¸c gi¶
nhËn thÊy, viÖc xuÊt ra kÕt qu¶ sai thêng chØ x¶y ra mét c¸ch ngÉu nhiªn sau ®ã
l¹i tr¶ vÒ gi¸ trÞ ch©n lý. T¸c gi¶ ®Ò xuÊt ®a ra viÖc chÊp nhËn kÕt qu¶ nhËn d¹ng
chØ ®îc truy xuÊt khi cã liªn tiÕp mét sè lÇn nhËn d¹ng cã cïng kÕt qu¶. Trêng
hîp nhËn d¹ng cã cïng mét kÕt qu¶ sai ë mét sè lÇn liªn tiÕp kh¸c nhau lµ rÊt hiÕm
x¶y ra nªn c¸ch xö lý nµy lµm cho kÕt qu¶ nhËn d¹ng t¨ng lªn mét c¸ch ®¸ng kÓ.
Víi viÖc truy xuÊt kÕt qu¶ cho ba lÇn xö lý liªn tiÕp, t¸c gi¶ thu ®îc mét kÕt qu¶
kh¶ quan h¬n :
B¶ng 2. KÕt qu¶ thö nghiÖm thuËt to¸n víi c¸c kÝch thíc ¶nh
kh¸c nhau sau ba lÇn trïng khíp kÕt qu¶.
KÝch thíc ¶nh
40x44 80x88 100x110 150x165 200x220 232x256
mÆt(pixel)
Thêi gian tÝnh trung
12 27 36 69 93 117
b×nh (ms)
Kho¶ng c¸ch trung
b×nh b¾t ®Çu qu¸ tr×nh 3.5 2.5 2.2 1.8 1.5 1.2
nhËn diÖn(m)
§é chÝnh x¸c 87.4% 90.2% 94.5% 95.6% 96.4% 97.1%
4. KÕt luËn
Tõ c¸c kÕt qu¶ thö nghiÖm, t¸c gi¶ nhËn thÊy, ®èi víi tõng môc ®Ých sö dông
c«ng cô (chÊm c«ng, qu¶n lý ®èi tîng ra vµo khu vùc, hay lµm nhiÖm vô c¶nh b¸o
an ninh) chóng ta sÏ ®¸nh gi¸ yªu cÇu ®Ó lùa chän th«ng sè hîp lý nhÊt.
Víi môc ®Ých ch¬ng tr×nh ho¹t ®éng thö nghiÖm nhËn diÖn theo thêi gian thùc
c¸c ®èi tîng ra vµo c¬ quan (Khoa), t¸c gi¶ c¨n cø vµo kÕt qu¶ vµ lùa chän ®îc
yÕu tè quyÕt ®Þnh ®Õn tÝnh n¨ng bµi to¸n lµ kÝch thíc ¶nh chuÈn cho tËp d÷ liÖu
còng nh cho ¶nh mÆt ®Çu vµo nhËn diÖn. Víi kÝch thíc ¶nh ®Çu vµo cã kÝch
thíc 640x480 vµ kÝch thíc quy chuÈn mÆt c¸c ®èi tîng vÒ 100x110, tèc ®é ph¸t
hiÖn mÆt vµ nhËn d¹ng mÆt cña ch¬ng tr×nh kh¸ nhanh, ®¶m b¶o ph¸t hiÖn t¸ch
®îc mÆt cña ®èi tîng, xö lý vµ ®a ra 27 kÕt qu¶ nhËn dang trong 1 gi©y, ®¶m
b¶o ®îc tèc ®é yªu cÇu.
§é chÝnh x¸c thèng kª thùc nghiÖm trªn tËp ¶nh c¬ së d÷ liÖu thùc (c¸n bé gi¸o
viªn trong Khoa) ®¹t xÊp xØ 94.5% kÕt qu¶ chÝnh x¸c trªn tæng sè lÇn mµ ch¬ng
tr×nh truy xuÊt kÕt qu¶.
58 N.B. §¹i, D.Q. Dòng , “X©y dùng c«ng cô nhËn d¹ng khuôn mÆt... mã nguồn mở”
- Nghiªn cøu khoa häc c«ng nghÖ
Trong qu¸ tr×nh thùc nghiÖm, t¸c gi¶ nhËn thÊy r»ng hÖ thèng cÇn c¶i tiÕn thuËt
to¸n ®Ó cã thÓ lo¹i bá tèi ®a nh÷ng yÕu tè nhiÔu do m«i trêng nhËn d¹ng, còng
nh tèi u hãa tèc ®é cña ch¬ng tr×nh nh»m gi¶m c«ng suÊt lµm viÖc cho chÝp
nh»m ®¶m b¶o tÝnh tin cËy còng nh tµi nguyªn cña hÖ nhóng. §ång thêi thö
nghiÖm trªn tËp mÉu thùc lín h¬n nh¾m ®¸nh gi¸ chÝnh x¸c ®îc kÕt qu¶.
Lêi c¶m ¬n: Nhãm t¸c gi¶ xin göi lêi c¸m ¬n ch©n thµnh tíi c¸c gi¸o viªn trong Khoa Hµng
kh«ng vò trô, Häc viÖn kü thuËt Qu©n sù ®· gióp ®ì nhiÖt t×nh nhãm nghiªn cøu trong qu¸ tr×nh tiÕn
hµnh thö nghiÖm thuËt to¸n.
Tµi liÖu tham kh¶o
[1]. Herve Abdi and Lynne J. Williams, “Principal component analysis,” Wiley
Interdisciplinary Reviews: Computational Statistics, 2: 433–459.
[2]. Matthew A. Turk and Alex P. Pentland, “Face recognition using eigenfaces.”
In Proceedings CVPR 91, IEEE Computer Society Conference on Computer
Vision and Pattern Recognition, 1991.
[3]. Peter N. Belhumeur, Joao P. Hespanha, and David J. Kriegman, “Eigenfaces
vs. fisherfaces: Recognition using class specific linear projection,” IEEE
Transactions On Pattern Analysis And Machine Intelligence, 19(7):711–720,
July 1996.
[4]. W. Zhao, R. Chellappa, P. J. Phillips, and A. Rosenfeld “Face recognition: A
literature survey,” ACM Computing Surveys,35(4):399-458, December 2003
[5]. Rafael C. Gonzalez, Richard E. Woods, “Digital Image Processing,” 2nd
edition, Prentice Hall, Upper Saddle River, NJ, pp 693-750.
[6]. Robert Laganière, “OpenCV 2 Computer Vision Application Programming
Cookbook,” Published by Packt Publishing Ltd. 32 Lincoln Road,
Olton,Birmingham, B27 6PA, UK.
[7]. I.T. Jolliffe, ‘Principal Companent Analysis,” 2nd edition, Springer, New
York, 2005.
abstract
building face recognition tool in
real time based open source
This paper presents research building face recognition tool in real time
based open source with using principal companent analysis. Initial test
results show that the tool has worked quite effectively and be able to apply
in practice in many fields.
Keywords: Computer vision, Image processing, Face recognition, PCA
NhËn bµi ngµy 08 th¸ng 9 n¨m 2013
Hoµn thiÖn ngµy 08 th¸ng 01 n¨m 2013
ChÊp nhËn ®¨ng ngµy 14 th¸ng 01n¨m 2014
§Þa chØ: * Khoa Hµng kh«ng Vò trô, Häc viÖn KTQS.
** Khoa Kü thuËt ®iÒu khiÓn, Häc viÖn KTQS.
T¹p chÝ Nghiªn cøu KH&CN Qu©n sù, Sè 29, 02 - 2014
59
nguon tai.lieu . vn