Xem mẫu
- TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 20 (45) - Thaùng 9/2016
Những phương pháp tiếp cận
về kỹ thuật giám định ảnh số
Approaches to techniques of digital image forensics
han r ng
i n h ng
r ng Đại h c B ch hoa
Phan Trong Le, BEng.
Le Tien Thuong, Assoc.Prof.,Ph.D.
Ho Chi Minh City University of Technology
Tóm t t
Một bức ảnh số có thể d dàng đ ợc chỉnh sửa về mặt hiển thị nh vào các phần mềm chỉnh sửa ảnh
nhất định ơ sở của việc gi m định tính chân thực của ảnh là mặc dù ảnh giả có thể hông để lại bất kỳ
dấu v t hay điểm bất th ng gì báo hiệu đã qua chỉnh sửa, nh ng có thể đặc tính thống kê pixel trên ảnh
đã bị thay đổi. Bài vi t này là một tổng quan về ph ơng ph p gi m định ảnh số, chú tr ng vào ph ơng
pháp phát hiện mù từ công trình khởi đầu của Fridrich năm 2003 đ n các công trình mới trong nửa đầu
năm 2016 Hầu h t c c ph ơng ph p hiện tại đều đ ợc x p vào các nhóm phân loại và đ ợc phân tích đi
kèm với nhận xét và trích dẫn từ tác giả. Bài vi t cũng đề ra thách thức và tiêu chí đ nh gi trong việc
gi m định ảnh giả, từ đó làm cơ sở để phân tích và so sánh giữa c c ph ơng ph p h c nhau
Từ khóa: phát hiện ảnh giả, pháp chứng, kỹ thuật watermarking, chữ ký signature, ảnh cloning,
splicing, retouching, ảnh tạo hoàn toàn từ máy tính (CGI), biến đổi cosine rời rạc (DCT), phân tích
thành phần chính (PCA), máy vector hỗ trợ (SVM).
Abstract
A digital image can be visually changed with ease by using certain editing software. A foundation on
which we are relying is the assumption that although digital forgeries may leave no visual evidences
indicating the tampering, they may have altered the statistical properties of pixel values in the image. This
paper is a literature review on digital image forgery detection focusing on blind detection approach, from
the very beginning work of Fridrich in 2003 to the recent ones in the first half of 2016. Most of the
proposed methods are well classified into categories and analyzed with comments and citations. This work
also indicates the vital challenges and criteria of performance evaluation to the detection of forgery
images, which are considered as the basis of comparison between different methods.
Keywords: digital image forgery, forensics, watermarking, signature, copy-move, splicing or retouching
image, computer-generated imagery (CGI), affine transform, discrete cosine transform (DCT), discrete
wavelet transform (DWT), principal component analysis (PCA), support vector machine (SVM).
3
- 1. ặt v v k thu t nh detection). Với trạng thái bị động về nguồn
nh s tin, yêu cầu đặt ra là chỉ dựa vào bức ảnh
Nhi p ảnh dần trở thành lĩnh vực phổ đang có mà ta phải x c định liệu ảnh này có
bi n trong cuộc sống con ng i từ những thật hay bị chỉnh sửa gì hay không. Với sự
năm hởi đầu ở th kỷ XIX. Dù ở mức độ quan sát về bản chất rằng: mặc dù ảnh giả
chuyên nghiệp hay nghiệp d , ai cũng có có thể hông để lại dấu v t trực quan cho
thể d dàng tạo đ ợc một bức ảnh kỹ thuật mắt trần của con ng i nhận bi t dấu hiệu
số (từ đây, g i tắt là ảnh) bằng camera trên chỉnh sửa, nh ng ảnh đó có thể đã bị thay
điện thoại hoặc máy ảnh, sau đó chỉnh sửa đổi về mặt số liệu thống kê ở mức giá trị
ảnh trực ti p tr n điện thoại hoặc chuyên pixel. Các thuộc tính thống kê này có thể
sâu hơn, chỉnh sửa trên máy tính (Personal đ ợc phân tách và trích l c để tạo thành các
Computer) bằng các phần mềm chuyên đặc tr ng giúp nhận bi t sự can thiệp về
dụng. M i chuyện sẽ hông có gì đ ng nói chỉnh sửa ảnh. Hình 2 cho thấy mức độ
n u nh m i bức ảnh đều đ ợc sử dụng quan tâm trong lĩnh vực gi m định ảnh
đúng với mục đích và chức năng của nó: thông qua số l ợng bài báo công bố giai
truyền tải cho ng i nhìn thông tin ghi đoạn 2004 – 2013.
nhận lại trong th giới thực. Vấn đề nảy
sinh khi một ng i dùng ảnh đã chỉnh sửa
nh là một công cụ để khi n cho ng i xem
tin vào thông điệp mà ng i đó muốn
truyền tải. Hiện t ợng này dẫn tới nhu cầu
sử dụng giải pháp khoa h c để gi m định
tính chân thực trong nội dung hiển thị của
ảnh. Hình 1 là ảnh giả từng đ ợc sử dụng
trong truyền thông.
hông th ng, để bảo vệ tác quyền ảnh a) b)
và xác thực nguồn gốc, kỹ thuật Hình 1: Ảnh ch p c u tổng th ng Pháp
watermar ing hay signature đ ợc áp dụng z p gi i Tour de
vào trong ảnh. Từ đó, n u nội dung ảnh bị France: nh g c (a) và nh ch nh s a (b).
chỉnh sửa thì dữ liệu đ ợc mã hóa vào ảnh [T p chí Le Parisien, 07/2015.
(vốn đ ợc xem là thông điệp nhận dạng www.fourandsix.com]
mang tính bí mật) sẽ bị thay đổi. Việc xác
thực ảnh đ ợc thực hiện bằng cách trích
xuất ng ợc lại mã nhúng từ ảnh rồi kiểm tra
mã này có t ơng ứng với mã mà ng i giữ
bản gốc đang sở hữu hay hông Đây là
c ch gi m định chủ động (active), khi mà
ảnh gốc và ảnh giả đều sẵn có, hiện hữu.
Mặt h c, th ng bức ảnh nhận đ ợc Hình 2: S bài báo khoa h c IEEE và
hông đi èm với bất cứ thông tin bi t c nh
tr ớc nào Điều này dẫn tới c ch gi m định nh s n 2004 - 2013. [23]
bị động (passive) hoặc phát hiện mù (blind Phần còn lại của bài vi t có bố cục nh
4
- sau: mục II. trình bày các loại ảnh giả, mục p dụng cho loại ảnh giả này để tăng c ng
III. và IV. phân loại các giải ph p gi m định hay giảm bỏ c c chi ti t gốc. ột ví dụ
theo h ớng Active và Passive, mục V. và VI. đ ợc cho ở hình 5.
lần l ợt là các thách thức và ti u chí đ nh gi
khi thực hiện gi m định ảnh, cuối cùng là
thảo luận và k t luận ở mục VII. và VIII.
2. Phân lo i nh gi
A. Cloning
Một phần của ảnh đ ợc sao chép và
dán (clone) vào một nơi h c của cùng một
ảnh ban đầu với mục đích là để che giấu
hoặc tạo thêm chi ti t trong ảnh. Ví dụ điển a) b)
hình đ ợc cho ở hình 3. Hình 5: Ả
a) b): ú
ổ ê
ặ [35]
D. Computer-Generated Imagery (CGI)
Thay vì làm giả một phần, một bức ảnh
có thể đ ợc làm giả hoàn toàn (không chụp
a) b)
bằng camera) nh các công cụ đồ h a trên
Hình 3: Ví d nh cloning. Ảnh g c (a)
máy tính. Một ví dụ đ ợc cho ở hình 6.
và nh gi (b) v i vùng nh hai con mèo
. [2]
B. Splicing
ỹ thuật này giống cloning, ngoại trừ
việc vùng ảnh sao chép đ ợc lấy từ nguồn
ảnh h c b n ngoài Nói cách khác,
splicing là tr ng hợp tổng qu t hơn
cloning. ột ví dụ ảnh splicing đ ợc cho ở
hình 4.
Hình 6: Ví d v nh CGI. Ảnh g c
(n a mặt trái) và nh gi (n a mặt ph i):
h un nh m khác
bi t bằng m ờng. [22]
3. ng ti p c n phát hi n nh gi
- Active
rong ỹ thuật watermar ing, dữ liệu
Hình 4: Ả a, nhúng là thông tin đã đ ợc x c định tr ớc,
b) c). [7] nh là một ảnh biểu t ợng th ơng hiệu
C. Retouching hoặc một đoạn văn bản au hi mã hóa
Nâng cao chất l ợng ảnh (cân bằng thông tin vào ảnh, dữ liệu nhúng có thể
trắng, đổi màu, tạo nhòe, v v ) th ng đ ợc đ ợc hiển thị tr n ảnh, hoặc cũng có thể để
5
- ẩn hoàn toàn, hoặc t hợp cả hai c ch bi n đổi ng ợc để t i tạo lại watermar đã
(hình 7). Việc trích xuất lại watermar dùng. Kỹ thuật watermar ing trải phổ [10]
cũng có hai c ch: giải thuật có dùng thêm đ ợc sử dụng phố bi n và có nhiều thuật
thông tin từ ảnh gốc (non-blind) và không toán mới đ ợc đề xuất ph t triển; đồng
dùng ảnh gốc (blind) rong hi ỹ thuật th i, đây cũng là giải ph p mang tính bền
watermar ing thực hiện nhúng thông tin vững cao
đ ợc ch n tr ớc vào ảnh, thì ỹ thuật Tiwari et al. [34] dùng bi n đổi DW
signature thực hiện lấy đặc tr ng độc nhất hai mức cho ảnh gốc và dữ liệu nhúng
từ ảnh rồi mã hóa thành dạng chữ ý số đ ợc mã hóa DE (Data Encryption
tandard) tr ớc hi t hợp nhúng với ảnh
gốc t quả là watermar chống chịu hiệu
quả với phép nội suy hối nh ng vẫn giữ
đ ợc chất l ợng ảnh ở hệ số chất l ợng QF
lớn hơn 90 Jiansheng et al. [16] t hợp
a) b) DW với D cho ra t quả watermar
Hình 7: a) đ ợc ẩn hoàn toàn, đồng th i chống ch i
(“ ” Africa Studio, đ ợc một số phép xử lý thông dụng nh
www.shutterstock.com) và bán b) l c, tăng c ng sắc nét, nhi u muối ti u,
(“20 0 ©” Klaus Herrmann, nén và cắt ảnh
http://farbspiel-photo.com). Những năm gần đây, c c h ớng
ó hai h ớng ti p cận: nhúng nghi n cứu dựa trên ba loại bi n đổi cơ bản
watermar trong miền hông gian và trong này vẫn đ ợc chú tr ng ph t triển. Pathak
miền tần số Trong miền hông gian, ba ỹ et al. [27] dùng lý thuy t to n huỗi hỗn
thuật chính là Bit tr ng số thấp nhất (LSB) loạn (Chaotic sequence) để trải phổ tín hiệu
[8, 37], ập hối (Patchwork) [3] và ã dự watermar vào c c hệ số DW , giúp giữ
đo n (Predictive coding) [39]. Ba ph ơng nguy n chất l ợng ảnh gốc (cải thiện chỉ số
pháp trên, theo thứ tự t ơng ứng, rất nhạy NR) và tăng tính bền vững đối với c c
với nhi u thay đổi tr n gi trị pixel (từ phép bi n đổi nh phân t n dữ liệu nhúng
nh truyền, phép xử lý hậu ỳ nh xoay, tr n vùng phổ rộng và mang đặc tính giống
dịch và cắt ảnh), bị giới hạn l ợng thông nhi u (hình 8). Hu et al. [14] tăng c ng
tin nhúng và ém về mặt giữ nguy n chất hả năng chống chịu tấn công nén J E và
l ợng ảnh, n n watermar miền tần số thay đổi nhi u bằng c ch điều ch gi trị
đ ợc quan tâm xem xét nhiều hơn nh trung bình của hệ số D đổi dấu một
hắc phục đ ợc c c y u điểm này. phần ( A) có ph ơng sai điều chỉnh theo
Trong miền tần số, ba phép bi n đổi bảng l ợng tử J E hoặc chỉ số bi n dạng
chính là Wavelet r i rạc - DWT, osine r i đ ng chú ý (JND) của mô hình ệ thống
rạc - DCT và Fourier r i rạc - DFT. Bức thị gi c con ng i ( V ) Su et al. [32]
ảnh đ ợc biểu di n d ới dạng tần số, vốn dùng phép bi n đổi mới hơn là ontourlet,
là đặc tính của tín hiệu nói chung, thông t hợp phép phân tích essenberg để
qua c c hệ số của miền bi n đổi. Thông tin nhúng watermar trong ảnh màu, t quả
mã nhúng đ ợc lồng vào c c hệ số này và đạt tính vô hình cao hơn và hả năng
hi ti n hành x c minh, ta thực hiện phép chống ch i tốt hơn từ c c cuộc tấn công về
6
- nén J E , l c tích chập và nhi u cộng còn đề xuất ph ơng ph p tối u hơn là
Robust Match bằng cách dùng hệ số DCT
thay vì giá trị pixel cho b ớc so sánh khối.
h ơng ph p này cho hiệu quả cao hơn
nh ng vẫn còn vài giới hạn về độ tin cậy.
Ngoài ra, ph ơng ph p này cũng hông bền
vững tr ớc các phép bi n đổi tuy n tính.
Hình 8: w Bảng 1 thống kê k t quả đạt đ ợc
W [40]. t ơng ứng với các loại đặc tr ng khác nhau,
)Ả ú )Ả thay vì dùng mức xám hay hệ số D nh
w )Ả w đã phân tích ở đoạn tr ớc. Công trình tiêu
. biểu gần đây trong nhóm kỹ thuật này là
4. ng ti p c n phát hi n nh gi Kaur và Walia [24] với việc sử dụng ớc
- Passive l ợng nhi u và đặc tr ng về độ dốc có định
Hầu h t các kỹ thuật mù phát hiện ảnh h ớng biểu đồ tần suất ( O ) h ơng
giả đều có thể phân loại thành năm nhóm: pháp này có khả năng đồng th i phát hiện
dựa vào pixel, định dạng, máy ảnh và độ r i và định vị vùng ảnh giả. K t quả (hình 9)
sáng (từ mục A. đ n D.). Ngoài ra, có một đ ợc thử nghiệm trên tập dữ liệu CASIA.
cách phân nhóm khác dựa trên loại đặc
tr ng [30], n n năm nhóm trên có thể sắp
x p lại thành hai nhóm lớn: dựa trên khối
pixel và keypoint.
A. Dựa vào pixel
Các khối pixel, vốn là cơ sở hình thành a) Ảnh gốc b) Ảnh giả
nên ảnh số, đ ợc chú tr ng khảo s t để tìm Hình 9: Phát hi nh v vùng nh
sự h c th ng trong thống kê ở mức giá trị gi trong hình b) dùng k
pixel, từ đó t luận về dấu v t chỉnh sửa thu Ư ng nhi ặ
của vùng ảnh giả. Trong công trình khởi HOG [18].
đầu h ớng nghiên cứu gi m định ảnh, B. Dự và định dạng ảnh
Fridrich et al. [11] đề xuất ph ơng ph p r ớc khi bị làm giả, ảnh đ ợc mở
Exhausive Search cho ảnh cloning bằng bằng phần mềm chỉnh sửa au đó, ảnh
cách tìm hai vùng chứa giá trị pixel giống đ ợc l u mới và qua thêm một lần nén ảnh
nhau Đây là ph ơng ph p rất cơ bản và (ví dụ định dạng J E ) Để tận dụng tính
đơn giản nh ng hông đủ để dùng giám chất nén không bảo toàn JPEG, có ba
định ảnh giả thực t , đồng th i lại cần khối ph ơng ph p đ ợc đề xuất:
l ợng tính toán lớn au đó, công trình này 1. Lượng tử JPEG
7
- B ng 1: So sánh k t qu n nh cloning [23]
h ơng ph p Đặc tr ng Bộ phân lớp Độ chính xác
Popescu và PCA ắp x p theo thứ tự t n 100% hối pixel 16x16
(lexicographic)
Farid [28] 50% hối pixel nhỏ hơn
Gopi et al.[13] ệ số tự hồi quy ạng nơron nhân tạo 94.83%
Lin et al. [19] ng độ s ng trung ắp x p theo cơ số và 98%
bình của hối pixel tính vector dịch
Bashar et al. [1] DWT và KPCA huật to n ph t hiện 95.55% (DWT)
nhân bản dựa theo điểm
90.94% (KCPA)
Thajeel và Sulong [33] CR LBP ắp x p theo thứ tự t n > 91% (với phép xoay
và phép xoay t hợp
với phép bi n đổi khác)
Isaac và Wilscy [15] Gabor Wavelet và SVD 99% tr n tập dữ liệu
l ợng tử pha cục bộ CASIA v1.0 và tập màu
(LPQ) DVMM
Kaur và Walia [18] Ước l ợng nhi u Phân nhóm k-Means và ~70% cho tập dữ liệu
dựa tr n A và đặc SVM CASIA v1.0 và v2.0
tr ng O
Khi nén, mỗi hệ số DCT c đ ợc l ợng 3. Nhiễu khối JPEG
tử với hệ số q: c/q. Việc lựa ch n giá trị q Phát hiện ảnh giả dựa trên sự bất đồng
khác nhau cho ra bảng l ợng tử khác nhau; nhất trong nhi u khối. Giải pháp là tìm ma
do đó, một dạng chữ ý độc nhất về l ợng trận nhi u khối và quan sát phân lớp mẫu.
tử sẽ đ ợc nhúng vào ảnh JPEG ở đầu ra. Ảnh giả qua nhiều lần nén sẽ gây nhi u
2. Nén JPEG hơn một lần trong hai quan sát này.
Phát hiện ảnh giả dựa trên hiện diện Lin và Tsay [21] dùng bộ ớc l ợng
của nhi u (artifact) khi có nhiều hơn một ích th ớc khối nhi u (áp dụng kỹ thuật lấy
lần nén ảnh. Giải pháp là phân tích tính chu mẫu ngẫu nhiên, bầu ch n và hợp lý cực
kỳ lặp lại của nhi u l ợng tử đôi trong đại - maximum likelihood) và phân tích
histogram sau khi ảnh bị nén từ lần thứ hai tính nhất quán của ích th ớc khối nhi u
(hình 10). JPEG (hình 11), khối cục bộ nào có kích
th ớc khác với ích th ớc khối chính thì
đ ợc xem là vùng ảnh giả.
a) b)
Hình 10: K t qu phân tích nén JPEG và
a) Ảnh splicing. b) K t quả.
nhi ng t (b) t nh gi (a). Xem
Hình 11: Phát hi n nh Splicing dùng k
ngu n nh th t hình 3. [2]
thu Ư ng kh i nhi u [21].
8
- Tóm lại, những kỹ thuật này chỉ có lợi Tuy nhiên, thực t khó sử dụng h ớng
th trên bức ảnh đ ợc l u lại hơn một lần. ti p cận này vì với phát hiện mù, việc bi t
Việc chỉ dùng mỗi thông tin về định dạng tr ớc thông tin về loại cảm bi n hay bản đồ
ảnh hông đủ để xây dựng ph ơng ph p nhi u cho tr ớc, hoặc sở hữu tập ảnh đ ợc
phát hiện ảnh giả bền vững. Ngoài ra, n u chụp từ cùng một cảm bi n thì hoàn toàn
chỉ dùng thông tin nén ảnh thì d dẫn đ n không khả thi.
phát hiện sai, đơn cử là tr ng hợp ảnh gốc D. Dự và cườ g độ rọi sáng và màu
đ ợc phóng to theo thuật toán nội suy hoặc Vì c c phần ảnh giả đ ợc cắt ghép từ
đ ợc làm nhòe, sau đó đ ợc l u lại Nh nhiều nguồn h c nhau n n chúng hông
vậy, mặc dù nội dung ảnh hông thay đổi đảm bảo đ ợc tính nhất qu n của h ớng
nh ng vẫn sẽ bị đ nh gi là ảnh giả, vì cũng nguồn s ng đặt l n đối t ợng Do đó, phân
có trải qua thêm một lần nén. tích sự bất th ng trong hiệu ứng nh s ng
C. Dựa vào máy ảnh đ ợc r i l n c c đối t ợng giúp chỉ ra dấu
Phân tích nhi u đ ợc tạo ra từ một hệ v t của chỉnh sửa ó hai c ch để tận dụng
thống máy ảnh nhất định; từ đó, sự không h ớng ti p cận này: vị trí nguồn s ng và
nhất quán trong nhi u có thể đ ợc dùng để phân lớp màu (ví dụ hình 14). Tuy nhiên,
chỉ ra dấu v t chỉnh sửa ảnh. Có bốn cơ sở số l ợng lớn c c đối t ợng trong màu sắc
để áp dụng: h c th ng về màu sắc, Mảng h c nhau dẫn tới sự hó hăn trong việc
l c màu, àm đ p ứng của máy ảnh và ph t hiện tất cả đối t ợng giả cùng một lúc
Nhi u cảm bi n. Do đó, phần lớn công trình nghi n cứu gần
Fridrich et al. [12] sử dụng kỹ thuật đây tập trung vào sử dụng một phần hông
Ước l ợng đ p ứng hông đồng nhất của gian màu để giới hạn loại đối t ợng xem
máy ảnh để tận dụng thông tin từ nhi u của xét, ví dụ nh chỉ xem xét đối t ợng màu
cảm bi n hông tin này đ ợc xem xét nh da ng i [5].
là đặc tr ng nhận dạng (hình 12) cho việc Johnson và Farid [17] đã vận dụng t
phát hiện ảnh đ ợc chụp bởi máy ảnh thật quả nghi n cứu Ước l ợng tự động h ớng
hay từ cùng một máy ảnh hay không. Theo nguồn s ng [25] để đ nh gi mức độ phản
đó, tất cả cảm bi n đều có các thuộc tính xạ cục bộ hoặc toàn cục tr n c c vùng ảnh
t ơng tự cho việc tạo đặc tr ng nhận dạng có t cấu h c nhau (hình 13). Carvalho et
dựa tr n cơ sở rằng chúng đ ợc tạo từ công al. [6] xây dựng mô hình 3 chiều của đối
nghệ sản xuất giống nhau. t ợng (chỉ từ một ảnh) tr ớc hi ớc l ợng
h ớng nguồn s ng đ ợc đặt l n đối t ợng
đó uy t quả hông đ ợc đ nh gi tr n
một tập dữ liệu lớn, nh ng từ t quả thí
nghiệm cho thấy ph ơng ph p này hiệu
quả ngay cả với nguồn s ng phức tạp
Mặc dù kỹ thuật phân tích h ớng
nguồn sáng và thông tin màu rất hứa hẹn trở
Hình 12: Phóng to m t ph n nh nhi u thành một công cụ gi m định ảnh hiệu quả,
trên c m bi n Canon G2. Giá tr pixel nh ng trong 5 năm trở lại đây, số l ợng
c chia t l theo d [0 255] quan công trình về h ớng nghiên cứu này vẫn
sát. [12] còn rất ít so với c c h ớng ti p cận khác.
9
- giống nhau, bầu tr i, mảng mây).
Có khả năng hoanh vùng và định
vị vùng ảnh giả.
Loại bỏ các thông tin thừa khi tìm
vùng ảnh giả: ví dụ nh chữ bìa báo
a) b) trong hình 1.
Hình 13: Ảnh giả (a) cho thấy góc ước Các thuật to n có dùng ng ỡng để
lượng hướng ánh sáng cách biệt giữa hai phân loại k t quả th ng ch n giá
người, 123o và 86o. Ảnh thật (b) cho thấy trị ng ỡng cố định và mang tính
góc ước lượng hướng ánh sáng của hai kinh nghiệm. Cần xây dựng hàm lấy
người tương đương nhau, 98o và 93o. [17] ng ỡng thích hợp có khả năng tùy
bi n thích nghi và có mối liên hệ
chặt chẽ với c c đặc tính đang xem
xét của ảnh để tối u điểm lấy
ng ỡng theo hàm mục ti u độ chính
xác cực đại.
Gần đây, Zerni e moments và lựa ch n
bi n đổi tuy n tính t ơng đồng (SATS)
a) b) đ ợc dùng cho phát hiện xoay [31, 9], SIFT
Hình 14: cho xoay và tỉ lệ [26], SUFT cho xoay, tỉ lệ,
sáng (b) ờ nhi u cộng và nhòe [4], SVM cho phát hiện
(a). [5] vùng nhòe [36]. Bi n đổi FMT thì bền vững
đối với xoay, tỉ lệ, nhi u và nhòe với chi
5. Các thách th c nh nh
phí tính toán thấp.
Cần x c định rõ các thách thức sẽ phải
6. ê
đối mặt trong việc phát hiện ảnh giả để l u
Độ chính x c: ỉ lệ số lần ph t hiện
ý các vấn đề cần giải quy t và đặt ra giả
đúng tr n tổng số ảnh giả đầu vào
thuy t phù hợp trong quá trình nghiên cứu:
hi phí tính to n: l ợng tính to n
Giảm tỉ lệ phát hiện sai
cần dùng để cho ra t quả, cần l u
Hoàn toàn tự động (không cần con
ý hi ứng dụng vào hệ thống th i
ng i can thiệp để di n dịch k t quả)
gian thực
Không phụ thuộc vào định dạng
Độ nhạy với c c phép bi n đổi: chỉ
nguồn ảnh (nén ảnh)
ra mức độ t quả bị ảnh h ởng bởi
ăng độ tin cậy và bền vững đối với
c c điều iện thử nghiệm h c nhau.
bi n đổi tuy n tính và phi tuy n.
Không nhạy với thay đổi của nhi u.
Tránh giới hạn số l ợng và kích
ức độ tự động: giảm thiểu can
th ớc của vùng ảnh giả có thể phát
thiệp của con ng i trong việc di n
hiện đ ợc bởi thuật toán.
dịch và đ a ra t luận gi m định.
Tận dụng thông tin màu, thay vì chỉ
Độ chính x c n n là ti u chí hàng đầu,
dùng ảnh xám.
vì đây là t quả cuối cùng ảnh h ởng tới
Tránh phát hiện sai c c đối t ợng thật
quy t định gi m định, nhất là hi liên quan
có tính chất giống nhau hoặc đồng
tới luật pháp, còn các tiêu chí h c có thể
nhất tự nhiên (ví dụ: lốc các hộp sữa
10
- đ nh đổi qua lại Độ nhạy có thể đ ợc giới r i lại, h ớng ti p cận dựa vào m y ảnh
hạn ở một số hía cạnh và ứng dụng để mang tính ém hả thi nhất vì nó y u cầu
ph ơng ph p đề ra có thể đ p ứng tốt một đ ợc bi t một số thông tin có tr ớc từ ảnh
số mục ti u nhất định. hả nghi, điều mà vốn hông thể đạt đ ợc
iệu năng có thể đ ợc biểu di n d ới trong ứng dụng thực t hép bi n đổi nh
dạng thống độ chính x c, độ nhạy và độ D hay F ti p tục là ỹ thuật hiệu quả
ri ng biệt Độ nhạy (Sensitivity) là thông để biểu di n lại ảnh với ích th ớc nhỏ hơn
số đo l ng độ chính x c phân loại đúng (giảm thông tin d thừa) để giảm hối
đối với ảnh giả (tức, ảnh giả đ ợc x p loại l ợng tính to n Ngoài ra, hai tập dữ liệu
là giả), Độ ri ng biệt ( pecificity) đo l ng ảnh th ng dùng phổ bi n trong c c công
độ chính x c phân loại đúng đối với ảnh trình gần đây đ ợc đ nh gi là đủ tốt để
thực (tức, ảnh thực đ ợc x p loại là thực) thử nghiệm và so s nh giữa c c ph ơng
và Độ chính x c (Accuracy) là tỉ lệ phần ph p, đó là o oFoD (từ phòng thí
trăm giữa số ảnh phân loại đúng tr n tổng nghiệm Video ommunications, Đại h c
số ảnh xem xét (tức, ảnh giả đ ợc x p loại Zagreb, roatia) và A IA (từ Viện ự
là giả và ảnh thực đ ợc x p loại là thực), động Nhận dạng ẫu, c việc hoa h c
tính nh (1): Quốc gia, rung Quốc)
TP TN ổng quan, nhiều ph ơng ph p đã
Accuracy 100 (1)
TP TN FN FP đ ợc đề xuất để xử lý c c th ch thức trong
Với: ph t hiện ảnh giả, tuy nhi n chúng vẫn còn
TP (True Positive): số ảnh giả đ ợc nhiều giới hạn về tính ứng dụng thực t
x p đúng là ảnh giả ột phần là vì có đặt tr ớc giới hạn trong
FN (False Negative): số ảnh giả giả thuy t ban đầu, một phần là vì thi u
đ ợc x p sai thành ảnh thực một mô hình chung và chuẩn hóa để hội tụ
FP (False Positive): số ảnh thực c c nh nh nghi n cứu còn đang ri ng lẻ
đ ợc x p sai thành ảnh giả Việc đ nh gi tính bền vững đối với c c
TN (True Negative): số ảnh thực loại phép bi n đổi đ ợc dùng tr n vùng ảnh
đ ợc x p đúng là ảnh thực giả vẫn dựa tr n thực nghiệm iểm chứng
7. l là chủ y u, n n nhu cầu về một mô hình
rong hi ỹ thuật watermar và to n h c hỗ trợ cho việc phân tích t quả
signature đ ợc dùng nh là công cụ chủ cũng nh là dự đo n và ớc l ợng tr ớc
động để giúp chủ nhân của c c bức ảnh số tính bền vững của giải ph p (hay cụ thể là
bảo vệ quyền t c giả của mình, thì phần loại đặc tr ng) đ ợc đề xuất là cần thi t
còn lại của câu chuyện gi m định ảnh là 8. l n
ph t hiện mù tr n những bức ảnh hông rõ Bài hảo s t này đã tóm tắt phần lớn
nguồn gốc ớng ti p cận dựa vào độ r i các h ớng nghi n cứu về lĩnh vực gi m
sáng và không gian màu là ph ơng ph p định ảnh giả trong 15 năm gần đây, tập
ph t hiện hứa hẹn ph t triển nhất vì nó trung chủ y u vào h ớng ph t hiện mù
hông phụ thuộc vào c c phép bi n đổi p rong h ớng ti p cận chủ động, có hai ỹ
dụng tr n vùng ảnh giả uy nhi n, h ớng thuật chính đ ợc dùng là watermar ing và
ti p cận này cũng phải đối mặt với hó signature; còn h ớng ti p cận bị động, có
hăn về định vị và hoanh vùng ảnh giả năm nhóm chính là dựa vào pixel, định
11
- dạng, m y ảnh và độ r i s ng ai ỹ thuật 8. Chang, C. C., Hsiao, J. Y., và Chan, C. S.
dựa vào hối pixel và eypoint cũng là một (2003). Finding optimal least-significant-bit
substitution in image hiding by dynamic
c ch phân loại h c Bài vi t cũng đã chỉ ra programming strategy. Pattern Recognition,
u nh ợc điểm của mỗi nhóm phân loại 36(7), 1583-1595.
Nhiều ỹ thuật đ ợc đ a ra cho thấy sự cải 9. Christlein, V., Riess, C., và Angelopoulou, E.
thiện lớn về độ chính x c l n tới 99%; tuy (2010). On rotation invariance in copy-move
forgery detection. In Information Forensics
nhi n, th ng luôn có sự đ nh đổi giữa độ and Security (WIFS), 2010 IEEE International
chính xác, mức phức tạp và độ bền vững Workshop on, pages 1-6. IEEE.
trong giải thuật Ngoài ra, việc đối phó với 10. Cox, I. J., Kilian, J., Leighton, F. T., và
Shamoon, T. (1997). Secure spread spectrum
c c phép bi n đổi tuy n tính cũng là một
watermarking for multimedia. IEEE
trong c c th ch thức lớn nhất trong việc Transactions on Image Processing,
xây dựng giải ph p mang tính bền vững, do 6(12):1673-1687.
sự đa dạng và tính t hợp của c c phép 11. Fridrich, A. J., Soukal, B. D., và u š, A. J.
(2003). Detection of copy-move forgery in
bi n đổi đ ợc dùng hi tạo ảnh giả. digital images. In in Proceedings of Digital
Lời c Forensic Research Workshop. Citeseer.
12. Fridrich, J. (2009). Digital image forensics.
ông trình này đ ợc tài trợ bởi quỹ Đại h c Signal Processing Magazine, IEEE, 26(2):26-37.
Quốc gia Thành phố Hồ Chí Minh với mã 13. Gopi, E., Lakshmanan, N., Gokul, T., Kumara
sốB2015-20-02. Ganesh, S., và Shah, P. R. (2006). Digital
image forgery detection using artificial neural
TÀI LIỆU THAM KHẢO
network and auto regressive coefficients. In
Electrical and Computer Engineering, 2006.
1. Bashar, M., Noda, K., Ohnishi, N., và Mori,
E E’06 anadian onference on, pages
K. (2010). Exploring duplicated regions in
194-197. IEEE.
natural images. IEEE Transactions on Image 14. Hu, H. T., Chang, J. R., và Hsu, L. Y. (2016).
Processing, vol. PP, no. 99, pp. 1-1. Robust blind image watermarking by
2. Belkasoft, Belkasoft database. [Online]. modulating the mean of partly sign-altered
Available: https://belkasoft.com/forgery-detection DCT coefficients guided by human visual
3. Bender, W., Gruhl, D., Morimoto, N., và Lu, perception. AEU-International Journal of
A. (1996). Techniques for data hiding. IBM Electronics and Communications.
systems journal, 35(3.4), pp. 313-336. 15. Isaac, M. M., và Wilscy, M. (2015). Image
4. Bo, X., Junwen, W., Guangjie, L., và Yuewei, D. Forgery Detection Based on Gabor Wavelets
(2010). Image copymove forgery detection based and Local Phase Quantization. Procedia
on surf. In Multimedia Information Networking Computer Science, 58, 76-83.
and Security (MINES), 2010 International 16. Jiansheng, M., Sukang, L., và Xiaomei, T.
Conference on, pages 889-892. IEEE. (2009). A digital watermarking algorithm
5. Carvalho, T. J. d., Riess, C., Angelopoulou, based on DCT and DWT. In Proceedings of
E., Pedrini, H., và de Rezende Rocha, A. the 2009 International Symposium on Web
(2013). Exposing digital image forgeries by Information Systems and Applications
illumination color classification. Information (WI A’09) Nanchang, R hina, pages
Forensics and Security, IEEE Transactions 104-107. Citeseer.
on, 8(7):1182-1194. 17. Johnson, Micah K., và Hany Farid. (2005)
6. Carvalho, Tiago, Hany Farid, và Eric Kee. Exposing digital forgeries by detecting
(2015). Exposing photo manipulation from inconsistencies in lighting. Proceedings of the
user-guided 3D lighting analysis. SPIE/IS&T 7th workshop on Multimedia and security.
Electronic Imaging. International Society for ACM.
Optics and Photonics. 18. Kaur, M., và Walia, S. (2016). Forgery
7. CASIA. Tampering detection dataset. [Online]. Detection Using Noise Estimation and HOG
Available: http://forensics.idealtest.org Feature Extraction. International Journal of
12
- Multimedia and Ubiquitous Engineering, Dartmouth College. USA.
11(4), 37-48. 29. Qazi, T., Hayat, K., Khan, S. U., Madani, S.
19. Lin, H.-J., Wang, C.-W., Kao, Y.-T., và Chen, A., Khan, I. A., Ko lodziej, J., Li, H., Lin, W.,
S. (2009a). An efficient method for copy-move Yow, K., và Xu, C.-Z. (2013). Survey on
forgery detection. In WSEAS International blind image forgery detection. Image
Conference. Proceedings. Mathematics and Processing, IET, 7(7):660-670.
Computers in Science and Engineering, 30. Rajkumar, R., Chanu, T. A., và Singh, N. N.
number 8. World Scientific and Engineering (2016). Copy move forgery detection
Academy and Society. approaches: A survey. ADBU Journal of
20. Lin, H.-J., Wang, C.-W., Kao, Y.-T., et al. Engineering Technology,
(2009b). Fast copy-move forgery detection. 31. Ryu, S.-J., Lee, M.-J., và Lee, H.-K. (2010).
WSEAS Transactions on Signal Processing, Detection of copy-rotatemove forgery using
5(5): 188-197. zernike moments. In Information Hiding,
21. Lin, C. S., và Tsay, J. J. (2015). Passive pages 51–65. Springer.
forgery detection for JPEG compressed image 32. Su, Q., Wang, G., Lv, G., Zhang, X., Deng,
based on block size estimation and G., và Chen, B. (2016). A novel blind color
consistency analysis. Applied Mathematics image watermarking based on Contourlet
and Information Sciences, 9(2), 1015. transform and Hessenberg decomposition.
22. Luxion. Keyshot program. [Online]. Multimedia Tools and Applications, 1-21.
Available: https://www.keyshot.com 33. Thajeel, S. A. N., và Sulong, G. (2015). A
23. Mushtaq, S. và Mir, A. H. (2014). Digital novel approach for detection of copy move
image forgeries and passive image forgery using completed robust local binary
authentication techniques: A survey. pattern. Journal of Information Hiding and
International Journal of Advanced Science Multimedia Signal Processing, 6(2), 351-364.
and Technology, 73:15–32. 34. Tiwari, N., Ramaiya, M. K., và Sharma, M.
24. Myrna, A., Venkateshmurthy, M., và Patil, C. (2013). Digital watermarking using DWT and
(2007). Detection of region duplication DES. In Advance Computing Conference
forgery in digital images using wavelets and (IACC), 2013 IEEE 3rd International, pages
log-polar mapping. In Conference on 1100–1102.
Computational Intelligence and Multimedia 35. Unknown. Retouching image. [Online].
Applications, 2007. International Conference Available:
on, volume 3, pages 371-377. IEEE. www.retouchingphotos.wikispaces.com
25. Nillius, Peter, và Jan-Olof Eklundh. (2001). 36. Wang, B., Kong, X., Bertino, E., và Fu, H.
Automatic estimation of the projected light (2009). Exposing copypasteblur forgeries
source direction. Computer Vision and based on color coherence. Chinese Journal of
Pattern Recognition, 2001. CVPR 2001. Electronics, 18(3):487-490.
Proceedings of the 2001 IEEE Computer 37. Wang, R. Z., Lin, C. F., và Lin, J. C. (2001).
Society Conference on. Vol. 1. IEEE. Image hiding by optimal LSB substitution and
26. Pan, X. và Lyu, S. (2010). Detecting image genetic algorithm. Pattern recognition, 34(3),
region duplication using sift features. In 671-683.
ICASSP, pages 1706–1709. 38. Yang, R., Bai, Z., Yin, L., và Gao, H. (2015).
27. Pathak, S., Tiwari, S., và Agrawal, S. (2016). Detecting of copy-move forgery in digital
Digital image watermarking in Wavelet images using fractional Fourier transform. In
domain using chaotic. Futuristic Trends in Seventh International Conference on Digital
Engineering, Science, Humanities, and Image Processing (ICDIP15) (pp. 96310B-
Technology FTESHT-16, 108. 96310B). International Society for Optics and
28. Popescu, A. và Farid, H. (2004). Exposing Photonics.
digital forgeries by detecting duplicated 39. Yu, Y. H., Chang, C. C., và Hu, Y. C. (2005).
image region [technical report]. 2004-515. Hiding secret data in images via predictive
Hanover, Department of Computer Science, coding. Pattern Recognition, 38(5), 691-705.
Ngày nhận bài: 30/8/2016 Biên tập xong: 15/9/2016 Duyệt đăng: 20/9/2016
13
nguon tai.lieu . vn