Xem mẫu

  1. TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 20 (45) - Thaùng 9/2016 Những phương pháp tiếp cận về kỹ thuật giám định ảnh số Approaches to techniques of digital image forensics han r ng i n h ng r ng Đại h c B ch hoa Phan Trong Le, BEng. Le Tien Thuong, Assoc.Prof.,Ph.D. Ho Chi Minh City University of Technology Tóm t t Một bức ảnh số có thể d dàng đ ợc chỉnh sửa về mặt hiển thị nh vào các phần mềm chỉnh sửa ảnh nhất định ơ sở của việc gi m định tính chân thực của ảnh là mặc dù ảnh giả có thể hông để lại bất kỳ dấu v t hay điểm bất th ng gì báo hiệu đã qua chỉnh sửa, nh ng có thể đặc tính thống kê pixel trên ảnh đã bị thay đổi. Bài vi t này là một tổng quan về ph ơng ph p gi m định ảnh số, chú tr ng vào ph ơng pháp phát hiện mù từ công trình khởi đầu của Fridrich năm 2003 đ n các công trình mới trong nửa đầu năm 2016 Hầu h t c c ph ơng ph p hiện tại đều đ ợc x p vào các nhóm phân loại và đ ợc phân tích đi kèm với nhận xét và trích dẫn từ tác giả. Bài vi t cũng đề ra thách thức và tiêu chí đ nh gi trong việc gi m định ảnh giả, từ đó làm cơ sở để phân tích và so sánh giữa c c ph ơng ph p h c nhau Từ khóa: phát hiện ảnh giả, pháp chứng, kỹ thuật watermarking, chữ ký signature, ảnh cloning, splicing, retouching, ảnh tạo hoàn toàn từ máy tính (CGI), biến đổi cosine rời rạc (DCT), phân tích thành phần chính (PCA), máy vector hỗ trợ (SVM). Abstract A digital image can be visually changed with ease by using certain editing software. A foundation on which we are relying is the assumption that although digital forgeries may leave no visual evidences indicating the tampering, they may have altered the statistical properties of pixel values in the image. This paper is a literature review on digital image forgery detection focusing on blind detection approach, from the very beginning work of Fridrich in 2003 to the recent ones in the first half of 2016. Most of the proposed methods are well classified into categories and analyzed with comments and citations. This work also indicates the vital challenges and criteria of performance evaluation to the detection of forgery images, which are considered as the basis of comparison between different methods. Keywords: digital image forgery, forensics, watermarking, signature, copy-move, splicing or retouching image, computer-generated imagery (CGI), affine transform, discrete cosine transform (DCT), discrete wavelet transform (DWT), principal component analysis (PCA), support vector machine (SVM). 3
  2. 1. ặt v v k thu t nh detection). Với trạng thái bị động về nguồn nh s tin, yêu cầu đặt ra là chỉ dựa vào bức ảnh Nhi p ảnh dần trở thành lĩnh vực phổ đang có mà ta phải x c định liệu ảnh này có bi n trong cuộc sống con ng i từ những thật hay bị chỉnh sửa gì hay không. Với sự năm hởi đầu ở th kỷ XIX. Dù ở mức độ quan sát về bản chất rằng: mặc dù ảnh giả chuyên nghiệp hay nghiệp d , ai cũng có có thể hông để lại dấu v t trực quan cho thể d dàng tạo đ ợc một bức ảnh kỹ thuật mắt trần của con ng i nhận bi t dấu hiệu số (từ đây, g i tắt là ảnh) bằng camera trên chỉnh sửa, nh ng ảnh đó có thể đã bị thay điện thoại hoặc máy ảnh, sau đó chỉnh sửa đổi về mặt số liệu thống kê ở mức giá trị ảnh trực ti p tr n điện thoại hoặc chuyên pixel. Các thuộc tính thống kê này có thể sâu hơn, chỉnh sửa trên máy tính (Personal đ ợc phân tách và trích l c để tạo thành các Computer) bằng các phần mềm chuyên đặc tr ng giúp nhận bi t sự can thiệp về dụng. M i chuyện sẽ hông có gì đ ng nói chỉnh sửa ảnh. Hình 2 cho thấy mức độ n u nh m i bức ảnh đều đ ợc sử dụng quan tâm trong lĩnh vực gi m định ảnh đúng với mục đích và chức năng của nó: thông qua số l ợng bài báo công bố giai truyền tải cho ng i nhìn thông tin ghi đoạn 2004 – 2013. nhận lại trong th giới thực. Vấn đề nảy sinh khi một ng i dùng ảnh đã chỉnh sửa nh là một công cụ để khi n cho ng i xem tin vào thông điệp mà ng i đó muốn truyền tải. Hiện t ợng này dẫn tới nhu cầu sử dụng giải pháp khoa h c để gi m định tính chân thực trong nội dung hiển thị của ảnh. Hình 1 là ảnh giả từng đ ợc sử dụng trong truyền thông. hông th ng, để bảo vệ tác quyền ảnh a) b) và xác thực nguồn gốc, kỹ thuật Hình 1: Ảnh ch p c u tổng th ng Pháp watermar ing hay signature đ ợc áp dụng z p gi i Tour de vào trong ảnh. Từ đó, n u nội dung ảnh bị France: nh g c (a) và nh ch nh s a (b). chỉnh sửa thì dữ liệu đ ợc mã hóa vào ảnh [T p chí Le Parisien, 07/2015. (vốn đ ợc xem là thông điệp nhận dạng www.fourandsix.com] mang tính bí mật) sẽ bị thay đổi. Việc xác thực ảnh đ ợc thực hiện bằng cách trích xuất ng ợc lại mã nhúng từ ảnh rồi kiểm tra mã này có t ơng ứng với mã mà ng i giữ bản gốc đang sở hữu hay hông Đây là c ch gi m định chủ động (active), khi mà ảnh gốc và ảnh giả đều sẵn có, hiện hữu. Mặt h c, th ng bức ảnh nhận đ ợc Hình 2: S bài báo khoa h c IEEE và hông đi èm với bất cứ thông tin bi t c nh tr ớc nào Điều này dẫn tới c ch gi m định nh s n 2004 - 2013. [23] bị động (passive) hoặc phát hiện mù (blind Phần còn lại của bài vi t có bố cục nh 4
  3. sau: mục II. trình bày các loại ảnh giả, mục p dụng cho loại ảnh giả này để tăng c ng III. và IV. phân loại các giải ph p gi m định hay giảm bỏ c c chi ti t gốc. ột ví dụ theo h ớng Active và Passive, mục V. và VI. đ ợc cho ở hình 5. lần l ợt là các thách thức và ti u chí đ nh gi khi thực hiện gi m định ảnh, cuối cùng là thảo luận và k t luận ở mục VII. và VIII. 2. Phân lo i nh gi A. Cloning Một phần của ảnh đ ợc sao chép và dán (clone) vào một nơi h c của cùng một ảnh ban đầu với mục đích là để che giấu hoặc tạo thêm chi ti t trong ảnh. Ví dụ điển a) b) hình đ ợc cho ở hình 3. Hình 5: Ả a) b): ú ổ ê ặ [35] D. Computer-Generated Imagery (CGI) Thay vì làm giả một phần, một bức ảnh có thể đ ợc làm giả hoàn toàn (không chụp a) b) bằng camera) nh các công cụ đồ h a trên Hình 3: Ví d nh cloning. Ảnh g c (a) máy tính. Một ví dụ đ ợc cho ở hình 6. và nh gi (b) v i vùng nh hai con mèo . [2] B. Splicing ỹ thuật này giống cloning, ngoại trừ việc vùng ảnh sao chép đ ợc lấy từ nguồn ảnh h c b n ngoài Nói cách khác, splicing là tr ng hợp tổng qu t hơn cloning. ột ví dụ ảnh splicing đ ợc cho ở hình 4. Hình 6: Ví d v nh CGI. Ảnh g c (n a mặt trái) và nh gi (n a mặt ph i): h un nh m khác bi t bằng m ờng. [22] 3. ng ti p c n phát hi n nh gi - Active rong ỹ thuật watermar ing, dữ liệu Hình 4: Ả a, nhúng là thông tin đã đ ợc x c định tr ớc, b) c). [7] nh là một ảnh biểu t ợng th ơng hiệu C. Retouching hoặc một đoạn văn bản au hi mã hóa Nâng cao chất l ợng ảnh (cân bằng thông tin vào ảnh, dữ liệu nhúng có thể trắng, đổi màu, tạo nhòe, v v ) th ng đ ợc đ ợc hiển thị tr n ảnh, hoặc cũng có thể để 5
  4. ẩn hoàn toàn, hoặc t hợp cả hai c ch bi n đổi ng ợc để t i tạo lại watermar đã (hình 7). Việc trích xuất lại watermar dùng. Kỹ thuật watermar ing trải phổ [10] cũng có hai c ch: giải thuật có dùng thêm đ ợc sử dụng phố bi n và có nhiều thuật thông tin từ ảnh gốc (non-blind) và không toán mới đ ợc đề xuất ph t triển; đồng dùng ảnh gốc (blind) rong hi ỹ thuật th i, đây cũng là giải ph p mang tính bền watermar ing thực hiện nhúng thông tin vững cao đ ợc ch n tr ớc vào ảnh, thì ỹ thuật Tiwari et al. [34] dùng bi n đổi DW signature thực hiện lấy đặc tr ng độc nhất hai mức cho ảnh gốc và dữ liệu nhúng từ ảnh rồi mã hóa thành dạng chữ ý số đ ợc mã hóa DE (Data Encryption tandard) tr ớc hi t hợp nhúng với ảnh gốc t quả là watermar chống chịu hiệu quả với phép nội suy hối nh ng vẫn giữ đ ợc chất l ợng ảnh ở hệ số chất l ợng QF lớn hơn 90 Jiansheng et al. [16] t hợp a) b) DW với D cho ra t quả watermar Hình 7: a) đ ợc ẩn hoàn toàn, đồng th i chống ch i (“ ” Africa Studio, đ ợc một số phép xử lý thông dụng nh www.shutterstock.com) và bán b) l c, tăng c ng sắc nét, nhi u muối ti u, (“20 0 ©” Klaus Herrmann, nén và cắt ảnh http://farbspiel-photo.com). Những năm gần đây, c c h ớng ó hai h ớng ti p cận: nhúng nghi n cứu dựa trên ba loại bi n đổi cơ bản watermar trong miền hông gian và trong này vẫn đ ợc chú tr ng ph t triển. Pathak miền tần số Trong miền hông gian, ba ỹ et al. [27] dùng lý thuy t to n huỗi hỗn thuật chính là Bit tr ng số thấp nhất (LSB) loạn (Chaotic sequence) để trải phổ tín hiệu [8, 37], ập hối (Patchwork) [3] và ã dự watermar vào c c hệ số DW , giúp giữ đo n (Predictive coding) [39]. Ba ph ơng nguy n chất l ợng ảnh gốc (cải thiện chỉ số pháp trên, theo thứ tự t ơng ứng, rất nhạy NR) và tăng tính bền vững đối với c c với nhi u thay đổi tr n gi trị pixel (từ phép bi n đổi nh phân t n dữ liệu nhúng nh truyền, phép xử lý hậu ỳ nh xoay, tr n vùng phổ rộng và mang đặc tính giống dịch và cắt ảnh), bị giới hạn l ợng thông nhi u (hình 8). Hu et al. [14] tăng c ng tin nhúng và ém về mặt giữ nguy n chất hả năng chống chịu tấn công nén J E và l ợng ảnh, n n watermar miền tần số thay đổi nhi u bằng c ch điều ch gi trị đ ợc quan tâm xem xét nhiều hơn nh trung bình của hệ số D đổi dấu một hắc phục đ ợc c c y u điểm này. phần ( A) có ph ơng sai điều chỉnh theo Trong miền tần số, ba phép bi n đổi bảng l ợng tử J E hoặc chỉ số bi n dạng chính là Wavelet r i rạc - DWT, osine r i đ ng chú ý (JND) của mô hình ệ thống rạc - DCT và Fourier r i rạc - DFT. Bức thị gi c con ng i ( V ) Su et al. [32] ảnh đ ợc biểu di n d ới dạng tần số, vốn dùng phép bi n đổi mới hơn là ontourlet, là đặc tính của tín hiệu nói chung, thông t hợp phép phân tích essenberg để qua c c hệ số của miền bi n đổi. Thông tin nhúng watermar trong ảnh màu, t quả mã nhúng đ ợc lồng vào c c hệ số này và đạt tính vô hình cao hơn và hả năng hi ti n hành x c minh, ta thực hiện phép chống ch i tốt hơn từ c c cuộc tấn công về 6
  5. nén J E , l c tích chập và nhi u cộng còn đề xuất ph ơng ph p tối u hơn là Robust Match bằng cách dùng hệ số DCT thay vì giá trị pixel cho b ớc so sánh khối. h ơng ph p này cho hiệu quả cao hơn nh ng vẫn còn vài giới hạn về độ tin cậy. Ngoài ra, ph ơng ph p này cũng hông bền vững tr ớc các phép bi n đổi tuy n tính. Hình 8: w Bảng 1 thống kê k t quả đạt đ ợc W [40]. t ơng ứng với các loại đặc tr ng khác nhau, )Ả ú )Ả thay vì dùng mức xám hay hệ số D nh w )Ả w đã phân tích ở đoạn tr ớc. Công trình tiêu . biểu gần đây trong nhóm kỹ thuật này là 4. ng ti p c n phát hi n nh gi Kaur và Walia [24] với việc sử dụng ớc - Passive l ợng nhi u và đặc tr ng về độ dốc có định Hầu h t các kỹ thuật mù phát hiện ảnh h ớng biểu đồ tần suất ( O ) h ơng giả đều có thể phân loại thành năm nhóm: pháp này có khả năng đồng th i phát hiện dựa vào pixel, định dạng, máy ảnh và độ r i và định vị vùng ảnh giả. K t quả (hình 9) sáng (từ mục A. đ n D.). Ngoài ra, có một đ ợc thử nghiệm trên tập dữ liệu CASIA. cách phân nhóm khác dựa trên loại đặc tr ng [30], n n năm nhóm trên có thể sắp x p lại thành hai nhóm lớn: dựa trên khối pixel và keypoint. A. Dựa vào pixel Các khối pixel, vốn là cơ sở hình thành a) Ảnh gốc b) Ảnh giả nên ảnh số, đ ợc chú tr ng khảo s t để tìm Hình 9: Phát hi nh v vùng nh sự h c th ng trong thống kê ở mức giá trị gi trong hình b) dùng k pixel, từ đó t luận về dấu v t chỉnh sửa thu Ư ng nhi ặ của vùng ảnh giả. Trong công trình khởi HOG [18]. đầu h ớng nghiên cứu gi m định ảnh, B. Dự và định dạng ảnh Fridrich et al. [11] đề xuất ph ơng ph p r ớc khi bị làm giả, ảnh đ ợc mở Exhausive Search cho ảnh cloning bằng bằng phần mềm chỉnh sửa au đó, ảnh cách tìm hai vùng chứa giá trị pixel giống đ ợc l u mới và qua thêm một lần nén ảnh nhau Đây là ph ơng ph p rất cơ bản và (ví dụ định dạng J E ) Để tận dụng tính đơn giản nh ng hông đủ để dùng giám chất nén không bảo toàn JPEG, có ba định ảnh giả thực t , đồng th i lại cần khối ph ơng ph p đ ợc đề xuất: l ợng tính toán lớn au đó, công trình này 1. Lượng tử JPEG 7
  6. B ng 1: So sánh k t qu n nh cloning [23] h ơng ph p Đặc tr ng Bộ phân lớp Độ chính xác Popescu và PCA ắp x p theo thứ tự t n 100% hối pixel 16x16 (lexicographic) Farid [28] 50% hối pixel nhỏ hơn Gopi et al.[13] ệ số tự hồi quy ạng nơron nhân tạo 94.83% Lin et al. [19] ng độ s ng trung ắp x p theo cơ số và 98% bình của hối pixel tính vector dịch Bashar et al. [1] DWT và KPCA huật to n ph t hiện 95.55% (DWT) nhân bản dựa theo điểm 90.94% (KCPA) Thajeel và Sulong [33] CR LBP ắp x p theo thứ tự t n > 91% (với phép xoay và phép xoay t hợp với phép bi n đổi khác) Isaac và Wilscy [15] Gabor Wavelet và SVD 99% tr n tập dữ liệu l ợng tử pha cục bộ CASIA v1.0 và tập màu (LPQ) DVMM Kaur và Walia [18] Ước l ợng nhi u Phân nhóm k-Means và ~70% cho tập dữ liệu dựa tr n A và đặc SVM CASIA v1.0 và v2.0 tr ng O Khi nén, mỗi hệ số DCT c đ ợc l ợng 3. Nhiễu khối JPEG tử với hệ số q: c/q. Việc lựa ch n giá trị q Phát hiện ảnh giả dựa trên sự bất đồng khác nhau cho ra bảng l ợng tử khác nhau; nhất trong nhi u khối. Giải pháp là tìm ma do đó, một dạng chữ ý độc nhất về l ợng trận nhi u khối và quan sát phân lớp mẫu. tử sẽ đ ợc nhúng vào ảnh JPEG ở đầu ra. Ảnh giả qua nhiều lần nén sẽ gây nhi u 2. Nén JPEG hơn một lần trong hai quan sát này. Phát hiện ảnh giả dựa trên hiện diện Lin và Tsay [21] dùng bộ ớc l ợng của nhi u (artifact) khi có nhiều hơn một ích th ớc khối nhi u (áp dụng kỹ thuật lấy lần nén ảnh. Giải pháp là phân tích tính chu mẫu ngẫu nhiên, bầu ch n và hợp lý cực kỳ lặp lại của nhi u l ợng tử đôi trong đại - maximum likelihood) và phân tích histogram sau khi ảnh bị nén từ lần thứ hai tính nhất quán của ích th ớc khối nhi u (hình 10). JPEG (hình 11), khối cục bộ nào có kích th ớc khác với ích th ớc khối chính thì đ ợc xem là vùng ảnh giả. a) b) Hình 10: K t qu phân tích nén JPEG và a) Ảnh splicing. b) K t quả. nhi ng t (b) t nh gi (a). Xem Hình 11: Phát hi n nh Splicing dùng k ngu n nh th t hình 3. [2] thu Ư ng kh i nhi u [21]. 8
  7. Tóm lại, những kỹ thuật này chỉ có lợi Tuy nhiên, thực t khó sử dụng h ớng th trên bức ảnh đ ợc l u lại hơn một lần. ti p cận này vì với phát hiện mù, việc bi t Việc chỉ dùng mỗi thông tin về định dạng tr ớc thông tin về loại cảm bi n hay bản đồ ảnh hông đủ để xây dựng ph ơng ph p nhi u cho tr ớc, hoặc sở hữu tập ảnh đ ợc phát hiện ảnh giả bền vững. Ngoài ra, n u chụp từ cùng một cảm bi n thì hoàn toàn chỉ dùng thông tin nén ảnh thì d dẫn đ n không khả thi. phát hiện sai, đơn cử là tr ng hợp ảnh gốc D. Dự và cườ g độ rọi sáng và màu đ ợc phóng to theo thuật toán nội suy hoặc Vì c c phần ảnh giả đ ợc cắt ghép từ đ ợc làm nhòe, sau đó đ ợc l u lại Nh nhiều nguồn h c nhau n n chúng hông vậy, mặc dù nội dung ảnh hông thay đổi đảm bảo đ ợc tính nhất qu n của h ớng nh ng vẫn sẽ bị đ nh gi là ảnh giả, vì cũng nguồn s ng đặt l n đối t ợng Do đó, phân có trải qua thêm một lần nén. tích sự bất th ng trong hiệu ứng nh s ng C. Dựa vào máy ảnh đ ợc r i l n c c đối t ợng giúp chỉ ra dấu Phân tích nhi u đ ợc tạo ra từ một hệ v t của chỉnh sửa ó hai c ch để tận dụng thống máy ảnh nhất định; từ đó, sự không h ớng ti p cận này: vị trí nguồn s ng và nhất quán trong nhi u có thể đ ợc dùng để phân lớp màu (ví dụ hình 14). Tuy nhiên, chỉ ra dấu v t chỉnh sửa ảnh. Có bốn cơ sở số l ợng lớn c c đối t ợng trong màu sắc để áp dụng: h c th ng về màu sắc, Mảng h c nhau dẫn tới sự hó hăn trong việc l c màu, àm đ p ứng của máy ảnh và ph t hiện tất cả đối t ợng giả cùng một lúc Nhi u cảm bi n. Do đó, phần lớn công trình nghi n cứu gần Fridrich et al. [12] sử dụng kỹ thuật đây tập trung vào sử dụng một phần hông Ước l ợng đ p ứng hông đồng nhất của gian màu để giới hạn loại đối t ợng xem máy ảnh để tận dụng thông tin từ nhi u của xét, ví dụ nh chỉ xem xét đối t ợng màu cảm bi n hông tin này đ ợc xem xét nh da ng i [5]. là đặc tr ng nhận dạng (hình 12) cho việc Johnson và Farid [17] đã vận dụng t phát hiện ảnh đ ợc chụp bởi máy ảnh thật quả nghi n cứu Ước l ợng tự động h ớng hay từ cùng một máy ảnh hay không. Theo nguồn s ng [25] để đ nh gi mức độ phản đó, tất cả cảm bi n đều có các thuộc tính xạ cục bộ hoặc toàn cục tr n c c vùng ảnh t ơng tự cho việc tạo đặc tr ng nhận dạng có t cấu h c nhau (hình 13). Carvalho et dựa tr n cơ sở rằng chúng đ ợc tạo từ công al. [6] xây dựng mô hình 3 chiều của đối nghệ sản xuất giống nhau. t ợng (chỉ từ một ảnh) tr ớc hi ớc l ợng h ớng nguồn s ng đ ợc đặt l n đối t ợng đó uy t quả hông đ ợc đ nh gi tr n một tập dữ liệu lớn, nh ng từ t quả thí nghiệm cho thấy ph ơng ph p này hiệu quả ngay cả với nguồn s ng phức tạp Mặc dù kỹ thuật phân tích h ớng nguồn sáng và thông tin màu rất hứa hẹn trở Hình 12: Phóng to m t ph n nh nhi u thành một công cụ gi m định ảnh hiệu quả, trên c m bi n Canon G2. Giá tr pixel nh ng trong 5 năm trở lại đây, số l ợng c chia t l theo d [0 255] quan công trình về h ớng nghiên cứu này vẫn sát. [12] còn rất ít so với c c h ớng ti p cận khác. 9
  8. giống nhau, bầu tr i, mảng mây).  Có khả năng hoanh vùng và định vị vùng ảnh giả.  Loại bỏ các thông tin thừa khi tìm vùng ảnh giả: ví dụ nh chữ bìa báo a) b) trong hình 1. Hình 13: Ảnh giả (a) cho thấy góc ước  Các thuật to n có dùng ng ỡng để lượng hướng ánh sáng cách biệt giữa hai phân loại k t quả th ng ch n giá người, 123o và 86o. Ảnh thật (b) cho thấy trị ng ỡng cố định và mang tính góc ước lượng hướng ánh sáng của hai kinh nghiệm. Cần xây dựng hàm lấy người tương đương nhau, 98o và 93o. [17] ng ỡng thích hợp có khả năng tùy bi n thích nghi và có mối liên hệ chặt chẽ với c c đặc tính đang xem xét của ảnh để tối u điểm lấy ng ỡng theo hàm mục ti u độ chính xác cực đại. Gần đây, Zerni e moments và lựa ch n bi n đổi tuy n tính t ơng đồng (SATS) a) b) đ ợc dùng cho phát hiện xoay [31, 9], SIFT Hình 14: cho xoay và tỉ lệ [26], SUFT cho xoay, tỉ lệ, sáng (b) ờ nhi u cộng và nhòe [4], SVM cho phát hiện (a). [5] vùng nhòe [36]. Bi n đổi FMT thì bền vững đối với xoay, tỉ lệ, nhi u và nhòe với chi 5. Các thách th c nh nh phí tính toán thấp. Cần x c định rõ các thách thức sẽ phải 6. ê đối mặt trong việc phát hiện ảnh giả để l u  Độ chính x c: ỉ lệ số lần ph t hiện ý các vấn đề cần giải quy t và đặt ra giả đúng tr n tổng số ảnh giả đầu vào thuy t phù hợp trong quá trình nghiên cứu:  hi phí tính to n: l ợng tính to n  Giảm tỉ lệ phát hiện sai cần dùng để cho ra t quả, cần l u  Hoàn toàn tự động (không cần con ý hi ứng dụng vào hệ thống th i ng i can thiệp để di n dịch k t quả) gian thực  Không phụ thuộc vào định dạng  Độ nhạy với c c phép bi n đổi: chỉ nguồn ảnh (nén ảnh) ra mức độ t quả bị ảnh h ởng bởi  ăng độ tin cậy và bền vững đối với c c điều iện thử nghiệm h c nhau. bi n đổi tuy n tính và phi tuy n.  Không nhạy với thay đổi của nhi u.  Tránh giới hạn số l ợng và kích  ức độ tự động: giảm thiểu can th ớc của vùng ảnh giả có thể phát thiệp của con ng i trong việc di n hiện đ ợc bởi thuật toán. dịch và đ a ra t luận gi m định.  Tận dụng thông tin màu, thay vì chỉ Độ chính x c n n là ti u chí hàng đầu, dùng ảnh xám. vì đây là t quả cuối cùng ảnh h ởng tới  Tránh phát hiện sai c c đối t ợng thật quy t định gi m định, nhất là hi liên quan có tính chất giống nhau hoặc đồng tới luật pháp, còn các tiêu chí h c có thể nhất tự nhiên (ví dụ: lốc các hộp sữa 10
  9. đ nh đổi qua lại Độ nhạy có thể đ ợc giới r i lại, h ớng ti p cận dựa vào m y ảnh hạn ở một số hía cạnh và ứng dụng để mang tính ém hả thi nhất vì nó y u cầu ph ơng ph p đề ra có thể đ p ứng tốt một đ ợc bi t một số thông tin có tr ớc từ ảnh số mục ti u nhất định. hả nghi, điều mà vốn hông thể đạt đ ợc iệu năng có thể đ ợc biểu di n d ới trong ứng dụng thực t hép bi n đổi nh dạng thống độ chính x c, độ nhạy và độ D hay F ti p tục là ỹ thuật hiệu quả ri ng biệt Độ nhạy (Sensitivity) là thông để biểu di n lại ảnh với ích th ớc nhỏ hơn số đo l ng độ chính x c phân loại đúng (giảm thông tin d thừa) để giảm hối đối với ảnh giả (tức, ảnh giả đ ợc x p loại l ợng tính to n Ngoài ra, hai tập dữ liệu là giả), Độ ri ng biệt ( pecificity) đo l ng ảnh th ng dùng phổ bi n trong c c công độ chính x c phân loại đúng đối với ảnh trình gần đây đ ợc đ nh gi là đủ tốt để thực (tức, ảnh thực đ ợc x p loại là thực) thử nghiệm và so s nh giữa c c ph ơng và Độ chính x c (Accuracy) là tỉ lệ phần ph p, đó là o oFoD (từ phòng thí trăm giữa số ảnh phân loại đúng tr n tổng nghiệm Video ommunications, Đại h c số ảnh xem xét (tức, ảnh giả đ ợc x p loại Zagreb, roatia) và A IA (từ Viện ự là giả và ảnh thực đ ợc x p loại là thực), động Nhận dạng ẫu, c việc hoa h c tính nh (1): Quốc gia, rung Quốc)  TP  TN  ổng quan, nhiều ph ơng ph p đã Accuracy  100   (1)  TP  TN  FN  FP  đ ợc đề xuất để xử lý c c th ch thức trong Với: ph t hiện ảnh giả, tuy nhi n chúng vẫn còn  TP (True Positive): số ảnh giả đ ợc nhiều giới hạn về tính ứng dụng thực t x p đúng là ảnh giả ột phần là vì có đặt tr ớc giới hạn trong  FN (False Negative): số ảnh giả giả thuy t ban đầu, một phần là vì thi u đ ợc x p sai thành ảnh thực một mô hình chung và chuẩn hóa để hội tụ  FP (False Positive): số ảnh thực c c nh nh nghi n cứu còn đang ri ng lẻ đ ợc x p sai thành ảnh giả Việc đ nh gi tính bền vững đối với c c  TN (True Negative): số ảnh thực loại phép bi n đổi đ ợc dùng tr n vùng ảnh đ ợc x p đúng là ảnh thực giả vẫn dựa tr n thực nghiệm iểm chứng 7. l là chủ y u, n n nhu cầu về một mô hình rong hi ỹ thuật watermar và to n h c hỗ trợ cho việc phân tích t quả signature đ ợc dùng nh là công cụ chủ cũng nh là dự đo n và ớc l ợng tr ớc động để giúp chủ nhân của c c bức ảnh số tính bền vững của giải ph p (hay cụ thể là bảo vệ quyền t c giả của mình, thì phần loại đặc tr ng) đ ợc đề xuất là cần thi t còn lại của câu chuyện gi m định ảnh là 8. l n ph t hiện mù tr n những bức ảnh hông rõ Bài hảo s t này đã tóm tắt phần lớn nguồn gốc ớng ti p cận dựa vào độ r i các h ớng nghi n cứu về lĩnh vực gi m sáng và không gian màu là ph ơng ph p định ảnh giả trong 15 năm gần đây, tập ph t hiện hứa hẹn ph t triển nhất vì nó trung chủ y u vào h ớng ph t hiện mù hông phụ thuộc vào c c phép bi n đổi p rong h ớng ti p cận chủ động, có hai ỹ dụng tr n vùng ảnh giả uy nhi n, h ớng thuật chính đ ợc dùng là watermar ing và ti p cận này cũng phải đối mặt với hó signature; còn h ớng ti p cận bị động, có hăn về định vị và hoanh vùng ảnh giả năm nhóm chính là dựa vào pixel, định 11
  10. dạng, m y ảnh và độ r i s ng ai ỹ thuật 8. Chang, C. C., Hsiao, J. Y., và Chan, C. S. dựa vào hối pixel và eypoint cũng là một (2003). Finding optimal least-significant-bit substitution in image hiding by dynamic c ch phân loại h c Bài vi t cũng đã chỉ ra programming strategy. Pattern Recognition, u nh ợc điểm của mỗi nhóm phân loại 36(7), 1583-1595. Nhiều ỹ thuật đ ợc đ a ra cho thấy sự cải 9. Christlein, V., Riess, C., và Angelopoulou, E. thiện lớn về độ chính x c l n tới 99%; tuy (2010). On rotation invariance in copy-move forgery detection. In Information Forensics nhi n, th ng luôn có sự đ nh đổi giữa độ and Security (WIFS), 2010 IEEE International chính xác, mức phức tạp và độ bền vững Workshop on, pages 1-6. IEEE. trong giải thuật Ngoài ra, việc đối phó với 10. Cox, I. J., Kilian, J., Leighton, F. T., và Shamoon, T. (1997). Secure spread spectrum c c phép bi n đổi tuy n tính cũng là một watermarking for multimedia. IEEE trong c c th ch thức lớn nhất trong việc Transactions on Image Processing, xây dựng giải ph p mang tính bền vững, do 6(12):1673-1687. sự đa dạng và tính t hợp của c c phép 11. Fridrich, A. J., Soukal, B. D., và u š, A. J. (2003). Detection of copy-move forgery in bi n đổi đ ợc dùng hi tạo ảnh giả. digital images. In in Proceedings of Digital Lời c Forensic Research Workshop. Citeseer. 12. Fridrich, J. (2009). Digital image forensics. ông trình này đ ợc tài trợ bởi quỹ Đại h c Signal Processing Magazine, IEEE, 26(2):26-37. Quốc gia Thành phố Hồ Chí Minh với mã 13. Gopi, E., Lakshmanan, N., Gokul, T., Kumara sốB2015-20-02. Ganesh, S., và Shah, P. R. (2006). Digital image forgery detection using artificial neural TÀI LIỆU THAM KHẢO network and auto regressive coefficients. In Electrical and Computer Engineering, 2006. 1. Bashar, M., Noda, K., Ohnishi, N., và Mori, E E’06 anadian onference on, pages K. (2010). Exploring duplicated regions in 194-197. IEEE. natural images. IEEE Transactions on Image 14. Hu, H. T., Chang, J. R., và Hsu, L. Y. (2016). Processing, vol. PP, no. 99, pp. 1-1. Robust blind image watermarking by 2. Belkasoft, Belkasoft database. [Online]. modulating the mean of partly sign-altered Available: https://belkasoft.com/forgery-detection DCT coefficients guided by human visual 3. Bender, W., Gruhl, D., Morimoto, N., và Lu, perception. AEU-International Journal of A. (1996). Techniques for data hiding. IBM Electronics and Communications. systems journal, 35(3.4), pp. 313-336. 15. Isaac, M. M., và Wilscy, M. (2015). Image 4. Bo, X., Junwen, W., Guangjie, L., và Yuewei, D. Forgery Detection Based on Gabor Wavelets (2010). Image copymove forgery detection based and Local Phase Quantization. Procedia on surf. In Multimedia Information Networking Computer Science, 58, 76-83. and Security (MINES), 2010 International 16. Jiansheng, M., Sukang, L., và Xiaomei, T. Conference on, pages 889-892. IEEE. (2009). A digital watermarking algorithm 5. Carvalho, T. J. d., Riess, C., Angelopoulou, based on DCT and DWT. In Proceedings of E., Pedrini, H., và de Rezende Rocha, A. the 2009 International Symposium on Web (2013). Exposing digital image forgeries by Information Systems and Applications illumination color classification. Information (WI A’09) Nanchang, R hina, pages Forensics and Security, IEEE Transactions 104-107. Citeseer. on, 8(7):1182-1194. 17. Johnson, Micah K., và Hany Farid. (2005) 6. Carvalho, Tiago, Hany Farid, và Eric Kee. Exposing digital forgeries by detecting (2015). Exposing photo manipulation from inconsistencies in lighting. Proceedings of the user-guided 3D lighting analysis. SPIE/IS&T 7th workshop on Multimedia and security. Electronic Imaging. International Society for ACM. Optics and Photonics. 18. Kaur, M., và Walia, S. (2016). Forgery 7. CASIA. Tampering detection dataset. [Online]. Detection Using Noise Estimation and HOG Available: http://forensics.idealtest.org Feature Extraction. International Journal of 12
  11. Multimedia and Ubiquitous Engineering, Dartmouth College. USA. 11(4), 37-48. 29. Qazi, T., Hayat, K., Khan, S. U., Madani, S. 19. Lin, H.-J., Wang, C.-W., Kao, Y.-T., và Chen, A., Khan, I. A., Ko lodziej, J., Li, H., Lin, W., S. (2009a). An efficient method for copy-move Yow, K., và Xu, C.-Z. (2013). Survey on forgery detection. In WSEAS International blind image forgery detection. Image Conference. Proceedings. Mathematics and Processing, IET, 7(7):660-670. Computers in Science and Engineering, 30. Rajkumar, R., Chanu, T. A., và Singh, N. N. number 8. World Scientific and Engineering (2016). Copy move forgery detection Academy and Society. approaches: A survey. ADBU Journal of 20. Lin, H.-J., Wang, C.-W., Kao, Y.-T., et al. Engineering Technology, (2009b). Fast copy-move forgery detection. 31. Ryu, S.-J., Lee, M.-J., và Lee, H.-K. (2010). WSEAS Transactions on Signal Processing, Detection of copy-rotatemove forgery using 5(5): 188-197. zernike moments. In Information Hiding, 21. Lin, C. S., và Tsay, J. J. (2015). Passive pages 51–65. Springer. forgery detection for JPEG compressed image 32. Su, Q., Wang, G., Lv, G., Zhang, X., Deng, based on block size estimation and G., và Chen, B. (2016). A novel blind color consistency analysis. Applied Mathematics image watermarking based on Contourlet and Information Sciences, 9(2), 1015. transform and Hessenberg decomposition. 22. Luxion. Keyshot program. [Online]. Multimedia Tools and Applications, 1-21. Available: https://www.keyshot.com 33. Thajeel, S. A. N., và Sulong, G. (2015). A 23. Mushtaq, S. và Mir, A. H. (2014). Digital novel approach for detection of copy move image forgeries and passive image forgery using completed robust local binary authentication techniques: A survey. pattern. Journal of Information Hiding and International Journal of Advanced Science Multimedia Signal Processing, 6(2), 351-364. and Technology, 73:15–32. 34. Tiwari, N., Ramaiya, M. K., và Sharma, M. 24. Myrna, A., Venkateshmurthy, M., và Patil, C. (2013). Digital watermarking using DWT and (2007). Detection of region duplication DES. In Advance Computing Conference forgery in digital images using wavelets and (IACC), 2013 IEEE 3rd International, pages log-polar mapping. In Conference on 1100–1102. Computational Intelligence and Multimedia 35. Unknown. Retouching image. [Online]. Applications, 2007. International Conference Available: on, volume 3, pages 371-377. IEEE. www.retouchingphotos.wikispaces.com 25. Nillius, Peter, và Jan-Olof Eklundh. (2001). 36. Wang, B., Kong, X., Bertino, E., và Fu, H. Automatic estimation of the projected light (2009). Exposing copypasteblur forgeries source direction. Computer Vision and based on color coherence. Chinese Journal of Pattern Recognition, 2001. CVPR 2001. Electronics, 18(3):487-490. Proceedings of the 2001 IEEE Computer 37. Wang, R. Z., Lin, C. F., và Lin, J. C. (2001). Society Conference on. Vol. 1. IEEE. Image hiding by optimal LSB substitution and 26. Pan, X. và Lyu, S. (2010). Detecting image genetic algorithm. Pattern recognition, 34(3), region duplication using sift features. In 671-683. ICASSP, pages 1706–1709. 38. Yang, R., Bai, Z., Yin, L., và Gao, H. (2015). 27. Pathak, S., Tiwari, S., và Agrawal, S. (2016). Detecting of copy-move forgery in digital Digital image watermarking in Wavelet images using fractional Fourier transform. In domain using chaotic. Futuristic Trends in Seventh International Conference on Digital Engineering, Science, Humanities, and Image Processing (ICDIP15) (pp. 96310B- Technology FTESHT-16, 108. 96310B). International Society for Optics and 28. Popescu, A. và Farid, H. (2004). Exposing Photonics. digital forgeries by detecting duplicated 39. Yu, Y. H., Chang, C. C., và Hu, Y. C. (2005). image region [technical report]. 2004-515. Hiding secret data in images via predictive Hanover, Department of Computer Science, coding. Pattern Recognition, 38(5), 691-705. Ngày nhận bài: 30/8/2016 Biên tập xong: 15/9/2016 Duyệt đăng: 20/9/2016 13
nguon tai.lieu . vn