Xem mẫu
- TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN ĐÀO TẠO SAU ĐẠI HỌC
BÁO CÁO ĐỀ TÀI TIỂU LUẬN
MÔN HỌC: TRUYỀN THÔNG ĐA PHƯƠNG TIỆN
Đề tài:
“Tìm hiểu về kỹ thuật Watermarking trong truyền thông đa phương tiện”
Giảng viên: PGS.TS. Nguyễn Hoàng Lan – Viện CNTT&TT
Học viên: Nguyễn Văn Tánh
MSHV: CB110416
Lớp: 11BMTTT.KH
Kỹ thuật máy tính và truyền thông
Ngành:
Hà Nội, 05/2012
- LỜI MỞ ĐẦU
Ngày nay, bên cạnh những ích lợi to lớn, thiết thực mà mạng máy tính đem lại,
chúng ta cũng đang đối đầu với nh ững th ử thách liên quan đ ến các v ấn đ ề truy ền thông
bảo mật và đặc biệt là vấn đ ề phân ph ối các tài li ệu đa ph ương ti ện sao cho b ảo đ ảm
quyền sở hữu trí tuệ. Tình tr ạng sao chép b ất h ợp pháp, gi ả m ạo các tác ph ẩm s ố hóa
gây búc xúc không chỉ riêng các tác gi ả mà còn cho c ả nh ững ng ười làm pháp lu ật.
Những hành vi xâm phạm bản quyền như giả mạo, ăn cắp tác phẩm, sử dụng các
tác phẩm không có bản quyền,… đang trở nên phổ biến và ngày càng tinh vi.
Tuy nhiên với các phương pháp bảo vệ dữ liệu truyền thống như mã hoá,
sử dụng khóa đều không đem lại hiệu quả cao trong tình hình hiện nay. C ác loại
truyền t hông đa phương tiện n h ư â m t h a n h s ố , ả n h s ố , v i d e o là n h ữ n g dạng
dữ liệu rất khó bảo vệ. Trong bối cảnh đó, kỹ thuật Watermarking ra đời như một
cứu cánh. Watermarking là một kỹ thuật m ới cho phép nhúng thông tin tác gi ả, g ọi là
một Watermark, vào các tài li ệu số hóa sao cho ch ất l ượng tr ực quan c ủa tài li ệu không
bị ảnh hưởng và khi c ần có th ể dò l ại đ ược Watermark đã nhúng nh ằm xác nh ận b ản
quyền.
Bài tiểu luận tiến hành nghiên c ứu một số vấn đ ề lý thuy ết t ổng quan v ề
Watermarking và các ứng dụng c ủa nó trong công ngh ệ truy ền thông đa ph ương ti ện,
đồng thời tìm hiểu và phân tích sơ bộ v ề m ột số k ỹ thu ật Watermarking trong môi
trường ảnh màu kỹ thuật số.
Bài tiểu luận được trình bày thành 4 phần:
Phần 1: Tổng quan về Watermarking
Phần 2: Các mô hình Watermarking, các thu ật toán và phân lo ại
Phần 3: Watermarking trong môi trường ảnh màu
Phần 4: Độ an toàn Watermarking và tấn công Watermark
Do thời gian thực hiện và kiến th ức b ản thân còn nh ều h ạn ch ế nên chắc chắn
không tránh khỏi những sai lầm, thi ếu sót, kính mong nh ận đ ược s ự đóng góp ý ki ến,
bổ sung, sửa đổi của quý th ầy cô giáo, các bạn đồng nghiệp, đ ồng môn đ ể bài ti ểu
luận hoàn chỉnh hơn, thiết th ực h ơn.
Xin chân thành cảm ơn.
Học viên
Nguyễn Văn Tánh
2
- MỤC LỤC
3
- CHƯƠNG 1. TỔNG QUAN VỀ WATERMARKING
Watermarking là một trong những kỹ thuật giấu dữ liệu hi ện đại. Nó đ ược đ ịnh
nghĩa như là quá trình chèn thông tin vào dữ liệu đa phương ti ện nh ưng bảo đ ảm không
cảm thụ được, nghĩa là chỉ làm thay đổi nhỏ dữ liệu gốc. Thông th ường ng ười ta ch ỉ đ ề
cập đến Watermarking số. Đó là một tập các dữ liệu số thứ cấp - gọi là Watermark (mã
đánh dấu bản quyền) - được nhúng vào dữ liệu số sơ cấp - gọi là d ữ li ệu bao ph ủ (ví d ụ
như văn bản, hình ảnh, video và audio số,...). Dữ li ệu sau quá trình nhúng đ ược g ọi là d ữ
liệu nhúng. Tanaka (1990), Caronni và Tirkel (1993) lần lượt đưa ra những ấn b ản đ ầu
tiên về Watermarking nhưng chưa nhận được sự quan tâm đúng m ức. Mãi đ ến năm
1995, chủ đề này mới bắt đầu được quan tâm và kể từ đó, Watermarking số đã phát tri ển
rất nhanh với nhiều hướng nghiên cứu và phương pháp thực hiện khác nhau.
Watermarking được ứng dụng trong nhiều lĩnh vực như bảo vệ quyền sở hữu,
điều khiển việc sao chép, xác nhận giấy tờ, hay truyền đạt thông tin khác, … trong đó ứng
dụng phổ biến của nó là cung cấp bằng chứng về bản quyền tác giả của các d ữ li ệu s ố
bằng cách nhúng các thông tin bản quyền. Rõ ràng trong ứng d ụng này, thông tin nhúng
cần phải bền vững trước các thao tác nhằm loại bỏ chúng.
a) Sơ đồ nhúng Watermark b) Sơ đồ khôi phục Watermark
Tất cả các phương pháp Watermarking đều có chung các khối sau: một hệ thống
nhúng Watermark và một hệ thống khôi phục Watermark. Ngõ vào là Watermark, d ữ li ệu
cần nhúng và mã cá nhân hay công cộng. Watermark có thể ở bất kì dạng nào như ch ữ s ố,
văn bản hay hình ảnh. Khoá có thể được dùng để tang cường tính bảo m ật, nghĩa là
ngăn chặn những kẻ không có bản quyền khôi ph ục hay phá h ủy Watermark.
Các hệ thống thực tế dùng ít nhất là một khoá, thậm chí kết hợp nhi ều khoá. Ngõ ra là d ữ
liệu đã được Watermark. Quá trình khôi phục Watermark tổng quát. Các ngõ vào là d ữ li ệu
đã Watermark, khoá và dữ liệu gốc (có thể có hoặc không tuỳ thuộc vào phương pháp).
Ngõ ra hoặc là Watermark khôi phục được hoặc đại lượng nào đó ch ỉ ra m ối t ương quan
giữa nó và Watermark cho trước ở ngõ vào.
1.1 Lịch sử Watermarking
4
- Nghệ thuật làm giấy đã được phát minh ở Trung Quốc cách đây trên m ột ngàn năm
nhưng mãi đến khoảng năm 1282, các công nghệ Watermark trên giấy mới xuất hiện đầu
tiên dưới hình thức một số vị trí khuôn giấy là các mẫu dây m ỏng h ơn, khi đó gi ấy s ẽ
mỏng và trong suốt hơn ở những vị trí dây mỏng. Các Watermark gi ấy nguyên th ủy giúp
xác nhận xưởng sản xuất hay đơn giản chỉ là để trang trí. Vào thế kỉ th ứ 18, ở châu Âu và
Mỹ, Watermark trên giấy đã đem lại những lợi ích thi ết th ực trong vi ệc xác đ ịnh nhãn hi ệu
thương mại, ghi nhận ngày sản xuất, chống làm tiền giả. Thuật ngữ Watermark bắt nguồn
từ một loại mực vô hình được viết lên giấy và chỉ hiển thị khi nhúng gi ấy đó vào n ước.
Thuật ngữ digital Watermarking được cộng đồng thế giới chấp nhận rộng rãi vào đầu thập
niên 1990. Khoảng năm 1995, sự quan tâm đến Watermarking bắt đầu phát tri ển nhanh.
Năm 1996, hội thảo về che dấu thông lần đầu tiên đưa Watermarking vào phần trình n ội
dung chính. Đến năm 1999, SPIE đã tổ chức hội nghị đặc biệt v ề Bảo m ật và
Watermarking trên các nội dung đa phương tiện.
Cũng trong khoảng thời gian này, một số tổ chức đã quan tâm đến k ỹ thu ật
Watermarking với những mức độ khác nhau. Chẳng hạn CPTWG thử nghi ệm hệ th ống
Watermarking bảo vệ phim trên DVD. SDMI sử dụng Watermarking trong việc bảo v ệ các
đoạn nhạc. Hai dự án khác được liên minh châu Âu ủng hộ, VIVA và Talisman đã th ử
nghiệm sử dụng Watermarking để theo dõi phát sóng. Vào cuối thập niên 1990, m ột số
công ty đưa Watermarking vào thương trường, chẳng hạn các nhà phân ph ối nh ạc trên
internet sử dụng Liqid Audio áp dụng công nghệ của Verance Corporation. Trong lĩnh
vực Watermarking ảnh, Photoshop đã tích hợp m ột bộ nhúng và b ộ dò Watermark tên là
Digimarc.
Ngày nay, các công ty chuyên kinh doanh các hệ thống Watermarking đã tăng đáng
kể, dưới đây là một số ví dụ về các công ty và sản phẩm trong lĩnh vực Watermarking:
Các hệ thống Watermarking âm thanh
Công nghệ Watermarking của Giovanni, Blue Spike có
Blue Spike, Inc.
thể được dùng để nhận dang, xác nhận và kiểm tra các tài
liệu âm thanh.
Verance Corporation - được sát nhập từ ARIS
Verance Corporation
Technologies, Inc. (Cambridge, Mass) và Solana
Technology Development Corporation - sở hữu công nghệ
Watermarking đã có bằng sáng chế Musicode® và
Electronic DNA®.
Các hệ thống Watermarking trên ảnh
Một công ty Anh phát triển hệ thống Watermarking
Signum
'SureSign' dùng cho bảo vệ bản qu yền và hệ thống
5
- 'VeriData' dùng để xác thự tính toàn vẹn của các ảnh số.
Technologies
Các công nghệ có bằng sáng chế của Digimarc cho phép
Digimarc
dữ liệu kĩ thuật số được nhúng trong các tài liệu có giá
trị như giấy tờ tài chính, thị thực, giúp ngăn chặn giả
mạo, trộm và sử dụng không được phép khác.
Các hệ thống Watermarking trên phim
Alpha Tec. Ltd. là một công ty Hy Lạp phát triển
Alpha Tec. Ltd. -
AudioMark, gói phần mềm thiết kế cho việc nhúng các
AudioMark
Watermark vào tài liệu âm thanh và phim
Cung cấp công cụ SysCoP (System for Copyright Protection)
MediaSec
để nhúng nhãn hiệu tác quyền vào ảnh và phim (MPEG )
Technologies
Bảng - 1: Các công ty và sản phẩm trong lĩnh vực Watermarking
1.2 Các tiêu chí cần có của một thuật toán Watermarking mạnh mẽ
Tùy thuộc vào từng ứng dụng, kỹ thuật Watermarking có những đòi hỏi khác nhau.
Tuy nhiên có một số yêu cầu chung mà mà hầu hết các ứng dụng thực tế phải đạt được.
1.2.1 Tính bảo mật
Giống như trong lĩnh vực mã hóa, tính hiệu quả của một thuật toán không th ể d ựa
vào giả định là các kẻ tấn công không biết cách mà Watermark đ ược nhúng vào tài li ệu đa
phương tiện. Tuy nhiên, giả định đó lại được dùng để đánh giá đ ộ an toàn c ủa các s ản
phẩm thương mại sử dụng Watermarking có giá trị trên thị trường. Vì v ậy v ới m ột ứng
dụng Watermarking, một khi biết được cách làm việc của bộ nhúng và bộ dò, việc làm cho
Watermark không đọc được thường rất dễ dàng. Hơn nữa một số kỹ thuật sử dụng dữ
liệu gốc trong quy trình dò và thường thì các giải pháp lo ại này không kh ả thi trong th ực
tế.
1.2.2 Tính vô hình
Những nhà nghiên cứu gần đây đã cố nhúng những Watermark bằng cách sao cho nó
không thể được nhận ra. Tuy nhiên yêu cầu này mâu thuẫn v ới các yêu c ầu khác ch ẳng
hạn sức chịu đựng và độ an toàn chống sự bền vững chống được gi ả mạo đ ặc bi ệt là các
thuật toán nén có mất thông tin. Vì mục đích này chúng ta phải khảo sát các tính ch ất c ủa
HVS và HAS trong quy trình dò Watermark. Các thuật toán nén được dùng hi ện nay cho
phép đạt được mục tiêu đó, tuy nhiên điều này sẽ không khả thi trong tương lai là do th ế
hệ của thuật toán nén tiếp theo có thể thay đổi, cần phải cho các người quan sát đã qua
huấn luyện (người được yêu cầu so sánh phiên bản của tài li ệu gốc và tài li ệu đ ược ấn
dấu) thấy được Watermark. Dĩ nhiên đây không phải là khó khăn trong th ực t ế vì ng ười
dùng thông thường không có khả năng so sánh đó.
6
- 1.2.3 Tính vô hình đối với thống kê
Watermark không thể dò được bằng phương pháp thống kê bởi một ngưởi không
được phép. Ví dụ nhiều tác phẩm kỹ thuật số đã được nhúng cùng m ột Watermark sao cho
khi thực hiện tấn công dựa trên thống kê thì không tài nào trích được Watermark. M ột gi ải
pháp khả thi là sử dụng Watermark phụ thuộc nội dung.
1.2.4 Tỉ lệ bit
Tùy thuộc vào ứng dụng, thuật toán Watermark có thể cho phép một số lượng bit
cần ẩn được định nghĩa trước. Không tồn tại các quy tắc chung, tuy nhiên đ ối v ới ảnh thì
tối thiểu 300 - 400 bit. Trong bất kỳ trường hợp nào thì nhà thi ết k ế h ệ th ống ph ải nh ớ
rằng tốt nhất là không nên giới hạn số lượng bit được nhúng vào dữ liệu.
1.2.5 Quá trình dò đáng tin cậy
Thậm chí khi không có các tấn công cũng như các biến d ạng tín hi ệu, kh ả năng
không dò được Watermark đã nhúng hoặc dò sai Watermark phải rất nh ỏ. Thông th ường
các thuật toán dựa trên thống kê dễ dàng thỏa được các yêu này. Tuy nhiên m ột kh ả năng
như vậy phải được đưa lên hàng đầu nếu ứng dụng Watermarking liên quan đ ến lu ật pháp
vì có như vây mới tạo sự tin cậy chắc chắn trong các phán quyết cuối cùng.
1.2.6 Tính bền vững
Việc sử dụng các tín hiệu âm nhạc, hình ảnh và phim dưới d ạng k ỹ thuật s ố thông
thường có liên quan tới nhiều kiểu biến dạng, chẳng hạn như nén có mất thông tin, hay
trong trường hợp ảnh là các phép lọc, định lại kích thước, cải ti ến độ tương ph ản, phép
quay, v.v. Để Watermarking hữu ích, Watermark phải dò được ngay khi cả các biến d ạng
xảy ra. Quan điểm chung để đạt được tính mạnh mẽ chống được các biến dạng tính hi ệu
là đặt Watermark vào các phần quan trọng của tín hiệu . Điều này phụ thuộc vào cách xử lý
của các thuật toán nén có mất thông tin (bỏ qua các ph ần d ữ li ệu không quan tr ọng mà
không làm ảnh hưởng đến chất lượng của dữ liệu được nén. Đi ều này dẫn đ ến m ột
Watermark được ẩn trong các dữ liệu không quan trọng khó tồn tại khi b ị nén. Trong
trường hợp Watermarking trên ảnh, sức chịu đựng với các xử lý hình h ọc (d ịch chuy ển,
định lại kích thước, quay, xén ) thì vẫn là m ột vấn đ ề m ở, nh ững thao tác nh ư v ậy r ất
thông thường và một giải pháp đề ra cần giải quyết được trước khi áp dụng Watermark
cho bảo vệ tác quyền ảnh.
1.2.7 Nhúng nhiều Watermark
Cần phải cho phép nhúng một tập hợp các Watermark khác nhau trong cùng ảnh
bằng cách sao cho mỗi Watermark có thể dò được b ởi người dùng đ ược c ấp quy ền. Đ ặc
trưng này thì hữu dụng trong các ứng dụng dấu vân tay, trong đó thuộc tính tác quyền được
truyền từ người sở hữu tác phẩm đến các tác phẩm khác. Hơn nữa chúng ta có th ể ngăn
7
- người khác thực hiện Watermarking cho một tác phẩm đã được đóng dấu. Trong m ột số
trường hợp việc sửa một Watermark sau khi nhúng là c ần thiết ch ẳng hạn trong tr ường
hợp của các đĩa DVD, một con dấu có thể được dùng để chỉ số lượng các bản sao chép
được phép. Mỗi lần một bản sao chép được thực hiện con dấu sẽ được sửa đổi đ ể gi ảm
số. Sự chỉnh sửa có thể thực hiện được bằng cách xoá bỏ dấu cũ và nhúng d ấu m ới ho ặc
là nhúng một dấu mới chồng lên dấu cũ. Khả năng thứ hai được chọn lựa nhiều hơn bởi vì
một Watermark mà có thể xoá được thì yếu và không chịu đ ựng đ ược các t ấn công gi ả
mạo.
1.2.8 Blind/non-blind, public/private Watermarking
Mối quan tâm đặc biệt là cơ chế sử dụng để khôi phục vết ấn từ ảnh. Trong m ột
số trường hợp để phát triển một thuật toán mạnh mẽ, Watermark được trích bằng cách so
sánh các phiên bản đã được đóng dấu vả chưa đóng dấu. Trong đó nhiều phương pháp
được đề xuất chịu đựng được nhiều kỹ thuật xử lý ảnh và các tấn công có thể nhằm vào
việc gỡ Watermark hay làm cho nó không thể đọc được. Tuy nhiên thông th ường trong th ế
giới thực, sự có mặt của ảnh gốc trong quá trình dò không được bảo đảm, do vậy thu ật
toán cần ảnh gốc để hồi phục vết ấn không thích hợp cho nhi ều ứng dụng th ực t ế. Ngoài
ra loại thuật toán này không thể được dùng cho việc chứng minh quyền sở h ữu hoàn toàn
trừ khi thỏa một số yêu cầu phụ khác như không tựa khả đảo (non-quasi-invertibility) c ủa
Watermark, vốn rất khó đạt được và hầu như không thể chứng minh. Các k ỹ thu ật khôi
phục Watermark không cần so sánh các tín hiệu được mark và không đ ược mark th ường
gọi là oblivious hay blind. Trong các trường hợp khác thuật ngữ public Watermarking đ ược
dùng để đối lại với private Watermarking . Thực sự, thuật ngữ public/private Watermarking
để chỉ một khái niệm khác: một kỹ thuật được gọi là private n ếu chỉ có người sở h ữu tài
liệu hay người được cấp quyền mới trích Watermark bởi vì anh ta m ới là người có th ể truy
xuất vào ảnh gốc hoặc anh ta mới là người biết khoá chính xác đúng để trích Watermark từ
dữ liệu chủ. Trái lại các kỹ thuật mà cho phép bất kỳ người nào cũng đọc được Watermark
được gọi là public. Hầu hết mọi người cho rằng các cơ chế private dường như mạnh m ẽ
hơn public ở chỗ là mỗi khi Watermark được đọc, kỹ thuật public làm cho các k ẻ t ấn công
dễ xóa Watermark hay làm cho Watermark không đọc được chẳng hạn bằng cách đ ảo quy
trình nhúng hay bằng cách nhúng một Watermark đảo (Watermark reversibility). Nói m ột
cách tổng quát trong số các kỹ thuật Watermarking ảnh được đ ề xu ất gần đây, các s ản
phẩm thương mại thường áp dụng các hệ thống public trong khi các nghiên c ứu l ại t ập
trung vào tiếp cận private.
1.2.9 Watermarking đọc được và dò được
8
- Một Watermark mà có thể dò được chỉ nếu nội dung của nó được biết trước gọi là
một Watermark dò được. Ngược lại các kỹ thuật cho phép Watermark đ ọc đ ược ngay khi
nội dung của nó bỏ qua thì gọi là Watermark đọc được. Nói cách khác, theo hướng tiếp cận
dò được, người ta có thể chỉ cần biết một Watermark có tồn t ại trong d ữ li ệu hay không.
Nếu một người không biết Watermark là gì thì không thể phân tích tài li ệu đa ph ương ti ện
để tìm ra Watermark. Điều này không giống với các kỹ thuật đọc được, trong đó cơ chế
nhúng và trích Watermark được thực hiện sao cho bất kỳ ai cũng có th ể đ ọc đ ược
Watermark. Dĩ nhiên tính chất đọc được/ dò được của Watermark ảnh hưởng nhi ều đ ến
cách mà nó được sử dụng trong các ứng dụng thực t ế. Ví d ụ gi ả s ử có m ột tình hu ống
trong đó người ta muốn biết ai là người sở hữu của một ảnh mà anh ta đã tìm đã tìm th ấy
đâu đó trên Internet. Ngoài ra giả sử rằng Watermark chỉ ra người s ở h ữu đã đ ược nhúng
trong ảnh sử dụng kỹ thuật Watermarking dò được. Không có cách nào để đ ọc đ ược
Watermark nếu không thực hiện các giả định về người sở hữu có thể, b ởi vì nh ờ tính ch ất
dò được của Watermark chỉ có thể xác định ảnh có thuộc một tác giả cụ thể nào đó
(Watermark của anh ta được biết ) không.
1.2.10 Tính khả đảo và tính thuận nghịch của Watermark
Mặc dù tính mạnh mẽ thường được chỉ ra như một yêu cầu chính được thỏa mãn,
mối quan tâm lớn lại tập trung vào tính khả đảo c ủa Watermark. Thuật ngữ kh ả đ ảo đ ược
dùng với những ý nghĩa khác nhau, nghĩa tự nhiên nhất định nghĩa m ột Watermark là kh ả
đảo nếu các người dùng được cấp quyền có thể xoá nó kh ỏi tài li ệu. Trong nhi ều ứng
dụng tính khả đảo này có thể là một đặc trưng mong đ ợi, b ởi vì nó có th ể cho phép thay
đổi tình trạng của một tài liệu cho trước theo lịch sử của nó mà không c ần phải ẩn quá
nhiều bit thông tin trong nó. Tính khả đảo của Watermark còn được đ ịnh nghĩa theo cách
khác: đó là khả năng làm mất hiệu lực thừa nhận quyền sở h ữu đ ược h ỗ tr ợ b ởi
Watermarking bằng cách sử dụng kỹ thuật công nghệ đảo để đảo lại quy trình
Watermarking. Một mô hình Watermarking để được sử dụng thành công trong ứng d ụng
bảo vệ quyền sở hữu, tính không khả đảo của Watermark phải đ ược th ỏa mãn. H ơn n ữa
đây chỉ là một điều kiện cần thiết phải thỏa mãn bởi vì tổng quát hơn tính người ta c ần
tính không tựa khả đảo của Watermark hơn. Ở đây thuật ngữ khả đảo và t ựa kh ả đ ảo
được hiểu theo nghĩa tự nhiên như đã nói trên. Không cần đi vào chi ti ết, chúng ta có th ể
nói rằng một Watermark là khả đảo nếu nó có thể tạo ra một Watermark ngược (false
Watermark) và một tài liệu giả mạo tài liệu gốc mà giống như tài li ệu gốc sao cho bằng
cách nhúng false Watermark vào nó, ta có thể thu được một tài li ệu mà giống hay gần
giống với tài liệu gốc thực sự đã được đóng dấu. Để tránh việc dùng nhập nhằng thuật
9
- ngữ invertibility, thuật ngữ reversibility được đề xuất để chỉ r ằng m ột Watermark có th ể
xóa khỏi ảnh chủ mỗi khi nội dung của nó được biết.
1.2.11 Tính có thể thay đổi tỉ lệ (scalability)
Trong các ứng dụng thương mại, chi phí tính toán cho vi ệc nhúng và trích là r ất
quan trọng. Trong một số ứng dụng việc chèn vào chỉ có thể thực hiện m ột lần. Do đó, chi
phí nhúng có thể ít quan trọng hơn là chi phí dò, vốn thường ph ải xảy ra theo th ời gian
thực, ví dụ như tốc độ giải mã của các frame video. Các yêu c ầu tính toán ràng bu ột
một Watermark phải đơn giản, nhưng sự đơn giản này có thể giảm trầm trọng tính chịu
đựng giả mạo. Hơn nữa, người ta biết rằng tốc độ máy vi tính thì c ứ tăng xấp xỉ gấp đôi
sau 18 tháng, để mà những gì được tính toán không thỏa đáng ngày hôm nay có th ể nhanh
chóng trở thành hiện thực. Do đó người ta rất mong đợi thi ết k ế m ột Watermark mà b ộ dò
tương thích với mỗi thế hệ máy vi tính. Ví dụ thế hệ thứ nhất của bộ dò có thể có chi phí
tính toán rẻ nhưng có thể không đáng tin cậy bằng bộ dò ở th ế h ệ ti ếp theo mà có th ể c ấp
cho nhiều tính toán hơn để xử lý với các vấn đề chẳng hạn như các biến dạng hình học.
1.3 Các ứng dụng của Watermarking
Phần này trình bày tất cả các ứng dụng của Watermarking trên hầu h ết các tài li ệu
đa phương tiện (ảnh, âm thanh, phim), bao gồm:
• Theo dõi phát sóng (broadcast Watermarking )
• Nhận ra người chủ sở hữu (owner identification )
• Bằng chứng của quyền sở hữu (proof of owner ship )
• Lưu vết giao tác hay dấu vân tay (transaction tracking/fingerprinting )
• Sự xác nhận nội dung (content authentication )
• Kiểm soát sao chép (copy control )
1.3.1 Theo dõi phát sóng
Trong thực tế, việc phát sóng các đoạn phim hay âm thanh qua các phương ti ện
thông tin đại chúng có những nhu cầu như:
Các nhà quảng cáo muốn chắc chắn rằng đoạn chương trình quảng cáo của họ
được phát đủ thời gian mà họ đã mua từ các nhà phát sóng.
Các diễn viên tham gia đoạn chương trình quảng cáo đó muốn bảo đảm họ được
trả tiền bản quyền ứng với thời lương phát sóng từ các công ty quảng cáo.
Những người sở hữu một đoạn nhạc hay phim không muốn tác ph ẩm của mình bị
xâm phạm tác quyền qua việc thu và phát sóng lại.
Một cách để giải quyết điều này là sử dụng hệ thống theo dõi t ự đ ộng th ụ đ ộng và
chủ động. Hệ thống theo dõi thụ động mô phỏng như một quan sát viên, nó ch ứa m ột máy
10
- tính chuyên theo dõi nội dung phát sóng và so sánh tín hiệu nhận đ ược v ới m ột c ơ s ở d ữ
liệu các tác phẩm biết trước. Lợi điểm của nó là không cần b ất kỳ thông tin liên k ết vào
quá trình phát sóng, và như vậy không đòi hỏi bất kỳ sự hợp tác nào v ới các nhà qu ảng cáo
hay các nhà phát sóng. Như vậy có thể áp dụng nó trong các d ịch v ụ đi ều tra th ị tr ường
nhằm mục đích cạnh tranh. Khó khăn của hệ thống này là:
+ Thứ nhất, việc so sánh tín hiệu nhận được với cơ sở dữ liệu không phải chuyện
tầm thường. Về nguyên tắc, cần chia tín hiệu nhận được thành các đ ơn v ị có th ể phân tích
được và tìm chúng trong cơ sở dữ liệu. Tuy nhiên mỗi frame c ủa video chứa hàng ngàn bit
thông tin và không thực tế chút nào cho quá trình tìm ki ếm. Nh ư vậy hệ th ống tr ước h ết
phải xử lý tín hiệu thành những chữ ký nhỏ hơn sao cho v ừa đ ủ đ ể phân bi ệt v ới tài li ệu
khác và phải đủ nhỏ để lưu được trong cơ sở dữ liệu.
+ Thứ hai, sự giảm tín hiệu trong quá trình phát sóng là đi ều không tránh kh ỏi, nó
thay đổi theo thời gian, tức là sự thu tín hiệu của cùng m ột nội dung ở các th ởi đi ểm khác
nhau có thể dẫn đến những tín hiệu khác nhau. Vì thế, hệ thống không thể tìm nó chính
xác trong cơ sở dữ liệu mà chỉ có thể tìm dưới dạng người láng gi ềng g ần nh ất, th ực t ế
phức tạp hơn nhiều.
+ Thứ ba, ngay cả khi vấn đề tìm kiếm được giải quyết thì việc lưu trữ và quản lý
cơ sở dữ liệu cũng là vấn đề lớn. Hơn nữa hệ thống phải theo dõi nhiều vị trí đ ịa lý khác
nhau đồng thời, phải truy xuất và giao tiếp c ơ sở dữ li ệu trung tâm ho ặc là l ưu c ơ s ở d ữ
liệu cục bộ.
Hệ thống theo dõi chủ động đơn giản hơn về mặt kỹ thuật hơn vì thông tin nh ận
dạng được giải mã trực tiếp, không cần cơ sở dữ liệu để thông d ịch nghĩa của nó. Một cài
đặt của hệ thống này là lưu các mã nhận dạng ở ph ần đ ầu file. Khó khăn là ng ười x ử lý
trung gian và người phân phối cuối cùng không bảo đảm phân phát thông tin đ ầu file
nguyên vẹn. Hơn nữa dữ liệu khó sống sót với sự chuyển đổi định dạng.
Watermarking là một phương pháp mã hoá thông tin nhận dạng cho theo dõi ch ủ
động. Nó có thuận lợi là Watermark tồn tại bên trong n ội dung tín hi ệu phát sóng ch ứ
không phải chỉ trong một đoạn đặc biệt của tín hiệu và vì thế hoàn toàn th ương thích v ới
nền tảng thiết bị phát sóng đã được cài đặt bao gồm cả bộ truyền tải digital và analog. Tuy
nhiên, qui trình nhúng dò Watermark phức tạp hơn việc thêm dữ liệu vào đầu file và tìm
được một thuật toán sao cho chất lượng trực quan của nội dung gi ảm không đáng k ể
nhưng lại có độ an toàn cao cũng là một bài toán thu hút nhi ều sự quan tâm nghiên c ứu.
Như vậy, bằng cách nhận dạng những Watermark được nhúng trong n ội dung s ố, có th ể
chỉ ra khi nào và ở đâu nội dung đó được phát song.
1.3.2 Nhận ra người chủ sở hữu
11
- Trong thực tế có trường hợp một tác phẩm đã có tác quyền bị sử dụng sai m ục đích
và phán quyết của cơ quan luật pháp rất cần thông báo tác quyền trên m ột hình th ức hay v ị
trí nào xem được trên tài liệu được phân phối. Thông báo tác quyền chúng ta th ường th ấy
trên có các tài liệu khả kiến là “Copyright ngày người sở hữu”, “© ngày người sở hữu” hay
“Corp. ngày người sở hữu”. Trên các tác phẩm âm thanh các thông báo đó phải đ ược đ ặt
lên bề mặt của đĩa vật lý, tên nhãn hay trên bao bì. Dễ thấy rằng, gi ới h ạn c ủa nó là vi ệc
nhận dạng người sở hữu tác quyền của một tác phẩm không bảo đảm do người ta không
quá khó để loại bỏ nó ra khỏi một tài liệu khi ti ến hành sao ch ụp l ại th ậm chí không c ần
quan tâm rằng đó là một việc làm sai: Chẳng hạn, một giáo viên chụp m ột số trang từ
quyển sách mà quên chụp luôn thông báo tác quyền ở trang tiêu đ ề, m ột h ọa sĩ s ử d ụng
một bức hình hợp pháp trong mục quảng cáo của báo có thể xén đi phần có chứa thông tin
tác quyền. Rồi sau đó các công dân tôn trọng luật pháp muốn dùng tác phẩm có th ể không
tài nào xác định được tác phẩm có được bảo vệ tác quyền hay chưa. M ột tr ường h ợp khá
nổi tiếng là Lena Sjooblom. Đây là ảnh thử thông th ường nh ất trong lĩnh v ực nghiên c ứu
xử lý ảnh và đã xuất hiện không biết bao nhiêu mà kể ở các bào báo h ội ngh ị nh ưng không
ai tham khảo tên người sở hữu hợp pháp của nó, đó là hãng Playboy. Ban đầu nó là m ột
ảnh phóng to lồng giữa các trang của tạp chí Playboy (Tháng 11- 1972 ). Khi ảnh đ ược
Scan và dùng cho mục đích kiểm thử, hầu hết ảnh đã bị xén chỉ còn khuôn m ặt và vai c ủa
Lena. Không may là dòng chữ ghi Playboy là người sở h ữu cũng b ị xén m ất. T ừ đó ảnh
được phân phối toàn cầu và hầu hết các nhà nghiên c ứu dùng nó trong các bào báo đã
không biết rằng chúng là tác quyền của Playboy.
Thứ hai là vấn đề thẩm mỹ, dù chỉ đặt ở một phần của ảnh nhưng m ột dòng ch ữ
thông tin tác quyền có thể làm giảm bớt vẻ đẹp của nó. Với các tài li ệu âm thanh hay
phim, vì thông báo tác quyền nằm trên băng đĩa vật lý và bao bì nên sẽ không có thông báo
nào được sao chép cùng với nội dung của nó.
Do các Watermark có thể vừa không thể nhận thấy vừa không thể tách rời tác phẩm
chứa nó nên chúng là giải pháp tốt hơn dòng chữ đối v ới vi ệc nhận ra ng ười s ở h ữu n ếu
người dùng tác phẩm được cung cấp bộ dò Watermark. Digimarc cho ảnh là ứng
dụng mà ta đang đề cập. Nó được tích hợp vào Photoshop. Khi bộ dò của Digimarc nhận ra
một Watermark, nó liên lạc với cơ sở dữ liệu trung tâm trên Internet và dùng thông đi ệp
Watermark như một khóa để tìm thông tin liên lạc cho người sở hữu ảnh. Tính h ợp pháp
của một ứng dụng như vậy chưa được thừa nhận bởi cơ quan pháp luật nhưng nó giúp
những người lương thiện dễ dàng tìm ra người họ muốn liên lạc để dùng ảnh. Nh ư vậy,
nhúng thông tin của người giữ tác quyền của một tác phẩm như là một Watermark.
1.3.3 Bằng chứng về quyền sở hữu
12
- Watermark không chỉ được dùng để chỉ ra thông tin tác quyền mà còn được dùng để
chứng minh tác quyền. Thông tin tác quyền có thể dễ bị gi ả. Chẳng hạn, gi ả sử A t ạo m ột
ảnh và post lên mạng với thông tin tác quyền “© 2003 A”. M ột tên tr ộm (B) l ấy ảnh đó,
dùng chương trình xử lý ảnh để thay thông tin tác quyền đó bằng “© 2003 B” và sau đó t ự
cho là anh ta là người sở hữu. Vậy giải quyết tranh luận ra sao. Nếu A đã đăng ký b ản
quyền tác phẩm của mình với một cơ quan pháp luật và gửi cho h ọ ảnh gốc khi v ừa m ới
tạo ra nó thì không có vấn đề gì. Tuy nhiên n ếu A không làm vi ệc đó vì chi phí t ốn kém thì
A phải đưa ra bằng chứng chứng tỏ mình đã tạo ra ảnh. Ch ẳng h ạn, là m ột t ấm phim n ếu
ảnh được chụp, là một bản phát thảo nếu đó là một bức họa. Vấn đ ề là B cũng có th ể
ngụy tạo bằng chứng. Tệ hơn nữa là nếu ảnh được chụp bằng k ỹ thu ật s ố thì ch ẳng có
phim âm bản cũng như bản phát thảo.
A có thể nào bảo vệ quyền lợi của mình mà không phải tốn phí đăng ký bằng cách
áp dụng Watermark vào ảnh của mình? Nếu A dùng Digimarc, v ấn đ ề không đ ược gi ải
quyết vì bộ dò cũng được kẻ trộm biết. Về lý thuyết, ai dò được Watermark đều có th ể
xoá bỏ nó. Do đó B có thể dùng bộ dò Digimarc, gỡ Watermark c ủa A và thay vào đó
Watermark của mình. Để đạt được mức bảo mật trong bằng chứng tác quyền, c ần gi ới
hạn tính khả dụng của bộ dò. Đối với kẻ trộm không có một bộ dò, việc bỏ Watermark thì
rất khó khăn phức tạp. Như thế khi A và B ra tòa, A dùng ảnh gốc và ảnh tranh cãi đưa vào
bộ dò và bộ dò sẽ cho ra Watermark của A. Tuy nhiên cũng có một dạng h ệ th ống
Watermarking mà B có thể dùng và làm như thể Watermark của B n ằm trong b ản gốc ảnh
của A. Tấn công được gọi là tấn công đảo (inversion attack) hay tấn công khóa ch ết (dead
lock attack). Không có cách gì để giải quyết quyền sở hữu bản quyền trong tr ường h ợp
này và tòa cũng không thể biết A hay B có ảnh gốc th ực sự. Đi ều này cho th ấy r ằng ch ỉ
với một mình Watermark mà không có một nghi thức khác hỗ trợ nó thì sẽ không đ ủ đ ể
giải quyết tình huống bản quyền này.
Bài toán có thể được giải quyết nếu ta thay đổi phần phát biểu nó: Thay vì c ố
chứng minh trực tiếp quyền sở hữu bằng cách nhúng m ột Watermark “A sở h ữu ảnh này”,
ta nên cố chứng minh một ảnh bắt nguồn từ ảnh khác. Một hệ thống như vậy cung c ấp
một bằng chứng gián tiếp rằng khả năng ảnh tranh cãi là c ủa A cao h ơn B, trong đó A là
người có phiên bản mà từ đó hai ảnh khác tạo ra.
1.3.4 Lưu vết giao tác hay dấu vân tay
Trong ứng dụng này, Watermark lưu lại một hay nhiều giao d ịch đã xảy ra trong
những lần sao chép tác phẩm đã có nhúng Watermark. Ví dụ, Watermark có th ể l ưu tên
người mua trong mỗi lần mua bán hợp pháp hay phân phối. Người sở hữu và người t ạo ra
tác phẩm có thể dùng những Watermark khác nhau trong m ỗi b ản sao. N ếu tài li ệu b ị dùng
13
- sai mục đích (phát hành hay phân phối trái phép ) người sở hữu có thể tìm ra người có trách
nhiệm.
Một giải pháp thông thường cho Watermarking áp dụng cho lưu vết giao tác là dùng
các Watermark hữu hình, chẳng hạn các tài liệu thương mại được in có background có
chứa các số lớn hơn màu xám, với mỗi bản sao sẽ chứa một số khác.
Một ví dụ khác có sử dụng Watermarking cho việc theo dõi giao tác đã đ ược cài đ ặt
bởi DiVX Corporation. DiVX bán một DVD player tri ển khai theo mô hình kinh doanh pay-
per-view. Họ cài đăt nhiều kỹ thuật để ngăn giả mạo đĩa c ủa họ, m ột trong số đó là
Watermark được thiết kế cho lưu vết giao tác. Mỗi DVD player phải đặt một Watermark
duy nhất vào mỗi video mà nó chiếu. Nếu ai đó thu lại đo ạn video và bán các b ản sao,
DiVX có thể lấy được bản copy đó và tìm ra kẻ phản bội bằng cách giải mã Watermark.
Một ví dụ khác là trong phân phối các nhật báo phim. Suốt quá trình th ực hi ện m ột
phim, kết quả các bức hình mỗi ngày được phân phối cho nhiều người có tham gia vào
phim. Nhưng những nhật báo này được yêu cầu giấu bí m ật, không mu ốn b ị l ộ ra ngoài.
Gặp trường hợp này, trường quay nhanh chónh xác định được người đã làm rò rỉ thông tinh.
Trường quay có thể dùng đoạn văn hữu hình ở góc màn hình để xác định m ỗi bản sao c ủa
ảnh. Tuy nhiên, các Watermark được chuộng hơn vì đoạn văn bản dễ bị xóa đi.
1.3.5 Xác nhận nội dung
Các tác phẩm kỹ thuật số ngày nay đứng trước nguy c ơ bị làm giả nhiều h ơn, d ễ
dàng hơn và tinh vi hơn. Nếu ảnh là một bằng ch ứng quan tr ọng trong đi ều tra c ủa c ảnh
sát, sự giả mạo có thể gây ra nhiều vấn đề nghiêm trọng.
Bài toán xác nhận thông điệp đã được nghiên cứu rộng rãi trong lĩnh v ực mã hóa
(crytography). Một tiếp cận mã hóa thông thường cho bài toán này là t ạo ra m ột ch ữ kí
điện tử. Thuật toán được dùng là mã hóa khoá bất đối xứng. Ch ỉ có tác gi ả thông đi ệp m ới
biết khoá cần để tạo ra các chữ ký. Do vậy, kẻ trộm c ố thay đ ổi thông đi ệp thì s ẽ không
tạo ra được một chữ ký mới. Nếu khi tiến hành so sánh, thông đi ệp đ ược s ửa đ ổi khác v ới
chữ ký gốc, ta có thể khẳng định thông điệp đã bị sửa. Chữ ký đi ện t ử đã đ ược áp d ụng
cho các camera kỹ thuật số bởi Fredman, người gợi ý tạo ra m ột máy ảnh có ch ữ ký bên
trong. Khóa để tạo chữ kí chỉ có trong máy ảnh mà thôi.
Chữ ký dạng như vậy chung qui là một dạng dữ li ệu meta đ ược đi kèm v ới tài li ệu
mà chúng xác nhận. Điều này cho thấy rất dễ làm mất các ch ữ ký. Ch ẳng hạn một hệ
thống xác nhận ảnh lưu dữ liệu meta vào phần vào phần đầu (header) c ủa ảnh JPEG. N ếu
ảnh được chuyển sang dạng khác, chữ ký sẽ bị mất và dĩ nhiên tài li ệu không còn đ ược
chứng thực nữa.
14
- Một giải pháp hay là những chữ ký trực tiếp vào tài li ệu dùng k ỹ thu ật
Watermarking. Epson đề ra một hệ thống như vậy trên nhiều máy ảnh k ỹ thu ật s ố c ủa
hãng. Ta gọi chữ ký này là chữ kí xác nhận (authentication mark). Ch ữ kí xác nh ận đ ược
thiết kế sao cho trở nên sai lệch dù chỉ gặp sự chỉnh sửa nh ỏ nh ất đ ược gọi là các
Watermark dễ vỡ (fragile Watermark).
Mối lo ngại về việc các chữ ký có trong tài liệu hay không gi ờ đây đã b ị lo ại tr ừ.
Điều quan tâm lúc này là việc nhúng Watermark cần bào đảm không thay đ ổi tài li ệu nhi ều
quá để nó còn đúng khi so sánh với chữ ký. Điều này có thể thực hiện được bằng cách xem
tài liệu thành hai phần : Một dùng cho việc tính toán bằng chữ ký, m ột dùng cho vi ệc
nhúng chữ ký. Ví dụ, nhiều tác giả đề xuất tính toán m ột chữ ký t ừ các bit cao c ủa ảnh và
nhúng chữ ký vào các bit thấp của ảnh.
Nếu một tài liệu có chứa chữ kí xác nhận bị thay đổi, chữ kí xác nhận cũng thay
đổi theo. Điều này mở ra một hướng nghiên cứu mới là tìm hiểu tài liệu đã bị giả mạo như
thế nào. Chẳng hạn nếu một ảnh được chia làm nhi ều khối, m ỗi kh ối có m ột ch ữ kí xác
nhận, chúng ta dễ phát thảo ra phần nào của ảnh nguyên trạng và phần nào bị chỉnh sửa.
Một ví dụ rất hay được áp dụng trong điều tra tội phạm c ủa cảnh sát, sử d ụng ch ữ
kí xác nhận khoanh vùng (localized authentication). Cảnh sát nhận đ ược m ột đo ạn phim
theo dõi đã bị giả mạo. Nếu đoạn phim này dùng các chứng thực chữ ký truyền thống, d ễ
thấy rằng họ biết phim bị giả mạo và không tin bất cứ điều gì trong phim. Tuy nhiên n ếu
dùng một Watermark theo kiểu xác nhận khoanh vùng , họ có thể khám phá rằng trong các
khung (frame) của phim vẫn có chỗ tin cậy. Như vậy k ẻ có liên quan đ ến t ội ác đã b ị g ỡ
bớt các frame có dấu vết của hắn.
Khi kiểm tra một chữ kí xác nhận đã bị sửa đổi ta cũng có được thông tin “Li ệu nén
có mất có được áp dụng vào tài liệu hay không”. Hầu hết các thu ật toán nén ảnh có m ất
đều áp dụng sự lượng tử hóa, chính điều này đã để lại các thay đ ổi th ống kê trong m ột
Watermark và có thể nhận diện được.
1.3.6 Kiểm soát sao chép
Các ứng dụng đã đề cập ở trên hầu hết có tác dụng sau khi có ai đó làm sai. Ch ẳng
hạn theo dõi phát sóng giúp phát hiện nhà phát sóng bất lương đã ăn ch ặn ti ền sau khi bi ết
họ đã phát sóng không đúng thời lượng. Còn lưu vết giao tác ch ỉ ra k ẻ phản b ội sau khi h ọ
đã làm lộ và phân phối các bản sao bất hợp pháp. Các kỹ thuật này có tể nói là ch ữa b ệnh
chứ không phòng bệnh. Rõ ràng là sẽ tốt hơn nếu ngăn ngay t ừ đầu nh ững hành vi b ất h ợp
pháp, như vậy một ứng dụng kiểm soát sao chép ngăn không cho tạo các b ản sao bất h ợp
pháp từ nội dung đã có bản quyền.
15
- Mã hóa cũng có thể dùng để cài đặt cho ứng dụng dạng này. Tài li ệu đ ược mã hóa
với một khóa duy nhất, nếu không có khóa thì không dùng được. Tuy nhiên khóa này đ ược
cung cấp theo kiểu khó mà sao chép hay phân phối lại (nhằm hạn chế thếp nhất khả năng
khách hàng cho khóa của họ cho người khác xài mi ễn phí). Ví d ụ, nhi ều sóng TV đ ược mã
hóa, khóa giải mã được tích hợp vào một thẻ thông minh (smart card) cho các khách hàng
nào trả tiền. Thẻ thông tin được giấu vào hộp antene c ủa TV. N ếu ai đó c ố tình xem hay
thu sóng mà không có thẻ thông minh card chắc chắn ch ỉ th ấy hình nhi ễu. Đi ều đáng quan
tâm là mã hóa không thực sự giải quyết tốt ứng dụng này, vì chúng d ễ b ị phá bằng ba cách
sau: Thứ nhất, cố giải mã tín hiệu với hàng tri ệu trường hợp khóa có th ể. Tuy nhiên n ếu
khóa ≥ 50 bit thì điều này không thực hiện được. Thứ hai, dùng công ngh ệ đ ảo ph ần m ềm
hay phần cứng chứa khóa. (Giống như crack phần mềm). Ví dụ như chương trình DeCSS
của Jon Johanasen và hai cộng sự người Đức. CSS (Content Scrambling System ) là h ệ
thống mã hoá dùng để chống ghi DVD bất hợp pháp. Jon đã dùng công ngh ệ đ ảo áp d ụng
cho một đầu đọc DVD và tìm khóa giải mã của nó. Sau đó b ất kỳ video nào đã đ ược mã
hóa cũng có thể được giải mã. Cách thứ ba là trả ti ền để có m ột khóa r ồi sao chép n ội
dung đã được giải mã. Một kẻ trộm muốn thu và phát lại sóng v ệ tinh ch ỉ c ần đăng ký là
khách hàng, mua một thẻ thông minh, nối đầu đọc với đầu thu, cứ thể thu lại n ội dung đã
được giải mã. Ví dụ này chỉ ra yếu kém chính của bảo vệ nội dung sử dụng mã hóa: M ột
nội dung muốn dùng được cần phải giải mã, khi đã được giải mã r ồi, t ất c ả các b ảo v ệ
coi như không còn.
Điều chúng ta cần là làm sao cho dữ liệu media xem được nhưng v ẫn ngăn không
cho thu lại. Một kỹ thuật làm được điều này, trong trường hợp video NTSC đó là quy trình
chống sao chép videocassette của Marovision. Quy trình này sửa tín hiệu video sao cho làm
rối loạn điều khiển trên VCRs. Tín hiệu thu được có thể xem tốt trên TV nh ưng v ới VCR
nó sẽ tạo ra những thứ kông thể xem được. Tuy nhiên, k ỹ thu ật này ch ỉ áp d ụng cho tím
hiệu TV tuần tự , không được cho audio và các ki ểu tín hiệu số khác. Do vậy m ặc dù h ệ
thống của Macrovision thích hợp để chống thu video bất h ợp pháp bằng VCRs, nó l ại
không dùng được cho đầu DVDs, VCRs số, hay các kỹ thuật thu video số khác.
Do các Watermark được nhúng trong nội dung nên chúng có m ặt khi có n ội dung và
như vậy nó cung cấp một phương pháp tốt hơn để cài đặt các ứng d ụng kiểm soát sao
chép. Nếu mọi thiết bị thu được gắn bộ dò Watermark , việc thu có thể b ị các thi ết b ị thu
ngăn cản khi chúng dò ra một Watermark dạng như “không được chép”. M ột h ệ th ống
như vậy đã được “Copy protection Technical Working Group” (CPTWG) dùng cho đ ầu
video DVD và SDMI dùng cho audio.
16
- Vấn đề đặt ra là làm sao bảo đảm rằng mọi đầu thu chứa bộ dò Watermark. Ch ẳng
có động lực tự nhiên nào để các nhà sản xuất đầu thu lại bỏ thêm chi phí để tích hợp bộ dò
vào sản phẩm của họ. Trong thực tế, theo cách nhìn c ủa khách hàng thì b ộ dò Watermark
chỉ làm chỉ làm giảm giá trị của đầu thu vì dĩ nhiên họ mu ốn thi ết b ị c ủa mình có th ể sao
chép được bất kì tài liệu nào họ muốn (Cho dù điều đó là không hợp pháp).
Giải pháp trực tiếp cho vấn đề này đòi hỏi luật quy định các đầu thu phải có b ộ dò
Watermark. Tuy nhiên, cho đến bây giờ thì chưa có luật nào như vậy, và thỏa yêu c ầu đó là
cả một vấn đề vì nó cần sự tham gia tất cả các quốc gia. Vì l ẽ này, CPTWG và SDMI đ ều
không phụ thuộc luật nói trên. CPTWG và SDMI đưa ra yêu c ầu vào cam k ết tác quy ền là
“Nhà sản xuất đầu thu nào sử dụng kỹ thuật của họ phải có bộ dò”. Cách ti ếp c ận này
phù hợp ở chỗ nó dưa trên những luật đã có sẵn trên hầu h ết các n ước. B ất l ợi c ủa nó là
nó cho phép nhà sản xuất tạo ra bộ thu không chứa bộ dò Watermark khi họ không dùng kỹ
thuật có đề cập yêu cầu đó. Một giải pháp dung hòa là cho phép l ưu hành c ả hai hai lo ại
thiết bị (có và không cài Watermarking): Chẳng hạn, đầu đ ọc không cài Watermarking ch ỉ
đọc được các bản sao chép được đã được giải mã mà không đọc được các bản sao chép
chưa được giải mã, và khi đã đọc được thì nó có thể đ ược thu ti ếp bằng đ ầu thu không cài
Watermarking.Đầu đọc có Watermarking đọc được các bản sao chép có mã hóa, không đ ọc
được bản sao đã qua giải mã, và khi đã đọc được thì nó có thể được thu ti ếp bằng đầu thu
không cài Watermarking. Như vậy lợi và hại của mỗi thiết bị có thể để khách hàng cân
nhắc lựa chọn và hy vọng những công dân có ý thức pháp lu ật và tôn tr ọng quy ền s ở h ữu
trí tuệ sẽ sử dụng loại có cài Watermarking nhiều hơn.
Từ các phân tích ở trên, có thể thấy rằng Watermarking gi ải quyết các bài toán v ề
ẩn giấu thông tin linh hoạt hơn những phương pháp truyền thống khác chẳng h ạn nh ư mã
hóa nhờ lợi thế thông tin nhúng nằm kèm theo trong tài li ệu chủ. Đó là các ứng d ụng chung
của Watermarking trên các tài liệu đa phương tiện, riêng đ ối v ới ảnh s ố, b ảo v ệ b ản
quyền và xác nhận nội dung là hai ứng dụng khả thi nhất, quan tr ọng nh ất mà ảnh s ố có
thể áp dụng được và sẽ được nghiên cứu và phân tích sâu trong các chương sau.
17
- CHƯƠNG 2. CÁC MÔ HÌNH WATERMARKING, CÁC THUẬT TOÁN
Các mô hình Watermarking hiện nay chia làm hai nhóm: thứ nhất là các mô hình dựa
trên quan điểm xem Watermarking như một phương thức truyền thông, và các mô hình d ựa
trên quan điểm hình học.
2.1 Mô hình trên quan điểm Watermarking như một dạng truyền thông
Có 3 loại và chúng khác nhau ở cách tích hợp của tài liệu chủ vào trong hệ thống.
2.1.1 Mô hình cơ bản
Trong mô hình này, tài liệu chủ được xem như nhi ễu được thêm vào trong suốt quá
trình truyền tín hiệu Watermark.
Hình - 1: Bộ dò không cần ảnh gốc
Hình - 2: Bộ dò cần ảnh gốc
18
- Không quan tâm bộ dò ở đây là blind hay non-blind, qui trình nhúng bao g ồm hai
bước:
Trước hết, thông điệp được ánh xạ thành một mẫu thêm (added pattern) wa có cùng
kiểu và kích thước với ảnh chủ c0. Ví dụ, trong Watermarking ảnh, b ộ nhúng t ạo ra m ột
mẫu các pixel hai chiều cùng kích thước với ảnh chủ gốc. Sự ánh xạ này đ ược th ực hi ện
với một khóa Watermark. Các mẫu thêm thường được tính qua nhi ều b ước. V ới các m ẫu
định nghĩa sẵn và có thể phụ thuộc vào khóa, gọi là mẫu tham khảo (reference pattern) wr0,
wr1, wr2, chúng ta liên kết chúng lại để tạo ra một mẫu mã hóa, ta gọi là m ẫu thông đi ệp
(message pattern), wm. Mẫu thông điệp này sau đó được ch ỉnh sửa hay thay đ ổi t ỉ l ệ đ ể thu
được mẫu thêm.Sau đó, wa được thêm vào tài liệu chủ, c0, để tạo tài li ệu đ ược
Watermark (Watermarked Work), cw.
Sau khi mẫu thêm được nhúng, giả sử tài liệu được Watermark cw bị thay đổi vì
một xử lý nào đó, ta mô hình hóa hiệu ứng xử lý này bằng một nhi ễu c ộng. Các ki ểu x ử lý
có thể gồm: Nén, giải nén, phát sóng qua các kênh tuần t ự, c ải thi ện ảnh hay âm thanh…
hay một xử lý bất kì của kẻ trộm nhằm gỡ bỏ Watermark…
2.1.2 Mô hình Watermarking truyền thông với thông tin ph ụ ở b ộ trung
chuyển
Tài liệu chủ vẫn được xem là một nhiễu, nhưng qui trình nhúng Watermark cần
được cung cấp thêm ảnh chủ đó với vai trò là thông tin phụ. Thông tin ph ụ (side
information) là thông tin được cung cấp cho b ộ trung chuyển ho ặc b ộ nh ận trong m ột h ệ
thống truyền thông, khác với thông điệp được chuyển hay tín hiệu nhận được c ần gi ải mã.
Trong mô hình Watermarking này, chúng ta xem ảnh chủ là m ột thông tin ph ụ đ ối v ới b ộ
nhúng.
Trong mô hình trước, giới hạn của nó là vết Watermark được mã hóa đ ộc lập v ới
tài liệu chủ co, điều này không tận dụng tri ệt để ảnh gốc. N ếu ta cho phép b ộ mã hóa
Watermark kiểm tra co trước khi mã hóa mẫu thêm thì ta sẽ có thu ật toán nhúng hi ệu qu ả
hơn.
19
- Hình - 3: Mô hình Watermarking theo quan niệm truyền thông với thông tin phụ ở bộ trung
chuyển
2.1.3 Mô hình Watermarking theo quan niệm truyền thông đa công
Ở sơ đồ này, ảnh chủ không còn được xem là một phần của kênh truyền mà là
thông điệp thứ hai được truyền đi cùng với thông đi ệp Watermark trong cùng tìn hiệu cw.
Hai thông điệp co và m sẽ được dò và giải mã bởi 2 nguồn nhận r ất khác nhau: con ng ười
và bộ dò Watermark. Bộ nhúng Watermark liên kết m và co trong m ột tín hi ệu đ ơn, cw ,
tương tự như việc truyền nhiều thông điệp trên 1 đường dây trong truyền thông truy ền
thống như chia thời gian (time - division) , chia tần (frequency - division) hay chia mã (code
- division) đa công (code division multiplexing là truyền nhi ều thông đi ệp trên 1 kênh đ ơn
bằng cách thay chúng bằng các tín hiệu trực giao chồng lên nhau theo thời gian, không gian,
tần số.
Hình - 4: Mô hình Watermarking theo quan niệm truyền thông đa công
20
nguon tai.lieu . vn