Xem mẫu

  1. Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Huế, ngày 07-08/6/2019 DOI: 10.15625/vap.2019.00054 SỬ DỤNG BÀI TOÁN THỎA MÃN RÀNG BUỘC ĐỂ SO KHỚP ONTOLOGY MỜ Quách Xuân Hƣng Khoa Công nghệ thông tin, Trường Đại học khoa học, Đại học Huế tiasang70@yahoo.com TÓM TẮT: Bài toán tích hợp ontology mờ có thể được chia thành hai giai đoạn: giai đoạn khớp giữa các ontology và giải quyết mâu thuẫn trong các giá trị mờ. Bài viết này tập trung vào các vấn đề của giai đoạn so khớp, với phương pháp vét cạn và theo kinh nghiệm hiện có. Hướng vét cạn thường xảy ra nhiều lỗi khớp, tuy nhiên hầu hết các cặp so khớp giữa hai ontology đều được phát hiện. Cách tiếp cận theo hướng kinh nghiệm, thường dựa vào các tính chất ontology để cắt tỉa các cặp không tương đồng trước khi so khớp. Với cách tiếp cận này mức độ xẩy ra so khớp sai giảm đáng kể, tuy nhiên thường bỏ qua nhiều cặp thành phần tương đồng trong quá trình so khớp. Để khắc phục nhược điểm của hai phương pháp trên, chúng tôi đã đề xuất sử dụng bài toán thỏa mãn ràng buộc (CSP) để mô hình hóa bài toán so khớp ontology. Cụ thể, ở đây đề xuất các ràng buộc và đưa ra hàm tối ưu để tối thiểu các lỗi so khớp. Bên cạnh đó, sử dụng phương pháp đồng thuận để xác định đại diện tốt nhất giữa các đối tượng mâu thuẫn trong quá trình tích hợp ontology mờ. Từ khóa: Ontology, Tích hợp ontology, So khớp ontology, Thỏa mãn ràng buộc. I. GIỚI THIỆU Trong các hệ thống tri thức phân tán luôn luôn tồn tại tính không đồng nhất của thông tin, vấn đề này cần thiết phải giải quyết khi các hệ thống có yêu cầu trao đổi, chia sẻ, tái sử dụng thông tin và dữ liệu. Ontology được xem là nền tảng của các hệ thống thông tin tri thức, vì vậy trong quá trình sử dụng và triển khai các hệ thống này chúng ta cần thiết phải thực hiện tích hợp các ontology. Tuy nhiên thực hiện điều này là vấn đề phức tạp vì tính không đồng nhất về thông tin và cấu trúc đa dạng của nó. Tích hợp tri thức là một quá trình mà trong đó sự không nhất quán của tri thức từ các nguồn khác nhau được hợp nhất nhằm mang lại một sự thống nhất của tri thức. Các nghiên cứu gần đây về tích hợp ontology được thực hiện theo các mức độ khác nhau: so khớp ontology (ontology matching), liên kết ontology (alignment ontology), trộn ontology (merge ontology), ánh xạ ontology (ontology mapping). Khái niệm tích hợp ontology được định nghĩa như sau [1]: cho n ontology tích hợp ontology là xác định một ontology mới tốt nhất từ các các ontology đã cho. Các nghiên cứu về tích hợp ontology, trước hết cần mô hình hóa ontology mà thông thường họ sử dụng logic mô tả cho mô hình hóa ontology. Để tích hợp các ontology, các phép toán tương đương giữa các thành phần ontology được nghiên cứu. Ngoài ra, chiến lược hay phương pháp tích hợp ontology cũng là vấn đề được quan tâm. Hiện nay, khái niệm ontology rõ dựa trên logic mô tả truyền thống bị hạn chế vì không đủ khả năng để mô tả và biểu diễn các thông tin mơ hồ và không chắc chắn. Điều này dẫn đến sự xuất hiện ngày càng nhiều các nghiên cứu về ontology mờ. Cùng với các định nghĩa ontology mờ được đề xuất, các nghiên cứu về tích hợp ontology mờ bắt đầu được quan tâm. Các kỹ thuật tích hợp ontology rõ hiện nay không phù hợp với ontology mờ. Thực tế hiện nay không có nhiều nghiên cứu về bài toán tích hợp ontology mờ. Các nghiên cứu về so khớp/liên kết ontology trên ontology mờ [2] có thể được phân thành hai loại: một là phương pháp tiếp cận mở rộng so khớp ontology rõ để giải quyết bài toán so khớp trên ontology mờ; hai là phương pháp tiếp cận giải quyết tính mơ hồ của các khái niệm trong quá trình so khớp. Rung-Ching Chen [3] và các cộng sự đề xuất một phương pháp trộn ontology kết hợp WordNet và FFCA (Fuzzy Formal Concept Analysis) [4] để tạo một ontology mờ gọi là trộn FFCA. Gần đây nhóm nghiên cứu của Giáo Sư Nguyễn Ngọc Thành đã đề xuất các giải pháp xử lý mâu thuẫn ontology mờ cho bài toán tích hợp ontology mờ [4-7]. Chúng tôi cũng đã nghiên cứu về tích hợp ontology mờ dựa trên lý thuyết đồng thuận [8]. Trong bài báo này, đề xuất một mô hình chung cho việc tích hợp ontology sử dụng lập trình ràng buộc CSP. Bên cạnh đó, đề xuất phương pháp xử lý mâu thuẫn tính mờ giữa các thành phần tích hợp sử dụng phương pháp đồng thuận. II. MÔ HÌNH HÓA ONTOLOGY MỜ DỰA VÀO LOGIC MÔ TẢ MỜ Bài báo này đề xuất một mô hình ontology mờ trong đó các thành phần được mờ hóa bằng cách sử dụng một hàm thành viên. Ở đây ontology mờ được đề xuất bằng cách tích hợp logic mờ và logic mô tả mờ vào ontology rõ để giải quyết hiệu quả các phương pháp lập luận tri thức ontology mờ. Định nghĩa về ontology mờ ở đây là mở rộng của các khái niệm ontology mờ đã được đề xuất trước đó [8]: Định nghĩa 1: Ontology mờ Cho (A, V) là một thế giới thực, trong đó A là tập hữu hạn các thuộc tính, V miền giá trị của A. Ontology mờ được định nghĩa là bộ tứ (C, R, I, Z), trong đó: – C là tập hữu hạn các khái niệm mờ. C )| i=1..n}, trong đó là giá trị hàm thành viên của khái niệm , [0,1].
  2. 424 SỬ DỤNG BÀI TOÁN THỎA MÃN RÀNG BUỘC ĐỂ TÍCH HỢP ONTOLOGY MỜ – R là tập các quan hệ mờ giữa các khái niệm, R= { , ,…, }, C C [0,1], i = 1,..,m. Một quan hệ là một tập bao gồm một cặp khái niệm và giá trị mờ biểu diễn mức độ quan hệ giữa chúng. Mối quan hệ giữa hai khái niệm trong ontology chỉ được biểu diễn bằng một giá trị mờ duy nhất, nghĩa là nếu (c, c’, v) và (c, c’, v’) thì v = v’. – I là tập các thực thể mờ, I = { , ,…, }, , trong đó là giá trị hàm thành viên của trường hợp [0,1]. - Z là tập hợp các tiên đề, các ràng buộc toàn vẹn hoặc mối quan hệ giữa các khái niệm và thực thể trong ontology mà không thể biểu diễn bằng các mối quan hệ trong tập R hoặc là các điều kiện (cần và đủ) để xác định các khái niệm C. Định nghĩa 2: Khái niệm mờ cụ thể Khái niệm mờ cụ thể được định nghĩa là một bộ năm: . Trong đó cf là định danh duy nhất của khái niệm. là một tập cụ thể, được gọi là miền giá trị của khái niệm. biểu diễn các giá trị mờ của tập cụ thể . là một hàm thành viên mờ được xác định: ớ . là giá trị ngôn ngữ để xác định mức độ giá trị thuộc tính trong Định nghĩa 3: Thực thể instances Một thực thể của khái niệm c được mô tả bởi các thuộc tính của tập , với các giá trị trong tập là cặp (id, v), trong đó id là định danh của thực thể và v là giá trị của thực thể với một ánh xạ v: → , v(a) , a . Định nghĩa 4: Thuộc tính mờ cụ thể Thuộc tính mờ cụ thể d được định nghĩa là một cặp: , hoặc bộ 5: . Trong đó, d là định danh duy nhất của thuộc tính. là khái niệm mờ được gọi là miền của thuộc tính d, là khái niệm mờ cụ thể. là một tập cụ thể được gọi là miền giá trị của thuộc tính d. biểu diễn cho các giá trị mờ của tập cụ thể . là hàm thành viên mờ được xác định: ớ là giá trị ngôn ngữ để xác định mức độ giá trị thuộc tính trong Định nghĩa 5: Khái niệm mờ Một khái niệm của ontology mờ được định nghĩa là một bộ tứ: ( , , ) , với là tập hợp các đối tượng (objects) hay các thể hiện (instances), A là tập các thuộc tính mô tả khái niệm, V là miền giá trị của thuộc tính: ⋃ ( là miền giá trị của thuộc tính a) và là hàm thành viên thuộc tính mờ: : [0,1] biễu diễn mức độ quan trọng/ xác định của thuộc tính đối với khái niệm . Bộ ( , ) được gọi là cấu trúc mờ của . III. TÍNH TƢƠNG ĐƢƠNG GIỮA CÁC THÀNH PHẦN ONTOLOGY Một trong những bài toán cơ bản nhất đối với quá trình tích hợp là tìm sự tương đồng của các thành phần giữa các ontology. Sự tương đồng giữa các thành phần trong các ontology được thực hiện bằng các phương pháp so khớp khác nhau và cần được sử dụng kết hợp với nhau một cách hiệu quả. Nghệ thuật so khớp ontology nằm ở chỗ lựa chọn phương pháp và sự kết hợp các phương pháp này theo cách thích hợp nhất. Theo cách tiếp cận này [11], đề xuất cách xác định mức độ tương đồng cho bài toán tích hợp ontology thành bốn nhóm sau: Tương đồng dựa trên thực thể: Sự tương đồng giữa các khái niệm được xác định bởi các thực thể chung. Tương đồng dựa trên từ vựng: Sự tương đồng giữa các khái niệm được xác định bởi ý nghĩa ngôn ngữ của tên liên quan. Tương đồng dựa trên lược đồ: Sự tương đồng giữa hai khái niệm này dựa trên sự giống nhau giữa các thuộc tính liên quan. Tương đồng dựa trên phân loại: Sự tương đồng giữa hai khái niệm được xác định bởi các mối quan hệ tương đồng cấu trúc của chúng. Trong bài báo [12], các tác giả cụ thể hóa hai cách tiếp cận tính toán tính tương đồng mờ giữa các thành phần trong ontology. Việc đầu tiên, sử dụng đo khoảng cách đối với chiều dài đường đi giữa hai khái niệm trong cấu trúc liên kết (link chính trong liên kết phân loại IS-A). Việc thứ hai, dựa trên nội dung thông tin chia sẻ của nút chung cụ thể nhất của hai khái niệm. Phương pháp xem như là một mở rộng của mô hình độ đo t lệ giống nhau của Tversky . Xác định mức độ, độ tương đồng ngữ nghĩa, khoảng cách ngữ nghĩa, hoặc quan hệ ngữ nghĩa giữa các khái niệm từ các hệ thống hoặc các lĩnh vực khác nhau đang trở thành một nhiệm vụ ngày càng quan trọng. Bài báo trình bày khái quát các biện pháp đo giữa các khái niệm trong ontology và cung cấp một số ví dụ về các độ đo được trình bày trong các nghiên cứu. Và dùng các biện pháp tập mờ tương tự để kiểm tra các biện pháp trên.
  3. Quách Xuân Hưng 425 Gần đây, các nhà nghiên cứu đã bắt đầu để xuất việc sử dụng các ontology mờ để tìm kiếm thông tin và cho sáp nhập nhiều ontology để xây dựng một kiến thức chung bởi nhiều người dùng khác nhau. Các ví dụ cụ thể về xác định mức độ giống nhau và biện pháp đo khoảng cách giữa các ontology sử dụng trong các ontology mờ được đề xuất. Một trong những phương pháp đơn giản nhất để điều chỉnh khoảng cách [13] là mở rộng khoảng cách số cạnh tối thiểu giữa cl và c2 bởi độ sâu D tối đa của một hệ thống phân loại cấp bậc. Ví dụ, chỉ sử dụng hyponymy, is-a, loại liên kết giữa các khái niệm. 0 . /1 Một phương pháp tính độ tương tự khái niệm giữa một cặp khái niệm cl và c2 được trình bày ở [14]. Xác định sự giống nhau dựa trên độ sâu của các siêu khái niệm chung nhất c3 giữa cl và c2. N1 là chiều dài (số node) của con đường từ cl đến c3, N2 là chiều dài của con đường từ c2 đến c3, và N3 là chiều dài của con đường từ c3 vào thư mục gốc của hệ thống phân cấp. Độ đo sự tương đồng giữa các khái niệm/thuộc tính mờ cụ thể: Cho bộ ba {A, V, } và {A’, V’, } thuộc về các khái niệm/thuộc tính mờ cụ thể a và a’ tương ứng. Trong đó V và V’ là các tập cụ thể, và và là các tập mờ tương ứng của tập V và V’. Lấy , các phép toán trên các tập con mờ của và được định nghĩa như sau: [ ] (1) [ ] (2) * ( ) + (3) Độ tương đồng giữa các thuộc tính của ontology mờ: | | (4) (5) (6) Độ tương đồng giữa các khái niệm của ontology mờ: Xét hai khái niệm hình thức mờ ( , , ) và ( , , ) từ hai khái niệm mờ khác nhau. Cho là số các thành viên của bộ , , tức là, = | |, = | |, với giả sử rằng n m. Tập 𝓣( , ) của các bộ ứng viên của các cặp được định nghĩa bởi tất cả các tập có thể có của n cặp thuộc tính được định nghĩa như sau: ( , ={{...}|ah , bh , h=1,...,n, and ah } Xét một miền ontology, độ tương tự của hai khái niệm mờ ( , , ) và ( , , ) được xác định như sau: - Tương đồng dựa trên lược đồ: ( ) [ ∑ ] ( ) 〈 〉 - Tương đồng dựa trên thực thể: | | ( ) ( ) - Tương đồng dựa trên thực thể và lược đồ ( ) ( ) ( ) Với: là mức độ thành viên của thuộc tính a, b.
  4. 426 SỬ DỤNG BÀI TOÁN THỎA MÃN RÀNG BUỘC ĐỂ TÍCH HỢP ONTOLOGY MỜ là là trọng số sao cho , và giá trị được thiết lập bởi người sử dụng. (a,b) là giá trị tương đương giữa từ a và b. IV. TÍCH HỢP ONTOLOGY MỜ DỰA VÀO LẬP TRÌNH RÀNG BUỘC CSP Lập trình ràng buộc là công nghệ quan trọng trong việc giải quyết các bài toán tối ưu tổ hợp. Tích hợp ontology mờ bằng cách so khớp ontology là một quá trình nhằm mục đích tìm kiếm sự tương đồng ngữ nghĩa giữa các thành phần trong hai ontology cho trước. Vì vậy, lập trình ràng buộc là một phương pháp phù hợp để đại diện cho xử lý so khớp ontology. Lập trình ràng buộc là một cách tiếp cận mới về vấn đề giải quyết thỏa mãn các ràng buộc và tối ưu hóa. Trong bài báo này chỉ tập trung vào giải quyết thỏa mãn các ràng buộc (CSPs): các định nghĩa cho các CSPs, ràng buộc và giải pháp cho các CSPs cho so khớp ontology được thể hiện như sau: 4.1. Định nghĩa 6: So khớp ontology sử dụng CSP Cho hai ontology và , bài toán so khớp thỏa mãn ràng buộc bao gồm 3 thành phần . Trong đó { } là tập các biến. D={D1,D2,...,Dn} là tập các miền giá trị tương ứng với mỗi biến trong . Mỗi miền giá trị là tập các giá trị khởi tạo có thể cho các biến tương ứng, và } là tập khác rỗng, tập hữu hạn các ràng buộc trên các biến số của . Một ràng buộc như trước đây thường được định nghĩa, đó là một cặp bao gồm một tập hợp các biến và các mối quan hệ giữa chúng. Định nghĩa này cho chúng ta cơ sở để mô hình hóa các loại không chắc chắn khác nhau trong đối sánh lược đồ. Trong nghiên cứu này cần xác định các cặp khái niệm tương đồng giữa hai ontology mờ, được gọi là tích hợp ontology mờ. 4.2. Định nghĩa 7: Một ràng buộc mờ trên một tập biến là một cặp với mối quan hệ mờ được xác định bởi ∏ với là hàm thành viên thể hiện mức độ mà bộ được gọi là thỏa mãn . có nghĩa là hoàn toàn thỏa . có nghĩa là vi phạm . có nghĩa là đáp ứng một phần . 4.3. Định nghĩa 8: Bài toán tối ưu hóa ràng buộc mờ là một bộ tứ , với C là danh sách các khái niệm thuộc ontology , D là danh sách các khái niệm thuộc ontology có thể khớp với các khái niệm trong C, là danh sách các ràng buộc mờ mà mỗi ràng buộc đề cập đến một hoặc vài khái niệm trong C và trong D và g là hàm mục tiêu được tối ưu hóa. V. XÂY DỰNG CÁC RÀNG BUỘC 5.1. Ràng buộc quan hệ Nếu có tồn tại một quan hệ giữa hai khái niệm , thì sẽ tồn tại các ánh xạ tương ứng của chúng như sau. Với: ( ) , {( ) | } (( ) ) ( ) ( )- Với mọi cặp hai biến khái niệm tồn tại một tập ràng buộc nhị phân thỏa mãn: Ràng buộc quan hệ cha: ( ) đại diện cho mối quan hệ cha con từ , như sau: ( ) ( ) Ràng buộc quan hệ con: ( ) đại diện cho mối quan hệ con cha từ , như sau: ( ) ( ) Ràng buộc đồng cấp: ( ) đại diện cho các cấu trúc có thể hiện được của mối quan hệ đồng cấp như sau: ( ) ( ) ( ) ( ) 5.2. Tƣơng đồng dựa trên từ vựng: Với mọi khái niệm , tồn tại một ràng buộc đảm bảo tương đồng ngữ nghĩa giữa và thông qua sự tương đồng ý nghĩa ngôn ngữ của các nhãn tương ứng: ( ) , | ( ( )) -. Với
  5. Quách Xuân Hưng 427 Với là hàm xác định ngữ nghĩa tương đồng giữa các nhãn của các khái niệm và như là một ngưỡng xác định trước. 5.3. Tƣơng đồng dựa trên thực thể: Với mọi khái niệm , tồn tại một ràng buộc đảm bảo tương đồng ngữ nghĩa giữa và được xác định bởi các thực thể chung. ( ) , | ( ( )) - Với 5.4. Tƣơng đồng dựa trên lƣợc đồ: Với mọi khái niệm , tồn tại một ràng buộc đảm bảo tương đồng ngữ nghĩa giữa và dựa trên sự giống nhau giữa các thuộc tính liên quan. ( ) , | ( ( )) - Với 5.5. Tƣơng đồng dựa trên phân loại: Với mọi khái niệm , tồn tại một ràng buộc đảm bảo tương đồng ngữ nghĩa giữa và được xác định các mối quan hệ tương đồng cấu trúc của chúng. ( ) , | ( ( )) -Với Các ràng buộc về cú pháp và ngữ nghĩa trên phụ thuộc vào một hàm thành viên để chỉ đến mức thỏa mãn, có thể chấp nhận được. Nếu , điều này thể hiện vi phạm tất cả các ràng buộc và với thể hiện hoàn toàn thỏa mãn các ràng buộc đặt ra. Các ràng buộc hạn chế các không gian tìm kiếm cho vấn đề tích hợp, điều này có thể đem lại hiệu quả cao của quá trình tìm kiếm. Mặt khác, nếu vấn đề quá phức tạp, các ràng buộc sẽ giúp đưa ra các tính toán phức tạp giúp cho vấn đề giải quyết. 5.6. Hàm mục tiêu Hàm mục tiêu nhằm tối ưu, tối thiểu hóa các lỗi so khớp thông qua mức độ thỏa mãn các ràng buộc và tìm ra nhiều nhất các so khớp thông qua các tổng số phần từ được gán cho các biến. Với ý nghĩa của hàm mục tiêu như trên, chúng ta có: ∑ ∑ Trong đó là hàm thành viên để chỉ đến mức thỏa mãn, có thể chấp nhận được với một phép gán với các ràng buộc; là tổng số ràng buộc, =1 là các biến điều khiển tùy thuộc vào các ontology mờ đầu vào. VI. CÁC PHƢƠNG PHÁP GIẢI QUYẾT MÂU THUẪN TRONG TÍCH HỢP ONTOLOGY MỜ 6.1 Giải quyết mâu thuẫn ontology mờ ở mức khái niệm Cho hai ontology mờ và , khái niệm c thuộc là (c, , ) và thuộc là (c, , ). Ta nói rằng sự mâu thuẫn khái niệm xảy ra nếu ≠ hoặc ≠ Vc2 hoặc ≠ ). Ví dụ: Chúng ta xem xét thuộc tính hasPrice của cùng một khái niệm Car trong các ontology khác nhau (Biểu thị là thuộc tính hasPrice trong ontology ). Chúng ta thấy các mâu thuẫn ontology mờ xảy ra như sau: Car(hasPrice) = {(P1, 0.8), (P1, 0.9), (P1 , 1), (P2, 0.6), (P2, 0.7), (P2, 0.8), (P3, 0.8), (P3, 0.9)} 6.2. Giải quyết mâu thuẫn ontology mờ ở mức quan hệ Cho hai ontology mờ và . c , c’ . Chúng ta nói rằng sự mâu thuẫn mức quan hệ xảy ra nếu Ri1(c,c’) Ri2(c,c’),i {1,…,m}. Ví dụ: Trong bảng 1, cho hai ontology và có các quan hệ , và các khái niệm a, b, c. Các mâu thuẫn mức quan hệ xảy ra như sau: = khác với Bảng 1. Mâu thuẫn mức quan hệ R1 R2 R3 O1 O2
  6. 428 SỬ DỤNG BÀI TOÁN THỎA MÃN RÀNG BUỘC ĐỂ TÍCH HỢP ONTOLOGY MỜ Hoặc , trong khi không tồn tại. Trong trường hợp này chúng ta có thể giả sử . 6.3. Giải quyết mâu thuẫn ontology mờ ở mức thực thể Trong các hệ thống tri thức ontology, thông tin về các khái niệm và các mối quan hệ giữa các thành phần của các ontology là đầy đủ và chắc chắn. Tuy nhiên trong một số trường hợp có thể xuất hiện một số giá trị thuộc tính của các thực thể là không đầy đủ hoặc chưa biết. Bảng 2. Dữ liệu quan sát của hệ thống dự báo thời tiết các trạm khí tượng Thực thể I1 I2 I3 I4 I5 I6 Thuộc tính Áp suất 990-995 990-997 992-999 993-997 992-998 Hướng gió {W, W-N} {E, E-N} {S, W-S} {S, W-S} {W-N} Vận tốc gió 10-12 5-10 20-30 40-50 0-10 Nhiệt độ 15-25 20-24 12-21 12-21 22-24 17-20 Mưa không có không không Có Có Nắng không không không không Có không Tuyết Có không Có Trong các ontology mờ, các thực thể bao gồm nhiều thuộc tính và các giá trị thuộc tính không phải là giá trị đơn mà có thể là một tập hợp các giá trị. Trong trường hợp này các giá trị mờ không phải là một số mà là một tập các giá trị. Để giải quyết vấn đề này, ở đây sử dụng cấu trúc đa thuộc tính - đa giá trị để biểu diễn các thực thể mờ và giải pháp cho bài toán tích hợp ontology mờ ở mức thực thể [5]. Cho hai ontology và , khái niệm c thuộc là (c, , ) và thuộc là ( , , ). Cho (i, v) ( ,c) và (i, ) ( , ). Ta nói rằng sự mâu thuẫn thực thể xảy ra nếu v(a) = ,a . Thực thể mờ: Một thực thể mờ của khái niệm c được mô tả bởi các thuộc tính của tập có các giá trị thuộc tập (X= ) là một căp (i, v), với: – i là định danh của thực thể, v là giá trị của thực thể, – v là một bộ có kiểu được biểu diễn là một hàm ̅ với v(a) , a . VII. KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Bài toán tích hợp ontology mờ có thể được chia làm hai giai đoạn. Giai đoạn so khớp giữa các ontology và giải quyết mâu thuẫn trong giá trị mờ. Về so khớp, có hai trường phái, đó là vét cạn và theo kinh nghiệm. Hướng vét cạn thường xẩy ra nhiều lỗi so khớp, tuy nhiên hầu hết các cặp so khớp giữa hai ontology đều được phát hiện. Theo trường phái kinh nghiệm, thường dựa vào các tính chất ontology để cắt tỉa các cặp không tương đồng trước khi so khớp. Với cách tiếp cận này mức độ xẩy ra so khớp sai giảm đáng kể, tuy nhiên thường bỏ qua nhiều cặp thành phần tương đồng trong quá trình so khớp. Để khắc phục nhược điểm của hai cách tiếp cận trên, bài báo này đề xuất sử dụng CSP cho mô hình hóa bài toán so khớp. Đề xuất các ràng buộc và đưa ra hàm tối ưu để tối thiểu các lỗi so khớp. Trong giai đoạn giải quyết mâu thuẫn tích hợp ontology mờ, đề xuất sử dụng lý thuyết đồng thuận nhằm giải quyết mâu thuẫn trên mức quan hệ, mức thực thể và mức khái niệm, các thuộc tính của các khái niệm tương đồng. Các khái niệm của ontology sau khi trộn bao gồm tất cả các thuộc tính của các khái niệm tham gia trộn gây ra sự dư thừa dữ liệu. Trong khi đó, ở đây sử dụng phương pháp đồng thuận để xác định đại diện tốt nhất giữa các đối tượng mâu thuẫn. Do đó, các mâu thuẫn có thể được xóa bỏ và giảm đi sự dư thừa dữ liệu. Kết quả nghiên cứu tại thời điểm này bao gồm đề xuất mô hình ontology mờ, trong đó ontology được tích hợp với logic mờ và logic mô tả mờ. Dựa trên mô hình ontology mờ, chúng tôi đã mô hình hóa bài toán tối ưu sử dụng CSP cho so khớp ontology mờ. Định nghĩa bài toán tối ưu hóa sử dụng CSP và hàm mục tiêu cho tối ưu hóa quá trình so khớp. Trong nghiên cứu tiếp theo, chúng tôi sẽ cụ thể hóa các giải thuật cho việc tích hợp ontology mờ đã được mô hình hóa dựa trên CSP. Sử dụng các tập dữ liệu chuẩn trong việc đánh giá kết quả nghiên cứu, so sánh với các nghiên cứu trước đây để cho ra các đánh giá và kết luận với mô hình tích hợp ontology mờ được đề xuất trong bài báo này.
  7. Quách Xuân Hưng 429 VIII. TÀI LIỆU THAM KHẢO [1] Hai Bang Truong, Trong Hai Duong, Ngoc Thanh Nguyen, “A Hybrid Method For Fuzzy Ontology Integration”, Cybernetics and Systems: An International Journal, 44:2-3, pp.133-154, 2013. [2] Konstantin Todorov, Peter Geibel, and C_eline Hudelo, ”A Framework for a Fuzzy Matching between Multiple Domain Ontologies”, KES'11 Proceedings of the 15th international conference on Knowledge-based and intelligent information and engineering systems, Springer-Verlag Berlin, Heidelberg, vol. part I. p538-547, 2011. [3] Rung-Ching Chen, Cho-Tscan Bau, Chun-Ju Yeh, “Merging domain ontologies based on the WordNet system and Fuzzy Formal Concept Analysis techniques”, Applied Soft Computing 1, pp.1908-1923, 2011. [4] Hai Bang Truong, Ngoc Thanh Nguyen, “A Multi-attribute and Multi-valued Model for Fuzzy Ontology Integrationon Instance Level”, ACIIDS The 4nd Asian Conference on Intelligent Information and Database Systems, Springer Verlag in a vol. LNAI, pp.187-197, 2012. [5] Trong Hai Duong, Hai Bang Truong, Ngoc Thanh Nguyen, “Local Neighbor Enrichment for Ontology Integration”, ACIIDS The 4nd Asian Conference on Intelligent Information and Database Systems, Springer Verlag in a vol. LNAI: pp.156-166, 2012. [6] Hai Bang Truong, Ngoc Thanh Nguyen, Phi Khu Nguyen, “Fuzzy Ontology Building and Integration for Fuzzy Inference Systems in Weather Forecast Domain”, ACIIDS-2011 The 3nd Asian Conference on Intelligent Information and Database Systems, Springer Verlag in a vol. LNAI, in Daegu city, Korea: pp.517-527, 2011. [7] Hai Bang Truong, Trong Hai Duong, Ngoc Thanh Nguyen, “A Hybrid Method For Fuzzy Ontology Integration”, Cybernetics and Systems: An International Journal, 44:2-3, pp.133-154, 2013. [8] Hai Bang Truong, Xuan Hung Quach, “An Overview of Fuzzy Ontology Integration Methods Based on Consensus Theory”. ICCSAMA, pp. 217-227, 2014. [9] K. Marriott, P. Stuckey: “Programming with Constraints”, An Introduction, MIT Press, 1998. [10] E. Tsang, “Foundations of Constraint Satisfaction”, Acadimic Press, 1993. [11] Hai Bang Truong, Ngoc Thanh Nguyen, “A framework of an effective fuzzy ontology alignment technique. International Conference on Systems, Man and Cybernetics, Anchorage, Alaska, USA, IEEE 2011, ISBN 978-1-4577-0652-3, pp.931-935, 2011. [12] Ling Song, Jun Ma, Hui Liu, Dongmei Zhang, “Fuzzy Semantic Similarity Between Ontological Concepts, Advances and Innovations in Systems”, Computing Sciences and Software Engineering, pp.275-280, 2011. [13] Claudia Leacock and Martin Chodorow, “Combining local context and WordNet similarity for word sense identi- fication”, In Fellbaum, pp. 265-283, 1998. [14] Silvia Calegari, Marco Loregian, “Using Dynamic Fuzzy ontologies to Understand Creative Environments”, In: Proceedings of the 7th International Conference on Flexible Query Answering Systems (FQAS 2006), Edited by Henrik Legind Larsen, Gabriella Pasi, Daniel Ortiz Arroyo, Troels Andreasen, and Henning Christiansen,Vol. 4027, Lecture Notes in Computer Science. Milan, Italy, Springer-Verlag, pp.404-415, 2006. [15] Nguyen, N. T., “Advanced methods for inconsistent knowledge management”, Springer, London, 2008. ONTOLOGY MATCHING METHOD BY USING CONSTRAINT SATISFACTION PROBLEM Quach Xuan Hung ABSTRACT:The problem of fuzzy ontology integration can be divided into two phases: the matching phase between ontologies and conflicting resolution on fuzzy values. This paper focuses on the problems of the matching phase, which currently has exhaustive and heuristic approaches. While the exhaustive method has many matching errors, most of the matched pairs between the two ontologies are detected. The heuristic approach uses the ontology nature to trim the non-homologous pairs which can decrease significantly the number of mismatching pairs, but often skips lots of homologous element pairs. To overcome the disadvantages of the two approaches, we proposed to use the constraint satisfaction problem (CSP) for modeling the ontology matching problem. In particular, we introduce constraints and suggest optimal function to minimize the matching errors. In the experiment, the mismatching pairs between ontologies are significantly reduced by applying CSP for refinement. Besides, using consensus method to determine the best representation between conflicting objects in the process of integrating fuzzy ontology.
nguon tai.lieu . vn