Xem mẫu

  1. Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018 DOI: 10.15625/vap.2018.00025 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG Trần Thị Thúy1, Trương Quốc Định2, Nguyễn Văn Thọ3, Huỳnh Trung Long4 1 Khoa Kỹ thuật Công nghệ, Trường Đại học Cửu Long 2 Khoa Công nghệ Thông tin & Truyền thông, Trường Đại học Cần Thơ 3 Trung tâm Y tế quận Bình Thủy, TP Cần Thơ 4 Sở Thông tin Truyền thông thành phố Cần Thơ tranthithuy@mku.edu.vn, tqdinh@cit.ctu.edu.vn, nguyenthoytct@gmail.com, trunglong159753@gmail.com TÓM TẮT: Hiện nay, khai thác quan điểm của khách hàng thông qua các bình luận, phản hồi đang được ứng dụng ngày càng nhiều trong các hệ thống gợi ý, đặc biệt là các trang web thương mại điện tử. Phần lớn các hệ thống hiện tại chỉ đưa ra gợi ý dựa trên ước đoán điểm đánh giá tổng thể của sản phẩm mà chưa chú trọng đến điểm từng tính năng của sản phẩm. Hướng tiếp cận này có thể sẽ gợi ý các sản phẩm chưa đúng với nhu cầu của khách hàng trong trường hợp họ quan tâm tới chi tiết tính năng của sản phẩm. Để giải quyết vấn đề nêu trên, trong bài báo này, chúng tôi đề xuất giải pháp gợi ý sản phẩm dựa trên tính năng. Hệ thống sẽ thu thập ý kiến/bình luận của khách hàng về các nhóm sản phẩm cần gợi ý, sử dụng các kỹ thuật của lĩnh vực khai phá quan điểm để xác định được quan điểm của khách hàng. Mỗi bình luận của khách hàng sẽ được hệ thống xử lý để thu được các thông tin: tên sản phẩm, tính năng, quan điểm (xấu, bình thường, tốt) phục vụ xây dựng CSDL cho bước gợi ý. Kết quả thực nghiệm trên nhóm sản phẩm điện thoại di động với hơn 10000 bình luận tiếng Việt đã khẳng định tính khả thi của giải pháp mà chúng tôi đề xuất. Từ khóa: Hệ thống gợi ý, bình luận, quan điểm, khai phá quan điểm. I. GIỚI THIỆU Trong thời đại bùng nổ của thông tin cùng với sự gia tăng về số lượng của các thiết bị có khả năng kết nối và duyệt web hiện nay thì việc xây dựng các hệ thống gợi ý (Recommender Systems) là một việc hết sức cần thiết. Mục đích của hệ thống gợi ý là hỗ trợ người dùng (users) tìm kiếm được đúng thông tin cần thiết bằng cách dự đoán sở thích (preferences) hay xếp hạng (rating) mà người dùng có thể dành cho một đối tượng thông tin (item) nào đó mà họ chưa xem xét tới trong quá khứ. Hệ thống gợi ý được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau như: lĩnh vực giải trí (gợi ý bài hát - LastFM - www.last.fm, gợi ý phim - LastFM - www.last.fm), lĩnh vực học thuật (gợi ý bài báo – ResearchGate – www.researchgate.net) và đặc biệt là lĩnh vực thương mại điện tử (Amazon – www.amazon.com). Đối với lĩnh vực thương mại điện tử, hệ thống gợi ý giúp người dùng giảm “chi phí giao dịch” bằng cách hỗ trợ tìm và chọn lựa sản phẩm phù hợp với nhu cầu [1], giúp người kinh doanh tăng lợi nhuận vì bán được nhiều sản phẩm hơn [2]. Các hệ thống gợi ý có thể được phân thành 2 dạng chính đó là dự đoán xếp hạng (rating prediction) tức là dự đoán giá trị xếp hạng mà một người dùng đánh giá cho một mục tin nào đó và dự đoán mục tin (item prediction) nghĩa là ước lượng xác suất người dùng thích một mục tin nào đó [3]. Trong lĩnh vực thương mại điện tử, với các hệ thống cho phép người dùng phản hồi một cách tường minh thông qua việc xếp hạng (ví dụ đưa ra điểm đánh giá từ  đến ) thì sản phẩm gợi ý là sản phẩm được dự đoán có điểm xếp hạng cao nhất. Hiện nay nhiều trang web thương mại điện tử đã phát triển các hệ thống đánh giá thông qua các cơ chế sao giá trung bình cho sản phẩm để giúp khách hàng ra quyết định khi mua hàng. Tuy nhiên, việc đánh giá một cách tổng quan như vậy là chưa đủ độ tin cậy và chưa hẳn đã phản ánh chất lượng thực tế của sản phẩm, đặc biệt là đối với các nhóm sản phẩm có nhiều tính năng/thuộc tính khác nhau [4] (ví dụ: một điện thoại được đánh giá chung là tốt thì chưa hẳn đã có dung lượng pin lớn). Việc gợi ý sản phẩm phù hợp theo một hoặc nhiều tính năng mà người dùng quan tâm dựa trên hướng tiếp cận dự đoán xếp hạng sẽ luôn là không khả thi cho đến khi các trang web thương mại điện tử hỗ trợ người dùng đánh giá theo tính năng sản phẩm. Tuy nhiên trong thời đại mà mạng xã hội phát triển cũng như phần lớn các trang thương mại điện tử cho phép người dùng đưa ra ý kiến bình luận thì người dùng đã bày tỏ quan điểm của mình một cách rõ ràng và chi tiết hơn về tính năng của một sản phẩm, ví dụ như: Màn hình hiển thị đẹp và lớn. Bình luận trở thành công cụ đắc lực để khách hàng phản ánh ý kiến của mình về sản phẩm cũng như dịch vụ. Thực tế, khách hàng đã ngày càng có nhiều quyền lực hơn trong mối quan hệ nhà sản xuất – khách hàng. Cuộc khảo sát từ PowerReviews cho kết quả rằng 57% người mua sắm không những chỉ đọc các đánh giá trực tuyến để có thêm thông tin mà còn thích truy cập vào các trang web thương mại điện tử cung cấp dịch vụ đánh giá1. Người dùng của các trang thương mại điện tử cũng tin rằng “Những lời đánh giá phản ánh một phần trải nghiệm khi sử dụng sản phẩm, vì thế, họ sử dụng chúng nhiều hơn”. Như vậy, việc đánh giá và tổng hợp được quan điểm của khách hàng thông qua các bình luận sẽ cho chúng ta thông tin về sự hài lòng/không hài lòng của khách hàng đối với tính năng nào đó của một sản phẩm và từ đó có thể giúp đưa ra các gợi ý phù hợp nhất với yêu cầu của khách hàng. Trong phạm vi của nghiên cứu này, chúng tôi đặt sự quan tâm đến việc phân tích các ý kiến của khách hàng về một chức năng cụ thể nào đó của sản phẩm. Dữ liệu đầu vào sẽ là một tập các sản phẩm, tập các tính năng và các tập 1 https://www.retaildive.com/news/the-power-of-online-reviews/368614/
  2. 192 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG bình luận tương ứng với mỗi sản phẩm. Với mỗi bình luận của người dùng, chúng tôi sẽ tiến hành trích xuất tính năng, từ nói lên quan điểm và đồng thời dự đoán điểm đánh giá cho chức năng của sản phẩm. Phần còn lại của bài báo được tổ chức như sau. Trong phần II chúng tôi sẽ trình bày tổng quan về lĩnh vực khai phá quan điểm trong bình luận của người dùng/khách hàng. Kiến trúc của hệ thống gợi ý sản phẩm dựa trên phân tích quan điểm khách hàng được trình bày trong phần III. Phần IV sẽ mô tả kết quả đạt được của mô hình đề xuất dựa trên dữ liệu thu thập tự động hơn 10.000 bình luận (tiếng Việt) của khách hàng về các sản phẩm thuộc nhóm hàng điện thoại di động. Kết quả bước đầu cho thấy tính hiệu quả của mô hình mà chúng tôi đề xuất. Phần V sẽ thảo luận một số ưu nhược điểm của mô hình đề xuất cùng định hướng nghiên cứu trong tương lai. II. NGHIÊN CỨU LIÊN QUAN Lĩnh vực khai phá quan điểm trong bình luận của khách hàng thu hút được sự quan tâm của nhiều nhà nghiên cứu trong và ngoài nước vì tính chất quan trọng cũng như lĩnh vực ứng dụng rộng rãi của nó. Để thực hiện khai phá quan điểm, rất nhiều nghiên cứu đã bắt đầu từ việc xây dựng từ điển cảm xúc (SentiWordNet). Esuli và cộng sự đã nghiên cứu xây dựng bộ từ điển cảm xúc cho ngôn ngữ tiếng Anh [5] với các thông tin như từ vựng, điểm số cho quan điểm tích cực và điểm số cho quan điểm tiêu cực. Từ điển cảm xúc này được xem là bước khởi đầu và cũng là nguồn tài nguyên mở cho các nghiên cứu khai phá quan điểm ngôn ngữ Anh. Trong một nghiên cứu tương tự [6], Baccianella và các cộng sự đã trình bày giải pháp xây dựng từ điển cảm xúc phiên bản 3.0 (SentiWordNet 3.0 – http://sentiwordnet.isti.cnr.it/). Đây được xem là phiên bản nâng cấp của SentiWordNet 1.0, tuy nhiên số lượng từ vựng vẫn chưa đầy đủ và chưa thể bao phủ hết tất cả các miền ngữ nghĩa. Từ điển cảm xúc tiếng Việt cũng nhận được sự quan tâm của nhiều nhà nghiên cứu trong nước, nổi bật là công trình của tác giả Nguyễn Hồng Nam và các cộng sự [7] với kết quả sau cùng là bộ từ điển cảm xúc tiếng Việt VietSentiWordNet (https://github.com/sonvx/VietSentiWordNet). Các tác giả ban đầu đã thực hiện dịch các từ có từ loại là tính từ, trạng từ và động từ thuộc từ điển SentiWordNet 3.0 sang tiếng Việt, sử dụng từ điển Anh –Việt, từ điển tiếng Việt để lọc nhiễu. Ở khía cạnh khai phá quan điểm, các nghiên cứu có thể được chia thành 2 dạng bài toán lớn đó là xác định quan điểm trong câu có tính chất so sánh (liên quan đến nhiều đối tượng) và rút trích quan điểm chỉ liên quan đến 1 đối tượng. Có không nhiều công trình mà đối tượng nghiên cứu là câu bình luận có tính chất so sánh. Một trong số đó Jindal và Liu [8] hướng nghiên cứu của mình đến việc xác định quan điểm trong các câu bình luận có tính chất so sánh. Các tác giả đã đề xuất phương pháp học có giám sát để xác định các câu dạng so sánh, đưa ra các luật để xác định các đối tượng cũng như quan điểm so sánh, kết quả bước đầu cho thấy tính khả thi của giải pháp đề xuất. Rút trích quan điểm trong câu bình luận chỉ liên quan đến 1 đối tượng có thể được thực hiện ở mức đoạn hoặc mức câu. Yue Lu [9] giải quyết vấn đề xác định quan điểm như chức năng tóm tắt của một bình luận ngắn. Văn bản đầu tiên được tiền xử lý thành các đoạn theo định dạng , với headterm là các tên nhóm theo cấu trúc PLSA (Probability Latent Semantic Analysis). Sau đó, việc đánh giá những đoạn văn được phán đoán bởi dự đoán cục bộ hoặc phán đoán toàn cục. Chúng được tổng hợp để có được đánh giá chức năng. Brody và Elhadad [10] sử dụng mô hình chủ đề (topic model) để tìm các tính năng. Sau đó, với mỗi tính năng, tiến hành trích xuất toàn bộ các tính từ thích hợp và xây dựng sơ đồ liên kết. Một giải thuật lan truyền nhãn được sử dụng trên sơ đồ để học các điểm phân cực cảm xúc của các tính từ đó. Mô hình của Sauper [11], Sauper và Bazilay [12] không sử dụng đoạn mà thay vào đó là “snippets” và một snippet là một câu ngắn hay một đoạn ngắn. Tuy nhiên, vấn đề hiệu chỉnh nhãn cảm xúc không được giải quyết tốt trong mô hình này. Mô hình dùng seed word để xác định bất đối xứng trước nhưng nó chỉ hỗ trợ hai loại cảm xúc: tích cực và tiêu cực trong khi cách xác định bất đối xứng cho nhiều loại cảm xúc không rõ ràng. Lakkaraju [13] thử giải quyết vấn đề đặt nhãn cảm xúc bằng cách giả thiết rằng toàn bộ đánh giá được sinh ra như một biến trả về và sự đối xứng của các chủ đề cảm xúc xem như là những đặc trưng. Tuy nhiên, cách mà các nhãn cảm xúc liên kết với các đánh giá vẫn không biết được cho đến lúc được học. Lazaridou [14] cố gắng liên kết các nhãn cảm xúc với đánh giá bằng ký hiệu Kronecker và áp dụng được cho 3 loại cảm xúc: tích cực, trung lập và tiêu cực. Tuy nhiên phương pháp này không xây dựng hay xác định các từ cảm xúc, nguồn tri thức quan trọng phục vụ đánh giá quan điểm. Baumgarten cùng các cộng sự trong nghiên cứu [15] tập trung xác định tập từ khóa giúp phân loại và rút trích quan điểm. Các từ khóa sẽ được sử dụng để phân lớp các thông điệp ngắn (short message), loại thông điệp chủ yếu xuất hiện trên các trang mạng xã hội và từ đó xác định được quan điểm tiềm ẩn trong các thông điệp. Đóng góp chính của nghiên cứu là xây dựng được tập từ khóa giúp xác định quan điểm của các bình luận cũng như là một tham khảo tốt cho các nghiên cứu tương tự về sau. Mạng xã hội là nơi nhiều người dùng bày tỏ quan điểm của mình về các vấn đề nóng và thời sự đang diễn ra. Đặc thù của các bình luận trên mạng xã hội là ngắn và chứa nhiều từ “lóng” vì thế việc xác định quan điểm dựa vào các bình luận trên mạng xã hội đòi hỏi các cách tiếp cận đặc thù. Các hướng tiếp cận chính cho lớp bài toán này đó là: kỹ thuật phân tích từ vựng (lexical analysis) [16, 17], kỹ thuật máy học (machine learning based analysis) [18, 19] và các kỹ thuật lai (hybrid analysis) [20, 21]. Trong các hướng tiếp cận trên thì kỹ thuật dựa trên máy học cho kết quả tốt nhất mặc dù đòi hỏi phải có một tập dữ liệu huấn luyện đủ lớn trong khi hướng tiếp cận phân tích từ vựng lại không yêu cầu bất kỳ tri thức sẵn có nào. Dù theo cách tiếp cận nào đi nữa thì tính chính xác của mô hình đề xuất cũng luôn thay đổi theo miền ứng dụng.
  3. Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 193 Các nghiên cứu nói trên đều ít nhiều có những mặt chưa tối ưu và đều thực hiện trên tập dữ liệu tiếng nước ngoài vốn đã được phân tích và xây dựng cấu trúc ngữ pháp chặt chẽ cùng ưu điểm có các bộ từ điển cảm xúc đi kèm. Vấn đề khai phá quan điểm trong ý kiến/bình luận tiếng Việt và ứng dụng vào bài toán gợi ý sản phẩm, đặc biệt là gợi ý sản phẩm theo tính năng thì chưa được nghiên cứu và công bố nhiều tại Việt Nam. Chính vì lẽ đó, trong bài báo này, chúng tôi nhắm đến xây dựng hệ thống gợi ý sản phẩm theo tính năng dựa trên kỹ thuật khai phá quan điểm bình luận trên các website thương mại điện tử. III. MÔ HÌNH ĐỀ XUẤT Bài toán chúng tôi nhắm đến giải quyết trong nghiên cứu này đó là đưa ra sản phẩm gợi ý theo tính năng mà người dùng quan tâm, ví dụ như: tìm điện thoại có màn hình được đánh giá là tốt nhất thì hệ thống sẽ gợi ý là Samsung galaxy S8 hoặc nếu tìm điện thoại có pin dùng được trong khoảng thời gian dài thì hệ thống có thể sẽ gợi ý là Nokia 5. Để có thể đưa ra những gợi ý thuộc dạng vừa nêu, chúng tôi cần xây dựng CSDL gợi ý, CSDL này sẽ bao gồm nhiều mục tin, mỗi mục tin có cấu trúc như sau: , , . Kiến trúc của hệ thống cho phép xây dựng CSDL gợi ý được giới thiệu trong hình 1 và kiến trúc của hệ thống gợi ý sản phẩm được thể hiện trong hình 2. Bộ thu thập dữ liệu Tiền xử lý Dữ liệu xây dựng dữ liệu Tập các bình luận CSDL gợi ý phù hợp Dữ liệu Bình luận 1 Bình luận 2 Bình luận n huấn luyện Xác định Xác định Xác định tính năng tính năng tính năng Mô hình chủ đề cho tính năng Xác định từ chỉ Xác định từ chỉ Xác định từ chỉ cảm xúc cảm xúc cảm xúc Từ điển Phán đoán Phán đoán Phán đoán cảm xúc quan điểm quan điểm quan điểm TỔNG HỢP ĐIỂM TÍNH NĂNG THEO SẢN PHẨM CSDL GỢI Ý Hình 1. Kiến trúc hệ thống xây dựng cơ sở dữ liệu gợi ý Danh sách Lọc dữ liệu theo tính năng tính năng CSDL GỢI Ý quan tâm Tổng hợp và tính điểm cho từng sản phẩm Danh sách sản phẩm Chọn 10 sản phẩm gợi ý tốt nhất Hình 2. Kiến trúc hệ thống gợi ý sản phẩm theo tính năng
  4. 194 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG 3.1. Hệ thống xây dựng CSDL gợi ý 1. Môđun lấy dữ liệu Cho phép thu thập dữ liệu là các bình luận từ các trang web thương mại điện tử có cung cấp chức năng bình luận (ví dụ http://fptshop.com, http://www.thegioididong.com…) liên quan đến nhóm sản phẩm cần gợi ý. Dữ liệu thu thập được, cho một nhóm sản phẩm, sẽ được phân chia một cách ngẫu nhiên thành 2 tập dữ liệu: tập dữ liệu huấn luyện và tập dữ liệu xây dựng CSDL gợi ý. Tập dữ liệu huấn luyện sẽ được dùng để xây dựng mô hình chủ đề cho các tính năng của sản phẩm cùng với từ điển cảm xúc. Tập dữ liệu xây dựng CSDL gợi ý sẽ được dùng để tính được điểm tính năng cho mỗi một sản phẩm. Bên cạnh việc thu thập dữ liệu là các bình luận thì chúng tôi cũng thu thập kèm theo điểm đánh giá (số ) mà người dùng đã đánh giá cho sản phẩm tương ứng đi kèm theo bình luận đó. 2. Môđun xây dựng mô hình chủ đề cho tính năng Để xác định được câu bình luận của người dùng là nêu quan điểm về chức năng nào của sản phẩm thì chúng tôi cần thiết phải xây dựng được mô hình chủ đề (topic model) cho tính năng. Mô hình chủ đề được Griffiths và Steyvers đề xuất lần đầu tiên vào năm 2004 [22]. Một cách tổng quát, mô hình chủ đề được xem như là một mô hình thống kê cho phép khám phá các chủ đề “trừu tượng” tiềm ẩn bên trong một tập tài liệu (collection of documents). Trong ngữ cảnh của hệ thống mà chúng tôi xây dựng, mô hình chủ đề cho tính năng được hiểu đơn giản đó là danh sách các từ khóa đại diện cho một tính năng, nghĩa là khi đề cập đến 1 từ khóa nào đó thì chúng ta biết được đang nói đến tính năng nào của sản phẩm. Bảng 1 minh họa cho danh sách các từ khóa đại diện cho một số tính năng của điện thoại. Bảng 1. Mô hình chủ đề cho một số tính năng của điện thoại Tính năng Danh sách từ khóa đại diện Màn hình Màn hình, display, screen, hiển thị Bộ nhớ trong Bộ nhớ trong, bộ nhớ, ROM Quá trình tạo lập từ khóa đại diện cho một tính năng được tóm lược qua các bước chính như sau: Duyệt qua bình luận có nhãn chủ đề là tính năng nào đó của sản phẩm. Với mỗi bình luận, sử dụng công cụ vnTagger [23] để tách từ và gán từ loại. Các từ khóa có nhãn là danh từ chung sẽ được giữ lại xem như là từ khóa đại diện cho tính năng của sản phẩm. Tổng hợp danh sách các từ khóa được trả về ở bước 1, trong đó mỗi từ khóa sẽ có thêm thông tin đó là số lượt mà từ khóa đó được trả về. Các từ khóa được xếp theo thứ tự giảm dần của số lượt trả về. Trả về N từ khóa đầu danh sách có được ở bước 2 như là N từ khóa đại diện cho mỗi tính năng của sản phẩm. 3. Môđun xây dựng từ điển cảm xúc Bắt đầu Đọc câu bình luận cùng điểm đánh giá Còn bình sai luận? Kết thúc đúng - Đọc số lượt xuất hiện của từ cảm xúc k: fk Tách từ, xác định bộ bốn - Đọc điểm đánh giá hiện tại của từ cảm xúc k: sk (Sản phẩm i; Tính năng j; Từ cảm xúc k; Điểm -d) - Tính điểm đánh giá mới: sknew = (sk * fk + d) /(fk+1) Cập nhật điểm đánh giá sknew cho từ cảm xúc k Hình 3. Giải thuật xây dựng từ điển cảm xúc Như đã đề cập ở phần trên, để có thể đưa ra gợi ý sản phẩm theo tính năng mà người dùng quan tâm, hệ thống cần có dữ liệu dạng , , . Nguồn thông tin để xây dựng dữ liệu gợi ý đó là các bình luận cùng với điểm đánh giá (số ) mà người dùng dành cho sản phẩm tương ứng. Tuy nhiên, có một nhận xét rằng mặc dù điểm đánh giá không tương ứng với tính năng nhưng người dùng cho điểm đánh giá tốt hay
  5. Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 195 không tốt khi mà người dùng hài lòng hay không hài lòng với một tính năng nào đó được đề cập đến trong bình luận. Một lý do khác cho việc xây dựng từ điển cảm xúc đó là cách dùng từ để biểu đạt quan điểm của mỗi một người dùng là khác nhau và đôi khi là cùng từ cảm xúc nhưng điểm đánh giá lại khác nhau. Do vậy, mục tiêu của môđun xây dựng từ điển cảm xúc, trong ngữ cảnh hệ thống của chúng tôi xây dựng, đó là xác định điểm đánh giá tương ứng với mỗi một từ cảm xúc (, ). Phương pháp xây dựng từ điển cảm xúc được thể hiện trong hình 3. 4. Môđun xây dựng CSDL gợi ý Sử dụng tập bình luận thu thập từ các trang mạng xã hội, các trang web thương mại điện tử, với mỗi bình luận, hệ thống sẽ thực hiện bước tách từ, giữ lại các danh từ riêng, danh từ chung, trạng từ và tính từ. Mô hình chủ đề cho tính năng được sử dụng để xác thực tính năng mà bình luận đề cập đến. Kết quả của bước phân tích sẽ là bộ ba: , , . Từ điển cảm xúc được sử dụng để xác định điểm đánh giá cho tính năng của câu bình luận. Điểm đánh giá này được tính vào điểm tổng của tính năng của sản phẩm tương ứng trong CSDL gợi ý. Hình 4 minh họa các bước chính của quy trình xây dựng CSDL gợi ý của hệ thống. Bắt đầu Đọc câu bình luận Còn bình sai luận? Kết thúc đúng Rút trích được bộ 3 sai ? đúng - Đọc số lượt xuất hiện của tính năng j của sản phẩm i: fij Truy xuất điểm đánh giá - Đọc điểm đánh giá hiện tại: sij của từ cảm xúc k: sk - Tính điểm đánh giá mới: sijnew = (sij * fij + sk) /(fij+1) Cập nhật điểm đánh giá đọc sijnew cho tính năng j của sản phẩm i CSDL gợi ý ghi Hình 4. Các bước xây dựng CSDL gợi ý Hệ thống thực hiện gợi ý cho người dùng theo 2 cách: theo tính năng và không. Trong trường hợp người dùng không quan tâm đến 1 tính năng cụ thể nào đó thì hệ thống sẽ thực hiện tính điểm cho sản phẩm theo tổng điểm của các tính năng. Điểm đánh giá tổng quan cho một sản phẩm được tính theo công thức ∑ trong đó wij là điểm tính năng j của sản phẩm pi. Trong trường hợp người dùng xác định danh sách các tính năng (theo thứ tự giảm dần của độ ưu tiên), điểm gợi ý cho mỗi sản phẩm được tính theo công thức ∑ trong đó j là trọng số cho tính năng j tương ứng, trọng số này được xem là tham số của hệ thống, do người dùng xác lập theo nguyên tắc 1 > 2 > … > m. Hình 5 minh họa danh mục điện thoại thông minh được hệ thống gợi ý cho người dùng khi người dùng chọn quan tâm đến các tính năng: màn hình, cảm ứng, thiết kế và camera.
  6. 196 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG 3.2. Hệ thống gợi ý Hình 5. Danh mục điện thoại gợi ý khi theo tính năng: màn hình, cảm ứng, thiết kế, camera IV. THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 4.1. Dữ liệu thực nghiệm Chúng tôi thực nghiệm tính khả thi của hệ thống đề xuất dựa trên các bình luận thu thập được từ các trang thương mại điện tử http://fptshop.com, http://www.thegioididong.com liên quan đến nhóm sản phẩm điện thoại thông minh. Lý do chúng tôi thực nghiệm trên nhóm sản phẩm này là vì đây là nhóm sản phẩm có số lượt bình luận lớn trên các trang web bán hàng thương mại điện tử. Chúng tôi sử dụng công cụ jsoup (https://jsoup.org/) cho việc tải về nội dung trang web dưới dạng mã nguồn HTML và thực hiện phân tích thẻ HTML để giữ lại các thông tin cần thiết: tên sản phẩm, câu bình luận và mức  đánh giá. Do các website FPT shop và Thế giới di động có số lượng trang rất lớn, nên chúng tôi thiết lập 2 thông số: số sản phẩm (theo mức độ quan tâm giảm dần) n_sp; số trang bình luận của mỗi sản phẩm n_page. Trong ngữ cảnh của nghiên cứu này, chúng tôi thiết lập n_sp = 50 và n_page=10 tương ứng. Tổng số bình luận chúng tôi thu thập được là 14.872 bình luận, trong đó khoảng 1/3 số bình luận (4.872) được dùng làm tập dữ liệu huấn luyện cho việc xây dựng mô hình chủ đề cho tính năng và từ điển cảm xúc. 10.000 bình luận còn lại (bao gồm bình luận và số ) được sử dụng để đánh giá tính đúng đắn của mô hình đề xuất. Nếu hệ thống dự đoán đúng số  của bình luận thì được xem là đúng. Các bình luận được chúng tôi tiền xử lý để bỏ qua các bình luận trùng lặp (các bình luận giống nhau của cùng một người dùng, các bình luận không nói đến đặc tính nào hoặc không phát hiện được từ cảm xúc). Ở giai đoạn này, chúng tôi cũng thực hiện bước chuẩn hóa tên sản phẩm về một tên gọi đúng duy nhất. Ví dụ: Iphone 7 plus 64GB và Iphone 7 plus màu táo đỏ sẽ được đưa về cùng một tên là Iphone 7 plus. 4.2. Thực nghiệm Tính khả thi của hệ thống được chúng tôi kiểm định theo 2 kịch bản. Kịch bản 1: kiểm chứng việc phán đoán đúng điểm đánh giá tương ứng với mỗi bình luận. Kịch bản 2: kiểm chứng việc phán đoán quan điểm của khách hàng là tiêu cực, trung tính hay tích cực. Vì điểm bình luận được khách hàng đánh giá từ  đến  nên chúng tôi đề xuất chia điểm đánh giá thành 3 mức:  đến  là tiêu cực, là trung tính và từ  đến  là tích cực. Kết quả kiểm chứng trên 10.000 bình luận về các điện thoại hiện có trên thị trường trong khoảng thời gian từ năm 2017 đến năm 2018 được biểu diễn ở bảng 2. Bảng 2. Kết quả đánh giá hệ thống theo 2 kịch bản Kịch bản Độ chính xác Kịch bản 1 74,59% Kịch bản 2 82,64% Kết quả đạt được là rất khả quan nếu như đối chiếu với kết quả của các công trình nghiên cứu khác, mặc dù nghiên cứu của chúng tôi không được kiểm chứng trên cùng một tập dữ liệu vì lý do ngôn ngữ của bình luận, nhưng cũng phần nào cho thấy tính hợp lý của mô hình mà chúng tôi đề xuất. Chẳng hạn như theo công bố của tác giả Bauman và cộng sự [24] thì kết quả dự đoán đúng điểm xếp hạng của khách hàng là vào khoảng 82%. Mặc dù kết quả
  7. Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 197 kiểm chứng đã đáp ứng được kỳ vọng của chúng tôi đề ra, tuy nhiên vẫn có một số vấn đề tồn tại trong thực tế mà hệ thống vẫn chưa giải quyết được một cách triệt để. Thứ nhất đó là vấn đề sử dụng từ trong câu bình luận: từ viết tắt, từ đa nghĩa và các từ mang nghĩa “bóng”. Bảng 3 trình bày một số câu bình luận có chứa từ mà hệ thống chúng tôi đề xuất hiện tại chưa xử lý được. Bảng 3. Một số bình luận hệ thống không thể xử lý Tên sản phẩm Bình luận Điểm đánh giá Lý do (số ) Asus_Zenfone 4 Max_Pro camera 16 m nhưng chỉ 5 Kí tự „k‟ có thể diễn tả cho (No.00393814) tiếc màn hình hd nên hình 1000 trong tiếng Việt không ảnh cũng k đc đẹp cho lắm chính thống, cũng có thể là từ viết tắt cho chữ “không”, “khó”. Chuỗi “đc” có thể là từ viết tắt cho chữ “được” hoặc “địa chỉ”. Asus_Zenfone 4 Max_Pro ok đáng đồng tiền bát gạo 4 Hệ thống không nhận dạng (No.00393814) được ngữ “đáng đồng tiền bát gạo”. Vấn đề thứ hai cũng ảnh hưởng nhiều đến độ chính xác đó là yếu tố con người trong việc cho điểm đánh giá. Ở đây chúng tôi muốn nói đến cách cho điểm đánh giá của các người dùng khác nhau là rất khác nhau. Ví dụ như câu bình luận có ý nói sản phẩm chất lượng trung bình nhưng điểm đánh giá lại được 5 sao trong khi một số bình luận có quan điểm tiêu cực nhưng cũng có điểm đánh giá là 4 sao. Bảng 4 minh họa cho một số trường hợp bình luận và điểm đánh giá không tương ứng. Bảng 4. Một số bình luận và điểm đánh giá không tương xứng Sản phẩm Bình luận Đánh giá Asus_Zenfone 4 Max_Pro (No.00393814) Máy sử dụng ổn 3 Asus_Zenfone 4 Max (No.00415196) Chụp hình ổn 5 Asus_Zenfone 4 Max_Pro (No.00393814) Máy hơi dày và nặng 4 Nokia 3310 (No.00349644) Tuy nhiên đồ làm bằng nhựa bóng nên cầm hơi trơn 4 tay. V. KẾT LUẬN Trong bài báo này chúng tôi đã đề xuất giải pháp xây dựng hệ thống gợi ý sản phẩm theo tính năng dựa trên việc thu thập và phân tích quan điểm của khách hàng về nhóm sản phẩm tương ứng. Giải pháp mà chúng tôi xây dựng có đồng thời 2 ưu điểm so với những hệ thống gợi ý khác: 1- Sản phẩm được gợi ý theo tính năng nên sẽ phù hợp hơn với yêu cầu của người dùng. Đặc biệt là đối với các nhóm sản phẩm/dịch vụ có nhiều tính năng, khía cạnh khác nhau. Sản phẩm được gợi ý sẽ có tính năng người dùng mong muốn tìm kiếm là tốt nhất dựa trên quan điểm của những khách hàng đã sử dụng sản phẩm/dịch vụ đó. 2- Hệ thống thể hiện được xu hướng tiêu dùng của khách hàng theo thời gian. Hệ thống đề xuất đã được thực nghiệm trên tập dữ liệu bao gồm gần 15.000 bình luận về các sản phẩm điện thoại thông minh trong đó 1/3 được dùng làm tập dữ liệu huấn luyện và 2/3 dùng làm tập dữ liệu kiểm thử. Hai kịch bản thực nghiệm được đề xuất và cho kết quả khả quan, đặc biệt là đối với các bình luận bằng ngôn ngữ tiếng Việt, ngôn ngữ chưa có các công cụ phân tích văn phạm chuẩn xác. Chúng tôi cũng phân tích và đánh giá những vấn đề còn tồn tại mà hệ thống chưa giải quyết được đó là yếu tố con người trong việc sử dụng từ ngữ cũng như trong việc đưa ra điểm đánh giá. Bên cạnh đó chúng tôi cũng nghĩ rằng quan điểm của người dùng trong bình luận sẽ được phán đoán chính xác hơn nếu như các từ cảm xúc không được xử lý một cách riêng lẻ mà kết hợp với tính năng của sản phẩm. Ví dụ thuật ngữ “pin trâu” nếu được xử lý cùng nhau sẽ có được quan điểm rất tích cực cho tính năng dung lượng pin của điện thoại, trong khi xử lý riêng lẻ thì thuật ngữ này sẽ bị bỏ qua. Đây cũng là hướng nghiên cứu mà chúng tôi nhắm đến trong các nghiên cứu tiếp theo. VI. TÀI LIỆU THAM KHẢO [1] Hu R, Pu P. Potential acceptance issues of personality-ASED recommender systems. In: Proceedings of ACM conference on recommender systems (RecSys‟09), New York City, NY, USA; October 2009. p. 22–5.
  8. 198 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG [2] Pu P, Chen L, Hu R. A user-centric evaluation framework for recommender systems. In: Proceedings of the fifth ACM conference on Recommender Systems (RecSys‟11), ACM, New York, NY, USA; 2011. p. 57–164. [3] Pilaszy I., & Tikk D. (2009). Recommending new movies: Even a few ratings are more valuable than metadata. In Proceedings of the Third ACM Conference on Recommender Systems (RecSys 2009), (p. 93-100). NY, ACM. [4] Wei R., Xu H. A Formal Cost-Effectiveness Analysis Model for Product Evaluation in E-Commerce. In: SEKE, p. 287–293, 2013. [5] Esuli A, Sebastiani F. Sentiwordnet: A Publicly Available Lexical Resource for Opinion Mining. In: Proceedings of the 5th Conference on Language Resources and Evaluation, p. 417-412, 2006. [6] Baccianella S., A. Esuli, and F. Sebastiani. SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining. In: Proceedings of the International Conference on Language Resources and Evaluation, p.17-23, 2010. [7] Nguyen H. N., et al. Domain Specific Sentiment Dictionary for Opinion Mining of Vietnamese Text. In: Proceedings of the 8th International Workshop on Multidisciplinary Trends in Artificial Intelligence, p.136-148. [8] Nitin Jindal and Bing Liu. 2006. Identifying comparative sentences in text documents. In Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval (SIGIR '06). ACM, New York, NY, USA, 244-251. [9] Yue Lu, ChengXiang Zhai, and Neel Sundaresan. Rated aspect summarization of short comments. In: Proceedings of the 18th international conference on World wide web, pp. 131–140, 2009. [10] Samuel Brody and Noemie Elhadad. An unsupervised aspect-sentiment model for online reviews. In: Proceeding HLT ‟10 Human Language Technologies: The 2010 Annual Conference of the North American, Chapter of the Association for Computational Linguistics, pp. 804–812, 2010. [11] C. Sauper, Aria Haghighi, and Regina Barzilay. Content Models with Attitude. In: Proceeding HLT ‟11 Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies - Volume 1, pp. 350–358. [12] Christina Sauper and Regina Barzilay. Automatic Aggregation by Joint Modeling of Aspects and Values. Journal of Artificial Intelligence Research, Volume 46, pp. 89-127, 2013. [13] Himabindu Lakkaraju, Chiranjib Bhattacharyya, Srujana Merugu, and Indrajit Bhattacharya. Exploiting Coherence for the Simultaneous Discovery of Latent Facets and associated Sentiments. In: Proceedings of the Eleventh SIAM International Conference on Data Mining, SDM 2011, p. 498–509. [14] Angeliki Lazaridou, Ivan Titov, and Caroline Sporleder. A Bayesian Model for Joint Unsupervised Induction of Sentiment, Aspect and Discourse Representations. In: Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, ACL 2013, p. pages 1630–1639. [15] M. Baumgarten, M. D. Mulvenna, N. Rooney, and J. Reid. 2013. Keyword-Based Sentiment Mining using Twitter. Int. J. Ambient Comput. Intell. 5, 2 (April 2013), 56-69. [16] Lucie Flekov, Oliver Ferschk and Iryna Gurevych. UKPDIPF: A Lexical Semantic Approach to Sentiment Polarity Prediction in Twitter Data. In: Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), Dublin, Ireland, pp. 704-710, 23-24 August (2014). [17] W. Y. Wang and D. Yang. 2015. That‟s so annoying!!!: A lexical and frame-semantic embedding based data augmentation approach to automatic categorization of annoying behaviors using #petpeeve tweets. In Empirical Methods in Natural Language Processing (EMNLP). [18] Le B., Nguyen H. (2015) Twitter Sentiment Analysis Using Machine Learning Techniques. In: Le Thi H., Nguyen N., Do T. (eds) Advanced Computational Methods for Knowledge Engineering. Advances in Intelligent Systems and Computing, vol 358. Springer, Cham. [19] Aliaksei Severyn and Alessandro Moschitti. 2015. Twitter Sentiment Analysis with Deep Convolutional Neural Networks. In Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR '15). ACM, New York, NY, USA, 959-962. [20] A. C. Pandey, D. S. Rajpoot, M. Saraswat. Twitter sentiment analysis using hybrid cuckoo search method. Information Processing & Management, vol. 53, no. 4, pp. 764-779, 2017. [21] F. Balage, P. Pedro and T. A. S. Pardo. NILC-USP: A Hybrid System for Sentiment Analysis in Twitter Messages. In: Proceedings of the Seventh International Workshop on Semantic Evaluation (SemEval 2013), Georgia, 2013, pp. 568-572. [22] T. L. Griffiths and M. Steyvers. Finding scientific topics. Proceedings of the National Academy of Sciences of the United States of America, 101(Suppl 1):5228--5235, 2004. [23] P. Le-Hong. An empirical study of maximum entropy approach for part-of-speech tagging of Vietnamese texts. In: Proceedings of Traitement Automatique des Langues Naturelles (TALN-2010), Montreal, Canada, 2010.
  9. Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 199 [24] Konstantin Bauman, Bing Liu, and Alexander Tuzhilin. 2017. Aspect Based Recommendations: Recommending Items with the Most Valuable Aspects Based on User Reviews. In Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '17). ACM, New York, NY, USA, 717-725. DOI: https://doi.org/10.1145/3097983.3098170. PRODUCT RECOMMENDATION SYSTEM BASED ON CUSTOMER REVIEWS ANALYSIS Tran Thi Thuy, Truong Quoc Dinh, Nguyen Van Tho, Huynh Trung Long ABSTRACT: Nowadays, many e-commerce websites implement recommendation function which is based on customer reviews/feedbacks analysis. The majority of these systems make the suggestions by using only the overall product ratings. By using this approach, systems may suggest products that are not relevant to the customer needs, especially in the case that they take into account only several product features. To deal with this problem, in this paper, we propose construct a feature-based recommendation system. The proposed system will collect customer reviews/feedbacks concerning given product and then uses natural language processing techniques to discover customer opinion. Experimental results conducted on 10.000 Vietnamese smartphone reviews show the feasibility of proposed system.
nguon tai.lieu . vn