Xem mẫu
- Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018
DOI: 10.15625/vap.2018.00025
GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG
Trần Thị Thúy1, Trương Quốc Định2, Nguyễn Văn Thọ3, Huỳnh Trung Long4
1
Khoa Kỹ thuật Công nghệ, Trường Đại học Cửu Long
2
Khoa Công nghệ Thông tin & Truyền thông, Trường Đại học Cần Thơ
3
Trung tâm Y tế quận Bình Thủy, TP Cần Thơ
4
Sở Thông tin Truyền thông thành phố Cần Thơ
tranthithuy@mku.edu.vn, tqdinh@cit.ctu.edu.vn, nguyenthoytct@gmail.com, trunglong159753@gmail.com
TÓM TẮT: Hiện nay, khai thác quan điểm của khách hàng thông qua các bình luận, phản hồi đang được ứng dụng ngày càng nhiều
trong các hệ thống gợi ý, đặc biệt là các trang web thương mại điện tử. Phần lớn các hệ thống hiện tại chỉ đưa ra gợi ý dựa trên ước
đoán điểm đánh giá tổng thể của sản phẩm mà chưa chú trọng đến điểm từng tính năng của sản phẩm. Hướng tiếp cận này có thể sẽ
gợi ý các sản phẩm chưa đúng với nhu cầu của khách hàng trong trường hợp họ quan tâm tới chi tiết tính năng của sản phẩm. Để giải
quyết vấn đề nêu trên, trong bài báo này, chúng tôi đề xuất giải pháp gợi ý sản phẩm dựa trên tính năng. Hệ thống sẽ thu thập ý
kiến/bình luận của khách hàng về các nhóm sản phẩm cần gợi ý, sử dụng các kỹ thuật của lĩnh vực khai phá quan điểm để xác định
được quan điểm của khách hàng. Mỗi bình luận của khách hàng sẽ được hệ thống xử lý để thu được các thông tin: tên sản phẩm, tính
năng, quan điểm (xấu, bình thường, tốt) phục vụ xây dựng CSDL cho bước gợi ý. Kết quả thực nghiệm trên nhóm sản phẩm điện thoại
di động với hơn 10000 bình luận tiếng Việt đã khẳng định tính khả thi của giải pháp mà chúng tôi đề xuất.
Từ khóa: Hệ thống gợi ý, bình luận, quan điểm, khai phá quan điểm.
I. GIỚI THIỆU
Trong thời đại bùng nổ của thông tin cùng với sự gia tăng về số lượng của các thiết bị có khả năng kết nối và
duyệt web hiện nay thì việc xây dựng các hệ thống gợi ý (Recommender Systems) là một việc hết sức cần thiết. Mục
đích của hệ thống gợi ý là hỗ trợ người dùng (users) tìm kiếm được đúng thông tin cần thiết bằng cách dự đoán sở thích
(preferences) hay xếp hạng (rating) mà người dùng có thể dành cho một đối tượng thông tin (item) nào đó mà họ chưa
xem xét tới trong quá khứ. Hệ thống gợi ý được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau như: lĩnh vực giải trí
(gợi ý bài hát - LastFM - www.last.fm, gợi ý phim - LastFM - www.last.fm), lĩnh vực học thuật (gợi ý bài báo –
ResearchGate – www.researchgate.net) và đặc biệt là lĩnh vực thương mại điện tử (Amazon – www.amazon.com). Đối
với lĩnh vực thương mại điện tử, hệ thống gợi ý giúp người dùng giảm “chi phí giao dịch” bằng cách hỗ trợ tìm và chọn
lựa sản phẩm phù hợp với nhu cầu [1], giúp người kinh doanh tăng lợi nhuận vì bán được nhiều sản phẩm hơn [2].
Các hệ thống gợi ý có thể được phân thành 2 dạng chính đó là dự đoán xếp hạng (rating prediction) tức là dự
đoán giá trị xếp hạng mà một người dùng đánh giá cho một mục tin nào đó và dự đoán mục tin (item prediction) nghĩa
là ước lượng xác suất người dùng thích một mục tin nào đó [3]. Trong lĩnh vực thương mại điện tử, với các hệ thống
cho phép người dùng phản hồi một cách tường minh thông qua việc xếp hạng (ví dụ đưa ra điểm đánh giá từ đến
) thì sản phẩm gợi ý là sản phẩm được dự đoán có điểm xếp hạng cao nhất. Hiện nay nhiều trang web
thương mại điện tử đã phát triển các hệ thống đánh giá thông qua các cơ chế sao giá trung bình cho sản phẩm để giúp
khách hàng ra quyết định khi mua hàng. Tuy nhiên, việc đánh giá một cách tổng quan như vậy là chưa đủ độ tin cậy và
chưa hẳn đã phản ánh chất lượng thực tế của sản phẩm, đặc biệt là đối với các nhóm sản phẩm có nhiều tính
năng/thuộc tính khác nhau [4] (ví dụ: một điện thoại được đánh giá chung là tốt thì chưa hẳn đã có dung lượng pin
lớn). Việc gợi ý sản phẩm phù hợp theo một hoặc nhiều tính năng mà người dùng quan tâm dựa trên hướng tiếp cận dự
đoán xếp hạng sẽ luôn là không khả thi cho đến khi các trang web thương mại điện tử hỗ trợ người dùng đánh giá theo
tính năng sản phẩm.
Tuy nhiên trong thời đại mà mạng xã hội phát triển cũng như phần lớn các trang thương mại điện tử cho phép
người dùng đưa ra ý kiến bình luận thì người dùng đã bày tỏ quan điểm của mình một cách rõ ràng và chi tiết hơn về
tính năng của một sản phẩm, ví dụ như: Màn hình hiển thị đẹp và lớn. Bình luận trở thành công cụ đắc lực để khách
hàng phản ánh ý kiến của mình về sản phẩm cũng như dịch vụ. Thực tế, khách hàng đã ngày càng có nhiều quyền lực
hơn trong mối quan hệ nhà sản xuất – khách hàng. Cuộc khảo sát từ PowerReviews cho kết quả rằng 57% người mua
sắm không những chỉ đọc các đánh giá trực tuyến để có thêm thông tin mà còn thích truy cập vào các trang web thương
mại điện tử cung cấp dịch vụ đánh giá1. Người dùng của các trang thương mại điện tử cũng tin rằng “Những lời đánh
giá phản ánh một phần trải nghiệm khi sử dụng sản phẩm, vì thế, họ sử dụng chúng nhiều hơn”. Như vậy, việc đánh
giá và tổng hợp được quan điểm của khách hàng thông qua các bình luận sẽ cho chúng ta thông tin về sự hài
lòng/không hài lòng của khách hàng đối với tính năng nào đó của một sản phẩm và từ đó có thể giúp đưa ra các gợi ý
phù hợp nhất với yêu cầu của khách hàng.
Trong phạm vi của nghiên cứu này, chúng tôi đặt sự quan tâm đến việc phân tích các ý kiến của khách hàng về
một chức năng cụ thể nào đó của sản phẩm. Dữ liệu đầu vào sẽ là một tập các sản phẩm, tập các tính năng và các tập
1
https://www.retaildive.com/news/the-power-of-online-reviews/368614/
- 192 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG
bình luận tương ứng với mỗi sản phẩm. Với mỗi bình luận của người dùng, chúng tôi sẽ tiến hành trích xuất tính năng,
từ nói lên quan điểm và đồng thời dự đoán điểm đánh giá cho chức năng của sản phẩm.
Phần còn lại của bài báo được tổ chức như sau. Trong phần II chúng tôi sẽ trình bày tổng quan về lĩnh vực khai
phá quan điểm trong bình luận của người dùng/khách hàng. Kiến trúc của hệ thống gợi ý sản phẩm dựa trên phân tích
quan điểm khách hàng được trình bày trong phần III. Phần IV sẽ mô tả kết quả đạt được của mô hình đề xuất dựa trên
dữ liệu thu thập tự động hơn 10.000 bình luận (tiếng Việt) của khách hàng về các sản phẩm thuộc nhóm hàng điện
thoại di động. Kết quả bước đầu cho thấy tính hiệu quả của mô hình mà chúng tôi đề xuất. Phần V sẽ thảo luận một số
ưu nhược điểm của mô hình đề xuất cùng định hướng nghiên cứu trong tương lai.
II. NGHIÊN CỨU LIÊN QUAN
Lĩnh vực khai phá quan điểm trong bình luận của khách hàng thu hút được sự quan tâm của nhiều nhà nghiên cứu
trong và ngoài nước vì tính chất quan trọng cũng như lĩnh vực ứng dụng rộng rãi của nó. Để thực hiện khai phá quan
điểm, rất nhiều nghiên cứu đã bắt đầu từ việc xây dựng từ điển cảm xúc (SentiWordNet). Esuli và cộng sự đã nghiên cứu
xây dựng bộ từ điển cảm xúc cho ngôn ngữ tiếng Anh [5] với các thông tin như từ vựng, điểm số cho quan điểm tích cực
và điểm số cho quan điểm tiêu cực. Từ điển cảm xúc này được xem là bước khởi đầu và cũng là nguồn tài nguyên mở cho
các nghiên cứu khai phá quan điểm ngôn ngữ Anh. Trong một nghiên cứu tương tự [6], Baccianella và các cộng sự đã
trình bày giải pháp xây dựng từ điển cảm xúc phiên bản 3.0 (SentiWordNet 3.0 – http://sentiwordnet.isti.cnr.it/). Đây được
xem là phiên bản nâng cấp của SentiWordNet 1.0, tuy nhiên số lượng từ vựng vẫn chưa đầy đủ và chưa thể bao phủ hết tất
cả các miền ngữ nghĩa. Từ điển cảm xúc tiếng Việt cũng nhận được sự quan tâm của nhiều nhà nghiên cứu trong nước,
nổi bật là công trình của tác giả Nguyễn Hồng Nam và các cộng sự [7] với kết quả sau cùng là bộ từ điển cảm xúc tiếng
Việt VietSentiWordNet (https://github.com/sonvx/VietSentiWordNet). Các tác giả ban đầu đã thực hiện dịch các từ có từ
loại là tính từ, trạng từ và động từ thuộc từ điển SentiWordNet 3.0 sang tiếng Việt, sử dụng từ điển Anh –Việt, từ điển
tiếng Việt để lọc nhiễu.
Ở khía cạnh khai phá quan điểm, các nghiên cứu có thể được chia thành 2 dạng bài toán lớn đó là xác định quan
điểm trong câu có tính chất so sánh (liên quan đến nhiều đối tượng) và rút trích quan điểm chỉ liên quan đến 1 đối
tượng. Có không nhiều công trình mà đối tượng nghiên cứu là câu bình luận có tính chất so sánh. Một trong số đó
Jindal và Liu [8] hướng nghiên cứu của mình đến việc xác định quan điểm trong các câu bình luận có tính chất so sánh.
Các tác giả đã đề xuất phương pháp học có giám sát để xác định các câu dạng so sánh, đưa ra các luật để xác định các
đối tượng cũng như quan điểm so sánh, kết quả bước đầu cho thấy tính khả thi của giải pháp đề xuất.
Rút trích quan điểm trong câu bình luận chỉ liên quan đến 1 đối tượng có thể được thực hiện ở mức đoạn hoặc
mức câu. Yue Lu [9] giải quyết vấn đề xác định quan điểm như chức năng tóm tắt của một bình luận ngắn. Văn bản
đầu tiên được tiền xử lý thành các đoạn theo định dạng , với headterm là các tên nhóm
theo cấu trúc PLSA (Probability Latent Semantic Analysis). Sau đó, việc đánh giá những đoạn văn được phán đoán bởi
dự đoán cục bộ hoặc phán đoán toàn cục. Chúng được tổng hợp để có được đánh giá chức năng. Brody và Elhadad [10]
sử dụng mô hình chủ đề (topic model) để tìm các tính năng. Sau đó, với mỗi tính năng, tiến hành trích xuất toàn bộ các
tính từ thích hợp và xây dựng sơ đồ liên kết. Một giải thuật lan truyền nhãn được sử dụng trên sơ đồ để học các điểm
phân cực cảm xúc của các tính từ đó.
Mô hình của Sauper [11], Sauper và Bazilay [12] không sử dụng đoạn mà thay vào đó là “snippets” và một
snippet là một câu ngắn hay một đoạn ngắn. Tuy nhiên, vấn đề hiệu chỉnh nhãn cảm xúc không được giải quyết tốt
trong mô hình này. Mô hình dùng seed word để xác định bất đối xứng trước nhưng nó chỉ hỗ trợ hai loại cảm xúc: tích
cực và tiêu cực trong khi cách xác định bất đối xứng cho nhiều loại cảm xúc không rõ ràng.
Lakkaraju [13] thử giải quyết vấn đề đặt nhãn cảm xúc bằng cách giả thiết rằng toàn bộ đánh giá được sinh ra như
một biến trả về và sự đối xứng của các chủ đề cảm xúc xem như là những đặc trưng. Tuy nhiên, cách mà các nhãn cảm
xúc liên kết với các đánh giá vẫn không biết được cho đến lúc được học. Lazaridou [14] cố gắng liên kết các nhãn cảm
xúc với đánh giá bằng ký hiệu Kronecker và áp dụng được cho 3 loại cảm xúc: tích cực, trung lập và tiêu cực. Tuy nhiên
phương pháp này không xây dựng hay xác định các từ cảm xúc, nguồn tri thức quan trọng phục vụ đánh giá quan điểm.
Baumgarten cùng các cộng sự trong nghiên cứu [15] tập trung xác định tập từ khóa giúp phân loại và rút trích
quan điểm. Các từ khóa sẽ được sử dụng để phân lớp các thông điệp ngắn (short message), loại thông điệp chủ yếu
xuất hiện trên các trang mạng xã hội và từ đó xác định được quan điểm tiềm ẩn trong các thông điệp. Đóng góp chính
của nghiên cứu là xây dựng được tập từ khóa giúp xác định quan điểm của các bình luận cũng như là một tham khảo
tốt cho các nghiên cứu tương tự về sau.
Mạng xã hội là nơi nhiều người dùng bày tỏ quan điểm của mình về các vấn đề nóng và thời sự đang diễn ra.
Đặc thù của các bình luận trên mạng xã hội là ngắn và chứa nhiều từ “lóng” vì thế việc xác định quan điểm dựa vào các
bình luận trên mạng xã hội đòi hỏi các cách tiếp cận đặc thù. Các hướng tiếp cận chính cho lớp bài toán này đó là: kỹ
thuật phân tích từ vựng (lexical analysis) [16, 17], kỹ thuật máy học (machine learning based analysis) [18, 19] và các
kỹ thuật lai (hybrid analysis) [20, 21]. Trong các hướng tiếp cận trên thì kỹ thuật dựa trên máy học cho kết quả tốt nhất
mặc dù đòi hỏi phải có một tập dữ liệu huấn luyện đủ lớn trong khi hướng tiếp cận phân tích từ vựng lại không yêu cầu
bất kỳ tri thức sẵn có nào. Dù theo cách tiếp cận nào đi nữa thì tính chính xác của mô hình đề xuất cũng luôn thay đổi
theo miền ứng dụng.
- Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 193
Các nghiên cứu nói trên đều ít nhiều có những mặt chưa tối ưu và đều thực hiện trên tập dữ liệu tiếng nước
ngoài vốn đã được phân tích và xây dựng cấu trúc ngữ pháp chặt chẽ cùng ưu điểm có các bộ từ điển cảm xúc đi kèm.
Vấn đề khai phá quan điểm trong ý kiến/bình luận tiếng Việt và ứng dụng vào bài toán gợi ý sản phẩm, đặc biệt là gợi
ý sản phẩm theo tính năng thì chưa được nghiên cứu và công bố nhiều tại Việt Nam. Chính vì lẽ đó, trong bài báo này,
chúng tôi nhắm đến xây dựng hệ thống gợi ý sản phẩm theo tính năng dựa trên kỹ thuật khai phá quan điểm bình luận
trên các website thương mại điện tử.
III. MÔ HÌNH ĐỀ XUẤT
Bài toán chúng tôi nhắm đến giải quyết trong nghiên cứu này đó là đưa ra sản phẩm gợi ý theo tính năng mà
người dùng quan tâm, ví dụ như: tìm điện thoại có màn hình được đánh giá là tốt nhất thì hệ thống sẽ gợi ý là Samsung
galaxy S8 hoặc nếu tìm điện thoại có pin dùng được trong khoảng thời gian dài thì hệ thống có thể sẽ gợi ý là Nokia 5.
Để có thể đưa ra những gợi ý thuộc dạng vừa nêu, chúng tôi cần xây dựng CSDL gợi ý, CSDL này sẽ bao gồm nhiều
mục tin, mỗi mục tin có cấu trúc như sau: , , . Kiến trúc của hệ
thống cho phép xây dựng CSDL gợi ý được giới thiệu trong hình 1 và kiến trúc của hệ thống gợi ý sản phẩm được thể
hiện trong hình 2.
Bộ thu thập dữ liệu Tiền xử lý
Dữ liệu xây dựng dữ liệu Tập các bình luận
CSDL gợi ý phù hợp
Dữ liệu Bình luận 1 Bình luận 2 Bình luận n
huấn luyện
Xác định Xác định Xác định
tính năng tính năng tính năng
Mô hình chủ đề
cho tính năng Xác định từ chỉ Xác định từ chỉ Xác định từ chỉ
cảm xúc cảm xúc cảm xúc
Từ điển Phán đoán Phán đoán Phán đoán
cảm xúc quan điểm quan điểm quan điểm
TỔNG HỢP ĐIỂM TÍNH NĂNG THEO SẢN PHẨM
CSDL GỢI Ý
Hình 1. Kiến trúc hệ thống xây dựng cơ sở dữ liệu gợi ý
Danh sách Lọc dữ liệu theo
tính năng tính năng CSDL GỢI Ý
quan tâm
Tổng hợp và tính điểm
cho từng sản phẩm
Danh sách
sản phẩm Chọn 10 sản phẩm
gợi ý tốt nhất
Hình 2. Kiến trúc hệ thống gợi ý sản phẩm theo tính năng
- 194 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG
3.1. Hệ thống xây dựng CSDL gợi ý
1. Môđun lấy dữ liệu
Cho phép thu thập dữ liệu là các bình luận từ các trang web thương mại điện tử có cung cấp chức năng bình
luận (ví dụ http://fptshop.com, http://www.thegioididong.com…) liên quan đến nhóm sản phẩm cần gợi ý. Dữ liệu thu
thập được, cho một nhóm sản phẩm, sẽ được phân chia một cách ngẫu nhiên thành 2 tập dữ liệu: tập dữ liệu huấn luyện
và tập dữ liệu xây dựng CSDL gợi ý. Tập dữ liệu huấn luyện sẽ được dùng để xây dựng mô hình chủ đề cho các tính
năng của sản phẩm cùng với từ điển cảm xúc. Tập dữ liệu xây dựng CSDL gợi ý sẽ được dùng để tính được điểm tính
năng cho mỗi một sản phẩm. Bên cạnh việc thu thập dữ liệu là các bình luận thì chúng tôi cũng thu thập kèm theo điểm
đánh giá (số ) mà người dùng đã đánh giá cho sản phẩm tương ứng đi kèm theo bình luận đó.
2. Môđun xây dựng mô hình chủ đề cho tính năng
Để xác định được câu bình luận của người dùng là nêu quan điểm về chức năng nào của sản phẩm thì chúng tôi
cần thiết phải xây dựng được mô hình chủ đề (topic model) cho tính năng. Mô hình chủ đề được Griffiths và Steyvers
đề xuất lần đầu tiên vào năm 2004 [22]. Một cách tổng quát, mô hình chủ đề được xem như là một mô hình thống kê
cho phép khám phá các chủ đề “trừu tượng” tiềm ẩn bên trong một tập tài liệu (collection of documents). Trong ngữ
cảnh của hệ thống mà chúng tôi xây dựng, mô hình chủ đề cho tính năng được hiểu đơn giản đó là danh sách các từ
khóa đại diện cho một tính năng, nghĩa là khi đề cập đến 1 từ khóa nào đó thì chúng ta biết được đang nói đến tính
năng nào của sản phẩm. Bảng 1 minh họa cho danh sách các từ khóa đại diện cho một số tính năng của điện thoại.
Bảng 1. Mô hình chủ đề cho một số tính năng của điện thoại
Tính năng Danh sách từ khóa đại diện
Màn hình Màn hình, display, screen, hiển thị
Bộ nhớ trong Bộ nhớ trong, bộ nhớ, ROM
Quá trình tạo lập từ khóa đại diện cho một tính năng được tóm lược qua các bước chính như sau:
Duyệt qua bình luận có nhãn chủ đề là tính năng nào đó của sản phẩm. Với mỗi bình luận, sử dụng công cụ
vnTagger [23] để tách từ và gán từ loại. Các từ khóa có nhãn là danh từ chung sẽ được giữ lại xem như là từ
khóa đại diện cho tính năng của sản phẩm.
Tổng hợp danh sách các từ khóa được trả về ở bước 1, trong đó mỗi từ khóa sẽ có thêm thông tin đó là số lượt
mà từ khóa đó được trả về. Các từ khóa được xếp theo thứ tự giảm dần của số lượt trả về.
Trả về N từ khóa đầu danh sách có được ở bước 2 như là N từ khóa đại diện cho mỗi tính năng của sản phẩm.
3. Môđun xây dựng từ điển cảm xúc
Bắt đầu
Đọc câu bình luận
cùng điểm đánh giá
Còn bình sai
luận? Kết thúc
đúng
- Đọc số lượt xuất hiện của từ cảm xúc k: fk
Tách từ, xác định bộ bốn
- Đọc điểm đánh giá hiện tại của từ cảm xúc k: sk
(Sản phẩm i; Tính năng j; Từ cảm xúc k; Điểm -d)
- Tính điểm đánh giá mới: sknew = (sk * fk + d) /(fk+1)
Cập nhật điểm đánh giá
sknew cho từ cảm xúc k
Hình 3. Giải thuật xây dựng từ điển cảm xúc
Như đã đề cập ở phần trên, để có thể đưa ra gợi ý sản phẩm theo tính năng mà người dùng quan tâm, hệ thống
cần có dữ liệu dạng , , . Nguồn thông tin để xây dựng dữ liệu gợi ý
đó là các bình luận cùng với điểm đánh giá (số ) mà người dùng dành cho sản phẩm tương ứng. Tuy nhiên, có một
nhận xét rằng mặc dù điểm đánh giá không tương ứng với tính năng nhưng người dùng cho điểm đánh giá tốt hay
- Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 195
không tốt khi mà người dùng hài lòng hay không hài lòng với một tính năng nào đó được đề cập đến trong bình luận.
Một lý do khác cho việc xây dựng từ điển cảm xúc đó là cách dùng từ để biểu đạt quan điểm của mỗi một người dùng
là khác nhau và đôi khi là cùng từ cảm xúc nhưng điểm đánh giá lại khác nhau. Do vậy, mục tiêu của môđun xây dựng
từ điển cảm xúc, trong ngữ cảnh hệ thống của chúng tôi xây dựng, đó là xác định điểm đánh giá tương ứng với mỗi một
từ cảm xúc (, ). Phương pháp xây dựng từ điển cảm xúc được thể hiện trong hình 3.
4. Môđun xây dựng CSDL gợi ý
Sử dụng tập bình luận thu thập từ các trang mạng xã hội, các trang web thương mại điện tử, với mỗi bình luận,
hệ thống sẽ thực hiện bước tách từ, giữ lại các danh từ riêng, danh từ chung, trạng từ và tính từ. Mô hình chủ đề cho
tính năng được sử dụng để xác thực tính năng mà bình luận đề cập đến. Kết quả của bước phân tích sẽ là bộ ba: , , . Từ điển cảm xúc được sử dụng để xác định điểm đánh giá cho tính năng của câu
bình luận. Điểm đánh giá này được tính vào điểm tổng của tính năng của sản phẩm tương ứng trong CSDL gợi ý. Hình
4 minh họa các bước chính của quy trình xây dựng CSDL gợi ý của hệ thống.
Bắt đầu
Đọc câu bình luận
Còn bình sai
luận? Kết thúc
đúng
Rút trích được bộ 3 sai
?
đúng
- Đọc số lượt xuất hiện của tính năng j của sản phẩm i: fij
Truy xuất điểm đánh giá - Đọc điểm đánh giá hiện tại: sij
của từ cảm xúc k: sk - Tính điểm đánh giá mới: sijnew = (sij * fij + sk) /(fij+1)
Cập nhật điểm đánh giá đọc
sijnew cho tính năng j của
sản phẩm i
CSDL gợi ý
ghi
Hình 4. Các bước xây dựng CSDL gợi ý
Hệ thống thực hiện gợi ý cho người dùng theo 2 cách: theo tính năng và không. Trong trường hợp người dùng
không quan tâm đến 1 tính năng cụ thể nào đó thì hệ thống sẽ thực hiện tính điểm cho sản phẩm theo tổng điểm của các
tính năng. Điểm đánh giá tổng quan cho một sản phẩm được tính theo công thức
∑ trong đó wij là điểm tính năng j của sản phẩm pi.
Trong trường hợp người dùng xác định danh sách các tính năng (theo thứ tự giảm dần của độ ưu tiên), điểm gợi
ý cho mỗi sản phẩm được tính theo công thức
∑ trong đó j là trọng số cho tính năng j tương ứng, trọng số này
được xem là tham số của hệ thống, do người dùng xác lập theo nguyên tắc 1 > 2 > … > m.
Hình 5 minh họa danh mục điện thoại thông minh được hệ thống gợi ý cho người dùng khi người dùng chọn
quan tâm đến các tính năng: màn hình, cảm ứng, thiết kế và camera.
- 196 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG
3.2. Hệ thống gợi ý
Hình 5. Danh mục điện thoại gợi ý khi theo tính năng: màn hình, cảm ứng, thiết kế, camera
IV. THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ
4.1. Dữ liệu thực nghiệm
Chúng tôi thực nghiệm tính khả thi của hệ thống đề xuất dựa trên các bình luận thu thập được từ các trang
thương mại điện tử http://fptshop.com, http://www.thegioididong.com liên quan đến nhóm sản phẩm điện thoại thông
minh. Lý do chúng tôi thực nghiệm trên nhóm sản phẩm này là vì đây là nhóm sản phẩm có số lượt bình luận lớn trên
các trang web bán hàng thương mại điện tử.
Chúng tôi sử dụng công cụ jsoup (https://jsoup.org/) cho việc tải về nội dung trang web dưới dạng mã nguồn
HTML và thực hiện phân tích thẻ HTML để giữ lại các thông tin cần thiết: tên sản phẩm, câu bình luận và mức đánh
giá. Do các website FPT shop và Thế giới di động có số lượng trang rất lớn, nên chúng tôi thiết lập 2 thông số: số sản
phẩm (theo mức độ quan tâm giảm dần) n_sp; số trang bình luận của mỗi sản phẩm n_page. Trong ngữ cảnh của
nghiên cứu này, chúng tôi thiết lập n_sp = 50 và n_page=10 tương ứng.
Tổng số bình luận chúng tôi thu thập được là 14.872 bình luận, trong đó khoảng 1/3 số bình luận (4.872) được
dùng làm tập dữ liệu huấn luyện cho việc xây dựng mô hình chủ đề cho tính năng và từ điển cảm xúc. 10.000 bình luận
còn lại (bao gồm bình luận và số ) được sử dụng để đánh giá tính đúng đắn của mô hình đề xuất. Nếu hệ thống dự
đoán đúng số của bình luận thì được xem là đúng. Các bình luận được chúng tôi tiền xử lý để bỏ qua các bình luận
trùng lặp (các bình luận giống nhau của cùng một người dùng, các bình luận không nói đến đặc tính nào hoặc không
phát hiện được từ cảm xúc). Ở giai đoạn này, chúng tôi cũng thực hiện bước chuẩn hóa tên sản phẩm về một tên gọi
đúng duy nhất. Ví dụ: Iphone 7 plus 64GB và Iphone 7 plus màu táo đỏ sẽ được đưa về cùng một tên là Iphone 7 plus.
4.2. Thực nghiệm
Tính khả thi của hệ thống được chúng tôi kiểm định theo 2 kịch bản. Kịch bản 1: kiểm chứng việc phán đoán
đúng điểm đánh giá tương ứng với mỗi bình luận. Kịch bản 2: kiểm chứng việc phán đoán quan điểm của khách hàng
là tiêu cực, trung tính hay tích cực. Vì điểm bình luận được khách hàng đánh giá từ đến nên chúng tôi đề
xuất chia điểm đánh giá thành 3 mức: đến là tiêu cực, là trung tính và từ đến là tích
cực. Kết quả kiểm chứng trên 10.000 bình luận về các điện thoại hiện có trên thị trường trong khoảng thời gian từ năm
2017 đến năm 2018 được biểu diễn ở bảng 2.
Bảng 2. Kết quả đánh giá hệ thống theo 2 kịch bản
Kịch bản Độ chính xác
Kịch bản 1 74,59%
Kịch bản 2 82,64%
Kết quả đạt được là rất khả quan nếu như đối chiếu với kết quả của các công trình nghiên cứu khác, mặc dù
nghiên cứu của chúng tôi không được kiểm chứng trên cùng một tập dữ liệu vì lý do ngôn ngữ của bình luận, nhưng
cũng phần nào cho thấy tính hợp lý của mô hình mà chúng tôi đề xuất. Chẳng hạn như theo công bố của tác giả
Bauman và cộng sự [24] thì kết quả dự đoán đúng điểm xếp hạng của khách hàng là vào khoảng 82%. Mặc dù kết quả
- Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 197
kiểm chứng đã đáp ứng được kỳ vọng của chúng tôi đề ra, tuy nhiên vẫn có một số vấn đề tồn tại trong thực tế mà hệ
thống vẫn chưa giải quyết được một cách triệt để. Thứ nhất đó là vấn đề sử dụng từ trong câu bình luận: từ viết tắt, từ
đa nghĩa và các từ mang nghĩa “bóng”. Bảng 3 trình bày một số câu bình luận có chứa từ mà hệ thống chúng tôi đề
xuất hiện tại chưa xử lý được.
Bảng 3. Một số bình luận hệ thống không thể xử lý
Tên sản phẩm Bình luận Điểm đánh giá Lý do
(số )
Asus_Zenfone 4 Max_Pro camera 16 m nhưng chỉ 5 Kí tự „k‟ có thể diễn tả cho
(No.00393814) tiếc màn hình hd nên hình 1000 trong tiếng Việt không
ảnh cũng k đc đẹp cho lắm chính thống, cũng có thể là từ
viết tắt cho chữ “không”,
“khó”.
Chuỗi “đc” có thể là từ viết tắt
cho chữ “được” hoặc “địa chỉ”.
Asus_Zenfone 4 Max_Pro ok đáng đồng tiền bát gạo 4 Hệ thống không nhận dạng
(No.00393814) được ngữ “đáng đồng tiền bát
gạo”.
Vấn đề thứ hai cũng ảnh hưởng nhiều đến độ chính xác đó là yếu tố con người trong việc cho điểm đánh giá. Ở
đây chúng tôi muốn nói đến cách cho điểm đánh giá của các người dùng khác nhau là rất khác nhau. Ví dụ như câu
bình luận có ý nói sản phẩm chất lượng trung bình nhưng điểm đánh giá lại được 5 sao trong khi một số bình luận có
quan điểm tiêu cực nhưng cũng có điểm đánh giá là 4 sao. Bảng 4 minh họa cho một số trường hợp bình luận và điểm
đánh giá không tương ứng.
Bảng 4. Một số bình luận và điểm đánh giá không tương xứng
Sản phẩm Bình luận Đánh giá
Asus_Zenfone 4 Max_Pro (No.00393814) Máy sử dụng ổn 3
Asus_Zenfone 4 Max (No.00415196) Chụp hình ổn 5
Asus_Zenfone 4 Max_Pro (No.00393814) Máy hơi dày và nặng 4
Nokia 3310 (No.00349644) Tuy nhiên đồ làm bằng nhựa bóng nên cầm hơi trơn 4
tay.
V. KẾT LUẬN
Trong bài báo này chúng tôi đã đề xuất giải pháp xây dựng hệ thống gợi ý sản phẩm theo tính năng dựa trên
việc thu thập và phân tích quan điểm của khách hàng về nhóm sản phẩm tương ứng. Giải pháp mà chúng tôi xây dựng
có đồng thời 2 ưu điểm so với những hệ thống gợi ý khác: 1- Sản phẩm được gợi ý theo tính năng nên sẽ phù hợp hơn
với yêu cầu của người dùng. Đặc biệt là đối với các nhóm sản phẩm/dịch vụ có nhiều tính năng, khía cạnh khác nhau.
Sản phẩm được gợi ý sẽ có tính năng người dùng mong muốn tìm kiếm là tốt nhất dựa trên quan điểm của những khách
hàng đã sử dụng sản phẩm/dịch vụ đó. 2- Hệ thống thể hiện được xu hướng tiêu dùng của khách hàng theo thời gian.
Hệ thống đề xuất đã được thực nghiệm trên tập dữ liệu bao gồm gần 15.000 bình luận về các sản phẩm điện
thoại thông minh trong đó 1/3 được dùng làm tập dữ liệu huấn luyện và 2/3 dùng làm tập dữ liệu kiểm thử. Hai kịch
bản thực nghiệm được đề xuất và cho kết quả khả quan, đặc biệt là đối với các bình luận bằng ngôn ngữ tiếng Việt,
ngôn ngữ chưa có các công cụ phân tích văn phạm chuẩn xác.
Chúng tôi cũng phân tích và đánh giá những vấn đề còn tồn tại mà hệ thống chưa giải quyết được đó là yếu tố
con người trong việc sử dụng từ ngữ cũng như trong việc đưa ra điểm đánh giá. Bên cạnh đó chúng tôi cũng nghĩ rằng
quan điểm của người dùng trong bình luận sẽ được phán đoán chính xác hơn nếu như các từ cảm xúc không được xử lý
một cách riêng lẻ mà kết hợp với tính năng của sản phẩm. Ví dụ thuật ngữ “pin trâu” nếu được xử lý cùng nhau sẽ có
được quan điểm rất tích cực cho tính năng dung lượng pin của điện thoại, trong khi xử lý riêng lẻ thì thuật ngữ này sẽ
bị bỏ qua. Đây cũng là hướng nghiên cứu mà chúng tôi nhắm đến trong các nghiên cứu tiếp theo.
VI. TÀI LIỆU THAM KHẢO
[1] Hu R, Pu P. Potential acceptance issues of personality-ASED recommender systems. In: Proceedings of ACM
conference on recommender systems (RecSys‟09), New York City, NY, USA; October 2009. p. 22–5.
- 198 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG
[2] Pu P, Chen L, Hu R. A user-centric evaluation framework for recommender systems. In: Proceedings of the fifth
ACM conference on Recommender Systems (RecSys‟11), ACM, New York, NY, USA; 2011. p. 57–164.
[3] Pilaszy I., & Tikk D. (2009). Recommending new movies: Even a few ratings are more valuable than metadata. In
Proceedings of the Third ACM Conference on Recommender Systems (RecSys 2009), (p. 93-100). NY, ACM.
[4] Wei R., Xu H. A Formal Cost-Effectiveness Analysis Model for Product Evaluation in E-Commerce. In: SEKE, p.
287–293, 2013.
[5] Esuli A, Sebastiani F. Sentiwordnet: A Publicly Available Lexical Resource for Opinion Mining. In: Proceedings
of the 5th Conference on Language Resources and Evaluation, p. 417-412, 2006.
[6] Baccianella S., A. Esuli, and F. Sebastiani. SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment
Analysis and Opinion Mining. In: Proceedings of the International Conference on Language Resources and
Evaluation, p.17-23, 2010.
[7] Nguyen H. N., et al. Domain Specific Sentiment Dictionary for Opinion Mining of Vietnamese Text. In:
Proceedings of the 8th International Workshop on Multidisciplinary Trends in Artificial Intelligence, p.136-148.
[8] Nitin Jindal and Bing Liu. 2006. Identifying comparative sentences in text documents. In Proceedings of the 29th
annual international ACM SIGIR conference on Research and development in information retrieval (SIGIR '06).
ACM, New York, NY, USA, 244-251.
[9] Yue Lu, ChengXiang Zhai, and Neel Sundaresan. Rated aspect summarization of short comments. In: Proceedings
of the 18th international conference on World wide web, pp. 131–140, 2009.
[10] Samuel Brody and Noemie Elhadad. An unsupervised aspect-sentiment model for online reviews. In: Proceeding
HLT ‟10 Human Language Technologies: The 2010 Annual Conference of the North American, Chapter of the
Association for Computational Linguistics, pp. 804–812, 2010.
[11] C. Sauper, Aria Haghighi, and Regina Barzilay. Content Models with Attitude. In: Proceeding HLT ‟11
Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language
Technologies - Volume 1, pp. 350–358.
[12] Christina Sauper and Regina Barzilay. Automatic Aggregation by Joint Modeling of Aspects and Values. Journal
of Artificial Intelligence Research, Volume 46, pp. 89-127, 2013.
[13] Himabindu Lakkaraju, Chiranjib Bhattacharyya, Srujana Merugu, and Indrajit Bhattacharya. Exploiting
Coherence for the Simultaneous Discovery of Latent Facets and associated Sentiments. In: Proceedings of the
Eleventh SIAM International Conference on Data Mining, SDM 2011, p. 498–509.
[14] Angeliki Lazaridou, Ivan Titov, and Caroline Sporleder. A Bayesian Model for Joint Unsupervised Induction of
Sentiment, Aspect and Discourse Representations. In: Proceedings of the 51st Annual Meeting of the Association
for Computational Linguistics, ACL 2013, p. pages 1630–1639.
[15] M. Baumgarten, M. D. Mulvenna, N. Rooney, and J. Reid. 2013. Keyword-Based Sentiment Mining using
Twitter. Int. J. Ambient Comput. Intell. 5, 2 (April 2013), 56-69.
[16] Lucie Flekov, Oliver Ferschk and Iryna Gurevych. UKPDIPF: A Lexical Semantic Approach to Sentiment
Polarity Prediction in Twitter Data. In: Proceedings of the 8th International Workshop on Semantic Evaluation
(SemEval 2014), Dublin, Ireland, pp. 704-710, 23-24 August (2014).
[17] W. Y. Wang and D. Yang. 2015. That‟s so annoying!!!: A lexical and frame-semantic embedding based data
augmentation approach to automatic categorization of annoying behaviors using #petpeeve tweets. In Empirical
Methods in Natural Language Processing (EMNLP).
[18] Le B., Nguyen H. (2015) Twitter Sentiment Analysis Using Machine Learning Techniques. In: Le Thi H.,
Nguyen N., Do T. (eds) Advanced Computational Methods for Knowledge Engineering. Advances in Intelligent
Systems and Computing, vol 358. Springer, Cham.
[19] Aliaksei Severyn and Alessandro Moschitti. 2015. Twitter Sentiment Analysis with Deep Convolutional Neural
Networks. In Proceedings of the 38th International ACM SIGIR Conference on Research and Development in
Information Retrieval (SIGIR '15). ACM, New York, NY, USA, 959-962.
[20] A. C. Pandey, D. S. Rajpoot, M. Saraswat. Twitter sentiment analysis using hybrid cuckoo search method.
Information Processing & Management, vol. 53, no. 4, pp. 764-779, 2017.
[21] F. Balage, P. Pedro and T. A. S. Pardo. NILC-USP: A Hybrid System for Sentiment Analysis in Twitter
Messages. In: Proceedings of the Seventh International Workshop on Semantic Evaluation (SemEval 2013),
Georgia, 2013, pp. 568-572.
[22] T. L. Griffiths and M. Steyvers. Finding scientific topics. Proceedings of the National Academy of Sciences of the
United States of America, 101(Suppl 1):5228--5235, 2004.
[23] P. Le-Hong. An empirical study of maximum entropy approach for part-of-speech tagging of Vietnamese texts.
In: Proceedings of Traitement Automatique des Langues Naturelles (TALN-2010), Montreal, Canada, 2010.
- Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 199
[24] Konstantin Bauman, Bing Liu, and Alexander Tuzhilin. 2017. Aspect Based Recommendations: Recommending
Items with the Most Valuable Aspects Based on User Reviews. In Proceedings of the 23rd ACM SIGKDD
International Conference on Knowledge Discovery and Data Mining (KDD '17). ACM, New York, NY, USA,
717-725. DOI: https://doi.org/10.1145/3097983.3098170.
PRODUCT RECOMMENDATION SYSTEM BASED ON CUSTOMER REVIEWS
ANALYSIS
Tran Thi Thuy, Truong Quoc Dinh, Nguyen Van Tho, Huynh Trung Long
ABSTRACT: Nowadays, many e-commerce websites implement recommendation function which is based on customer
reviews/feedbacks analysis. The majority of these systems make the suggestions by using only the overall product ratings. By using
this approach, systems may suggest products that are not relevant to the customer needs, especially in the case that they take into
account only several product features. To deal with this problem, in this paper, we propose construct a feature-based
recommendation system. The proposed system will collect customer reviews/feedbacks concerning given product and then uses
natural language processing techniques to discover customer opinion. Experimental results conducted on 10.000 Vietnamese
smartphone reviews show the feasibility of proposed system.
nguon tai.lieu . vn