Xem mẫu

  1. Bùi Anh Tuấn Phan Như Huỳnh Nguyễn Ngọc Phương Anh Trường Đại học Cần Thơ Tóm tắt: Trong xu hướng dạy học chuyển đổi số thời kì 4.0, việc khai thác các tài liệu dạy học (văn bản, video,…) nhờ vào công cụ kĩ thuật số đóng vai trò quan trọng. Dựa vào xu hướng đó đã có rất nhiều phần mềm cũng như công cụ hỗ trọ được tạo ra; trong đó ATLAS.ti, một phần mềm của Đức, được sử dụng rộng rãi bởi sự đa dạng và miễn phí. Bài viết này trình bày các ứng dụng nổi bật của ATLAS.ti trong việc hỗ trợ công tác tìm hiểu, nghiên cứu tài liệu học tập cho một số môn học, từ đó thúc đẩy hiệu quả học tập hơn cho học sinh và làm nguồn tài liệu bổ ích cho giáo viên. Từ khóa: Chuyển đổi số, Giáo dục 4.0, ATLAS.ti, Tài liệu online. 1. Giới Thiệu Thời kỳ Công nghiệp 4.0 đang đưa ra những thách thức mang tính nhanh chóng và theo kịp thời đại. Trong đó, thuật ngữ “chuyển đổi số” ngày càng được biết đến trong thời gian gần đây ở hầu hết các lĩnh vực, đây chính là quá trình sử dụng các công nghệ mới để chuyển đổi các thông tin ở thế giới thực sang kĩ thuật số (Trần et al., [16]). Theo Gaikwad et al. [4] cho rằng từ sự tăng trưởng của dữ liệu số, việc khám phá kiến thức và khai thác dữ liệu ngày càng thu hút sự chú ý vì tính ứng dụng của nó. Một trong những kĩ thuật nổi bật được sử dụng để phân tích văn bản là Text Mining. Điển hình là công trình Raja et al. [13] đã dùng Text Mining khai thác văn bản của dữ liệu hồ sơ lâm sàng điện tử để chứa một khối lượng lớn các thông tin bệnh án của các bệnh nhân. Công trình của Tuan et al. [18] đã phân tích bài thơ Divan of Hafiz nhằm để xác định số lượng từ và phân loại những từ quan trọng trong bài thơ. Grobelnik et al. [5] đã sử dụng công nghệ hỗ trợ khai thác văn bản trong xuất bản để làm tăng số lượng khách hàng tiếp cận. Ngoài ra, với các phương pháp khai thác văn bản trong nghiên cứu của Lamurias và Couto [10] đã giúp cho người học dễ dàng truy xuất thông tin từ nguồn tài liệu y sinh khổng lồ. Theo Jalali et al. [9] cho rằng hiện nay các tài nguyên trực tuyến, cụ thể là dữ liệu lớn bao gồm văn bản, hình ảnh, video,… đã làm cho các phương pháp khai thác văn bản truyền thống khó thực hiện được. Từ đó, việc thúc đẩy sự phát triển của các công cụ để hỗ trợ quá trình khai thác dữ 615
  2. liệu như: NVivo, ATLAS.ti, Quirkos, MAXQDA,… là các chương trình hỗ trợ nghiên cứu phương pháp phân tích định tính bằng cách mã hóa dữ liệu đầu vào. Trong đó, ATLAS.ti cho phép khám phá nhiều tài liệu nghiên cứu cùng một lúc, làm giảm thời gian và số lượng sai lầm, ngoài ra còn có thể dễ dàng tìm kiếm, sao chép và dán các trích dẫn. Ngalande và Mkwinda [11] nhận thấy được việc trang bị đủ kiến thức và kĩ năng sử dụng ATLAS.ti là một lợi ích đối với bất kỳ cơ sở Giáo dục Đại học nào. Trong quá trình học tập, việc nghiên cứu các tài liệu dạy học từ giáo viên và các nguồn trên Internet là điều vô cùng quan trọng mà mỗi học sinh nói riêng và tất cả chúng ta nói chung khi thật sự muốn nắm toàn diện một vấn đề. Từ đây, việc phân tích tài liệu rõ ràng, chính xác, đúng trọng tâm sẽ mang lại lợi ích lớn đến việc cải thiện chất lượng học tập của học sinh mà còn tiết kiệm lượng lớn thời gian. Theo nghiên cứu của Nguyễn [12], việc tìm kiếm những thông tin hữu ích, tin cậy và chính xác về bệnh học lưu trữ tại các bệnh viện bằng kĩ thuật khai phá dữ liệu là rất cần thiết. Việc chắt lọc đúng thông tin từ các tài liệu học tập là một giải pháp vô cùng cần thiết khi khối lượng dữ liệu trên Web sinh ra liên tục mỗi ngày (Hoàng Minh Hiền, [7]). Từ những thực trạng trên, nghiên cứu này tiến hành phân thích các ứng dụng nổi bật của ATLAS.ti trong việc hỗ trợ phân tích tài liệu học tập ở một số môn Toán học, Lịch sử, Ngữ văn và hướng mở rộng thêm cho tất cả các môn học khác trong chương trình giáo dục phổ thông. Các phần còn lại của bài báo được trình bày theo các trình tự sau: Phần 2 trình bày cơ sở lí luận về khai thác văn bản, phương pháp phân tích cụm dữ liệu và khai thác video, phần mềm ATLAS.ti cũng như chọn lọc và giới thiệu các tài liệu phân tích các môn học. Phần 3 trình bày phương pháp nghiên cứu và kết quả phân tích bài học. Phần 4 trình bày kết luận và hướng phát triển đề tài. 2. Cơ sở lý luận 2.1 Khai thác dữ liệu văn bản và video Khai thác văn bản (Text mining/ Text data mining) là một quá trình xử lý và trích xuất thông tin trong văn bản, quá trình này là một phần của việc phân tích văn bản. Khai thác văn bản đã trở thành một nghiên cứu quan trọng đây là sự khám phá các thông tin chưa biết bằng cách tự động trích xuất thông tin từ các tài nguyên văn bản khác nhau (Gupta và Lehal, [6]). Quá trình này bao gồm các hoạt động như tóm tắt văn bản, phân cụm tài liệu, định vị các từ viết tắt và định nghĩa của chúng (Witten et al., [20]). Một số nhà nghiên cứu đã áp dụng kĩ thuật khai thác văn bản vào các dự án nghiên cứu định tính và đã xem khai thác văn bản như một công cụ hữu ích mang tính khả thi. Các tài liệu về bằng sáng chế chứa rất nhiều các thông tin về kết quả nghiên cứu quan trọng, tuy nhiên chúng dài và giàu thuật ngữ kĩ thuật nên cần 616
  3. rất nhiều thời gian để phân tích do đó các công cụ phân tích tự động mang lại rất nhiều lợi ích như phân đoạn văn bản, trích xuất tóm tắt, liên kết thuật ngữ cũng như xác định chủ đề (Tseng et al., [17]). Gaikwad et al. [4] đã đề xuất quy trình khai thác văn bản gồm 5 bước (Hình 1). Hình 1. Quá trình khai thác văn bản Bên cạnh các dữ liệu văn bản thì video tạo khả năng nắm bắt thông tin tốt hơn, sâu hơn so với chữ viết và hình ảnh tĩnh, để nghiên cứu dữ liệu video, có thể sử dụng phần mềm như Vivo hoặc ATLAS.ti (Wang et al., [19]) từ đó cho thấy các dữ liệu được đưa vào khai thác bằng các phần mềm phân tích định tính từ các văn bản cho đến các đoạn video. 2.2 Giới thiệu phần mềm ATLAS.ti ATLAS.ti là một chương trình máy tính phân tích dữ liệu định tính (computer assisted qualitative data analysis - CAQDAS) cung cấp một số công cụ định vị, mã hóa và chú thích (Barry, [2]) nhằm giúp các nhà nghiên cứu khám phá và phân tích một cách có hệ thống các hiện tượng phức tạp ẩn trong dữ liệu phi cấu trúc (văn bản, đa phương tiện, không gian địa lý); qua đó cân nhắc và đánh giá tầm quan trọng và mối quan hệ giữa chúng (Silver, [14]). ATLAS.ti hỗ trợ phân tích dữ liệu theo nhiều định dạng như văn bản, âm thanh, đồ họa, v.v… giúp ích cho việc phân tích dữ liệu phi cấu trúc và phi số, xác định chủ đề, mẫu và ý nghĩa. Hay nói khác hơn, ATLAS.ti là công cụ lý tưởng cho những ai muốn xem bức tranh lớn nhưng đồng thời cũng có thể biết được các chi tiết được nổi bật trong dữ liệu khai thác. Một số công dụng nổi bật có thể kể đến: Khi học sinh tiếp nhận đoạn thông tin của bài đến từ giáo viên hoặc nguồn tài liệu tham khảo học sinh có thể sử dụng chức năng “Code” để ghi chú lại trực tiếp các phần quan trọng giúp dễ dàng xác định ý chính của đoạn. Thêm vào đó khi học sinh muốn tìm các tài liệu nhưng do nội dung khá dài thì có thể sử dụng công cụ “Word list”, “Word cloud” từ đó sẽ cho học sinh có cái nhìn tổng quan về điều mà tài liệu muốn thể hiện. Bên cạnh đó, ATLAS.ti còn cho chúng ta trực tiếp xem, nghe video (điều chỉnh âm lượng, tốc độ phát, đánh dấu phân đoạn có chứa nội dung quan trọng),… Hiện nay ATLAS.ti có sẵn các phiên bản cho hệ điều hành Windows, Mac, Android và iPad. 617
  4. 2.3 Giới thiệu các tài liệu học tập học sinh thường khai thác trong chương trình GDPT Ngày nay, công nghệ thông tin đang phát triển vô cùng nhanh chóng và nó cũng mang lại những lợi ích to lớn đối với công tác dạy và học hiện nay. Đặc biệt trong bối cảnh đại dịch Covid-19 khi xã hội giãn cách, mọi việc đều được thực hiện trực tuyến do đó trong dạy học các loại tài liệu như văn bản, video được gửi đến cho học sinh tìm hiểu và quan sát tại nhà cũng ngày càng phổ biến hơn.Theo khảo sát của An [1] trong 2 tuần đầu tiên nghỉ học do ảnh hưởng của Covid-19, số giờ học trực tuyến trung bình của học sinh ở cấp THCS và THPT Hà Nội là 3,7 giờ. Theo Hoang et al. [8] các yếu tố ảnh hưởng đến thói quen học tại nhà trong đại dịch Covid-19: Nguồn tài liệu, môi trường học tập, động lực học tập, động viên từ gia đình,… Trong đó yếu tố nguồn tài liệu với 65% đồng ý trên tổng số 420 mẫu khảo sát cho thấy tầm quan trọng của tài liệu có ảnh hưởng lớn đến việc học tập của học sinh so với các yếu tố khác. Tổng quan trong một bài báo của Ta [15] với 294 mẫu khảo sát tỉ lệ giáo viên cho rằng công tác dạy học trực tuyến hiệu quả chiếm số lượng khá tương đối nhưng số lượng cho rằng không đồng ý và phân vân trong nhận định dạy học trực tuyến rất hiệu quả cũng đang chiếm tỉ lệ vô cùng cao. Qua đó nhận thấy rằng các thầy cô cần có biện pháp hiệu quả hơn để giúp cải thiện hiệu quả dạy và học trực tuyến nếu bối cảnh dịch cứ tiếp tục diễn biến phức tạp. Do đó các công cụ hỗ trợ dạy học cho giáo viên tiếp cận, truyền đạt bài giảng bằng các tài liệu Online để giúp quá trình học của học sinh đạt hiệu quả cao hơn là điều vô cùng cần thiết và ATLAS.ti sẽ là một công cụ hữu ích để thực hiện điều này. 3. Phương pháp nghiên cứu và kết quả 3.1 Phương pháp nghiên cứu Bằng những công cụ được cung cấp sẵn trong phần mềm ATLAS.ti 9, Bui et al. [3] đã đưa ra quy trình phân tích dữ liệu định tính ở Hình 2. Hình 2. Quy trình phân tích dữ liệu định tính bằng phần mềm ATLAS.ti 618
  5. Ở Bước 1, lựa chọn tích hợp các tài liệu cần phân tích. Tạo dự án với tên cụ thể trong ATLAS.ti, các file được đưa vào dự án bằng chức năng Add Document trên thanh công cụ. Ở Bước 2, tiến hành xử lí văn bản, video bằng các kĩ thuật phân tích văn bản khác nhau. Các dữ liệu được thể hiện và truy xuất trực quan ở bước 3. Theo Gupta và Lehal [6] các kĩ thuật cần được lặp đi lặp lại cho đến khi thông tin được trích xuất. Do đó các dữ liệu ở Bước 3 trở thành dữ liệu đầu vào của Bước 2 để tiếp tục quá trình xử lý. Quá trình này kết thúc khi dữ liệu được trích xuất thỏa mãn yêu cầu của người phân tích. Để hiểu rõ hơn quy trình làm việc này, nhóm tiến hành phân tích mẫu tác phẩm văn học “Chí Phèo” và SGK Đại số 10 để làm tiền đề phân tích các loại tài liệu tương tự cho các sinh viên sư phạm tìm hiểu và thúc đẩy sự sáng tạo, hiệu quả hơn trong công tác giảng dạy. + Trước hết ta sử dụng công cụ Word Cloud để thống kê tần số xuất hiện của tất cả các từ có trong tác phẩm giúp dễ dàng nắm bắt được chủ đề và cốt truyện xoay quang nhân vật trong truyện với khoảng thời gian rất ngắn. Trên thanh công cụ nhấp chuột chọn mục Word List/Word Cloud trong mục Document (Hình 3). Hình 3. Thanh công cụ của ATLAS.ti Tiếp đó, tiến hành tạo Network để xem xét trực quan mối liên hệ của từ ngữ trong tác phẩm. Vào Home/New Entities/New Network để tạo sơ đồ thể hiện sự liên kết các từ/cụm từ trong văn bản. + Ngoài việc phân tích các dữ liệu văn bản ATLAS.ti còn được biết đến là công cụ hỗ trợ phân tích Video hiệu quả. Trước hết chúng ta thêm Video vào bằng cách Add Document/ Add Linked Video or Audio. Sau đó đánh dấu các đoạn có nội dung quan trọng cần ghi chú lại vào lệnh Create Quotation (tạo trích dẫn) trên thanh công cụ. Sau đó sẽ mã hóa các đoạn đó bằng cách tạo thêm Code(s) mới hoặc Memo mới để đặt tên cũng như ghi chú lại các nội dung chính xuất hiện trong video (Hình 4). 619
  6. Hình 4. Chức năng tạo Code(s) mới hoặc Memo mới Bên cạnh đó, ATLAS.ti còn cho phép chụp màn hình video những thời điểm quan trọng trong đoạn video bằng cách vào Document/Capture Snapshot trên thanh công cụ. Và các chức năng phụ như điều chỉnh âm lượng, tốc độ của video hay tạm dừng, chuyển đến đoạn trích dẫn tiếp theo,… cũng dễ dàng thao tác trên ATLAS.ti. (Hình 5). Hình 5. Các tùy chỉnh trên video 3.2. Kết quả và thảo luận Sau khi tiến hành phân tích bằng ATLAS.ti 9 để phân tích tác phẩm Chí Phèo, Sách giáo khoa Đại số 10 và một đoạn phim tài liệu ngắn về cuộc “Tổng tiến công và nổi dậy xuân Mậu Thân 1968” một số kết quả đại diện được trình bày dưới đây: + Trong tác phẩm Chí Phèo kết quả Word Cloud (Hình 6) các từ có kích thước từ lớn đến nhỏ dựa vào tần suất xuất hiện cùng với các màu sắc khác nhau tạo nên sự trực quan. Từ đó có thể thấy rằng nội dung cốt truyện tập trung vào các nhân vật chính là Chí Phèo, Thị Nở, Bá Kiến,… các từ có tần suất xuất hiện là Chí Phèo (103 lần), làng (98 lần), Bá Kiến (52 lần), rượu (46 lần), gạch mặt (56 lần). Bước đầu có thể suy ra được câu truyện này xoay quang một ngôi làng, có một người thanh niên tên Chí Phèo suốt ngày chỉ biết đến rượu, bị cụ Bá Kiến xuôi khiến đi đòi nợ mướn bằng cách gạch mặt ăn vạ…. 620
  7. Hình 6. Kết quả Word Cloud của tác phẩm Chí Phèo + Các bước phân tích được thực hiện tương tự đối với SGK Đại số 10. Kết quả Word Cloud (Hình 7) cho thấy tần số các từ xuất hiện nhiều nhất là “Phương trình”, “Bất phương trình”, thể hiện trong chương trình SGK Đại số 10 tập trung chính vào chương III và Chương IV. Tần số từ “ví dụ”, “chứng minh” cũng khá cao cho thấy chương trình đầu tư vào hệ thống ví dụ và bài tập minh họa để giúp học sinh nắm vững kiến thức và vận dụng kiến thức một cách linh hoạt. Hình 7. Kết quả Word Cloud của SGK Đại số 10 621
  8. Qua hai phần phân tích Word Cloud đều giúp ta có cái nhìn tổng quát nhất về nguồn tài liệu. Đối với tác phẩm Chí Phèo giúp học sinh xác định được một phần của cốt truyện và các yếu tố chính xoay quanh, đối với phân tích SGK thì có thể tạo nguồn tư liệu tham khảo cho những nhà nghiên cứu về sự phân bổ chương trình giáo dục hiện nay. + Kết quả Network các từ/cụm từ có trong tài liệu cho thấy các nhánh xoay quanh chủ đề chính là nhân vật “Chí Phèo” và “Thị Nở” có các cụm từ xoay quanh cả hai nhân vật thể hiện các sự kiện xảy ra trong truyện và từ đó biết được đâu là nguyên nhân dẫn đến các sự việc tiếp theo cho cuộc đời Chí Phèo. Network tạo ra cho người đọc cái nhìn tổng quát về nội dung cốt truyện theo cách trực quan sinh động hơn (Hình 8). Hình 8. Kết quả Network của tác phẩm Chí Phèo + Trong chương trình Sách giáo khoa Lịch Sử lớp 12 để tìm hiểu và khắc sâu kiến thức về cuộc tổng tiến công và nổi dậy Xuân Mậu Thân 1968. Học sinh có thể tham khảo thêm thông tin từ video. Nhóm đã tiến hành phân tích video của đài VTV1 với thời lượng 35 phút dưới sự hỗ trợ của ATLAS.ti. Kết quả phân tích cho người học có cái nhìn tổng quan hơn về các sự kiện và mốc thời gian diễn ra trong suốt thời gian từ năm 1950 đến năm 1968. Nổi bật như tháng 5/1961, phó Tổng thống Mỹ đã phổ biến chiến lược “Chiến tranh đặc biệt”; Tháng 1/1963, trận Ấp Bắc diễn ra và phần thắng thuộc về đội du kích Việt Năm; Năm 1965, Mỹ tiến hành chiến lược “Chiến tranh cục bộ” và nhân dân ta từng bước đánh bại; Đêm 31/01/1968 là thời khắc lịch sử giao thừa Tết Mậu Thân, đồng bào chiến sĩ cả nước lắng nghe lời của Bác trên sóng phát thanh và đã mở màn cho cuộc Tổng tiến công và nổi dậy lịch sử,… Với sự hỗ trợ của ATLAS.ti, giáo viên và học sinh đều có thể biết được các nội dung chính của phim tài liệu trên, từ đó tạo hứng thú cho người học và giúp người học ghi chú dễ dàng và thuận tiện hơn (Hình 9). 622
  9. Hình 9. Kết quả phân tích video trong ATLAS.ti 4. Kết luận Nghiên cứu này đã cho ta thấy được tầm quan trọng của việc phân tích tài liệu và tiến hành phân tích bằng kĩ thuật khai thác văn bản dưới sự hỗ trợ của phần mềm ATLAS.ti 9. Qua đó đã đưa ra được các bước phân tích văn bản cũng như video và giới thiệu được một số tính năng và cách sử dụng ATLAS.ti. Kết quả nghiên cứu này có thể được xem là nguồn tham khảo để các bạn sinh viên ngành sư phạm, giáo viên có thể tìm hiểu và vận dụng trong công tác giảng dạy của mình và đây cũng là công cụ hiệu quả có thể giới thiệu đến các em học sinh để các em chủ động hơn trong việc tìm hiểu các tài liệu tham khảo và giúp kết quả tìm hiểu đó đạt được kết quả tốt hơn. Ngày nay, kĩ thuật Text mining đang được sử dụng phổ biến rộng rãi, trong đó ATLAS.ti là một phần mềm phân tích định tính mang lại hiệu quả cao. Các lựa chọn phân tích trên chỉ là một vài ví dụ điển hình nói chung về các loại tài liệu thường gặp hiện nay nên việc nhân rộng việc sử dụng phần mềm ATLAS.ti vào khai thác dữ liệu ở các môn khác cũng là hướng chúng ta có thể tiếp tục phát triển tốt. Từ các tính năng của ATLAS.ti như tạo network, ghi chú, lưu trữ, phân đoạn tài liệu văn bản và video,… giúp dễ dàng hệ thống kiến thức, tạo cái nhìn trực quan sinh động và mang lại hiệu quả cho người dùng. 623
  10. Tài liệu tham khảo [1]. An, H. (2020). Thói quen học trực tuyến trong mùa dịch: Nhìn từ dữ liệu khảo sát sơ bộ. [2]. Barry, C. A. (1998): Choosing qualitative data analysis software: ATLAS/ti and Nudist compared. Sociological research online, 3(3), 16-28 (1998). [3]. Bui, T. A., Ho, T. D. C., Nguyen, H. C., Phan, N. H., & Nguyen, Y.L. (2020). Text Mining in the trend of education 4.0: A study on clustering mathematical term of algebra textbooks in Vietnamese high schools. Vietnam Journal of Education (in press). [4]. Gaikwad, S. V., Chaugule, A., & Patil, P. (2014). Text mining methods and techniques. International Journal of Computer Applications, 85(17). [5]. Grobelnik, M., Mladenic, D., & Jermol, M. (2002). Exploiting text mining in publishing and education. In Proceedings of the ICML-2002 workshop on data mining lessons learned (pp. 34-39). [6]. Gupta, V., & Lehal, G. S. (2009). A survey of text mining techniques and applica- tions. Journal of emerging technologies in web intelligence, 1(1), 60-76. [7]. Hoàng Minh Hiền (2008). Độ tương đồng ngữ nghĩa giữa hai câu và ứng dụng trong tóm tắt văn bản. Luận văn tốt nghiệp. Đại học Quốc gia Hà Nội - Trường Đại học Công nghệ. [8]. Hoang, A. D., Nguyen, Y. C., Dinh, V. H., & Pham, H. H. (2020). Dataset of Viet- namese Student's Learning Habit during School Closure due to COVID-19 Pan- demic. Mendeley Data. [9]. Jalali, S. M. J., Park, H. W., Vanani, I. R., & Pho, K. H. (2020). Research trends on big data domain using text mining algorithms. Digital Scholarship in the Humanities. [10]. Lamurias, A., & Couto, F. M. (2019). Text mining for bioinformatics using biomedical literature. Encyclopedia of bioinformatics and computational biology, 1, 602-611. [11]. Ngalande, R. C., & Mkwinda, E. (2014). Benefits and challenges of using ATLAS. ti. https://doi. org/10.14279/depositonce-4848. [12]. Nguyễn, Đ. P. (2013). Ứng dụng khai phá dữ liệu xây dựng hệ thống hỗ trợ chuẩn đoán bệnh tim mạch (Doctoral dissertation, Đại học Đà Nẵng). [13]. Raja, U., Mitchell, T., Day, T., & Hardin, J. M. (2008). Text mining in healthcare. Ap- plications and opportunities. J Healthc Inf Manag, 22(3), 52-6. [14]. Silver, C., & Lewins, A. (2014): Using software in qualitative research: A step-by-step guide. Sage (2014). [15]. Ta, N. T. (2020). Tổng quan bộ dữ liệu mô tả quan điểm của giáo viên đối với những hỗ trợ từ trường học trong thời gian diễn ra dịch COVID-19. [16]. Trần, Đ. T., Phạm, T. T., & Nguyễn, T. T. (2020). Số hoá và chuyển đổi số trong hoạt động thư viện. [17]. Tseng, Y. H., Lin, C. J., & Lin, Y. I. (2007). Text mining techniques for patent analy- sis. Information processing & management, 43(5), 1216-1247. [18]. Tuan, B. A., Pudikova, G. N., Mahmoudi, M. R., & Pho, K. H. (2020). Statistical ap- proaches in literature: Comparing and clustering the alternatives of love in Divan of Ha- fiz. Digital Scholarship in the Humanities, 35(4), 886-892. [19]. Wang, T. L., & Lien, Y. H. B. (2013). The power of using video data. Quality & Quan- tity, 47(5), 2933-2941. [20]. Witten, I. H., Don, K. J., Dewsnip, M., & Tablan, V. (2004): Text mining in a digital library. (2004). 624
nguon tai.lieu . vn