Xem mẫu

  1. Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) Một Phương Pháp Phân Luồng Người Khám Bệnh Dựa Trên Học Sâu Và Xử Lý Ngôn Ngữ Tự Nhiên Nguyễn Ngọc Duy, Huỳnh Trung Trụ, Huỳnh Thị Tuyết Trinh, Lưu Ngọc Diệp Khoa Công Nghệ Thông Tin II, Học Viện Công Nghệ Bưu Chính Viễn Thông cơ sở tại TP.HCM Email: duynn, truht, trinhhuynh, luungocdiep@ptithcm.edu.vn Abstract —Ứng dụng trí tuệ nhân tạo trong chẩn đoán ban Trong phần tiếp theo của bài báo này, các tác giả sẽ trình đầu tốt sẽ giúp quá trình khám và chữa bệnh. Nếu chẩn đoán ban bày một số công trình liên quan về học sâu và về y tế ở mục 2. đầu hiệu quả sẽ xác định được sớm trường hợp khám có dấu hiệu Mục 3 sẽ trình bày về phương pháp thực hiện từ quá trình bệnh nặng thì việc chữa trị sẽ gặp thuận lợi. Ngược lại, người chuyển đổi và xử lý dữ liệu đến các cấu hình của một số giải khám sẽ không còn lo lắng hoặc chỉ cần khám tại các cơ sở ý tế thuật học sâu dùng trong thử nghiệm của bài báo. Mục 4 các nhỏ tại địa phương, tránh được sự lãng phí và cũng góp phần giảm tải cho bệnh viện trung tâm. Bài báo này đề xuất phương tác giả sẽ trình bày các kết quả đạt được và các ý kiến thảo pháp dùng các giải thuật học sâu cho việc chẩn đoán ban đầu luận. Các tác giả sẽ trình bày những ý kiến kết quận và hướng trong thử nghiệm nhận định một số bệnh. Phương pháp mà bài phát triển tiếp dựa trên kết quả đạt được từ bài báo này trong báo đề xuất ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên đối mục 5. với tiếng Việt trong việc xây dựng kho dữ liệu huấn luyện hệ thống học sâu từ các bệnh án cũng như dựa trên sự tư vấn của II. CÁC CÔNG TRÌNH LIÊN QUAN bác sĩ chuyên môn. Kết quả thử nghiệm với mô hình Ở công trình [10] các tác giả giới thiệu một mô hình học Convolutional Neural Network (CNN), Long short-term memory sâu phân loại trẻ em khỏe mạnh hoặc có khả năng mắc chứng (LSTM), Bi-LSTM, CNN-Bi-LSTM và CNN-LSTM kết hợp là khá tốt khi nhận định các loại bệnh viêm phổi, tiêu chảy, da liễu. tự kỷ. Mô hình các tác giả sử dụng là CNN kết hợp với mô hình MobileNet. Kết quả đạt được rất tốt, độ chính xác đạt Keywords- Corpus, Deep Learning, classification, CNN, 94,6%. Trong khi đó, Amjad Rehman [11] và các cộng sự Convolution Neural Network, Healthcare, Medicine, Physical phân loại bệnh bạch cầu mãn tính dòng tế bào lympho sử dụng exam, Examination. mô CNN phân loại ảnh chụp tế bào đạt độ chính xác 97.78%. Tiếp theo trong bài báo [12] tác giả sử dụng mô hình học sâu I. GIỚI THIỆU trong chẩn đoán ký sinh trùng đường ruột ở người, tác giả sử dụng mạng nơ-ron tính chập ConvNet với độ chính xác Ứng dụng các kỹ thuật trí tuệ nhân tạo trong lĩnh vựa y tế 96.49%. Trong bài báo [13] tác giả phát hiện và chẩn đoán sâu đã được quan tâm từ rất lâu. Nhu cầu xây dựng một hệ thống răng bằng cách sử dụng thuật toán mạng nơ-ron CNNs dựa hỗ trợ chăm sóc sức khỏe hoặc thăm khám bệnh tự động là trên mô hình học sâu, với độ chính xác 95%. mong muốn rất lớn của mọi người. Với sự phát triển của khoa Các công trên đạt được độ chính xác rất cao khi giải quyết học máy tính, và nhất là sự phát triển của các phương pháp bài toán xác định một loại bênh cụ thể. học sâu, những công trình nghiên cứu nhằm đáp ứng nhu cầu Các giải thuật học sâu trong lĩnh vực xử lý ngôn ngữ tự này càng trở nên được quan tâm hơn và cũng càng có cơ sở nhiên tiếng Việt cũng được dùng trong nhiều công trình, nhất thành công hơn. Đã có nhiều công trình nghiên cứu về lĩnh là cho lĩnh vực phân loại ý kiến đánh giá sản phẩm như [14] vực này trên thế giới [1]. Các công trình này nghiên cứu ứng và [15]. Kết quả đạt được ở các công trình này cũng khá tốt, dụng từ nhiều lĩnh vực khác nhau của khoa học máy tính như độ chính xác trên 80%. Ở công trình [14] các tác giả đã thử thị giác máy tính, nhận dạng giọng nói cũng như xử lý ngôn nghiệm phân loại ý kiến cho tiếng Anh và tiếng Việt để nhận ngữ tự nhiên cho tiếng Anh. Những công trình xử lý bài toán thấy các giải thuật học sâu không phụ thuộc vào ngôn ngữ chuyên sâu theo chuyên ngành hẹp như [5] và [6] đòi hỏi công trong lĩnh vực xử lý ngôn ngự tự nhiên. Vấn đề sử dụng các sức rất lớn và cũng thu được những kết quả rất tốt. giải thuật học sâu cho lĩnh vực xử lý ngôn ngữ tự nhiên là xây Quá trình thu thập kiến thức và học để hiểu biết từ dữ liệu y dựng kho ngữ liệu đầy đủ và chất lượng để các giải thuật học sinh phức tạp, nhiều chiều và không đồng nhất vẫn là một sâu học tốt tri thức của lĩnh vực cần xử lý. thách thức quan trọng trong việc xây dựng kho dữ liệu để huấn luyện các hệ thống học sâu. Nhiều loại dữ liệu khác nhau đã và III. PHƯƠNG PHÁP TIẾP CẬN đang xuất hiện trong nghiên cứu y sinh hiện đại, bao gồm hồ sơ Các bệnh án là tập hợp của nhiều yếu tố như số đo huyết áp, sức khỏe điện tử, hình ảnh, dữ liệu cảm biến … Đặc điểm thân nhiệt, hoặc các chỉ số trong xét nghiệm … là những giá chung của các loại dữ liệu này là phức tạp, không đồng nhất, trị có ý nghĩa quan trọng thuộc về chuyên ngành khoa học sức chú thích kém và cơ bản là không có cấu trúc. Việc xử lý các khỏe. Đó là các giá trị định lượng nên nếu chỉ xem các giá trị dữ liệu này đòi hỏi nền tảng kiến thức miền đầy đủ và sâu. này như một từ hoặc cụm từ thông thường sẽ dẫn đến chẩn ISBN: 978-604-80-5076-4 291
  2. Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) đoán hoặc nhận định sai trong khám chữa bệnh. Tuy nhiên, nhiều lĩnh vực. Mô hình CNN như hình 1 có các layer liên kết bên cạnh những giá trị định lượng của kết quả trong khám cận được với nhau thông qua cơ chế tích chập (convolution). Dữ lâm sàng có tính chuyên môn sâu về y khoa, có những thông liệu đầu vào của layer tiếp theo là kết quả tích chập từ layer số của quá trình khám tổng quát như chiều cao, cân nặng, trước đó. Nhờ đó, ta có được các kết nối cục bộ trong quá trình huyết áp … không đòi độ chính xác cao. Đây là các thông số tính toán. Sự kết hợp cục bộ cho chúng ta khả năng biểu diễn cơ bản góp phần vào nhận định phân loại bệnh trong giai đoạn thông tin từ mức độ thấp đến mức độ cao và trừu tượng hơn đầu của quá trình khám chữa bệnh. Trong bài báo này, các tác thông qua tích chập (convolution) từ các bộ lọc. giả trình bày một phương pháp tiếp cận biến đổi và xử lý các Việc chuyển các từ trong câu thành ma trận trọng số trong thông tin ban đầu này thành cơ sở tri thức nhằm khai thác khả bài toán xử lý ngôn ngữ tự nhiên dùng ở tầng Word embedding năng của các hệ thống học sâu trong xử lý ngôn ngữ tự nhiên có thể được tạo từ công cụ word2vec hay Glove. Tầng này là cho mục đích hỗ trợ phân loại một số bệnh ở giai đoạn đầu của một tập các ma trận kích thước n x k. Trong đó, n là số từ trong quá trình khám chữa bệnh. câu, mỗi từ biểu diễn một vector k chiều. Lớp này biểu diễn mỗi từ trong câu được chọn thành một vector từ. Đặt l R là 3.1 Xây dựng kho dữ liệu chiều dài câu, |D| R là kích thước từ vựng và W(l) Rkx|D| là ma trận nhúng các vector từ k chiều. Từ thứ i trong câu được 3.1.1 Tiền xử lý dữ liệu chuyển thành một vector k chiều wi bằng công thức (1): Dữ liệu thử nghiệm của bài báo này được các tác giả thu wi = W(l)xi (1) thập từ các bệnh án ở một số bệnh viện và phòng khám tư trong đó xi là một biểu diễn one-hot vector cho từ thứ i. nhân. Quá trình xử lý tạo kho dữ liệu được thực hiện theo các bước: Bước 1: Rút trích dữ liệu theo từng ca khám và kết luận của các bác sỹ. Bước 2: Tạo văn bản cho mỗi ca khám bệnh. Mỗi ca tạo thành một văn bản. Mỗi câu trong văn bản là một thông tin theo khía cạnh như tiền sử bệnh, chẩn đoán, kết luận … Ví dụ 1: “Cao 163 cm, nặng 42 kg, huyết áp … Đã bị lao cách đây 8 Word Convolutional Pooling fully- năm. Khả năng bị …” embedding Layer Layer connected Ví dụ 2: Layer layer Cao 152 cm, nặng 54 kg, hay đau nhức cơ thể … Khả năng Hình 1: Mô hình Convolutional Neural Network [2] bị … Sau quá trình xử lý như trên tác giả thu được một kho dữ Tầng Convolutional sử dụng phép tích chập để xử lý dữ liệu liệu với số liệu như bảng 3.1. bằng cách cho cửa sổ trượt (slide windows) có kích thước cố Bảng 3.1: Số liệu kho dữ liệu bệnh án bằng tiếng việt định (còn gọi là kernel) trên ma trận dữ liệu đầu vào để thu được kết quả đã được tinh chỉnh. Tầng Pooling tổng hợp các Đặc tính Số lượng vector kết quả của tầng Convolution và giữ lại những vector Số bệnh nhân 4103 quan trọng nhất. Tầng full-connected là một mạng nơ-ron Số văn bản 8697 truyền thống sử dụng những vector còn lại ở tầng Pooling làm Số loại nhãn (loại bệnh) 3 đầu vào để tạo ra kết quả cuối cùng thông qua quá trình huấn luyện. 3.1.2 Tạo dữ liệu cho mô hình học sâu Dữ liệu văn bản được chuyển đổi về dạng ma trận trọng số 3.2.2 LSTM để sử dụng huấn luyện các mô hình học sâu. Bài báo này sử Mạng LSTM [7] thuộc nhóm phương pháp học sâu hồi quy dụng công cụ word2vec [8] cho việc chuyển đổi này. (Recurrent Neural Networks – RNN). Mô hình mạng LSTM Word2vec chứa mô hình Continuous Bag-of-Words (CBOW) như ở hình 2. LSTM có các kết nối giữa các neural tạo thành và mô hình Skip-Gram [9]. Mô hình CBOW dự đoán từ mục dạng có hướng có tính chu kỳ và có khả năng học các phụ tiêu (ví dụ: từ “mặc” có thể tìm ra khi dùng từ “kệ” nếu trong thuộc dài. Tất cả các RNN có dạng một chuỗi các module lặp kho ngữ liệu hai từ này có mối quan hệ) từ các từ cùng ngữ lại. Trong các RNN tiêu chuẩn, module lặp này thường có cấu cảnh với nó. Trong khi đó, mô hình Skip-Gram thực hiện trúc đơn giản. Tuy nhiên, module lặp trong LSTM thì phức tạp ngược lại, dự đoán các từ ngữ cảnh được đưa ra từ mục tiêu. hơn. Thay vì có một tầng neural thì có bốn lớp tương tác theo 3.2 Sơ lược về phương pháp học sâu CNN và LSTM một cách đặc biệt. Bên cạnh đó, nó có hai trạng thái: trạng thái ẩn và trạng thái tế bào (cell state). Hình 2 minh họa mô hình LSTM. 3.2.1 CNN Tại thời điểm bước t, LSTM trước tiên quyết định thông tin CNN là một trong những mô hình học sâu tiên tiến rất phổ nào sẽ được đổ vào trạng thái tế bào. Quyết định này được đưa biến. Mô hình này giúp cho chúng ta xây dựng được những hệ ra bởi một hàm sigmoid hoặc tầng , được gọi là cổng quên thống xử lý thông minh, cho kết quả có độ chính xác cao trong (forget gate). Hàm lấy ℎ t-1 (đầu ra từ lớp ẩn trước đó) và xt ISBN: 978-604-80-5076-4 292
  3. Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) (đầu vào hiện tại) và xuất ra một số trong [0, 1], trong đó 1 có trong một chuỗi, chúng ta có thể cần xem xét cả bối cảnh bên nghĩa là giữ hoàn toàn và 0 có nghĩa là bỏ qua hoàn toàn trong trái và bên phải. công thức (2) ft = (Wfxt + Ufht-1) (2) Sau đó LSTM quyết định những thông tin mới sẽ lưu trữ trong trạng thái tế bào. Việc này gồm hai bước. Đầu tiên, một hàm hay lớp sigmoid, được gọi là cổng đầu vào như ở công thức (3), quyết định giá trị nào LSTM sẽ cập nhật. Tiếp theo, một hàm hoặc lớp tanh tạo ra một vectơ các giá trị ứng viên ~ mới C. Hình 3: Mô hình Bidirectional RNN [7] Một BRNN bao gồm hai bộ RNN ngược hướng xếp chồng lên nhau. Một bộ xử lý đầu vào theo thứ tự ban đầu và một bộ RNN xử lý chuỗi đầu vào đảo ngược. Đầu ra sau đó được tính toán dựa trên trạng thái ẩn của cả hai bộ RNN. Hình 2: Mô hình Long Short Term Memory network [7] IV. IV. THỬ NGHIỆM it = (Wixt + Uiht-1) (3) 4.1 Cấu hình các mô hình học sâu dùng cho thử nghiệm ~ Các thông số dùng trong thử nghiệm của các giải thuật sâu C tanh(W n xt U n ht 1 ) (4) của bài báo được trình bày 4.1, 4.2, 4.3, 4.4, 4.5. Đây là các ~ thông số cho kết quả tốt nhất trong các thử nghiệm của bài báo Ct ft *Ct 1 it *Ct (5) này. Tiếp theo, cập nhật trạng thái tế bào cũ Ct-1 vào trạng thái tế 4.1.1. LSTM bào mới Ct như công thức (5). Cổng quên ft có thể kiểm soát độ Dựa trên thư viện Keras. Các thông số được chọn để thử dốc đi qua nó và cho phép xóa và cập nhật bộ nhớ một cách nghiệm như liệt kê ở bảng 4.1 tường minh, giúp giảm bớt sự hao hụt của độ dốc hoặc làm bùng nổ về độ dốc trong RNN tiêu chuẩn. Bảng 4.1: Thông số thử nghiệm mô hình LSTM LSTM quyết định đầu ra dựa trên trạng thái tế bào. Trước Đặc tính Giá trị tiên, LSTM chạy một lớp sigmoid, quyết định phần nào của Số neural ẩn 100, 200 trạng thái tế bào sẽ xuất ra trong công thức (6), được gọi là ngõ dropout 0.2 ra (output gate). Sau đó, LSTM đặt trạng thái tế bào vào hàm Recurrent_dropout 0.2 tanh và nhân nó với đầu ra của cổng sigmoid, để LSTM chỉ Epoch 500 xuất ra các phần mà nó quyết định như công thức (7). Kích thước word embedding 300 ot (W 0 xt U 0ht 1 ) (6) Hàm activation sigmoid 4.1.2. CNN ht ot * tanh( Ct ) (7) Dựa trên thư viện Tensorflow. Các thông số được chọn để thử nghiệm như liệt kê ở bảng 4.2 3.2.3 Bidirectional LSTM (Bi_LSTM) Hình 4.2: Thông số thử nghiệm mô hình CNN Mô hình BRNN [7] dựa trên ý tưởng rằng đầu ra tại mỗi thời Đặc tính Giá trị điểm có thể không chỉ phụ thuộc vào các yếu tố trước đó trong Kích thước embedding word 300 chuỗi, mà còn phụ thuộc vào các yếu tố tiếp theo trong chuỗi Số bộ lọc 300 được trình ở hình 3. Chẳng hạn, để dự đoán một từ còn thiếu Dropout 0.5 ISBN: 978-604-80-5076-4 293
  4. Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) Epoch 500 Bảng 4.6: Độ chính xác (accuracy - %) tốt nhất của mô hình trong L2 0.0008 các thử nghiệm Hàm activation Sigmoid Phương pháp Da liễu Tiêu hóa Phổi Tổng Kích thước bộ lọc 3,4,5 CNN 61.57 67.43 66.99 65.42 LSTM 60.64 67.57 66.66 65.06 Bi_LSTM 60.87 66.39 69.03 66.84 4.1.3. Bi-LSTM CNN-Bi_LSTM 65.31 69.85 70.74 69.57 Dựa trên thư viện Keras. Các thông số được chọn để thử CNN-LSTM 68.73 73.60 71.64 71.38 nghiệm như liệt kê ở bảng 4.3 Bảng 4.3: Thông số thử nghiệm mô hình Bi-LSTM Từ kết thu được về độ chính xác của các phương dùng trong thử nghiệm của bài báo này có thể rút ra một số nhận xét Đặc tính Giá trị sau: Số neural ẩn 100, 200 - Sự kết hợp bộ CNN và bộ LSTM tạo được sự cải thiện dropout 0.2 đáng kể về hiệu năng khi so với khi thực thi riêng từng giải Recurrent_dropout 0.2 thuật. Tương tự, khi kết hợp bộ CNN và bộ Bi-LSTM cũng đạt Epoch 500 độ chính xác tốt hơn khi để các bộ học sâu này thực thi riêng, Kích thước word embedding 300 tuy không tốt như khi kết hợp CNN và LSTM. Mức chênh Hàm activation sigmoid lệch cao nhất lên đến trên 8% đối với loại nhãn bệnh da liễu. - Mặc dù là sự kết hợp hai bộ LSTM theo hai chiều khác nhau nhưng bộ Bi-LSTM không có được kết quả tốt hơn 4.1.4. CNN – LSTM kết hợp LSTM trong trường hợp thử nghiệm dữ liệu của bài báo này. Dựa trên thư viện Keras. Các thông số được chọn để thử - Đối với kho dữ liệu thử nghệm trong bài báo này, kết nghiệm như liệt kê ở bảng 4.4. quả thu được về độ chính xác của phương pháp CNN và Bảng 4.4: Thông số thử nghiệm mô hình CNN + LSTM LSTM khá tương đương nhau trong khả năng phân biệt cả ba nhãn bệnh cũng như trong đánh giá chung. Đặc tính Giá trị - Khả năng nhận dạng đối với nhãn bệnh da liễu có kết Epoch 500 quả thấp nhất. Điều này có thể lý giải là do các triệu chứng về LSTM da là rất đa dạng, khó phân biệt nếu không có sự hỗ trợ của Số bộ lọc 200 quá trình khám cận lâm sàng. Hàm activation softmax - Các kết quả đạt được về độ chính xác trong xác định CNN các loại bệnh trong thử nghiệm ở bài báo này tuy không cao, Kích thước embedding word nhưng có thể nói phương pháp này có nhiều triển vọng về việc Số bộ lọc 300 ứng dụng các phương pháp học sâu vào việc hỗ trợ phân loại Kích thước bộ lọc 3 ban đầu các bệnh nhân vì sự đơn giản và dễ ứng. Pool size 2 Hàm activation sigmoid V. KẾT LUẬN Kết quả thu được của bài báo này cho thấy phương pháp 4.1.5. CNN – Bi-LSTM kết hợp tiếp cận của bài báo là khá triển vọng. Mô hình nhận định Dựa trên thư viện Keras. Các thông số được chọn để thử bệnh của bài báo có ưu điểm là linh hoạt, dễ xây dựng ứng nghiệm như liệt kê ở bảng 4.5. dụng đối với các cơ sở y tế; dễ tiếp cận và dễ sử dụng với Bảng 4.5: Thông số thử nghiệm mô hình CNN + Bi-LSTM nhiều đối tượng người bệnh nếu triển khai dưới dạng website Đặc tính Giá trị hoặc ứng dụng di động. Tuy vậy, để có thể đưa vào ứng dụng Epoch 500 thực tế, thời gian tới các tác giả sẽ thu thập thêm dữ liệu, nghiên cứu phân tích bệnh án theo hướng phân loại triệu LSTM chứng cho nhiều loại bệnh hơn và thử nghiệm với nhiều mô Số bộ lọc 200 hình học sâu khác. Hàm activation softmax CNN TÀI LIỆU THAM KHẢO Kích thước embedding word [1] MIOTTO, Riccardo, et al. Deep learning for healthcare: review, Số bộ lọc 300 opportunities and challenges. Briefings in bioinformatics, vol 19, isuue Kích thước bộ lọc 3 6, 2018, pages 1236-1246. Pool size 2 [2] Yoon Kim, “Convolutional neural networks for sentence classification”, in Proceedings of the 2014 Conference on Empirical Methods in Natural Hàm activation sigmoid Language Processing, EMNLP 2014, pages 1746-1751. [3] FAUST, Oliver, et al. Deep learning for healthcare applications based on 4.2 Kết quả thử nghiệm physiological signals: A review. Computer methods and programs in Kết quả thử nghiệm trên bộ dữ liệu trình bày ở phần 3.1 biomedicine, vol 161, 2018, pages 1-13. được trình bày trong bảng 4.6. [4] BEAM, Andrew L.; KOHANE, Isaac S. “Big data and machine learning in health care”. Jama, vol 319, isuue 13, 2018, pages 1317-1318. ISBN: 978-604-80-5076-4 294
  5. Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020) [5] WANG, Dayong, et al. Deep learning for identifying metastatic breast [12] A.Z. Peixinho, S.B. Martins, J.E. Vargas and A.X. Falc ̃ao, J.F. Gomes, cancer. arXiv preprint arXiv:1606.05718, 2016. C.T.N. Suzuki, “Diagnosis of Human Intestinal Parasites by Deep [6] LIU, Saifeng, et al. Prostate cancer diagnosis using deep learning with Learning”. In: Computational Vision and Medical Image Processing V: 3D multiparametric MRI. In: Medical imaging 2017: computer-aided Proceedings of the 5th Eccomas Thematic Conference on Computational diagnosis. International Society for Optics and Photonics, 2017. pages Vision and Medical Image Processing (VipIMAGE 2015, Tenerife, 1013428. Spain. 2015. pages 107. [7] Lei Zhang, Suai Wang, and Bing Liu (2018), “Deep learning for [13] Jae-Hong Leea, Do-Hyung Kima, Seong-Nyum Jeonga, Seong-Ho sentiment analysis: A survey”, Wiley Interdisciplinary Reviews: Data Choib, “Detection and diagnosis of dental caries using a deep learning- Mining and Knowledge Discovery, Vol 8, Issue 4, 2018, page e1253. based convolutional neural network algorithm”. Journal of dentistry, vol 77, 2018, pages 106-111. [8] Xin Rong, “word2vec parameter learning explained”, In arXiv preprint arXiv:1411.2738, 2014. [14] Duy Nguyen Ngoc, Tuoi Phan Thi and Phuc Do, “Preprocessing Improves CNN and LSTM in Aspect-Based Sentiment Analysis for [9] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg Corrado, and Jeffrey Vietnamese”. In Proceedings of Fifth International Congress on Dean, “Distributed representations of words and phrases and their Information and Communication Technology. ICICT 2020. Springer, compositionality”. In Proceedings of the Annual Conference on Singapore, 2020. pages. 175-185. Advances in Neural Information Processing Systems (NIPS 2013), 2013. [15] Duy Nguyen Ngoc, Tuoi Phan Thi and Phuc Do, “A Data Preprocessing [10] Madison Beary, Alex Hadsell, Ryan Messersmith, Mohammad-Parsa Method to Classify and Summarize Aspect-Based Opinions using Deep Hosseini, “Diagnosis of Autism in Children using Facial Analysis and Learning”, Asian Conference on Intelligent Information and Database Deep Learning”. arXiv preprint arXiv:2008.02890, 2020. Systems. Springer, Cham, 2019. pages 115-127 [11] Amjad Rehman, Naveed Abbas, Tanzila Saba, Syed Ijaz ur Rahman, Zahid Mehmood, HoshangKolivand. “Classification of acute lymphoblastic leukemia using deep learning". Microscopy Research and Technique, cil 81, isuue 11, 2018, pages 1310-1317. ISBN: 978-604-80-5076-4 295
nguon tai.lieu . vn