Xem mẫu
- Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020)
Một Phương Pháp Phân Luồng Người Khám Bệnh
Dựa Trên Học Sâu Và Xử Lý Ngôn Ngữ Tự Nhiên
Nguyễn Ngọc Duy, Huỳnh Trung Trụ, Huỳnh Thị Tuyết Trinh, Lưu Ngọc Diệp
Khoa Công Nghệ Thông Tin II,
Học Viện Công Nghệ Bưu Chính Viễn Thông cơ sở tại TP.HCM
Email: duynn, truht, trinhhuynh, luungocdiep@ptithcm.edu.vn
Abstract —Ứng dụng trí tuệ nhân tạo trong chẩn đoán ban Trong phần tiếp theo của bài báo này, các tác giả sẽ trình
đầu tốt sẽ giúp quá trình khám và chữa bệnh. Nếu chẩn đoán ban bày một số công trình liên quan về học sâu và về y tế ở mục 2.
đầu hiệu quả sẽ xác định được sớm trường hợp khám có dấu hiệu Mục 3 sẽ trình bày về phương pháp thực hiện từ quá trình
bệnh nặng thì việc chữa trị sẽ gặp thuận lợi. Ngược lại, người chuyển đổi và xử lý dữ liệu đến các cấu hình của một số giải
khám sẽ không còn lo lắng hoặc chỉ cần khám tại các cơ sở ý tế
thuật học sâu dùng trong thử nghiệm của bài báo. Mục 4 các
nhỏ tại địa phương, tránh được sự lãng phí và cũng góp phần
giảm tải cho bệnh viện trung tâm. Bài báo này đề xuất phương tác giả sẽ trình bày các kết quả đạt được và các ý kiến thảo
pháp dùng các giải thuật học sâu cho việc chẩn đoán ban đầu luận. Các tác giả sẽ trình bày những ý kiến kết quận và hướng
trong thử nghiệm nhận định một số bệnh. Phương pháp mà bài phát triển tiếp dựa trên kết quả đạt được từ bài báo này trong
báo đề xuất ứng dụng các kỹ thuật xử lý ngôn ngữ tự nhiên đối mục 5.
với tiếng Việt trong việc xây dựng kho dữ liệu huấn luyện hệ
thống học sâu từ các bệnh án cũng như dựa trên sự tư vấn của II. CÁC CÔNG TRÌNH LIÊN QUAN
bác sĩ chuyên môn. Kết quả thử nghiệm với mô hình Ở công trình [10] các tác giả giới thiệu một mô hình học
Convolutional Neural Network (CNN), Long short-term memory
sâu phân loại trẻ em khỏe mạnh hoặc có khả năng mắc chứng
(LSTM), Bi-LSTM, CNN-Bi-LSTM và CNN-LSTM kết hợp là
khá tốt khi nhận định các loại bệnh viêm phổi, tiêu chảy, da liễu.
tự kỷ. Mô hình các tác giả sử dụng là CNN kết hợp với mô
hình MobileNet. Kết quả đạt được rất tốt, độ chính xác đạt
Keywords- Corpus, Deep Learning, classification, CNN, 94,6%. Trong khi đó, Amjad Rehman [11] và các cộng sự
Convolution Neural Network, Healthcare, Medicine, Physical phân loại bệnh bạch cầu mãn tính dòng tế bào lympho sử dụng
exam, Examination. mô CNN phân loại ảnh chụp tế bào đạt độ chính xác 97.78%.
Tiếp theo trong bài báo [12] tác giả sử dụng mô hình học sâu
I. GIỚI THIỆU trong chẩn đoán ký sinh trùng đường ruột ở người, tác giả sử
dụng mạng nơ-ron tính chập ConvNet với độ chính xác
Ứng dụng các kỹ thuật trí tuệ nhân tạo trong lĩnh vựa y tế
96.49%. Trong bài báo [13] tác giả phát hiện và chẩn đoán sâu
đã được quan tâm từ rất lâu. Nhu cầu xây dựng một hệ thống
răng bằng cách sử dụng thuật toán mạng nơ-ron CNNs dựa
hỗ trợ chăm sóc sức khỏe hoặc thăm khám bệnh tự động là
trên mô hình học sâu, với độ chính xác 95%.
mong muốn rất lớn của mọi người. Với sự phát triển của khoa
Các công trên đạt được độ chính xác rất cao khi giải quyết
học máy tính, và nhất là sự phát triển của các phương pháp
bài toán xác định một loại bênh cụ thể.
học sâu, những công trình nghiên cứu nhằm đáp ứng nhu cầu
Các giải thuật học sâu trong lĩnh vực xử lý ngôn ngữ tự
này càng trở nên được quan tâm hơn và cũng càng có cơ sở
nhiên tiếng Việt cũng được dùng trong nhiều công trình, nhất
thành công hơn. Đã có nhiều công trình nghiên cứu về lĩnh
là cho lĩnh vực phân loại ý kiến đánh giá sản phẩm như [14]
vực này trên thế giới [1]. Các công trình này nghiên cứu ứng
và [15]. Kết quả đạt được ở các công trình này cũng khá tốt,
dụng từ nhiều lĩnh vực khác nhau của khoa học máy tính như
độ chính xác trên 80%. Ở công trình [14] các tác giả đã thử
thị giác máy tính, nhận dạng giọng nói cũng như xử lý ngôn
nghiệm phân loại ý kiến cho tiếng Anh và tiếng Việt để nhận
ngữ tự nhiên cho tiếng Anh. Những công trình xử lý bài toán
thấy các giải thuật học sâu không phụ thuộc vào ngôn ngữ
chuyên sâu theo chuyên ngành hẹp như [5] và [6] đòi hỏi công
trong lĩnh vực xử lý ngôn ngự tự nhiên. Vấn đề sử dụng các
sức rất lớn và cũng thu được những kết quả rất tốt.
giải thuật học sâu cho lĩnh vực xử lý ngôn ngữ tự nhiên là xây
Quá trình thu thập kiến thức và học để hiểu biết từ dữ liệu y
dựng kho ngữ liệu đầy đủ và chất lượng để các giải thuật học
sinh phức tạp, nhiều chiều và không đồng nhất vẫn là một
sâu học tốt tri thức của lĩnh vực cần xử lý.
thách thức quan trọng trong việc xây dựng kho dữ liệu để huấn
luyện các hệ thống học sâu. Nhiều loại dữ liệu khác nhau đã và III. PHƯƠNG PHÁP TIẾP CẬN
đang xuất hiện trong nghiên cứu y sinh hiện đại, bao gồm hồ sơ
Các bệnh án là tập hợp của nhiều yếu tố như số đo huyết áp,
sức khỏe điện tử, hình ảnh, dữ liệu cảm biến … Đặc điểm
thân nhiệt, hoặc các chỉ số trong xét nghiệm … là những giá
chung của các loại dữ liệu này là phức tạp, không đồng nhất,
trị có ý nghĩa quan trọng thuộc về chuyên ngành khoa học sức
chú thích kém và cơ bản là không có cấu trúc. Việc xử lý các
khỏe. Đó là các giá trị định lượng nên nếu chỉ xem các giá trị
dữ liệu này đòi hỏi nền tảng kiến thức miền đầy đủ và sâu.
này như một từ hoặc cụm từ thông thường sẽ dẫn đến chẩn
ISBN: 978-604-80-5076-4 291
- Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020)
đoán hoặc nhận định sai trong khám chữa bệnh. Tuy nhiên, nhiều lĩnh vực. Mô hình CNN như hình 1 có các layer liên kết
bên cạnh những giá trị định lượng của kết quả trong khám cận được với nhau thông qua cơ chế tích chập (convolution). Dữ
lâm sàng có tính chuyên môn sâu về y khoa, có những thông liệu đầu vào của layer tiếp theo là kết quả tích chập từ layer
số của quá trình khám tổng quát như chiều cao, cân nặng, trước đó. Nhờ đó, ta có được các kết nối cục bộ trong quá trình
huyết áp … không đòi độ chính xác cao. Đây là các thông số tính toán. Sự kết hợp cục bộ cho chúng ta khả năng biểu diễn
cơ bản góp phần vào nhận định phân loại bệnh trong giai đoạn thông tin từ mức độ thấp đến mức độ cao và trừu tượng hơn
đầu của quá trình khám chữa bệnh. Trong bài báo này, các tác thông qua tích chập (convolution) từ các bộ lọc.
giả trình bày một phương pháp tiếp cận biến đổi và xử lý các Việc chuyển các từ trong câu thành ma trận trọng số trong
thông tin ban đầu này thành cơ sở tri thức nhằm khai thác khả bài toán xử lý ngôn ngữ tự nhiên dùng ở tầng Word embedding
năng của các hệ thống học sâu trong xử lý ngôn ngữ tự nhiên có thể được tạo từ công cụ word2vec hay Glove. Tầng này là
cho mục đích hỗ trợ phân loại một số bệnh ở giai đoạn đầu của một tập các ma trận kích thước n x k. Trong đó, n là số từ trong
quá trình khám chữa bệnh. câu, mỗi từ biểu diễn một vector k chiều. Lớp này biểu diễn
mỗi từ trong câu được chọn thành một vector từ. Đặt l R là
3.1 Xây dựng kho dữ liệu chiều dài câu, |D| R là kích thước từ vựng và W(l) Rkx|D| là
ma trận nhúng các vector từ k chiều. Từ thứ i trong câu được
3.1.1 Tiền xử lý dữ liệu chuyển thành một vector k chiều wi bằng công thức (1):
Dữ liệu thử nghiệm của bài báo này được các tác giả thu wi = W(l)xi (1)
thập từ các bệnh án ở một số bệnh viện và phòng khám tư trong đó xi là một biểu diễn one-hot vector cho từ thứ i.
nhân. Quá trình xử lý tạo kho dữ liệu được thực hiện theo các
bước:
Bước 1: Rút trích dữ liệu theo từng ca khám và kết luận của
các bác sỹ.
Bước 2: Tạo văn bản cho mỗi ca khám bệnh. Mỗi ca tạo
thành một văn bản. Mỗi câu trong văn bản là một thông tin
theo khía cạnh như tiền sử bệnh, chẩn đoán, kết luận …
Ví dụ 1:
“Cao 163 cm, nặng 42 kg, huyết áp … Đã bị lao cách đây 8 Word Convolutional Pooling fully-
năm. Khả năng bị …” embedding Layer Layer connected
Ví dụ 2: Layer layer
Cao 152 cm, nặng 54 kg, hay đau nhức cơ thể … Khả năng Hình 1: Mô hình Convolutional Neural Network [2]
bị …
Sau quá trình xử lý như trên tác giả thu được một kho dữ Tầng Convolutional sử dụng phép tích chập để xử lý dữ liệu
liệu với số liệu như bảng 3.1. bằng cách cho cửa sổ trượt (slide windows) có kích thước cố
Bảng 3.1: Số liệu kho dữ liệu bệnh án bằng tiếng việt định (còn gọi là kernel) trên ma trận dữ liệu đầu vào để thu
được kết quả đã được tinh chỉnh. Tầng Pooling tổng hợp các
Đặc tính Số lượng
vector kết quả của tầng Convolution và giữ lại những vector
Số bệnh nhân 4103
quan trọng nhất. Tầng full-connected là một mạng nơ-ron
Số văn bản 8697 truyền thống sử dụng những vector còn lại ở tầng Pooling làm
Số loại nhãn (loại bệnh) 3 đầu vào để tạo ra kết quả cuối cùng thông qua quá trình huấn
luyện.
3.1.2 Tạo dữ liệu cho mô hình học sâu
Dữ liệu văn bản được chuyển đổi về dạng ma trận trọng số 3.2.2 LSTM
để sử dụng huấn luyện các mô hình học sâu. Bài báo này sử Mạng LSTM [7] thuộc nhóm phương pháp học sâu hồi quy
dụng công cụ word2vec [8] cho việc chuyển đổi này. (Recurrent Neural Networks – RNN). Mô hình mạng LSTM
Word2vec chứa mô hình Continuous Bag-of-Words (CBOW) như ở hình 2. LSTM có các kết nối giữa các neural tạo thành
và mô hình Skip-Gram [9]. Mô hình CBOW dự đoán từ mục dạng có hướng có tính chu kỳ và có khả năng học các phụ
tiêu (ví dụ: từ “mặc” có thể tìm ra khi dùng từ “kệ” nếu trong thuộc dài. Tất cả các RNN có dạng một chuỗi các module lặp
kho ngữ liệu hai từ này có mối quan hệ) từ các từ cùng ngữ lại. Trong các RNN tiêu chuẩn, module lặp này thường có cấu
cảnh với nó. Trong khi đó, mô hình Skip-Gram thực hiện trúc đơn giản. Tuy nhiên, module lặp trong LSTM thì phức tạp
ngược lại, dự đoán các từ ngữ cảnh được đưa ra từ mục tiêu. hơn. Thay vì có một tầng neural thì có bốn lớp tương tác theo
3.2 Sơ lược về phương pháp học sâu CNN và LSTM một cách đặc biệt. Bên cạnh đó, nó có hai trạng thái: trạng thái
ẩn và trạng thái tế bào (cell state). Hình 2 minh họa mô hình
LSTM.
3.2.1 CNN
Tại thời điểm bước t, LSTM trước tiên quyết định thông tin
CNN là một trong những mô hình học sâu tiên tiến rất phổ nào sẽ được đổ vào trạng thái tế bào. Quyết định này được đưa
biến. Mô hình này giúp cho chúng ta xây dựng được những hệ ra bởi một hàm sigmoid hoặc tầng , được gọi là cổng quên
thống xử lý thông minh, cho kết quả có độ chính xác cao trong (forget gate). Hàm lấy ℎ t-1 (đầu ra từ lớp ẩn trước đó) và xt
ISBN: 978-604-80-5076-4 292
- Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020)
(đầu vào hiện tại) và xuất ra một số trong [0, 1], trong đó 1 có trong một chuỗi, chúng ta có thể cần xem xét cả bối cảnh bên
nghĩa là giữ hoàn toàn và 0 có nghĩa là bỏ qua hoàn toàn trong trái và bên phải.
công thức (2)
ft = (Wfxt + Ufht-1) (2)
Sau đó LSTM quyết định những thông tin mới sẽ lưu trữ
trong trạng thái tế bào. Việc này gồm hai bước. Đầu tiên, một
hàm hay lớp sigmoid, được gọi là cổng đầu vào như ở công
thức (3), quyết định giá trị nào LSTM sẽ cập nhật. Tiếp theo,
một hàm hoặc lớp tanh tạo ra một vectơ các giá trị ứng viên
~
mới C.
Hình 3: Mô hình Bidirectional RNN [7]
Một BRNN bao gồm hai bộ RNN ngược hướng xếp chồng
lên nhau. Một bộ xử lý đầu vào theo thứ tự ban đầu và một bộ
RNN xử lý chuỗi đầu vào đảo ngược. Đầu ra sau đó được tính
toán dựa trên trạng thái ẩn của cả hai bộ RNN.
Hình 2: Mô hình Long Short Term Memory network [7] IV. IV. THỬ NGHIỆM
it = (Wixt + Uiht-1) (3) 4.1 Cấu hình các mô hình học sâu dùng cho thử nghiệm
~ Các thông số dùng trong thử nghiệm của các giải thuật sâu
C tanh(W n xt U n ht 1 ) (4)
của bài báo được trình bày 4.1, 4.2, 4.3, 4.4, 4.5. Đây là các
~ thông số cho kết quả tốt nhất trong các thử nghiệm của bài báo
Ct ft *Ct 1 it *Ct (5) này.
Tiếp theo, cập nhật trạng thái tế bào cũ Ct-1 vào trạng thái tế 4.1.1. LSTM
bào mới Ct như công thức (5). Cổng quên ft có thể kiểm soát độ Dựa trên thư viện Keras. Các thông số được chọn để thử
dốc đi qua nó và cho phép xóa và cập nhật bộ nhớ một cách nghiệm như liệt kê ở bảng 4.1
tường minh, giúp giảm bớt sự hao hụt của độ dốc hoặc làm
bùng nổ về độ dốc trong RNN tiêu chuẩn. Bảng 4.1: Thông số thử nghiệm mô hình LSTM
LSTM quyết định đầu ra dựa trên trạng thái tế bào. Trước Đặc tính Giá trị
tiên, LSTM chạy một lớp sigmoid, quyết định phần nào của Số neural ẩn 100, 200
trạng thái tế bào sẽ xuất ra trong công thức (6), được gọi là ngõ dropout 0.2
ra (output gate). Sau đó, LSTM đặt trạng thái tế bào vào hàm Recurrent_dropout 0.2
tanh và nhân nó với đầu ra của cổng sigmoid, để LSTM chỉ Epoch 500
xuất ra các phần mà nó quyết định như công thức (7). Kích thước word embedding 300
ot (W 0 xt U 0ht 1 ) (6) Hàm activation sigmoid
4.1.2. CNN
ht ot * tanh( Ct ) (7)
Dựa trên thư viện Tensorflow. Các thông số được chọn để
thử nghiệm như liệt kê ở bảng 4.2
3.2.3 Bidirectional LSTM (Bi_LSTM)
Hình 4.2: Thông số thử nghiệm mô hình CNN
Mô hình BRNN [7] dựa trên ý tưởng rằng đầu ra tại mỗi thời Đặc tính Giá trị
điểm có thể không chỉ phụ thuộc vào các yếu tố trước đó trong Kích thước embedding word 300
chuỗi, mà còn phụ thuộc vào các yếu tố tiếp theo trong chuỗi Số bộ lọc 300
được trình ở hình 3. Chẳng hạn, để dự đoán một từ còn thiếu
Dropout 0.5
ISBN: 978-604-80-5076-4 293
- Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020)
Epoch 500 Bảng 4.6: Độ chính xác (accuracy - %) tốt nhất của mô hình trong
L2 0.0008 các thử nghiệm
Hàm activation Sigmoid Phương pháp Da liễu Tiêu hóa Phổi Tổng
Kích thước bộ lọc 3,4,5 CNN 61.57 67.43 66.99 65.42
LSTM 60.64 67.57 66.66 65.06
Bi_LSTM 60.87 66.39 69.03 66.84
4.1.3. Bi-LSTM CNN-Bi_LSTM 65.31 69.85 70.74 69.57
Dựa trên thư viện Keras. Các thông số được chọn để thử CNN-LSTM 68.73 73.60 71.64 71.38
nghiệm như liệt kê ở bảng 4.3
Bảng 4.3: Thông số thử nghiệm mô hình Bi-LSTM Từ kết thu được về độ chính xác của các phương dùng
trong thử nghiệm của bài báo này có thể rút ra một số nhận xét
Đặc tính Giá trị
sau:
Số neural ẩn 100, 200 - Sự kết hợp bộ CNN và bộ LSTM tạo được sự cải thiện
dropout 0.2 đáng kể về hiệu năng khi so với khi thực thi riêng từng giải
Recurrent_dropout 0.2 thuật. Tương tự, khi kết hợp bộ CNN và bộ Bi-LSTM cũng đạt
Epoch 500 độ chính xác tốt hơn khi để các bộ học sâu này thực thi riêng,
Kích thước word embedding 300 tuy không tốt như khi kết hợp CNN và LSTM. Mức chênh
Hàm activation sigmoid lệch cao nhất lên đến trên 8% đối với loại nhãn bệnh da liễu.
- Mặc dù là sự kết hợp hai bộ LSTM theo hai chiều khác
nhau nhưng bộ Bi-LSTM không có được kết quả tốt hơn
4.1.4. CNN – LSTM kết hợp LSTM trong trường hợp thử nghiệm dữ liệu của bài báo này.
Dựa trên thư viện Keras. Các thông số được chọn để thử - Đối với kho dữ liệu thử nghệm trong bài báo này, kết
nghiệm như liệt kê ở bảng 4.4. quả thu được về độ chính xác của phương pháp CNN và
Bảng 4.4: Thông số thử nghiệm mô hình CNN + LSTM LSTM khá tương đương nhau trong khả năng phân biệt cả ba
nhãn bệnh cũng như trong đánh giá chung.
Đặc tính Giá trị
- Khả năng nhận dạng đối với nhãn bệnh da liễu có kết
Epoch 500
quả thấp nhất. Điều này có thể lý giải là do các triệu chứng về
LSTM
da là rất đa dạng, khó phân biệt nếu không có sự hỗ trợ của
Số bộ lọc 200
quá trình khám cận lâm sàng.
Hàm activation softmax - Các kết quả đạt được về độ chính xác trong xác định
CNN các loại bệnh trong thử nghiệm ở bài báo này tuy không cao,
Kích thước embedding word nhưng có thể nói phương pháp này có nhiều triển vọng về việc
Số bộ lọc 300 ứng dụng các phương pháp học sâu vào việc hỗ trợ phân loại
Kích thước bộ lọc 3 ban đầu các bệnh nhân vì sự đơn giản và dễ ứng.
Pool size 2
Hàm activation sigmoid V. KẾT LUẬN
Kết quả thu được của bài báo này cho thấy phương pháp
4.1.5. CNN – Bi-LSTM kết hợp tiếp cận của bài báo là khá triển vọng. Mô hình nhận định
Dựa trên thư viện Keras. Các thông số được chọn để thử bệnh của bài báo có ưu điểm là linh hoạt, dễ xây dựng ứng
nghiệm như liệt kê ở bảng 4.5. dụng đối với các cơ sở y tế; dễ tiếp cận và dễ sử dụng với
Bảng 4.5: Thông số thử nghiệm mô hình CNN + Bi-LSTM nhiều đối tượng người bệnh nếu triển khai dưới dạng website
Đặc tính Giá trị hoặc ứng dụng di động. Tuy vậy, để có thể đưa vào ứng dụng
Epoch 500 thực tế, thời gian tới các tác giả sẽ thu thập thêm dữ liệu,
nghiên cứu phân tích bệnh án theo hướng phân loại triệu
LSTM
chứng cho nhiều loại bệnh hơn và thử nghiệm với nhiều mô
Số bộ lọc 200
hình học sâu khác.
Hàm activation softmax
CNN TÀI LIỆU THAM KHẢO
Kích thước embedding word [1] MIOTTO, Riccardo, et al. Deep learning for healthcare: review,
Số bộ lọc 300 opportunities and challenges. Briefings in bioinformatics, vol 19, isuue
Kích thước bộ lọc 3 6, 2018, pages 1236-1246.
Pool size 2 [2] Yoon Kim, “Convolutional neural networks for sentence classification”,
in Proceedings of the 2014 Conference on Empirical Methods in Natural
Hàm activation sigmoid Language Processing, EMNLP 2014, pages 1746-1751.
[3] FAUST, Oliver, et al. Deep learning for healthcare applications based on
4.2 Kết quả thử nghiệm physiological signals: A review. Computer methods and programs in
Kết quả thử nghiệm trên bộ dữ liệu trình bày ở phần 3.1 biomedicine, vol 161, 2018, pages 1-13.
được trình bày trong bảng 4.6. [4] BEAM, Andrew L.; KOHANE, Isaac S. “Big data and machine learning
in health care”. Jama, vol 319, isuue 13, 2018, pages 1317-1318.
ISBN: 978-604-80-5076-4 294
- Hội nghị Quốc gia lần thứ 23 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2020)
[5] WANG, Dayong, et al. Deep learning for identifying metastatic breast [12] A.Z. Peixinho, S.B. Martins, J.E. Vargas and A.X. Falc ̃ao, J.F. Gomes,
cancer. arXiv preprint arXiv:1606.05718, 2016. C.T.N. Suzuki, “Diagnosis of Human Intestinal Parasites by Deep
[6] LIU, Saifeng, et al. Prostate cancer diagnosis using deep learning with Learning”. In: Computational Vision and Medical Image Processing V:
3D multiparametric MRI. In: Medical imaging 2017: computer-aided Proceedings of the 5th Eccomas Thematic Conference on Computational
diagnosis. International Society for Optics and Photonics, 2017. pages Vision and Medical Image Processing (VipIMAGE 2015, Tenerife,
1013428. Spain. 2015. pages 107.
[7] Lei Zhang, Suai Wang, and Bing Liu (2018), “Deep learning for [13] Jae-Hong Leea, Do-Hyung Kima, Seong-Nyum Jeonga, Seong-Ho
sentiment analysis: A survey”, Wiley Interdisciplinary Reviews: Data Choib, “Detection and diagnosis of dental caries using a deep learning-
Mining and Knowledge Discovery, Vol 8, Issue 4, 2018, page e1253. based convolutional neural network algorithm”. Journal of dentistry, vol
77, 2018, pages 106-111.
[8] Xin Rong, “word2vec parameter learning explained”, In arXiv preprint
arXiv:1411.2738, 2014. [14] Duy Nguyen Ngoc, Tuoi Phan Thi and Phuc Do, “Preprocessing
Improves CNN and LSTM in Aspect-Based Sentiment Analysis for
[9] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg Corrado, and Jeffrey
Vietnamese”. In Proceedings of Fifth International Congress on
Dean, “Distributed representations of words and phrases and their
Information and Communication Technology. ICICT 2020. Springer,
compositionality”. In Proceedings of the Annual Conference on Singapore, 2020. pages. 175-185.
Advances in Neural Information Processing Systems (NIPS 2013), 2013.
[15] Duy Nguyen Ngoc, Tuoi Phan Thi and Phuc Do, “A Data Preprocessing
[10] Madison Beary, Alex Hadsell, Ryan Messersmith, Mohammad-Parsa
Method to Classify and Summarize Aspect-Based Opinions using Deep
Hosseini, “Diagnosis of Autism in Children using Facial Analysis and
Learning”, Asian Conference on Intelligent Information and Database
Deep Learning”. arXiv preprint arXiv:2008.02890, 2020.
Systems. Springer, Cham, 2019. pages 115-127
[11] Amjad Rehman, Naveed Abbas, Tanzila Saba, Syed Ijaz ur Rahman,
Zahid Mehmood, HoshangKolivand. “Classification of acute
lymphoblastic leukemia using deep learning". Microscopy Research and
Technique, cil 81, isuue 11, 2018, pages 1310-1317.
ISBN: 978-604-80-5076-4 295
nguon tai.lieu . vn