Xem mẫu
- 182 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC”
Giải pháp kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mô hình cấu
tạo âm tiết và kho ngữ vựng tiếng Ê Đê
Hoàng Thị Mỹ Lệ1, Phan Huy Khánh2
1
Trường Đại học Sư phạm Kỹ Thuật, Đại học Đà Nẵng
2
Trường Đại học Bách Khoa, Đại học Đà Nẵng
hoangthimyle.html@gmail.com
khanhph@dut.udn.vn
Tóm tắt. Hiện nay nhu cầu sử dụng, trao đổi văn bản tiếng dân tộc thiểu số ở Việt Nam nói
chung và tiếng Ê Đê nói riêng ngày càng nhiều. Yêu cầu đặt ra cho các văn bản là phải đảm
bảo đúng, chính xác và hiệu quả. Các yêu cầu này thực hiện được thì các văn bản phải được
kiểm tra chính tả, kiểm tra ngữ pháp… trước khi sử dụng hay trao đổi. Trong ứng dụng soạn
thảo văn bản MicroSoft Word đã có chức năng kiểm tra chính tả và ngữ pháp tiếng Anh ở
một mức độ tương đối nhất định. Đối với tiếng Việt cũng đã có các phần mềm kiểm tra chính
tả và phần nào cũng đã góp phần giải quyết bài toán phát hiện lỗi chính tả trong văn bản tiếng
Việt. Tuy nhiên, bài toán kiểm tra chính tả văn bản tiếng Ê Đê cho đến nay vẫn chưa được
quan tâm nghiên cứu của các nhà khoa học. Bước đầu nhằm góp phần giải quyết bài toán
kiểm tra chính tả văn bản tiếng Ê Đê, nghiên cứu đề xuất giải pháp kiểm tra chính tả văn bản
tiếng Ê Đê dựa vào mô hình cấu tạo âm tiết và kho ngữ vựng tiếng Ê Đê.
Keywords: Xử lý tiếng Ê Đê, Kiểm tra chính tả tiếng Ê Đê, Âm tiết tiếng Ê Đê, Kho ngữ
vựng tiếng Ê Đê, Dân tộc thiểu số.
1 Giới thiệu
Mọi hoạt động xử lý thông tin trên máy tính đều liên quan đến soạn thảo văn bản. Có nhiều
mục đích khác nhau trong soạn thảo văn bản: giao tiếp xã hội, các hoạt động hành chính-văn
phòng, tổ chức lưu trữ và tìm kiếm tài liệu, xây dựng các hệ thống thông tin, dịch thuật các ngôn
ngữ tự nhiên, trong các ứng dụng in ấn, chế bản điện tử… Bài toán kiểm tra chính tả là thành
phần quan trọng không thể thiếu trong các ứng dụng này [4], [10], [11].
Dựa vào loại hình ngôn ngữ, chính tả được kiểm tra theo các mức khác nhau. Với ngôn ngữ
không đơn lập (tiếng Anh, tiếng Pháp, tiếng Nga…) kiểm tra chính tả được thực hiện ở mức từ.
Với ngôn ngữ đơn lập (tiếng Hàn, tiếng Thái, tiếng Việt…) kiểm tra chính tả được thực hiện ở
các mức âm tiết, mức từ, mức câu. Tính chính xác của phương pháp kiểm tra chính tả ở mức âm
tiết và mức từ phụ thuộc vào chất lượng của từ điển âm tiết, từ điển từ vựng [3], [8].
Trong dạy và học tiếng dân tộc thiểu số ở Việt Nam nói chung và tiếng Ê Đê nói riêng, cũng
như trong các lĩnh vực khác, nhu cầu sử dụng và trao đổi bằng văn bản tiếng dân tộc thiểu số
ngày càng nhiều. Vì vậy, nhu cầu kiểm tra lỗi chính tả văn bản trước khi sử dụng là cần thiết.
Tuy nhiên, các văn bản nếu được kiểm tra theo lối thủ công thì mất nhiều thời gian và không
tránh khỏi sai sót. Có nhiều nguyên nhân dẫn đến sai sót, trong đó nguyên nhân chủ quan là do
người kiểm tra không kiểm tra hết văn bản, hoặc khi kiểm tra hết văn bản thì cũng chưa đảm
bảo văn bản đó đã đúng toàn bộ. Lỗi xãy ra nhiều nhất trong văn bản là lỗi chính tả do đánh
máy nhầm. Lỗi này thường xãy trên các văn bản được soạn thảo bởi những người chưa thông
thạo tiếng Ê Đê và chưa quen với cách gõ chữ cái tiếng Ê Đê.
- Hoàng Thị Mỹ Lệ, Phan Huy Khánh 183
Kiểm tra chính tả tiếng Anh đã có trong MicroSoft Word. Kiểm tra chính tả tiếng Việt cũng
đã được sự quan tâm nghiên cứu của các nhà khoa học. Một số phần mềm kiểm tra chính tả
tiếng Việt đã được công bố như: website VSpell.com của phần mềm soát lỗi chính tả tiếng Việt;
phần mềm Tummo Spell, VcatSpell, Vietspell, Copcon, VicheckSpell, Vietkey Office… phần
nào đã giải quyết bài toán phát hiện lỗi chính tả tiếng Việt trong văn bản. Cho đến nay bài toán
kiểm tra chính tả tiếng dân tộc thiểu số ở Việt Nam nói chung và tiếng Ê Đê nói riêng vẫn chưa
được sự quan tâm của các nhà khoa học.
Nhằm góp phần giải quyết bài toán kiểm tra chính tả văn bản tiếng Ê Đê ở mức âm tiết,
chúng tôi đề xuất giải pháp kết hợp mô hình cấu tạo âm tiết và kho ngữ vựng (KNV) tiếng Ê Đê
trong kiểm tra lỗi chính tả văn bản tiếng Ê Đê.
Áp dụng hướng tiếp cận này là dựa theo mô hình cấu trúc âm tiết tiếng Ê Đê, nhằm xác định
các âm tiết tiếng Ê Đê có cấu trúc âm tiết đúng và các âm tiết Ê Đê có cấu trúc âm tiết sai [5].
Sau đó dựa vào KNV tiếng Ê Đê đã được xây dựng [6], [7], tiếp tục kiểm tra các âm tiết sau khi
đã được kiểm tra mô hình cấu trúc âm tiết. Các âm tiết tiếng Ê Đê không có trong KNV, được
thông báo trên giao diện cho người dùng kiểm tra và chỉnh sửa.
Phần tiếp theo bài báo sẽ trình bày giải pháp kiểm tra chính tả âm tiếng tiết Ê Đê dựa vào mô
hình cấu tạo âm tiết tiếng Ê Đê và KNV tiếng Ê Đê giải quyết bài toán kiểm tra chính tả văn bản
tiếng Ê Đê. Cuối cùng là kết quả thực nghiệm và kết luận.
2 Kiểm tra chính tả âm tiết tiếng Ê Đê dựa vào mô hình cấu tạo âm tiết
tiếng Ê Đê
2.1 Cấu tạo âm tiết tiếng Ê Đê
Các âm tiết tiếng Ê Đê được thể hiện trên chữ viết thành một khối và được tách rời nhau
bằng dấu cách. Mỗi âm tiết bao gồm hai bộ phận chính: phần đầu và phần vần [12], [1], [2]. Cấu
tạo âm tiết tiếng Ê Đê được thể hiện trong Hình 1.
Phần đầu giữ vai trò phần đầu âm tiết có thể là: một phụ âm, tổ hợp hai phụ âm hay ba phụ âm.
Phần vần giữ vai trò vần âm tiết có thể là: một nguyên âm, bán nguyên âm + nguyên âm,
nguyên âm + bán nguyên âm, bán nguyên âm + nguyên âm + bán nguyên âm. Nguyên âm ở
phần vần có thể tách ra khỏi phụ âm cuối của vần.
Âm đệm có chức năng nối phần đầu với nguyên âm chính của vần và góp phần biến đổi âm
sắc của âm tiết. Hai bán nguyên âm u, i là các âm đệm.
Âm chính là yếu tố giữ âm sắc chủ yếu của âm tiết. Giữ vai trò âm chính bao giờ cũng là
nguyên âm.
Bán nguyên âm theo sau âm chính: các bán nguyên âm (o, u, i) hoặc một tổ hợp âm gồm
bán nguyên âm và một phụ âm họng (ĭ, ŏ).
Âm cuối có chức năng kết thúc âm tiết, có thể là một trong các phụ âm (p, t, č, k, h, m, n, ñ,
ng, l, r).
Hình 1. Cấu tạo âm tiết tiếng Ê Đê
- 184 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC”
Dựa trên 22 kiểu âm tiết khác nhau trong mô hình cấu tạo âm tiết tiếng Ê Đê [12]. và các
trường hợp kiểu âm tiết không có phần đầu, chúng tôi đã rút gọn 22 kiểu âm tiết còn 8 kiểu âm
tiết và bổ sung thêm 7 kiểu âm tiết không có phần đầu.
Trong 8 kiểu âm tiết rút gọn là gộp các trường hợp phần đầu âm tiết là một phụ âm hay tổ
hợp hai phụ âm và ba phụ âm thành một trường hợp chung là phần đầu âm tiết.
Trong 7 kiểu âm tiết bổ sung có một trường hợp kiểu âm tiết không có trong từ điển đó là
trường hợp nguyên âm + bán nguyên âm. Vì vậy, trong 7 kiểu âm tiết bổ sung chỉ còn 6 kiểu âm
tiết không có phần đầu.
Tập mô hình cấu tạo âm tiết tiếng Ê Đê được đề xuất, gồm có 14 mô hình âm tiết (xem
Bảng 1).
Bảng 1. Mô hình âm tiết tiếng Ê Đê
Stt Mô hình âm tiết Ví dụ Stt Mô hình âm tiết Ví dụ
1 V ĭ (sơ sinh) 8 CbVCe mđơt (ngắn)
2 VCe ung (chồng) 9 CbVS2 hmlei (bông gòn)
3 VS2Ce ơih (vâng) 10 CbVSCe hmiêt (gói ghém)
4 S1V iŭ (bơm) 11 CbS1V thiê (xui khiến)
5 S1VS2 iêu (gọi) 12 CbS1VS2 miêu (con mèo)
6 S1VCe uan (số) 13 CbS1VCe mđhiăr (lặp lại)
7 CbV ƀô̆ (mặt) 14 CbS1VS2Ce mbhuôih (chuốt)
2.2 Giải pháp kiểm tra chính tả âm tiết tiếng Ê Đê
Dựa vào tập 14 mô hình cấu tạo âm tiết tiếng Ê Đê trong Bảng 1, giải pháp kiểm tra chính tả
âm tiết tiếng Ê Đê được đề xuất, thể hiện trong mô hình kiểm tra chính tả âm tiết tiếng Ê Đê
(Hình 2).
Hình 2. Mô hình kiểm tra chính tả âm tiết tiếng Ê Đê
- Hoàng Thị Mỹ Lệ, Phan Huy Khánh 185
Hoạt động trong mô hình
Đầu tiên, tạo tập mô hình chuẩn của âm tiết Ê Đê theo cấu trúc âm tiết tiếng Ê Đê trong
Bảng 1.
Tiếp đến, dựa vào tập dữ liệu của các thành phần trong cấu trúc âm tiết Ê Đê (Cb, S1, V, S2,
Ce) chuyển đổi âm tiết tiếng Ê Đê cần kiểm tra sang mô hình âm tiết có cấu trúc
[Cb][S1][S2][Ce].
Trong đó, thành phần trong cặp dấu < > là bắt buộc phải có trong mô hình âm tiết tiếng Ê Đê
và thành phần trong cặp dấu [ ] là thành phần không bắt buộc phải có trong mô hình âm tiết
tiếng Ê Đê.
Ví dụ: âm tiết miêu (con mèo) chuyển thành sang mô hình âm tiết là CbS1VS2.
Sau cùng, kiểm tra mô hình của âm tiết đã chuyển đổi trong tập mô hình chuẩn của âm tiết
tiếng Ê Đê, từ đó kết luận được âm tiết kiểm tra có cấu trúc âm tiết đúng hay sai.
2.3 Mô đun chuyển đổi âm tiết Ê Đê sang mô hình âm tiết
- Đầu vào: Âm tiết tiếng Ê Đê, các hàm tách phụ âm đầu, tách nguyên âm, tách phụ âm cuối,
tách âm đệm và bán nguyên âm. Các hàm tách các thành phần trong mô hình âm tiết.
- Đầu ra: Mô hình âm tiết chuẩn hoặc kí tự dấu sao "*" (kí tự dấu sao "*" là mô hình không
thuộc mô hình âm tiết chuẩn của tiếng Ê Đê).
- Phương pháp:
Bước 1: Gọi hàm TACH_PAD(âm tiết), kiểm tra trong âm tiết có phụ âm đầu thì gán
MH = "Cb" và tách phụ âm đầu ra khỏi âm tiết.
Bước 2: Gọi hàm TACH_ADEM(âm tiết), kiểm tra trong âm tiết có âm đệm thì gán
MH=MH & "S1" và tách bán nguyên âm ra khỏi âm tiết.
Bước 3: Gọi hàm TACH_NA(âm tiết), kiểm tra trong âm tiết có nguyên âm thì gán MH
= MH & “V” và tách nguyên âm ra khỏi âm tiết, nếu không có nguyên âm thì trả về kí
tự dấu sao "*".
Bước 4: Gọi hàm TACH_BNA(âm tiết), kiểm tra trong âm tiết có bán nguyên âm đứng
sau nguyên âm thì gán MH = MH & "S2" và tách bán nguyên âm ra khỏi âm tiết.
Bước 5: Gọi hàm TACH_PAC(âm tiết), kiểm tra trong âm tiết có phụ âm cuối thì gán
MH = MH & "Ce" và tách phụ âm cuối ra khỏi âm tiết.
Bước 6: Kiểm tra âm tiết sau khi tách, nếu length(âm tiết) = 0 thì trả về MH, còn không
thì trả về kí tự dấu sao "*".
Bảng 2, minh họa ví dụ các âm tiết tiếng Ê Đê được chuyển sang mô hình âm tiết.
Bảng 2. Ví dụ âm tiết tiếng Ê Đê chuyển sang mô hình âm tiết
Čar Lâm Đồng ară anei mâo 700 anôk bruă dôk đuôm nư bảo hiểm
Âm tiết
yang ƀuôn, bảo hiểm mdrao mgŭn lehanăn bảo hiểm luič bruă mă,
tiếng Ê Đê
hŏng ênoh prăk jih jang truh êbeh 55 êklai prăk. [15]
Čar(CbVCe) Lâm(CbVCe) Đồng(*) ară(CbV) anei(CbVS2)
mâo(CbVS2) 700(*) anôk(CbVCe) bruă(CbS1V) dôk(CbVCe)
đuôm(CbS1VCe) nư(CbV) bảo(*) hiểm(*) yang(CbVCe)
Âm tiết tiếng Ê Đê chuyển ƀuôn(CbS1VCe), bảo(*) hiểm(*) mdrao(CbVS2) mgŭn(CbVCe)
sang mô hình âm tiết lehanăn(*) bảo(*) hiểm(*) luič(CbS1VCe) bruă(CbS1V)
mă(CbV), hŏng(CbVCe) ênoh(CbVCe) prăk(CbVCe)
jih(CbVCe) jang(CbVCe) truh(CbVCe) êbeh(CbVCe) 55(*)
êklai(CbVS2) prăk(CbVCe).
- 186 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC”
3 Kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mô hình cấu tạo âm tiết
và kho ngữ vựng tiếng Ê Đê
3.1 Xây dựng kịch bản kiểm tra chính tả văn bản tiếng Ê Đê
- Đầu vào: Văn bản tiếng Ê Đê, KNV Ê Đê, tập mô hình âm tiết tiếng Ê Đê chuẩn.
- Đầu ra: Văn bản tiếng Ê Đê được kiểm tra lỗi chính tả.
- Phương pháp: Hoạt động theo mô hình kiểm tra lỗi chính tả văn bản tiếng Ê Đê được trình
bày trong Hình 3.
Hình 3. Mô hình kiểm tra chính tả văn bản tiếng Ê Đê dựa vào
cấu tạo âm tiết tiếng Ê Đê và kho ngữ vựng tiếng Ê Đê
Bước 1: Xử lý loại các nhiễu là sai âm tiết trong văn bản bằng cách lọc các ký tự dư
thừa, các ký tự phụ.
Bước 2: Tách âm tiết trong văn bản tiếng Ê Đê thành tập các âm tiết tiếng Ê Đê. Trong
văn bản tiếng Ê Đê, các âm tiết được phân biệt với nhau qua kí tự trắng. Dựa vào kí tự
trắng giữa các âm tiết cho việc thực hiện tách âm tiết.
- Hoàng Thị Mỹ Lệ, Phan Huy Khánh 187
Bước 3: Kiểm tra chính tả âm tiết tiếng Ê Đê đã được đề xuất để tách tập âm tiết tiếng
Ê Đê thành hai nhóm: tập âm tiết tiếng Ê Đê đúng và tập âm tiết tiếng Ê Đê sai. Tập âm
tiết tiếng Ê Đê sai được chuyển sang bước 4. Tập âm tiết tiếng Ê Đê đúng được chuyển
sang bước 5.
Bước 4: Kiểm tra các âm tiết tiếng Ê Đê sai trong KNV tiếng Ê Đê, xác định được các
âm tiết sai chính tả có trong KNV là các từ được vay mượn các ngôn ngữ khác. Các âm
tiết xác định sai chính tả không có trong KNV sẽ được thông báo trên giao diện cho
người sử dụng thực hiện kiểm tra và chỉnh sửa.
Bước 5: Kiểm tra tập âm tiết tiếng Ê Đê đúng trong KNV tiếng Ê Đê. Nếu các âm tiết
tiếng Ê Đê đúng không có trong KNV, thì thông báo trên giao diện cho người sử dụng
kiểm tra và xử lý.
Kết quả, các âm tiết trong văn bản tiếng Ê Đê đã được kiểm tra chính tả âm tiết dựa vào tập
14 mô hình âm tiết Ê Đê và KNV Ê Đê.
3.2 Triển khai ứng dụng
Dựa theo kịch bản giải quyết bài toán kiểm tra lỗi chính tả văn bản tiếng Ê Đê, nghiên cứu
đề xuất triển khai xây dựng ứng dụng kiểm tra lỗi chính tả văn bản tiếng Ê Đê theo hướng tiếp
cận kết hợp mô hình cấu tạo âm tiết và KNV tiếng Ê Đê, gồm các chức năng:
Kiểm tra lỗi chính tả: thực hiện theo bài toán kiểm tra lỗi chính tả văn bản tiếng Ê Đê. Sau
khi thực hiện chức năng kiểm tra lỗi chính tả, các âm tiết tiếng Ê Đê không có trong KNV được
đánh dấu cho người sử dụng kiểm tra.
Tìm kiếm và thay thế: cho phép người sử dụng sửa các từ sai chính tả trong văn bản.
Chức năng này thực hiện tìm kiếm và thay thế các từ trong văn bản theo yêu cầu của người
sử dụng.
3.3 Cài đặt thử nghiệm
Tiến hành cài đặt thử nghiệm ứng dụng kiểm tra lỗi chính tả văn bản tiếng Ê Đê và thu được
kết quả thực nghiệm khả quan.
Nhằm đảm bảo cho kết quả nghiên cứu và thử nghiệm, dữ liệu của các tệp văn bản
thử nghiệm được nhập thủ công từ sách học tiếng Ê Đê [13], [14], truyện đọc Ê Đê-Việt [9], báo
dân tộc và miền núi. Những tài liệu văn bản này có đặc thù: cấu trúc nhất quán, ngôn từ cụ thể,
ngắn gọn và các từ vựng chủ yếu tiếng địa phương Kpă.
Ứng dụng kiểm tra lỗi chính tả văn bản tiếng Ê Đê đã phát hiện được các lỗi chính tả âm tiết
trong các tệp văn bản thử nghiệm (Bảng 3). Các lỗi chính tả âm tiết phát hiện từ bộ công cụ,
cũng đã được chúng tôi kiểm tra trực tiếp thủ công trên các văn bản tài liệu gốc. Kết quả các
chính tả phát hiện được gồm các âm tiết là các danh từ riêng và do gõ nhầm phím.
Bảng 3. Kết quả thử nghiệm kiểm tra chính tả trên các tệp văn bản tiếng Ê Đê
Âm tiết sai được phát hiện
Loại văn bản Số âm tiết
Danh từ riêng Gõ nhầm Tổng cộng
Sách học tiếng Ê Đê 28.164 93 218 359
Truyện đọc Ê Đê Việt 47.952 174 392 613
Báo dân tộc và miền núi 56.004 7.056 569 6.672
- 188 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC”
Với kết quả cài đặt thử nghiệm đạt được, cho thấy rắng kết quả kiểm tra chính tả còn
phụ thuộc vào ngữ liệu đầu vào cho quá trình tiền xử lý văn bản như từ điển tên riêng, từ điển
viết tắt... Quá trình tiền xử lý văn bản cần sử dụng các ngữ liệu này để phân loại âm tiết và lọc
nhiễu trước khi thực hiện kiểm tra chính tả âm tiết. Với ngữ liệu đầu vào đầy đủ, hiệu suất khả
năng phát hiện lỗi chính tả âm tiết tiếng Ê Đê được nâng cao hơn.
4 Kết luận
Giải pháp kiểm tra chính tả văn bản tiếng Ê Đê dựa vào mô hình cấu tạo âm tiết và kho ngữ
vựng tiếng Ê Đê, góp phần giải quyết bài toán kiểm tra chính tả tiếng Ê Đê ở mức âm tiết trong
các văn bản tiếng Ê Đê.
Triển khai ứng dụng, chúng tôi đã xây dựng được ứng dụng kiểm tra chính tả văn bản tiếng Ê
Đê ở mức âm tiết. Ứng dụng này góp phần trợ giúp cho giáo viên, học sinh phát hiện và sửa các
lỗi chính tả âm tiết trên các văn bản soạn thảo bằng tiếng Ê Đê như các giáo trình, giáo án, các
bài học, bài tập...
Tài liệu tham khảo
1. Đoàn Văn Phúc, Ngữ âm Ê Đê, Nxb Khoa học xã hội, Hà Nội (1996).
2. Đoàn Văn Phúc, Từ vựng các phương ngữ Ê Đê, Nxb TP Hồ Chí Minh (1998).
3. Ela Kumar, Natural Language Processing, I. K. International Pvt Ltd (2011).
4. Gobinda G. Chowdhury, Natural language processing, Annual Review of Information Science and
Technology, 37. pp. 51-89 (2003).
5. Hoàng Thị Mỹ Lệ, Phan Huy Khánh, Basing on the Ede syllable models to check Ede syllable
misspelling, applying to improve the quality of Ede vocabulary corpus, Proceeding of the
International Conference on Advanced Technologies for Communications-ATC, pp. 158-162, HaNoi
(2016).
6. Hoàng Thị Mỹ Lệ, Phan Huy Khánh, Giải pháp xây dựng kho ngữ vựng song ngữ Việt-Ê Đê dựa trên
mô hình tương tác Việt-Ê Đê, Tạp chí Khoa học Công nghệ ĐHĐN, Số 5 (2), pp. 36–40 (2017).
7. Hoàng Thị Mỹ Lệ, Phan Huy Khánh, Deploying environment for processing Ede ethnic minority
language in Vietnam, Proceeding of the IEEE International Conference on System Science and
Engineering (ICSSE), pp. 174-177, HoChiMinh (2017).
8. Hodge, V.J. and Austin, A comparison of standard spell checking algorithms and a novel binary
neural approach, Proceeding of the IEEE Transactions on Knowledge and Data Engineering, pp.
1073-1081 (2003).
9. Phan Hồng, Nguyễn Văn Thú, Truyện đọc song ngữ Ê Đê-Việt, tập 1, 2, 3, Nxb Giáo dục Việt Nam
(2011).
10. Phan Huy Khánh, Xây dựng văn phạm xử lý văn bản. Ứng dụng cho các ngôn ngữ dân tộc thiểu số
Việt Nam, Kỷ yếu Hội thảo Khoa học (Kỷ niệm 30 năm ngày thành lập viện CNTT, Viện KH&CN
Việt Nam 1976-2006) (2006).
11. Phan Huy Khanh, A Survey on Vietnamese Language Processing and Multilingual Processing,
Proceeding of the NECTEC Conference, Phuket, ThaiLan, pp. 13-14 (2002).
12. Sở Giáo dục & Đào tạo Đăk Lăk, Ngữ Pháp tiếng Ê Đê, Nxb Giáo dục Việt Nam (2011).
13. Y-Hạ Niê Kdăm, Klei ÊĐê Hdruôn 1, 2, 3, Nxb Giáo dục Việt Nam (2013).
14. Y Čang Niê Siêng, Y ČôČ Mlô, Hdruôm Hră Hriăm Ê Đê, Sở Giáo dục Đăk Lăk (2007).
15. http://vov4.vov.vn/Ede/chuyen-muc/lam-dong-mnuih-nga-brua-at-kyua-brua-duh-mkra-duom-nu-
bao-hiem-c1300-171975.aspx
nguon tai.lieu . vn