Xem mẫu

 1. MÔN HỌC: XỬ LÝ TIẾNG NÓI Mục đích: – Cung cấp cho sinh viên những kiến thức cơ bản về lĩ h vực xử lý tiếng nói ề lĩnh ự ử tiế ói Giảng viên: Lê Bá Dũng Địa chỉ: Khoa Công nghệ Thông tin- Trường Đại tin- học Hàng Hải Việt Nam- số 484 Lạch Tray- Ngô Nam- Tray- Quyền- Quyền- Tp. Hải Phòng Email: dungleba@gmail.com Website khóa học: – http://www fit vimaru edu vn/cntt/ dunglb/teaching/spee http://www.fit.vimaru.edu.vn/cntt/~dunglb/teaching/spee chprocessing08
 2. NỘI DUNG CHÍNH Giới thiệu về xử lý tiếng nói Các kiến thức cơ bản về xử lý tín hiệu số Các mô hình số cho tín hiệu tiếng nói Các mô hình trong miền thời gian cho xử lý tiếng nói Biểu diễn số cho dạng sóng tiếng nói Tổng hợp tiếng nói g ợp g Nhận dạng tiếng nói
 3. TÀI LIỆU THAM KHẢO Xuedong Huang, Alex Acero, Hsiao Wuen Hon, Spoken Language Processing, Prentice Hall, 2001 Lawrence R.Rabiner, Ronald W.Schafer, Di it l L R R bi R ld W S h f Digital Processing of Speech Signal, Prentice Hall, 1978.
 4. Bài 1: Giới thiệu Tiếng nói là các chuỗi âm thanh được phát ra từ bộ máy phát âm của con người Mục đích của tiếng nói là dùng để giao tiếp
 5. Quá trình giao tiếp bằng tiếng nói Thông tin muốn trao đổi được chuyển thành tập hợp các tín hiệu nơron được dùng để điều khiển các bộ phận trong bộ máy phát ể âm (lưỡi, môi, họng, ..) S chuyển độ của các bộ phận này tạo ra Sự h ể động ủ á hậ à một dãy các cử chỉ, kết quả của nó là sóng âm tương ứng mang thông tin cần trao đổi
 6. Thông tin được giao tiếp thông qua tiếng nói có thể được biểu diễn bằng sự ghép nối nhiều thành phần từ một tập hợp hữu hạn các ký hiệu Ký hiệ mà dựa vào đó mỗi âm thanh có hiệu à d à ỗi â h h ó thể mang ý nghĩa được gọi là âm vị Mỗi ngôn ngữ có tậ hợ các â vị của ô ữ ó tập hợp á âm ị ủ riêng nó, thông thường số lượng từ 30 đến 50
 7. Quá trình xử lý tín hiệu
 8. Quá trình xử lý tín hiệu tiếng nói Nguồn thông tin: người nói Lượng giá: dạng sóng của âm thanh ợ gg ạ g g Biểu diễn tín hiệu: biểu diễn tín hiệu dưới dạng số Biến đổi tín hiệu: chuyển tín hiệu sang một dạng thích hợp hơn Trích xuất và sử dụng thông tin: có thể được thực hiện bởi người nghe hoặc máy tự động độ
 9. Các ứng dụng xử lý tiếng nói
 10. Các ứng dụng xử lý tiếng nói Truyền và lưu trữ tiếng nói: mã hóa tiếng nói (voice coder). Mục đích của mã hóa tiếng nói là làm giảm thiểu băng thông cần ể thiết để truyền tiếng nói Các Cá hệ thống tổng h tiếng nói: các hệ hố ổ hợp iế ói á thống trả lời tự động bằng máy tính là các hệ thống cung cấp thông tin dạng số tự động cho người sử dụng dưới dạng tiếng nói
 11. Hệ thống định danh người nói: là các hệ thống có khả năng xác định người đang truy cập hệ thống có hợp lệ hay không thông qua tiếng nói của người đó Cá hệ thống nhận d Các hố hậ dạng tiếng nói: là các iế ói á ứng dụng chuyển đổi dạng sóng âm thanh sang thông tin dạng viết tương đương
 12. Nâng cao chất lượng tín hiệu: là các ứng dụng như loại bỏ nhiễu, loại bỏ tiếng vang trong tiếng nói