Xem mẫu

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ QUỐC PHÒNG

HỌC VIỆN KỸ THUẬT QUÂN SỰ

NGÔ VĂN CƯƠNG

NGHIÊN CỨU KỸ THUẬT NHẬN DẠNG TIẾNG NÓI
TIẾNG VIỆT VÀ ỨNG DỤNG
Chuyên ngành: Hệ thống thông tin
Mã số: 60 48 01 04

LUẬN VĂN THẠC SĨ KỸ THUẬT

Hà Nội - Năm 2015

CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI
HỌC VIỆN KỸ THUẬT QUÂN SỰ

Cán bộ hướng dẫn chính: PGS.TS. Bùi Thế Hồng

Cán bộ chấm phản biện 1: TS. Trần Nguyên Ngọc

Cán bộ chấm phản biện 2: TS. Trần Thị Thu Hà

Luận văn thạc sĩ được bảo vệ tại:
HỘI ĐỒNG CHẤM LUẬN VĂN THẠC SĨ
HỌC VIỆN KỸ THUẬT QUÂN SỰ
Ngày tháng năm 2015

Tôi xin cam đoan:
Những kết quả nghiên cứu được trình bày trong luận văn là hoàn toàn
trung thực, của tôi, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ và
pháp luật Việt Nam. Nếu sai, tôi hoàn toàn chịu trách nhiệm trước pháp luật.
TÁC GIẢ LUẬN VĂN

Ngô Văn Cương

MỤC LỤC
Trang
Trang phụ bìa
Bản cam đoan
Mục lục
Các thuật ngữ viết tắt
Mở đầu ......................................................................................................... 1
Chương 1
CƠ SỞ LÝ THUYẾT XỬ LÝ TIẾNG NÓI
1.1. Lý thuyết âm thanh và tiếng nói .............................................................. 5
1.1.1. Nguồn gốc âm thanh:............................................................................ 5
1.1.2. Các đại lượng đặc trưng cho âm thanh:................................................. 5
1.1.2.1. Tần số của âm thanh: ......................................................................... 5
1.1.2.2. Chu kì của âm thanh: ......................................................................... 5
1.1.2.3. Tốc độ truyền âm: .............................................................................. 5
1.1.2.4. Cường độ âm thanh: ......................................................................... 5
1.1.2.5. Thanh áp:.......................................................................................... 6
1.1.2.6. Âm sắc: ............................................................................................ 6
1.1.2.7. Âm lượng: ........................................................................................ 6
1.1.3. Các tần số của âm thanh: ...................................................................... 6
1.1.4. Cơ chế tạo lập tiếng nói của con người: ................................................ 6
1.1.5. Mô hình lọc nguồn tạo tiếng nói: .......................................................... 7
1.1.6. Hệ thống nghe của người: ..................................................................... 8
1.1.7. Quá trình sản xuất tiếng nói và thu nhận tiếng nói: ............................... 9
1.1.8. Các âm thanh tiếng nói và các đặc trưng:............................................ 10
1.1.8.1. Nguyên âm: ..................................................................................... 10
1.1.8.2. Các âm vị khác: ............................................................................... 10
1.2. Giới thiệu về xử lý tiếng nói .................................................................. 11

1.3. Nhận dạng tiếng nói .............................................................................. 12
1.3.1. Bài toán nhận dạng tiếng nói .............................................................. 12
1.3.2. Các phương pháp nhận dạng tiếng nói ................................................ 14
1.3.2.1. Phương pháp âm học ngữ âm học .................................................... 14
1.3.2.2. Phương pháp nhận dạng mẫu .......................................................... 16
1.3.2.3. Phương pháp ứng dụng trí tuệ nhân tạo........................................... 18
1.4. Nhận dạng tiếng Việt ............................................................................. 19
1.4.1. Một số đặc điểm ngữ âm tiếng Việt .................................................... 19
1.4.2. Những thuận lợi và khó khăn đối với nhận dạng tiếng Việt ................ 20
1.4.2.1. Thuận lợi ......................................................................................... 20
1.4.2.2. Khó khăn ......................................................................................... 20

Chương 2
MÔ HÌNH NHẬN DẠNG TIẾNG NÓI
2.1. Các kiểu mô hình mạng nơron ............................................................... 22
2.1.1. Perceptron .......................................................................................... 24
2.1.2. Mạng nhiều tầng truyền thẳng (MLP)

25

2.2. Huấn luyện mạng nơron ........................................................................ 26
2.2.1. Các phương pháp học

26

2.2.2. Học có giám sát trong các mạng nơron ............................................... 28
2.2.3. Thuật toán lan truyền ngược ............................................................... 29
2.3. Các vấn đề trong xây dựng mạng MLP.................................................. 30
2.3.1. Chuẩn bị dữ liệu ................................................................................. 30
2.3.1.1. Kích thước mẫu ............................................................................... 30
2.3.1.2. Mẫu con........................................................................................... 32
2.3.2. Xác định các tham số cho mạng.......................................................... 32
2.3.2.1. Chọn hàm truyền ............................................................................. 32
2.3.2.2. Xác định số nơron tầng ẩn ............................................................... 33

nguon tai.lieu . vn