Xem mẫu
Nghiên cứu và cài đặt các thuật toán phân lớp dữ liệu với Maple
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
CAO HỌC CÔNG NGHỆ THÔNG TIN QUA MẠNG
LẬP TRÌNH SYMBOLIC VÀ ỨNG DỤNG
BÀI THU HOẠCH:
NGHIÊN CỨU VÀ CÀI ĐẶT CÁC THUẬT TOÁN PHÂN LỚP DỮ LIỆU VỚI MAPLE
Giảng viên:
PGS. TS. Đỗ Văn Nhơn
Học viên thực hiện:
Huỳnh Tuấn Anh
CH1101004
Khóa 6
GV: PGS. TS. Đỗ Văn Nhơn HVTH: Huỳnh Tuấn Anh
Nghiên cứu và cài đặt các thuật toán phân lớp dữ liệu với Maple
TpHCM, 02/2013
Lời cám ơn.
Em xin chân thành cám ơn PGS. TS. Đỗ Văn Nhơn đã tận tình hướng dẫn, chỉ bảo chúng em trong suốt thời gian học chuyên đề này.
Xin chân thành cám ơn quý thầy cô trong Trường Đại Học Công Nghệ Thông Tin, Đại Học Quốc Gia Tp.HCM đã tận tình giảng dạy, trang bị cho em những kiến thức quý báu, tạo mọi điều kiện tốt cho chúng em học tập và nghiên cứu.
Xin chân thành cám ơn gia đình và bạn bè đã ủng hộ, giúp đỡ và động viên em trong thời gian học tập và nghiên cứu.
Mặc dù đã cố gắng hoàn thành bài luận nhưng chắc chắn không tránh khỏi thiếu sót.
Em kính mong nhận được sự thông cảm và tận tình chỉ bảo của quý thầy cô.
Học viên thực hiện
Huỳnh Tuấn Anh
TpHCM, 02/2013
GV: PGS. TS. Đỗ Văn Nhơn HVTH: Huỳnh Tuấn Anh
Nghiên cứu và cài đặt các thuật toán phân lớp dữ liệu với Maple
Mục Lục
GV: PGS. TS. Đỗ Văn Nhơn HVTH: Huỳnh Tuấn Anh
Nghiên cứu và cài đặt các thuật toán phân lớp dữ liệu với Maple
Chương 1: THUẬT TOÁN FINDS 1. HỌC KHÁI NIỆM VÀ BÀI TOÁN CỤ THỂ
Theo Tom M.Mitchell: “Nhiều vấn đề học đòi hỏi các khái niệm tổng quát thu được
từ các ví dụ huấn luyện. … Vấn đề tự động kết luận về sự xác định tổng quát nhất của
một vài khái niệm, các ví dụ cho trước được ghi nhãn có phải là bộ phận của khái niệm
hay không, nhiệm vụ đó thường được xem như là học khái niệm.”
1.1. Học khái niệm
Cho trước các ví dụ huấn luyện. mỗi ví dụ huấn luyện cho biết có thuộc khái
niệm hay không? (thuộc: positive; không: negative)
Đưa ra khái niệm tổng quát phân loại tập huấn luyện. Khái niệm tổng quát là
hàm boolean được định nghĩa trên tập cá thể.
“Học khái niệm là đưa ra một hàm boolean từ tập input và putput của các ví dụ
huấn luyện” (Tom M.Mitchell – Machine Learning)
Ví dụ:
o (Input) Các ví dụ huấn luyện:
Tập các animal cùng thuộc tính của nó.
o (Output) Khái niệm được trích ra:
Bird
Cat
…
1.2. Bài toán cụ thể
(Input) Tập ví dụ huấn luyện gồm 4 cá thể sau:
o Tập này nói về những ngày (như thế nào đó) mà Aldo thích chơi
môn thể thao dưới nước của anh ta (Table 2.1 – Positive and
negative training examples gor thw target concept EnjoySport, Machine
Learning – Tom M.Mitchell, 2003).
Exampl AirTem
Sky
e p
1 Sunny Warm 2 Sunny Warm
3 Rainy Cold
Humidity Wind
Normal Strong High Strong
High Strong
Water Forecast
Warm Same Warm Same
Warm Change
EnjoySport
Positive Positive
Negative
GV: PGS. TS. Đỗ Văn Nhơn 4 HVTH: Huỳnh Tuấn Anh
Nghiên cứu và cài đặt các thuật toán phân lớp dữ liệu với Maple
4 Sunny Warm High Strong Cool Change Positive
Bảng 1.1 – Các ví dụ huấn luyện thuộc và không thuộc khái niệm đích EnjoySport
(Output) Khái niệm được học: “EnjoySport”
1.3. Giả thiết
Cũng được hiểu là khái niệm. Là hội của các ràng buộc trên thuộc tính của cá
thể.
X là cá thể, và X thoả mãn tất cả các ràng buộc trên giả thiết h thì h [hân loại
X là positive (h(X) = 1)
Ví dụ: Giả thiết là Aldo thích môn thể thao dưới nước vào nagỳ “cold days
with high humidity”, giả thiết được ghi là:
o , Clod, High, ?, ?, ?>
Giả thiết tổng quát nhất:
o , ?, ?, ?, ?, ?>
Giả thiết cụ thể nhất:
o <Ø, Ø, Ø, Ø, Ø, Ø>
1.4. Ký hiệu
Tập cá thể (set of instances)
o Tập được dùng để trích khái niệm từ đó
o Ký hiệu: X
o Ví dụ trên: tập cá thể = tập ngày, mỗi ngày có 6 thuộc tính.
Khái niệm đích (target concep)
o Khái niệm (hàm) được học.
o Ký hiệu: c
c: X {0,1}
Ví dụ trên: c(X) = 1 nếu EnjoySport = Yes
Ví dụ trên: c(X) = 0 nếu EnjoySport = No
Các ví dụ huấn luyện, gồm có:
...
- tailieumienphi.vn
nguon tai.lieu . vn