Xem mẫu

LỜI NÓI ðẦU Giáo trình “Hệ thống tìm tin” ñược biên sọan nhằm cung cấp những kiến thức cơ bản về hệ thống tìm tin cho sinh viên chuyên ngành thông tin-thư viện. Nội dung giáo trình bao gồm 7 chương như sau: Chương 1: Tổng quan về hệ thống tìm tin. Chương 2: Hệ thống công cụ xử lý ngữ nghĩa trong các hệ thống tìm tin. Chương 3: Tổ chức thông tin trong hệ thống tìm tin Chương 4: Thiết kế hệ thống tìm tin Chương 5: Hệ thống tìm tin thủ công Chương 6: Hệ thống tìm tin tự ñộng hóa Chương 7: ðánh giá hiệu quả hoạt ñộng của hệ thống tìm tin Giáo trình này ñược biên soạn lần ñầu nên không tránh khỏi những thiếu sót. Rất mong nhận ñược ý kiến ñóng góp của các ñồng nghiệp và bạn ñọc ñể giáo trình ñược hoàn thiện hơn trong những lần xuất bản sau. Xin chân thành cảm ơn các ñồng nghiệp ở khoa Thư viện -Thông tin học, trường ðại học Khoa học xã hội và nhân văn Tp.Hồ Chí Minh, PGS.TS ðoàn Phan Tân, ThS.Vĩnh Quốc Bảo ñã nhiệt tình giúp ñỡ và có nhiều ý kiến ñóng góp cho tác giả trong quá trình biên soạn giáo trình. TP.Hồ Chí Minh, tháng 12 năm 2009 Tác giả 1 BẢNG CÁC TỪ VIẾT TẮT AACR: Quy tắc biên mục Anh-Mỹ (Anglo-American Cataloguing Rule) CSDL: Cơ sở dữ liệu CQTT: Cơ quan thông tin DDC: Khung phân lọai thập phân Dewey (Dewey Decimal Classification) DC: Yếu tố siêu dữ liệu cốt lõi Dublin (Dublin Core) HTTT: Hệ thống tìm tin HTTTTðH: Hệ thống tìm tin tự ñộng hóa LCSH: Bảng ñề mục chủ ñề của Thư viện Quốc hội Mỹ (Library of Congress Subject Headings MARC: Biên mục ñọc máy (Machine Readable Cataloging) MLCC: Mục lục chữ cái MLPL: Mục lục phân lọai NNTT: Ngôn ngữ tìm tin OPAC: Mục lục công công truy cập trực tiếp (Online Public Access Catalog) TðTC: Từ ñiển từ chuẩn 2 CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG TÌM TIN 1.1.Tìm tin 1.1.1. Khái niệm tìm tin Khái niệm tìm tin ñược nhiều tác giả ñề cập ñến trong nhiều tài liệu về các lĩnh vực khác nhau như thông tin học, thư viện học, khoa học máy tính… Sau ñây là một số ñịnh nghĩa về tìm tin. Theo TCVN 5453-1991, tìm tin là quá trình lựa chọn và ñưa ra từ một tập hợp tài liệu hay mảng tin nào ñó những tài liệu, thông tin thích hợp với nội dung yêu cầu tin. [8] Các tác giả cuốn “Cơ sở thông tin học” của Viện thông tin VINITI ñưa ra ñịnh nghĩa “Tìm tin là một tập hợp các công ñoạn ñược thực hiện với mục ñích tìm ra những tài liệu có chứa thông tin nhất ñịnh (sau ñó cung cấp chính các tài liệu ñó hoặc các bản sao của chúng) hoặc với mục ñích cung cấp các số liệu cụ thể ñể trả lời các câu hỏi ñược ñịnh trước”. [24] Theo C.T. Meadow, các thuật ngữ tìm tài liệu, tìm dữ kiện, chọn lọc dữ liệu và tìm tin ñược sử dụng ñể chỉ quá trình tìm các tài liệu ñáp ứng yêu cầu tin (tìm tài liệu) hoặc tìm thông tin trực tiếp (ba dạng tìm sau cùng). Vì vậy, “Tìm tin là quá trình tìm kiếm trong một mảng tin nào ñó những tài liệu chứa thông tin và việc tìm kiếm này không phụ thuộc vào bản chất, loại thông tin cần tìm và phương thức sử dụng thông tin ñó.” [22] Theo B.C.Vickery, tìm tin là quá trình lựa chọn thông tin từ một mảng tin. [31] Những ñịnh nghĩa trên cho thấy mặc dù cách diễn ñạt khác nhau nhưng có sự thống nhất tương ñối giữa các tác giả về ý nghĩa của thuật ngữ tìm tin. Như vậy, tìm tin là một thuật ngữ chung ñược sử dụng ñể phản ánh quá trình tìm kiếm tài liệu hoặc thông tin cần thiết trong một mảng tin nào ñó. Việc tìm kiếm tài liệu hoặc thông tin cần thiết ñược thực hiện một cách chọn lọc và thường ñòi hỏi nhiều công sức, thời gian và chi phí. Thư viện là một ví dụ ñiển hình về một tổ chức chuyên phục vụ cho việc tìm kiếm thông tin một cách chọn lọc. Một người dùng tin ñến thư viện không phải ñể ñọc toàn bộ tài liệu có trong thư viện mà ñể tìm tài liệu hoặc thông tin một cách chọn lọc nhằm thỏa mãn các nhu cầu tin của mình. Phương pháp hiệu quả nhất ñể tìm tài liệu hoặc thông tin cần thiết trong một thư viện bất kỳ là ñọc qua từng tài liệu của thư viện này. Tuy nhiên, trong thực tế không thể áp dụng phương pháp này vì số lượng tài liệu trong các thư viện thường rất lớn nên việc ñọc tất cả tài liệu ñể chọn ra những tài liệu cần thiết là không khả thi. Vì vậy, người ta sử dụng một phương pháp tìm tin khác, ñó là tìm tin theo các ñặc tính nội dung ngắn gọn hoặc theo các ñặc tính hình thức của tài liệu. 3 Có thể xem tìm tin như một quá trình truyền thông một cách gián tiếp giữa các tác giả hoặc những người tạo lập các biểu ghi với những người sử dụng thông tin. Các ngôn ngữ và các kênh của hệ thống truyền thông này khác với các hệ thống truyền thông khác như truyền thông ñại chúng hoặc truyền thông trực tiếp. Các ngôn ngữ ñược sử dụng trong hệ thống truyền thông này có thể là các ngôn ngữ tìm tin và/hoặc ngôn ngữ tự nhiên. Còn các kênh truyền thông có thể là các công cụ tìm tin như hệ thống mục lục, bảng tra, cơ sở dữ liệu…Nói cách khác, tìm tin là một quá trình tương tác giữa người sử dụng và các mảng tin thông qua các công cụ tìm tin khác nhau. 1.1.2. Quá trình tìm tin Tìm tin là một quá trình cơ bản của con người và nó liên quan mật thiết với việc học tập và giải quyết vấn ñề. Quá trình tìm tin ñược bắt ñầu với nhu cầu tin của người sử dụng. ðể ñạt ñược mục tiêu như giải quyết một vấn ñề, trả lời một câu hỏi cụ thể hoặc ñể thỏa mãn tính ham hiểu biết, người dùng tin có thể cần thông tin nhanh và ngắn gọn hoặc thông tin ñầy ñủ và chi tiết. Trong hình 1.1. là sơ ñồ của quá trình tìm tin. Mặc dù trông có vẻ rất ñơn giản nhưng về thực chất, quá trình tìm tin bao gồm nhiều qui trình phức tạp. Một số qui trình là qui trình công nghệ và liên quan ñến hệ thống tìm tin, giao diện người sử dụng…Các qui trình khác liên quan ñến bản chất và các ñặc trưng của nội dung thông tin và người dùng tin cụ thể. Thời gian thực hiện và mức ñộ phức tạp của quá trình tìm tin phụ thuộc vào khả năng nhận thức, trình ñộ và nhu cầu tin của người dùng tin. Quá trình tìm tin là một quá trình tương tác phụ thuộc vào khả năng của người dùng tin, sự phản hồi từ hệ thống tìm tin và các quyết ñịnh của người dùng tin về các hành ñộng tiếp theo dựa trên sự phản hồi này. Các chi tiết về nhu cầu tin ban ñầu của người sử dụng có thể thay ñổi. Các nhu cầu tin ban ñầu thường ñược ñiều chỉnh sau khi người tìm tin biết nhiều hơn về vấn ñề ñang tìm kiếm thông qua sự tương tác với các hệ thống tìm tin. Vì vậy, quá trình tìm tin tiếp tục ñến khi người dùng tin có ñược thông tin thỏa mãn nhu cầu tin ñã ñược ñiều chỉnh của mình. Công nghệ thích hợp, chẳng hạn hệ thống tìm tin và giao diện người sử dụng thích hợp, có thể thúc ñẩy quá trình nhưng ñó không phải là vấn ñề cơ bản nhất vì quá trình tìm tin phụ thuộc nhiều vào người dùng tin và nhu cầu tin của người dùng tin cũng như bản chất, số lượng và sự ña dạng của thông tin. 4 Nhu caàu tin Xaùc ñònh yeâu caàu tin Xaùc ñònh HTTT thích hôïp Ñaët yeâu caàu tin cho HTTT Nhaän keát quaû tìm Ñaùnh giaù keát quaû tìm Yeâu caàu tin ñöôïc thoûa maõn Khoâng thoûa maõn Thoûa maõn Keát thuùc 5 ... - tailieumienphi.vn
nguon tai.lieu . vn