Xem mẫu

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI & NHÂN VĂN KHOA THÔNG TIN – THƯ VIỆN -----o0o----- ĐỖ THỊ THANH HUYỀN TÌM HIỂU PHẦN MỀM THƯ VIỆN SỐ VÀ ỨNG DỤNG XÂY DỰNG THƯ VIỆN SỐ Ở THƯ VIỆN TẠ QUANG BỬU KHÓA LUẬN TỐT NGHIỆP NGÀNH: THÔNG TIN – THƯ VIỆN Hệ đào tạo: Chính quy Khóa: QH-2007-X Giảng viên hướng dẫn: Th.S. Nguyễn Thị Thúy Hạnh Hà Nội - 05/2011 Bàn Thị Năm K52 Thông tin – Thƣ viện 1
  2. LỜI NÓI ĐẦU ................................................................................................4 1. Tính cấp thiết của đề tài.................................................................................... 5 2. Mục đích nghiên cứu ........................................................................................ 6 3. Đối tƣợng nghiên cứu ....................................................................................... 6 4. Phạm vi nghiên cứu .......................................................................................... 7 CHƯƠNG I. THƯ VIỆN SỐ VÀ NHỮNG VẤN ĐỀ VỀ THƯ VIỆN SỐ7 1.1 Thƣ viện và các mô hình thƣ viện .................................................................. 7 1.1.1 Khái niệm thƣ viện .................................................................................. 7 1.1.2 Chức năng của thƣ viện ........................................................................... 8 1.1.3 Các mô hình thƣ viện ngày nay. .............................................................. 9 1.2 Công nghệ thƣ viện số và các vấn đề liên quan ........................................... 12 1.2.1 Đặc điểm của thƣ viện số ....................................................................... 12 1.2.2 Lợi ích của thƣ viện số .......................................................................... 13 1.2.3 Kiến trúc và Kiến trúc thông tin của thƣ viện số. .................................. 14 1.2.4 Nền tảng thƣ viện số .............................................................................. 18 1.2.5 Các dịch vụ Thƣ viện số. ....................................................................... 27 1.2.6 Web Services ......................................................................................... 29 1.2.7 Bài toán tích hợp thƣ viện số. ............................................................... 30 CHƯƠNG II: PHẦN MỀM THƯ VIỆN SỐ ............................................32 2.1 Các yêu cầu về quản lý thƣ viện số .............................................................. 32 2.1.1 Yêu cầu chung ....................................................................................... 32 2.1.2 Yêu cầu về công nghệ nền tảng ............................................................ 33 2.1.3 Yêu cầu về chuẩn thƣ viện ..................................................................... 35 2.1.4 Yêu cầu về chuẩn nghiệp vụ thƣ viện .................................................... 35 2.2 Các phần mềm thƣ viện số ........................................................................... 39 2.2.1 Giới thiệu chung .................................................................................... 39 2.2.2 Phần mềm Greenstone .......................................................................... 40 2.2.3 Phần mềm Dspace.................................................................................. 41 2.2.4 Phần mềm Feroda .................................................................................. 43 Bàn Thị Năm K52 Thông tin – Thƣ viện 2
  3. 2.2.5. So sánh các phần mềm và phản hồi của ngƣời dùng ............................ 44 2.3 Đặc điểm của Dspace ................................................................................... 47 2.3.1 Mô hình đối tƣợng trong Dspace ........................................................... 47 2.3.2 Kiến trúc của Dspace ............................................................................. 48 2.3.3 Tiến trình của Dspace ............................................................................ 48 2.3.4 Dspace Workflow .................................................................................. 49 2.3.5 Quản lí ngƣời dùng trong DSpace ......................................................... 51 2.3.6 Quản lí tài liệu trong DSpace................................................................ 52 2.3.7 Manakin cho Dspace.............................................................................. 52 CHƯƠNG III: ỨNG DỤNG XÂY DỰNG THƯ VIỆN SỐ Ở THƯ VIỆN ĐẠI HỌC BÁCH KHOA HÀ NỘI ............................................................55 3.1 Vài nét về thƣ viện Tạ Quang Bửu ............................................................... 55 3.1.1 Lịch sử hình thành và phát triển ............................................................ 55 3.1.2. Chức năng, nhiêm ̣ vu ̣ của Thư viêṇ Ta ̣ Quang Bửu.......................57 3.1.3 Khảo sát trực trạng thƣ viện Tạ Quang Bửu .......................................... 60 3.2 Mục tiêu xây dựng thƣ viện số ở thƣ viện Tạ Quang Bửu ........................... 62 3.3 Tiến hành xây dựng thƣ viện số ở thƣ viện Tạ Quang Bửu ........................ 63 KẾT LUẬN...................................................................................................65 DANH MỤC HÌNH VẼ ...............................................................................66 DANH MỤC TÀI LIỆU THAM KHẢO ...................................................71 Bàn Thị Năm K52 Thông tin – Thƣ viện 3
  4. LỜI NÓI ĐẦU Thƣ viện là kho tri thức của xã hội; có ngƣời còn cho rằng thƣ viện là đền đài của văn hoá và sự uyên thâm. Đƣợc hình thành trong thời kỳ nông nghiệp thống trị trong tƣ duy của nhân loại, thƣ viện đã trải nghiệm qua một cuộc hồi sinh với việc phát minh ngành in trong thời kỳ Phục hƣng, và thực sự bắt đầu khởi sắc khi cuộc cách mạng công nghiệp bùng phát với hàng loạt những phát minh cơ giới hoá quy trình in ấn. Lịch sử thƣ viện đã trãi qua hơn 25 thế kỷ. Hình ảnh thƣ viện của thời xa xƣa đƣợc hình dung nhƣ là một cơ sở vững chắc trong đó chứa hàng ngàn phiến Bàn Thị Năm K52 Thông tin – Thƣ viện 4
  5. đá khổng lồ đƣợc khắc chữ - thƣờng đƣợc gọi là "rừng bia". Qua nhiều năm cùng với sự tiến hoá của nhân loại, con ngƣời càng tiến bộ trong nhận thức và thƣ viện ngày càng đƣợc phát triển. Giai đoạn Quản lý tƣ liệu đã trải qua một thời gian dài theo sự phát triển đó. Cho đến một lúc, cũng xuất phát từ ý định ban đầu là làm tốt công việc lƣu trữ và bảo quản, thƣ viện đã chú trọng đến việc xem ngƣời sử dụng là trung tâm, với sự nhấn mạnh đến việc trao đổi thông tin. Điều này cũng đồng thời để đáp ứng yêu cầu thông tin ngày càng gia tăng. Giai đoạn Quản lý thông tin đƣợc xem nhƣ bắt đầu. Và chúng ta sẽ nhận thức đƣợc rằng để xây dựng thƣ viện số là ta đã bắt đầu bƣớc qua một giai đoạn phát triển mới của thƣ viện: Giai đoạn Quản lý tri thức. Cùng với sự phát triển của mạng lƣới truyền thông và công nghệ thông tin (CNTT), hiện nay trên thế giới nhiều thƣ viện số (TVS) đã ra đời và ngày càng phát triển mạnh mẽ. Sự ra đời của TVS là một tất yếu của cuộc cách mạng khoa học kỹ thuật trong giai đoạn bùng nổ thông tin hiện nay. 1. Tính cấp thiết của đề tài Thƣ viện số đã hình thành và phát triển hơn mƣời năm nay trên thế giới. Đó là một hình thức phục vụ tài liệu điện tử và liên thông trên phạm vi toàn cầu mang đến hiệu quả cao nhất trong việc đáp ứng nhu cầu thông tin cho ngƣời sử dụng khắp nơi trên thế giới. Tại hội nghị quốc tế lần thứ năm về Thƣ viện số Châu Á (ICADL 2002) tại Singapore từ 11-14/12/2002 cho thấy rằng thƣ viện số Châu Á đã đạt đến một mức độ phát triển cao trong đó có nhiều nƣớc trong khu vực Đông Nam Á. Hiện nay các thƣ viện trên thế giới và trong khu vực đã đạt đến một mức độ hiện đại cao về hạ tầng cơ sở và công nghệ để phát triển và khai thác thƣ viện số. Giá trị thƣ viện ngày nay là chỗ thƣ viện sử dụng công nghệ nhƣ thế nào để Bàn Thị Năm K52 Thông tin – Thƣ viện 5
  6. đáp ứng mọi nhu cầu của độc giả từ mọi nguồn thông tin khắp nơi trên thế giới thông qua thƣ viện số. Thƣ viện Việt Nam có đủ khả năng về hiện đại hóa hạ tầng cơ sở nhƣng hiện nay do thiếu trình độ quản lý, thiếu nhận thức và thông tin về hiện đại hóa, lúng túng và không biết sử dụng công nghệ nên khắp nơi đang lãng phí thời gian và ngân sách từ nhiều nguồn kể cả nguồn vay nƣớc ngoài trong hoạt động thƣ viện một cách nghiêm trọng. Trong khi hoàn toàn có thể đi tắt đón đầu, sử dụng công nghệ mới để hội nhập với hệ thống thƣ viện trên thế giới. Trong đó việc ứng dụng phần mềm các phần mềm thƣ viện số để xây dựng thƣ viện số ở các thƣ viện nƣớc ta hiện nay là một điển hình. Xây dựng thành công thƣ viện số mang ý nghĩa đặc biệt nhƣ một bƣớc ngoặt trên con đƣờng hiện đại hóa ngành thông tin thƣ viện – con đƣờng của sự phối hợp giữa công nghệ thông tin và thƣ viện. Từ đấy, mọi nghiên cứu khoa học thông tin thƣ viện chính là nghiên cứu công nghệ thông tin. Xuất phát từ thực tế trên, em đã đi đến lựa chọn tìm hiểu và nghiên cứu đề tài: “Tìm hiểu phần mềm thƣ viện số và ứng dụng xây dựng thƣ viện số ở Thƣ viện Tạ Quang Bửu”, nhằm lựa chọn những phần mềm thƣ viện số ƣu việt, và hình mẫu ứng dụng xây dựng thƣ viện số ở thƣ viện Tạ Quang Bửu – một trong những thƣ viện Đại học đi đầu trong ứng dụng CNTT, để từ có đó đƣợc những định hƣớng tốt nhất trong việc xây dựng thƣ viện số ở nƣớc ta. 2. Mục đích nghiên cứu Mục đích nghiên cứu của khóa luận là nhằm nghiên cứu các phần mềm thƣ viện số đang đƣợc sử dụng rộng rãi hiện nay, có nhiều ƣu điểm và phù hợp với đặc điểm của các thƣ viện nƣớc ta. Bên cạnh đó, khóa luận đi vào tìm hiểu việc ứng dụng xậy dựng thƣ viện số ở Thƣ viện Tạ Quang Bửu để có đƣợc cái nhìn khái quát hơn trong việc việc định hƣớng xây dựng thƣ viện số ở nƣớc ta. 3. Đối tượng nghiên cứu Bàn Thị Năm K52 Thông tin – Thƣ viện 6
  7. Nghiên cứu các phần mềm thƣ viện số và việc ứng dụng xây dựng thƣ viện số ở thƣ viện Tạ Quang Bửu. 4. Phạm vi nghiên cứu Nghiên cứu các phần mềm thƣ viện số đang đƣợc ứng dụng rộng rãi và xây dựng thƣ viện số tại Thƣ viện Tạ Quang Bửu trong thời gian hiện nay. CHƢƠNG I. THƢ VIỆN SỐ VÀ NHỮNG VẤN ĐỀ VỀ THƢ VIỆN SỐ 1.1 Thư viện và các mô hình thư viện 1.1.1 Khái niệm thư viện Thuật ngữ “thƣ viện” xuất phát từ chũ Hy Lạp bibliotheca. “Biblio” nghĩa là sách, “theca” là nơi bảo quản. Hiểu theo nghĩa đen, thƣ viện là nơi bảo quản sách, nơi tàng trữ sách báo. Ngày nay, thƣ viện đƣợc định nghĩa nhƣ sau: “TV là cơ quan TT, văn hoá giáo dục có VTL nhân bản đƣợc tổ chức và đƣa ra cho các pháp nhân, cá nhân ngƣời sử dụng có thời hạn” (Liên Bang Nga) “TV- một sƣu tập những TL đã đƣợc tổ chức để đáp ứng nhu cầu của một nhóm ngƣời mà TV có bổn phận phục vụ, để cho họ có thể sử dụng cơ sở của TV, truy dụng thƣ tịch cũng nhƣ trau dồi kiến thức của họ”. (Các nhà Thƣ viện học Mỹ) “TV là một bộ sƣu tập sách nhằm mục đích để đọc, để nghiên cứu hoặc tra cứu” (Bách khoa toàn thƣ Anh) “TV không phục thuộc vào tên gọi, là bất cứ bộ sƣu tập có tổ chức nào của sách, ấn phẩm định kỳ hoặc các TL khác nhau, kể cả đồ họa, nghe nhìn và nhân Bàn Thị Năm K52 Thông tin – Thƣ viện 7
  8. viên phục vụ có trách nhiệm tổ chức cho bạn đọc sử dụng các TL đó nhằm mục đích TT, NCKH, GD hoặc giải trí” (Tuyên ngôn 1994 của UNESCO về thƣ viện công cộng) Nhƣ vậy trên thế giới tồn tại rất nhiều quan điểm khác nhau về thƣ viện. Tuy nhiên trong các định nghĩa trên, định nghĩa của UNESCO đƣợc các nhà thƣ viện học trên thế giới đánh giá là định nghĩa đầy đủ nhất về thƣ viện vì định nghĩa này nêu lên đƣợc những thành phần cấu tạo nên thƣ viện và các chức năng nhiệm vụ chủ yếu của nó. Thƣ viện đƣợc cấu thành từ 4 yếu tố: vốn tài liệu, cán bộ thƣ viện, ngƣời sử dụng, cơ sở vật chất kỹ thuật. Các yếu tố này có mối quan hệ qua lại, tác động chặt chẽ với nhau. 1.1.2 Chức năng của thư viện Thƣ viện có vai trò quan trọng trong công tác phục vụ nhu cầu đọc, tìm hiểu thông tin, nâng cao tri thức cho con ngƣời. Thƣ viện có một số chức năng chính nhƣ sau: Chức năng văn hóa: Thƣ viện thu thập, tàng trữ, bảo quản và truyền bá di sản văn hóa của nhân loại cũng nhƣ của đất nƣớc đƣợc lƣu giữ trong các tài liệu. Thƣ viện là trung tâm sinh hoạt văn hóa, trung tâm mở mang dân trí, tuyên truyền, phổ biến kiến thức về các loại hình nghệ thuật và lôi cuốn quảng đại quần chúng tham gia và hoạt động sáng tạo. Chức năng giáo dục: Ngay từ thời cổ đại, thƣ viện đã là một tổ chức giáo dục quan trọng. Chức năng giáo dục của thƣ viện đƣợc các thƣ viện công cộng thực hiện từ thế kỷ XVI, thể hiện ở các điểm chính sau: - Tham gia vào việc xóa mù chữ cho nhân dân Bàn Thị Năm K52 Thông tin – Thƣ viện 8
  9. - Nâng cao trình độ dân trí, chuyên môn cho các tầng lớp dân cƣ trong vùng. Cho đến nay, các thƣ viện hiện đại vẫn thực hiện chức năng giáo dục của mình. Chức năng thông tin: Thƣ viện với tƣ cách là cơ quan cung cấp thông tin thực hiện chức năng thông tin bằng cách: - Phục vụ thông tin – thƣ mục theo phƣơng thức cổ truyền cũng nhƣ hiện đại ngay tại thƣ viện: hệ thống mục lục, thƣ mục, cơ sở dữ liệu, phổ biến thông tin chọn lọc, bản tin điện tử… - Tiếp cận qua mạng để với tới nguồn lực của các thƣ viện khác và đảm bảo sự tiếp cận đó tới các nguồn thông tin điện tử cho bạn đọc không có điều kiện nhận đƣợc ngay từ nhà hoặc nơi làm việc của họ. Chức năng giải trí: Ngoài các kiến thức chuyên ngành, thƣ viện còn tham gia vào việc tổ chức sử dụng thời gian nhàn rỗi cho nhân dân bằng cách cung cấp sách báo và các phƣơng tiện nghe – nhìn khác để đáp ứng nhu cầu giải trí, góp phần giảm bớt mệt nhọc trong quá trình học tập và làm việc. 1.1.3 Các mô hình thư viện ngày nay. Cùng với sự phát triển của CNTT và khoa học công nghệ, thƣ viện không đơn thuần là nơi lƣu giữ sách, báo, tạp chí, nơi yêu tĩnh cho độc giả đến nghiên cứu, học tập mà thƣ viện còn trở thành một trung tâm thông tin đƣợc ứng dụng công nghệ cao. Từ đó, nhiều mô hình thƣ viện hiện đại cũng ra đời. Theo Barker (1997), có 4 dạng thƣ viện khả dĩ: - Thƣ viện đa phƣơng tiện; - Thƣ viện điện tử; - Thƣ viện số; Bàn Thị Năm K52 Thông tin – Thƣ viện 9
  10. - Thƣ viện ảo 1.1.3.1 Thư viện đa phương tiện. Là thƣ viện sử dụng hỗn hợp sách báo và nhiều phƣơng tiện lƣu trữ thông tin và tri thức khác nhau nhƣ băng đĩa video, vi phim, CD - ROM, phần mềm máy tính, vv. Quy trình và quá trình tổ chức và quản lí TVĐPT giống nhƣ thƣ viện truyền thống: việc tìm tài liệu cũng bằng tay, sử dụng bộ máy tra cứu bằng phiếu hoặc vi phim, vi phiếu... Cán bộ thƣ viện vẫn đóng vai trò quan trọng trong TVĐPT, mặc dù sử dụng máy tính nhƣng chƣa thể tự động hoá hoàn toàn các thao tác. Tại Việt Nam, một số cơ quan thông tin tƣ liệu và thƣ viện lớn đã và đang tổ chức một số phòng đọc đa phƣơng tiện phục vụ ngƣời sử dụng. 1.1.3.2 Thư viện điện tử Là thƣ viện mà các quá trình cơ bản về nghiệp vụ dựa trên cơ sở máy tính và các phƣơng tiện hỗ trợ khác. Dấu hiệu đặc trƣng của TVĐT là sử dụng phổ biến các phƣơng tiện điện tử trong lƣu giữ, tìm kiếm và cung cấp thông tin. Tuy nhiên, trong TVĐT, sách truyền thống vẫn tiếp tục tồn tại cùng với các ấn phẩm điện tử nên vẫn cần sự trợ giúp của cán bộ thƣ viện trong mọi hoạt động chuyên môn.  Đặc điểm của thƣ viện điện tử: - Thƣ viện phải có vốn tài liệu điện tử (là những tƣ liệu đƣợc lƣu giữ dƣới dạng số sao cho có thể truy nhập đƣợc bằng các thiết bị xử lý dữ liệu) - Phải đƣợc tin học hóa, phải có một hệ quản trị thƣ viện điện tử tích hợp, phải nối mạng. - Phải cung cấp và tạo điều kiện cho ngƣời sử dụng các dịch vụ điện tử (timg tin trong các cơ sở dữ liệu, yêu cầu và gia hạn mƣợn qua mạng..) Tóm tại, TVĐT phải sử dụng các phƣơng tiện điện tử trong việc thu thập, xử lý, tìm kiếm và phổ biến thông tin. Bàn Thị Năm K52 Thông tin – Thƣ viện 10
  11. 1.1.3.3 Thư viện số Nhiều định nghĩa đã đƣợc công bố trong giới học giả toàn cầu về thƣ viện nhằm định nghĩa rõ ràng một thƣ viện số. Dƣới đây là một số định nghĩa tiêu biểu về thƣ viện số: Một số thành viên Hiệp hội Thƣ Viện Số Hoa kỳ (Digital Library Federation) đã đƣa ra một định nghĩa, “Thƣ viện số là các tổ chức cung cấp tài nguyên, gồm các nhân viên chuyên biệt giúp lựa chọn, tổ chức, cung cấp khả năng truy cập thông minh, chỉ dẫn, phân phối, bảo quản tính toàn vẹn và sự thống nhất của các bộ sƣu tập số theo thời gian để đảm bảo làm sao chúng luôn sẵn có để truy xuất một cách dễ dàng và kinh tế nhất đối với một cộng đồng ngƣời dùng hoặc một nhóm cộng đồng ngƣời dùng” (Raitt, 1999). Hai học giả ngƣời Nga là Sokolova và Liyabev cho rằng thƣ viện số là một hệ thống phân tán có khả năng lƣu trữ và tận dụng hiệu quả các loại tài liệu điện tử khác nhau, mà giúp ngƣời dùng có thể truy cập và đƣợc chuyển giao thông tin dễ dàng qua mạng máy tính (Xiao, 2003). Nhiều học giả Trung Quốc lại có cùng quan điểm rằng “Một thƣ viện số trên thực tế không phải là một thƣ viện ở góc độ mở rộng không gian của nó; thay vào đó nó là trung tâm tài nguyên thông tin số chứa đựng tài nguyên thông tin đa phƣơng tiện. Một thƣ viện số tồn tại bằng việc số hóa thông tin, chẳng hạn nhƣ văn bản, ký tự, chữ viết, hình ảnh, video và âm thanh, đồng thời cung cấp cho ngƣời dùng các dịch vụ thông tin nhanh chóng và thuận tiện thông qua Internet, nhằm chuyển giao một hệ thống thông tin số mà trong đó việc chia sẻ nguồn tài nguyên luôn sẵn sàng” (Wang, 2003). Bàn Thị Năm K52 Thông tin – Thƣ viện 11
  12. Nhƣ vậy thƣ viện số đƣợc hiểu là: “một thƣ viện điện tử cao cấp, trong đó toàn bộ các tài liệu của thƣ viện đó đƣợc số hoá và đƣợc quản lý bằng một phần mềm chuyên nghiệp có tổ chức để ngƣời dùng tin dễ dàng truy cập, tìm kiếm và xem đƣợc nội dung toàn văn của chúng từ xa thông qua hệ thống mạng thông tin và các phƣơng tiện truyền thông” 1.1.3.4 Thư viện ảo Một loại thƣ viện số khác cung cấp một cổng thông tin nhằm vào thông tin điện tử ở nơi khác ngoài thƣ viện. Loại này đôi khi đƣợc gọi là thƣ viện ảo để nhấn mạnh rằng đây là thƣ viện mà bản thân không chứa nội dung. Những quản thủ thƣ viện đã dùng thuật ngữ này cách đây hơn mƣời năm để chỉ một loại thƣ viện chuyên cung cấp việc truy cập thông tin điện tử thông qua những chỉ điểm – pointers. Thƣ viện ảo đƣợc xác định theo kho tin của nó. Thƣ viện không có kho riêng, mà phụ thuộc vào kho của các thƣ viện khác. Thƣ viện ảo còn gọi là thƣ viện không tƣờng. Thƣ viện ảo cũng đƣợc định nghĩa theo dịch vụ của nó. Thƣ viện ảo không phải quản trị kho tin, mà tiến hành lựa chọn, thu thập, tổ chức thông tin cho yêu cầu của ngƣời dùng riêng biệt. Thƣ viện là một trung tâm tra cứu tới các tài liệu hƣớng dẫn, bảng tra, tài liệu tóm tắt và các công cụ khác để nâng cao việc truy cập các nguồn tin. 1.2 Công nghệ thư viện số và các vấn đề liên quan 1.2.1 Đặc điểm của thư viện số Mặc dù có sự khác nhau về lý giải trong nhiều định nghĩa về thƣ viện số, nhƣng những đĩnh nghĩa này lại tƣơng tự nhau về mặt bản chất cốt yếu. Vì vậy, từ những định nghĩa trên chúng ta có thể rút ra những đặc điểm khác biệt của thƣ viện số bao gồm: Bàn Thị Năm K52 Thông tin – Thƣ viện 12
  13. - Khả năng lƣu trữ khối lƣợng lớn tài nguyên thông tin khác nhau; - Khả năng lƣu trữ và chuyển giao tài nguyên thông tin bằng nhiều phƣơng tiện khác nhau; - Khả năng chuyển giao tài nguyên thông tin qua mạng; - Khả năng quản lý tài nguyên thông tin phân tán; - Khả năng chia sẻ thông tin ở cấp độ chuyên biệt cao; - Có công nghệ tìm kiếm và truy xuất thông minh; - Cung cấp dịch vụ thông tin không giới hạn thời gian và không gian. 1.2.2 Lợi ích của thư viện số - Mang lại thông tin cho NDT: TVS có thể sử dụng ở khắp mọi nơi, NDT có thể truy cập và tìm kiếm thông tin mọi lúc, mọi nơi theo cơ chế quản trị quyền truy cập. - Tăng cƣờng khả năng tìm kiếm thông tin: Thông qua các tiện ích phức tạp và đa dạng, đặc biệt là các dịch vụ tìm kiếm CSDL và các trang Web, máy tìm… - Tăng cƣờng việc chia sẻ thông tin: Các tổ chức, công ty, trƣờng đại học, viện nghiên cứu..đã và đang sử dụng và chia sẻ các nguồn tài nguyên thông tin trên Internet và TVS. - Giúp NDT truy cập thông tin kịp thời: Khoảng cách giữa việc sáng tạo thông tin và truy cập tới thông tin này là rất lớn trong thƣ viện truyền thống. TVS giảm thiểu tối đa khoảng cách này bằng cách xuất bản số và nhanh chóng tích hợp bổ sung thông tin vào các bộ sƣu tập và dịch vụ của TVS. Thông qua các tiện ích tìm kiếm cũng giúp NDT cập nhật thông tin nhanh chóng với khoảng thời gian nhanh nhất. Bàn Thị Năm K52 Thông tin – Thƣ viện 13
  14. - Giúp tăng cƣờng việc sử dụng thông tin: TVS phá vỡ hàng rào thời gian, không gian, ngôn ngữ và văn hóa. Thông tin đƣợc tạo ra từ nhiều nơi trên thế giới, nhiều nền văn hóa và các ngôn ngữ khác nhau đều có thể đƣợc NDT truy cập dễ dàng. Thông tin đƣợc đóng gói, chế biến để phục vụ mọi đối tƣợng. - Tăng cƣờng khả năng cộng tác: Chu trình giao lƣu, sử dụng và truyền bá thông tin của các học giả và nhà nghiên cứu đƣợc tăng cƣờng. - Giảm khoảng cách số: Ngày nay, CNTT và truyền thông, đặc biệt là Internet đã làm giảm khoảng cách giữa mọi ngƣời trên thế giới nhƣng giữa các quốc gia vẫn còn :khoảng cách số”, đó là khoảng cách về hạ tầng công nghệ, các tiện ích và các tài nguyên thông tin…Đó cũng là khoảng cách giữa các cá nhân, tổ chức ở các mức độ kinh tế - xã hội khác nhau,…(cơ hội tiếp cận CNTT & Internet, khả năng sử dụng trong các hoạt động khác nhau). 1.2.3 Kiến trúc và Kiến trúc thông tin của thư viện số. 1.2.3.1 Kiến trúc của thư viện số Một thƣ viện số thƣờng là một tập tích hợp các dịch vụ khác nhau nhƣ thu thập, phân loại, biên mục, lƣu trữ, tìm kiếm, bảo vệ và duy trì thông tin, hệ thống này tạo thành một tổ chức chặt chẽ, thuận tiện, cho việc truy cập và xử lý một số lƣợng lớn tài nguyên số. Các thƣ viện số là các việc thực thi kiến trúc của hạ tầng mạng, hệ thống máy tính, các phần mềm, phần cứng nhất định để tăng cƣờng tổ chức, thu thập, bảo trì và tận dụng thông tin. Thƣ viện số là một hệ thống phức tạp. Một thƣ viện số có thể là một hệ thống có kiến trúc đa tầng với nhiều chức năng khác nhau và các thƣ viện số có khác nhau thƣờng có mô hình và kiến trúc khác nhau. Tuy nhiên, kiến trúc chung Bàn Thị Năm K52 Thông tin – Thƣ viện 14
  15. cho một thƣ viện thƣờng gồm 4 thành phần cơ bản: giao diện ngƣời dùng, kho thông tin, hệ thống định danh và hệ thống tìm kiếm. Giao diện ngƣời dùng (User Interface): Thƣờng có 2 giao diện ngƣời dùng: - Giao diện dành cho ngƣời dùng tin thƣ viện - Giao diện cho cán bộ thƣ viện và ngƣời quản trị hệ thống Giao diện ngƣời dùng tin có hai phần: một là trình duyệt Internet tiêu chuẩn cho ngƣời sử dụng tƣơng tác thực với máy tính. Trình duyệt này nối với dịch vụ máy khách, đóng vai trò trung gian giữa trình duyệt và các thành phần khác của hệ thống. Dịch vụ máy khách cho phép ngƣời dùng xác định vị trí cũng nhƣ nội dung tìm kiếm, chúng diễn giải thông tin đƣợc cấu trúc từ những đối tƣợng số. Chúng thƣơng lƣợng các điều khoản và điều kiện, quản lý các điều kiện giữa các đối tƣợng số, ghi nhớ lại tình trạng của quá trình giao tiếp của các hệ thống khác nhau. Kho thông tin: Các kho thông tin lƣu trữ và quản lý các đối tƣợng số và các loại thông tin khác. Một thƣ viện số quy mô lớn có rất nhiều kho thông tin với nhiều loại hình, bao gồm các kho thông tin hiện có và các cơ sở dữ liệu hồi cố, tƣơng tác với kho này phải thông qua giao thức truy cập kho. Giao thức này nhận diện quyền và sự cho phép một khách hàng có thể truy cập vào kho, hỗ trợ trên quy mô lớn sự phân phối thông tin và tao ra một kiến trúc mờ đối với các giao diện đã đƣợc xác định rõ ràng. Hệ thống định danh: Bàn Thị Năm K52 Thông tin – Thƣ viện 15
  16. Đây là những yếu tố định danh có mục đích tổng quát đƣợc dùng để xác định các nguồn tin trên Internet trong một thời gian dài và để quản lý các tài liệu có trong kho hay trong cơ sở dữ liệu. Hệ thống định danh là một hệ thống máy tính nhằm cung cấp dịch vụ chỉ dẫn phân tán cho các định danh cho các nguồn tin trên Internet. Khi tƣơng tác với kho thông tin, hệ thống định danh tiếp nhận thông tin định danh của đối tƣợng số và gửi nó về kho thông tin nơi mà đối tƣợng số đƣợc lƣu trữ. Hệ thống tìm kiếm: Hệ thống tìm kiếm phải thiết kế để có những chỉ mục (Index) và mục lục (Catalog) để phát hiện ra thông tin cần tìm trƣớc khi truy xuất nó từ kho thông tin. Các Index này phải đƣợc quản lý độc lập và có rất nhiều giao thức. 1.2.3.2 Kiến trúc thông tin của thư viện số Trong thƣ viện số, thông tin đƣợc lƣu trữ dƣới dạng những đơn vị thông tin số cơ bản nhƣ bản đồ số hóa, một đoạn văn bản, một trang web hay một bức ảnh quét … Các tài liệu số thƣờng liên hệ với các tài liệu khác theo quan hệ bộ phận – toàn thể hay theo quan hệ trật tự. Chẳng hạn, một văn bản đƣợc số hóa có thể bao gồm các trang, chƣơng, bảng mục lục, ví dụ minh họa, … Trong hệ thống mạng toàn cầu (www), một văn bản tƣơng tự có thể bao gồm nhiều trang văn bản với hình đi kèm và đƣờng dẫn tới các thông tin khác. Theo phƣơng thức này, tài liệu đƣợc chia thành những tập hợp. Đó có thể là những tập hợp thông tin theo nghĩa đen, những nhóm thông tin do các nhà xuất bản cung cấp hay có thể là những trang tin đƣợc ngƣời chủ trang web đƣa lên. Những thông tin cùng loại đƣợc lƣu dƣới nhiều dạng khác nhau. Đôi lúc những định dạng này hoàn toàn tƣơng thích và có thể chuyển đổi dễ dàng từ Bàn Thị Năm K52 Thông tin – Thƣ viện 16
  17. dạng này sang dạng khác, nhƣng cũng có khi một loại thông tin lại đƣợc chứa trong những định dạng khác hẳn nhau. Do tính năng dễ thay đổi nên các sản phẩm số thƣờng xuyên phải thay phiên bản (chúng ta có thể thấy rõ điều này qua các trang web của một số tổ chức - họ thay đổi trang chủ của mình nhiều lần trong một tháng). Khi một tài liệu đƣợc chuyển đổi sang dạng số thì các định dạng của nó cũng đƣợc chuyển đổi nhiều lần. Ví dụ nhƣ một bức ảnh quét có thể có 3 phiên bản: bản lƣu trữ có độ phân giải cao, một phiên bản chất lƣợng trung bình, và một hình ảnh dạng phác thảo (thumbnail). Mỗi một yếu tố của thông tin số có chức năng và quyền truy cập khác nhau, phụ thuộc vào kích cỡ tài liệu và đặc điểm của hệ thống máy tính và mạng. Kiến trúc thông tin đƣợc mô tả ở đây cung cấp cách tiếp cận chung để tổ chức thông tin trong thƣ viện số theo cách hiệu quả, giúp cho các chƣơng trình máy tính có thể hiểu đƣợc cấu trúc của tài liệu và tiến hành các tƣơng tác theo mong muốn của ngƣời sử dụng. * Các nguyên tắc cơ bản: Kiến trúc thông tin đƣợc tổ chức theo các nguyên tắc cơ bản sau: Ngƣời sử dụng và các chƣơng trình ứng dụng của họ cần phải linh hoạt. Do ngƣời sử dụng có thể khai thác thông tin theo những cách thức khác nhau nên thông tin cần đƣợc tổ chức linh hoạt, không lệ thuộc quá nhiều vào cách thức truy cập, trình độ chuyên môn hay trình tự truy cập của họ. Bộ sƣu tập tài liệu cần đƣợc quản lý theo cách đơn giản. Cũng giống nhƣ các thƣ viện khác, một số cán bộ làm việc trong thƣ viện số mặc dù có chuyên môn tƣơng đối thấp vẫn phải quản lý một bộ sƣu tập tài liệu rất lớn. Do vậy, Bàn Thị Năm K52 Thông tin – Thƣ viện 17
  18. thông tin cần phải đƣợc kiến trúc theo cách thức đơn giản, cho phép các cán bộ thƣ viện tập trung vào những lĩnh vực họ cần phụ trách chứ không ôm đồm quá nhiều việc cùng lúc. Kiến trúc thông tin phải phản ánh đƣợc cơ cấu kinh tế xã hội và pháp lý của sự phát triển hạ tầng thông tin. Cụ thể những đặc tính đó là: có giá trị, phụ thuộc vào thời gian và các điều kiện khách quan, đƣợc truyền đạt thông qua các hệ thống mạng không bảo mật của các quốc gia. * Loại dữ liệu, siêu dữ liệu cấu trúc và siêu đối tƣợng Thông tin đƣợc cấu trúc dựa trên ba khái niệm cơ bản: Loại dữ liệu, siêu dữ liệu có cấu trúc và siêu đối tƣợng. - Loại dữ liệu mô tả những đặc tính của thông tin nhƣ loại định dạng hay phƣơng thức xử lý thông tin. - Siêu dữ liệu có cấu trúc là loại siêu dữ liệu mô tả phiên bản, các mối quan hệ và các đặc tính khác của tài liệu số. - Siêu đối tượng là đối tƣợng cho phép tham chiếu đến một tập hợp các đối tƣợng số. Theo cách hiểu đơn giản thì siêu đối tƣợng là danh mục liệt kê các nhóm đối tƣợng khác. Chẳng hạn nhƣ trong một tuyển tập thơ, mỗi một bài thơ là một đối tƣợng số và tuyển tập thơ đó đƣợc gọi là một siêu đối tƣợng. Cũng có lúc một siêu đối tƣợng chính là đối tƣợng số liệt kê các phiên bản đã đƣợc chuyển đổi của cùng một dữ kiện cụ thể. 1.2.4 Nền tảng thư viện số 1.2.4.1 Metadata Bàn Thị Năm K52 Thông tin – Thƣ viện 18
  19. Siêu dữ liệu (metadata) dùng để mô tả tài nguyên thông tin. Thuật ngữ “meta” xuất xứ là một từ Hy Lạp đùng để chỉ một cái gì đó có bản chất cơ bản hơn hoặc cao hơn. Vì vậy metadata là dữ liệu về dữ liệu. Theo tiến sĩ Warwick Cathro (Thƣ viện Quốc gia Úc) thì “siêu dữ liệu là những thành phần mô tả tài nguyên thông tin hoặc hỗ trợ thông tin truy cập đến tài nguyên thông tin”. Cụ thể trong tài liệu thì siêu dữ liệu đƣợc xác định là “dữ liệu mô tả các thuộc tính của đối tƣợng thông tin và trao cho các thuộc tính này ý nghĩa, khung cảnh và tổ chức. Siêu dữ liệu còn có thể đƣợc định nghĩa là dữ liệu có cấu trúc về dữ liệu”. Theo Gail Hodge siêu dữ liệu là “thông tin có cấu trúc mà nó mô tả, giải thích, định vị, hoặc làm cho nguồn tin trở nên dễ tìm kiếm, sử dụng và quản lý hơn. Siêu dữ liệu đƣợc hiểu là dữ liệu về dữ liệu hoặc thông tin về thông tin”Nói tóm lại thì siêu dữ liệu là thông tin mô tả tài nguyên thông tin. Mục đích đầu tiên và yêu cầu cốt lỗi nhất của siêu dữ liệu (metadata) là góp phần mô tả và tìm lại các tài liệu điện tử trên mạng Internet. Sự phát triển mạnh mẽ của Internet đã tạo ra sự bùng nổ của các loại dữ liệu đa dạng ở dạng số, văn bản, âm thanh, hình ảnh, tài liệu đa phƣơng tiện. Những tài liệu này có thể truy cập đƣợc trên mạng Internet song việc tìm kiếm chúng một cách hiệu quả và khoa học nhƣ với các hệ thống thông tin trực tuyến là hết sức khó khăn. Để góp phần tăng cƣờng chất lƣợng tìm kiếm các tài liệu số trên mạng Internet, ngƣời ta đã đƣa ra giải pháp sử dụng siêu dữ liệu. Thực ra trong hoạt động thông tin – thƣ viện truyền thống, từ lâu đã có những khái niệm liên quan đến siêu dữ liệu. Các bản thƣ mục chứa các dữ liệu mô tả đối tƣợng nhƣ cho sách , cho tạp chí thì chúng cũng đƣợc coi nhƣ là một dạng siêu dữ liệu. Với việc tự động hóa công tác biên mục, phiếu thƣ mục đƣợc thay thế bằng biểu ghi thƣ mục. Nhƣ vậy thành phần siêu dữ liệu còn có thể Bàn Thị Năm K52 Thông tin – Thƣ viện 19
  20. đƣợc trình bày trong biểu ghi, vì vậy biểu ghi này đƣợc coi là biểu ghi siêu dữ liệu (metadata record) của đối tƣợng đƣợc cơ sở dữ liệu quản lý. Với tài nguyên truyền thống trên giấy, thông tin mô tả đƣợc bố trí nằm ngoài đối tƣợng mà nó mô tả (Ví dụ, trên phiếu thƣ mục của mục lục thƣ viện, trong biểu ghi của CSDL). Nhờ những yếu tố mô tả nhƣ vậy, ngƣời ta có thể xác định và tìm kiếm lại đƣợc tài liệu một cách chính xác theo một vài yếu tố. Ngày nay, nguồn tài liệu điện tử phát triển nhanh chóng và sự phân tán trên mạng nhiều đến mức không thể xử lý đƣợc một cách thủ công nhƣ đã và đang áp dụng đối với tài liệu xuất bản trên giấy. Để xử lý đƣợc hết tài liệu điện tử phân tán, ngƣời ta phải áp dụng các phƣơng pháp tự động – sử dụng các chƣơng trình đặc biệt (đƣợc gọi theo nhiều cách khác nhau nhƣ: robots, crawlers, spiders,...). Do tài liệu điện tử đƣợc tạo ra, thông thƣờng không tuân thủ những quy định xuất bản truyền thống, không có những quy tắc nhất định giúp cho phép nhận dạng tự động đƣợc các yếu tố mô tả thông thƣờng nhƣ tác giả, địa chỉ về xuất bản, thông tin về khối lƣợng... nên cần thiết phải có những quy định thống nhất để các chƣơng trình tự động nhận dạng và xử lý chúng theo các yêu cầu nghiệp vụ. Những quy định nhƣ vậy đƣợc gọi là những quy định về siêu dữ liệu. Có thể thấy hiện nay, do nhiều chƣơng trình máy tính chỉ định chỉ số dựa vào một số thành phần hạn chế nhƣ nhan đề hoặc toàn văn nên không hỗ trợ những tìm kiếm đặc thù (ví dụ theo tác giả, theo chủ đề, theo lĩnh vực...). Vì thế để tạo điều kiện cho các chƣơng trình có thể đinh chỉ số tự động theo một số yếu tố xác định, ngƣời ta phải đƣa thêm vào tài liệu điện tử những thuộc tính bổ sung để tăng cƣờng mô tả tài nguyên thông tin. Các công cụ định chỉ số tự động sẽ đƣợc lập trình để nhận dạng các thuộc tính này và định chỉ số chúng, từ đó hỗ trợ tìm kiếm những thuộc tính đặc thù. Nhƣ vậy một bản ghi metadata bao gồm một tập hợp những thuộc tính hoặc tập hợp những phần tử cần thiết để mô tả các tài nguyên thông tin theo yêu Bàn Thị Năm K52 Thông tin – Thƣ viện 20
nguon tai.lieu . vn