Xem mẫu

  1. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện LỜI CAM ĐOAN Tôi xin cam đoan nội dung Khóa luận do bản thân tự nghiên cứu, tìm tòi và học hỏi, dưới sự hướng dẫn và chỉ bảo của giáo viên hướng dẫn. Đề tài nghiên cứu Bảo quản thông tin số mang tính mới, chưa có khóa luận nào nghiên cứu trước đây. Trong quá trình thực hiện khóa luận, bên cạnh sự cố gắng nỗ lực không ngừng của bản thân, tôi đã luôn nhận được sự động viên và giúp đỡ nhiệt tình từ phía các thầy cô giáo, gia đình và bạn bè. Qua đây, tôi xin được gửi lời cảm ơn chân thành tới các thầy cô giáo và các bạn học khoa Thông tin – Thư viện khóa 2005-2009, đồng thời, tôi xin chân thành cảm ơn các thầy cô giáo, cô chú cán bộ công tác tại Trung tâm Thông tin Khoa học và Công nghệ Quốc gia, Trung tâm Học liệu Tổng hợp trường Đại học Quốc tế RMIT Việt Nam, xin chân thành cảm ơn chị Hoàng Tuyết Anh và tiến sỹ Dan Doner đã chỉ bảo và tạo điều kiện giúp tôi hoàn thành khóa luận của mình. Đặc biệt, tôi xin bày tỏ lòng kính trọng và biết ơn sâu sắc tới cô giáo, Thạc sỹ Nguyễn Thị Thúy Hạnh đã tận tình hướng dẫn, động viên và giúp đỡ tôi trong suốt thời gian thực hiện khóa luận này. Hà Nội, ngày 18 tháng 5 năm 2009 Sinh viên Nguyễn Thu Anh 1
  2. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện DANH MỤC BẢNG BIỂU, ĐỒ THỊ, SƠ ĐỒ ĐƢỢC THỂ HIỆN TRONG KHÓA LUẬN Trang Hình 1: Mô hình Đối tượng số 12 Hình 2: Sơ đồ biểu diễn mối quan hệ 17 Người dùng tin (Users) – Quyền (Right) – Nội dung thông tin số (Content) Hình 3: Sơ đồ quan hệ giữa công cụ truy nhập số và cán bộ 43 thư viện số Hình 4: Sơ đồ thể hiện nhiệm vụ, kỹ năng và vai trò cán bộ 47 thư viện số Hình 5:So sánh vai trò người cán bộ thư viện truyền thống 48 và hiện đại Hình 6: Biểu đồ phần trăm dân số sử dụng Internet tại Việt 70 Nam trong các năm 2005 đến 2008 2
  3. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện MỤC LỤC Trang PHẦN MỞ ĐẦU 6 PHẦN NỘI DUNG 10 CHƢƠNG 1: ĐỊNH NGHĨA BẢO QUẢN SỐ. NỘI DUNG CÔNG TÁC BẢO QUẢN SỐ 10 1.1 Định nghĩa bảo quản số và các vấn đề liên quan 10 1.1.1 Định nghĩa bảo quản số 10 1.1.2 Đối tượng số 11 1.1.3 Số hóa và quy trình số hóa 12 1.1.3.1 Lợi thế quan trọng của việc số hóa tài liệu 13 1.1.3.2 Quy trình số hóa tài liệu 14 1.1.4 Bảo quản số và bảo quản truyền thống 21 1.2 Nội dung công tác bảo quản số 22 1.2.1 Lựa chọn thông tin đưa vào bảo quản 22 1.2.2 Các nguyên nhân chủ yếu gây mất dữ liệu số 23 1.2.3 Bảo quản số 25 1.2.3.1 Làm mới dữ liệu (Refreshment) 25 1.2.3.2 Di trú dữ liệu (Migration) 26 1.2.3.3 Phần mềm đa chức năng (Emulation) 28 1.2.3.4 Bảo quản công nghệ (Technology Preservation) 28 1.3 Khảo sát Nhận thức vấn đề bảo quản thông tin số tại Trung tâm Thông tin Khoa học và Công nghệ Quốc gia 31 1.3.1 Cách hiểu khái niệm Bảo quản số 33 3
  4. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện 1.3.2 Đánh giá lợi thế của tài liệu số hóa 36 1.3.3 Nguyên nhân gây mất dữ liệu số 37 CHƢƠNG 2: VAI TRÕ NGƢỜI CÁN BỘ THƢ VIỆN SỐ VÀ CÁC KỸ NĂNG CẦN THIẾT ĐỐI VỚI NGƢỜI CÁN BỘ THƢ VIỆN SỐ 32 2.1 Vai trò người cán bộ thư viện số 32 2.2 Các kỹ năng cần thiết với người cán bộ thư viện số 34 2.2.1 Công cụ truy nhập thư viện số và các nguồn thông tin số cho cán bộ thư viện 35 2.2.2 Năng lực và kỹ năng của người cán bộ thư viện số 37 2.2.2.1 Kỹ năng quản lý 37 2.2.2.2 Các kỹ năng về công nghệ 37 2.2.2.3 Kỹ năng tìm kiếm và đánh giá 39 2.2.2.4 Dịch vụ khách hàng 39 2.2.2.5 Các kỹ năng khác 40 2.3 So sánh sự khác nhau giữa cán bộ thư viện số và cán bộ thư viện truyền thống 41 2.4 Khảo sát Nhận thức vai trò của người cán bộ thư viện số tại Trung tâm Thông tin Khoa học và Công nghệ Quốc gia 50 CHƢƠNG 3: CÔNG TÁC BẢO QUẢN SỐ TRÊN THẾ GIỚI VÀ THỰC TIỄN TẠI VIỆT NAM 55 3.1 Nhìn ra công tác bảo quản số trên thế giới 55 3.1.1 Các chương trình bảo quản số tại Thư viện Quốc gia New Zealand 55 3.1.1.1 Trang web MATAPIHI 56 3.1.1.2 Website lưu trữ - Một phần của chương trình lưu trữ số 4
  5. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện Thư viện Quốc gia New Zealand 59 3.1.2 Các dự án số hóa và bảo quản số thuộc Thư viện Quốc hội Mỹ 61 3.1.2.1 Chương trình Ký ức Mỹ (American Memory) 62 3.1.2.2 Chương trình Xây dựng hạ tầng và Bảo quản thông tin số Quốc gia thuộc Thư viện Quốc hội Mỹ 67 3.2 Công tác bảo quản số tại Việt Nam 70 3.2.1 Xu hướng tiếp cận thông tin số tại Việt Nam hiện nay 70 3.2.2 Một số khuyến nghị và giải pháp đối với công tác bảo quản số 72 3.2.2.1 Những thuận lợi sẵn có 72 3.2.2.2 Những khó khăn tồn tại 73 3.2.2.3 Một số khuyến nghị và giải pháp 74 PHẦN KẾT LUẬN 77 DANH MỤC TÀI LIỆU THAM KHẢO 78 PHỤ LỤC 5
  6. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện PHẦN MỞ ĐẦU 1. Tính cấp thiết của đề tài Trong thời đại ngày nay, khi nhìn vào lĩnh vực công nghệ ở bất kỳ quốc gia nào trên thế giới, chúng ta đều thấy một số điểm tương đồng rõ rệt: các mạng lưới liên kết và băng thông ngày càng mở rộng, công nghệ thông tin đặc biệt phát triển… dẫn đến sự truy cập tới các nguồn thông tin điện tử gia tăng một cách nhanh chóng. Không chỉ dừng lại trong phạm vi một đất nước, nhu cầu sử dụng thông tin điện tử tăng nhanh mạnh mẽ trên phạm vi toàn cầu thôi thúc các quốc gia trên thế giới hợp tác chia sẻ nguồn lực, phát triển liên kết mạng toàn cầu. Sự phát triển đó cho phép kết nối mạnh và rộng rãi, ví dụ như ở Việt Nam có thể truy cập tới mạng thông tin Úc, New Zealand, hay thậm chí tới Nhà Trắng - Mỹ. Sự phát triển công nghệ không những cho phép gia tăng số lượng truy cập, mà còn gia tăng khối lượng thông tin. Bằng chứng là hiện nay, khối lượng thông tin trên mạng đạt con số khổng lồ, khó có một phần mềm hay giải pháp nào có thể thống kê được. Tuy nhiên, số lượng khổng lồ không đồng nghĩa với chất lượng cũng “khổng lồ”. Làm thế nào để chúng ta có được nguồn thông tin trên mạng với chất lượng tốt nhất? Và một khi chúng ta có cơ hội truy cập vào nguồn tin tốt nhất đó, những gì chúng ta thu được sẽ làm thay đổi cách sống, hiệu quả học tập, làm việc của mỗi người. 6
  7. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện Thông tin số còn được tạo ra nhanh hơn cả tốc độ phát triển công nghệ. Sự ra đời ồ ạt đó tất yếu dẫn đến một môi trường thông tin số khó kiểm soát, khiến cho việc sử dụng thông tin số luôn đi kèm với sự nghi ngờ chất lượng của chúng. Do đó, mỗi quốc gia cần đặt ra vấn đề kiểm soát và quản lý nguồn thông tin đó như thế nào. Tựu trung lại, việc sử dụng hiệu quả nguồn thông tin số đặt ra vấn đề bảo quản kỹ thuật số, bởi bảo quản số không chỉ là bảo quản nội dung, mà còn bảo quản cả công nghệ và khả năng truy cập đến thông tin số. Hơn lúc nào hết, việc bảo quản số cần phải được tính toán cẩn thận và có sự quan tâm đúng đắn. 2. Mục tiêu và nhiệm vụ nghiên cứu Tác giả đưa ra một sự giới thiệu tổng hợp cách thức tạo nên thông tin dạng số hay quy trình số hóa tài liệu, các nhân tố ảnh hướng tới thông tin số và cách xử lý chúng. Nội dung nghiên cứu không nhằm cung cấp danh sách các phương pháp và thực hành chi tiết trong công tác bảo quản, mà chỉ đề cập tới những vấn đề cơ bản hỗ trợ hoạt động này. Ngoài ra, khóa luận đưa ra một số tiêu chuẩn về kỹ năng và năng lực cần có để đảm nhận vai trò người cán bộ thư viện số tương lai. Công trình được thực hiện nhằm khuyến khích cán bộ thư viện làm công tác bảo quản nói riêng và toàn bộ cá nhân sỡ hữu thông tin số nhận biết những tác nhân gây hại, đối mặt với chúng. Cùng với khoa học công nghệ kỹ thuật tiên tiến, hiện đại sẽ xây dựng một chính sách bảo quản số hợp lý và thiết thực nhất cho thư viện mình. Tựu trung lại, bài nghiên cứu đặt ra các vấn đề sau: 7
  8. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện - Hiểu được khái niệm “Bảo quản số” và các vấn đề liên quan; - Nắm được những nhân tố gây hủy hoại tài liệu số; - Phương pháp bảo quản cơ bản để hạn chế tối thiểu mất mát; - Vai trò người cán bộ thư viện số; - Nhìn ra công tác bảo quản trên thế giới; 3. Tình hình nghiên cứu theo hƣớng đề tài Thông tin số đã và đang tiếp tục được nghiên cứu dưới nhiều khía cạnh khác nhau, tuy nhiên Bảo quản thông tin số là một đề tài mới, quá trình nghiên cứu và khảo sát thực tế đã cho thấy hầu như chưa có một đề tài khoa học nào nghiên cứu về vấn đề này. 4. Đối tƣợng và phạm vi nghiên cứu Bảo quản có thể nghiên cứu dưới nhiều khía cạnh: bảo quản các dạng in ấn, bảo quản tài liệu điện tử, các dạng tài liệu không in ấn… Đối tượng và phạm vi nghiên cứu của đề tài là vấn đề bảo quản thông tin số ; các nguyên nhân chính yếu dẫn đến sự biến mất thông tin số, cũng như bước đầu hướng dẫn cách giảm thiểu sự mất mát này. Bên cạnh quá trình khảo sát thực tế tại Trung tâm Thông tin Khoa học và Công nghệ Quốc gia, tác giả nghiên cứu một số dự án bảo quản số của Thư viện Quốc gia New Zealand và Thư viện Quốc hội Mỹ. 5. Cơ sở lý luận và phƣơng pháp nghiên cứu - Khóa luận được viết trên cơ sở phương pháp luận chủ nghĩa duy vật biện chứng và duy vật lịch sử của Triết học Mác Lê Nin - Phương pháp nghiên cứu của khóa luận: 8
  9. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện + Nghiên cứu tài liệu + Tổng hợp, phân tích, đánh giá + Khảo sát thực tế bằng phiếu hỏi và phỏng vấn trực tiếp 6. Đóng góp về lý luận và thực tiễn - Về lý luận: Khẳng định tầm quan trọng và vai trò của công tác bảo quản tài thông tin trong kỷ nguyên số, làm nổi bật vai trò quan trọng của người cán bộ thư viện hiện đại. - Về thực tiễn: Đưa ra cái nhìn cụ thể về các dự án bảo quản thông tin số trên thế giới. Khảo sát mức độ nhận thức vấn đề bảo quản số nói chung và kỹ năng cần có của người cán bộ thư viện số hiện đại. Dựa trên công trình nghiên cứu, các cá nhân hoặc tổ chức có thể tự xây dựng cho mình một dự án số hóa tài liệu và đề ra các biện pháp bảo quản thông tin số hiệu quả. 7. Bố cục của khóa luận Ngoài phần mở đầu, kết luận, danh mục tài liệu tham khảo và phần phụ lục, nội dung của khóa luận được chia làm 5 chương: Chương 1: Định nghĩa bảo quản số. Nội dung công tác bảo quản số. Chương 2: Vai trò người cán bộ thư viện số và các kỹ năng cần thiết đối với người cán bộ thư viện số. Chương 3: Công tác bảo quản số trên thế giới và xu hướng tiếp cận thông tin số tại Việt Nam hiện nay. 9
  10. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện PHẦN NỘI DUNG CHƢƠNG 1: ĐỊNH NGHĨA BẢO QUẢN SỐ. NỘI DUNG CÔNG TÁC BẢO QUẢN SỐ 1.1 Định nghĩa bảo quản số và các vấn đề liên quan 1.1.1 Định nghĩa bảo quản số Bảo quản số hay bảo quản thông tin số không phải là một chủ đề mới được quan tâm trên thế giới. Hiệp hội lữu trữ New Zealand đưa ra một tuyên bố quan trọng trên trang web chính thức của mình như sau: “Thông tin số cần được quản lý và quan tâm một cách chủ động ngay từ đầu. Tuy nhiên, sự bàng quan của người ngoài thường xuyên xuất hiện, điều này sẽ gây ra hậu quả khôn lường với thông tin số”. Hiệp hội thư viện Mỹ (American Library Association) đưa ra hai định nghĩa Bảo quản số: Định nghĩa ngắn gọn và định nghĩa đầy đủ. - Định nghĩa ngắn gọn: “ Bảo quản số là sự kết hợp các chính sách, chiến lược và hành động nhằm đảm bảo sự truy cập tới nội dung số qua thời gian” - Định nghĩa đầy đủ: “Bảo quản số là sự kết hợp các chính sách, chiến lược và hành động để đảm bảo tính chân thực, chính xác của nội dung thông tin qua thời gian, bất 10
  11. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện chấp sự thay đổi của công nghệ hoặc sự lỗi thời của nó. Bảo quản số áp dụng chung cho tài liệu số hóa nguyên gốc (born digital materials) và tài liệu số là kết quả của quy trình số hóa (digitalized materials)” Hiệp hội bảo quản số Anh Quốc đưa ra định nghĩa về bảo quản số như sau: “Bảo quản số là một loạt những hoạt động quản lý cần thiết để đảm bảo việc truy cập liên tục tới tài liệu số cho đến khi còn cần thiết” Các định nghĩa trên nhấn mạnh tới hai khía cạnh: đảm bảo độ chính xác nội dung số và tính truy cập liên tục tới thông tin số. Có nghĩa là, bảo quản thông tin số là phải đảm bảo một thông tin số còn có thể truy cập được và truy cập liên tục cho đến khi thông tin số đó không còn có giá trị nữa. Trên thực thế, luôn luôn tồn tại những tài liệu cần sử dụng trong thời gian dài với tần suất cao, tuy nhiên một số khác chỉ cần dùng trong khoảng thời gian ngắn, sau đó trở nên vô giá trị, vì vậy điều quan trọng là việc lựa chọn tài liệu sẽ được lưu trữ dưới dạng số và lưu trữ chúng trong bao lâu. 1.1.2 Đối tƣợng số Trong một thư viện điện tử hay thư viện số, thông tin sau khi số hóa sẽ được lưu trữ như những “Đối tượng số”. Một đối tượng số trong kho dữ liệu thường có hai phần: phần nội dung và siêu dữ liệu đi kèm (trong môi trường thư viện điện tử, siêu dữ liệu chính là thông tin thư mục) [6] 11
  12. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện SIÊU DỮ LIỆU ĐỐI TƢỢNG SỐ NỘI DUNG Hình 1. Mô hình Đối tượng số 1.1.3 Số hóa và quy trình số hóa Số hóa hiểu đơn giản là việc chuyển đổi một dạng nào khác của thông tin, như thông tin dạng in ấn trên giấy hay dạng analogue, thành thông tin dạng số. Số hóa 12
  13. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện Quy trình này gồm 3 giai đoạn chính: 1. Chuyển đổi từ tài liệu dạng giấy (hardcopy) sang dạng ảnh kỹ thuật số. Công việc này được gọi là Quét (scanning); 2. Chuyển đổi từ dạng ảnh kỹ thuật số sang dạng văn bản, sử dụng phần mềm Nhận biết ký tự quang học (Optical Character Recognition – OCR); 3. Hiệu chỉnh lỗi và căn chỉnh văn bản (Proof-reading). Tài liệu dạng giấy có thể là sách, báo, tạp chí, tờ rời, ảnh, bức vẽ bằng bút và các văn bản viết tay. 1.1.3.1 Lợi thế quan trọng của việc số hóa tài liệu - Một điều dễ nhận thấy là tài liệu dạng số “linh hoạt” hơn tài liệu in ấn nhiều lần. Chúng có thể hiện thị trên màn hình máy tính, sửa chữa và in ra. - Tài liệu dạng số chia sẻ một cách dễ dàng ; nhân làm nhiều bản nhanh chóng, ít tốn chi phí ; cập nhật vào các cơ sở dữ liệu trực tuyến thư viện, truyền qua Intranet hoặc Internet… - Tài liệu dạng số dễ lưu trữ và lấy ra. Hàng trăm tài liệu dưới dạng số có thể lưu trữ chỉ trên một đĩa CD-ROM hoặc ổ cứng dung lượng tương đối. - Ngoài ra, người dùng tin tìm kiếm tài liệu dễ dàng và nhanh chóng hơn bằng cách sử dụng các tiện ích tìm kiếm của máy tính điện tử. - Việc biến đổi tài liệu sang dạng số giúp tránh được những hủy hoại trên phương diện vật lý và sự thiếu cẩn thận của nhân viên thư viện cũng như người dùng tin đối với tài liệu dạng giấy, đặc biệt là các văn bản viết tay hay tài liệu quý hiếm. 13
  14. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện 1.1.3.2 Quy trình số hóa tài liệu Số hóa tài liệu là một quy trình đòi hỏi nhiều thời gian, do đó cần chuẩn bị một kế hoạch cẩn thận. Trước khi quyết định thực hiện dự án số hóa, mỗi tổ chức hay cá nhân cần tự trả lời một số câu hỏi sau: + Mục đích hay lý do chính để số hóa tài liệu là gì? Tổ chức/cá nhân muốn xây dựng một thư viện số hay chỉ đơn giản để bảo quản chúng? + Ai là người cần tới những tài liệu này và họ sẽ/muốn tiếp cận với chúng bằng cách nào? Qua website, CD-ROM hay sách? + Quy mô như thế nào? Tại chỗ, trong khu vực hay toàn cầu? + Những tài liệu nào nên số hóa? Số lượng? Tài liệu có bao nhiêu bản? + Các tài liệu cần số hóa được viết dưới bao nhiêu ngôn ngữ khác nhau? + Có nhiều tranh ảnh không? + Tài liệu này đã có ở dạng số và đã phổ biến chưa? + Nếu đã có thì ở dạng format nào? + Tình trạng bản quyền của tài liệu? + Tài chính liệu có đủ cho toàn bộ dự án số hóa không? + Ai là người sẽ số hóa chúng? (Vấn đề nhân lực) + Sẽ bán hay miễn phí sản phẩm của dự án? + Dự án số hóa này chỉ là công việc tạm thời/diễn ra một lần hay sẽ tiếp tục trong tương lai? 14
  15. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện 1.1.3.2.1 Các bước số hóa Sau khi trả lời một số câu hỏi như trên, tức là đã xác định rõ mục tiêu chương trình số hóa, bước tiếp theo là xây dựng một bản chi tiết quy trình hành động hay các bước thực hiện dự án số hóa tài liệu. Một dự án số hóa nên có các bước tuần tự như sau: CHUẨN BỊ DỰ ÁN TÍNH TOÁN CHI PHÍ ĐẦU TƯ CHUẨN BỊ KẾ HOẠCH CHI TIẾT TỪNG GIAI ĐOẠN VÀ NHIỆM VỤ CỤ THỂ LỰA CHỌN TÀI LIỆU VÀ ĐỊNH DẠNG TIẾN HÀNH SỐ HÓA TÀI LIỆU XỬ LÝ SẢN PHẨM: HIỆU ĐÍNH, NHẬN DẠNG QUANG HỌC…. CHUYỂN GIAO TÀI LIỆU SỐ HAY TẠO KHẢ NĂNG TRUY CẬP CHO NGƯỜI DÙNG TIN 15
  16. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện 1.1.3.2.2 Lựa chọn tài liệu số hóa Đầu tiên, thư viện cần xác định tài liệu sẽ được số hóa. Không phải tất cả tài liệu in trên giấy đều dễ dàng chuyển đổi thành dạng số. Bảng thông tin dưới đây cung cấp một số gợi ý giúp kiểm tra mức độ số hóa tài liệu đơn giản hay phức tạp. Số hóa dễ dàng Số hóa khó khăn Tờ giấy riêng lẻ hoặc quyển sách tháo Quyển sách không tháo được gáy hoặc được gáy gáy quá dày Bản in có độ rộng vừa đủ Bản in nhỏ, kích cỡ thất thường, tài liệu đánh máy hoặc viết tay nham nhở Giấy trắng, sạch sẽ, sáng sủa Giấy bẩn hoặc đã hư hỏng, rách nát; màu nền quá rõ nét; giấy mỏng nhìn xuyên trang tiếp theo Văn bản có biểu đồ một hoặc hai cột; Văn bản có quá nhiều bảng biểu, tranh không căn chỉnh, trang trí nhiều ảnh, phương trình, lời chú thích cuối trang; căn chỉnh, trang trí phức tạp, dày đặc. Thư viện cần đảm bảo việc số hóa này là có giá trị. Nghĩa là, cần đảm bảo tài liệu lựa chọn số hóa chứa những thông tin cần thiết và hữu ích.  Một số lưu ý khác khi số hóa tài liệu 16
  17. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện Cẩn thận với vấn đề bản quyền. Hiện nay, hầu hết các xuất bản phẩm (đặc biệt với các ấn phẩm nước ngoài) đều đăng ký bản quyền. Thư viện cần được sự cho phép của nơi giữ bản quyền trước khi đưa chúng vào bộ sưu tập số. Nếu nghi ngờ về bản quyền của bất kỳ tài liệu nào trong số đó, hãy hỏi lại tác giả hoặc nhà xuất bản. Lưu tâm tới vấn đề bảo mật. Số hóa tài liệu làm cho chúng dễ dàng truy cập và sao chép. Một số loại tài liệu như Kết quả nghiên cứu, chứng từ ngân quỹ… có thể là riêng tư. Thư viện nên hạn chế quyền truy cập tới những tài liệu đó bằng cách yêu cầu mật mã để mở và chỉnh sửa chúng. Quyền truy cập Sở hữu Người Tiếp cận dùng tin Nộidung Tạo lập / Sử dụng thôngtin số Hình 2: Sơ đồ biểu diễn mối quan hệ Người dùng tin (Users) – Quyền (Right) – Nội dung thông tin số (Content) 17
  18. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện 1.1.3.2.3 Lựa chọn định dạng tài liệu Tiếp theo, thư viện cần lựa chọn định dạng cho tài liệu số. Lựa chọn tiêu chuẩn thường giữa file hình ảnh và file văn bản. Dưới đây là các định dạng phổ biến cho hai loại này: + Định dạng file ảnh (TIF, GIF, JPG/JPEG…): Thích hợp cho hình ảnh hoặc văn bản viết tay. Tài liệu loại này thường không có nhu cầu tìm kiếm toàn văn. File ảnh là sản phẩm trực tiếp từ việc quét tài liệu, nhưng ít hữu dụng hơn dạng văn bản. + Định dạng file văn bản (HTML, XML, DOC, PDF…): Được tạo ra bằng cách ứng dụng phần mềm OCR sau khi quét tài liệu. Loại này khó sản xuất hơn nhưng hữu hiệu và dễ dàng sử dụng vì chúng cho phép tìm kiếm toàn văn. Hầu hết file văn bản có thể sửa chữa bằng cách sử dụng các công cụ sửa chữa văn bản chuyên dụng. 1.1.3.2.4 Trang thiết bị phục vụ dự án - Thiết bị đầu tiên cần thiết cho công tác số hóa là máy quét (scanner); - Máy quét và phần mềm OCR yêu cầu máy tính có cấu hình rất mạnh. Chúng ta có thể quét hàng trăm tờ giấy chỉ cần tới một máy tính điện tử và một máy scan. Tuy nhiên, với số lượng nhiều hơn, giả dụ như với hàng nghìn tờ giấy, sẽ cần nhiều máy tính và máy quét hơn. Lúc này, số lượng máy tính điện tử với cấu hình cao tăng lên rất nhiều; - Sửa chữa và hiệu chỉnh văn bản tốn nhiều thời gian nhưng chỉ yêu cầu máy tính có cấu hình bình thường, bởi vậy, máy tính cấu hình yếu hơn sẽ phục vụ mục đích này; 18
  19. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện - Thư viện cần trang bị ổ ghi CD hỗ trợ sao chép và sao lưu dữ liệu với khối lượng lớn; - Thiết lập mạng máy tính cho phép chia sẻ công việc tới những thành viên khác nhau trong cùng một quy trình. - Một số phần mềm chuyên dụng: + Phần mềm quét dữ liệu (Scanning Software): cài trực tiếp lên máy tính điện tử nối với máy quét, giúp máy tính nhận biết máy quét; + Bộ xử lý văn bản (Word Processor) và Phần mềm kiểm tra chính tả (Spellchecker): Cài trực tiếp lên máy tính điện tử nhằm phát hiện và sửa lỗi chính tả, căn chỉnh lề văn bản (Gợi ý: Microsoft Word, Corel WordPerfect); + OCR: cài trực tiếp lên máy tính điện tử nhằm chuyển đổi văn bản dưới dạng hình ảnh sang dạng văn bản chữ mà bộ xử lý văn bản có thể hiểu (Gợi ý: ReadIris, OmniPage, FineReader); + Phần mềm quản lý ảnh: hỗ trợ chỉnh sửa, xem và quản lý ảnh (Gợi ý: CompuPic, Kudo, ACDSee, PhotoShop, iPhoto…); + Chương trình chuyển dạng file: Hỗ trợ chuyển từ định dạng này sang định dạng khác của cùng một tài liệu (Gợi ý: DoPDF…); + Adobe Acrobat: Đọc văn bản dạng PDF. 1.1.3.2.5 Chi phí số hóa + Chi phí trong thời gian chuẩn bị: thời gian chuẩn bị tài liệu gốc để sẵn sàng số hóa (đóng gói, vận chuyển…); + Chi phí xử lý tài liệu: tài liệu càng lớn (như bản đồ) thường dễ hỏng, rách, nát (như tranh ảnh) sẽ tăng chi phí trong quá trình xử lý để số hóa; + Chi phí vận hành xử lý tự động; 19
  20. Khóa luận tốt nghiệp Nguyễn Thu Anh _ K50 Thông tin - Thư viện + Chi phí nhân lực; + Chi phí trang thiết bị; + Chi phí lưu trữ file (file càng lớn càng tốn kém chi phí ). Ngoài ra, trong quá trình tiến hành dự án sẽ có nhiều chi phí khác phát sinh. Công tác chuẩn bị dự án cần có dự trù cho các khoản phát sinh này. 1.1.3.2.6 Nguồn nhân lực Dự án số hóa tài liệu hoàn chỉnh yêu cầu: + Người Quản lý dự án (Project Manager): Sắp xếp, phối hợp hoạt động toàn nhóm và quản lý văn bản; + Người / Chuyên gia lựa chọn tài liệu số hóa (Selector); + Người nhập dữ liệu (Data entry technician); + Người / Chuyên gia biên mục (Cataloger): Tạo siêu dữ liệu hỗ trợ truy nhập tài liệu; + Nhân viên với kỹ năng máy tính cơ bản và có tính kiên nhẫn cao phụ trách việc quét tài liệu (Scanning technician or photographer); + Chuyên gia với kỹ năng máy tính cao làm việc với các phần mềm tạo ra tài liệu số nói trên (Programmer Expert); + Người / Chuyên gia quản lý chất lượng nội dung (Quality Control Expert); 20
nguon tai.lieu . vn