Xem mẫu

  1. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 TỔNG QUAN VỀ QUẢN TRỊ DỮ LIỆU, KIẾN THỨC DỮ LIỆU VÀ QUẢN LÝ CHẤT LƯỢNG DỮ LIỆU Ths. Nguyễn Lê Phương Hoài Viện Thông tin Khoa học xã hội Tóm tắt: Quản trị dữ liệu và kiến thức dữ liệu là hai khối quan trọng trong nền tảng kiến thức của các chuyên gia thông tin liên quan đến việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu, cả về chất lượng dữ liệu và quản lý dữ liệu nghiên cứu. Áp dụng quản trị dữ liệu để nghiên cứu quy trình quản lý dữ liệu và đào tạo kiến thức dữ liệu giúp phác họa các phạm vi quyết định và xác định trách nhiệm giải trình cho việc ra quyết định. Quản trị dữ liệu là một dịch vụ dựa trên các quy trình chuẩn, lặp lại và được thiết kế để cho phép minh bạch các quá trình liên quan đến dữ liệu. Quản trị dữ liệu đề cập đến các quy tắc, chính sách, tiêu chuẩn; quyền quyết định; trách nhiệm giải trình và phương pháp thực thi. Dù đã nhận được nhiều sự quan tâm trong các tổ chức thư viện, các cán bộ thư viện đã có một số kỹ năng về quản trị dữ liệu, song kiến thức về quản trị dữ liệu vẫn là nền tảng cho các dịch vụ dữ liệu nghiên cứu, nhất là khi nó xuất hiện ở tất cả các mức độ của dịch vụ dữ liệu nghiên cứu và quản trị dữ liệu có thể áp dụng cho dữ liệu lớn. Từ khóa: Quản trị dữ liệu, Kiến thức dữ liệu, Dịch vụ dữ liệu nghiên cứu Khoa học chuyên sâu về dữ liệu, cùng với các nhiệm vụ cho kế hoạch quản lý dữ liệu và dữ liệu mở từ các nhà tài trợ nghiên cứu, đã làm tăng sự chú trọng về quản lý dữ liệu nghiên cứu trong cả các thư viện nghiên cứu và các thư viện đại học. Các cán bộ thư viện đại học thường được lồng ghép vào quá trình nghiên cứu, trước tiên là trong các dịch vụ dữ liệu nghiên cứu (research data service - RDSs). Do đó, việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu là xu hướng hàng đầu trong hoạt động thư viện đại học. Đó là tâm điểm đặc biệt vì nó tạo cơ hội để thay đổi thực tế là các giảng viên và các nhà nghiên cứu coi thư viện không phải là nơi hỗ trợ nghiên cứu theo thời gian thực, mà chỉ là một trung tâm phân phối tài liệu. 1
  2. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 Theo Koltay 1 và McMillan 2, hai yếu tố quan trọng của cơ sở tri thức có ý nghĩa quyết định đối với các chuyên gia thông tin tham gia vào việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu gồm: quản trị dữ liệu và kiến thức dữ liệu. Quản trị dữ liệu (data governance - DG) cho phép cung cấp dịch vụ dữ liệu nghiên cứu tốt hơn. Kiến thức dữ liệu, liên quan chặt chẽ đến các dịch vụ dữ liệu nghiên cứu mà bao gồm quản trị dữ liệu nghiên cứu (research data management - RDM). Khái niệm dịch vụ dữ liệu nghiên cứu và đào tạo kiến thức dữ liệu đang được các nhà nghiên cứu bàn đến, cho nên mối quan hệ của chúng với quản trị dữ liệu cần được xem xét. Bài viết tổng quan các quan niệm của các nhà nghiên cứu trên thế giới về ba thuật ngữ chính: Quản trị dữ liệu, Chất lượng dữ liệu, Kiến thức dữ liệu và mối quan hệ giữa quản trị dữ liệu với chất lượng dữ liệu và kiến thức dữ liệu. 1. Quản trị dữ liệu Khái niệm Quản trị dữ liệu ít được đề cập trong các tài liệu khoa học thông tin – thư viện. Một số ít tài liệu cho rằng lĩnh vực học thuật, thông tin – thư viện cần quan tâm đến quản trị dữ liệu. Điều này được DosSantos nhận định: “Vai trò của nhà quản trị dữ liệu phải thay đổi giống như một nhân viên dữ liệu để làm cho việc quản trị dữ liệu trở thành động lực đằng sau sự đổi mới kinh doanh, thay vì là trở ngại đối với dữ liệu. Mục tiêu này có thể đạt được bằng cách cung cấp công nghệ thông tin như là một dịch vụ và cho phép các quá trình định vị và tổ chức các dữ liệu có sẵn tốt nhất” 3. “Quản trị dữ liệu có thể ám chỉ các cơ quan tổ chức; các quy tắc, chính sách, tiêu chuẩn; quyền quyết định; trách nhiệm giải trình và phương pháp thực thi. Quản trị dữ liệu cho phép đưa ra quyết định tốt hơn và bảo vệ nhu cầu của các bên liên quan. Nó khuyến khích áp dụng các cách tiếp cận phổ biến đối với các vấn đề dữ liệu. Quản trị dữ liệu cũng giúp xây dựng các quy trình chuẩn, lặp lại, giảm chi phí và tăng hiệu quả” 4. 1 Koltay T (2015a), “Data literacy: In search of a name and identity”, Journal of Documentation, 71(2): 401–415 2 MacMillan D (2014), “Data sharing and discovery: What librarians need to know”, Journal of Academic Librarianship, 40(5): 541–549 3 DosSantos J (2015), “What librarians can teach us about managing Big Data”, InFocus. https://infocus.emc.com/joe_dossantos/what-librarians-can-teach-us-about-managing-big-data. 4 DGI (2015a), “Definitions of Data Governance”, http://www.datagovernance.com/adg_data_governance_definition/. 2
  3. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 Các tác giả Khatri & Brown 5 và Weill & Ross 6 cùng cho rằng quản trị dữ liệu mô tả các lĩnh vực quyết định, tức là những quyết định phải được thực hiện để đảm bảo quản lý hiệu quả và sử dụng nguồn lực của tổ chức. Quản trị dữ liệu cũng xác định phạm vi trách nhiệm đối với việc ra quyết định bằng cách xác định người có quyền quyết định trong tổ chức và người chịu trách nhiệm về quyết định liên quan đến nguồn lực dữ liệu. Seiner cho biết thêm rằng: “Quản trị dữ liệu hợp lệ có thể yêu cầu xác định những người có trách nhiệm về dữ liệu, họ xác định, tạo ra và sử dụng để hoàn thành công việc hoặc chức năng của họ. Việc quản trị đúng đắn và hiệu quả phụ thuộc nhiều vào công nghệ cũng như về văn hoá tổ chức” 7. Trách nhiệm, các thành phần chính của quản lý và tiêu chuẩn hóa, được định nghĩa theo cách thức kiểm tra và cân bằng giữa các nhóm khác nhau, giữa những người tạo ra và thu thập thông tin, những người quản lý, những người sử dụng và những người đưa ra các tiêu chuẩn và yêu cầu tuân thủ. “Quản lý dữ liệu liên quan đến việc đảm bảo các dữ liệu không thuộc quyền quản lý của người sở hữu. Do đó các nhà quản lý dữ liệu đại diện cho mối quan tâm của người dùng và đảm bảo rằng các công việc liên quan đến dữ liệu được thực hiện theo các chính sách và quy định đã được xác định. Ngược lại, quản trị dữ liệu là một quá trình tổng thể nhằm kết hợp các nhóm chức năng (bao gồm cả người quản lý dữ liệu) để tạo ra các quy tắc phụ thuộc lẫn nhau hoặc để giải quyết các vấn đề và cung cấp dịch vụ cho các bên liên quan dữ liệu” 8. Quản trị dữ liệu hiệu quả cần phải xác định được mục tiêu, xây dựng quy trình và tiêu chuẩn riêng. Đồng thời xác định trách nhiệm, vai trò của từng nhân viên quản trị dữ liệu. Theo nghĩa quản lý, giám sát và đo lường các khía cạnh khác nhau của một tổ chức, quản trị có thể liên quan đến việc quản lý công nghệ thông tin, nhân lực và các nguồn lực hữu hình khác. Dữ liệu ở khắp mọi nơi, do đó quản trị dữ liệu theo chiều rộng. Các định nghĩa về dữ liệu và cách sử dụng dữ liệu là một phần của quá trình quản lý dữ liệu, trong 5 Khatri V, Brown CV (2010), “Designing data governance”, Communications of the ACM, 53(1): 148– 152. 6 Weill P, Ross JW (2004), IT Governance: How Top Performers Manage IT Decision Rights for Superior Results, Boston, MA: Harvard Business School Press. 7 Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and Greatest Success, Basking Ridge, NJ: Technics Publications 8 Rosenbaum S (2010), “Data governance and stewardship: Designing data stewardship entities and advancing data access”, Health Services Research, 45(5): 1442–1455. 3
  4. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 khi tích hợp dữ liệu và xác định các cá nhân giám sát việc quản lý các quá trình dữ liệu gắn liền với quản trị dữ liệu. Quản trị dữ liệu cũng phải bao gồm siêu dữ liệu, dữ liệu phi cấu trúc, đăng ký, phân loại… Các nguyên tắc truyền thống của quản trị dữ liệu cũng áp dụng cho dữ liệu lớn. Trong số các loại dữ liệu lớn, dữ liệu từ Web và từ truyền thông xã hội, hay dữ liệu từ máy tính đến máy tính đều đáng chú ý. Quản trị dữ liệu lớn đặc biệt quan trọng đối với việc sử dụng dữ liệu được chấp nhận. Mặc dù tích hợp dữ liệu lớn khác với tích hợp dữ liệu truyền thống theo nhiều yếu tố, song nó cho thấy sự phức tạp và tầm quan trọng của quản trị dữ liệu. Tích hợp dữ liệu có thể hiểu là sự kết hợp các quy trình kỹ thuật để tổng hợp dữ liệu từ các nguồn khác nhau thành thông tin có ý nghĩa và có giá trị. Tích hợp dữ liệu giúp làm rõ, làm sạch, giám sát, chuyển đổi và cung cấp dữ liệu, do đó nó cung cấp dữ liệu đáng tin cậy từ nhiều nguồn khác nhau. Tích hợp dữ liệu giải quyết các vấn đề liên quan đến việc kết hợp dữ liệu có xuất xứ đa dạng bằng cách thể hiện một quan điểm thống nhất về những dữ liệu này. Trong môi trường nghiên cứu, các bên liên quan của quản trị dữ liệu là các nhà nghiên cứu, các viện nghiên cứu, các nhà tài trợ, các nhà xuất bản và công chúng nói chung. Am hiểu về quản trị dữ liệu giúp các nhà nghiên cứu yên tâm về các quyền và lợi ích. Các cơ cấu quản trị cũng cần thiết cho việc quản lý các dữ liệu liên quan đến con người, bởi vì việc đảm bảo những thông tin cá nhân đòi hỏi không chỉ phải thiết lập các tiêu chuẩn và các quy tắc thực tiễn mà còn thúc đẩy sự thay đổi văn hoá theo hướng quản lý dữ liệu tốt hơn. Ngoài các chức năng này, quản trị dữ liệu trong môi trường nghiên cứu cho phép truy cập và chia sẻ hợp lý ngay cả khi quyền sở hữu dữ liệu thường không rõ ràng, bởi vì người có đóng góp trong các dữ liệu nghiên cứu không chắc là chủ sở hữu dữ liệu. Nhiều kỹ năng của quản trị dữ liệu như xử lý các điều khoản và thỏa thuận cấp phép, cũng như kiến thức về bản quyền đã được các cán bộ thư viện sở hữu. Tựu chung lại, quản trị dữ liệu là điểm khởi đầu cho việc quản lý dữ liệu. Một chương trình quản lý dữ liệu chính thức phải cung cấp câu trả lời cho các câu hỏi về khả năng sẵn có, khả năng truy cập, nguồn, giá trị và độ tin cậy. Là một phần trách nhiệm trong toàn bộ các thành phần của một tổ chức, quản trị dữ liệu bắt buộc phải cung cấp các cách tiếp cận phối hợp, liên chức năng và tạo điều kiện thực hành tốt nhất. Quản trị dữ liệu ngăn chặn việc lạm dụng tài sản dữ liệu của tổ chức và khuyến khích sử dụng hiệu quả hơn các tài sản dữ liệu tương tự của chính tổ chức này. Am hiểu về bản chất của quản trị dữ liệu là cơ sở cho dịch vụ dữ liệu nghiên cứu và quản trị dữ liệu phát triển tốt là một trong những điều kiện cần thiết cho dữ liệu mở. 4
  5. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 2. Quản lý chất lượng dữ liệu và chất lượng dữ liệu Quản trị dữ liệu "đảm bảo rằng dữ liệu đáng tin cậy và rằng mọi người có thể phải chịu trách nhiệm cho bất kỳ sự bất lợi nào xảy ra vì chất lượng kém" 9. Quan niệm tương tự, Khatri và Brown nhấn mạnh: “Quản trị bao gồm việc xác định người trong tổ chức có quyền đặt ra các tiêu chuẩn về chất lượng dữ liệu” 10. Quản lý dữ liệu liên quan đến việc xác định các tiêu chuẩn thực tế được áp dụng cho chất lượng dữ liệu, trong khi quản trị dữ liệu chỉ định người nên đưa ra những tiêu chuẩn này. Theo Seiner, “Quản trị dữ liệu chính thức hóa không chỉ hành vi liên quan đến định nghĩa, tổ chức và sử dụng dữ liệu, mà còn về chất lượng” 11. Tương tự, Báo cáo của Information Builders cho rằng quản trị dữ liệu là một thành phần quan trọng của bất kỳ chiến lược quản lý chất lượng dữ liệu nào. Một báo cáo khác có tựa đề Quản trị thông tin thành công thông qua dữ liệu chất lượng cao nhấn mạnh sự thành công của một chương trình quản trị thông tin phụ thuộc vào chất lượng dữ liệu có thể đạt được nếu chúng ta giảm sự gia tăng của dữ liệu không chính xác hoặc không nhất quán bằng việc phân tích và giám sát liên tục. Chất lượng dữ liệu là một trong những nền tảng của mô hình chuyên sâu về dữ liệu của nghiên cứu khoa học. Việc đánh giá dữ liệu đòi hỏi kiến thức chuyên ngành sâu và đánh giá theo cách truyền thống các bộ dữ liệu rất tốn thời gian và tốn kém, trong khi các phương pháp tiếp cận tự động đang ở giai đoạn sơ khai. Trong lĩnh vực học thuật, vấn đề về chất lượng dữ liệu đã được xây dựng tương đối tỉ mỉ, do đó việc xử lý sâu hơn là không cần thiết. Tuy nhiên, các yếu tố đáng chú ý nhất, đó là khả năng sẵn có, khả năng khám phá, độ tin cậy và tính xác thực, khả năng chấp nhận, tính chính xác (bao gồm tính đúng đắn và nhất quán), khả năng áp dụng, toàn vẹn, đầy đủ, dễ hiểu và khả năng sử dụng. Rõ ràng là các dịch vụ dữ liệu nghiên cứu được cung cấp bởi các thư viện đại học có thể đóng vai trò quan trọng như là các trung tâm dữ liệu chất lượng trong trường đại học, bằng cách cung cấp các dịch vụ kiểm tra và kiểm định chất lượng dữ liệu cho các cộng đồng nghiên cứu. Mặc dù mối quan tâm cho tính sẵn có của dữ liệu là một yêu cầu rõ ràng, song việc hướng đến các nhân viên dữ liệu, hiểu biết về cách đánh giá tính xác 9 Sarsfield S (2009), The Data Governance Imperative: A Business Strategy for Corporate Data, Ely: IT Governance 10 Khatri V, Brown CV (2010), “Designing data governance”, Communications of the ACM, 53(1): 148– 152 11 Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and Greatest Success, Basking Ridge, NJ: Technics Publications. 5
  6. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 thực, tính toàn vẹn và tính chính xác của các đối tượng số theo thời gian cũng sẽ có ích. Gần đây, Zilinski và Nelson đã xác định một số yếu tố khác của chất lượng dữ liệu như là phạm vi và sự liên quan đến câu hỏi và định dạng nghiên cứu, bao gồm các trường và các đơn vị được sử dụng, các quy ước đặt tên, ngày tạo và cập nhật. Chúng cũng hướng sự chú ý của người dùng đến một tập hợp các thuộc tính kiểm soát chất lượng tương tự như quản trị dữ liệu để trả lời câu hỏi rằng kiểm soát chất lượng được nêu rõ hay không bằng cách tìm hiểu người kiểm tra chất lượng và những quy trình kiểm tra 12 Theo Smith, “Quản trị dữ liệu thành công không chỉ phụ thuộc vào các quy định liên quan đến vai trò nói chung mà còn các trách nhiệm liên quan đến các tiêu chuẩn dữ liệu thích hợp và các môi trường siêu dữ liệu được quản lý. Do đó, quản lý siêu dữ liệu là một trong những quá trình quản trị dữ liệu quan trọng liên quan đến chất lượng, cho phép ghi lại nguồn gốc dữ liệu đảm bảo chất lượng được đảm bảo” 13. 3. Quản trị dữ liệu, chất lượng dữ liệu và kiến thức dữ liệu Mặc dù kiến thức dữ liệu đang trải qua giai đoạn phát triển, song kiến thức dữ liệu mới bắt đầu được chấp nhận rộng rãi như là một khả năng quan trọng cho các chuyên gia thông tin tham gia vào việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu. Mặt khác, các thuật ngữ trong lĩnh vực kiến thức dữ liệu vẫn chưa được chuẩn hóa. Có kiến thức dữ liệu khoa học và kiến thức dữ liệu nghiên cứu. Carlson tranh luận về kiến thức dữ liệu thông tin khác với ý nghĩa hạn chế của kiến thức dữ liệu, tức là khả năng đọc đồ thị và biểu đồ thích hợp, rút ra kết luận chính xác từ dữ liệu và nhận dạng khi dữ liệu được sử dụng theo cách gây hiểu nhầm hoặc không thích hợp 14 Mặc dù các thuật ngữ khác nhau, song định nghĩa cho thấy có điểm chung thống nhất. Nhìn vào sự phát triển của các định nghĩa về kiến thức dữ liệu, Fosmire và Miller đã nói đơn giản về kiến thức thông tin trong thế giới dữ liệu. Hai năm sau, kiến thức dữ 12 Zilinski LD, Nelson MS (2014), “Thinking critically about data consumption: Creating the data credibility checklist”, Proceedings of the American Society for Information Science and Technology, 51(1): 1–4 13 Smith AM (2007), “Data governance best practices: The beginning”, EIMInsight (1)1. http://www.eiminstitute.org/library/eimi-archives/volume-1-issue-1-march-2007-edition/data-governance-best- practices-2013-the-beginning 14 Carlson J, Fosmire M, Miller C, . (2011), “Determining data information literacy needs: A study of students and research faculty”, portal: Libraries and the Academy, 11(2): 629–657 6
  7. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 liệu được định nghĩa rõ ràng là khả năng hiểu, sử dụng và quản lý dữ liệu. Theo định nghĩa của Calzada Prado và Marzal, “kiến thức dữ liệu cho phép các cá nhân truy cập, diễn giải, đánh giá, quản lý, xử lý và sử dụng hợp lý dữ liệu” 15 Như đã đề cập ở trên, Johnson mô tả kiến thức dữ liệu chi tiết hơn, xác định nó như là khả năng xử lý, sắp xếp và lọc số lượng lớn thông tin, việc này đòi hỏi phải biết cách tìm kiếm, lọc và xử lý để tạo ra và tổng hợp thông tin 16. Rõ ràng rằng các thuộc tính này về cơ bản giống với các đặc điểm của kiến thức thông tin khi chúng xuất hiện trong định nghĩa phổ biến và được thừa nhận rộng rãi về kiến thức thông tin, bao gồm khả năng nhận biết nhu cầu thông tin, xác định, định vị, đánh giá và sử dụng thông tin để giải quyết một vấn đề cụ thể. Một số tác giả nhấn mạnh những điểm tương đồng với kiến thức thông tin. Khung kiến thức thông tin của Australia và New Zealand, cho thấy những người có kiến thức thông tin có thể thu thập, lưu trữ và phổ biến không chỉ văn bản mà cả dữ liệu nữa 17. Andretta đã xác định việc trình bày, đánh giá và diễn giải các dữ liệu định tính và định lượng như là một kết quả học tập của kiến thức thông tin 18. Theo Hunt, việc đào tạo kiến thức dữ liệu cần phải vay mượn từ đào tạo kiến thức thông tin, ngay cả khi lĩnh vực kiến thức dữ liệu phổ biến hơn lĩnh vực kiến thức thông tin 19. Schneider cũng xác định kiến thức dữ liệu như là một phần của kiến thức thông tin 20. 15 Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information literacy programs: Core competencies and contents”, Libri, 63(2): 123–134 16 Johnson CA (2012), The Information Diet: A Case for Conscious Consumption, Sebastopol, CA: O’Reilly Media 17 Bundy A (ed.) (2004), Australian and New Zealand Information Literacy Framework, Adelaide: Australian and New Zealand Institute for Information Literacy. 18 Andretta S, Pope A, Walton G (2008), “Information Literacy Education in the UK”, Communications in Information Literacy, 2(1): 36–51 19 Hunt K (2004), “The challenges of integrating data literacy into the curriculum in an undergraduate institution”, IASSIST Quarterly, 28(2): 12–15, http://www.iassistdata.org/downloads/iqvol282_3hunt.pdf 20 Schneider R (2013), “Research data literacy”, In: Kurbanoglu S, . (eds) Worldwide Commonalities and Challenges in Information Literacy Research and Practice, Cham: Springer International, pp. 134–140 7
  8. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 Cả hai mô hình Bảy trụ cột của kiến thức thông tin SCONUL 21 và thấu kính kiến thức thông tin về Khung phát triển của các nhà nghiên cứu Vitae 22 đều nhấn mạnh rằng để xác định thông tin nào có thể cung cấp tư liệu tốt nhất nhằm đáp ứng nhu cầu tin, tìm kiếm, tạo ra và xử lý với dữ liệu nghiên cứu là rất quan trọng, vì kiến thức thông tin hiện nay không chỉ bao gồm các thông tin được công bố và các dữ liệu cơ bản. Điều này phù hợp với cách giải thích thông tin rộng hơn, thừa nhận rằng khái niệm thông tin bao gồm dữ liệu nghiên cứu. Carlson nhấn mạnh rằng mở rộng phạm vi kiến thức thông tin bao gồm quản lý dữ liệu là một sự phát triển hợp lý. Si cho rằng các dịch vụ liên quan đến dữ liệu cần được hỗ trợ bởi các chuyên gia giỏi về kiến thức thông tin 23. Calzada Prado và Marzal cho biết “Kiến thức thông tin và kiến thức dữ liệu là một phần của sự liên tục giáo dục về khoa học, một quá trình đào tạo bắt đầu ở trường học được hoàn thiện và trở nên chuyên sâu trong đào tạo đại học và trở thành một phần của quá trình học tập suốt đời” 24. Hai tác giả cũng xác định được một số tiêu chí về kiến thức thông tin và tiêu chuẩn năng lực kiến thức thông tin cho giáo dục đại học gồm: Xác định dữ liệu cần thiết; Truy cập các nguồn dữ liệu phù hợp với các thông tin cần thiết; Nhận biết giá trị, phân loại và định dạng dữ liệu nguồn; Đánh giá dữ liệu và nguồn của nó; Lựa chọn và tổng hợp dữ liệu và kết hợp dữ liệu với các nguồn thông tin khác và kiến thức sẵn có; Sử dụng dữ liệu một cách có đạo đức; Áp dụng kết quả để học tập, ra quyết định hoặc giải quyết vấn đề. Họ cũng nhấn mạnh đến khả năng xác định bối cảnh trong đó dữ liệu được tạo ra và tái sử dụng. Bằng cách đề cập đến hai thành phần chính trong vòng đời dữ liệu, chúng phù hợp với quan điểm hiện tại về kiến thức thông tin kết hợp sự hiểu biết về cách thức tạo ra thông tin. 21 SCONUL (2011), The SCONUL Seven Pillars of Information Literacy. Core Model for Higher Education, London: Society of College, National and University Libraries Working Group on Information Literacy. http://www.sconul.ac.uk/sites/default/files/documents/coremodel.pdf. 22 Vitae (2011), Researcher Development Framework. Cambridge: Careers Research and Advisory Centre. https://www.vitae.ac.uk/vitae-publications/rdf-related/researcher-development-framework-rdf-vitae.pdf. 23 Si L, Zhuang X, Xing W, . (2013), “The cultivation of scientific data specialists”, Library Hi Tech, 31(4): 700–724 24 Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information literacy programs: Core competencies and contents”, Libri, 63(2): 123–134. 8
  9. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 Mandinach và Gummer xác định “Kiến thức dữ liệu là khả năng am hiểu và sử dụng dữ liệu hiệu quả để đưa ra quyết định, kiến thức dữ liệu có vai trò hỗ trợ ra quyết định, do đó kiến thức dữ liệu gắn liền với quản trị dữ liệu” 25 Theo Hiệp hội Thư viện đại học và nghiên cứu (Association of College and Research Libraries), “Kiến thức dữ liệu tập trung vào việc tìm hiểu cách tìm và đánh giá dữ liệu, nhấn mạnh đến phiên bản của tập dữ liệu nhất định và người chịu trách nhiệm về nó, các trích dẫn và sử dụng dữ liệu có đạo đức” 26 Xem xét tất cả các định nghĩa này, kiến thức dữ liệu có thể được định nghĩa là một bộ kỹ năng và kiến thức cơ bản, trao quyền cho các cá nhân biến dữ liệu thành thông tin và thành kiến thức có thể thực hiện bằng cách cho phép họ truy cập, giải thích, đánh giá, quản lý và sử dụng dữ liệu một cách có đạo đức. Searle xác định kiến thức dữ liệu là một trong các hoạt động dịch vụ dữ liệu nghiên cứu hỗ trợ các nhà nghiên cứu xây dựng các kỹ năng và kiến thức cần thiết để quản lý dữ liệu hiệu quả 27. Do đó, có thể nói rằng kiến thức dữ liệu có liên quan thực tế đến tất cả các quy trình được dịch vụ dữ liệu nghiên cứu quy định, và xây dựng khung chính cho sự tham gia của các thư viện trong việc hỗ trợ mô hình nghiên cứu chuyên sâu về dữ liệu. Các dịch vụ dữ liệu nghiên cứu chắc chắn là toàn diện, do đó bao gồm các khía cạnh của chúng làm cho kiến thức dữ liệu rộng khắp và toàn diện. Khi đặt kiến thức dữ liệu gần với kiến thức thông tin, cần xem xét đến kiến thức thông tin tổng quát. Theo Carlson, các chương trình dữ liệu thông tin phải phù hợp với thực tiễn chuyên ngành và văn hoá hiện nay 28. Một nghiên cứu phân tích của Pinto cho thấy kiến thức thông tin cả trong khoa học y tế và khoa học xã hội đều có 'nhân cách' cụ 25 Mandinach E, Gummer E (2013), “A systemic view of implementing data literacy in educator preparation”, Educational Researcher, 42(1): 30–37 26 ACRL (2013), Intersections of Scholarly Communication and Information Literacy: Creating Strategic Collaborations for a Changing Academic Environment, Chicago, IL: Association of College and Research Libraries. http://acrl.ala.org/intersections 27 Searle S, Wolski M, Simons N, . (2015), “Librarians as partners in research data service development at Griffith University”, Program, 49(4): 440–460. 28 Carlson J, Fosmire M, Miller C, . (2011), “Determining data information literacy needs: A study of students and research faculty”, portal: Libraries and the Academy, 11(2): 629–657. 9
  10. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 thể riêng 29. Nói chung, các phương pháp tiếp cận mới hơn đối với kiến thức thông tin nhấn mạnh rằng thông tin được sử dụng trong các bối cảnh chuyên ngành khác nhau. Farrell và Badke nhấn mạnh: “Để đáp ứng nhu cầu của thời đại thông tin đối với những người xử lý thông tin có trình độ, việc đào tạo kiến thức thông tin phải nằm trong phạm vi thực tiễn văn hoá xã hội của các ngành bằng việc tập trung mở rộng vào nhận thức luận và siêu diễn ngôn. Kiến thức thông tin thực sự sẽ đòi hỏi các cán bộ thư viện hoặc các giảng viên mời gọi sinh viên vào các ngành học. Vì vậy, kiến thức thông tin phải được hiểu là thực hành thông tin thuộc về một ngành học.” 30 Kỹ năng kiến thức dữ liệu cũng được xem là một ngành học cụ thể. Về kỹ năng và khả năng cần thiết, những người có kiến thức dữ liệu biết cách chọn và tổng hợp dữ liệu và kết hợp nó với các nguồn thông tin khác và kiến thức đã có. Họ cũng phải nhận ra giá trị dữ liệu nguồn và làm quen với các loại và định dạng dữ liệu. Các kỹ năng khác bao gồm xác định, thu thập, tổ chức, phân tích, tóm tắt và ưu tiên dữ liệu. Xây dựng các giả thuyết, xác định các vấn đề, giải thích dữ liệu, xác định, lập kế hoạch, thực hiện, cũng như giám sát các quá trình hành động cũng gắn liền với các kỹ năng cần thiết và bổ sung thêm cho nhu cầu biến đổi dữ liệu cho các mục đích sử dụng cụ thể. Ridsdale thiết lập một ma trận về năng lực kiến thức dữ liệu với ý định thúc đẩy một cuộc đối thoại liên tục về các tiêu chuẩn về kiến thức dữ liệu và kết quả học tập trong đào tạo kiến thức dữ liệu. Hoạt động có lẽ quan trọng nhất trong ma trận này là đánh giá chất lượng, bao gồm việc đánh giá các nguồn dữ liệu cho độ tin cậy và sai sót hoặc các vấn đề. Việc đánh giá xuất hiện trong quá trình thu thập dữ liệu và giải thích dữ liệu rõ ràng cho thấy các cơ chế cũng đặc trưng cho kiến thức thông tin. Ngay cả việc hiển thị dữ liệu bao gồm đánh giá các biểu thị đồ họa về dữ liệu. 31 Một chương trình học về kiến thức dữ liệu thí điểm tại Đại học Purdue được xây dựng dựa trên các kỹ năng lập kế hoạch; mô hình vòng đời; khám phá và thu nhận; mô tả 29 Pinto M, Pulgarin A, Escalona M (2014), “Viewing information literacy concepts: A comparison of two branches of knowledge”, Scientometrics, 98(3): 231–232. 30 Farrell R, Badke W (2015), “Situating information literacy in the disciplines”, Reference Services Review, 43(2): 319–340. 31 Ridsdale C, Rothwell J, Smit M, . (2015), “Strategies and Best Practices for Data Literacy Education Knowledge Synthesis Report”, Halifax, NS: Dalhousie University. http://www.mikesmit.com/wp-content/papercite-data/pdf/data_literacy.pdf. 10
  11. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 và siêu dữ liệu; an ninh và lưu trữ; bản quyền và cấp phép; chia sẻ; quản lý và tài liệu; mô tả; kho tàng; bảo quản; xuất bản và quản lý 32. Thực tế là chất lượng dữ liệu đóng vai trò đặc biệt trong kiến thức dữ liệu cũng đã được Carlson minh chứng. Các trách nhiệm chính và thiếu sót trong quản lý dữ liệu của sinh viên sau đại học bao gồm việc đảm bảo chất lượng. Đảm bảo chất lượng được xem như một sự pha trộn các kỹ năng kỹ thuật giúp cụ thể hóa trong sự hiểu biết với thiết bị, kiến thức ngành học và một quá trình siêu nhận thức đòi hỏi sự tổng hợp. Mặc dù đã bị thay thế một phần bởi Khung kiến thức thông tin cho giáo dục đại học, song kiến thức dữ liệu có thể được nhìn qua lăng kính của Các tiêu chuẩn năng lực kiến thức thông tin cho giáo dục đại học. Tiêu chuẩn 3 của các tiêu chuẩn này (đánh giá thông tin) bao gồm yêu cầu phải hiểu và đánh giá nghiêm các nguồn bằng cách xác định xem liệu dữ liệu có đáng tin cậy và/hoặc kho dữ liệu hay thành phần của nó cung cấp mức độ kiểm soát chất lượng cho nội dung của nó hay không. Như đã đề cập ở trên, quản lý siêu dữ liệu là một trong những quy trình quản trị dữ liệu quan trọng liên quan đến chất lượng. Đồng thời, việc đánh giá siêu dữ liệu là một phần của việc đảm bảo chất lượng nên được đưa vào các chương trình kiến thức dữ liệu. Bảo đảm chất lượng trong bối cảnh này bao gồm việc sử dụng siêu dữ liệu để tạo điều kiện hiểu rõ các vấn đề tiềm ẩn với dữ liệu. Đào tạo kiến thức dữ liệu có hai mục đích. Mục đích thứ nhất là tự giải thích, tức là đảm bảo rằng sinh viên, giảng viên và nhà nghiên cứu trở thành những cán bộ khoa học kiến thức dữ liệu. Như Carlson và Johnston nhấn mạnh, phải nâng cao nhận thức về kiến thức dữ liệu cho các giảng viên, sinh viên và các quản trị viên bằng cách gửi thông điệp rõ ràng đến nhu cầu của các bên liên quan. Việc truyền tải thông điệp thậm chí có thể tăng cường độ tin cậy của các thông điệp như vậy. Mục đích thứ hai là để giáo dục các chuyên gia thông tin 33 Kết luận: Quản trị dữ liệu và kiến thức dữ liệu là hoạt động không thể thiếu trong quản lý chất lượng dữ liệu. Việc sử dụng chúng là điều kiện tiên quyết để quản lý dữ liệu hiệu quả, và triển khai các dịch vụ dữ liệu nghiên cứu. Việc phân định các lĩnh vực quyết định và xác định trách nhiệm giải trình cho việc ra quyết định, tuân thủ các quy tắc trong 32 Carlson J, Stowell Bracke MS (eds) (2015), “Planting seeds for data literacy: Lessons learned from a student-centered education program”, International Journal of Digital Curation, 10(1): 95–110. 33 Carlson J, Johnston LR (2015), Data Information Literacy: Librarians, Data, and the Education of a New Generation of Researchers. West Lafayette, IN: Purdue University Press. 11
  12. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 quản trị dữ liệu có thể cải thiện công tác quản lý dữ liệu trong thư viện. Quản trị dữ liệu là một dịch vụ dựa trên các quy trình chuẩn, lặp lại và được thiết kế để cho phép minh bạch các quá trình liên quan đến dữ liệu và giảm chi phí, do đó nó có thể được sử dụng trong thư viện đại học. Quản trị dữ liệu đề cập đến các quy tắc, chính sách, tiêu chuẩn; quyền quyết định; trách nhiệm giải trình và phương pháp thực thi, nó sẽ như là một quy chuẩn về chất lượng dữ liệu của thư viện. Thực tiễn quản trị dữ liệu cũng sẽ hữu ích trong việc quản lý thay đổi và đàm phán các vấn đề dữ liệu lớn. Chú ý đến quản lý chất lượng dữ liệu song song với quản lý dữ liệu là việc làm quan trọng giúp thư viện cung cấp các dịch vụ dữ liệu nghiên cứu. TÀI LIỆU THAM KHẢO 1. ACRL (2013), Intersections of Scholarly Communication and Information Literacy: Creating Strategic Collaborations for a Changing Academic Environment, Chicago, IL: Association of College and Research Libraries. http://acrl.ala.org/intersections. 2. Andretta S, Pope A, Walton G (2008), “Information Literacy Education in the UK”, Communications in Information Literacy, 2(1): 36–51 3. Bawden D, Robinson L (2015), “An intensity around information’: The changing face of chemical information literacy”, Journal of Information Science. 4. Boyd D, Crawford K (2012), “Critical questions for big data. Information”, Communication and Society, 15(5): 662–669. 5. Bundy A (ed.) (2004), Australian and New Zealand Information Literacy Framework, Adelaide: Australian and New Zealand Institute for Information Literacy. 6. Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information literacy programs: Core competencies and contents”, Libri, 63(2): 123–134 7. Carlson J, Fosmire M, Miller C, . (2011), “Determining data information literacy needs: A study of students and research faculty”, portal: Libraries and the Academy, 11(2): 629–657 8. Carlson J, Johnston LR (2015), Data Information Literacy: Librarians, Data, and the Education of a New Generation of Researchers. West Lafayette, IN: Purdue University Press. 12
  13. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 9. Carlson J, Stowell Bracke MS (eds) (2015), “Planting seeds for data literacy: Lessons learned from a student-centered education program”, International Journal of Digital Curation, 10(1): 95–110. 10. DGI (2015a), “Definitions of Data Governance”, http://www.datagovernance.com/adg_data_governance_definition/. 11. DosSantos J (2015), “What librarians can teach us about managing Big Data”, InFocus. https://infocus.emc.com/joe_dossantos/what-librarians-can-teach-us-about- managing-big-data. 12. Duncan J, Clement K, Rozum B (2013), “Teaching our faculty. developing copyright and scholarly communication outreach programs”. In: Davis-Kahl S, Hensley MK (eds) Common Ground at the Nexus of Information Literacy and Scholarly Communication, Chicago IL: Association of College & Research Libraries, pp. 269– 286. 13. Exner N (2014), “Research information literacy: Addressing original researchers’ needs”, Journal of Academic Librarianship, 40(5): 460–466. 14. Farrell R, Badke W (2015), “Situating information literacy in the disciplines”, Reference Services Review, 43(2): 319–340. 15. Fosmire M, Miller C (2008), “Creating a culture of data integration and interoperability: Librarians and Earth Science Faculty collaborate on a geoinformatics course”, In: Proceedings of the IATUL conferences, Paper 16. http://docs.lib.purdue.edu/iatul/2008/papers/16. 16. Hunt K (2004), “The challenges of integrating data literacy into the curriculum in an undergraduate institution”, IASSIST Quarterly, 28(2): 12–15, http://www.iassistdata.org/downloads/iqvol282_3hunt.pdf. 17. Johnson CA (2012), The Information Diet: A Case for Conscious Consumption, Sebastopol, CA: O’Reilly Media 18. Khatri V, Brown CV (2010), “Designing data governance”, Communications of the ACM, 53(1): 148–152. 19. Koltay T (2015a), “Data literacy: In search of a name and identity”, Journal of Documentation, 71(2): 401–415 20. Koltay T. (2016), “Datagovernance, data literacy and the management of data quality”, IFLA Journal, Vol. 2, Issue 4. 13
  14. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 21. MacMillan D (2014), “Data sharing and discovery: What librarians need to know”, Journal of Academic Librarianship, 40(5): 541–549 22. Mandinach E, Gummer E (2013), “A systemic view of implementing data literacy in educator preparation”, Educational Researcher, 42(1): 30–37 23. Martell C (2009), “sAccess: The social dimension of a new paradigm for academic librarianship”, Journal of Academic Librarianship, 35(3): 205–206. 24. Maybee C, Zilinski L (2015), “Data informed learning: A next phase data literacy framework for higher education”, In: 78th ASIS&T annual meeting: Information science with impact: Research in and for the community, St Louis, MS, USA, pp. 108–111. 25. Pinto M, Pulgarin A, Escalona M (2014), “Viewing information literacy concepts: A comparison of two branches of knowledge”, Scientometrics, 98(3): 231–232. 26. Ridsdale C, Rothwell J, Smit M, . (2015), “Strategies and Best Practices for Data Literacy Education Knowledge Synthesis Report”, Halifax, NS: Dalhousie University. http://www.mikesmit.com/wp-content/papercite-data/pdf/data_literacy.pdf. 27. Rosenbaum S (2010), “Data governance and stewardship: Designing data stewardship entities and advancing data access”, Health Services Research, 45(5): 1442–1455 28. Sarsfield S (2009), The Data Governance Imperative: A Business Strategy for Corporate Data, Ely: IT Governance 29. Schneider R (2013), “Research data literacy”, In: Kurbanoglu S, . (eds) Worldwide Commonalities and Challenges in Information Literacy Research and Practice, Cham: Springer International, pp. 134–140. 30. SCONUL (2011), The SCONUL Seven Pillars of Information Literacy. Core Model for Higher Education, London: Society of College, National and University Libraries Working Group on Information Literacy. http://www.sconul.ac.uk/sites/default/files/documents/coremodel.pdf. 31. Searle S, Wolski M, Simons N, . (2015), “Librarians as partners in research data service development at Griffith University”, Program, 49(4): 440–460. 32. Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and Greatest Success, Basking Ridge, NJ: Technics Publications 33. Si L, Zhuang X, Xing W, . (2013), “The cultivation of scientific data specialists”, Library Hi Tech, 31(4): 700–724 14
  15. Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018 34. Smith AM (2007), “Data governance best practices: The beginning”, EIMInsight (1)1. http://www.eiminstitute.org/library/eimi-archives/volume-1-issue-1-march- 2007-edition/data-governance-best-practices-2013-the-beginning 35. Soares S (2012), Big Data Governance: An Emerging Imperative, Boise, ID: MC Press. 36. Vitae (2011), Researcher Development Framework. Cambridge: Careers Research and Advisory Centre. https://www.vitae.ac.uk/vitae-publications/rdf- related/researcher-development-framework-rdf-vitae.pdf. 37. Wang M (2013), “Supporting the research process through expanded library data services”, Program, 47(3): 282–303 38. Weill P, Ross JW (2004), IT Governance: How Top Performers Manage IT Decision Rights for Superior Results, Boston, MA: Harvard Business School Press. 39. Zilinski LD, Nelson MS (2014), “Thinking critically about data consumption: Creating the data credibility checklist”, Proceedings of the American Society for Information Science and Technology, 51(1): 1–4. 15
nguon tai.lieu . vn