Xem mẫu

  1. Bài giảng CƠ SỞ DỮ LIỆU NÂNG CAO Số tc: 2; LT: 20; Btập: 10 GV: Nguyễn Thị Mỹ Dung Khối lớp: Đại học L2 Chương 1: CSDL phân tán 1
  2. TÀI LIỆU THAM KHẢO Tài liệu bắt buộc chính: [1] Nguyễn Thị Mỹ Dung, Bài giảng HQT CSDL Ocrale, Khoa SP Toán Tin – ĐH Đồng Tháp, năm 2015. Tài liệu tham khảo: [2] Nguyễn Trọng Nhân, 2012, Bài giảng Cơ sở dữ liệu nâng cao, Đại học Đồng Tháp. [3] Nguyễn Trung Đức, 2008, Bài giảng cơ sở dữ liệu nâng cao, Đại học Hàng Hải. [4] O’reilly, Oracle PL/SQL Programming Fundamentals, eBook-DDU, 2002 [5] Object-Relation Features in Oracle Database, Shahabi, , . [5] Các tài liệu khác về “ORACLE” Chương 1: CSDL phân tán 2
  3. HÌNH THỨC ĐÁNH GIÁ - Kiểm tra giữa kỳ: 0.3  Kiểm tra tính chuyên cần: Đi học đầy đủ và báo cáo nhóm (0.1)  Kiểm tra tự luận: trên lớp, bài tập tổng hợp (0.2) - Thi kết thúc môn học: 0.7  Nội dung từ chương 1  7  Thời gian: 60 – 75 phút  Được sử dụng tài liệu Chương 1: CSDL phân tán 3
  4. NỘI DUNG MÔN HỌC 1 Chương 1. Tổng quan CSDL phân tán (4) 2 Chương 2. Tổng quan CSDL hướng đối tượng 3 Chương 3. Cơ bản về Oracle (4) 4 Chương 4: Lập trình PL/SQL (4) 5 Chương 5: Procedure, Function (4) 6 Chương 6: Thiết kế đối tượng (6) 7 Chương 7: Truy vấn trong CSDL HĐT (4) Chương 1: CSDL phân tán 4
  5. Ch1: Tổng quan CSDL phân tán I. Giới thiệu về CSDL phân tán II. Kiến trúc cơ bản của CSDL phân tán III. Các đặc điểm chính của hệ phân tán IV. Trong suốt phân tán V. Lợi ích của CSDLPT VI. Phương pháp thiết kế CSDL phân tán VII. Phân mảnh dữ liệu VIII.Cấp phát tài nguyên trong hệ phân tán IX. Xử lý truy vấn trong CSDL phân tán X. Xử lý truy vấn trong môi trường phân tán Chương 1: CSDL phân tán 5
  6. I. Giới thiệu về CSDL phân tán  Thiết kế hệ thống thông tin có CSDL phân tán bao gồm: - Phân tán và chọn những vị trí đặt dữ liệu; - Các chương trình ứng dụng tại các điểm; - Thiết kế tổ chức khai thác hệ thống đó trên mạng.  Một số khái niệm về phân tán: - Sự phân tán dữ liệu (data distribution): dữ liệu phải được phân tán ở nhiều nơi. - Ứng dụng cục bộ (local application): ứng dụng được chạy hoàn thành tại một nơi và chỉ sử dụng dữ liệu cục bộ của nơi này. - Ứng dụng toàn cục (hoặc ứng dụng phân tán - distributed application): ứng dụng được chạy hoàn thành và sử dụng dữ liệu của ít nhất hai nơi. Chương 1: CSDL phân tán 6
  7. Giới thiệu… (tt)  Định nghĩa CSDL phân tán: Cơ sở dữ liệu phân tán là tập hợp dữ liệu được phân tán trên các máy tính khác nhau của một mạng máy tính. Mỗi nơi của mạng máy tính có khả năng xử lý tự trị và có thể thực hiện các ứng dụng cục bộ. Mỗi nơi cũng tham gia thực hiện ít nhất một ứng dụng toàn cục, mà nơi này yêu cầu truy xuất dữ liệu ở nhiều nơi bằng cách dùng hệ thống truyền thông.  Các đặc điểm chính của CSDL phân tán: (1) Điều khiển tập trung; (2) Độc lập dữ liệu; (3) Giảm dư thừa dữ liệu; (4) Độ tin cậy qua các giao dịch phân tán; (5) Cải tiến hiệu năng; (6) Dễ dàng mở rộng hệ thống. Chương 1: CSDL phân tán 7
  8. Giới thiệu… (tt) Ví dụ: - Một ngân hàng có ba chi nhánh ở các vị trí địa lý khác nhau. - Tại mỗi chi nhánh có một máy tính và một cơ sở dữ liệu tài khoản, tạo thành một nơi (site) của cơ sở dữ liệu phân tán. - Các máy tính được kết nối với nhau thông qua một mạng máy tính truyền thông. - Một khách hàng có thể gửi tiền và rút tiền tại các chi nhánh. Chương 1: CSDL phân tán 8
  9. Giới thiệu… (tt) 1. Cơ chế điều khiển tập trung Là một đặc điểm của CSDL tập trung, toàn bộ dữ liệu được tập trung lại nhằm để tránh sự dư thừa dữ liệu, đảm bảo được tính độc lập của dữ liệu. 2. Độc lập dữ liệu Tổ chức lưu trữ dữ liệu là trong suốt đối với người lập trình ứng dụng. Sự chính xác của chương trình không bị ảnh hưởng bởi việc dịch chuyển dữ liệu từ trạm này đến trạm khác. Tuy nhiên, tốc độ thực hiện của chúng bị ảnh hưởng. Chương 1: CSDL phân tán 9
  10. Giới thiệu… (tt) 3. Giảm dư thừa dữ liệu - Dữ liệu dư thừa được giảm đến mức tối thiểu bởi vì: Sự không tương thích giữa nhiều bản sao của cùng một tập dữ liệu. Tiết kiệm không gian lưu trữ bằng cách loại bỏ các dư thừa. Hoạt động của các trình ứng dụng và tính thường trực của hệ thống có thể bị tăng lên khi dữ liệu được sao lại tất cả các vị trí, nơi trình ứng dụng cần nó. Chương 1: CSDL phân tán 10
  11. Giới thiệu… (tt) 4. Cải tiến hiệu năng - Khả năng phân mảnh CSDL khái niệm và cho phép cục bộ hoá dữ liệu. - Tính song song của các hệ thống phân tán có thể được khai thác để thực hiện song song liên truy vấn và truy vấn cục bộ. 5. Dễ dàng mở rộng - Trong môi trường phân tán dễ dàng tăng kích thước dữ liệu và hiếm khi cần sửa đổi trong các hệ thống lớn. Chương 1: CSDL phân tán 11
  12. Giới thiệu… (tt) Mô hình CSDL phân tán Cơ sở Cơ sở dữ liệu 1 dữ liệu 2 Terminal T T T T T Máy tính 1 Máy tính 2 Chi nhánh 1 Chi nhánh 2 Mạng truyền thông Chi nhánh 3 T Cơ sở Máy tính 3 T dữ liệu 3 T Chương 1: CSDL phân tán 12
  13. Giới thiệu… (tt) Trung tâm máy tính Chi nhánh 1 Chi nhánh 2 T T T T T Cơ sở Cơ sở T dữ liệu 1 dữ liệu 2 Máy tính 1 Máy tính 2 Mạng cục bộ Chi nhánh 3 T Máy tính 3 Cơ sở T dữ liệu 3 T Cơ sở dữ liệu phân tán trên một mạng cục bộ Chương 1: CSDL phân tán 13
  14. Giới thiệu… (tt) Trung tâm máy tính Chi nhánh 1 Chi nhánh 2 T T Cơ sở Cơ sở Cơ sở T T dữ liệu 1 dữ liệu 2 dữ liệu 3 T T Máy tính Máy tính Máy tính phía sau 1 phía sau 2 phía sau 3 Mạng cục bộ Máy tính ứng dụng (phía trước) Chi nhánh 3 T T T Hệ thống đa xử lý (multiprocessor system) Chương 1: CSDL phân tán 14
  15. Giới thiệu… (tt)  Hệ quản trị CSDL phân tán (DDBMSs) : Chức năng: - Hỗ trợ việc tạo và bảo trì cơ sở dữ liệu phân tán - Có các thành phần tương tự như một hệ quản trị cơ sở dữ liệu tập trung - Các thành phần hỗ trợ trong việc chuyển tải dữ liệu đến các trạm và ngược lại. Thành phần của DDBMS: - Quản trị dữ liệu (Database management): DBM - Truyền thông dữ liệu (Data Communication): DC - Từ điển dữ liệu (Data Dictionary): DD dùng để mô tả thông tin về sự phân tán của dữ liệu trên mạng. - Cơ sở dữ liệu phân tán (Distributed Database): DDB. Chương 1: CSDL phân tán 15
  16. Giới thiệu… (tt) T T T Local database DB DC 1 DDB DD Site 1 Site 2 DD Local database 2 DB DC DDB T T T Các thành phần của một DDBMS thương mại Chương 1: CSDL phân tán 16
  17. Giới thiệu… (tt)  CSDL phân tán so với CSDL tập trung CSDL phân tán không đơn giản là những sự thực hiện phân tán của CSDL tập trung, bởi vì chúng cho phép thiết kế các đặc trưng khác với CSDL tập trung. Ưu điểm của hệ phân tán: - Đáp ứng nhanh hầu hết các ứng dụng sử dụng dữ liệu tại các trạm. - Tăng cường các đơn thể ứng dụng và CSDL mà không làm cản trở người sử dụng hiện tại. - Kiểm soát dữ liệu địa phương theo hướng hoàn thiện sự tích hợp và quản trị dữ liệu từ xa. - Tăng cường khả năng của hệ thống liên quan đến sự dư thừa dữ liệu. Chương 1: CSDL phân tán 17
  18. Giới thiệu… (tt) Nhược điểm: - Phần mềm đắt và phức tạp. - Phải xử lý các thay đổi thông báo trong mọi địa điểm. - Khó kiểm soát tính toàn vẹn dữ liệu với nhiều bản sao dữ liệu được phân bố khắp mọi nơi. - Đáp ứng chậm nhu cầu của các trạm trong trường hợp các phần mềm ứng dụng không được phân bố phù hợp với việc sử dụng chung. Chương 1: CSDL phân tán 18
  19. II. Kiến trúc cơ bản của CSDL PT Sơ đồ tổng thể (Global Schema) Các Sơ đồ Sơ đồ phân mảnh độc (Fragmentation Schema) lập vị Sơ đồ định vị trí (Allocation Schema) Sơ đồ ánh xạ địa phương 1 Sơ đồ ánh xạ địa phương n (Local mapping Schema 1) (Local mapping Schema n) Hệ quản trị CSDL tại vị trí 1 Hệ quản trị CSDL tại vị trí n (DBMS 1) (DBMS n) CSDL địa CSDL địa phương 1 phương n (Local (Local Database 1) Database n) Kiến trúc tham khảo dùng cho CSDL phân tán Chương 1: CSDL phân tán 19
  20. Kiến trúc cơ bản của CSDL PT (tt) 1. Sơ đồ tổng thể (Global Schema) - Xác định tất cả các dữ liệu sẽ được lưu trữ trong CSDL phân tán cũng như các dữ liệu không được phân tán ở các trạm trong hệ thống. Sơ đồ tổng thể được định nghĩa theo cách như trong CSDL tập trung. Trong mô hình quan hệ, sơ đồ tổng thể bao gồm định nghĩa của tập các quan hệ tổng thể (Global relation). Chương 1: CSDL phân tán 20
nguon tai.lieu . vn