Xem mẫu
- Bài giảng
CƠ SỞ DỮ LIỆU
NÂNG CAO
Số tc: 2; LT: 20; Btập: 10
GV: Nguyễn Thị Mỹ Dung
Khối lớp: Đại học L2
Chương 1: CSDL phân tán 1
- TÀI LIỆU THAM KHẢO
Tài liệu bắt buộc chính:
[1] Nguyễn Thị Mỹ Dung, Bài giảng HQT CSDL
Ocrale, Khoa SP Toán Tin – ĐH Đồng Tháp, năm 2015.
Tài liệu tham khảo:
[2] Nguyễn Trọng Nhân, 2012, Bài giảng Cơ sở dữ
liệu nâng cao, Đại học Đồng Tháp.
[3] Nguyễn Trung Đức, 2008, Bài giảng cơ sở dữ
liệu nâng cao, Đại học Hàng Hải.
[4] O’reilly, Oracle PL/SQL Programming
Fundamentals, eBook-DDU, 2002
[5] Object-Relation Features in Oracle Database,
Shahabi, , .
[5] Các tài liệu khác về “ORACLE”
Chương 1: CSDL phân tán 2
- HÌNH THỨC ĐÁNH GIÁ
- Kiểm tra giữa kỳ: 0.3
Kiểm tra tính chuyên cần: Đi học đầy
đủ và báo cáo nhóm (0.1)
Kiểm tra tự luận: trên lớp, bài tập tổng
hợp (0.2)
- Thi kết thúc môn học: 0.7
Nội dung từ chương 1 7
Thời gian: 60 – 75 phút
Được sử dụng tài liệu
Chương 1: CSDL phân tán 3
- NỘI DUNG MÔN HỌC
1 Chương 1. Tổng quan CSDL phân tán (4)
2 Chương 2. Tổng quan CSDL hướng đối tượng
3 Chương 3. Cơ bản về Oracle (4)
4 Chương 4: Lập trình PL/SQL (4)
5 Chương 5: Procedure, Function (4)
6 Chương 6: Thiết kế đối tượng (6)
7 Chương 7: Truy vấn trong CSDL HĐT (4)
Chương 1: CSDL phân tán 4
- Ch1: Tổng quan CSDL phân tán
I. Giới thiệu về CSDL phân tán
II. Kiến trúc cơ bản của CSDL phân tán
III. Các đặc điểm chính của hệ phân tán
IV. Trong suốt phân tán
V. Lợi ích của CSDLPT
VI. Phương pháp thiết kế CSDL phân tán
VII. Phân mảnh dữ liệu
VIII.Cấp phát tài nguyên trong hệ phân tán
IX. Xử lý truy vấn trong CSDL phân tán
X. Xử lý truy vấn trong môi trường phân tán
Chương 1: CSDL phân tán 5
- I. Giới thiệu về CSDL phân tán
Thiết kế hệ thống thông tin có CSDL phân tán bao
gồm:
- Phân tán và chọn những vị trí đặt dữ liệu;
- Các chương trình ứng dụng tại các điểm;
- Thiết kế tổ chức khai thác hệ thống đó trên mạng.
Một số khái niệm về phân tán:
- Sự phân tán dữ liệu (data distribution): dữ liệu
phải được phân tán ở nhiều nơi.
- Ứng dụng cục bộ (local application): ứng dụng
được chạy hoàn thành tại một nơi và chỉ sử dụng dữ liệu
cục bộ của nơi này.
- Ứng dụng toàn cục (hoặc ứng dụng phân tán -
distributed application): ứng dụng được chạy hoàn thành
và sử dụng dữ liệu của ít nhất hai nơi.
Chương 1: CSDL phân tán 6
- Giới thiệu… (tt)
Định nghĩa CSDL phân tán:
Cơ sở dữ liệu phân tán là tập hợp dữ liệu được phân
tán trên các máy tính khác nhau của một mạng máy tính.
Mỗi nơi của mạng máy tính có khả năng xử lý tự trị
và có thể thực hiện các ứng dụng cục bộ.
Mỗi nơi cũng tham gia thực hiện ít nhất một ứng
dụng toàn cục, mà nơi này yêu cầu truy xuất dữ liệu ở
nhiều nơi bằng cách dùng hệ thống truyền thông.
Các đặc điểm chính của CSDL phân tán:
(1) Điều khiển tập trung; (2) Độc lập dữ liệu; (3) Giảm
dư thừa dữ liệu; (4) Độ tin cậy qua các giao dịch phân
tán; (5) Cải tiến hiệu năng; (6) Dễ dàng mở rộng hệ
thống.
Chương 1: CSDL phân tán 7
- Giới thiệu… (tt)
Ví dụ:
- Một ngân hàng có ba chi nhánh ở các vị trí địa
lý khác nhau.
- Tại mỗi chi nhánh có một máy tính và một cơ sở
dữ liệu tài khoản, tạo thành một nơi (site) của cơ sở
dữ liệu phân tán.
- Các máy tính được kết nối với nhau thông qua
một mạng máy tính truyền thông.
- Một khách hàng có thể gửi tiền và rút tiền tại các
chi nhánh.
Chương 1: CSDL phân tán 8
- Giới thiệu… (tt)
1. Cơ chế điều khiển tập trung
Là một đặc điểm của CSDL tập trung, toàn bộ dữ
liệu được tập trung lại nhằm để tránh sự dư thừa dữ
liệu, đảm bảo được tính độc lập của dữ liệu.
2. Độc lập dữ liệu
Tổ chức lưu trữ dữ liệu là trong suốt đối với
người lập trình ứng dụng.
Sự chính xác của chương trình không bị ảnh
hưởng bởi việc dịch chuyển dữ liệu từ trạm này đến
trạm khác. Tuy nhiên, tốc độ thực hiện của chúng
bị ảnh hưởng.
Chương 1: CSDL phân tán 9
- Giới thiệu… (tt)
3. Giảm dư thừa dữ liệu
- Dữ liệu dư thừa được giảm đến mức tối thiểu
bởi vì:
Sự không tương thích giữa nhiều bản sao của
cùng một tập dữ liệu.
Tiết kiệm không gian lưu trữ bằng cách loại bỏ
các dư thừa.
Hoạt động của các trình ứng dụng và tính thường
trực của hệ thống có thể bị tăng lên khi dữ liệu được
sao lại tất cả các vị trí, nơi trình ứng dụng cần nó.
Chương 1: CSDL phân tán 10
- Giới thiệu… (tt)
4. Cải tiến hiệu năng
- Khả năng phân mảnh CSDL khái niệm và cho
phép cục bộ hoá dữ liệu.
- Tính song song của các hệ thống phân tán có
thể được khai thác để thực hiện song song liên truy
vấn và truy vấn cục bộ.
5. Dễ dàng mở rộng
- Trong môi trường phân tán dễ dàng tăng kích
thước dữ liệu và hiếm khi cần sửa đổi trong các hệ
thống lớn.
Chương 1: CSDL phân tán 11
- Giới thiệu… (tt)
Mô hình CSDL phân tán
Cơ sở Cơ sở
dữ liệu 1 dữ liệu 2
Terminal T
T T
T T
Máy tính 1 Máy tính 2
Chi nhánh 1 Chi nhánh 2
Mạng truyền
thông
Chi nhánh 3
T Cơ sở
Máy tính 3
T dữ liệu 3
T
Chương 1: CSDL phân tán 12
- Giới thiệu… (tt)
Trung tâm máy tính
Chi nhánh 1 Chi nhánh 2
T T
T T
T Cơ sở Cơ sở T
dữ liệu 1 dữ liệu 2
Máy tính 1 Máy tính 2
Mạng cục bộ
Chi nhánh 3
T Máy tính 3 Cơ sở
T dữ liệu 3
T
Cơ sở dữ liệu phân tán trên một mạng cục bộ
Chương 1: CSDL phân tán 13
- Giới thiệu… (tt)
Trung tâm máy tính
Chi nhánh 1 Chi nhánh 2
T T
Cơ sở Cơ sở Cơ sở
T T
dữ liệu 1 dữ liệu 2 dữ liệu 3
T T
Máy tính Máy tính Máy tính
phía sau 1 phía sau 2 phía sau 3
Mạng cục bộ
Máy tính ứng dụng (phía trước)
Chi nhánh 3
T
T
T
Hệ thống đa xử lý (multiprocessor system)
Chương 1: CSDL phân tán 14
- Giới thiệu… (tt)
Hệ quản trị CSDL phân tán (DDBMSs) :
Chức năng:
- Hỗ trợ việc tạo và bảo trì cơ sở dữ liệu phân tán
- Có các thành phần tương tự như một hệ quản trị
cơ sở dữ liệu tập trung
- Các thành phần hỗ trợ trong việc chuyển tải dữ
liệu đến các trạm và ngược lại.
Thành phần của DDBMS:
- Quản trị dữ liệu (Database management): DBM
- Truyền thông dữ liệu (Data Communication): DC
- Từ điển dữ liệu (Data Dictionary): DD dùng để
mô tả thông tin về sự phân tán của dữ liệu trên mạng.
- Cơ sở dữ liệu phân tán (Distributed Database):
DDB.
Chương 1: CSDL phân tán 15
- Giới thiệu… (tt)
T T
T
Local database DB DC
1 DDB
DD Site 1
Site 2
DD
Local database
2 DB DC DDB
T T
T
Các thành phần của một DDBMS thương mại
Chương 1: CSDL phân tán 16
- Giới thiệu… (tt)
CSDL phân tán so với CSDL tập trung
CSDL phân tán không đơn giản là những sự thực
hiện phân tán của CSDL tập trung, bởi vì chúng cho
phép thiết kế các đặc trưng khác với CSDL tập trung.
Ưu điểm của hệ phân tán:
- Đáp ứng nhanh hầu hết các ứng dụng sử dụng dữ
liệu tại các trạm.
- Tăng cường các đơn thể ứng dụng và CSDL mà
không làm cản trở người sử dụng hiện tại.
- Kiểm soát dữ liệu địa phương theo hướng hoàn
thiện sự tích hợp và quản trị dữ liệu từ xa.
- Tăng cường khả năng của hệ thống liên quan đến
sự dư thừa dữ liệu.
Chương 1: CSDL phân tán 17
- Giới thiệu… (tt)
Nhược điểm:
- Phần mềm đắt và phức tạp.
- Phải xử lý các thay đổi thông báo trong mọi địa
điểm.
- Khó kiểm soát tính toàn vẹn dữ liệu với nhiều
bản sao dữ liệu được phân bố khắp mọi nơi.
- Đáp ứng chậm nhu cầu của các trạm trong
trường hợp các phần mềm ứng dụng không được
phân bố phù hợp với việc sử dụng chung.
Chương 1: CSDL phân tán 18
- II. Kiến trúc cơ bản của CSDL PT
Sơ đồ tổng thể
(Global Schema) Các
Sơ
đồ
Sơ đồ phân mảnh độc
(Fragmentation Schema) lập
vị
Sơ đồ định vị trí
(Allocation Schema)
Sơ đồ ánh xạ địa phương 1 Sơ đồ ánh xạ địa phương n
(Local mapping Schema 1) (Local mapping Schema n)
Hệ quản trị CSDL tại vị trí 1 Hệ quản trị CSDL tại vị trí n
(DBMS 1) (DBMS n)
CSDL địa CSDL địa
phương 1
phương n
(Local (Local
Database 1) Database n)
Kiến trúc tham khảo dùng cho CSDL phân tán
Chương 1: CSDL phân tán 19
- Kiến trúc cơ bản của CSDL PT (tt)
1. Sơ đồ tổng thể (Global Schema)
- Xác định tất cả các dữ liệu sẽ được lưu trữ
trong CSDL phân tán cũng như các dữ liệu không
được phân tán ở các trạm trong hệ thống.
Sơ đồ tổng thể được định nghĩa theo cách như
trong CSDL tập trung.
Trong mô hình quan hệ, sơ đồ tổng thể bao gồm
định nghĩa của tập các quan hệ tổng thể (Global
relation).
Chương 1: CSDL phân tán 20
nguon tai.lieu . vn