Tin học
Cơ sở dữ liệu Phân tán
Hệ tính toán phân tán bao gồm các dữ liệu được đặt ở nhiều nơi. Các người dùng có thể truy cập đến bất kỳ nơi nào. Sau đây là một số hướng dẫn để phát triển hệ cơ sở dữ liệu phân tán do Chris J. Date - nhà thiết kế hệ thống cơ sở dữ liệu quan hệ - đưa ra.
Local autonomy Sự tự quản địa phương cho phép từng nơi giữ nguyên bản chất độc lập để dữ liệu và tài nguyên được chính các cơ sở đặt tại địa phương bảo mật, bảo vệ, và quản lý.
Noncentralization Phi tập trung hóa dữ liệu tránh tình trạng sự cố xảy ra nơi trung tâm.
Continuous operation Vận hành liên tục đáp ứng nhu cầu của người dùng ngay cả lúc sao lưu dự phòng.
Transparency Che dấu các vị trí chứa dữ liệu và đơn giản hóa cách truy cập tạo cho người dùng tâm lý thoải mái.
Fragmentation Phân mãnh dữ liệu để lưu trên nhiều nơi.
Replication Là cách đồng nhất nội dung dữ liệu ở tất cả các phân mảnh.
Distributed query processing Xử lý truy vấn phân tán cung cấp cho người dùng con đường tối ưu đi đến các nguồn tài nguyên.
Distributed transaction processing Xử lý giao dịch phân tán đảm bảo cho việc ghi trực tiếp lên các cơ sở dữ liệu một cách chính xác, hay có thể hoãn lại quá trình lại nếu như xảy ra sự cố.
Hardware independence Độc lập phần cứng, điều nầy ngụ ý rằng sẽ hỗ trợ nhiều hệ máy khác nhau.
Operating system independence Độc lập hệ điều hành nghĩa là hỗ trợ nhiều hệ điều hành khác nhau.
Network independence Độc lập mạng giúp hỗ trợ nhiều cấu hình mạng và giao thức truyền thông.
DBMS independence Độc lập cơ sở dữ liệu sẽ cung cấp cho người dùng truy cập bất kỳ cơ sở dữ liệu nào. Xin xem tiếp “Database Connectivity”.
Một khi tất cả các yếu tố trên được hội tụ trong một cơ sở dữ liệu phân tán thì tính năng sẵn dụng, độ tin cậy, an toàn dữ liệu, được nâng lên rất cao.
Các môi trường không đồng nhất thường gây khó khăn trong kết nối cơ sở dữ liệu giữa client và server. Có thể cùng tồn tại nhiều hệ cơ sở dữ liệu back-end và nhiều hệ thống client. Giờ đây đã có nhiều sự lựa chọn kết nối giúp khắc phục được nhược điểm trên. Vấn đề được thảo luận trong mục “Database Connectivity” và “Web Middleware and Database Connectivity”.
Nếu dữ liệu được phân tán trên nhiều server, để bảo đảm dữ liệu sẽ được ghi lên đúng đắn lên mọi cơ sở dữ liệu, đòi hỏi phải có các cơ chế bảo vệ dữ liệu. Ví dụ như việc cập nhật bảng cân đối tài khoản khách hàng ở ba cơ sở dữ liệu khác nhau. Nếu có sự cố kết nối xảy ra trong thời gian ghi giao dịch, cơ sở dữ liệu sẽ mất tính đồng bộ. Xử lý giao dịch khắc phục tình trạng nầy bằng cách giám sát những thay đổi tác động lên các cơ sở dữ liệu liên quan nhằm bảo đảm toàn vẹn dữ liệu một khi có sự cố. Xin xem “Transaction Processing”.
Phân hoạch là phương pháp chia nhỏ dữ liệu ra thành nhiều khối có liên quan nhau, nhân bản là sao y các khối đó đến một nơi khác. Phần lớn cơ sở dữ liệu vẫn được tập trung tại một nơi, các phân hoạch chỉ chiếm một tỷ lệ nhỏ mà thôi. Phân hoạch và nhân bản được dùng vì các lý do sau:
Tăng tính sẵn dụng của cơ sở dữ liệu.
Bảo vệ dữ liệu bằng phương thức sao y.
Giúp phục hồi toàn bộ dữ liệu ngay khi một vị trí bị hỏng hóc.
Hệ hướng đối tượng cung cấp giải pháp độc đáo trong lưu trữ và tạo ra các ứng dụng trong các môi trường phức tạp. Đối tượng là sự trừu tượng hóa của các thực thể trong thế giới thật, ví dụ như người dùng trong các hệ cơ sở dữ liệu khách hàng, các hóa đơn trong các hệ thống kế toán hay các máy in, các server trong các cơ sở dữ liệu dịch vụ thư mục của mạng. Xem “Object Technologies”.
TỪ MỤC LIÊN QUAN
Client/Server Computing; Database Connectivity; Data Warehousing; DBMS; DOC; Enterprise Networks; IBM Host Connectivity; Middleware and Messaging; Object Technologies; ODBC (Open Database Connectivity), Microsoft; Replication; SQL; Transaction Processing; và Web Middleware and Database Connectivity.
THÔNG TIN TRÊN INTERNET
Xem mục “DBMS” để có danh sách đầy đủ các web site liên quan đến CSDL.