Mô hình dữ liệu quan hệ là một cách tiếp cận duy nhất để quản lý các tham số bằng cách sử dụng cấu trúc và ngôn ngữ theo logic vị từ bậc một. Nó được mô tả lần đầu tiên vào năm 1969 bởi nhà khoa học người Anh Codd. Trong dự án này, tất cả các tham số được trình bày dưới dạng các bộ được nhóm theo các mối quan hệ nhất định.
Mục đích của mô hình dữ liệu quan hệ…
… là cung cấp một phương thức khai báo để chỉ định các mô hình và truy vấn.
Người dùng ghi chú trực tiếp thông tin mà cơ sở dữ liệu chứa và lý thuyết họ muốn từ nó. Và cũng hãy để phần mềm quản lý cơ sở dữ liệu đảm nhận việc mô tả các cấu trúc để lưu trữ nó. Quy trình truy xuất thông tin để phản hồi các yêu cầu cũng rất quan trọng.
Hầu hết các RDB sử dụng định nghĩa dữ liệu SQL và ngôn ngữ tìm kiếm. Các hệ thống này triển khai những gì có thể được coi là một phép gần đúng về mặt kỹ thuật đối vớimô hình quan hệ.
Một bảng trong lược đồ cơ sở dữ liệu SQL tương ứng với một biến vị từ. Các ràng buộc khóa và truy vấn SQL khớp với các vị từ.
Tuy nhiên, những cơ sở dữ liệu như vậy đi chệch khỏi mô hình quan hệ ở nhiều chi tiết và Codd đã kịch liệt phản đối những thay đổi làm ảnh hưởng đến các nguyên tắc ban đầu.
Tổng quan
Ý tưởng chính của mô hình dữ liệu quan hệ là mô tả toàn bộ cơ sở dữ liệu như một tập hợp các vị từ cho thành phần cuối cùng của các biến, mô tả các hạn chế đối với các giá trị có thể có và sự kết hợp của chúng. Nội dung tại bất kỳ thời điểm nào là mô hình cuối cùng (lôgic). Nghĩa là, một tập hợp các quan hệ, một quan hệ cho mỗi biến vị ngữ, sao cho tất cả các thành phần đều được thỏa mãn. Đây là mô hình dữ liệu quan hệ.
Giải pháp thay thế
Các mô hình khác là hệ thống mạng và phân cấp. Một số trong số chúng, sử dụng các kiến trúc cũ hơn, vẫn còn phổ biến trong các trung tâm dữ liệu dung lượng cao. Hoặc trong trường hợp các hệ thống hiện có quá phức tạp và trừu tượng, việc chuyển đổi sang chúng bằng cách sử dụng mô hình quan hệ sẽ rất tốn kém. Và cũng cần lưu ý là các cơ sở dữ liệu hướng đối tượng mới.
Thực hiện
Đã có một số nỗ lực để có được sự hiện thực hóa thực sự của RMD, được định nghĩa ban đầu bởi Codd và những người khác giải thíchcác nhà khoa học.
Mô hình biểu diễn dữ liệu quan hệ là mô hình chính của loại hình này, được mô tả bằng các thuật ngữ toán học chính thức. Cơ sở phân cấp và mạng đã tồn tại trước các hệ thống quan hệ, nhưng các thông số kỹ thuật của chúng tương đối không chính thức. Sau khi RMD được định nghĩa, nhiều nỗ lực đã được thực hiện để so sánh và đối chiếu các mô hình khác nhau - và điều này dẫn đến việc mô tả chặt chẽ hơn về các hệ thống ban đầu. Mặc dù bản chất thủ tục của các giao diện thao tác dữ liệu cho cơ sở dữ liệu mạng và phân cấp đã hạn chế khả năng chính thức hóa.
Chủ đề
Giả định cơ bản về khái niệm mô hình dữ liệu quan hệ là tất cả chúng đều được biểu diễn dưới dạng toán học "p" - quan hệ điển hình, "Cn" - quan hệ theo cặp, là một tập con trong tích Descartes của một số các miền. Trong mô hình toán học, suy luận về dữ liệu đó được thực hiện theo logic vị từ hai giá trị, có nghĩa là đối với mỗi câu có thể có hai đánh giá: đúng hoặc sai (và không có giá trị thứ ba, chẳng hạn như không xác định hoặc không áp dụng, mỗi trong số đó thường được gắn với khái niệm 0). Dữ liệu được xử lý bằng phép tính toán hoặc đại số, tương đương với sức mạnh biểu đạt.
Các loại mô hình dữ liệu, mô hình dữ liệu quan hệ
RMD cho phép nhà phát triển tạo ra một cái nhìn thống nhất, hợp lý về thông tin. Tất cả điều này đạt được bằng cách kết hợp các ràng buộc đã nêu vào thiết kế cơ sở dữ liệu, thường được gọi là lược đồ logic. Lý thuyết là phát triển một quá trìnhchuẩn hóa mô hình, theo đó một thiết kế với các thuộc tính mong muốn nhất định có thể được chọn từ một tập hợp các phương án thay thế tương đương về mặt logic. Trong các kế hoạch truy cập cũng như các hoạt động và triển khai khác, các chi tiết được xử lý bởi công cụ DBMS và không được phản ánh trong mô hình logic. Điều này trái ngược với thực tế phổ biến trong đó việc điều chỉnh hiệu suất thường yêu cầu các thay đổi đối với chức năng logic.
Mô hình dữ liệu quan hệ cơ bản đại diện cho một khối xây dựng - nó là một miền hoặc loại thông tin, thường được giảm xuống mức tối thiểu. Bộ giá trị là một tập hợp các giá trị thuộc tính có thứ tự. Và đến lượt chúng, chúng là một cặp tên và loại tương hỗ. Nó có thể là một giá trị vô hướng hoặc một giá trị phức tạp hơn.
Một quan hệ bao gồm tiêu đề và nội dung
Đầu tiên là một tập hợp các thuộc tính.
Phần thân (với quan hệ thứ n) là một tập hợp các bộ giá trị.
Tiêu đề tiếp tuyến cũng là chủ đề của mỗi cấu trúc.
Mô hình dữ liệu quan hệ được định nghĩa là một tập các bộ n. Trong cả toán học và MRD, một tập hợp là một tập hợp không có thứ tự của các phần tử duy nhất không trùng lặp, mặc dù một số DBMS áp đặt một trình tự trên dữ liệu của chúng. Trong toán học, một tuple có một thứ tự và cho phép nhân đôi. E. F. Codd ban đầu đã thiết lập các bộ giá trị bằng cách sử dụng định nghĩa toán học này.
Sau này, một trong những ý tưởng tuyệt vời của E. F. Codd là sử dụng tên thuộc tính thay vì sắp xếp thứ tự sẽ thuận tiện hơn nhiều (nói chungcase) bằng ngôn ngữ máy tính dựa trên mối quan hệ. Câu nói này vẫn còn hữu ích cho đến ngày nay. Mặc dù khái niệm đã thay đổi, nhưng cái tên "tuple" vẫn không bị biến đổi. Hệ quả tức thì và quan trọng của sự khác biệt này là trong mô hình quan hệ, tích Descartes trở thành giao hoán.
Một bảng là một hình ảnh đại diện chung cho các mối quan hệ. Bộ tuple tương tự như khái niệm về một chuỗi.
Relvar là một biến được đặt tên của một số kiểu tiếp tuyến cụ thể mà tại mọi thời điểm, một số quan hệ của kiểu đó được gán, mặc dù ánh nhìn có thể chứa các bộ giá trị rỗng.
Khái niệm cơ bản về mô hình dữ liệu quan hệ: tất cả thông tin được biểu diễn bằng các giá trị thông tin trong các mối quan hệ. Theo nguyên tắc này, cơ sở quan hệ là một tập hợp các tương đối và kết quả của mỗi truy vấn được biểu diễn dưới dạng một tiếp tuyến.
Tính nhất quán của cơ sở dữ liệu quan hệ không được thực thi bởi các quy tắc được xây dựng trong các ứng dụng sử dụng nó, mà là bởi các ràng buộc được khai báo như một phần của lược đồ logic và được DBMS thực thi cho tất cả các ứng dụng. Hạn chế được thể hiện trong việc sử dụng các toán tử so sánh quan hệ, trong đó chỉ một toán tử là tập con (⊆), về mặt lý thuyết là đủ. Trong thực tế, một số phím tắt hữu ích dự kiến sẽ có sẵn, trong đó các khóa ứng viên và các ràng buộc nguồn bên ngoài là quan trọng nhất. Đây là nội dung của mô hình dữ liệu quan hệ.
Diễn giải
Để đánh giá đầy đủ RMD, cần phải hiểu cách diễn giải dự địnhnhư một mối quan hệ.
Phần thân của cảm ứng đôi khi được gọi là phần mở rộng của nó. Điều này là do nó nên được hiểu là đại diện cho sự gia tăng một số vị từ. Đây là tập hợp các câu đúng có thể được hình thành bằng cách thay thế mỗi biến tự do bằng một tên.
Có sự tương ứng 1-1 giữa các mô hình dữ liệu quan hệ đối tượng. Mỗi bộ của phần thân quan hệ cung cấp các giá trị thuộc tính để khởi tạo vị từ bằng cách thay thế từng biến tự do của nó. Kết quả là một câu lệnh được coi là đúng do sự xuất hiện của một bộ giá trị trong phần thân của quan hệ. Ngược lại, mọi quy trình có tiêu đề khớp với tên mối quan hệ nhưng không xuất hiện trong nội dung đều được coi là sai.
Giả thiết này được gọi là giả thuyết thế giới đóng. Nó thường bị vi phạm trong cơ sở dữ liệu thực tế, nơi mà sự vắng mặt của một bộ giá trị có thể có nghĩa là sự thật của câu tương ứng là không xác định. Ví dụ: việc thiếu một số thuật ngữ nhất định ("John", "Tây Ban Nha") trong Biểu đồ Kỹ năng Ngôn ngữ có thể không nhất thiết là bằng chứng cho thấy một cậu bé tên John không nói được tiếng Tây Ban Nha.
Ứng dụng vào cơ sở dữ liệu, lý thuyết chuẩn hóa
Chủ thể thông tin được sử dụng trong RDM quan hệ điển hình có thể là một tập hợp các số nguyên, một tập hợp các chuỗi ký tự tạo nên ngày tháng hoặc hai boolean true và false, v.v. Tên chủ đề tương ứng cho các số liệu này có thể là các chuỗi có tên "Chỉ mục", "Thực hiện công việc cần thiết","Thời gian", "Boolean", v.v.
Tuy nhiên, điều quan trọng là phải hiểu rằng lý thuyết quan hệ không chỉ định loại nào nên được hỗ trợ. Và nó thực sự đúng, hiện tại dự kiến rằng các điều khoản sẽ có sẵn cho các thực thể tùy chỉnh ngoài những điều khoản tích hợp được cung cấp bởi hệ thống.
Thuộc tính
Đây là thuật ngữ được sử dụng trong lý thuyết cho cái thường được gọi là cột. Tương tự, bảng thường được sử dụng thay cho thuật ngữ lý thuyết (mặc dù nó không đồng nghĩa với quan hệ trong SQL). Cấu trúc dữ liệu của bảng được chỉ định dưới dạng danh sách các định nghĩa cột, mỗi định nghĩa cột có một tên cột duy nhất và loại giá trị được phép cho nó.
Giá trị thuộc tính là một mục nhập tại một vị trí cụ thể, chẳng hạn như John Doe và 35.
Một bộ về cơ bản giống với một hàng, ngoại trừ trong SQL RDBMS, trong đó ý nghĩa của các cột trong một hàng được sắp xếp theo thứ tự, các bộ giá trị không được phân tách. Thay vào đó, mỗi giá trị định nghĩa chỉ được xác định bằng tên của nó, không phải bởi vị trí thứ tự của nó trong bộ giá trị. Tên thuộc tính có thể là Tên hoặc Tuổi.
Thái độ
Nó là một bảng định nghĩa cấu trúc cùng với sự xuất hiện của dữ liệu trong cấu trúc đó. Định nghĩa là tiêu đề và dữ liệu trong đó là nội dung, một tập hợp các hàng. Biến quan hệ thường được gọi là bảng chính. Tiêu đề của giá trị được chỉ định cho nó trongbất kỳ lúc nào khớp với ô được chỉ định trong ô đã cho và phần thân của nó khớp với phần mà nó được gán lần cuối, gọi một số câu lệnh cập nhật (thường là CHÈN, CẬP NHẬT hoặc XÓA).
Công thức định lý tập hợp
Các khái niệm cơ bản trong mô hình quan hệ quan hệ là tên và tên của các thuộc tính. Chúng cần được biểu diễn dưới dạng chuỗi như "Người" và "Tên" và thường sẽ cần sử dụng các biến để mở rộng chúng. Một khái niệm cơ bản khác là một tập hợp các giá trị nguyên tử chứa các ý nghĩa cần thiết và quan trọng như số và chuỗi.