Классификация модели данных | MegaDOCs

Классификация модели данных

СЛАЙД 1. Модели данных.

Классификация модели данных

В соответствии с трехуровневой архитектурой, предложенной в 1975г. Комитетом планирования стандартов и норм (SPARC) национального института стандартизации США.

СЛАЙД 2. Физические модели данных.

СЛАЙД 3. Даталогические модели данных (относятся к внутреннему уровню архитектуры).

СЛАЙД 4. Инфологические (семантические) модели данных. (соответствуют концептуальному уровню архитектуры).

Инфологические (семантические) модели данных используются на ранних стадиях проектирования БД.

Даталогические модели данных уже поддерживаются конкретной СУБД.

Физические модели данных связаны с организацией данных на носителях.

Документальные модели данных соответствуют слабоструктурированной информации, ориентированной на свободные форматы документов на естественном языке.

Модели данных, ориентированные на формат документа, связаны со стандартным общим языком разметки SGML (Standart Generaliset Markup Language), а также HTML, предназначенным для управления процессом вывода содержимого документа на экран.

Дескрипторные модели данных – самые простые, широко использовались раньше. В них каждому документу соответствует дескриптор – описатель, который имеет жёсткую структуру и описывает документ в соответствии с заранее определенными характеристиками.

Тезаурусные модели данных основаны на принципе организации словарей. Содержат языковые конструкции и принципы их взаимодействия в заданной грамматике. Эти модели используются, например, в системах-переводчиках.

Объектно-ориентированная модель перекликается с семантическими моделями данных. Принципы похожи на принципы объектно-ориентированных языков программирования. Структура таких моделей графически представима в виде дерева, узлами которого являются объекты. Свойства объектов описываются типом.

Объекты иерархической модели данных связанны иерархическими отношениями и образуют ориентированный граф. Основные понятия иерархических структур: уровень, узел (совокупность свойств данных, описывающих объект), связь.

В сетевой модели данных при тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом.

В реляционной модели данных данные представлены только в виде таблиц.

Мы будем рассматривать именно реляционные модели данных, т.к. в последнее время реляционные СУБД заняли преимущественное положение, поскольку их недостатки связаны в основном с техническими проблемами и компенсируются ростом быстродействия и ресурсов памяти современных ЭВМ.

Поскольку практически все современные базы данных построены на реляционной модели данных, для моделирования данных чаще всего применяется модель “сущность-связь” , лучшим образом позволяющая моделировать схемы реляционных баз данных.

СЛАЙД 5. Трехуровневая модель представления данных ANSI-SPARC.

Внешний уровень – это уровень пользователя. По сути, это совокупность внешних представлений данных, которые обрабатывают приложения и какими их видит пользователь на экране. Это может быть таблица с отсортированными данными, с примененным фильтром, форма, отчет, результат запроса. Внешние представления взаимосвязаны, т.е. из одного внешнего представления можно получить другое.

Концептуальный уровень – центральный. Здесь БД представлена в наиболее общем виде, который объединяет данные, используемые всеми приложениями. Т.е. это обобщенная модель предметной области, для которой созданы БД. Можно сказать, что концептуальный уровень формируется при создании таблиц (определение их полей, типов, свойств), связей, а так же при заполнении таблиц.

Физический уровень – собственно данные, расположенные на внешних носителях.

Архитектура ANSI — SPARC (также 3х-уровневая архитектура) определяет принцип, согласно которому рекомендуется строить системы управления базами данных (СУБД).

Проект архитектуры был выдвинут в 1975 году под-комитетом SPARC (Standards Planning and Requirements Committee) ANSI.

3 уровня СУБД:

внешний (пользовательский)

промежуточный (концептуальный)

внутренний (физический)

В основе архитектуры ANSI/SPARC лежит концептуальный уровень. В современных СУБД он может быть реализован при помощи представления. Концептуальный уровень описывает данные и их взаимосвязи с наиболее общей точки зрения, — концепции архитекторов базы, используя реляционную или другую модель.

Внутренний уровень позволяет скрыть подробности физического хранения данных (носители, файлы, таблицы, триггеры ...) от концептуального уровня. Отделение внутреннего уровня от концептуального обеспечивает так называемую физическую независимость данных.

На внешнем уровне описываются различные подмножества элементов концептуального уровня для представлений данных различным пользовательским программам. Каждый пользователь получает в свое распоряжение часть представлений о данных, но полная концепция скрыта. Отделение внешнего уровня от концептуального обеспечивает логическую независимость данных.

ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ

СЛАЙД 6. Элемент данных.

СЛАЙД 7. Запись. Схема записи.

Для уникальной идентификации записей одной или более полей записи должны быть объявлены явно как ключ записи. Значениями полей являются конкретные данные (числа, символьные строки, слова и прочее).

МОДЕЛЬ СУЩНОСТЬ-СВЯЗЬ

Определения.

СЛАЙД 8. Определение сущности.

Пример определения класса сущностей АВТОР.

СЛАЙД 9. Пример.

В этом примере АВТОР – это наименование сущности, в то время как ID, ФИО, являются атрибутами сущности, которым присвоены типы, соответствующие хранимым данным.

СЛАЙД 10. Определение атрибута.

В модели “сущность-связь” предполагается, что все экземпляры данного класса сущностей имеют одинаковые атрибуты.

Экземпляр сущности – это конкретный представитель данного класса сущностей.

В экземпляре сущности, в отличие от класса, каждый атрибут содержит данные, характеризующие конкретный объект.

СЛАЙД 11. Пример нескольких экземпляров сущностей класса АВТОР.

Как видно из рисунка, все экземпляры имеют одинаковые атрибуты, но разные данные (значения) каждого атрибута.

СЛАЙД 12. Понятие идентификатора.

Если идентификатор является уникальным, его значение будет указывать на один и только на один экземпляр сущности. Если идентификатор является неуникальным, его значение будет указывать на некоторое множество экземпляров.

Синониму слова “идентификатор” является термин “ключ”.

Пример: в классе сущностей АВТОР идентификатором является атрибут ID. Он является уникальным.

ОПРЕДЕЛЕНИЕ. Связи – это взаимоотношение сущностей. Это есть на СЛАЙД 13.

Модель “сущность-связь” включает в себя классы связей и экземпляры связей. Классы связей определяют взаимоотношения между классами сущностей, а экземпляры связи – взаимоотношение между экземплярами сущностей. У связей могут быть атрибуты.

Класс связей может затрагивать несколько классов сущностей. Число классов сущностей, участвующих в связи, называется степенью связи.

СЛАЙД 14. Примеры связей.

Комментарий: связь продавец-заказ имеет степень 2, поскольку в ней участвуют два класса сущностей: ПРОДАВЕЦ и ЗАКАЗ. Связь родитель имеет степень 3.

Связи степени 2 весьма распространены, их часты называют БИНАРНЫМИ СВЯЗЯМИ.

ТИПЫ БИНАРНЫХ СВЯЗЕЙ

СЛАЙД 15. Показаны примеры.

1) Связь 1:1 (один-к-одному) – одиночный экземпляр сущности одного типа связан с одиночным экземпляром сущности другого типа. Каждому договору должна соответствовать своя единственная смета, являющаяся обоснованием цены.

2) Связь 1:N (один-ко-многим, 1-бесконечность) – экземпляр сущности одного типа связан со многими экземплярами сущности другого типа. В примере общежитие-студент, где единичный экземпляр сущности класса ОБЩЕЖИТИЕ связан со многими экземплярами сущности класса СТУДЕНТ, то есть в общежитии может проживать много студентов, но каждый студент живет только в одном общежитии.

3) Связь N:M (многие-ко-многим) – многие экземпляры сущности одного типа связаны со многими сущностями другого типа и наоборот. Каждый преподаватель может обучать нескольких студентов, в то время как каждый студент может обучаться у нескольких преподавателей.