Организация БД

Организация данных базыопределяется видом модели данных, которую поддерживает конкретная СУБД. •Модель данных - это метод(принцип) логической организации данных, реализуемый в СУБД. Организация данныхв базе характеризуется двумя уровнями - логическим и физическим.
организация БД
Логическаяорганизация БД определяется типом структур данных и видоммодели данных, которая поддерживается СУБД. •База данных является совокупностьювзаимосвязанных массивов данных. Массив БД спростейшей организацией состоит из однотипных записей.
Логическая структура БД
• Логическаяструктура БД(концептуальная модель) всегда является некоторой реализацией модели данныхСУБД для конкретной предметной области.
Такая структура определяется:1.совокупностью объектов модели, поддерживаемой СУБД, 2.описанием структурыкаждого объекта и 3.логических связей между объектами.
Логическая структура базы данных являетсяв то же время отображением информационно-логической модели данных (ИЛМ)предметной области в модель, поддерживаемую СУБД.
Соответственно, концептуальная модельопределяется в терминах модели данных выбранной СУБД.
Логическая организация БД.
Логическаяорганизация БД – это представление пользователя о той предметной области,информация о которой должна хранится в БнД.
Результатомлогического проектирования является концептуальная схема БД (это логическаямодель предметной области). Эта модель отражает три вида информации:
- сведения обобъектах предметной области;
- сведения освойствах объектов;
- сведения оботношениях между объектами.
Такаямодель не зависит от: физической среды (типа ЭВМ), операционной системы, СУБД.
Логическуюмодель можно представлять несколькими способами. Для информационных системхарактерны два способа представления данных:
- графический(модель представляют в виде графа, вершины которого – записи, а дуги – этосвязи между записями);
- табличный
Табличныйспособ (структурирование данных) состоит в представлении информации опредметной области в виде одной или нескольких таблиц.
Сейчасизвестны три логические модели:
- иерархическая
- сетевая
- реляционная(наиболее распространены)
Реляционные СУБД: dBase, FoxBase , Clipper, FoxPro, Access.
Иерархическаямодель данных (ИМД) представляет собой дерево. Особенности: каждая из вершинсвязана только с одной вершиной вышележащего уровня (иерархии).
Поискданных в такой структуре выполняется по одной из ветвей, начиная с корневогоэлемента, то есть нужно указать полный путь движения по ветви.
Сетеваямодель использует графический способ представления данных. Однако с ИМД никакихограничений на количество связей, входящих в каждую вершину не накладывается.
Реляционнаямодель данных (РМД) строится на использовании табличных методов и способовпредставления данных и манипулировании ими. В реляционной модели данныхинформация о предметной области представляется таблицей – отношением. Строкатаблицы называется картижом, а столбец – атрибутом.Таблица или отношение характеризуются числом картежей - m и числом атрибутов – n, которое составляет арность отношения. Различают:
- унарные (n = 1);
- бинарные (n = 2);
- тенарные (n = 3);
- n – арные отношения (таблица).
Всостав РМД может входить несколько отношений, каждое из которых имеет своюсхему.
ПримерРМД в составе двух отношений приведем ниже:
Сотрудник
Фамилия | Год | Телефон | Должность |
Борисов | 1970 | 458-46-10 | Инженер |
Квитко | 1969 | 792-55-66 | Техник |
Сейфулин | 1969 | 599-99-99 | Инженер |
Финансы
Должность | Оклад |
инженер | 2500 |
техник | 2000 |
секретарь | 2200 |
Дляпоиска данных по ключу, атрибуты объявляются в качестве ключей. Один атрибутявляется первичным.
Физическая организация БД.
Физическая организация БД – совокупностьметодов и средств размещения данных во внешней памяти и созданная на их основевнутренняя (физическая) модель данных. В отличие от логических моделейфизическая модель данных связана со способами организации данных на носителяхметодами доступа к данным. Эта модель указывает каким образом записиразмещаются в БД, как они упорядочиваются, как организуются связи, как локализоватьзаписи и осуществить выборку. Внутренняя модель разрабатывается средствамиСУБД.
Основнымисредствами физического моделирования в БнД являются:
1. структура храненияданных (в простейшем случае, структуру хранения данных можно представить в видеструктуры записи файла БД, которая включает поля записи, порядок их размещения,типы и длины полей);
2. поисковыеструктуры (чтобы сократить время поиска данных, в базе разрабатываютсяпоисковые структуры, они определяют быстрый способ нахождения записи в базе);
3. язык описанияданных.
ВСУБД на ПК чаще всего используют следующие типы поисковых структур:
- линейный список;
- цепной список;
- инвертированныефайлы;
- индексные файлы.
Вотличие от трех последующих типов поисковых структур линейный список не требуетсоздания дополнительных файлов. В соответствии с этим способом файл БДрассматривается как последовательность невзаимосвязанных записей. Поиск любойзаписи осуществляется путем вычисления адреса записи по некоторому алгоритму.
Достоинства:по критерию «min-памяти» он наиболееэкономичный.
Недостаток:по быстродействию проигрывает остальным способам.
Цепнойсписок представляет собой файл, записи которого имеют ссылки на другие записи.Ссылками элементов являются указатели, которые встраиваются в записи какдополнительные поля. Поле, которое выделяется под указатель называется адресомсвязи. Чтобы войти в список надо указать адрес начала списка (АНС).
Примерцепного списка приведем ниже:
ФС– фиксатор списка или заголовок
АС– адрес связи
| | АНС | | | | | | | | | | |
ФС | | | | | | | | | | | | | |
| | | | | | | | | | | | | |
| | АС | | | | АС | | | АС | | АС |
| Иванов | | | | Петров | | | Сидоров | | | Ястин | | |
ВБД записи, как правило, упорядочены по одному из полей (основному ключу), чтопозволяет сократить перебор записей при чтении файла БД. Для уменьшения временипоиска по другим полям БД (не ключевым) создаются инвертированные файлы.Процесс создания инвертированного файла состоит в переупорядочении исходногофайла по значениям не ключевого поля, то есть получают на диске копию основногофайла только с иным порядком следования записей.
Достоинства:обеспечивает самый быстрый поиск данных по не ключевому полю.
Недостаток:происходит чрезмерно большое дублирование информации, то есть перерасходпамяти.
Инвертированный по полю «год»
| Фамилия | Год | Телефон | Должность |
001 | Квитко | 1969 | 792-55-66 | Техник |
002 | Сейфулин | 1969 | 599-99-99 | Инженер |
003 | Борисов | 1970 | 458-46-10 | Инженер |
Целесообразносоздавать файлы, которые содержат вместо записей БД адреса этих данных.
Индексныйфайл содержит два поля: поле, по которому упорядочивают и поле адресов.
Год | Адрес |
1969 | 002 |
1969 | 003 |
1970 | 001 |
Каждый индекс содержитзначения не ключевого поля и поля адресов. Файл БД, для обработки которогоиспользуется хотя бы один индекс называется индексированным файлом. Построениеиндексного файла осуществляется автоматически самой СУБД. Состав БД в случаеиспользования индексных файлов в качестве поисковой структуры можно представитьследующим образом:
БД={ФБД, [ИФ1,ИФ2,…, ИФп]}