По технологии обработкиданных базы данных подразделяются на централизованные и распределенные.
Централизованная база данныххранится в памяти одной вычислительной системы. Эта вычислительная системаможет быть мэйнфреймом - тогда доступ к нейорганизуется с использованием терминалов - или файловым сервером локальной сетиПК.
Распределенная база данных состоит из нескольких, возможно, пересекающихся или даже дублирующих друг другачастей, которые хранятся в различных ЭВМ вычислительной сети. Работа с такойбазой осуществляется с помощью системы управления распределенной базой данных(СУРБД).
По способу доступа кданным базы данных разделяются на базы данных с локальным доступом и базыданных с сетевым доступом.
Для всех современныхбаз данных можно организовать сетевой доступ с многопользовательским режимомработы.
Централизованные базыданных с сетевым доступом могут иметь следующую архитектуру:
· файл-сервер;
· клиент-сервер базы данных;
· "тонкийклиент" - сервер приложений - сервер базы данных (трехуровневаяархитектура).
Рис. 2.1. Схема работы с БД в локальной сети с выделенным файловымсервером
Файл-сервер. Архитектура систем БДс сетевым доступом предполагает выделение одной из машин сети в качествецентральной (файловый сервер). На этот компьютер устанавливается операционнаясистема (ОС) для выделенного сервера (например, Microsoft Windows Server 2003). На нем же хранится совместно используемаяцентрализованная БД в виде одного или группы файлов. Все другие компьютеры сетивыполняют функции рабочих станций (могут работать в ОС Microsoft Windows 2000 Professional или Microsoft Windows 98). Файлы базы данных всоответствии с пользовательскими запросами передаются на рабочие станции, где ипроизводится обработка информации (см. рис.2.1). При большой интенсивности доступа к одним и тем же даннымпроизводительность информационной системы падает. Пользователи могут создаватьтакже локальные БД на рабочих станциях.
Рис. 2.2. Схема работы с БД в архитектуре"Клиент-сервер"
Клиент-сервер. В этой архитектуре навыделенном сервере, работающем под управлением серверной операционной системы,устанавливается специальное программное обеспечение (ПО) - сервер БД, например,Microsoft®SQL Server™или Oracle. СУБД подразделяется на две части: клиентскую исерверную. Основа работы сервера БД - использование языка запросов (SQL).Запрос на языке SQL, передаваемый клиентом (рабочей станцией) серверу БД,порождает поиск и извлечение данных на сервере. Извлеченные данныетранспортируются по сети от сервера к клиенту (см. рис.2.2). Тем самым, количество передаваемой по сети информации уменьшается вомного раз.
Трехуровневаяархитектура функционирует в Интранет- и Интернет-сетях.Клиентская часть ("тонкий клиент"), взаимодействующая спользователем, представляет собой HTML-страницу в Web-браузере либоWindows-приложение, взаимодействующее с Web-сервисами. Вся программная логикавынесена на сервер приложений, который обеспечивает формирование запросов кбазе данных, передаваемых на выполнение серверу баз данных. Сервер приложенийможет быть Web-сервером или специализированной программой (например, Oracle Forms Server)(см. рис.2.3).
Рис. 2.3. Схема работы сБД в трехуровневой архитектуре
Иерархическиебазы данных
В основеданной модели - иерархическая модель данных. В этой модели имеется один главныйобъект и остальные - подчиненные - объекты, находящиеся на разных уровняхиерархии. Взаимосвязи объектов образуют иерархическое дерево с одним корневымобъектом.
ИерархическаяБД состоит из упорядоченного набора нескольких экземпляров одного типа дерева.Автоматически поддерживается целостность ссылок между предками и потомками.Основное правило: никакой потомок не может существовать без своего родителя(см. рис.2.4).
Рис. 2.4. Схема иерархической модели данных
Типичнымпредставителем (наиболее известным и распространенным) является Information Management System (IMS) фирмы IBM. Первая версия появилась в 1968 г. До сих порподдерживается много баз данных этой системы.
Сетевые базыданных
Сетевойподход к организации данных является расширением иерархического. Виерархических структурах запись-потомок должна иметь в точности одного предка;в сетевой структуре данных потомок может иметь любое число предков.
В сетевоймодели данных любой объект может быть одновременно и главным, и подчиненным, иможет участвовать в образовании любого числа взаимосвязей с другими объектами.Сетевая БД состоит из набора записей и набора связей между этими записями, аесли говорить более точно - из набора экземпляров каждого типа из заданного всхеме БД набора типов записи и набора экземпляров каждого типа из заданногонабора типов связи (см. рис.2.5).
Рис. 2.5. Схема сетевой модели
Типичнымпредставителем является Integrated Database Management System (IDMS) компании CullinetSoftware, Inc.,предназначенная для использования на машинах основного класса фирмы IBM подуправлением большинства операционных систем. Архитектура системы основана напредложениях Data Base Task Group (DBTG) Комитета поязыкам программирования Conference on Data SystemsLanguages (CODASYL) - организации, ответственной заопределение языка программирования Кобол. Отчет DBTG был опубликован в 1971 г., а позже появилосьнесколько систем, среди которых IDMS.
База данных – это информационнаямодель, позволяющая упорядоченно хранить данные о группе объектов, обладающиходинаковым набором свойств.
Программное обеспечение, предназначенное для работы с базами данных, называетсясистема управления базами данных (СУБД). СУБД используются для упорядоченногохранения и обработки больших объемов информации.
СУБД организуетхранение информации таким образом, чтобы ее было удобно:
· просматривать,
· пополнять,
· изменять,
· искать нужные сведения,
· делать любые выборки,
· осуществлять сортировкув любом порядке.
Классификация базданных:
1.По характеру хранимойинформации:
— Фактографические (картотеки),
— Документальные (архивы)
2.По способу храненияданных:
— Централизованные (хранятся на одном компьютере),
— Распределенные (используются в локальных и глобальных компьютерныхсетях).
3.По структуреорганизации данных:
— Табличные (реляционные),
— Иерархические,
Информация в базахданных структурирована на отдельные записи, которыми называют группу связанныхмежду собой элементов данных. Характер связи между записями определяет дваосновных типа организации баз данных: иерархический и реляционный.
В иерархическойбазе данных записи упорядочиваются в определенную последовательность, какступеньки лестницы, и поиск данных может осуществляться последовательным«спуском» со ступени на ступень. Иерархическая база данных по своей структуресоответствует структуре иерархической файловой системы.
Реляционная база данных, по сути,представляет собой двумерную таблицу.
Столбцы таблицы называются полями: каждое поле характеризуется своимименем и топом данных. Поле БД – это столбец таблицы, содержащийзначения определенного свойства.
В реляционной БДиспользуются четыре основных типов полей:
· Числовой,
· Символьный (слова,тексты, коды и т.д.),
· Дата (календарные датыв форме «день/месяц/год»),
· Логический (принимаетдва значения: «да» - «нет» или «истина» - «ложь»).
Строки таблицы являютсязаписями об объекте. Запись БД – это строка таблицы, содержащаянабор значения определенного свойства, размещенный в полях базы данных.
Системы управлениябазами данных позволяют объединять большие объемы информации и обрабатывать их,сортировать, делать выборки по определенным критериям и т. п.
Современные СУБД дают возможностьвключать в них не только текстовую и графическую информацию, но и звуковыефрагменты и даже видеоклипы.
Простота использования СУБД позволяет создавать новые базы данных, не прибегаяк программированию, а пользуясь только встроенными функциями. СУБД обеспечиваютправильность, полноту и непротиворечивость данных, а также удобный доступ кним.
Популярные СУБД - FoxPro, Accessfor Windows, Paradox. Дляменее сложных применений вместо СУБД используются информационно-поисковыесистемы (ИПС), которые выполняют следующие функции:
· хранение большогообъема информации;
· быстрый поиск требуемойинформации;
· добавление, удаление иизменение хранимой информации;
· вывод ее в удобном длячеловека виде.
Классификации
Банки данных являются сложнымисистемами, и их классификация может быть произведена по разным признакам. Однииз признаков классификации и соответственно классификационные группировкиотносятся к банку данных в целом, другие - к отдельным его компонентам, третьимогут быть отнесены как к отдельному компоненту, так и к нескольким компонентамили банку в целом.
Классификация баз данных. Центральной компонентой банка данных является базаданных, и большинство классификационных признаков относится именно к ней.
По форме представления информацииразличают видео- и аудиосистемы, а также системы мультимедиа. Эта классификацияв основном показывает, в каком виде информация из баз данных выдаетсяпользователям: в виде изображения, звука или дается возможность использованияразных форм отображения информации. Понятие «изображение» здесь используется вшироком смысле: это может быть символьный текст, неподвижное графическое изображение(рисунки, чертежи и т. п.), фотографии, географические карты, движущиесяизображения.
Пока наибольшее практическоеиспользование находят базы данных, содержащие обычные символьные данные. Этибазы данных, в свою очередь, могут быть разделены на неструктурированные,частично структурированные и структурированные. К неструктурированным БД могутбыть отнесены базы, организованные в виде семантических сетей. Частичноструктурированными можно считать базы данных в виде обычного текста илигипертекстовые системы.
Структурированные БД, в свою очередь, по типу используемой модели делятся на иерархические, сетевые,реляционные, смешанные и мультимодельные. Наибольшеекоммерческое использование в настоящее время имеют реляционные системы.Классификация по типу модели распространяется не только на базы данных, но и наСУБД и даже на банк данных в целом.
По типу хранимой информации БДделятся на документальные, фактографические и лексикографические. Средидокументальных баз различают библиографические, реферативные и полнотекстовые.К лексикографическим базам данных относятся различные словари (классификаторы,многоязычные словари, словари основ слов и т. п.). По характеру организациихранения данных и обращения к ним различают локальные (персональные), общие (интегрированные)и распределенные базы данных (Рис. 1.3)
Базы данных могутклассифицироваться по охвату предметной области. Причем эта классификация, всвою очередь, может производиться по разным признакам: по территориальному(всемирный, страна, город или какой-либо иной регион), временному (год, месяц,с начала века и т. п.), ведомственному, проблемному.
Различают также экстенсиональныеи интенсиональные БД. Экстенсиональнаябаза данных (ЭБД) - это просто реляционная база данных. Интенсиональнаябаза данных (ИБД) строится из ЭБД с помощью правил, определяющих ее содержание,а не с помощью явного хранения кортежей. Например, пусть имеется ЭБД ЛИЧНОСТЬ(PERSON), которая содержит сведения о личности, и среди полей которой есть поляФАМИЛИЯ-ИМЯ-ОТЧЕСТВО (FIО), ПОЛ (SEX). Мы можем построить вторую ЭБД РОДИТЕЛЬ(PARENT), которая содержит поля ФАМИЛИЯ-ИМЯ-ОТЧЕСТВО родителя (FIO) иИМЯ-РЕБЕНКА (CHILD). С помощью правил мы можем определить, например, отношениеОТЕЦ (FATHER), просто указав, что отец - это родитель, у которого пол -мужской. На ПРОЛОГе это отношение можно определитьследующим образом:
father (X, Y) :-person (X, male), parent (X, Y).
Если выполнить это правило, тополучится отношение, которое содержит подмножество кортежей БД PARENT, таких, длякоторых верно указанное условие. Пользователю эти данные выдадутся в видеобычного отношения.
Данное определение ЭБД и ИБД можнорасширить и на другой (нереляционный) тип БД, идругой способ задания правил. В более общем виде можно сказать, что информациюможно передать и в виде данных, и в виде программ (строго говоря, программытоже являются данными, но в русском языке нет подходящего термина, которыйможно было бы здесь употребить вместо слова «данные»).
Классификация СУБД. Рассмотрим теперь ряд классификационных признаков, относящихся к СУБД.По языкам общения СУБД делятся на открытые, замкнутые и смешанные. Открытыесистемы - это системы, в которых для обращения к базам данных используютсяуниверсальные языки программирования. Замкнутые системы имеют собственные языкиобщения с пользователями БнД. Открытые системы внастоящее время используются редко.
По числу уровней в архитектуреразличают одноуровневые, двухуровневые, трехуровневые системы. В принципевозможно выделение и большего числа уровней. Под архитектурным уровнем СУБДпонимают функциональный компонент, механизмы которого служат для поддержкинекоторого уровня абстракции данных (логический и физический уровень, а также«взгляд» пользователя - внешний уровень).
На рис. 1.4 сделана попытка совместитьтерминологию, встречающуюся в разных литературных источниках. В литературешироко используются понятия «внешняя», «концептуальная» и «внутренняя»модель/уровень, а также «логический» и «физический» уровень, а кроме того,«внешняя схема», «подсхема», «схема хранения», просто «схема» и проч. Понятие«схема» с тем или иным уточнением, обычно, относится к описаниюсоответствующего уровня описания данных.
Нумерация уровней на рисункеусловна, но, тем не менее, отражает их значимость (внутренняя модель может бытьпостроена только на основе концептуальной; эти два уровня могут быть совмещены,но поддерживаются СУБД всегда; внешний уровень в архитектуре СУБД можетотсутствовать).
По выполняемым функциям СУБДделятся на информационные и операционные. Информационные СУБД позволяюторганизовать хранение информации и доступ к ней. Для выполнения более сложнойобработки необходимо писать специальные программы. Операционные СУБД выполняютдостаточно сложную обработку, например, автоматически позволяют получатьагрегированные показатели, не хранящиеся непосредственно в базе данных, могутизменять алгоритмы обработки и т.д.
По сфере возможного примененияразличают универсальные и специализированные, обычно проблемно-ориентированныеСУБД.
Системы управления базами данныхподдерживают разные типы данных. Набор типов данных, допустимых в разных СУБД,различен. В настоящее время наблюдается тенденция к расширению числаиспользуемых типов данных. Кроме того, ряд СУБД позволяет разработчику(прикладному программисту или администратору БД) добавлять новые типы данных иновые операции над этими данными. Такие системы называются расширяемымисистемами баз данных (РСБД).
Дальнейшим развитием концепции РСБДявляются объектно-ориентированные системы баз данных, обладающие достаточномощными выразительными возможностями, чтобы непосредственно моделироватьсложные объекты.
Новым направлением в развитиипрограммного обеспечения банков данных являются генераторы системы базы данных.Они позволяют разработчику строить собственную СУБД нового типа без полногопереписывания программного кода из заготовок.
Классификация БнД поэкономико-организационным признакам.
Следующая группа признаковклассификации связана с банком данных в целом. По условиям предоставления услугразличают бесплатные и платные банки данных. Платные БД, в свою очередь,делятся на бесприбыльные и коммерческие. Бесприбыльные банки данныхфункционируют на принципе самоокупаемости и не ставят своей целью получениеприбыли. Это обычно БнД социально значимой информации,имеющей широкий круг пользователей, или научной, библиотечной информации.Основной целью создания коммерческих банков данных является получение прибылиот информационной деятельности.
По форме собственностибанки данных делятся на государственные и негосударственные.
По степени доступностиразличают общедоступные и с ограниченным кругом пользователей.
В литературе встречаются и другиеаспекты классификации банков данных, но названные являются наиболее значимыми.