Системы управления базами данных
Содержание
(является гиперссылками перехода к тексту – при нажатии клавиши Ctrl и левой кнопки мыши)
§1. Модели данных. 1
§2. Системы управления базами данных. 3
§3. Тенденции и перспективы развития технологий управления ресурсами данных. 4
§4. Технология хранилищ данных Data Warehousing. 5
§5. Технология анализа OLAP. 7
§6. Технология анализа «Data Mining». 9
§7. Классификаторы, коды и технология их применения. 12
§8. Использованные источники. 16
Модели данных
Существуют объекты, предметы, информацию о которых необходимо хранить, и эти объекты связаны между собой самыми разными способами. Чтобы область хранения данных рассматривалась в качестве базы данных, в ней должны содержаться не только данные, но и сведения о взаимоотношениях между этими данными.
База данных (БД)– это поименованный набор организованных данных, отражающий состояние объектов и их отношений в рассматриваемой предметной области.
Система управления базой данных (СУБД) позволяет получить доступ к данным, обеспечивает корректировку, пополнение, сохранение БД.
Различают логический и физический уровни организации данных. Физический уровень отражает организацию хранения БД на машинных носителях, а логический уровень – внешнее представление данных пользователю.
Логическая организация данных па машинном носителе зависит от используемых программных средств организации и ведения данных. Метод логической организации данных определяется используемыми типом структур данных и видом модели, которая поддерживается программным средством.
Модель данных – это совокупность взаимосвязанных структур данных и операций над этими структурами. Вид модели и используемые в ней типы структур данных отражают концепцию организации и обработки данных, используемую в СУБД, поддерживающей модель, или в языке системы программирования, на котором создается прикладная программа обработки данных.
Важно отметить, что для размещения одной и той же информации во внутримашинной сфере могут быть использованы различные структуры и модели данных. Их вы6op возлагается на пользователя, создающего информационную базу, и зависит от многих факторов, в том числе от имеющегося технического и программного обеспечения, определяется сложностью автоматизируемых задач и объемом информации.
По способу организации БД разделяют на базы с плоскими файлами, иерархические, сетевые, реляционные, объектно–реляционные и объектно–ориентированные базы данных.
Файловая модель. На ранней стадии использования информационных систем в экономике применялась файловая модель данных. В файловых системах реализуется модель типа плоский файл.
Плоский файл – это файл, состоящий из записей одного типа и не содержащий указателей на другие записи, двумерный массив элементов данных. Файлы, которые создаются в прикладных программах пользователя, написанных на алгоритмическом языке, также относятся к этому виду организации данных. Описание логической структуры файлов и параметры размещения на машинных носителях содержатся в каждой прикладной программе обработки файлов. В этих же программах предусмотрено их создание и корректировка. При файловой организации массивов трудно обеспечить актуальное состояние данных, их достоверность и непротиворечивость.
Сетевые и иерархические модели. Более сложными моделями данных по сравнению с файловой являются сетевые и иерархические модели, которые поддерживаются в системе управления базами данных соответствующего типа. Тип модели данных, поддерживаемой СУБД на машинном носителе, является одним из важнейших признаков классификации СУБД.
Сетевая или иерархическая модель данных представляет соответствующий метод логической организации базы данных в СУБД.
Иерархическая модель представляет собой древовидную структуру с корневыми сегментами, имеющими физический указатель на другие сегменты. Одно из неудобств этой модели заключается в том, что реальный мир не может быть представлен в виде древовидной структуры с единственным корневым сегментом. Иерархические БД обеспечивали указатели между различными деревьями баз данных, но обработка данных с использованием таких связей была не всегда удобной.
В иерархических моделях непосредственный доступ, как правило, возможен только к объекту самого высокого уровня, который не подчинен другим объектам. К другим объектам доступ осуществляется по связям от объекта на вершине модели. В сетевых моделях непосредственный доступ может обеспечиваться к любому объекту независимо от уровня, на котором он находится в модели. Возможен также доступ по связям от любой точки доступа.
В отличие от иерархической БД в сетевой БД нет необходимости в корневой записи. Однако, как и в иерархических БД, связи поддерживаются с помощью физических указателей.
Сетевые модели данных по сравнению с иерархическими являются более универсальным средством отображения структуры информации для разных предметных областей. Взаимосвязи данных большинства предметных областей имеют сетевой характер, что ограничивает использование СУБД с иерархической моделью данных. Сетевые модели позволяют отображать также иерархические взаимосвязи данных. Достоинством сетевых моделей является отсутствие дублирования данных в различных элементах модели. Кроме того, технология работы с сетевыми моделями является удобной для пользователя, так как доступ к данным практически не имеет ограничений и возможен непосредственно к объекту любого уровня. Допустимы всевозможные запросы.
Реляционная модель данных. Концепция реляционной модели баз данных была предложена Э.Ф. Коддом в 1970 г. Как отмечал доктор Кодд, реляционная модель данных обеспечивает ряд возможностей, которые делают управление и использование базы данных относительно легким, предсказуемым и устойчивым по отношению к ошибкам. Наиболее важные характеристики реляционной модели заключены в следующем:
· Модель описывает данные с их естественной структурой, не добавляя каких–либо дополнительных структур, необходимых для машинного представления или для целей реализации.
· Модель обеспечивает математическую основу для интерпретации выводимости, избыточности и непротиворечивости отношений.
· Модель обеспечивает независимость данных от их физического представления, от связей между данными и от соображений реализации, связанных с эффективностью и подобными проблемами.
Реляционные модели данных отличаются от рассмотренных выше сетевых и иерархических простотой структур данных, удобным для пользователя табличным представлением и доступом к данным. Реляционная модель данных является совокупностью простейших двумерных таблиц – отношений (объектов модели). Связи между двумя логически связанными таблицами в реляционной модели устанавливаются по равенству значений одинаковых атрибутов таблиц–отношений.
Таблица–отношение является универсальным объектом реляционных моделей. Это обеспечивает возможность унификации обработки данных в различных СУБД, поддерживающих реляционную модель. Операции обработки реляционных моделей основаны на использовании универсального аппарата алгебры отношений и реляционного исчисления.
Структуры данных реляционной модели.Таблица является основным типом структуры данных (объектом) реляционной модели. Структура таблицы определяется совокупностью столбцов. Данные в пределах одного столбца однородны. В таблице не может быть двух одинаковых строк. Общее число строк не ограничено.
Столбец соответствует некоторому элементу данных – атрибуту, который является простейшей структурой данных. В таблице не могут быть определены множественные элементы, группа или повторяющаяся группа, как в рассмотренных выше сетевых и иерархических моделях. Каждый столбец таблицы должен иметь имя соответствующего элемента данных (атрибута). Один или несколько атрибутов, значения которых однозначно идентифицируют строку таблицы, являются ключом таблицы.
В реляционном подходе к построению баз данных используется терминология теории отношений. Простейшая двумерная таблица определяется как отношение. Столбец таблицы со значениями соответствующего атрибута называется доменом, а строки со значениями разных атрибутов – кортежем.
Совокупность нормализованных отношений (реляционных таблиц), логически взаимосвязанных и отражающих некоторую предметную область, образует реляционною базу данных (РБД). В ходе разработки БД должен быть определен состав логически взаимосвязанных реляционных таблиц и определен состав атрибутов каждого отношения. Состав атрибутов должен отвечать требованиям нормализации.
Реляционная модель данных зарекомендовала себя как модель, на основе которой могут разрабатываться реальные жизнеспособные приложения. В настоящее время эта модель данных является наиболее популярной.
Объектно–ориентированная модель данных. Реляционная модель данных оказалась эффективной не для всех приложений. Главными среди типов приложений, для которых трудно использовать реляционные базы данных, являются автоматизированное проектирование (Computer Aided design, CAD) и автоматизированная разработка программного обеспечения (Computer Aided Software Engineering, CASE). Разработчики коммерческих продуктов в таких областях, в которых для управления хранением данных используется реляционная СУБД, должны пойти на некоторые изменения данных для того, чтобы подогнать их к структуре строк и столбцов. Как показывает практика, в таких областях, как CAD и CASE более подходит объектно–ориентированная модель данных. В объектно–ориентированных базах данных (ООБД) важнейшее место отводится объектам, на основе которых могут определяться другие объекты благодаря использованию концепции, называемой наследованием. При этом некоторые или все атрибуты (либо свойства) определяющего объекта наследуются каким–то другим объектом, одни атрибуты и свойства добавляются, а другие могут удаляться.
Системы управления базами данных
Обработка данных средствами СУБД. Добавление, удаление, изменение и выборка данных производится при помощи языка запросов, встроенного алгоритмического языка и других средств СУБД. Реализация запросов обеспечивается диалоговой системой команд с меню или запросами по примеру QBE (Query By Example). В первом случае отдельный запрос выполняется одной или несколькими командами языка СУБД. Последовательность команд языка СУБД образует программу (например, СУБД Dbase). Во втором – для выполнения запроса пользователь выбирает последовательно один или несколько пунктов меню или указывает в запросе пример (образец), по которому составляется запрос, а также при необходимости условия выбора и операции вычисления, которые необходимо выполнять с данными (например, СУБД Paradox, Access). Последовательность команд меню и запросов может быть запомнена в программе–макросе и в дальнейшем выполнена так же, как командный файл.
Стандартным реляционным языком запросов является язык структурированных запросов SQL (Structured Queries Language).
Классификация и краткий обзор современных СУБД.К важным признакам классификации современных СУБД относятся:
· среда функционирования – класс компьютеров и операционных систем (платформа), на которых работает СУБД, в том числе разрядность операционной системы, на которую ориентирована СУБД;
· тип поддерживаемой в СУБД модели данных: сетевая, иерархическая или реляционная;
· возможности встроенного языка СУБД, его переносимость в другие приложения (SQL, Visual Basic, ObjectPAL и т.п.);
· наличие развитых диалоговых средств конструирования (таблиц, форм, запросов, отчетов, макросов) и средств работы с базой данных;
· возможность работы с нетрадиционными данными в корпоративных сетях (страницы HTML, сообщения электронной почты, изображения, звуковые файлы, видеоклипы и т. п.);
· используемая концепция работы с нетрадиционными данными – объектно–реляционные, объектные;
· уровень использования – локальная (для настольных систем), архитектура клиент–сервер, с параллельной обработкой данных (многопроцессорная);
· использование объектной технологии OLE 2.0;
· возможности интеграции данных из разных СУБД;
· степень поддержки языка SQL и возможности работы с сервером баз данных (SQL–сервером);
· наличие средств отчуждаемых приложений, позволяющих не проводить полной инсталляции СУБД для тиражируемых приложений пользователя.
Наиболее известными СУБД для разработки простых приложений можно назвать Access, Paradox и Approach. Для создания более сложных бизнес–приложений, корпоративных информационных систем используются СУБД фирм Oracle, Informix, IBM, Sybase.
Относительно простой в изучении и использовании считается Approach for Windows, которая ориентирована на разработку небольших приложений. Более совершенными, обладающими мощным языком разработки приложений пользователя являются СУБД Paradox и Access.
К общим свойствам СУБД Approach, Paradox и Access относятся:
· графический многооконный интерфейс, позволяющий пользователю в диалоговом режиме создавать таблицы, формы, запросы, отчеты и макросы;
· специальные средства, автоматизирующие работу – многочисленные мастера (Wizards) в Access, ассистенты (Assistants) в Approach и эксперты (Experts) в Paradox;
· возможность работы в локальном режиме или в режиме клиента на рабочей станции (Windows NT 3.51, Novell NetWare 4.1);
· использование объектной технологии OLE2 для внедрения в базу данных разной природы (текстов, электронных таблиц, изображений и т. п.);
· наличие собственного языка программирования.
Особенности СУБД Approach, Paradox, Access:
· в Approach, в отличие от Paradox и Access, не обеспечивается полная поддержка языка запросов SQL, что ограничивает ее возможности в многопользовательских системах только просмотром данных;
· в Access предусмотрена автоматическая генерация кода SQL при создании запроса пользователем;
· в Approach язык для разработки приложении Lotus Script уступает по интеграционным возможностям и удобству работы объектно–ориентированным языкам (в Paradox – ObjectPAL, u Access – Visual Basic);
· Visual Basic в Access является наиболее мощным языком программирования, который обладает свойством автономности от СУБД и переносимости в другие приложения Microsoft Office, обеспечивая хорошую интеграцию данных;
· в Access имеется Мастер анализа таблиц, с помощью которого можно выполнить нормализацию таблицы.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|