Сделай Сам Свою Работу на 5

ФОРМИРОВАНИЕ МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ

Современный уровень инструментальных средств позволяет ра­ботать на компьютере на определенном уровне, например, при ис­пользовании редакторов, многим пользователям. Однако при уг­лубленной работе с информацией, связанной с ее сбором, создани­ем базы данных, обработкой информации, представлением для дальнейшего использования возникают значительные трудности. Это связано с невозможностью работы в компьютерной среде на естественном языке. Вся информация, описывающая конкретную предметную область должна быть определенным образом абстраги­рована и формализована.

Основными направлениями формализации информации о предметной области являются:

• теория классификации, базирующаяся на таксономическом и мерономическом описании информации. Таксономическое описа­ние основано на идеологии множеств, а мерономическое осуществ­ляется через строго формализованное определение классов;

• теория измерений, предлагающая базу для качественных и количественных измерений через классификационные и порядко­вые шкалы;

• семиотика, изучающая знаковые системы с точки зрения синтактики, семантики и прагматики.

Прежде чем перейти непосредственно к вопросам формализа­ции и абстрагированного описания кратко коснемся вопросов тер­минологии.

Понятие информации в общем плане должно быть связано с определенной предметной областью, свойства которой она отража­ет. В более узком плане понятие информации связано с определен­ным объектом. При этом наблюдается относительная независи­мость информации от носителя, поскольку возможны ее преобра­зование и передача по различным физическим средам с помощью разнообразных физических сигналов безотносительно к ее содер­жанию, т.е. к семантике, что и явилось центральным вопросом многих исследований, в том числе и в философской науке. Инфор­мация о любом материальном объекте может быть получена путем наблюдения, натурного либо вычислительного эксперимента, а также на основе логического вывода. Поэтому говорят о доопытной, или априорной информации и послеопытной, т.е. апостери­орной, полученной в итоге эксперимента.

Предметная область— реальный мир, который должен быть от­ражен в информационной базе.

Факты— результат наблюдения за состоянием предметной об­ласти.

Данные— вид информации, отличающийся высокой степенью форматированности в отличие от более свободных структур, харак­терных для речевой, текстовой и визуальной информации

Информационная база(база данных) — совокупность данных, предназначенных для совместного применения.

Знания— итог теоретической и практической деятельности че­ловека, отражающий накопление предыдущего опыта и отличаю­щийся высокой степенью структуризации.

В знаниях можно выделить три основные составные части:

• декларативные (факторальные знания), представляющие об­щее описание объекта, что не позволяет их использовать без пред­варительной структуризации в конкретной предметной области;

• понятийные (системные) знания, содержащие помимо пер­вой части, взаимосвязи между понятиями и свойства понятий;

• процедурные (алгоритмические) знания, позволяющие полу­чить алгоритм решения.

Предмет— всякая материальная вещь, объект познания. В ло­гике предметом называется все то, на что направлена наша мысль; все то, что может быть как-то воспринято, названо и т.д. В этом смысле предметом считаются также суждение, понятие, умозаклю­чение. В математической логике предметы обозначаются символа­ми — предметными константами и предметными переменными.

Свойство — то, что присуще предметам, что отличает их от дру­гих предметов или делает их похожими на другие предметы. Каж­дый предмет обладает бесчисленным множеством свойств. Свойст­ва проявляются в процессе взаимодействия предметов.

Признак— все то, в чем предметы, явления сходны друг с дру­гом или в чем они отличаются друг от друга; показатель, сторона предмета или явления, по которой можно узнать, определить или описать предмет или явление.

Атрибут (лат. attributum — предназначенное, наделенное, присо­вокупленное) — неотъемлемое, существенное, необходимое свойст­во, признак предмета или явления, без которого они не могут су­ществовать, быть самими собой, в отличие от случайных, преходя­щих, несущественных свойств, или акциденций.

Таким образом, для современного состояния информационных технологий необходим переход от информационного описания предметной области к представлению на уровне данных, осуществ­ляемый на основе декомпозиции, абстракции, агрегирования.

Декомпозиция— это разбиение системы (программы, задачи) на компоненты, объединение которых позволяет решить данную задачу.

Абстракция позволяет правильно выбрать нужные компоненты для декомпозиции.

Абстракция представляет собой эффективный способ декомпози­ции, осуществляемый посредством изменения списка декомпозиции.

Абстракция предполагает продуманный выбор компонент. Про­цесс абстракции может быть рассмотрен как некоторое обобщение. Он позволяет забыть о различиях и рассматривать предметы и яв­ления так, как если бы они были эквивалентны.

Выделение общего у процессов и явлений есть основа класси­фикации. Иерархия абстракций представляет собой фактически схему классификации.

Агрегирование — процесс объединения предметов в некоторую группу не обязательно в целях классификации. Агрегирование вы­полняется с некоторой целью.

Способы абстрагирования:

• абстракция через параметризацию;

• абстракция через спецификацию.

Абстракция через параметризацию — выделение формальных параметров с возможностью их замены на фактические в различ­ных контекстах.

Выделение формальных параметров позволяет абстрагироваться от конкретного приложения и базируется на общности определен­ных свойств конкретных приложений.

Абстракция через спецификацию позволяет абстрагироваться от внутренней структуры до знания свойств внешних проявлений (ре­зультата).

Модель данных— модель, используемая при абстрагировании. Концептуальная модель— абстрагированное описание предметной области.

После знакомства с вопросами терминологии Вы получили воз­можность разговаривать на профессиональном языке и можно перей­ти к проблемам конструирования информационного обеспечения. Первой в этом ряду стоит проблема анализа предметной области.

При анализе предметной области принято выделять три этапа:

• анализ требований и информационных потребностей;

• определение информационных объектов и связей между ними;

• конструирование концептуальной модели предметной области. Этап анализа требований и информационных потребностей

включает следующие задачи:

• определение перечня задач по извлечению, обработке, хране­нию, транспортировке и представлению (в том числе документиро­ванию) информации;

• определение требований к составу, структуре, формам пред­ставления информации;

• прогнозирование возможных изменений информационных ресурсов как в количественном, так и в содержательном плане.

Рассмотрим пример анализа предметной области. Выберем об­ласть деятельности, знакомую всем студентам — учебный процесс. Предположим, нам поручили разработать информационную систе­му «Расписание занятий».

Каждый из участников действия имеет свое представление об информации данной предметной области. Нашей задачей является обобщение этих представлений, получаемых путем опроса участни­ков информационных процессов и анализа документов. Все дейст­вия желательно фиксировать в виде определенных документов на бумаге или в памяти компьютера. Форма фиксации может быть любая: структурная схема, блок-схема, таблица и т.д. Например, в качестве таковых можно использовать следующие виды докумен­тов: схему внешних информационных связей (рис. 7.5), схему дета­лизации действия (рис. 7.6), схему потоков данных (рис. 7.7) и др.

 

Рис. 7.5. Схема внешних информационных связей

Рис. 7.6. Схема детализации действия

 

Используем предложенные типы документов.

1. Схема внешних информационных связей. Действие — Работа_с_расписанием.

2. Схема детализации действия. Действие — Работа_с_расписанием.

3. Схема потоков данных. Действие — Работа_с_расписанием.

4. Схемы классификации: объект — пользователи расписания (рис. 7.8, а); объект — помещение (рис. 7.8, б); данные — запросы к расписанию (рис. 7.8, в).

 

Рис. 7.7. Схема потоков данных

 

Рис. 7.8. Схемы классификации

 

5. Схема детализации. Данные — справки по расписанию (рис.

7.9).

6. Схема классификации. Данные — справки по расписанию

(рис. 7.10).

Тщательность проведения этапа анализа определяет в дальней­шем эффективность работы информационной системы,

 

 

Рис. 7.9. Схема детализации

 

возможность дальнейшего наращивания информационных ресурсов, адап­тируемость к изменению требований к системе.

После анализа требований и информационных потребностей можно перейти к следующей фазе — определению информацион­ных объектов и связей между ними.

Основной задачей данного этапа является разбиение предмет­ной области на составные части путем декомпозиции, осуществ­ляемой по определенным правилам.

На данный момент существуют два основных подхода к этому процессу, отличающихся критериями декомпозиции: функциональ­но — модульный (структурный) и объектно-ориентированный.

Функционально-модульный подход основан на принципе алгорит­мической декомпозиции с выделением функциональных элементов и установлением строгого порядка выполняемых действий, т.е. в основе лежит иерархический подход с выделением вначале функ­циональных действий, затем независимых компонентов с дальней­шей их детализацией.

Рис. 7.10. Схема классификации

 

Объектно-ориентированный подход основан на объектной деком­позиции с описанием поведения системы в терминах взаимодейст­вия объектов.

Главным недостатком функционально-модульного подхода яв­ляется однонаправленность информационных потоков и недоста­точная обратная связь. В случае изменения требований к системе это приводит к полному перепроектированию, поэтому ошибки, заложенные на ранних этапах, сильно сказываются на продолжи­тельности и стоимости разработки. Другой важной проблемой яв­ляется неоднородность информационных ресурсов, используемых в большинстве информационных систем. В силу этих причин в на­стоящее время наибольшее распространение получил объект­но-ориентированный подход.

Основные понятия, используемые при декомпозиции предмет­ной области на основе объектно-ориентированного подхода — объ­ект, класс, экземпляр, атрибут, связь между объектами, связь меж­ду атрибутами.

Объект— это абстракция множества предметов реального мира, обладающих одинаковыми характеристиками и законами поведе­ния. Объект характеризует собой типичный неопределенный эле­мент такого множества. Основной характеристикой объекта явля­ется состав его атрибутов (свойств). Иным образом, объект можно характеризовать как факт, лицо, событие, предмет, определяемый совокупностью данных. В примитивном плане — объект это то, что отвечает на вопрос «кто?», «что?». Объект может быть реальным (например, человек, предмет, географический пункт) и абстракт­ным (например, событие, счет покупателя, изучаемый учебный курс).

Атрибут— информационное отображение свойств объекта.

Экземпляр объекта— это конкретный, определенный элемент множества. Например объектом может являться государственный номер автомобиля, а экземпляром этого объекта — номер К 173 ПА.

Класс — это множество предметов реального мира, связанных общностью структуры и поведением.

Элемент класса— это конкретный элемент данного множества. Например, класс регистрационных номеров автомобиля.

Обобщая эти определения, можно сказать, что объект — это ти­пичный представитель класса, а термины «экземпляр объекта» и«элемент класса» равнозначны. На рис. 7.11 показаны отношения между классами, объектами и предметами реального мира. Связь между объектами (атрибутами) — информационное отображение

 

Рис. 7.11. Отношения между классами, объектами и предметами реального мира

 

функциональной, «родственной», видовой или иной зависимости (подчиненности).

При выделении информационных объектов можно проследить следующую последовательность действий:

• формирование классов, на которые можно разбить данные, подлежащие хранению;

• присвоение уникального имени каждому классу объектов;

• выделение информационных объектов путем анализа инфор­мационных потоков, документальных источников и интервьюиро­вания участников информационного взаимодействия;

• присвоение уникального имени каждому объекту данных и проверка их синтактики и семантики;

• определение набора характеристик каждого объекта и форми­рование на этой основе состава атрибутов;

• присвоение уникальных имен выбранным атрибутам;

• задание ограничений на объекты и их атрибуты (количест­венные ограничения — диапазон изменения: максимальное (мини­мальное) значение и др., ограничение целостности (неизменности состояния объекта в рассматриваемом интервале времени).

В процессе отражения между состояниями взаимодействующих объектов возникает определенная связь. Информация как резуль­тат отражения одного объекта другим выявляет степень соответст­вия их состояний.

Выделяют три типа связи: связь «один к одному» (1:1), связь «один ко многим» (1:М), связь «многие ко многим» (M:N).

Примеры этих связей:

 

 

Связь «один к одному» (1:1) отображает однозначную зависи­мость между объектами (больной Иванов лежит на койке 73 — на койке 73 лежит больной Иванов; студент Петров имеет зачетную книжку №131056— зачетная книжка №131056 принадлежит сту­денту Петрову).

Связь «один ко многим» (1:М) или «многие к одному» (М:1) отображает неоднозначную зависимость одного объекта по отно­шению к другому (больной Иванов лежит в палате №6 — в палате №6 лежат больные Иванов, Петров, Сидоров, Михайлов; студент Петров учится в группе №131 —в группе №131 учатся студенты Петров, Максимов, Коробкин, Ильин, Круглова и др.).

Связь «многие ко многим» (M:N) отображает неоднозначную зависимость объектов по отношению друг к другу (больной Иванов лечится у врачей Соколова, Воробьева, Воронова — врач Соколов лечит больных Иванова, Петрова, Сидорова; студент Петров посе­щает лекции профессоров Яшина, Васильева, Волкова — профес­сор Яшин читает лекции студентам Петрову, Максимову, Коробкину, Ильину, Кругловой и др.).

Выделение этих связей является крайне важным, так как связи 1:М и M:N имеют внутреннюю неопределенность, что сказывается при операциях поиска и модификации (изменения) данных. Для преодоления неопределенности на этапе реализации логической модели требуется вводить избыточную информацию.

Заключительной фазой анализа предметной области является проектирование определенной информационной структуры в виде концептуальной модели. Для построения концептуальной модели используются операции агрегации и обобщения.

Агрегация основана на объединении информационных объек­тов в один на основе семантических связей между объектами. На­пример, самолет типа X перевозит груз из пункта отправления А в пункт назначения В. Используя агрегацию создаем информацион­ный объект РЕЙС с атрибутами «тип самолета», «пункт отправле­ния», «пункт назначения», «рейс самолета».

Обобщение основано на объединении родственных информа­ционных объектов в родовой объект. Например, объекты АВТОМОБИЛЬ, САМОЛЕТ, КОРАБЛЬ, ВЕЛОСИПЕД, МОТО­ЦИКЛ объединяем в объект ТРАНСПОРТНОЕ СРЕДСТВО. Од­ним из атрибутов этого объекта будет атрибут «тип транспортного средства».

Этап концептуального проектирования является специфиче­ским, так как здесь требуется одновременно знание особенностей предметной области и методологии проектирования. Характерным является использование различных моделей (модели «сущ­ность — связь», бинарных моделей данных, семантических сетей, инфологических моделей данных и др.). Отрицательным моментом является неадекватность получаемых результатов как при исполь­зовании различных моделей, так и в рамках коллектива исполнителей.

Рис. 7.12. Элементы ER-диаграммы

 

Особенностью концептуаль­ной модели является ее ориента­ция с одной стороны на инфор­мационные интересы пользовате­ля, с другой — на информацион­ные потребности самой предмет­ной области. Пользователям на выбор предлагается две модели:

модель «сущность — связь» и простая реляционная модель с указа­нием функциональных взаимосвязей между атрибутами.

Одной из распространенных моделей является модель «сущ­ность — связь» («entity» — «relationship»), в литературе наряду с этим используется термин «ER-модель», или «модель Чена».

Базовыми структурами в ER-модели являются типы сущностей и типы связей (рис. 7.12). Отличие типа связи от типа сущно­сти - в установлении зависимости реализации одного типа от реа­лизации другого.

Пример: ЛИЧНОСТЬ-тип сущности, тип СОСТОИТ В БРАКЕ — нет, так как реализация последнего типа не существует, если не существует двух личностей. Поэтому, тип связи можно рас­сматривать как агрегат двух или более типов сущностей.

Реляционная модель является наиболее распространенной на практике в современных ИС, поэтому целесообразно рассмотреть

Рис. 7.13. Семантическая диаграмма реляционной модели

Рис. 7.14. Пример реляционной модели

 

ее возможности. Большинство СУБД, представленных на рынке, являются реляционными или объектно-реляционными. Семанти­ческая диаграмма реляционной модели представлена на рис. 7.13, а пример реляционной модели — на рис. 7.14.

 



©2015- 2017 stydopedia.ru Все материалы защищены законодательством РФ.