Сделай Сам Свою Работу на 5

Иерархическая система классификации





КЛАССИФИКАЦИЯ

И КОДИРОВАНИЕ

 

Методические указания

к самостоятельной работе,

практическим и лабораторным занятиям

для студентов очной и заочной форм обучения

по направлению 656100

 

 

Шахты 2001


УДК 002.001

Составители:

доцент кафедры «Информатика»

О.И. Лантратов

к.т.н., доцент кафедры «Информатика»

И.В. Барилов

ассистент кафедры «Информатика»

Н.В. Тюхаева

 

Рецензенты:

к.т.н., доцент кафедры «Информатика»

Г.Д. Диброва

к.ф.н., доцент кафедры «Информатика»

Е.Б. Ивушкина

 

 

Методические указания разработаны на основании Государственного образовательного стандарта высшего образования.

В методических указаниях рассмотрены базовые вопросы автоматизированной обработки информации – классификация и кодирование информации, приведены общие сведения о системах классификации и методах кодирования. Изложение теоретического материала сопровождается большим количеством примеров. Приведены типовые варианты выполнения лабораторной работы.

Данная работа предназначена для студентов, обучающихся по направлению 656100.

 



 

УДК 002.001

 

Ó Южно-Российский государственный

университет экономики и сервиса, 2001

Ó О.И. Лантратов, И.В. Барилов,

Н.В. Тюхаева, 2001

 


Оглавление

введение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 терминология. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 классификация. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 Иерархическая система классификации . . . . . . . . . . . . . . . . . . . . . . .
2.2 Фасетная классификация . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Дескрипторная система классификации . . . . . . . . . . . . . . . . . . . . . . .
3 КОДИРОВАНИЕ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 Регистрационные системы кодирования . . . . . . . . . . . . . . . . . . . . . . .
3.2 Классификационные (позиционные) системы кодирования . . . . . . .
3.3 Комбинированные методы кодирования . . . . . . . . . . . . . . . . . . . . . . .
4 Методические указания и задания к выполнению лабораторной работы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
4.1 Типовые задания к лабораторной работе . . . . . . . . . . . . . . . . . . . . . .
4.2 Пример выполнения лабораторной работы . . . . . . . . . . . . . . . . . . . . .
4.3 Порядок выполнения работы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4 Контрольные вопросы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
БИБЛИОГРАФИЧЕСКИЙ СПИСОК. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ВВЕДЕНИЕ



Сейчас большинство операций по обработке данных производится на ЭВМ. Структура исходных данных определяющим образом влияет на организацию информационных массивов и скорость их обработке.

При переносе исходных данных на машинные носители и организации их хранения в запоминающих устройствах ЭВМ текстовые наименования заменяются кодами, т.е. с естественного языка переводятся на условный. Это позволяет, во-первых, устранить неопределенность при обработке информации со сходными названиями, во-вторых, – значительно уменьшить объем обрабатываемой информации.

Пример.При учете мебели в большой организации неизбежно возникает проблема в большом количестве наименований, в частности, письменных столов. При поступлении столов на склад им присваивается наименование, указанное в сопроводительных документах (накладных). В связи с этим даже одинаковые столы разных производителей могут иметь разное название: «стол письменный двухтумбовый»; «стол письменный двухтумбовый офисный», «стол письменный корпусной двухтумбовый» и пр. Поэтому каждому вновь поступившему столу присваивается инвентарный номер, который в данном случае и является кодом.

При этом коды служат поисковыми образами реальных свойств в процессе выборки и обработки данных.



Результаты обработки оформляются в виде документа, где коды вновь заменяются на текстовые наименования. Поскольку при обработке информации тексты не претерпевают изменений, то информация об однозначном соответствии наименований и кодов выделяется в особый массив — “словарь”.

ТЕРМИНОЛОГИЯ

Человек существует не обособленно, а в обществе, следовательно, он постоянно находится во взаимодействии с различными процессами и явлениями. Совокупность этих процессов и явлений можно назвать окружающей средой.

Объекты окружающей среды соединены между собой каналами передачи информации, по которым циркулируют информационные потоки. Информационный поток представляет собой совокупность сообщений о каких-либо свойствах предметов, о процессах, событиях или об отношениях между объектами окружающей среды и человеком. Эти сообщения определяют сущность явления, которая выражается именно через совокупность его свойств.

Сообщение о сущности какого-то явления несет в себе логически завершенную информацию об этом явлении. Элементарным сообщением является информационная совокупность, определяемая термином “показатель”. Под этим термином понимается логическое высказывание, содержащее количественную и качественную характеристику отображаемой сущности, то есть описывающее какое-либо явление или процесс. Группа показателей образует информационную совокупность.

Элементами показателя являются реквизиты, каждый из которых выражает определенное свойство сущности. Реквизит не подлежит расчленению, так как при этом теряется его смысл, поэтому реквизит можно определить как простейший элемент сообщения. По содержанию реквизиты можно разделить на две группы: основания и признаки.

Основания дают количественное описание сущности (явления, процесса), выраженное в определенной единице измерения (м, кг, р. и т. п.). Их значениями могут быть только числа.

Признаки характеризуют качественные свойства сущности (явления, процесса), временные и пространственные координаты наблюдаемых явлений и процессов.

Пример.В высказывании «27.10.2000 г. на занятии по высшей математике присутствовали 8 человек из 15»

- 8 и 15 — реквизиты-основания,

- дата и указание “занятие по высшей математике” — реквизиты-признаки.

Каждый реквизит-признак имеет конечное множество конкретных значений. Например, значением признака “Одежда” может быть “пальто”, “платье”, “костюм” и т.д., а значением признака “Одежда спортивная” может быть “костюм спортивный”, ”костюм для занятий аэробикой”, “купальник” и т.д.

Величина этого множества конечна на конкретном отрезке времени. Это означает, что любое множество не бесконечно, то есть можно перечислить все возможные значения данного признака. С течением времени количество возможных значений множества может увеличиваться или уменьшаться. Поэтому специально оговаривается, что величина множества конечна именно на конкретном отрезке времени. Это может быть год, месяц, десятилетия и т.д., в зависимости от динамичности рассматриваемой системы.

Перечень значений реквизита составляет его номенклатуру.

 

 


КЛАССИФИКАЦИЯ

Классификацией называется логическая операция, которая заключается в распределении элементов рассматриваемого множества по подмножествам (классам) на основании общего признака или группы признаков. Каждый объект классификации характеризуется рядом свойств. То свойство объекта, которое позволяет установить его сходство или различие с другими объектами классификации, называется признаком классификации.

Упорядоченное расположение классифицируемых элементов на основе установленных связей и зависимостей между их признаками представляет собой классификационную систему.

Любая классификация основана на делении исходного понятия (множества) на подмножества по каким-либо признакам. Признак или группа признаков, на основании которых производится деление исходного множества на подмножества, называется основанием деления. Системы классификации характеризуются гибкостью, емкостью и степенью заполненности.

Гибкостью системы классификации называют свойство системы классификации допускать включение новых классификационных группировок без нарушения структуры существующей классификации.

Емкостью называют наибольшее количество группировок в данной системе классификации.

Степень заполненности классификации определяется отношением фактического количества классификационных группировок в данной классификации к емкости используемой в ней системы классификации.

Классификатор - систематизированный свод наименований и кодов классификационных группировок.

При любой классификации желательно, чтобы соблюдались следующие требования:

- полнота охвата объектов рассматриваемой области;

- однозначность реквизитов;

- возможность включения новых объектов.

В любой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Так, например, классифицированы: отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.

Существует несколько разновидностей классификаций: иерархическая, фасетная и дескрипторная.

 


Иерархическая система классификации

Под иерархией понимается такое соотношение, когда один класс является подклассом другого, целиком объемлющего первый.

Если в классификации каждое множество высшего порядка содержит непересекающиеся между собой подмножества низшего порядка, то эта классификация называется иерархической. Иногда такая классификация называется линейной. Например, деление людей на мужчин и женщин. Исходное множество — “люди” делится на непересекающиеся между собой подмножества: “мужчины” и “женщины”. Здесь основанием деления является пол человека.

Иерархическая классификация строится следующим образом: берется исходное понятие (множество) и последовательно уменьшается его объем (последовательно разбивается на подмножества). Под объемом понятия понимается множество предметов, каждый из которых обладает всеми признаками, составляющими содержание данного понятия (рисунок 2.1).

Так, при разделении множества «Одежда верхняя» можно применять только такие признаки, которые позволяют образовать подмножества (вид, тип, материал), и нельзя использовать такой признак, как, например, наличие капюшона, так как использование данного признака не обеспечивает разбиение исходного множества на непересекающиеся подмножества.

 


Рисунок 2.1 Иерархическая система классификации

 

Важно! В иерархической системе классификации из-за жесткой структуры особое внимание следует уделить выбору классификационных признаков.

Пример.Создать иерархическую систему классификации для информационного объекта "Верхняя одежда", которая позволит классифицировать информацию об объекте по следующим классификационным признакам: вид, тип и материал изготовления. Сведем основные признаки в таблицу.

 

Таблица 2.1 - Значения признаков классификации верхней одежды

Признак Уровень классификации Значения признака
Вид - Пальто - Шуба - Куртка - Плащ
Тип - Длинное - Короткое
Материал - Драп - Кашемир - Шерсть - Натуральный мех - Искусственный мех - Кожа - Ткань

 

 
 

Иерархическую классификацию удобно изображать в виде графа типа “дерево” (рисунок 2.2)

Рисунок 2.2 - Пример иерархической классификации

 

В приведенном на рисунке 2.2 дереве классификации из-за отсутствия места не показан признак тип. Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Таким образом, в иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Следовательно, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Достоинства иерархической системы классификации:

- простота и логичность построения;

- использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации:

- жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;

- невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

 

Фасетная классификация

 

Фасетная система классификации, в отличие от иерархической, позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet — рамка). Каждый фасет содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

Фасетный можно понимать и как “отдельный”, то есть каждый признак объекта (фасет) рассматривается индивидуально, а не в связи с остальными признаками. В основе фасетной классификации лежит фасетный анализ. Анализируются характерные признаки объектов классификации и выявляются основные категории свойств предметов. Фасеты в свою очередь могут быть разделены на субфасеты и т.п. до необходимой степени детализации.

Пример.Фасет одежда содержит значения мужская, женская, детская. В свою очередь каждую группу можно разбить на зимнюю, летнюю, демисезонную. Каждую подгруппу можно разбить по размеру, цвету и т.д.

После того как все характерные признаки выявлены, их необходимо упорядочить, то есть зафиксировать порядок перечисления этих признаков в ходе описания объекта исходного множества. Схема фиксированной последовательности расположения фасетов в классификации называется фасетной формулой.

Схема построения фасетной системы классификации в виде таблицы отображена на рисунке. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2, …, Фi, …, Фn. Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета.

 
 

Рисунок 2.3 - Фасетная система классификации

 

Процедура классификации состоит в присвоении каждому объекту соответствующих значений фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается порядок их следования:

Кs = (Ф1, Ф2, …, Фi, …, Фn),

где Фi - i-й фасет;

n - количество фасетов.

Фасетная система обладает большей гибкостью, удобством для компьютерной обработки информации, т.к. возможно добавлять неограниченное число фасет, группировать множество по любому сочетанию и числу фасетов, при этом необходимо, чтобы значения, используемые в различных фасетах, не повторялись.

Пример.Разработать фасетную систему классификации верхней одежды с учетом сезонности.

Сгруппируем и представим в виде таблицы все классификационные признаки по фасетам (таблица 2.2).

- фасет вид одеждыс четырьмя видами;

- фасет тип с двумя типами исполнения;

- фасет материал с семью наименованиями материала;

- фасет сезонность с двумя обозначениями сезонов;

Структурную формулу любого класса можно представить в виде:

Ks=(вид одежды, тип, материал, сезонность).

Присваивая конкретные значения каждому фасету, получим следующие классы:

К1=(куртка, короткая, кожа, демисезонная);

K2=(шуба, длинная, искусственный мех, зимняя) и т.д.

 


Таблица 2.2 - Фасетная система классификации

№ п/п Вид Тип Материал Сезонность
Пальто Длинная Драп Зимнее
Шуба Короткая Кашемир Демисезонное
Плащ   Шерсть  
Куртка   Натуральный мех  
    Искусственный мех  
    Кожа  
    Ткань  

 

Достоинства фасетной системы классификации:

- возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок;

- возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, т.к. необходимо учитывать все многообразие классификационных признаков.

 

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.