Сделай Сам Свою Работу на 5

Формирование фрагмента базы знаний предметной области





Проектирование баз знаний различного типа

На примерахучебной лингвистической базы знаний по русскому или белорусскому языку и базы знаний предметной области

Ниже дан перечень задач-этапов создания баз знаний. Выполняйте указанные задания и все результаты сохраняйте в один или несколько файлов (в соответствии с рекомендациями). Работу оформляйте на том языке (русском или белорусском), для которого создается база знаний. Перед каждым результатом дублируйте и выделяйте шрифтом (цветом, маркером) соответствующие предложенные формулировки заданий.

Прежде чем приступить к выполнению задачи, рекомендуется прочитать все входящие в нее шаги-задания.

Задача 1. Подготовка исходных данных для баз знаний в форме текстов

1. Выберите (придумайте) любую конкретную тему из любой конкретной предметной области и сформулируйте ее название. Например, тема «Приготовление драников» из области «приготовление пищи».

2. Напишите (или найдите из различных источников, с обязательной ссылкой на них) тексты различной стилистики, описывающие соответствующий выбранной теме процесс (например, приготовления одного и того же выбранного блюда):



1) рецепт, или инструкция, или руководство, или правило и т.п. - так, как это пишут в книгах рецептов, инструктажах, учебниках, справочниках и пр. формальных документах. Придумайте заголовок (название) для этого текста и укажите его стиль.

2) рассказ от первого лица, например, «Как я готовлю …: Чтобы приготовить драники, я беру 3 крупные картофелины …». Придумайте заголовок (название) для этого текста и укажите его стиль.

3)аналогичный рассказо ком-либо, например «Как он (она)готовит …: Лучше всего Вера умеет готовить драники. Приятно смотреть, как она это делает. Сначала она тщательно выбирает картошку. Берёт самые крупные и ровные картофелины. Если готовит на семью из 3-х человек, то подбирает примерно 5-6 картофелин. …». Определите и сформулируйте стиль данного текста. Придумайте заголовок (название) для этого текста.

4) аналогичныйрассказ в стиле «Мы готовим …» в двух формах обращения: на «ты» и на «Вы». Например: «Давай сегодня приготовим драники…» и «Давайте вместе научимся готовить драники. Для начала возьмём рецепт из Книги о вкусной и здоровой пище…». Определите и сформулируйте стиль данных текстов. Придумайте заголовок (название) для этого текста.



5) диалог в форме вопросов-ответов, расписанных по ролям, о том, как приготовить выбранное блюдо. Например:

Таня: Ваня, расскажи, как ты готовишь такие вкусные драники!

Ваня: С удовольствием! Это очень просто! Сначала я беру картошку.

Таня: А какая должна быть картошка?

Можно обыграть ситуацию как разговор по телефону и/или разговор при встрече, выбрав при этом форму обращения на «ты» или «Вы». Опишите для данного диалога условия, при которых он происходит. Например: «Таня пришла в гости к Ване. Ваня приготовил своё коронное блюдо – драники. Он предложил Тане попробовать своё блюдо…».

Придумайте заголовок (название) для данного диалога.

6) диалог-подготовка к выполнению рассматриваемого процесса, например «Покупка продуктов для приготовления блюда:

Покупатель: Скажите, пожалуйста, сколько стоит вот этот картофель?

Продавец: …»

Опишите для данного диалога условия, при которых он происходит.

Придумайте заголовок (название) для данного диалога.

3. Сохраните подготовленные тексты в отдельных файлах, давая им имена-заголовки соответствующих текстов.

Примечание: данную задачу можно выполнять коллективно, выбрав одну для всех предметную область, в рамках которой создав несколько тем для текстов.

 

Задача 2. Обработка подготовленных текстов с целью выделения и формирования фрагментов баз знаний различного типа



Формирование фрагмента лингвистической базы знаний

1. Обработайте подготовленные тексты, создав на их основе частотные словари словоформ для каждого текста в отдельности. Можно для этого использовать любое программное обеспечение. Например, средства MSWordи Excel (см. видео на сайте it.lang-study.com).Результаты можно сохранять в одном или нескольких файлах.

2. Выполните лемматизацию полученных частотных словарей, т.е. создайте словники, которые будут состоять из всех слов, стоящих в начальной форме (либо вручную, на основе созданных словарей словоформ, либо с помощью специальных программ).

3. Сравните состав всех лемматизированных словарей и выпишите в отдельный словник те слова, которые встречаются во всех текстах. Это словарь-пересечение, который можно использовать в качестве основы для создания базы знаний предметной области. Каждая лексема словаря-пересечения (за исключением слов-связок: предлогов, союзов и т.п.) – претендент на «звание» ключевого понятия-знака предметной области.

4. Систематизируйте слова, используя лингвистические знания (мета-информацию о лексемах), лучше всего это делать в таблицах Excel:

- рассортируйте слова из словаря-пересечения по частям речи

- внутри частеречных списков рассортируйте слова по другим устойчивым грамматическим признакам. Например, имена существительные – по родам, глаголы – по видам и т.д. вглубь. В результате должны получиться многоуровневые иерархические списки-таблицы. Продумайте способы наиболее удобного для работы и наглядного для изучения размещения информации;

- опишите для каждой лексемыдополнительную мета-информацию для слов словаря-пересечения, используя все созданные словники для каждого из проанализированных текстов:

-- отношение синонимии с реализациями, встретившимися в используемых текстах – в виде списка синонимов. Продумайте, каким способом наиболее эффективно создавать подобные списки, используя ссылки.

-- аналогично – любые другие семантические отношения.

-- формообразующие отношения (например, списки однокоренных слов и т.п.). Продумайте, каким способом наиболее эффективно создавать подобные списки, используя ссылки.

-- перечислите для каждой лексемы характерные отношения «лексическая сочетаемость» и выпишите примеры реализации этих отношений из используемых текстов (пример см. здесь: http://rus.lang-study.com/slovar/100-slov-dlya-studenta/auditoriya-3/).

-- для предикатных форм (хотя бы для глаголов) опишите модели управления слова (МУС) с примерами реализации этих моделей в используемых текстах. Например, для глагола «покупать»: что? где? у кого? по какой цене? Реализация МУС: «покупать картошку на рынке по 6000 рублей». Лучше представлять МУС в виде таблицы (дозаполните самостоятельно):

Покупать что? где? у кого? по какой цене?
Морфо-синтаксическая зона: Сущ., Вин.п. Всущ.предл.п. На … Усущ.род.п. По числит.+сущ.род.п. …
Семантическая: Неодуш.предмет Необязательно Торговое помещение или площадка Необязательно Человек, осуществляющий торговлю Необязательно
Реализации: картошку на рынке    
  картошку   у продавца по 6000 рублей
       

 

Вся организованная описанным выше способом информация – это часть лингвистической базы знаний. Отметьте в каждом выполненном пункте, какие из формализованных знаний являются декларативными, а какие можно отнести к процедурными.

Формирование фрагмента базы знаний предметной области

1. Проанализируйте подготовленные тексты и еще раз укажите наименование предметной области, к которой они относятся. Например предметная область (ПрО) «Приготовление пищи»

2. На основе созданных ранее словников составьте список ключевых слов рассматриваемой предметной области. Например, для ПрО «Приготовление пищи»: готовить, резать, мыть, тереть, тарелка, нож, продукт, специи и т.д.

3. Сформулируйте одну или несколько задач, которые должны быть решены в данной предметной области, опираясь на тему написанных текстов. Например, задача «Приготовить драники».

4. Используя (и при необходимости дополняя) составленный список ключевых слов, в естественно-языковой форме сформулируйте правила-процедуры, которые описаны в созданных ранее тестах. Например, по теме «Приготовление драников»:

Для приготовления драников необходимы следующие продукты: картофель, лук, мука, яйцо, соль, специи, растительное масло. Первый этап приготовления драников: почистить картофель. Второй этап приготовления драников: натереть очищенный картофель на мелкой терке. И т.д.

5. Переформулируйте написанные правила в терминах ЕСЛИ … ТО. Например:

ЕСЛИ требуется приготовить драники ТО необходимо взять: …
ЕСЛИ первый этап приготовления драников ТО почистить картофель
и т.д.

6. Идентифицируйте и пронумеруйте сформулированные правила и получите таким образом основу для создания сценария решения поставленной при выполнении п.3 задачи. Например: ПД1, ПД2 и т.д. (ПД – аббревиатура от «Приготовление Драников»). Эти идентификаторы просто допишите к написанным ранее правилам, чтобы не дублировать.

7. Попытайтесь описать все возможные сценарии решения сформулированной задачи, с возможными вариантами изменения последовательности выполняемых операций. Например, может получиться схема типа:

8. Сформулируйте подзадачи, которые необходимо решить в процессе решения поставленной основной задачи. Например, для задачи «Приготовить драники» подзадачи: «Помыть картофель», «Почистить картофель», «Натереть картофель», «Почистить лук» и т.д.

9. Выберите любые 2-3 подзадачи и сформулируйте для них правила, аналогично п.4 и 5. При этом придется обращаться к своему собственному опыту либо опыту экспертов, т.к. это уже глубинные знания, которые для человека могут казаться очевидными, но для экспертной системы, для которой создается БЗ, такие правила необходимо формулировать явно. Например: «Чтобы помыть картофель, необходимо взять картофелину, подойти к мойке, включить кран с холодной водой и обтереть пальцами или губкой всю поверхность картофелины под струёй воды». Обратите внимание на то, что во многих подобным образом сформулированных правилах также просматриваются подзадачи. Попробуйте детализировать подзадачи 3-го уровня и для них сформулировать хотя бы 2 правила в терминах ЕСЛИ … ТО …

10. Уточните список ключевых слов для рассматриваемой предметной области, опираясь на формулировки подзадач и правил для их решения.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.