Сделай Сам Свою Работу на 5

Объекты нечисловой природы как результат статистической обработки данных.





СТАТИСТИЧЕСКИЙ АНАЛИЗ НЕЧИСЛОВОЙ ИНФОРМАЦИИ

Методические рекомендации по изучению курса

Ростов - на - Дону

Печатается по решению кафедры математической статистики, эконометрики и актуарных расчетов РГЭУ «РИНХ» (протокол № 9 от 31.05.2010 г.)

 

Автор-составитель:доц., к.э.н. Герасимова И.А.

Рецензенты: проф., д.э.н. Ниворожкина Л.И.

проф., д.э.н. Маслова Н.П.

Методические рекомендации по изучению дисциплины «Статистический анализ нечисловой информации» разработаны в соответствии с требованиями Государственного образовательного стандарта высшего образования по специальности 08060165 «Статистика».

Пособие содержит как основные теоретические положения дисциплины, так и практические примеры, что способствует закреплению теоретического материала и приобретению практических навыков в решении задач. Контрольные вопросы к каждой теме и обширный список рекомендуемой литературы предполагают активную самостоятельную работу студентов.

Методические рекомендации ориентированы на студентов дневной и

заочной форм обучения, а также могут быть полезны аспирантам и преподавателям.



Ростовский государственный экономический университет « Ринх», 2010

ОГЛАВЛЕНИЕ

ТЕМА 1. «Предмет, объект и задачи статистического анализа нечисловой информации»………………………………………………………………………..4

1.1.Статистика объектов нечисловой природы как часть прикладной статистики……………………………………………………………………………4

1.2. Объекты нечисловой природы как результат статистической обработки данных………………………………………………………………………………5

ТЕМА 2. « Основы теории измерений»…………………………………………7

2.1. Понятие измерения и измерительной шкалы………………………………7

2.2. Номинальная шкала…………………………………………………………..7

2.3. Порядковая шкала…………………………………………………………… 8

2.4. Интервальная шкала…………………………………………………………..9

2.5. Шкала отношений…………………………………………………………….9

ТЕМА 3. «Измерение связи между переменными, измеренными на различных шкалах»……………………………………………………………………………10

3.1.Номинальная шкала. Измерение связи между дихотомическими переменными (таблица сопряженности 2x2)…………………………………..10



3.2.Измерение связи между политомичными переменными (таблица сопряженности m x p )……………………………………………………………12

3.3.Измерение тесноты связи между дихотомическими переменными и переменными, измеренными на интервальной шкале…………………………15

3.4.Порядковая шкала. Измерение связи между порядковыми переменными………………………………………………………………………17

ТЕМА 4. « Теоретико-информационный подход к построению мер связи

для номинального уровня измерения»………………………………………….23

4.1. Меры связи, основанные на величине количества информации…………23

4.2.Другие меры связей между переменными, измеренными

на номинальной шкале……………………………………………………………27

Библиографический список………………………………………………………32

Приложение……………………………………………………………………….34

 

 

ТЕМА 1. «Предмет, объект и задачи статистического анализа нечисловой информации»

Статистика объектов нечисловой природы как часть прикладной статистики.

С начала 70-х годов XX века под влиянием прикладных исследований в технических, медицинских и социальных науках в России активно развивается статистика объектов нечисловой природы, которая называется статистикой нечисловых данных или нечисловой статистикой. В создании нечисловой статистики приоритет принадлежит российским ученым.

Согласно классификации существующих методов прикладная статистика делится на 4 области:

статистика случайных величин (числовых величин);

многомерный статистический анализ;



статистика временных рядов и случайных процессов;

статистика объектов нечисловой природы.

Первые три являются классическими, а четвертая является достаточно новой областью прикладной статистики. Статистика нечисловых данных – это раздел прикладной статистики, в котором в качестве исходных статистических данных (результатов наблюдений ) рассматриваются объекты нечисловой природы. Объекты нечисловой природы - это объекты, которые нецелесообразно описывать числами.

Известно, что исходным объектом математической статистики является выборка. В классической математической статистике элементы выборки – это числа. В многомерном статистическом анализе – это вектора. В нечисловой статистике элементы выборки - это объекты нечисловой природы, которые нельзя складывать и умножать на числа.

Примерами объектов нечисловой природы являются:

1. Значения качественных признаков, представляющие собой результаты кодировки объектов с помощью заданного перечня категорий (градаций);

2.Упорядочения (ранжировки). Например, эксперты могут ранжировать предприятия с точки зрения их инвестиционной привлекательности, образцы продукции при оценке ее конкурентноспособности или могут ранжироваться заявки на проведение научных работ при проведении конкурсов на выделение грантов;

3.Классификации, т.е. разбиения объектов на группы, сходных между собой (кластеры).

4. Толерантности, т.е. бинарные отношения, описывающие сходство объектов между собой. Например, сходство тематики научных работ, оцениваемое экспертами с целью формирования экспертных советов внутри определенной области науки.

5. Результаты парных сравнений. Например, при контроле качества продукции по альтернативному признаку (годная или бракованная продукция).

6. Множества (четкие и нечеткие).

7. Cлова, предложения, тексты.

8. Векторы, координаты которых - это совокупность значений разнотипных признаков. Например, компьютеризированная история болезни, где часть признаков носит качественный характер, а часть – количественный.

9. Ответы на вопросы анкет (экспертных, маркетинговых, социальных), часть из которых носит количественный характер, часть сводится к выбору одного из нескольких ответов, а часть представляет собой тексты.

В процессе развития нечисловой статистики появилась необходимость использования новых видов объектов нечисловой природы. Например, в связи с развитием статистических методов обработки текстовой информации, стал рассматриваться еще один вид объектов нечисловой природы - это объекты произвольной природы. Таким образом, цель статистики объектов нечисловой природы состоит в том, чтобы применять методы статистической обработки данных как произвольной природы, так и данных, представляющих собой конкретные виды объектов нечисловой природы, т.е. методы описания данных, методы оценивания, методы проверки статистических гипотез.

Итак, в рамках нечисловой статистики решаются классические задачи описания данных, задачи оценивания, проверки гипотез. Однако эти задачи решаются для неклассических данных, и поэтому неклассическими методами. Принципиальная новизна нечисловой статистики состоит в том, что методы обработки нечисловых данных основаны на математическом аппарате, использующем различные расстояния в пространствах объектов нечисловой природы. Так, для анализа нечисловых данных очень важны различные методы классификации (например, методы дискриминационного и кластерного анализа). В целом, статистические методы анализа нечисловых данных особенно хорошо приспособлены для применения в экономике, социологии и экспертных оценках т.к. в этих областях от 50% до 90% данных являются нечисловыми.

Объекты нечисловой природы как результат статистической обработки данных.

В математической статистике наиболее распространенный объект изучения - это выборка х1, х2,…. ,хn , т.е. совокупность результатов n- наблюдений. В различных областях статистики результат наблюдения - любое число, либо n- мерный вектор, либо функция. В статистике объектов нечисловой природы в качестве результатов наблюдений рассматриваются объекты нечисловой природы. При этом результаты наблюдения за состоянием таких объектов могут быть представлены совокупностью числовых и нечисловых данных.

Применение объектов нечисловой природы часто связано с необходимостью обрабатывать более объективную информацию. Например, опыты показали, что человек более правильно отвечает на вопросы качественного характера, чем количественного. Таким образом, использование объектов нечисловой природы является средством повышения устойчивости математических моделей реальных явлений.

Объекты нечисловой природы могут появляться не только на «входе» статистической процедуры, но и в процессе обработки данных и на «выходе» в качестве итога статистического анализа. Рассмотрим объекты нечисловой природы на «выходе» статистической процедуры, к ним относятся:

а) разбиения - итог работы различных алгоритмов классификации (кластер-анализ);

б) ранжировки - например, результат упорядочения фирм по степени инвестиционной привлекательности или результат автоматизированной обработки мнений экспертов по той или иной проблеме.

Из всех объектов нечисловой природы на «выходе» статистической процедуры чаще всего появляются дихотомические данные, т.е. это результаты измерений значений альтернативного признака или данные, которые могут принимать одно из двух значений (0 или 1). Результатом применения статистической процедуры также может быть множество или несколько множеств различной природы. Таким образом, практически все виды объектов нечисловой природы могут появляться на «выходе» статистического исследования.

 

Вопросы для самоконтроля

1. Что изучает статистика нечисловых данных?

2. В чем состоит новизна статистики нечисловых данных?

3. Какова цель статистики нечисловых данных?

4. Какова сфера применения статистики нечисловых данных?

5.Что является объектом изучения статистики нечисловых данных?

6.Что представляют собой объекты нечисловой природы?

7. Что представляют собой объекты произвольной природы?

8. Какие объекты нечисловой природы могут появляться на «выходе» статистической процедуры?

9. Какие объекты являются элементами выборки в нечисловой статистике?

10. Какие объекты нечисловой природы чаще всего появляются на «выходе» статистической процедуры?

 

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.