Сделай Сам Свою Работу на 5

АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ





Методы, о которых пойдет речь в этой главе, касаются проверки, по-види- мому, самого широкого класса гипотез — в отношении тех явлений, измере­ния которых доступны в номинативной шкале.

ПРИМЕРЫ______________________________________________________________________

Кто чаще обращается в службу знакомств: мужчины или женщины?

Зависит ли количество аварий на производстве от дня недели?

Можно ли утверждать, что водители-женщины чаще становятся участниками ДТП

(дорожно-транспортных происшествий)?

Можно ли утверждать, что выигрыши в игре распределены не случайно среди про­игрышей?

Данные для ответов на подобные обыденные и чисто академические воп­росы могут быть получены при помощи простого способа — классификации событий и людей по интересующим градациям. И несмотря на, казалось бы, бесчисленное многообразие подобных ситуаций, все они могут быть сведены к трем типичным случаям:

1 — сравнение наблюдаемого (эмпирического) распределения частот с ожи­даемым (теоретическим) распределением;

2 — сравнение двух или более наблюдаемых распределений частот;

3 — сравнение наблюдаемого распределения событий Xсреди событий У (серий X, У) со случайным распределением.



ПРИМЕРЫ______________________________________________________________________

Случай I.

1. Кто чаще обращается в службу знакомств: мужчины или женщины? Для ответа на этот вопрос необходимо: а) подсчитать количество женщин и мужчин, обра­тившихся в службу знакомств; б) воспользовавшись методом статистической проверки, сопоставить полученное эмпирическое соотношение мужчин и жен­щин с ожидаемым (теоретическим) равномерным распределением.

2. Зависит ли количество аварий на производстве от дня недели? Проверка этого предположения требует выполнения сходных действий: а) подсчитать количе­ство аварий для каждогодня недели за достаточно длительный промежуток вре­
мени; б) воспользовавшись методом статистической проверки, сопоставить по­лученное эмпирическое распределение количества аварий по дням недели с ожи­даемым (теоретическим) равномерным распределением.

Случай II.

1. Зависит ли предпочтение напитка (минеральная вода, сок, лимонад) от сезона (зима, весна, лето, осень)? Для проверки этого предположения необходимо для каждого респондента определить тип предпочитае­мого напитка (первая номинативная переменная, 3 градации) и сезон опроса (вторая номинативная пе­ременная — 4 градации).



2. Зависит ли предпочтение одного из пяти кандида­тов на выборах от пола потенциального избирате­ля? Для проверки этого предположения необходи­мо для каждого респондента определить пол (первая номинативная переменная, 2 градации) и предпо- чи гаемого кандидата, одного из пяти (вторая номи­нативная переменная, 5 градаций).

3. Повлияла ли рекламная кампания на выбор респондентами одного из двух товаров? Это предположение требует опроса респондентов на предмет предпоч­тения одного из двух товаров дважды: до рекламной кампании (первая номина­тивная переменная, две градации) и после нее (вторая номинативная перемен­ная, те же две градации).

Для решения подобных задач, связанных с анализом классификаций или таблиц сопряженности, оказывается достаточным применение одного и того же критерия — х2-Пирсона:

Хэ=Е(/>/т)2, а/ = (к-])(1-1), (9.1)

1 = 1 /т

где Р — количество ячеек таблицы распределения или сопряженности, содер­жащих эмпирические значения частот;/э,/т — эмпирическое и теоретическое значения частот для одной ячейки; к — число градаций сопоставляемых рас­пределений; / — количество сопоставляемых распределений. Приведенная формула является общей для различных ситуаций, и в каждом случае ее при­менение обладает своей спецификой.

ПРИМЕРЫ_______________________________________________________________________

Случай III.

1. Является ли закономерным последовательный повтор выигрышей среди проиг­рышей в игре или это случайные совпадения?



2. В последовательности событий X и У является ли закономерным их чередова­ние (X после У и наоборот)?

3. Наблюдается ли закономерность в чередовании быстрых и медленных реакций на некоторый стимул: имеют ли они тенденцию к группированию или после мед­ленной реакции следует быстрая (и наоборот)?

Для решения задач такого типа необходимо упорядочить события во вре­мени и подсчитать число серий. Серия — это последовательность однотип­
ных событий, непосредственно перед и после которой произошли события другого типа. Далее применяется критерий серий, позволяющий определить вероятность случайного появления наблюдаемого числа серий при условии хаотичного распределения событий береди событий У.

Очень часто при исследовании классификаций, сопряженности или по­следовательности нет необходимости в накоплении данных в привычных таб­лицах типа «объект-признак»: результаты наблюдений сразу заносят в табли­цу распределения (сопряженности) или составляют последовательность. В этом случае нет необходимости в использовании специальных статистичес­ких программ, и все расчеты можно провести «вручную». Тем более что они не составляют особого труда.

АНАЛИЗ КЛАССИФИКАЦИИ: СРАВНЕНИЕ ЭМПИРИЧЕСКОГО И ТЕОРЕТИЧЕСКОГО

РАСПРЕДЕЛЕНИЙ

Две градации

Эта задача сводится к сравнению численности двух долей объектов (лю­дей, событий и т. д.) в совокупности: обладающих и не обладающих некото­рым свойством.

ПРИМЕР________________________________________________________________________

Мы можем сопоставлять долю мужчин, которым больше нравятся блондинки, с до­лей мужчин, которым больше нравятся девушки с темными волосами. Или сопо­ставлять доли голосующих «за» и «против» введения моратория на смертную казнь.

Обычно, сопоставляя доли, мы надеемся обнаружить различия их пропор­ции от некоторого ожидаемого соотношения. Соотношение численности групп, которое мы получаем в результате исследования, называется эмпири­ческим распределением. Ожидаемому соотношению соответствует теоретичес­кое распределение. В качестве теоретического распределения чаще всего вы­ступает равномерное распределение.

Изучая отношение людей к введению моратория на смертную казнь, мы надеемся, что численность группы голосующих «за» будет отличаться от численности группы голосующих «против», то есть распределение голосующих на две категории будет отличаться от равномерного распределения.

Формулировка проверяемой Н0: соотношение долей в генеральной сово­купности не отличается от ожидаемого (теоретического) соотношения.


Исходные данные: определена принадлежность каждого испытуемого к од­ной из двух категорий номинативной переменной. Задано ожидаемое (теоре­тическое) соотношение численности категорий.

Эта гипотеза проверяется при помощи формулы 9.1 для критерия х2, где Р — 2 (сумма состоит из двух слагаемых), к — 2,1=2, каждая из двух эмпири­ческих частот соответствует численности сравниваемых групп. Численности каждой из сравниваемых групп (эмпирической частоте) ставится в соответ­ствие теоретическая частота. Сумма теоретических частот равна сумме эмпи­рических частот, а соотношение теоретических частот равно ожидаемому (те­оретическому) соотношению.

Следует отметить, что точное решение для такого рода задач дает примене­ние биномиального критерия. Но поскольку его расчет трудоемок, а таблицы критических значений громоздки, мы предлагаем для расчетов «вручную» ис­пользовать приближение при помощи критерия %2. При расчетах на компью­тере в подобных случаях все же следует предпочесть биномиальный критерий (см. раздел «Обработка на компьютере»),

ПРИМЕР 9.1_____________________________________________________________________

А) Из 50 опрошенных по поводу отношения к введению моратория на смертную казнь 30 были «за», 20 — «против» (предполагается, что выборка репрезентатив­на генеральной совокупности). Можно ли утверждать на основании этого опро­са, что в совокупности количество сторонников превышает количество против­ников введения моратория на смертную казнь?

  Распределение:
эмпирическое теоретическое
«За»
«Против»
Сумма:

 

Шаг 1. Формулируем Н0: сравниваемые доли равны между собой (эмпирическое распределение соответствует равномерному распределению).

Ш а г 2. Выбираем для принятия статистического решения а = 0,05.

Ш а г 3. Вычисляем эмпирическое значение критерия. Задача сводится к сопостав­лению эмпирического распределения 30:20 с идентичиым по общей численности, но равномерным теоретическим распределением 25:25. Следовательно:

(Гэ), = 30; = 20; = 25; <Д)2 = 25.

Подставляем эти значения в формулу 9.1:

Ш а г 4. Определяем ^-уровень. По таблице критических значений теоретическо­го распределения х2-Пирсона (приложение 4) для с!/= 1 видим, что наше эмпириче­ское значение х2э находится левее критического значения для р = 0,1:

р > 0,1 р < 0,1 р< 0,05 р< 0,01 р<0,001 р = 0,1 р-0,05 р= 0,01 р =0,001

 

Ш а г 5. Принимаем статистическое решение. В соответствии со схемой определе­ния р-уровня р > 0,1, и мы не можем отклонить Н0, так как р > а.

Ш а г 6. Формулируем содержательный вывод. В результате исследования не обна­ружены статистически значимые различия в соотношении численности сторонни­ков и противников введения моратория на смертную казнь (р > 0,1). Или: числен­ность сторонников и противников введения моратория па смертную казнь статис­тически значимо не различается (/; >0,1).

Б) Предположим теперь, что было опрошено не 50, а 100 человек, и соотношение высказавшихся «за» и «против» сохранилось. Тогда эмпирические частоты со­ставили бы 60 «за» и 40 «против», а соответствующие теоретические частоты рав­нялись бы 50. Число степеней свободы не меняется, а эмпирическое значение критерия увеличивается: = В соответствии с таблицей критических значе­ний х2 и со схемой определения р-уропня/К 0,05, и мы можем отклонить Н0, так как р < а. Тогда содержательный вывод будет другим: численность сторонников введения моратория на смертную казнь статистически достоверно выше числен­ности противников введения моратория (р < 0,05).

Обратите внимание: принятие Н0 не позволяет сделать никакого вывода о соотношении численности сравниваемых групп. Напротив, отклонение Н0 позволяет в данном случае говорить не только о различии сравниваемых до­лей, но и о направлении различий — о том, что одна доля больше другой.

Отметим, что в качестве ожидаемого (теоретического) распределения мо­жет выступать не обязательно равномерное распределение. Например, мы можем проверять содержательную гипотезу о том, что некоторая группа со­ставляет по численности менее 20% совокупности. Тогда соотношение теоре­тических частот будет не 1:1, как в рассмотренном примере, а 1: 4. В осталь­ном весь ход решения остается прежним.

ПРИМЕР 9.2_____________________________________________________________________

Рассмотрим исследование, в котором проводилось сравнение частоты рождения мальчиков в индейских семьях английского города, где подавляющую часть насе­ления составляли выходцы из Америки[11]. Средняя частота рождения мальчиков в Англии составляет 52%, а в данном случае за период наблюдения из 20 родивших­ся детей мальчиков оказалось 5. Можно л и на этом основании сделать вывод о том, что в индейских семьях этого города мальчики рождаются достоверно реже, чем в целом по Англии?

Ш а г 1. Формулируем Н0: Р= 0,52 (выборочные данные согласуются с вероятнос­тью рождения мальчиков Р- 0,52).

Ш а г 2. Выбираем для принятия статистического решения а = 0,05.

Ш а г 3. Составляем таблицу эмпирических и теоретических частот и вычисляем эмпирическое значение критерия.

  Распределения:
  эмпирическое теоретическое
Мальчики 10,4
Девочки 9,6
Сумма:

 

Задача сводится к сопоставлению эмпирического распределения 5:15 с идентич­ным по общей численности теоретическим распределением (0,52:0,48). Следова­тельно:

(Л). = 5; (/э)2 = 15; (Л), = 10,4; (/т)2 = 9,6. Подставляем эти значения в формулу 9.1:

2 (5-10,4)2 , (15-9,б)2

X? =------------- +------ тт----- = 5,84 , й]~ .

10,4 9,6 У

Ш а г 4. Определяем/;-уровень. По таблице критических значений теоретического распределения %2-Пирсона (приложение 4) для 1 видим, что наше эмпиричес­кое значение х2 находится между критическими значениями для р = 0,05 и р = 0,01. Следовательно, р < 0,05.

Ш а г 5. Принимаем статистическое решение. Так какр < а, то Н0 можно отклонить.

Ш а г 6. Формулируем содержательный вывод. В индейских семьях этого города маль­чики действительно рождаются достоверно реже, чем в целом по Англии (р < 0,05).

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.