Сделай Сам Свою Работу на 5

АНАЛИЗ ТАБЛИЦ СОПРЯЖЕННОСТИ





Анализ таблиц сопряженности применяется для решения задач, которые могут быть сформулированы следующим образом:

1. Необходимо сравнить два (или более) распределения между собой.

Например, различаются ли мужчины и женщины по распределению предпочте­ний пяти политических лидеров?

2. Необходимо определить связь между двумя номинативными признака­ми (между классификациями объектов по двум разным основаниям).

Например, связано ли соотношение предпочтений трех групп напитков (соки, ли­монады, минеральные воды) с сезонностью (зима, весна, лето, осень)?

Нетрудно заметить, что эти задачи отличаются лишь словесными форму­лировками. Так, изучение связи между двумя номинативными переменными тождественно сравнению градаций одной номинативной переменной по рас­пределению другой номинативной переменной.

Например, изучать сезонную зависимость предпочтений различных напитков — то же самое, что сравнивать сезоны по распределению предпочтений этих напитков. А изучать связь двух оснований классификации респондентов — по полу и по по­литической ориентации — то же самое, что сравнивать распределение мужчин и женщин по политической ориентации.



В подобных случаях подразумевается анализ таблиц сопряженности, в ко­торых столбцы соответствуют сравниваемым распределениям (градациям од­ной номинативной переменной), а строки соответствуют градациям сравни­ваемых распределений (градациям другой номинативной переменной).

Формулировка проверяемой Н0: классификация объектов (людей, событий) по одному основанию не зависит от их классификации по другому основанию.

Исходные данные: определена принадлежность каждого объекта выборки к одной из градаций первой номинативной переменной и к одной из градаций второй номинативной переменной. Иными словами, две номинативные пе­ременные измерены на выборке объектов. Строки таблицы сопряженности соответствуют градациям одной номинативной переменной, столбцы — гра­дациям другой номинативной переменной.

Если проверка содержательной гипотезы предполагает анализ таблицы со­пряженности, то принципиальным является вопрос о размерности таблицы. Будем различать два случая:



□ общий случай (число градаций хотя бы одного из признаков больше 2-х),

□ частный случай: таблицы сопряженности 2x2 (по две градации для каж­дой переменной).

Эти случаи различаются как порядком расчетов, так и особенностями ин­терпретации.

Число градаций больше двух

По сравнению с анализом классификации, специфика применения крите­рия х2-Пирсона (формула 9.1) к таблицам сопряженности заключается в том, что теоретические частоты рассчитываются отдельно для каждой ячейки таб­лицы. Таким образом, число слагаемых в формуле 9.1 равно количеству ячеек таблицы сопряженности и равно Р = к-1, где к — число строк, / — число столбцов:

к-1 ( Г — Г \2

х1=ь ; > а/=(к-\)(1-\).

(9.2)

/=1

Формула для расчета теоретической частоты для ячейки /-строки и ./-столбца:

и

//■/у

(9.3)

N

где — сумма частот во всех ячейках /-строки;^- — сумма частот во всех ячей­ках /-столбца; N— сумма частот всей таблицы сопряженности.

ПРИМЕР 9.4

Для каждого респондента репрезентативной выборки определены: а) пол; б) один из пяти предпочитаемых политических лидеров:

Эмпирические ^(политический лидер)  
частоты Всего:
ЛГ(пол) муж.(1)
  жен. (2)
Всего:

 

Проверяется содержательная гипотеза о зависимости политических предпочтений от пола.

Н0: классификации объектов по двум основаниям являются независимыми (рас­пределение объектов по полу не зависит от их распределения по предпочтениям политических лидеров). Проверяем Н0 на уровне а = 0,05.

Шаг 1. Составляем таблицу сопряженности для теоретических (ожидаемых) час­тот — с теми же полями, что и для таблицы эмпирических (наблюдаемых) частот. Рассчитываем значения теоретических частот для каждой ячейки этой таблицы по формуле 9.3.



„ 51-16

105 51-37 105
= 17,97;

для ячеики (х,, у,) /т———'>''>

для ячейки (х,, у2) /т

51-29 ,.„„ для ячейки (х,,_у3) Л ~ 105 =14,09;

/■ 5МЗ «1

для ячейки (х,, >>4) Л = ^ = .

г 5110 ,„,.

для ячейки (хи у5) Л = ^ = %во,

, 54 16

для ячейки2, У\) Л - ^ -

54-37

для ячейки (х2, у2) Л = ^ = 19,03;

г 54-29 ,.П1 для ячейки (х2, у$) Л = ^ =14,91,

54'13 /с/со для ячейки2, уц) Л - ^ -

, _ 5410 ... для ячейки (х2, у5) Л —- э>14-

Теоретические частоты /(политический лидер)  
Всего:
Х(пол) муж.(1) 7,77 17,97 14,09 6,31 4,86
жен. (2) 8,23 19,03 14,91 6,69 5,14
Всего:

 

Отметим, что суммы теоретических частот по строкам (столбцам) должны быть рав­ны соответствующим суммам эмпирических частот.

Ш а г 2. Рассчитываем эмпирическое значение критерия х2-Пирсона и число степе­ней свободы по формуле 9.2.

2 _ (5-1,II)2 (25-17,97)2 (10-14,09)2 (8-6,31)2 (3-4,86)2 (11-8,23)2

~ 7,77 17,97 14,09 6,31 4,86 8,23

(12-19,03)2 (19-14,91)2 (5-6,69)2 (7-5,14)2 _п

19,03 14,91 6,69 5,14

ё/= (к- 1)(/- 1) = (2- 1)(5 - 1) = 4.

Ш а г 3. Определяем р-уроеень по таблице критических значений %2-Пирсона и прини­маем статистическое решение. Для аУ= 4 наше эмпирическое значение располага­ется между критическими для р = 0,05 ир = 0,01. Следовательно, /ь уровень в нашем случае р < 0,05. Мы можем отклонить Н0.

Ш а г 4. Формулируем содержательный вывод. Обнаружена статистически значимая зависимость политических предпочтений от пола (р < 0,05).

Порядок расчетов остается тем же для любого числа градаций того и друго­го признака, за исключением случая таблиц сопряженности 2x2. Для упро­
щения арифметических расчетов может быть использована формула, эквива­лентная формуле 9.2:


 

 


/2 ■> У
-1

ЕЕ-

/ = 1 у = 1 /) Х/у


 

 


где И— общая численность выборки; к, I — число строк и столбцов таблицы сопряженности.

Обратим внимание, что при отклонении Н0 принимается альтернативная гипотеза о связи двух оснований классификации, которая проявляется по крайней мере для одной ячейки таблицы сопряженности. Но остается неиз­вестным то, в отношении каких именно ячеек таблицы сопряженности связь проявляется, а в отношении каких — не проявляется. Иными словами, воз­никает проблема множественных сравнений. И для дальнейшей конкретиза­ции результатов необходим анализ соотношения 2-х долей или таблиц со­пряженности 2x2.

Исследование связи пола и предпочтений политических лидеров (см. пример 9.4) может быть продолжено. Так, может быть дополнительно проверена гипотеза о том, что лидер № 2 предпочитается чаще мужчинами, чем женщинами. Тогда необходи­мо сравнивать эмпирическое рас­пределение предпочтений мужчин и женщин (25:12) с равномерным распределением (13,5:13,5) — при помощи метода сопоставления эмпирического и теоретического распределений. Может быть также проверена гипотеза о том, что ли­дер № 2 чаще предпочитается муж­чинами, а лидер № 3 — женщина­ми. Тогда необходимо сопоставить два эмпирических распределения: 25:12 и 10:19 — при помощи ана­лиза таблиц сопряженности 2x2.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.