АНАЛИЗ ТАБЛИЦ СОПРЯЖЕННОСТИ
Анализ таблиц сопряженности применяется для решения задач, которые могут быть сформулированы следующим образом:
1. Необходимо сравнить два (или более) распределения между собой.
Например, различаются ли мужчины и женщины по распределению предпочтений пяти политических лидеров?
2. Необходимо определить связь между двумя номинативными признаками (между классификациями объектов по двум разным основаниям).
Например, связано ли соотношение предпочтений трех групп напитков (соки, лимонады, минеральные воды) с сезонностью (зима, весна, лето, осень)?
Нетрудно заметить, что эти задачи отличаются лишь словесными формулировками. Так, изучение связи между двумя номинативными переменными тождественно сравнению градаций одной номинативной переменной по распределению другой номинативной переменной.
Например, изучать сезонную зависимость предпочтений различных напитков — то же самое, что сравнивать сезоны по распределению предпочтений этих напитков. А изучать связь двух оснований классификации респондентов — по полу и по политической ориентации — то же самое, что сравнивать распределение мужчин и женщин по политической ориентации.
В подобных случаях подразумевается анализ таблиц сопряженности, в которых столбцы соответствуют сравниваемым распределениям (градациям одной номинативной переменной), а строки соответствуют градациям сравниваемых распределений (градациям другой номинативной переменной).
Формулировка проверяемой Н0: классификация объектов (людей, событий) по одному основанию не зависит от их классификации по другому основанию.
Исходные данные: определена принадлежность каждого объекта выборки к одной из градаций первой номинативной переменной и к одной из градаций второй номинативной переменной. Иными словами, две номинативные переменные измерены на выборке объектов. Строки таблицы сопряженности соответствуют градациям одной номинативной переменной, столбцы — градациям другой номинативной переменной.
Если проверка содержательной гипотезы предполагает анализ таблицы сопряженности, то принципиальным является вопрос о размерности таблицы. Будем различать два случая:
□ общий случай (число градаций хотя бы одного из признаков больше 2-х),
□ частный случай: таблицы сопряженности 2x2 (по две градации для каждой переменной).
Эти случаи различаются как порядком расчетов, так и особенностями интерпретации.
Число градаций больше двух
По сравнению с анализом классификации, специфика применения критерия х2-Пирсона (формула 9.1) к таблицам сопряженности заключается в том, что теоретические частоты рассчитываются отдельно для каждой ячейки таблицы. Таким образом, число слагаемых в формуле 9.1 равно количеству ячеек таблицы сопряженности и равно Р = к-1, где к — число строк, / — число столбцов:
к-1 ( Г — Г \2
х1=ь ; > а/=(к-\)(1-\).
(9.2)
/=1
Формула для расчета теоретической частоты для ячейки /-строки и ./-столбца:
//■/у
(9.3)
N
где — сумма частот во всех ячейках /-строки;^- — сумма частот во всех ячейках /-столбца; N— сумма частот всей таблицы сопряженности.
ПРИМЕР 9.4
Для каждого респондента репрезентативной выборки определены: а) пол; б) один из пяти предпочитаемых политических лидеров:
Эмпирические
| ^(политический лидер)
|
| частоты
|
|
|
|
|
| Всего:
| ЛГ(пол)
| муж.(1)
|
|
|
|
|
|
|
| жен. (2)
|
|
|
|
|
|
| Всего:
|
|
|
|
|
|
|
Проверяется содержательная гипотеза о зависимости политических предпочтений от пола.
Н0: классификации объектов по двум основаниям являются независимыми (распределение объектов по полу не зависит от их распределения по предпочтениям политических лидеров). Проверяем Н0 на уровне а = 0,05.
Шаг 1. Составляем таблицу сопряженности для теоретических (ожидаемых) частот — с теми же полями, что и для таблицы эмпирических (наблюдаемых) частот. Рассчитываем значения теоретических частот для каждой ячейки этой таблицы по формуле 9.3.
„ 51-16
для ячеики (х,, у,) /т———'>''>
для ячейки (х,, у2) /т
51-29 ,.„„ для ячейки (х,,_у3) Л ~ 105 =14,09;
/■ 5МЗ «1
для ячейки (х,, >>4) Л = ^ = .
г 5110 ,„,.
для ячейки (хи у5) Л = ^ = %во,
, 54 16
для ячейки (х2, У\) Л - ^ -
54-37
для ячейки (х2, у2) Л = ^ = 19,03;
г 54-29 ,.П1 для ячейки (х2, у$) Л = ^ =14,91,
54'13 /с/со для ячейки (х2, уц) Л - ^ -
, _ 5410 ... для ячейки (х2, у5) Л —- э>14-
Теоретические частоты
| /(политический лидер)
|
|
|
|
|
|
| Всего:
| Х(пол)
| муж.(1)
| 7,77
| 17,97
| 14,09
| 6,31
| 4,86
|
| жен. (2)
| 8,23
| 19,03
| 14,91
| 6,69
| 5,14
|
| Всего:
|
|
|
|
|
|
|
Отметим, что суммы теоретических частот по строкам (столбцам) должны быть равны соответствующим суммам эмпирических частот.
Ш а г 2. Рассчитываем эмпирическое значение критерия х2-Пирсона и число степеней свободы по формуле 9.2.
2 _ (5-1,II)2 (25-17,97)2 (10-14,09)2 (8-6,31)2 (3-4,86)2 (11-8,23)2
~ 7,77 17,97 14,09 6,31 4,86 8,23
(12-19,03)2 (19-14,91)2 (5-6,69)2 (7-5,14)2 _п
19,03 14,91 6,69 5,14
ё/= (к- 1)(/- 1) = (2- 1)(5 - 1) = 4.
Ш а г 3. Определяем р-уроеень по таблице критических значений %2-Пирсона и принимаем статистическое решение. Для аУ= 4 наше эмпирическое значение располагается между критическими для р = 0,05 ир = 0,01. Следовательно, /ь уровень в нашем случае р < 0,05. Мы можем отклонить Н0.
Ш а г 4. Формулируем содержательный вывод. Обнаружена статистически значимая зависимость политических предпочтений от пола (р < 0,05).
Порядок расчетов остается тем же для любого числа градаций того и другого признака, за исключением случая таблиц сопряженности 2x2. Для упро щения арифметических расчетов может быть использована формула, эквивалентная формуле 9.2:
ЕЕ-
/ = 1 у = 1 /) Х/у
где И— общая численность выборки; к, I — число строк и столбцов таблицы сопряженности.
Обратим внимание, что при отклонении Н0 принимается альтернативная гипотеза о связи двух оснований классификации, которая проявляется по крайней мере для одной ячейки таблицы сопряженности. Но остается неизвестным то, в отношении каких именно ячеек таблицы сопряженности связь проявляется, а в отношении каких — не проявляется. Иными словами, возникает проблема множественных сравнений. И для дальнейшей конкретизации результатов необходим анализ соотношения 2-х долей или таблиц сопряженности 2x2.
| Исследование связи пола и предпочтений политических лидеров (см. пример 9.4) может быть продолжено. Так, может быть дополнительно проверена гипотеза о том, что лидер № 2 предпочитается чаще мужчинами, чем женщинами. Тогда необходимо сравнивать эмпирическое распределение предпочтений мужчин и женщин (25:12) с равномерным распределением (13,5:13,5) — при помощи метода сопоставления эмпирического и теоретического распределений. Может быть также проверена гипотеза о том, что лидер № 2 чаще предпочитается мужчинами, а лидер № 3 — женщинами. Тогда необходимо сопоставить два эмпирических распределения: 25:12 и 10:19 — при помощи анализа таблиц сопряженности 2x2.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|