Таблицы сопряженности 2x2
Существует большое разнообразие различных ситуаций, когда по результатам исследования может быть построена таблица сопряженности 2x2. Их объединяет то, что объекты (испытуемые, события) классифицированы по двум основаниям, каждое из которых представляет собой дихотомию. Важно различать два варианта такой классификации объектов:
1) по двум различным дихотомическим основаниям — случай независимых выборок;
2) по одному и тому же дихотомическому основанию дважды (например, до и после воздействия) — случай зависимых выборок.
ПРИМЕРЫ_______________________________________________________________________
1. Случай независимых выборок. Две группы больных известной численности получали курс лечения разными методами. Подсчитывалось число рецидивов заболевания в той и другой группе. Одна переменная — «метод лечения» (1-й, 2-й), другая — «рецидив» (есть, нет).
2. Случай зависимых выборок. Подсчитывалось число тех, кто «за», и тех, кто «против» смертной казни: до и после убедительной лекции о введении моратория на смертную казнь. Одна переменная — «до лекции» («за», «против»), другая переменная — «после лекции» («за», «против»).
Для независимых выборок применяется критерий х2-Пирсона, а для зависимых более адекватным является метод Мак-Нимара.
Независимые выборки
Это наиболее часто встречающаяся ситуация применения таблиц 2x2, когда одна группа объектов классифицируется по двум дихотомическим основаниям и проверяется гипотеза о связи этих двух оснований классификации.
По сравнению с другими таблицами сопряженности особенность таблиц 2x2 проявляется в трех отношениях.
1. Эти таблицы могут быть построены разными способами, но только один из них является правильным в отношении применимости критерия х2- Пирсона.
2. Допустима проверка направленных альтернатив. Соответственно, меняется способ определения /ьуровня значимости.
3. В некоторых случаях при расчете х2-Пирсона необходимо введение поправки на непрерывность Йетса.
Рассмотрим эти особенности на примере.
ПРИМЕР 9.5______________________________________________________________________
Предположим, для изучения влияния 2-х условий запоминания материала 100 испытуемых были случайным образом разделены на две группы: по 50 человек для каждого из условий. После обучения количество усвоивших этот материал в первой группе составило 24 человека, а во второй — 34 человека. Можно ли утверждать, что различия в условиях влияют на результативность обучения?
Данные примера 9.5 могут быть представлены тремя способами, но только один из них является верным.
Правильный способ представления данных примера 9.4 в таблице:
| Усвоение материала
| Всего:
| есть
| нет
| Условие 1
|
|
|
| Условие 2
|
|
|
| Всего:
|
|
|
|
В последних двух случаях таблицы не содержат информации о тех, кто не усвоил материал. Поэтому уменьшаются шансы обнаружить достоверные различия, даже если они есть.
Как отмечалось, специфика применения х2-Пирсона в подобных случаях проявляется и в том, что это тот случай, когда допустима проверка как ненаправленной, так и направленной статистической гипотезы. Важность определения того, какая из этих двух гипотез проверяется, обусловлена тем, что в отношении одних и тех же данных при проверке направленной альтернативы значение р-уровня в два раза меньше, чем при проверке ненаправленной альтернативы (см. главу 7: Направленные и ненаправленные альтернативы).
Варианты неправильного представления в таблице данных примера 9.5:
|
| Усвоение материала
| наблюдаемое
| ожидаемое
| Условие 1
|
|
| Условие 2
|
|
|
| Усвоение материала
| участвовали
| усвоили
| Условие 1
|
|
| Условие 2
|
|
| Любые сомнения при выборе между направленной и ненаправленной статистической гипотезой решаются в пользу ненаправленной альтернативы!
Рассмотрим различия ненаправленной и направленной альтернативы в отношении данных примера 9.5. Они могли быть получены в ходе сравнения двух способов запоминания — без предварительных предположений о том, какой способ лучше. Исследователя при этом интересуют два случая (направления) отклонения Н0: а) «запоминание лучше при условии 1»; б) «запоминание лучше при условии 2». Такая проверка предполагает ненаправленную альтернативу. Соответственно, при отклонении Н0 допустим как тот, так и другой вывод. Или эти данные могли быть получены в ходе проверки предположения о том, что новый (второй) способ является более эффективным, чем традиционный (первый). Исследователя тогда будет интересовать только один исход: «запоминание лучше при условии 2». Эта проверка предполагает направленную альтернативу, а при отклонении Н0 допустим только один вывод — о превосходстве условий 2.
ПРИМЕР, КОГДА ОПРАВДАНА ПРОВЕРКА НАПРАВЛЕННОЙ ГИПОТЕЗЫ___________
Проверялась гипотеза о влиянии природы родства на преступность близнеца. Данные относятся к 30 преступникам мужского пола, каждый из которых имел брата близнеца. Тридцать человек были классифицированы: а) по природе родства (однояйцовые или разнояйцовые близнецы); б) по виновности или невиновности брата:
| Виновность брата:
| Всего:
|
| виновен
| не виновен
| Однояйцовый близнец
|
|
|
| Разнояйцовый близнец
|
|
|
| Всего:
|
|
|
| | (Справочник по прикладной статистике/Под ред. Э.Ллойда, У. Ледермана.М., 1989. Т. 1.С. 376).
|
Как указывают различные авторы, односторонний критерий х2-Пирсона, который применяется для ненаправленных гипотез, в данном случае «превращается» в двусторонний1. Таким образом, для проверки направленных гипотез р-уровень для таблиц 2x2, определенный по таблице для ненаправленной гипотезы (как двусторонний), делится на 2.
Другая особенность применения х2-Пирсона заключается во введении поправки на непрерывность Йетса. В соответствии с ней формула 9.1 для таблиц 2x2 приобретает вид:
\2
%1 = ^ (1/э /т1 0,5)2 , <//= 1. (9.4)
( = 1 /т
ПРИМЕР 9.5 (продолжение)
Предположим, данные примера 9.5 относятся к ситуации проверки содержательного предположения о большей эффективности нового метода обучения (условие 2) по сравнению с традиционным методом (условие 1).
Ш а г 1. Формулируется направленная статистическая гипотеза. Направленная Н0: При условии 2 вероятность усвоения материала не выше, чем при условии 1. В связи с тем, что объемы сравниваемых выборок не очень велики, можно принять а = 0,05.
Ш а г 2. Вычисляется эмпирическое значение х2-Пирсона с поправкой Йетса. Теоретические частоты подсчитываем по формуле 9.3:
/г
/з
| /г
| (|/, -Л -0,5)2
А
|
|
| 0,698
|
|
| 0,964
|
|
| 0,698
|
|
| 0,964
| Сумма:
|
| 3,325
| N '
, _ 50-58 .50-42 _ ,,, _ 50-58 , _ 50-42
•'11 "" , АА ~ -Л 2 '>/21 -------- ' 22 ~
|
Эмпирическое значение х2-Пирсона с поправкой на непрерывность х2 = 3,325.
Ш а г 3. Определение р-уровня для направленной статистической гипотезы. Определяем по таблице критических значений критерия х2-Пирсона р-уровень значимости. Наше эмпирическое значение располагается между критическими для р = 0,1 и р = 0,05. Следовательно, для ненаправленных гипотез в нашем случае р < 0,1. Но с учетом того, что мы проверяем направленную гипотезу, окончательное значениер-уровня: р < 0,05.
1 Доказательство этого см., например: Кендалл М., Стьюарт А. Статистические выводы и связи. М., 1973. С. 744-745; Справочник по прикладной статистике. В 2 т. Т. 1 / Под ред. Э. Ллойда, У. Ледермана, Ю. Тюрина. М„ 1989. С. 370-377.
Ш а г 4. Принятие статистического решения и формулировка содержательного вывода. Статистическое решение: Н0 отклоняется. Содержательный вывод: эффективность усвоения материала в условиях обучения № 2 статистически значимо выше, чем в условиях № 1 (х2 = 3,325, 4Г= 1 ,р< 0,05).
Отметим, что при проверке ненаправленной гипотезы для тех же данных статистическое решение и, следовательно, содержательный вывод были бы другими.
X2-Пирсона с поправкой на непрерывность применим для анализа таблиц сопряженности 2x2, когда N>40,0 если ни одна из теоретических частот не меньше 5, то при N>20}
Если таблица сопряженности 2x2 не удовлетворяет этим требованиям (%2-Пирсона с поправкой на непрерывность не применим), то можно воспользоваться расчетом точного значения р-уровня по Фишеру (ПзИег'з ехас( (ез1 — точный критерий Фишера) — односторонним (1-зк1ес1), для направленных гипотез, или двусторонним (2-$нЗес1), для ненаправленных альтернатив. Его расчет «вручную» является трудоемким, поэтому необходимо воспользоваться компьютерной программой (8Р88, §Ш1з(лса — см. конец этой главы).
Повторные измерения
Структура исходных данных соответствует ситуации, когда одна выборка объектов классифицирована на две группы дважды по одному и тому же основанию. Рассмотрим проверку гипотезы в отношении таких данных на примере.
ПРИМЕР 9.6_____________________________________________________________________
Исследовалось влияние убедительной лекции о введении моратория на смертную казнь. Число респондентов N= 60. Подсчитывалось число тех, кто «за», и тех, кто «против» смертной казни до и после лекции. Одна переменная — «до лекции» («за», «против»), другая — «после лекции» («за», «против»).
В таблице исходных данных в таких случаях каждой строке (объекту выборки) соответствуют два значения (в двух столбцах — «до», «после») одной и той же бинарной номинативной переменной («за», «против»). Таблица сопряженности для таких данных (например, построенная при помощи компьютерной программы):
| До:
| Всего:
| «За»
| «Против»
| После:
| «За»
| а= 16
| Ъ= 10
|
| «Против»
| с =26
|
|
| Всего:
|
|
|
| Для таких данных х2-Пирсона с поправкой на непрерывность не применим!
|
' См. там же.
Действительно, применяя этот метод, мы будем проверять гипотезу о связи классификации ответов до лекции с классификацией ответов после лекции, а нас интересует влияние лекции («до» — «после») на распределение ответов («за» — «против»). Тем не менее, попробуем применить х2-Пирсона с поправкой на непрерывность к этой таблице. Получим: х2 = 0,93, й/= 1, р > 0,1.
В подобных случаях применяется метод Мак-Нимара. Этот метод позволяет сопоставить долю тех, кто не обладал некоторой характеристикой (0) до воздействия, но стал обладать ею после воздействия (1), с долей тех, кто обладал этой характеристикой до воздействия (1) и перестал обладать ею после воздействия (0). Иначе говоря, метод позволяет сопоставить диагональные элементы таблицы сопряженности 2x2 (0,1 и 1,0 или 0,0 и 1,1), построенной непосредственно по дважды проведенной дихотомической классификации одной и той же выборки. Речь идет о таблице 2x2, построенной непосредственно по результатам дихотомической классификации двух зависимых выборок (одной и той же выборки — дважды):
Метод Мак-Нимара позволяет по этой таблице проверить две гипотезы: о соотношении а и с? (0,1 и 1,0); о соотношении с и Ъ (0,0 и 1,1).
Проверка гипотезы проводится по г-критерию по формулам для эмпирического значения1:
с-Ь а-й
= I—- или г3 =-т==, (9.5)
л1с + Ь у/а + с!
где си Ъ — одна пара диагональных элементов таблицы, для проверки одной гипотезы; ажй — другая пара диагональных элементов, для проверки другой гипотезы. Для определения /ьуровня значимости эмпирическое значение гэ сравнивается с теоретическим — единичным нормальным распределением.
Ограничение на применение метода Мак-Нимара: сумма сравниваемых частот не должна быть меньше 10.
ПРИМЕР 9.6 (продолжение)_________________________________________________________
Рассмотрим применение метода Мак-Нимара на примере проверки содержательной гипотезы о влиянии лекции на мнение респондентов (данные примера 9.6).
Ш а г 1. Построение таблицы 2x2.
| До:
| «За»
| «Против»
| После:
| «За»
| о= 16
| Ь= 10
| «Против»
| с =26
| ё= 8
| | 1 Данная реализация метода заимствована из: Гласс Дж., Стенли Дж. Статистические методы в педагогике и психологии. М., 1976. В программе ЗР58 используется критерий х2.
|
Ш а г 2. Формулировка статистической гипотезы.
Проверим Н0: с = Ь (ненаправленная гипотеза), при а = 0,05.
Отметим, что проверка гипотезы относительно других диагональных элементов
(Н0: а = с0 в данном случае не имеет смысла.
Ш а г 3. Вычисление эмпирического значения критерия.
с-Ь 26-10 Ъ = , = , = 2,67. л]с + Ь V 26 + 10
Ш а г 4. Определение р-уровня (приложение 1).
Воспользуемся таблицей единичного нормального распределения:
а) находим в таблице теоретическое значение г, ближайшее меньшее к абсолютному (без учета знака) эмпирическому значению гэ: гт = 2,65;
б) определяем площадь под кривой справа от V- Р= 0,004;
в) вычисляем р-уровень по формулер<2Р:р< 0,008.
Ш а г 5. Принятие статистического решения и статистический вывод. На уровне а = 0,05 гипотеза Н0 отклоняется. Содержательный вывод: доля лиц, выступающих против смертной казни после лекции статистически значимо увеличилась (г= 2,67; р < 0,008).
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|