Сделай Сам Свою Работу на 5

Таблицы сопряженности 2x2





Существует большое разнообразие различных ситуаций, когда по резуль­татам исследования может быть построена таблица сопряженности 2x2. Их объединяет то, что объекты (испытуемые, события) классифицированы по двум основаниям, каждое из которых представляет собой дихотомию. Важно различать два варианта такой классификации объектов:

1) по двум различным дихотомическим основаниям — случай независимых выборок;

2) по одному и тому же дихотомическому основанию дважды (например, до и после воздействия) — случай зависимых выборок.

ПРИМЕРЫ_______________________________________________________________________

1. Случай независимых выборок. Две группы больных известной численности по­лучали курс лечения разными методами. Подсчитывалось число рецидивов за­болевания в той и другой группе. Одна переменная — «метод лечения» (1-й, 2-й), другая — «рецидив» (есть, нет).

2. Случай зависимых выборок. Подсчитывалось число тех, кто «за», и тех, кто «про­тив» смертной казни: до и после убедительной лекции о введении моратория на смертную казнь. Одна переменная — «до лекции» («за», «против»), другая пере­менная — «после лекции» («за», «против»).



Для независимых выборок применяется критерий х2-Пирсона, а для зави­симых более адекватным является метод Мак-Нимара.

Независимые выборки

Это наиболее часто встречающаяся ситуация применения таблиц 2x2, ког­да одна группа объектов классифицируется по двум дихотомическим основа­ниям и проверяется гипотеза о связи этих двух оснований классификации.

По сравнению с другими таблицами сопряженности особенность таблиц 2x2 проявляется в трех отношениях.

1. Эти таблицы могут быть построены разными способами, но только один из них является правильным в отношении применимости критерия х2- Пирсона.

2. Допустима проверка направленных альтернатив. Соответственно, меня­ется способ определения /ьуровня значимости.

3. В некоторых случаях при расчете х2-Пирсона необходимо введение по­правки на непрерывность Йетса.

Рассмотрим эти особенности на примере.

ПРИМЕР 9.5______________________________________________________________________

Предположим, для изучения влияния 2-х условий запоминания материала 100 ис­пытуемых были случайным образом разделены на две группы: по 50 человек для каждого из условий. После обучения количество усвоивших этот материал в пер­вой группе составило 24 человека, а во второй — 34 человека. Можно ли утверж­дать, что различия в условиях влияют на результативность обучения?



Данные примера 9.5 могут быть представлены тремя способами, но только один из них является верным.

Правильный способ представления данных примера 9.4 в таблице:

  Усвоение материала Всего:
есть нет
Условие 1
Условие 2
Всего:

 

В последних двух случаях таблицы не содержат информации о тех, кто не усвоил материал. Поэтому уменьшаются шансы обнаружить достоверные раз­личия, даже если они есть.

Как отмечалось, специфика применения х2-Пирсона в подобных случаях проявляется и в том, что это тот случай, когда допустима проверка как ненап­равленной, так и направленной статистической гипотезы. Важность определе­ния того, какая из этих двух гипотез проверяется, обусловлена тем, что в от­ношении одних и тех же данных при проверке направленной альтернативы значение р-уровня в два раза меньше, чем при проверке ненаправленной альтерна­тивы (см. главу 7: Направленные и ненаправленные альтернативы).

Варианты неправильного представления в таблице данных примера 9.5:
  Усвоение материала
наблюдаемое ожидаемое
Условие 1
Условие 2
  Усвоение материала
участвовали усвоили
Условие 1
Условие 2

Любые сомнения при выборе между направленной и ненаправленной ста­тистической гипотезой решаются в пользу ненаправленной альтернативы!



Рассмотрим различия ненаправленной и направленной альтернативы в от­ношении данных примера 9.5. Они могли быть получены в ходе сравнения двух способов запоминания — без предварительных предположений о том, какой способ лучше. Исследователя при этом интересуют два случая (направ­ления) отклонения Н0: а) «запоминание лучше при условии 1»; б) «запомина­ние лучше при условии 2». Такая проверка предполагает ненаправленную аль­тернативу. Соответственно, при отклонении Н0 допустим как тот, так и другой вывод. Или эти данные могли быть получены в ходе проверки предположе­ния о том, что новый (второй) способ является более эффективным, чем тра­диционный (первый). Исследователя тогда будет интересовать только один исход: «запоминание лучше при условии 2». Эта проверка предполагает на­правленную альтернативу, а при отклонении Н0 допустим только один вывод — о превосходстве условий 2.

ПРИМЕР, КОГДА ОПРАВДАНА ПРОВЕРКА НАПРАВЛЕННОЙ ГИПОТЕЗЫ___________

Проверялась гипотеза о влиянии природы родства на преступность близнеца. Дан­ные относятся к 30 преступникам мужского пола, каждый из которых имел брата близнеца. Тридцать человек были классифицированы: а) по природе родства (одно­яйцовые или разнояйцовые близнецы); б) по виновности или невиновности брата:

  Виновность брата: Всего:
  виновен не виновен
Однояйцовый близнец
Разнояйцовый близнец
Всего:

(Справочник по прикладной статистике/Под ред. Э.Ллойда, У. Ледермана.М., 1989. Т. 1.С. 376).

 

Как указывают различные авторы, односторонний критерий х2-Пирсона, который применяется для ненаправленных гипотез, в данном случае «пре­вращается» в двусторонний1. Таким образом, для проверки направленных ги­потез р-уровень для таблиц 2x2, определенный по таблице для ненаправлен­ной гипотезы (как двусторонний), делится на 2.

Другая особенность применения х2-Пирсона заключается во введении по­правки на непрерывность Йетса. В соответствии с ней формула 9.1 для таблиц 2x2 приобретает вид:

\2

%1 = ^ (1/э /т1 0,5)2 , <//= 1. (9.4)

( = 1 /т

ПРИМЕР 9.5 (продолжение)

Предположим, данные примера 9.5 относятся к ситуации проверки содержатель­ного предположения о большей эффективности нового метода обучения (условие 2) по сравнению с традиционным методом (условие 1).

Ш а г 1. Формулируется направленная статистическая гипотеза. Направленная Н0: При условии 2 вероятность усвоения материала не выше, чем при условии 1. В связи с тем, что объемы сравниваемых выборок не очень велики, можно принять а = 0,05.

Ш а г 2. Вычисляется эмпирическое значение х2-Пирсона с поправкой Йетса. Теоретические частоты подсчитываем по формуле 9.3:

(|/, -Л -0,5)2 А
0,698
0,964
0,698
0,964
Сумма: 3,325
N ' , _ 50-58 .50-42 _ ,,, _ 50-58 , _ 50-42 •'11 "" , АА ~ -Л 2 '>/21 -------- ' 22 ~

100 " 100 " 100 " 100

 

Эмпирическое значение х2-Пирсона с поправкой на непрерывность х2 = 3,325.

Ш а г 3. Определение р-уровня для направленной статистической гипотезы. Определяем по таблице критических значений критерия х2-Пирсона р-уровень значимости. Наше эмпирическое значение располагается между критическими для р = 0,1 и р = 0,05. Следовательно, для ненаправленных гипотез в нашем случае р < 0,1. Но с учетом того, что мы проверяем направленную гипотезу, окончатель­ное значениер-уровня: р < 0,05.

1 Доказательство этого см., например: Кендалл М., Стьюарт А. Статистические выводы и связи. М., 1973. С. 744-745; Справочник по прикладной статистике. В 2 т. Т. 1 / Под ред. Э. Ллойда, У. Ледермана, Ю. Тюрина. М„ 1989. С. 370-377.

Ш а г 4. Принятие статистического решения и формулировка содержательного вы­вода. Статистическое решение: Н0 отклоняется. Содержательный вывод: эффектив­ность усвоения материала в условиях обучения № 2 статистически значимо выше, чем в условиях № 1 (х2 = 3,325, 4Г= 1 ,р< 0,05).

Отметим, что при проверке ненаправленной гипотезы для тех же данных статистическое решение и, следовательно, содержательный вывод были бы другими.

X2-Пирсона с поправкой на непрерывность применим для анализа таблиц со­пряженности 2x2, когда N>40,0 если ни одна из теоретических частот не мень­ше 5, то при N>20}

Если таблица сопряженности 2x2 не удовлетворяет этим требованиям (%2-Пирсона с поправкой на непрерывность не применим), то можно восполь­зоваться расчетом точного значения р-уровня по Фишеру (ПзИег'з ехас( (ез1 — точный критерий Фишера) — односторонним (1-зк1ес1), для направленных ги­потез, или двусторонним (2-$нЗес1), для ненаправленных альтернатив. Его рас­чет «вручную» является трудоемким, поэтому необходимо воспользоваться компьютерной программой (8Р88, §Ш1з(лса — см. конец этой главы).

Повторные измерения

Структура исходных данных соответствует ситуации, когда одна выборка объектов классифицирована на две группы дважды по одному и тому же осно­ванию. Рассмотрим проверку гипотезы в отношении таких данных на примере.

ПРИМЕР 9.6_____________________________________________________________________

Исследовалось влияние убедительной лекции о введении моратория на смертную казнь. Число респондентов N= 60. Подсчитывалось число тех, кто «за», и тех, кто «против» смертной казни до и после лекции. Одна переменная — «до лекции» («за», «против»), другая — «после лекции» («за», «против»).

В таблице исходных данных в таких случаях каждой строке (объекту вы­борки) соответствуют два значения (в двух столбцах — «до», «после») одной и той же бинарной номинативной переменной («за», «против»). Таблица сопря­женности для таких данных (например, построенная при помощи компью­терной программы):

  До: Всего:
«За» «Против»
После: «За» а= 16 Ъ= 10
«Против» с =26
Всего:
Для таких данных х2-Пирсона с поправкой на непрерывность не применим!

 

' См. там же.

Действительно, применяя этот метод, мы будем проверять гипотезу о связи класси­фикации ответов до лекции с классификацией ответов после лекции, а нас интере­сует влияние лекции («до» — «после») на распределение ответов («за» — «против»). Тем не менее, попробуем применить х2-Пирсона с поправкой на непрерывность к этой таблице. Получим: х2 = 0,93, й/= 1, р > 0,1.

В подобных случаях применяется метод Мак-Нимара. Этот метод позво­ляет сопоставить долю тех, кто не обладал некоторой характеристикой (0) до воздействия, но стал обладать ею после воздействия (1), с долей тех, кто обла­дал этой характеристикой до воздействия (1) и перестал обладать ею после воздействия (0). Иначе говоря, метод позволяет сопоставить диагональные элементы таблицы сопряженности 2x2 (0,1 и 1,0 или 0,0 и 1,1), построенной непосредственно по дважды проведенной дихотомической классификации одной и той же выборки. Речь идет о таблице 2x2, построенной непосред­ственно по результатам дихотомической классификации двух зависимых вы­борок (одной и той же выборки — дважды):

После: До:
а Ь
с (1

 

Метод Мак-Нимара позволяет по этой таблице проверить две гипотезы: о соотношении а и с? (0,1 и 1,0); о соотношении с и Ъ (0,0 и 1,1).

Проверка гипотезы проводится по г-критерию по формулам для эмпири­ческого значения1:

с-Ь а-й

= I—- или г3 =-т==, (9.5)

л1с + Ь у/а + с!

где си Ъ — одна пара диагональных элементов таблицы, для проверки одной гипотезы; ажй — другая пара диагональных элементов, для проверки другой гипотезы. Для определения /ьуровня значимости эмпирическое значение гэ сравнивается с теоретическим — единичным нормальным распределением.

Ограничение на применение метода Мак-Нимара: сумма сравниваемых ча­стот не должна быть меньше 10.

ПРИМЕР 9.6 (продолжение)_________________________________________________________

Рассмотрим применение метода Мак-Нимара на примере проверки содержатель­ной гипотезы о влиянии лекции на мнение респондентов (данные примера 9.6).

Ш а г 1. Построение таблицы 2x2.

  До:
«За» «Против»
После: «За» о= 16 Ь= 10
«Против» с =26 ё= 8

1 Данная реализация метода заимствована из: Гласс Дж., Стенли Дж. Статистические мето­ды в педагогике и психологии. М., 1976. В программе ЗР58 используется критерий х2.

 

Ш а г 2. Формулировка статистической гипотезы.

Проверим Н0: с = Ь (ненаправленная гипотеза), при а = 0,05.

Отметим, что проверка гипотезы относительно других диагональных элементов

0: а = с0 в данном случае не имеет смысла.

Ш а г 3. Вычисление эмпирического значения критерия.

с-Ь 26-10 Ъ = , = , = 2,67. л]с + Ь V 26 + 10

Ш а г 4. Определение р-уровня (приложение 1).

Воспользуемся таблицей единичного нормального распределения:

а) находим в таблице теоретическое значение г, ближайшее меньшее к абсолютно­му (без учета знака) эмпирическому значению гэ: гт = 2,65;

б) определяем площадь под кривой справа от V- Р= 0,004;

в) вычисляем р-уровень по формулер<2Р:р< 0,008.

Ш а г 5. Принятие статистического решения и статистический вывод. На уровне а = 0,05 гипотеза Н0 отклоняется. Содержательный вывод: доля лиц, выступающих против смертной казни после лекции статистически значимо уве­личилась (г= 2,67; р < 0,008).

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.