СРСП 4. Анализ качественных признаков. Таблицы сопряженности
Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «профессия» или «вид патологии», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?
В этих случаях изучается распространенность признаков, частота встречаемости признаков (доля объектов с интересующим нас признаком) в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.
Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки – градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.
Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации).
В общем случае Н(0) формулируется следующим образом:
· в генеральных совокупностях доля объектов с интересующими нас признаками одинакова
· или частота встречаемости одного признака не зависит от частоты встречаемости другого признака
· или какой-либо фактор не влияет на частоту встречаемости признака (признаков)
СЛУЧАЙ 1. Выборки независимые
Предположим, что у нас есть два качественных признака, характеризующие обследованных лиц. Занесем эти данные в таблицу сопряженности
| Первая признак (первая градация)
| Первый признак (вторая градация)
| Всего
| Второй признак (первая градация)
| Частота встречаемости
a
| Частота встречаемости
b
| a +b
| Второй признак (вторая градация)
| Частота встречаемости
c
| Частота встречаемости
d
| с+d
|
| n1=a+c
| n2=b+d
| n =a+b+c+d
|
Критерием для проверки нулевой гипотезы является хи-квадрат Пирсона с поправкой Йетса
Его критическое значение находится для заданного уровня значимости α и числа степеней свободы f=(m-1)(n-1), где m-число столбцов, n – число строк (Приложение 5).
Если то Н(0) принимается,
В случае принимается Н(1)
Можно вычислить меру связи между двумя признаками – ею является коэффициент ассоциации Юла Q (аналог коэффициента корреляции)
Q лежит в пределах от 0 до 1. Близкий к единице коэффициент свидетельствует о сильной связи между признаками. При равенстве его нулю – связь отсутствует.
Работа с преподавателем
Руководствуясь тем, что аспирин препятствует образованию тромбов, Г. Харатер решил проверить, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сут.). Было проведено контролируемое испытание. Все больные, согласившиеся принять участие в испытании и не имевшие противопоказаний к аспирину, были случайным образом разделены на две группы: 1-я получала плацебо, 2-я - аспирин. Исследование проводилось до тех пор, пока общее число больных с тромбозом шунта не достигло 24. Группы практически не различались по возрасту, полу и продолжительности лечения гемодиализом.
В 1-й группе тромбоз шунта произошел у 18 из 25 больных, во 2-й -у 6 из 19. Можно ли говорить о статистически значимом различии доли больных тромбозом, а тем самым об эффективности аспирина?
Зададим уровень значимости α=0,05
Сформулируем Н(0): в генеральной совокупности доля больных тромбозом не зависит от приема аспирина.
Занесем результаты испытания в таблицу.
| Тромбоз есть
| Тромбоза нет
|
| Плацебо
|
|
|
| Аспирин
|
|
|
| Всего
|
|
|
|
Посчитаем значение критерия хи-квадрат с поправкой Йетса
Q=0,7
Мы задали 5% -ный уровень значимости α = 0,05 . Тогда критическое значение = 3,84 (по таблице для f=1). Полученное значение χ2=5,56 больше, чем критическое, следовательно, мы отвергаем Н(0) гипотезу о том, что аспирин не влияет на проявление тромбоза шунта. Следовательно, мы можем утверждать с вероятностью 95%, что использование аспирина эффективно снижает риск тромбоза в генеральной совокупности.
Q=0,7 показывает сильную связь между приемом аспирина и вероятностью тромбоза.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|