Проблема связанных (одинаковых) рангов
В измерениях часто встречаются одинаковые значения. При их ранжировании возникает проблема связанных рангов (Лей Капкз). В этом случае действует особое правило ранжирования: объектам с одинаковыми значениями
приписывается один и тот же, средний ранг. Например, когда эксперт
не может установить различие между двумя лучшими образцами товара, им приписывается одинаковый ранг: (1 + 2)/2 = 1,5. Это сохраняет неизменной сумму рангов для выборки объемом К. уУ(Аг+ 1)/2.
При наличии одинаковых (связанных) рангов формулы ранговой корре ляции Спирмена (6.6) и Кендалла (6.7 и 6.8) не подходят. Хотя сумма рангов и не меняется, но изменчивость данных становится меньше. Соответственно, уменьшается возможность оценить степень связи между измеренными свойствами.
При использовании корреляции Спирмена в случае связанных рангов возможны два подхода:
О если связей немного (менее 10% для каждой переменной), то вычислить г-Спирмена приближенно по формуле 6.6; □ при большем количестве связей применить к ранжированным данным классическую формулу /--Пирсона 6.1 — это всегда позволит определить ранговую корреляцию независимо от наличия связей в рангах.
При использовании корреляции т-Кендалла в случае наличия связанных рангов в формулу вносятся поправки, и тогда получается общая формула для вычисления т коэффициента корреляции хь-Кендалла (КепёаИ'з 1аи-Ь) независимо от наличия или отсутствия связей в рангах:
Та=___________ РЧ1___________ 5
где Хх -(1 -1) (' ~~ количество групп связей по Х,^ — численность
каждой группы); к =(1 ^ ~ количество групп связей по У,/,—
численность каждой группы').
ПРИМЕР 6.6____________________________________________________________________________________
Супруги X и У ранжировали 8 жизненных ценностей по степени предпочтения. Данные представлены в таблице:
Ценности
| Ранги X
| Ранги У
| Р (совпадения)
| <2 (инверсии)
| Здоровье
|
|
|
|
| Любовь
|
|
|
|
| Богатство
|
|
|
|
| Свобода
|
|
|
|
| Мудрость
|
|
|
|
| Познание
|
|
|
|
| Развитие
|
|
|
|
| Творчество
|
|
|
|
|
|
|
| 2 = 20
|
| В качестве меры согласованности предпочтений супругов вычислим корреляцию т6-Кендалла, так как наблюдаются связи в рангах: одна группа из трех рангов по Хн две группы по три ранга по У.
Обратите внимание на подсчет совпадений для объектов, попадающих в «связки». Например, для объекта «Богатство» пропускаются два ниже находящихся объекта, как имеющие одинаковые с ним ранги по X.
|
Подсчитаем поправочные коэффициенты: Кх= (1/2)[(3(3 - 1)] = 3; Ку= (1/2)[3(3 - — 1) + 3(3 — 1)] = 6. Подставим полученные значения в формулу 6.9:
2°-° поо
т„ = . = 0,853.
7(8 х 7/2)-3 7(8x7/2) -6
Заметим, что инверсии отсутствуют, и если бы связей в рангах не было, то корреляция была бы строго прямой (равна 1).
КОРРЕЛЯЦИЯ БИНАРНЫХ ДАННЫХ
Как отмечалось ранее, если одна из двух переменных представлена в номинативной шкале, а другая — в числовой (ранговой или метрической), то связь между этими переменными лучше изучать путем сравнения групп по уровню выраженности числовой переменной.
ПРИМЕР_________________________________________________________________________
Предположим, исследуется связь количества пропущенных лекций студентами и курса обучения (с 1-го по 5-й). Первая переменная — метрическая, а вторая — номинативная. Связь между этими переменными может быть изучена путем сравнения разных курсов по количеству пропущенных лекций (по средним значениям). Если будут обнаружены различия между курсами, то посещаемость лекций связана с курсом обучения, в противном случае — связи нет.
То же касается проблемы изучения связи между двумя номинативными переменными. Хотя и для этого случая существуют коэффициенты корреляции (К— Чупрова, С — Пирсона), но возможность их интерпретации весьма ограничена, в частности потому, что они отражают лишь силу связи, но не ее направление. Поэтому и в этом случае проблему связи между двумя номинативными переменными лучше изучать путем сравнения градаций одной переменной по распределению другой переменной.
ПРИМЕР_________________________________________________________________________
Предположим, исследуется связь агрессивности учащихся (три градации: низкая, средняя, высокая) и образования их родителей (среднее, высшее техническое, высшее гуманитарное). Результаты исследования связей двух номинативных переменных обычно представляются в виде таблицы сопряженности:
Агрессивность
| Образование родителей
| Среднее
| Высш. технич.
| Высш. гуманит.
| Низкая
|
|
|
| Средняя
|
|
|
| Высокая
|
|
|
| Связь между этими переменными может быть изучена путем сравнения распределений учащихся по степени агрессивности для разных градаций образования родителей (или, что то же самое, путем сравнения распределения образования родителей для разных градаций степени агрессивности учащихся).
Исключением можно считать случай изучения связи двух бинарных переменных. Бинарная переменная имеет только две градации, обычно обозначаемые как О и 1. Примеры таких переменных: пол (мужской, женский), образование (среднее, высшее), тревожность (низкая, высокая), успешность (низкая, высокая) и т. д.
При изучении связей между бинарными переменными обычно строят че- тырехклеточные таблицы сопряженности:
Таблица 6.1
Таблица сопряженности 2x2
|
| Признак X
| Итог
|
|
|
|
|
| Признак У
|
| а
| Ъ
| а + Ь
|
| с
| с1
| с+ с1
| Итог
|
| а + с
| Ь + Л
| N
| |