Исходными данными для МРА является набор переменных, измеренных для выборки объектов (испытуемых). Одна из переменных определяется как «зависимая», остальные — как «независимые» переменные.
ПРИМЕР 15.1_____________________________________________________________________
Перед исследователем стоит задача предсказания успеваемости пяти абитуриентов поданным вступительных тестов (4 теста). Кроме того, его интересует, какие тесты обладают наибольшей предсказательной силой в отношении последующей успеваемости. В качестве исходных данных психолог имеет для каждого из 20 учащихся предыдущего набора средний балл отметок и 4 показателя тестирования. В его распоряжении имеются результаты применения тех же 4 тестов для пяти абитуриентов, и исследователь надеется предсказать для них средний балл успеваемости. Таким образом, исходными данными для МРА являются: средний балл отметок как «зависимая» переменная (У) и 4 «независимых» переменных — результатов тестов (Тез11, 1ез1 2, Гей 3, Гей 4) (табл. 15.1).
Таблица 15.1
Пример исходных данных для МРА
№
Гей 1
Гей 2
Гей 3
Гей 4
У
У
86,00
110,00
110,00
101,00
3,88
80,00
97,00
99,00
100,00
3,64
93,00
107,00
103,00
103,00
4,11
87,00
117,00
93,00
88,00
3,54
120,00
94,00
110,00
105,00
3,71
74,00
121,00
100,00
100,00
96,00
114,00
114,00
103,00
104,00
73,00
105,00
95,00
94,00
121,00
115,00
104,00
91,00
129,00
105,00
98,00
Первые 20 объектов — это учащиеся предыдущего набора, для которых известен средний балл успеваемости, последние 5 объектов — это абитуриенты, для которых известны только результаты тестирования. Последний столбец (У) — это оценки «зависимой» переменной, которые исследователь надеется получить в результате применения МРА. Корреляции исходных переменных приведены в табл. 15.2.
Таблица 15.2
Корреляция исходных данных для МРА
Гей 1
Гей 2
Гей 3
Гей 4
У
Гей 1
-0,015
0,263
0,402
0,639
Гей 2
-0,015
0,356
0,317
0,552
Гей 3
0,263
0,356
0,772
0,706
Гей 4
0,402
0,317
0,772
0,736
У
0,639
0,552
0,706
0,736
Строгих указаний о соотношении количества объектов N и количества признаков Р нет, но чем больше объем выборки, тем выше шансы получить статистически достоверные результаты.
Главное требование к исходным данным — отсутствие линейных взаимосвязей между переменными, когда одна переменная является линейной производной другой переменной. Таким образом, нельзя пользоваться суммой переменных или их средним арифметическим наряду с самими переменными. Соответственно, недопустимы переменные, коэффициент корреляции которых с любой другой переменной равен 1. Следует избегать включения в анализ переменных, корреляция между которыми близка к 1, так как сильно коррелирующая переменная не несет для анализа новой информации, добавляя излишний «шум».
Следующее требование — переменные должны быть измерены в метрической шкале (интервалов или отношений) и иметь нормальное распределение. При нарушении этого требования, однако, результаты могут быть полезны, если, конечно, соблюдать известную осторожность.
Желательно отбирать для МРА «независимые» переменные, сильно коррелирующие с «зависимой» переменной и слабо — друг с другом. Если «независимых» переменных много и наблюдается множество связей между ними, то перед МРА целесообразно провести факторный анализ этих «независимых» переменных с вычислением значений факторов для объектов (см. главу 16).
Практически во всех компьютерных программах анализ начинается с задания «зависимой» и «независимых» переменных, а также одного из методов МРА. Основные методы МРА:
□ исходный или стандартный (Еп1ег);
□ прямой пошаговый (Ропуагс!);
□ обратный пошаговый (Васк\уагс1).
Стандартный метод учитывает в МРА все «зависимые» переменные. Пошаговый метод обычно выступает в нескольких модификациях, основными из которых являются прямой и обратный метод.
Прямой пошаговый метод поочередно включает в регрессионное уравнение каждую переменную, начиная с наиболее тесно коррелирующей с «зависимой» переменной, до тех пор, пока ^-уровень значимости р-коэффициента последней из включенных переменных не превысит заданное значение (по умолчанию — 0,1). Обратный пошаговый метод поочередно исключает переменные из анализа, начиная с той, которая имеет наибольшее значение ^-уровня значимости Р-коэффициента, до тех пор, пока все оставшиеся переменные не будут иметь статистически значимые р-коэффициенты (по умолчанию р<0,1). Таким образом, пошаговые методы позволяют отсеивать несущественные для предсказания «независимые» переменные — те, Р-коэффициенты которых статистически не достоверны. Следует отметить, что разные варианты пошагового метода могут давать разные результаты, поэтому следует применить каждый из них и выбрать наиболее приемлемый конечный результат.
Основные результаты применения МРА:
К — коэффициент множественной корреляции;
Г — критерий Фишера и ^-уровень статистической значимости КМК;
К2 — квадрат КМК или КМД;
Р (Веш) — стандартизированные коэффициенты регрессии и /7-уровень их статистической значимости;
В — коэффициенты регрессии (регрессионного уравнения).
Дополнительно возможно вычисление оценок «зависимой» переменной (Ргеё1с1её Уа1ие§) и ошибок оценки (Ке§Миа1з).
Рассмотрим процедуру обработки, основные результаты и их интерпретацию, применив программу 8Р88 к данным примера 15.1.
ОБРАБОТКА НА КОМПЬЮТЕРЕ
Исходные данные (Ба*а Е<Шог) представляют собой 5 переменных (ьезь 1, ЬезЬ 2, ьезь 3, ЬезЬ 4, У) для 25 объектов; для последних 5 объектов значения Уне определены (табл. 15.1).
2. В открывшемся основном окне диалога Ьтеаг Ке§ге$$10п (Линейный регрессионный) выделяем и переносим из левого окна переменные при помощи кнопки >: зависимую переменную (У) в правое верхнее окно ферепйеп*), независимые переменные (ЬезЬ 1, (гезЬ 2 , (гезЬ 3 , (гезь 4) — в правое второе сверху окно (1п(1ереп(1еп18).
3. В том же окне диалога выбираем метод. Для этого в окне МеШой (Метод) вместо принятого по умолчанию стандартного метода (Еп1ег) при помощи кнопки > выбираем один из пошаговых методов, в данном случае — Васк\уап1 (Обратный).
4. Для вычисления и сохранения оценок зависимой переменной1 в том же окне диалога нажимаем клавишу 8ауе... (Сохранить). В появившемся окне диалога в разделе РгеШс^ей Уа1ие$ (Предсказанные оценки) отмечаем флажком Ш§1ап(]аг(Н2е(1 (Не стандартизованные). Нажимаем СогШпие (Продолжить).
5. После указания всех установок в основном окне диалога Ыпеаг Ке^геазюп (Линейный регрессионный) нажимаем ОК и получаем результаты.
Рассмотрим наиболее важные результаты МРА.
Мойе1 Зиттагу(с)
МосЗе1
К
Я Здиаге
АсЗ^изЬей К Бдиаге
зьа. Еггог оЕ (:Ье ЕзЫтаЬе
. 886(а)
.786
.729
.29023
.879(Ь)
. 773
.731
.28914
а РгесЗгсЬогз : (СопзЬагИ: ) , ТЕЗТ4, ТЕ5Т2, ТЕЗТ1, ТЕЗТЗ Ь РгесИсЬогз: (СопзЬапЬ), ТЕБТ4, ТЕ5Т2, ТЕЗТ1 с БерепсЗепЬ УаггаЫе: У
АМОУА(с)
МосЗе1
Зит оЕ
Здиагез
сЗГ
Меап
Здиаге
Р
31д.
Яедгезз1оп
. 159
13.755
. 000 (а)
Нез1<3иа1
1.
ТоЬа1
Яедгезз1оп
. 520
18.183
.000(Ъ)
Кез 1<3иа1
ТоЬа!
а РгесЗгсЬогз: (СопзЬапЬ), ТЕЗТ4, ТЕЗТ2, ТЕЗТ1, ТЕЗТЗ Ь РгесЗгсЬогз : (СопзЬапЬ) , ТЕЗТ4 , ТЕЗТ2 , ТЕЗТ1 с БерепсЗепЬ Уаг1аЫе: У
Эти две таблицы содержат наиболее общие результаты МРА для двух моделей (Моёе1): 1 — исходная модель, с включением всех переменных; 2 — окончательная модель, с исключенной переменной ьезьз. Интерпретации подлежат: в первой таблице — КМК (К) и КМД (К. Зциаге); во второй таблице — значение критерия ^-Фишера и его /7-уровень значимости. КМК для окончательной модели статистически достоверен, поэтому модель множественной регрессии может быть содержательно интерпретирована. КМД достаточно большой, регрессионная модель объясняет более 77% дисперсии зависимой переменной, и результаты предсказания могут быть приняты во внимание.
СоеЕЕ1с1епЬ8(а)
Мойе1
№з(:апс1агс112ес1
ЗЬапйагсИгесИ
51д.
Сое{Е1с1епЬз
Сое{{1с1еп<;з
В
зъа.
Веса
Еггог
(СопвЬапЪ)
-1.486
.871
-1.705
. 109
ТЕ5Т1
.011
. 004
.384
2.825
.013
ТЕ5Т2
. 012
. 005
.334
2 .565
. 022
ТЕ5ТЗ
. 014
.015
. 196
. 938
.363
ТЕ5Т4
.017
.012
.295
1.380
. 188
(СопзЬапЬ)
-1.049
.733
-1.430
. 172
ТЕ8Т1
.011
. 004
.379
2 . 800
.013
ТЕ5Т2
.014
. 005
.368
2 . 949
.009
ТЕ5Т4
.026
. 008
.445
3 .161
.006
а ОерепйепЪ \/аг1аЫе: У
Эта таблица содержит величины не стандартизованных (В) и стандартизованных (Ве1а) коэффициентов регрессии, а также критерии /-Стьюдента (I) и/7-уровни позволяющие определить их статистическую значимость.
Отметим, что во внимание могут быть приняты только те регрессионные коэффициенты, которые являются статистически значимыми.
Показателем вклада каждой из переменных в регрессионную модель служат их р-коэффициенты. В результирующей модели (2) для предсказания остаются три переменные: переменная 1ез1: 3 исключена. Представляет интерес анализ причин исключения переменной 1ез13 из модели. Как видно из табл. 15.2, эта переменная весьма существенно коррелируете зависимой переменной. Однако она сильно связана и с переменной 1ез14, что обусловливает существенное снижение ее р-коэффициента: в исходной модели (1) он наименьший из всех остальных (р = 0,196). Исключение переменной 1ез1 3 повышает предсказательную ценность переменной 1ез1: 4.
^-коэффициенты используются для предсказания значений зависимой переменной — путем вычисления ее оценок по уравнению регрессии, в соответствии с формулой 15.2:
В связи с тем, что назначено сохранение оценок зависимой переменной (см. шаг 4), в таблице исходных данных (Ба1а ЕсШог) появилась новая переменная рге_1 — оценки зависимой переменной. Они вычислены по указанной формуле для всех 25 объектов и в данном примере могут служить для предсказания успеваемости 5 абитуриентов.
Глава 16
ФАКТОРНЫЙ АНАЛИЗ
НАЗНАЧЕНИЕ
Возникновение и развитие факторного анализа тесно связано с измерениями в психологии. Длительное время факторный анализ и воспринимался как математическая модель в психологической теории интеллекта. Лишь начиная с 50-х годов XX столетия, одновременно с разработкой математического обоснования факторного анализа, этот метод становится общенаучным. К настоящему времени факторный анализ является неотъемлемой частью любой серьезной статистической компьютерной программы и входит в основной инструментарий всех наук, имеющих дело с многопараметрическим описанием изучаемых объектов, таких, как социология, экономика, биология, медицина и другие.
Основная идея факторного анализа была сформулирована еще Ф. Гальтоном, основоположником измерений индивидуальных различий. Она сводится к тому, что если несколько признаков, измеренных на группе индивидов, изменяются согласованно, то можно предположить существование одной общей причины этой совместной изменчивости — фактора как скрытой (латентной), непосредственно не доступной измерению переменной. Далее К. Пирсон в 1901 году выдвигает идею «метода главных осей», а Ч. Спирмен, отстаивая свою однофакторную концепцию интеллекта, разрабатывает математический аппарат для оценки этого фактора, исходя из множества измерений способностей. В своей работе, опубликованной в 1904 году, Ч. Спирмен показал, что если ряд при- знаков попарно коррелируют друг с другом, _ то может быть составлена система линейных уравнений, связывающих все эти признаки, один общий фактор «общей одаренности» и по одному специфическому фактору «специальных способностей» для каждой переменной. В 1930-х годах Л. Тер-
Фактор — скрытая причина согласованной изменчивости наблюдаемых переменных
стоун впервые предлагает «многофакторный анализ» для описания многочисленных измеренных способностей меньшим числом общих факторов интеллекта, являющихся линейной комбинацией этих исходных способностей. С 1950-х годов, с появлением компьютеров, факторный анализ начинает очень широко использоваться в психологии при разработке тестов, обоснования структурных теорий интеллекта и личности. При этом исследователь начинает с множества измеренных эмпирических показателей, которые при помощи факторного анализа группируются по факторам (изучаемым свойствам). Факторы получают интерпретацию по входящим в них переменным, затем отбираются наиболее «весомые» показатели этих факторов, отсеиваются малозначимые переменные, вычисляются значения факторов для испытуемых и сопоставляются с внешними эмпирическими показателями изучаемых свойств.
В дальнейшем, по мере развития математического обеспечения факторного анализа, накопления опыта его использования, прежде всего в психологии, задача факторного анализа обобщается. Как общенаучный метод, факторный анализ становится средством для замены набора коррелирующих измерений существенно меньшим числом новых переменных (факторов). При этом основными требованиями являются: а) минимальная потеря информации, содержащейся в исходных данных, и б) возможность представления (интерпретации) факторов через исходные переменные.
Таким образом, главная цель факторного анализа — уменьшение размерности исходных данных с целью их экономного описания при условии минимальных потерь исходной информации. Результатом факторного анализа является переход от множества исходных переменных к существенно меньшему числу новых переменных — факторов. Фактор при этом интерпретируется как причина совместной изменчивости нескольких исходных переменных.
Если исходить из предположения о том, что корреляции могут быть объяснены влиянием скрытых причин — факторов, то основное назначение факторного анализа — анализ корреляций множества признаков.
ПРИМЕР 16.1_____________________________________________________________________
Рассмотрим результаты факторного анализа на простом примере. Предположим, исследователь измерил на выборке из 50 испытуемых 5 показателей интеллекта: счет в уме, продолжение числовых рядов, осведомленность, словарный запас, установление сходства. Все показатели статистически значимо взаимосвязаны на уровне р < 0,05, кроме показателя № 4 с № 1 и 2 (табл. 16.1).
Табл и ца 16.1
Не нашли, что искали? Воспользуйтесь поиском по сайту: