ИСХОДНЫЕ ДАННЫЕ, ПРОЦЕДУРА И РЕЗУЛЬТАТЫ

Исходными данными для МРА является набор переменных, измеренных для выборки объектов (испытуемых). Одна из переменных определяется как «зависимая», остальные — как «независимые» переменные.

ПРИМЕР 15.1_____________________________________________________________________

Перед исследователем стоит задача предсказания успеваемости пяти абитуриентов поданным вступительных тестов (4 теста). Кроме того, его интересует, какие тесты обладают наибольшей предсказательной силой в отношении последующей успеваемости. В качестве исходных данных психолог имеет для каждого из 20 учащихся предыдущего набора средний балл отметок и 4 показателя тестирования. В его распоряжении имеются результаты применения тех же 4 тестов для пяти абитуриентов, и исследователь надеется предсказать для них средний балл успеваемости. Таким образом, исходными данными для МРА являются: средний балл отметок как «зависимая» переменная (У) и 4 «независимых» переменных — результатов тестов (Тез11, 1ез1 2, Гей 3, Гей 4) (табл. 15.1).

Таблица 15.1

Пример исходных данных для МРА

№	Гей 1	Гей 2	Гей 3	Гей 4	У	У
	86,00	110,00	110,00	101,00	3,88
	80,00	97,00	99,00	100,00	3,64
	93,00	107,00	103,00	103,00	4,11
	87,00	117,00	93,00	88,00	3,54

	120,00	94,00	110,00	105,00	3,71
	74,00	121,00	100,00	100,00
	96,00	114,00	114,00	103,00
	104,00	73,00	105,00	95,00
	94,00	121,00	115,00	104,00
	91,00	129,00	105,00	98,00

Первые 20 объектов — это учащиеся предыдущего набора, для которых известен средний балл успеваемости, последние 5 объектов — это абитуриенты, для которых известны только результаты тестирования. Последний столбец (У) — это оценки «зависимой» переменной, которые исследователь надеется получить в результате применения МРА. Корреляции исходных переменных приведены в табл. 15.2.

Таблица 15.2

Корреляция исходных данных для МРА

	Гей 1	Гей 2	Гей 3	Гей 4	У
Гей 1		-0,015	0,263	0,402	0,639
Гей 2	-0,015		0,356	0,317	0,552
Гей 3	0,263	0,356		0,772	0,706
Гей 4	0,402	0,317	0,772		0,736
У	0,639	0,552	0,706	0,736

Строгих указаний о соотношении количества объектов N и количества признаков Р нет, но чем больше объем выборки, тем выше шансы получить статистически достоверные результаты.

Главное требование к исходным данным — отсутствие линейных взаимосвязей между переменными, когда одна переменная является линейной производной другой переменной. Таким образом, нельзя пользоваться суммой переменных или их средним арифметическим наряду с самими переменными. Соответственно, недопустимы переменные, коэффициент корреляции которых с любой другой переменной равен 1. Следует избегать включения в анализ переменных, корреляция между которыми близка к 1, так как сильно коррелирующая переменная не несет для анализа новой информации, добавляя излишний «шум».

Следующее требование — переменные должны быть измерены в метрической шкале (интервалов или отношений) и иметь нормальное распределение. При нарушении этого требования, однако, результаты могут быть полезны, если, конечно, соблюдать известную осторожность.

Желательно отбирать для МРА «независимые» переменные, сильно коррелирующие с «зависимой» переменной и слабо — друг с другом. Если «независимых» переменных много и наблюдается множество связей между ними, то перед МРА целесообразно провести факторный анализ этих «независимых» переменных с вычислением значений факторов для объектов (см. главу 16).

Практически во всех компьютерных программах анализ начинается с задания «зависимой» и «независимых» переменных, а также одного из методов МРА. Основные методы МРА:

□ исходный или стандартный (Еп1ег);

□ прямой пошаговый (Ропуагс!);

□ обратный пошаговый (Васк\уагс1).

Стандартный метод учитывает в МРА все «зависимые» переменные. Пошаговый метод обычно выступает в нескольких модификациях, основными из которых являются прямой и обратный метод.

Прямой пошаговый метод поочередно включает в регрессионное уравнение каждую переменную, начиная с наиболее тесно коррелирующей с «зависимой» переменной, до тех пор, пока ^-уровень значимости р-коэффициента последней из включенных переменных не превысит заданное значение (по умолчанию — 0,1). Обратный пошаговый метод поочередно исключает переменные из анализа, начиная с той, которая имеет наибольшее значение ^-уровня значимости Р-коэффициента, до тех пор, пока все оставшиеся переменные не будут иметь статистически значимые р-коэффициенты (по умолчанию р<0,1). Таким образом, пошаговые методы позволяют отсеивать несущественные для предсказания «независимые» переменные — те, Р-коэффициенты которых статистически не достоверны. Следует отметить, что разные варианты пошагового метода могут давать разные результаты, поэтому следует применить каждый из них и выбрать наиболее приемлемый конечный результат.

Основные результаты применения МРА:

К — коэффициент множественной корреляции;

Г — критерий Фишера и ^-уровень статистической значимости КМК;

К² — квадрат КМК или КМД;

Р (Веш) — стандартизированные коэффициенты регрессии и /7-уровень их статистической значимости;

В — коэффициенты регрессии (регрессионного уравнения).

Дополнительно возможно вычисление оценок «зависимой» переменной (Ргеё1с1её Уа1ие§) и ошибок оценки (Ке§Миа1з).

Рассмотрим процедуру обработки, основные результаты и их интерпретацию, применив программу 8Р88 к данным примера 15.1.

ОБРАБОТКА НА КОМПЬЮТЕРЕ

Исходные данные (Ба*а Е<Шог) представляют собой 5 переменных (ьезь 1, ЬезЬ 2, ьезь 3, ЬезЬ 4, У) для 25 объектов; для последних 5 объектов значения Уне определены (табл. 15.1).

1. Выбираем Апа!ухе > Ке§ге8$юп (Регрессионный) > Упеаг... (Линейный).

2. В открывшемся основном окне диалога Ьтеаг Ке§ге$$10п (Линейный регрессионный) выделяем и переносим из левого окна переменные при помощи кнопки >: зависимую переменную (У) в правое верхнее окно ферепйеп*), независимые переменные (ЬезЬ 1, (гезЬ 2 , (гезЬ 3 , (гезь 4) — в правое второе сверху окно (1п(1ереп(1еп18).

3. В том же окне диалога выбираем метод. Для этого в окне МеШой (Метод) вместо принятого по умолчанию стандартного метода (Еп1ег) при помощи кнопки > выбираем один из пошаговых методов, в данном случае — Васк\уап1 (Обратный).

4. Для вычисления и сохранения оценок зависимой переменной¹ в том же окне диалога нажимаем клавишу 8ауе... (Сохранить). В появившемся окне диалога в разделе РгеШс^ей Уа1ие$ (Предсказанные оценки) отмечаем флажком Ш§1ап(]аг(Н2е(1 (Не стандартизованные). Нажимаем СогШпие (Продолжить).

5. После указания всех установок в основном окне диалога Ыпеаг Ке^геазюп (Линейный регрессионный) нажимаем ОК и получаем результаты.

Рассмотрим наиболее важные результаты МРА.

Мойе1 Зиттагу(с)

МосЗе1	К	Я Здиаге	АсЗ^изЬей К Бдиаге	зьа. Еггог оЕ (:Ье ЕзЫтаЬе
	. 886(а)	.786	.729	.29023
	.879(Ь)	. 773	.731	.28914

а РгесЗгсЬогз : (СопзЬагИ: ) , ТЕЗТ4, ТЕ5Т2, ТЕЗТ1, ТЕЗТЗ Ь РгесИсЬогз: (СопзЬапЬ), ТЕБТ4, ТЕ5Т2, ТЕЗТ1 с БерепсЗепЬ УаггаЫе: У

АМОУА(с)

МосЗе1		Зит оЕ	Здиагез	сЗГ	Меап	Здиаге	Р	31д.
	Яедгезз1оп					. 159	13.755	. 000 (а)
	Нез1<3иа1	1.
	ТоЬа1
	Яедгезз1оп					. 520	18.183	.000(Ъ)
	Кез 1<3иа1
	ТоЬа!

а РгесЗгсЬогз: (СопзЬапЬ), ТЕЗТ4, ТЕЗТ2, ТЕЗТ1, ТЕЗТЗ Ь РгесЗгсЬогз : (СопзЬапЬ) , ТЕЗТ4 , ТЕЗТ2 , ТЕЗТ1 с БерепсЗепЬ Уаг1аЫе: У

Эти две таблицы содержат наиболее общие результаты МРА для двух моделей (Моёе1): 1 — исходная модель, с включением всех переменных; 2 — окончательная модель, с исключенной переменной ьезьз. Интерпретации подлежат: в первой таблице — КМК (К) и КМД (К. Зциаге); во второй таблице — значение критерия ^-Фишера и его /7-уровень значимости. КМК для окончательной модели статистически достоверен, поэтому модель множественной регрессии может быть содержательно интерпретирована. КМД достаточно большой, регрессионная модель объясняет более 77% дисперсии зависимой переменной, и результаты предсказания могут быть приняты во внимание.

СоеЕЕ1с1епЬ8(а)

Мойе1		№з(:апс1агс112ес1	ЗЬапйагсИгесИ		51д.
		Сое{Е1с1епЬз	Сое{{1с1еп<;з
		В	зъа.	Веса
			Еггог
	(СопвЬапЪ)	-1.486	.871		-1.705	. 109
	ТЕ5Т1	.011	. 004	.384	2.825	.013
	ТЕ5Т2	. 012	. 005	.334	2 .565	. 022
	ТЕ5ТЗ	. 014	.015	. 196	. 938	.363
	ТЕ5Т4	.017	.012	.295	1.380	. 188
	(СопзЬапЬ)	-1.049	.733		-1.430	. 172
	ТЕ8Т1	.011	. 004	.379	2 . 800	.013
	ТЕ5Т2	.014	. 005	.368	2 . 949	.009
	ТЕ5Т4	.026	. 008	.445	3 .161	.006

а ОерепйепЪ \/аг1аЫе: У

Эта таблица содержит величины не стандартизованных (В) и стандартизованных (Ве1а) коэффициентов регрессии, а также критерии /-Стьюдента (I) и/7-уровни позволяющие определить их статистическую значимость.

Отметим, что во внимание могут быть приняты только те регрессионные коэффициенты, которые являются статистически значимыми.

Показателем вклада каждой из переменных в регрессионную модель служат их р-коэффициенты. В результирующей модели (2) для предсказания остаются три переменные: переменная 1ез1: 3 исключена. Представляет интерес анализ причин исключения переменной 1ез13 из модели. Как видно из табл. 15.2, эта переменная весьма существенно коррелируете зависимой переменной. Однако она сильно связана и с переменной 1ез14, что обусловливает существенное снижение ее р-коэффициента: в исходной модели (1) он наименьший из всех остальных (р = 0,196). Исключение переменной 1ез1 3 повышает предсказательную ценность переменной 1ез1: 4.

^-коэффициенты используются для предсказания значений зависимой переменной — путем вычисления ее оценок по уравнению регрессии, в соответствии с формулой 15.2:

У= -1,049 + 0,026(1ез14) + 0,0П(1еа 1) + 0,014(1ей 2). Фрагмент таблицы (Ба(а ЕйКог) с оценками зависимой переменной (У)

Гез! 1	ГезГ 2	1е51 3	(ей 4	У	рге_1
86,00	110,00	110,00	101,00	3,88	3,98

74,00	121,00	100,00	100,00		3,98
96,00	114,00	114,00	103,00		4,19
104,00	73,00	105,00	95,00		3,52
94,00	121,00	115,00	104,00		4,29
91,00	129,00	105,00	98,00		4,22

В связи с тем, что назначено сохранение оценок зависимой переменной (см. шаг 4), в таблице исходных данных (Ба1а ЕсШог) появилась новая переменная рге_1 — оценки зависимой переменной. Они вычислены по указанной формуле для всех 25 объектов и в данном примере могут служить для предсказания успеваемости 5 абитуриентов.

Глава 16

ФАКТОРНЫЙ АНАЛИЗ

НАЗНАЧЕНИЕ

Возникновение и развитие факторного анализа тесно связано с измерениями в психологии. Длительное время факторный анализ и воспринимался как математическая модель в психологической теории интеллекта. Лишь начиная с 50-х годов XX столетия, одновременно с разработкой математического обоснования факторного анализа, этот метод становится общенаучным. К настоящему времени факторный анализ является неотъемлемой частью любой серьезной статистической компьютерной программы и входит в основной инструментарий всех наук, имеющих дело с многопараметрическим описанием изучаемых объектов, таких, как социология, экономика, биология, медицина и другие.

Основная идея факторного анализа была сформулирована еще Ф. Гальтоном, основоположником измерений индивидуальных различий. Она сводится к тому, что если несколько признаков, измеренных на группе индивидов, изменяются согласованно, то можно предположить существование одной общей причины этой совместной изменчивости — фактора как скрытой (латентной), непосредственно не доступной измерению переменной. Далее К. Пирсон в 1901 году выдвигает идею «метода главных осей», а Ч. Спирмен, отстаивая свою однофакторную концепцию интеллекта, разрабатывает математический аппарат для оценки этого фактора, исходя из множества измерений способностей. В своей работе, опубликованной в 1904 году, Ч. Спирмен показал, что если ряд при- знаков попарно коррелируют друг с другом, _ то может быть составлена система линейных уравнений, связывающих все эти признаки, один общий фактор «общей одаренности» и по одному специфическому фактору «специальных способностей» для каждой переменной. В 1930-х годах Л. Тер-

Фактор — скрытая причина согласованной изменчивости наблюдаемых переменных

стоун впервые предлагает «многофакторный анализ» для описания многочисленных измеренных способностей меньшим числом общих факторов интеллекта, являющихся линейной комбинацией этих исходных способностей. С 1950-х годов, с появлением компьютеров, факторный анализ начинает очень широко использоваться в психологии при разработке тестов, обоснования структурных теорий интеллекта и личности. При этом исследователь начинает с множества измеренных эмпирических показателей, которые при помощи факторного анализа группируются по факторам (изучаемым свойствам). Факторы получают интерпретацию по входящим в них переменным, затем отбираются наиболее «весомые» показатели этих факторов, отсеиваются малозначимые переменные, вычисляются значения факторов для испытуемых и сопоставляются с внешними эмпирическими показателями изучаемых свойств.

В дальнейшем, по мере развития математического обеспечения факторного анализа, накопления опыта его использования, прежде всего в психологии, задача факторного анализа обобщается. Как общенаучный метод, факторный анализ становится средством для замены набора коррелирующих измерений существенно меньшим числом новых переменных (факторов). При этом основными требованиями являются: а) минимальная потеря информации, содержащейся в исходных данных, и б) возможность представления (интерпретации) факторов через исходные переменные.

Таким образом, главная цель факторного анализа — уменьшение размерности исходных данных с целью их экономного описания при условии минимальных потерь исходной информации. Результатом факторного анализа является переход от множества исходных переменных к существенно меньшему числу новых переменных — факторов. Фактор при этом интерпретируется как причина совместной изменчивости нескольких исходных переменных.

Если исходить из предположения о том, что корреляции могут быть объяснены влиянием скрытых причин — факторов, то основное назначение факторного анализа — анализ корреляций множества признаков.

ПРИМЕР 16.1_____________________________________________________________________

Рассмотрим результаты факторного анализа на простом примере. Предположим, исследователь измерил на выборке из 50 испытуемых 5 показателей интеллекта: счет в уме, продолжение числовых рядов, осведомленность, словарный запас, установление сходства. Все показатели статистически значимо взаимосвязаны на уровне р < 0,05, кроме показателя № 4 с № 1 и 2 (табл. 16.1).

Табл и ца 16.1

Не нашли, что искали? Воспользуйтесь поиском по сайту: