Факторная структура в общем виде

(М — число факторов, Р — число переменных)

			к	м	к^г
	«11	а₁₂	«14	^а\м	к]
	«21	а₂₂	а_2к	а_2м	к]

	Я/1	ап	«,*	«»/	к)

Р	а_Р[	а_п	^аРк	^арм	к}
X	X,	Х₂	К

Алгоритм факторного анализа обеспечивает максимально возможное приближение вычисленных, или восстановленных, коэффициентов корреляции к исходным корреляциям. Это достигается варьированием числа факторов и диагональными элементами корреляционной матрицы, на которых располагаются не единицы, как в компонентном анализе, а значения общностей.

Проблема числа факторов

Это первая проблема при проведении факторного анализа. Обычно заранее не известно, сколько факторов необходимо и достаточно для представления данного набора переменных. Сама же процедура факторного анализа предполагает предварительное задание числа факторов. Поэтому исследователь должен заранее определить или оценить их возможное количество. Для этого на первом этапе факторного анализа обычно применяют анализ главных компонент и используют график собственных значений (Зсгее р1о1).

На рис. 16.2 представлен график собственных значений для компонент из табл. 16.3. Компонентные нагрузки интерпретации на данном этапе не подлежат, нас интересуют только величины собственных значений.

Для определения числа факторов были предложены два критерия. Первый — критерий Кайзера: число факторов равно числу компонент, собственные значения которых больше 1.

Второй способ определения числа факторов — критерий отсеивания Р. Кеттелла (зсгее—1ез1), требует построения графика собственных значений

Рис. 16.2. График собственных значений для пяти показателей интеллекта

(компьютерные программы предлагают этот график при выборе метода главных компонент — зсгее р1о{). Количество факторов определяется приблизительно по точке перегиба на графике собственных значений до его выхода на пологую прямую после резкого спада. При этом проверяются три гипотезы: если К— точка перегиба, то возможное количество факторов равно К- 1, К\\ К+ 1.

По первому критерию (Кайзера) в нашем примере число факторов равно двум, так как первые два собственных значения больше 1. По второму критерию (Р. Кеттелла) — от двух до четырех, так как точке перегиба соответствует третья компонента (см. рис. 16.2).

При определении числа факторов на практике следует помнить, что указанные критерии являются лишь примерным ориентиром. Окончательное решение о числе факторов принимается только после интерпретации факторов.

Проблема общности

Это вторая главная проблема факторного анализа. Единичная дисперсия каждой переменной представлена в факторном анализе как сумма ее общности и характерности:

1 = И² + е²,

I I'

где к² — общность переменной с номером /'; е² — ее характерность.

Общность — это часть дисперсии переменной, обусловленная действием общих факторов. Характерность — часть ее дисперсии, обусловленная спецификой данной переменной и ошибками измерения. Иначе говоря, общность — это полный вклад всех факторов в единичную дисперсию переменной, а характерность — это разность полной единичной дисперсии переменной и ее общности. Общность переменной I равна сумме квадратов ее нагрузок по всем М факторам (по строке факторных нагрузок):

к=1

Полнота факторизации — важное понятие факторного анализа, вытекающее из определения общности. Любой элемент факторной структуры — факторная нагрузка переменной, возведенная в квадрат, — приобретает смысл доли дисперсии переменной, обусловленной данным фактором. Суммируя эти доли по строке, мы получаем общность — долю дисперсии переменной, обусловленную влиянием всех общих факторов.

Суммарная дисперсия всех переменных есть сумма единичных дисперсий всех признаков, что равно просто количеству признаков. Суммируя доли дисперсии всех переменных по одному фактору, мы получаем суммарную дисперсию всех переменных, обусловленную действием этого фактора. Разделив суммарную дисперсию, обусловленную действием данного фактора, на количество признаков, мы получим долю дисперсии, обусловленную данным фактором, или информативность (мощность) фактора. Сумма квадратов всех элементов факторной структуры — факторных нагрузок — равна сумме всех общностей и суммарной дисперсии всех переменных, обусловленной общими факторами. Эта величина, деленная на количество признаков, известна как полнота факторизации:

М 1 М 1 Р 1 М Р

к=1 ^г к=1 ^г 1=1 ^г к=М=1

где У_к — мощность фактора с номером к\ К_к — собственное число фактора с номером /; к} — общность переменной /; а}_к — вклад фактора / в переменную к\ М — число факторов; Р — число переменных.

Понятно, что качество факторного анализа тем выше, чем выше полнота факторизации. И эта величина является одним из важных показателей при выборе пользователем варианта решения, наряду с показателем того, насколько полно воспроизводятся коэффициенты корреляции. Надо отметить, что четких статистических критериев полноты факторизации не существует. Тем не менее, низкие ее значения, например меньше 0,7, свидетельствуют о желательности сокращения количества признаков или увеличения количества факторов.

Вообще говоря, проблема общностей заключается в том, что они, как и число общих факторов, не известны до начала анализа, но должны каким-то образом задаваться, так как величины факторных нагрузок зависят от величин общностей. Отметим, что в компонентном анализе этой проблемы не существует: общность каждой переменной равна 1, при условии выделения всех Р компонент. Различия в методах факторного анализа и определяются тем, как решается проблема общностей.

Методы факторного анализа

Методы факторного анализа — это различные способы получения факторной структуры при заданном числе факторов. Эти способы, как уже говорилось, отличаются решением проблемы общностей. Рассмотрим наиболее часто применяемые методы: анализ главных компонент, метод главных факторов, факторный анализ образов (общности равны квадрату КМК), метод не взвешенных наименьших квадратов, обобщенный метод наименьших квадратов и метод максимального правдоподобия.

Анализ главных компонент (Рппс1ра1 СотропеШз) иногда используется в качестве факторного анализа, хотя это и не вполне корректно. При использовании этого метода общность каждой переменной получается автоматически, путем суммирования квадратов ее нагрузок по всем главным компонентам. Вопрос о приближении восстановленных коэффициентов корреляции к исходным корреляциям не решается. В результате факторная структура искажается в сторону преувеличения абсолютных величин факторных нагрузок.

Факторный анализ образов (общности равны квадрату КМК) (1та§е Рас1о- пп§) — это метод главных компонент, применяемый к так называемой редуцированной корреляционной матрице, у которой вместо единиц на главной диагонали располагаются оценки общностей. Общность каждой переменной оценивается предварительно, как квадрат коэффициента множественной корреляции (КМК) этой переменной со всеми остальными. Такая оценка, с точки зрения теоретиков факторного анализа, приводит к более точным результатам, чем в анализе главных компонент. Но значения общностей недооцениваются, что также приводит к искажениям факторной структуры, хотя и меньшим, чем в предыдущем случае.

Метод главных осей (Рппс1ра1 Ахи Рас(опп§), позволяет получить более точное решение. На первом шаге общности вычисляются по методу главных компонент. На каждом последующем шаге собственные значения и факторные нагрузки вычисляются исходя из предыдущих значений общностей. Окончательное решение получается при выполнении заданного числа итераций или достижении минимальных различий между общностями на данном и предыдущем шагах.

Метод не взвешенных наименьших квадратов (ШшщШей 1еа$( хциагех) — минимизирует квадраты остатков (разностей) исходной и воспроизведенной корреляционных матриц (вне главной диагонали). На первом шаге оцениваются общности через квадрат КМК. Затем вычисляется факторная структура и восстанавливаются коэффициенты корреляции. Проверяется разность квадратов исходных и вычисленных корреляций. За новые значения общностей принимаются вычисленные по полученной факторной структуре. На втором шаге вычисляется новая факторная структура, и снова проверяется соответствие исходных и восстановленных коэффициентов корреляции. Процесс повторяется многократно до тех пор, пока не достигается минимально возможная разница между исходными и вычисленными корреляциями при заданном числе факторов. Метод, по определению, дает минимальные ошибки факторной структуры при фиксированном числе факторов. Реализация метода в компьютерных программах позволяет проверить расхождения между исходными и вычисленными корреляциями. Наличие многочисленных расхождений может служить дополнительным аргументом в пользу увеличения числа факторов.

Обобщенный метод наименьших квадратов (СепегаГцес! 1еаз1 хдиагех) — отличается от предыдущего тем, что для каждой переменной вводятся специальные весовые коэффициенты. Чем больше общность переменной, тем в большей степени она влияет на факторную структуру (имеет больший вес). Это соответствует основному принципу статистического оценивания, по которому менее точные наблюдения учитываются в меньшей степени. В этом — основное преимущество этого метода перед остальными.

Метод максимального правдоподобия (Махтит ИкеИНоой) также направлен на уменьшение разности исходных и вычисленных корреляций между признаками. Дополнительно этот метод позволяет получить важный показатель полноты факторизации — статистическую оценку «качества подгонки». Мерой качества является оценка различия исходных и вычисленных коэффициентов корреляции по х²-критерию, значимость которого определяется в зависимости от числа факторов и количества переменных. Если критерий показывает значимое отклонение при Л/-факторной модели, следует перейти к модели с М+1 факторами, и так до тех пор, пока отклонение исходных и вычисленных корреляций перестанет быть статистически значимым по ^-критерию. Таким образом, х²-критерий позволяет определить минимально допустимое количество факторов для данного числа переменных. Однако следует помнить, что этот критерий, как и остальные формальные критерии, является дополнительным. Окончательное же решение о числе факторов принимается после содержательной интерпретации факторной структуры.

Вряд ли возможно дать общие рекомендации о преимуществе или недостатке того или иного метода. Можно лишь отметить, что анализ главных компонент дает наиболее грубое решение, а метод максимального правдоподобия позволяет статистически оценить минимально возможное число факторов для данного набора переменных. По-видимому, в каждом конкретном случае стоит сравнивать результаты применения разных методов и выбирать тот, который позволяет получить наиболее простую и доступную интерпретации факторную структуру.

Проблема вращения и интерпретации

Это третья основная проблема факторного анализа, решение которой связано с геометрическим представлением факторной структуры. Необходимость решения этой проблемы обусловлена тем, что, как правило, результаты факторизации непосредственно не подлежат интерпретации. В то же время ценность результата факторного анализа определяется прежде всего возможностью его однозначной интерпретации.

Рассмотрим результат применения метода главных осей к данным о пяти показателях способностей. Из табл. 16.5 видно, что все переменные имеют наибольшие нагрузки по первому фактору, и невозможно определить, какие переменные идентифицируют второй фактор. То есть данная факторная структура не поддается интерпретации. Для ответа на вопрос о распределении пе-

Табл ица 16.5 Факторная структура пяти показателей способностей (метод главных осей, до вращения)

Переменные	Факторные нагрузки а,_к	Общность к!
	Ъ
	0,807	-0,482	0,88
	0,774	-0,481	0,83
	0,661	0,416	0,61
	0,580	0,470	0,56
	0,675	0,317	0,56
Собственное значение \_к	2,478	0,959	3,44
Доля дисперсии	0,496	0,192	0,69

ременных по факторам и необходимо решить проблему вращения факторов относительно признаков.

Факторную структуру графически можно представить в виде точек-признаков в пространстве М факторов. Положение каждой точки задается факторными нагрузками как координатами этой точки по соответствующим осям- факторам. Для нашего примера такое графическое изображение факторной структуры представлено на рис. 16.3.

Рис. 16.3. График пяти показателей интеллекта в осях двух факторов до вращения Фактор 1

0,6" 0,4- 0,2-

-0,2- -0,4- -0,6-

смо.

Расстояние каждой точки от начала координат или длина вектора-пере- менной равны сумме квадратов всех координат этой точки (конца вектора- переменной). Поскольку координаты — это факторные нагрузки, то длина каждого вектора равна общности соответствующей переменной.

Без доказательства укажем, что коэффициент корреляции между каждой парой переменных равен косинусу угла между соответствующими векторами в пространстве общих факторов. Иначе говоря, чем выше корреляция, тем меньше угол между соответствующими переменными.

Указанные соотношения между переменными в осях факторов никак не изменятся, если мы повернем оси факторов на любой угол относительно переменных, при условии соблюдения взаимной ортогональности (перпендикулярности) факторов. Из этого следует вывод, что мы можем поворачивать факторы относительно переменных как угодно, соблюдая ортогональность факторов. При этом наиболее предпочтительно, чтобы каждая переменная в результате вращения оказалась вблизи оси фактора, иными словами, имела бы максимальную нагрузку по одному фактору и минимальные — по всем остальным. Только в этом случае каждая переменная будет соотнесена только с одним фактором, что и требуется для интерпретации факторной структуры.

Каждая переменная имеет большую нагрузку только по одному из факторов

В нашем примере (рис. 16.3) желателен поворот осей факторов по часовой стрелке так, чтобы фактор 1 прошел вблизи переменных 1 и 2, а фактор 2 — вблизи переменных 3—5. Решение, при котором каждая переменная имеет большую нагрузку только по одному фактору, а по остальным ее нагрузки близки к нулю, называется простой структурой.

На заре появления многофакторного анализа проблема вращения решалась графически. Чертились графики факторной структуры — по одному для каждой пары факторов. Затем делали графический поворот осей факторов относительно переменных, после чего линейкой измеряли новые проекции переменных на эти оси. Таким образом получали факторную структуру после вращения.

В настоящее время используются аналитические способы вращения, реализованные во всех компьютерных программах факторного анализа. Работа аналитических методов подобна геометрическому вращению «вручную». Каждая пара факторов поворачивается относительно переменных до тех пор, пока не достигается наиболее возможная простота структуры. В одних случаях критерием простоты является факторная сложность переменных (квартимакс), в других — индекс сложности каждого фактора (варимакс), где факторная сложность переменной пропорциональна числу общих факторов, связанных с ней, а индекс сложности фактора пропорционален числу переменных, с ним связанных. Наиболее широко применяется вращение, где на каждом шаге простота структуры определяется по критерию варимакс Г. Кайзера — вари- макс-вращение.

Результат применения варимакс-вращения к факторной структуре из табл. 16.5 представлен в табл. 16.6; графический результат — на рис. 16.4.

0,80" 0,70" 0,60- 0,50- см о. 0,40" & В 0.30- 0,20- 0,10- 0,00-

0,00 0,20 0,40 0,60 0,80 1,00 Фактор 1 Рис. 16.4. Факторная структура пяти показателей интеллекта после варимакс-вращения

После вращения каждая переменная имеет большую нагрузку только по одному фактору. Следовательно, каждый фактор может быть однозначно интерпретирован через входящие в него переменные: фактор 1 — по признакам 1 и 2, фактор 2 — по признакам 3 и 5. Так как переменная 1 — счет в уме, переменная 2 — числовые ряды, то фактор 1 может быть идентифицирован как «арифметические способности». Переменные, входящие в фактор 2 (осведомленность, словарный запас, сходство), позволяют интерпретировать его как фактор словесного понимания.

Таб л и ца 16.6 Факторная структура пяти показателей интеллекта после варимакс-вращения

Переменные		Рг	И^{^[18]}
	0,921	0,217	0,88
	0,903	0,193	0,83
	0,183	0,757	0,61
	0,088	0,739	0,56
	0,260	0,700	0,56
СКН*	1,773	1,694	3,44
Доля дисперсии	0,355	0,339	0,69

* СКН — сумма квадратов факторных нагрузок¹

Проблема оценки значений факторов

После интерпретации факторной структуры допустима оценка значений факторов для объектов. Это позволяет перейти от множества исходных переменных к существенно меньшему числу факторов как новых переменных. Это может понадобиться исследователю как для более компактного представления различий между объектами (или их группами), так и для дальнейшего анализа — регрессионного, дисперсионного и т. д. В этом смысле факторный анализ как общенаучный метод выполняет задачу сокращения размерности набора переменных с минимальными потерями исходной информации.

В качестве оценки значения фактора / для объекта к используется линейная

комбинация значений исходных переменных X.

■4 = ЕР/Л* =Р|/*1* ⁺Р2/*2* + - + РР1^ХРк , (16.6)

У=1

где/_!к — значение фактора с номером / для объекта к; Хд — значение признака с номером у для этого объекта; (3,^ — факторный коэффициент признака у для фактора /.

Поскольку известны корреляции между исходными переменными и корреляции этих переменных с факторами (факторные нагрузки), то в качестве наиболее состоятельной оценки факторных коэффициентов чаще всего выступают коэффициенты множественной регрессии. В качестве «зависимой» переменной выступает фактор, в качестве «независимых» — исходные переменные, а вычисления производятся по формуле 15.3.

Вычисленные по модели множественной регрессии оценки факторных коэффициентов далее используются для вычисления всех оценок значений факторов для каждого объекта по формуле 16.6. Таким образом, исследователь переходит от множества Р переменных к небольшому числу М новых переменных-факторов, интерпретируемых через исходные переменные. Отметим, что средние значения каждой такой новой переменной для всех объектов равно 0, а стандартное отклонение близко (но меньше) 1.

Проблема оценки значений факторов связана с тем, что невозможно точно выразить общий фактор через исходные переменные, так как каждая из этих переменных содержит помимо общности и характерную часть, которую невозможно отделить. Поэтому можно получить лишь оценку значений факторов по исходным переменным, надежность которой обладает большей или меньшей определенностью — в зависимости от вида исходных данных и факторной структуры.

Зависимость надежности факторных оценок от факторной структуры выражается в следующем. Чем меньше суммарная общность всех переменных, тем меньше надежность факторных оценок всех факторов. Чем меньше информативность фактора (сумма квадратов факторных нагрузок по столбцу), тем меньше надежность факторных оценок данного фактора.

В связи с надежностью факторных оценок особое значение приобретает качество измерения исходных переменных. Чем больше исходные переменные соответствуют требованиям, которые предъявляются к метрическим переменным, тем надежнее факторные оценки. Если переменные измерены в порядковой или, тем более, в дихотомической шкале, то надежность факторных оценок снижается до непредсказуемого уровня. Тем не менее, некоторые авторы (см. К. Иберла, 1980) на основе факторного моделирования доказывают, что в случае исходных порядковых и даже дихотомических данных факторные оценки могут быть состоятельными. Условиями состоятельности факторных оценок являются действительно простая факторная структура, а также высокие значения общностей и факторных нагрузок переменных.

В заключение обзора математико-статистических идей факторного анализа заметим, что современный факторный анализ — изящная математическая процедура, имеющая достаточное статистическое обоснование. Это выгодно отличает данный метод от остальных. Эта изящность, наряду с исходным психологическим обоснованием, однако, часто вводит в заблуждение новичка, ожидающего получить «готовый ответ» в результате применения факторного анализа. Необходимо помнить, что факторный анализ не добавляет никакой новой информации к эмпирическим данным. Его задача — в обеспечении возможности интерпретировать данные. Качество же интерпретации целиком зависит от исследователя, оттого, насколько и как он понимает исходные измерения, основы и процедуру факторного анализа.

ПОСЛЕДОВАТЕЛЬНОСТЬ ФАКТОРНОГО АНАЛИЗА

Особенность факторного анализа заключается в неопределенности решения его основных проблем, изложенных в предыдущем параграфе. Нет четких критериев качества их решения, есть лишь рекомендации, которыми руководствуется исследователь в своем стремлении содержательно интерпретировать получаемые результаты. Поэтому факторный анализ — это пошаговая процедура, где на каждом шаге исследователь принимает решение о дальнейших преобразованиях данных. Главным же ориентиром на этом пути остается возможность получения содержательной интерпретации конечных результатов.

Весь процесс факторного анализа можно представить как выполнение шести этапов:

1. Выбор исходных данных.

2. Предварительное решение проблемы числа факторов.

3. Факторизация матрицы интеркорреляций.

4. Вращение факторов и их предварительная интерпретация.

5. Принятие решения о качестве факторной структуры.

6. Вычисление факторных коэффициентов и оценок.

Исследователь, в зависимости от своих целей, решает, сколько раз повторить эту последовательность, какие из этапов будут пропущены и насколько глубоко будет проработан каждый из них. Например, если исследователя интересует только структура взаимосвязей признаков, то достаточно выполнить эту последовательность один раз, без последнего этапа.

Этап 1. Выбор исходных данных

Модель факторного анализа разрабатывалась для метрических данных. Поэтому первое требование к исходным данным — представление всех признаков в метрической шкале (не обязательно с одинаковыми средними и дисперсиями).

Включение в анализ порядковых или бинарных данных допустимо, но исследователь должен отдавать себе отчет, что искажения факторной структуры при этом будут соответствовать искажениям коэффициентов корреляций, и характер этих искажений неизвестен. В общем случае желательно перейти к единой шкале для всех признаков, либо ранговой, либо бинарной, затем вычислять матрицу интеркорреляций, выбирая соответствующие меры взаимосвязи. Исследователь потеряет при этом существенную долю исходной информации. А о допустимости дальнейшего вычисления значений факторных коэффициентов и оценок для объектов известно мало. Можно лишь сказать, что достоверность и ценность конечного результата обратно пропорциональны доле потерянной исходной информации.

Если цель факторного анализа заключается только в определении структуры взаимосвязей переменных, то допустимо применение порядковых данных, но перед проведением факторного анализа необходимо перейти к рангам по каждой переменной. Допустимо также использовать факторный анализ в отношении дихотомических переменных, если задача ограничивается определением структуры взаимосвязей и дихотомические корреляции между переменными не очень велики (не превышают 0,7)'.

Порядковые и даже дихотомические данные могут использоваться для вычисления оценок факторов, но при условии действительно простой факторной структуры, высоких значениях общностей и факторных нагрузок переменных, определяющих каждый фактор (К. Иберла, 1980). При этом желательно проверять устойчивость факторной структуры на параллельных выборках.

Как и в других многомерных методах, недопустимы функциональные зависимости между переменными и корреляции, близкие к единице.

Количественное соотношение признаков и объектов зависит от целей исследования. Если цель анализа — изучение структуры взаимосвязей признаков, уменьшение их исходного количества путем перехода к новым переменным — факторам, то строгих ограничений нет. Желательно лишь, чтобы количество признаков было не меньше количества объектов. Если исследователь хочет обнаружить и обосновать наличие факторов за взаимосвязями переменных, то желательно иметь в три раза больше объектов, чем признаков. Данное соотношение может сложиться и в процессе анализа — при отсеивании мало информативных переменных. Если же стоит задача обоснования выявленной факторной структуры для генеральной совокупности, то объектов должно быть еще больше, для проверки устойчивости этой структуры на параллельных выборках.

Этап 2. Решение проблемы числа факторов

На этом этапе матрица интеркорреляций исходных признаков обрабатывается с использованием анализа главных компонент. Применяется критерий отсеивания Р. Кеттелла и критерий Кайзера — величины собственного значения фактора, большего 1 (ЕщепуаЬе, X > 1). Эти критерии не являются жесткими, поэтому далее проверяется несколько гипотез о числе факторов. Начинать при этом рекомендуется с максимально возможного числа факторов, с учетом обоих критериев, постепенно уменьшая их число.

Этап 3. Факторизация матрицы интеркорреляций

Выбирается метод факторизации, желательно — главных осей, наименьших квадратов или максимального правдоподобия. Задается число факторов, в соответствии с проверяемой гипотезой. Результатом данного этапа является матрица факторных нагрузок (факторная структура) до вращения, которая не подлежит интерпретации.

Полезной информацией на этом этапе могут являться суммарная доля дисперсии (информативность) факторов и значения общностей переменных. Суммарная доля дисперсии — показатель того, насколько полно выделяемые факторы могут представить данный набор признаков, а этот набор — выделяемые факторы. Общность переменной — показатель ее «участия» в факторном анализе, насколько она влияет на факторную структуру. Переменные с наименьшими общностями — ближайшие кандидаты на исключение из анализа в дальнейшем.

Этап 4. Вращение факторов и их предварительная интерпретация

На этом этапе выбирается один из аналитических методов вращения факторов, обычно — варимакс-вращение (Уапшах погшайгес!). Существуют и другие методы вращения, в том числе косоугольного, но они выходят за рамки нашего рассмотрения. В результате вращения достигается факторная структура, наиболее доступная для интерпретации при данном соотношении переменных и факторов.

Интерпретация факторов производится по таблице факторных нагрузок после вращения в следующем порядке. По каждой переменной (строке) выделяется наибольшая по абсолютной величине нагрузка — как доминирующая. Если вторая по величине нагрузка в строке отличается от уже выделенной менее чем на 0,2, то и она выделяется, но как второстепенная. После просмотра всех строк — переменных, начинают просмотр столбцов — факторов. По каждому фактору выписывают наименования (обозначения) переменных, имеющих наибольшие нагрузки по этому фактору — выделенных на предыдущем шаге. При этом обязательно учитывается знак факторной нагрузки переменной. Если знак отрицательный, это отмечается как противоположный полюс переменной. После такого просмотра всех факторов каждому из них присваивается наименование, обобщающее по смыслу включенные в него переменные. Если трудно подобрать термин из соответствующей теории, допускается наименование фактора по имени переменной, имеющей по сравнению с другими наибольшую нагрузку по этому фактору.

Этап 5. Принятие решения о качестве факторной структуры

Формальное требование к факторной структуре сформулировал Л. Терстоун еще в 1930-х годах, назвав его принципом простой структуры. Геометрически принцип простой структуры означает, что все переменные располагаются на осях факторов, то есть каждая переменная имеет близкие к нулю нагрузки по всем факторам, кроме одного. На практике достижение такого результата с первого раза маловероятно, но качество факторной структуры определяется степенью приближения к простой структуре.

Следует отметить общий принцип соотношения качества факторной структуры и качества исходных данных: чем ниже качество исходных данных в смысле требований, предъявляемых к метрическим переменным, тем выше требования к простоте факторной структуры, величине общностей и факторных нагрузок.

В настоящее время не существует формальных критериев соответствия факторной структуры простой. Поэтому основным критерием остается возможность хорошей содержательной интерпретации каждого фактора по двум и более исходным переменным. Если перед исследователем стоит дополнительно проблема обоснования устойчивости (воспроизводимости) факторной структуры в генеральной совокупности, то добавляется требование однозначного соотнесения каждой переменной с одним из факторов. Это требование означает, что каждая переменная имеет большую по абсолютной величине нагрузку (0,7 и выше) только по одному фактору и малые (0,2 и менее) — по всем остальным.

Можно предложить способы максимального приближения к простой структуре путем пошагового сокращения числа факторов и переменных.

1. Если по результатам интерпретации выявлен фактор, по которому ни одна из переменных не получила максимальной нагрузки (по строке), то это свидетельствует о необходимости сокращения количества факторов на один и повторения этапов 3 и 4 с новым числом факторов. То же касается фактора, идентифицируемого лишь по одной переменной, когда остальные в него не попадают даже с второстепенными нагрузками.

2. Определяются неоднозначные переменные. Каждая такая переменная имеет примерно одинаковые по абсолютной величине максимальные нагрузки по двум и более факторам. Если обосновывается устойчивость факторной структуры, то неоднозначной является переменная, у которой между максимальной и следующей за ней по величине нагрузкой разность менее 0,5. Неоднозначные переменные поочередно удаляются из числа исходных переменных, и каждый раз повторяются этапы 3 и 4.

Очевидно, что приближение к простой структуре связано с невосполнимой потерей исходной эмпирической информации. И каждый раз исследователь должен решать, насколько целесообразна эта потеря в свете стоящих перед ним задач. Наиболее жестки требования к простой структуре в случае обоснования устойчивости и воспроизводимости факторов, например, при разработке теста или факторной теоретической модели. Гораздо мягче требования при решении наиболее часто встречающихся задач — при изучении структуры взаимосвязей или при сокращении исходного набора признаков для дальнейшего исследования, например, различий между группами объектов.

Этап 6. Вычисление факторных коэффициентов и оценок

Это заключительный, наиболее однозначный и простой этап факторного анализа.

Оценки факторных коэффициентов являются коэффициентами линейного уравнения, связывающего значение фактора и значения исходных переменных. Они показывают, с каким весом входят исходные значения каждой переменной в оценку фактора. Факторные коэффициенты можно использовать для вычисления факторных оценок для новых объектов, не включенных ранее в факторный анализ.

Факторные оценки — значения факторов для каждого объекта (испытуемого). Их получение чаще всего и является конечным результатом факторного анализа. Вычисленные оценки факторов, как новые переменные, являются независимыми, отражающими реальную структуру взаимосвязей исходных признаков и наиболее полно передающими исходную эмпирическую информацию. В этом факторные оценки выгодно отличаются от других способов интегрирования исходных данных, например от простого суммирования пунктов теста или анкеты в шкалы.

ПРИМЕР 16.2_____________________________________________________________________________________

До широкого распространения персональных компьютеров полновесный факторный анализ был экзотической, весьма трудоемкой многоэтапной процедурой, когда очередной шаг исследователь выбирает по результатам выполнения предыдущих этапов. В настоящее время можно контролировать процесс факторного анализа без «посредников» (программиста, операторов), пользуясь современным программным обеспечением. Для этого не нужны знания программиста и математика, достаточны осведомленность в основных математико-статистических идеях метода и умение «читать» промежуточные и конечные результаты факторного анализа. При этом факторный анализ может быть рекомендован для решения очень широкого круга не только исследовательских, но и практических задач. Перечислим некоторые из них.

1. Факторный анализ как инструмент интерпретации позволяет быстро выделить группировки (кластеры) взаимосвязанных переменных, решая проблемы корреляционного анализа: наличия множества переменных и множества статистических проверок.

2. Факторный анализ как альтернатива простого суммирования значений исходных переменных позволяет учитывать реальную структуру данных и избегать излишних потерь драгоценной исходной информации. Затраты времени и сил на такую обработку данных при помощи факторного анализа часто меньше, чем при суммировании баллов «вручную». При этом выигрыш весьма ощутим — в детальности и корректности получаемых результатов.

3. Как подготовительный этап для прогнозирования факторный анализ позволяет получить некоррелированные интегральные переменные (факторы), наиболее пригодные для применения в регрессионном или дискриминантном анализе.

Не нашли, что искали? Воспользуйтесь поиском по сайту: