Сделай Сам Свою Работу на 5

Факторная структура в общем виде





(М — число факторов, Р — число переменных)

    к   м кг
«11 а12   «14   а к]
«21 а22   а   а к]
               
Я/1 ап   «,*   «»/ к)
               
Р аР[ ап   аРк   арм к}
X X, Х2   К      

 

Алгоритм факторного анализа обеспечивает максимально возможное при­ближение вычисленных, или восстановленных, коэффициентов корреляции к исходным корреляциям. Это достигается варьированием числа факторов и диагональными элементами корреляционной матрицы, на которых распола­гаются не единицы, как в компонентном анализе, а значения общностей.

Проблема числа факторов

Это первая проблема при проведении факторного анализа. Обычно зара­нее не известно, сколько факторов необходимо и достаточно для представле­ния данного набора переменных. Сама же процедура факторного анализа предполагает предварительное задание числа факторов. Поэтому исследова­тель должен заранее определить или оценить их возможное количество. Для этого на первом этапе факторного анализа обычно применяют анализ глав­ных компонент и используют график собственных значений (Зсгее р1о1).



На рис. 16.2 представлен график собственных значений для компонент из табл. 16.3. Компонентные нагрузки интерпретации на данном этапе не под­лежат, нас интересуют только величины собственных значений.

Для определения числа факторов были предложены два критерия. Пер­вый — критерий Кайзера: число факторов равно числу компонент, собственные значения которых больше 1.

Второй способ определения числа факторов — критерий отсеивания Р. Кеттелла (зсгее—1ез1), требует построения графика собственных значений

Рис. 16.2. График собственных значений для пяти показателей интеллекта

 

(компьютерные программы предлагают этот график при выборе метода глав­ных компонент — зсгее р1о{). Количество факторов определяется приблизи­тельно по точке перегиба на графике собственных значений до его выхода на по­логую прямую после резкого спада. При этом проверяются три гипотезы: если К— точка перегиба, то возможное количество факторов равно К- 1, К\\ К+ 1.



По первому критерию (Кайзера) в нашем примере число факторов равно двум, так как первые два собственных значения больше 1. По второму крите­рию (Р. Кеттелла) — от двух до четырех, так как точке перегиба соответствует третья компонента (см. рис. 16.2).

При определении числа факторов на практике следует помнить, что ука­занные критерии являются лишь примерным ориентиром. Окончательное ре­шение о числе факторов принимается только после интерпретации факторов.

Проблема общности

Это вторая главная проблема факторного анализа. Единичная дисперсия каждой переменной представлена в факторном анализе как сумма ее общно­сти и характерности:

1 = И2 + е2,

I I'

где к2 — общность переменной с номером /'; е2 — ее характерность.

Общность — это часть дисперсии переменной, обусловленная действием общих факторов. Характерность — часть ее дисперсии, обусловленная специ­фикой данной переменной и ошибками измерения. Иначе говоря, общность — это полный вклад всех факторов в единичную дисперсию переменной, а ха­рактерность — это разность полной единичной дисперсии переменной и ее общности. Общность переменной I равна сумме квадратов ее нагрузок по всем М факторам (по строке факторных нагрузок):

м

к=1

Полнота факторизации — важное понятие факторного анализа, вытекаю­щее из определения общности. Любой элемент факторной структуры — фак­торная нагрузка переменной, возведенная в квадрат, — приобретает смысл доли дисперсии переменной, обусловленной данным фактором. Суммируя эти доли по строке, мы получаем общность — долю дисперсии переменной, обусловленную влиянием всех общих факторов.



Суммарная дисперсия всех переменных есть сумма единичных дисперсий всех признаков, что равно просто количеству признаков. Суммируя доли дис­персии всех переменных по одному фактору, мы получаем суммарную дис­персию всех переменных, обусловленную действием этого фактора. Разделив суммарную дисперсию, обусловленную действием данного фактора, на ко­личество признаков, мы получим долю дисперсии, обусловленную данным фактором, или информативность (мощность) фактора. Сумма квадратов всех элементов факторной структуры — факторных нагрузок — равна сумме всех общностей и суммарной дисперсии всех переменных, обусловленной общи­ми факторами. Эта величина, деленная на количество признаков, известна как полнота факторизации:

М 1 М 1 Р 1 М Р

к=1 г к=1 г 1=1 г к=М=1

где Ук — мощность фактора с номером к\ Кк — собственное число фактора с номером /; к} — общность переменной /; а}к — вклад фактора / в переменную к\ М — число факторов; Р — число переменных.

Понятно, что качество факторного анализа тем выше, чем выше полнота факторизации. И эта величина является одним из важных показателей при выборе пользователем варианта решения, наряду с показателем того, насколь­ко полно воспроизводятся коэффициенты корреляции. Надо отметить, что четких статистических критериев полноты факторизации не существует. Тем не менее, низкие ее значения, например меньше 0,7, свидетельствуют о же­лательности сокращения количества признаков или увеличения количества факторов.

Вообще говоря, проблема общностей заключается в том, что они, как и число общих факторов, не известны до начала анализа, но должны каким-то обра­зом задаваться, так как величины факторных нагрузок зависят от величин общностей. Отметим, что в компонентном анализе этой проблемы не суще­ствует: общность каждой переменной равна 1, при условии выделения всех Р компонент. Различия в методах факторного анализа и определяются тем, как решается проблема общностей.

Методы факторного анализа

Методы факторного анализа — это различные способы получения фак­торной структуры при заданном числе факторов. Эти способы, как уже гово­рилось, отличаются решением проблемы общностей. Рассмотрим наиболее часто применяемые методы: анализ главных компонент, метод главных фак­торов, факторный анализ образов (общности равны квадрату КМК), метод не взвешенных наименьших квадратов, обобщенный метод наименьших квад­ратов и метод максимального правдоподобия.

Анализ главных компонент (Рппс1ра1 СотропеШз) иногда используется в ка­честве факторного анализа, хотя это и не вполне корректно. При использова­нии этого метода общность каждой переменной получается автоматически, путем суммирования квадратов ее нагрузок по всем главным компонентам. Вопрос о приближении восстановленных коэффициентов корреляции к ис­ходным корреляциям не решается. В результате факторная структура иска­жается в сторону преувеличения абсолютных величин факторных нагрузок.

Факторный анализ образов (общности равны квадрату КМК) (1та§е Рас1о- пп§) — это метод главных компонент, применяемый к так называемой реду­цированной корреляционной матрице, у которой вместо единиц на главной диагонали располагаются оценки общностей. Общность каждой переменной оценивается предварительно, как квадрат коэффициента множественной корреляции (КМК) этой переменной со всеми остальными. Такая оценка, с точки зрения теоретиков факторного анализа, приводит к более точным ре­зультатам, чем в анализе главных компонент. Но значения общностей недо­оцениваются, что также приводит к искажениям факторной структуры, хотя и меньшим, чем в предыдущем случае.

Метод главных осей (Рппс1ра1 Ахи Рас(опп§), позволяет получить более точ­ное решение. На первом шаге общности вычисляются по методу главных ком­понент. На каждом последующем шаге собственные значения и факторные нагрузки вычисляются исходя из предыдущих значений общностей. Оконча­тельное решение получается при выполнении заданного числа итераций или достижении минимальных различий между общностями на данном и преды­дущем шагах.

Метод не взвешенных наименьших квадратов (ШшщШей 1еа$( хциагех) — минимизирует квадраты остатков (разностей) исходной и воспроизведенной корреляционных матриц (вне главной диагонали). На первом шаге оценива­ются общности через квадрат КМК. Затем вычисляется факторная структура и восстанавливаются коэффициенты корреляции. Проверяется разность квад­ратов исходных и вычисленных корреляций. За новые значения общностей принимаются вычисленные по полученной факторной структуре. На втором шаге вычисляется новая факторная структура, и снова проверяется соответ­ствие исходных и восстановленных коэффициентов корреляции. Процесс повторяется многократно до тех пор, пока не достигается минимально воз­можная разница между исходными и вычисленными корреляциями при за­данном числе факторов. Метод, по определению, дает минимальные ошибки факторной структуры при фиксированном числе факторов. Реализация ме­тода в компьютерных программах позволяет проверить расхождения между исходными и вычисленными корреляциями. Наличие многочисленных рас­хождений может служить дополнительным аргументом в пользу увеличения числа факторов.


Обобщенный метод наименьших квадратов (СепегаГцес! 1еаз1 хдиагех) — отли­чается от предыдущего тем, что для каждой переменной вводятся специаль­ные весовые коэффициенты. Чем больше общность переменной, тем в боль­шей степени она влияет на факторную структуру (имеет больший вес). Это соответствует основному принципу статистического оценивания, по которо­му менее точные наблюдения учитываются в меньшей степени. В этом — ос­новное преимущество этого метода перед остальными.

Метод максимального правдоподобия (Махтит ИкеИНоой) также направлен на уменьшение разности исходных и вычисленных корреляций между при­знаками. Дополнительно этот метод позволяет получить важный показатель полноты факторизации — статистическую оценку «качества подгонки». Ме­рой качества является оценка различия исходных и вычисленных коэффици­ентов корреляции по х2-критерию, значимость которого определяется в за­висимости от числа факторов и количества переменных. Если критерий показывает значимое отклонение при Л/-факторной модели, следует перейти к модели с М+1 факторами, и так до тех пор, пока отклонение исходных и вы­численных корреляций перестанет быть статистически значимым по ^-кри­терию. Таким образом, х2-критерий позволяет определить минимально допу­стимое количество факторов для данного числа переменных. Однако следует помнить, что этот критерий, как и остальные формальные критерии, являет­ся дополнительным. Окончательное же решение о числе факторов принима­ется после содержательной интерпретации факторной структуры.

Вряд ли возможно дать общие рекомендации о преимуществе или недо­статке того или иного метода. Можно лишь отметить, что анализ главных ком­понент дает наиболее грубое решение, а метод максимального правдоподо­бия позволяет статистически оценить минимально возможное число факторов для данного набора переменных. По-видимому, в каждом конкретном случае стоит сравнивать результаты применения разных методов и выбирать тот, ко­торый позволяет получить наиболее простую и доступную интерпретации факторную структуру.

Проблема вращения и интерпретации

Это третья основная проблема факторного анализа, решение которой свя­зано с геометрическим представлением факторной структуры. Необходимость решения этой проблемы обусловлена тем, что, как правило, результаты фак­торизации непосредственно не подлежат интерпретации. В то же время цен­ность результата факторного анализа определяется прежде всего возможно­стью его однозначной интерпретации.

Рассмотрим результат применения метода главных осей к данным о пяти показателях способностей. Из табл. 16.5 видно, что все переменные имеют наибольшие нагрузки по первому фактору, и невозможно определить, какие переменные идентифицируют второй фактор. То есть данная факторная струк­тура не поддается интерпретации. Для ответа на вопрос о распределении пе-

Табл ица 16.5 Факторная структура пяти показателей способностей (метод главных осей, до вращения)
Переменные Факторные нагрузки а,к Общность к!
  Ъ    
0,807 -0,482 0,88
0,774 -0,481 0,83
0,661 0,416 0,61
0,580 0,470 0,56
0,675 0,317 0,56
Собственное значение \к 2,478 0,959 3,44
Доля дисперсии 0,496 0,192 0,69

 

ременных по факторам и необходимо решить проблему вращения факторов относительно признаков.

Факторную структуру графически можно представить в виде точек-при­знаков в пространстве М факторов. Положение каждой точки задается фак­торными нагрузками как координатами этой точки по соответствующим осям- факторам. Для нашего примера такое графическое изображение факторной структуры представлено на рис. 16.3.

Рис. 16.3. График пяти показателей интеллекта в осях двух факторов до вращения Фактор 1

0,6" 0,4- 0,2-

-0,2- -0,4- -0,6-

смо.

Расстояние каждой точки от начала координат или длина вектора-пере- менной равны сумме квадратов всех координат этой точки (конца вектора- переменной). Поскольку координаты — это факторные нагрузки, то длина каждого вектора равна общности соответствующей переменной.

Без доказательства укажем, что коэффициент корреляции между каждой парой переменных равен косинусу угла между соответствующими векторами в пространстве общих факторов. Иначе говоря, чем выше корреляция, тем мень­ше угол между соответствующими переменными.

Указанные соотношения между переменными в осях факторов никак не изменятся, если мы повернем оси факторов на любой угол относительно пе­ременных, при условии соблюдения взаимной ортогональности (перпенди­кулярности) факторов. Из этого следует вывод, что мы можем поворачивать факторы относительно переменных как угодно, соблюдая ортогональность факторов. При этом наиболее предпочтительно, чтобы каждая переменная в результате вращения оказалась вблизи оси фактора, иными словами, имела бы максимальную нагрузку по одному фактору и минимальные — по всем остальным. Только в этом случае каж­дая переменная будет соотнесена только с одним фактором, что и тре­буется для интерпретации факторной структуры.

Каждая переменная имеет большую нагрузку только по одному из факторов

В нашем примере (рис. 16.3) жела­телен поворот осей факторов по часовой стрелке так, чтобы фактор 1 прошел вблизи переменных 1 и 2, а фактор 2 — вблизи переменных 3—5. Решение, при котором каждая переменная имеет большую нагрузку только по одному факто­ру, а по остальным ее нагрузки близки к нулю, называется простой структурой.

На заре появления многофакторного анализа проблема вращения решалась графически. Чертились графики факторной структуры — по одному для каж­дой пары факторов. Затем делали графический поворот осей факторов относи­тельно переменных, после чего линейкой измеряли новые проекции перемен­ных на эти оси. Таким образом получали факторную структуру после вращения.

В настоящее время используются аналитические способы вращения, реа­лизованные во всех компьютерных программах факторного анализа. Работа аналитических методов подобна геометрическому вращению «вручную». Каж­дая пара факторов поворачивается относительно переменных до тех пор, пока не достигается наиболее возможная простота структуры. В одних случаях кри­терием простоты является факторная сложность переменных (квартимакс), в других — индекс сложности каждого фактора (варимакс), где факторная слож­ность переменной пропорциональна числу общих факторов, связанных с ней, а индекс сложности фактора пропорционален числу переменных, с ним связанных. Наиболее широко применяется вращение, где на каждом шаге простота структуры определяется по критерию варимакс Г. Кайзера — вари- макс-вращение.

Результат применения варимакс-вращения к факторной структуре из табл. 16.5 представлен в табл. 16.6; графический результат — на рис. 16.4.


0,80" 0,70" 0,60- 0,50- см о. 0,40" & В 0.30- 0,20- 0,10- 0,00-
0,00 0,20 0,40 0,60 0,80 1,00 Фактор 1 Рис. 16.4. Факторная структура пяти показателей интеллекта после варимакс-вращения

После вращения каждая переменная имеет большую нагрузку только по одному фактору. Следовательно, каждый фактор может быть однозначно ин­терпретирован через входящие в него переменные: фактор 1 — по признакам 1 и 2, фактор 2 — по признакам 3 и 5. Так как переменная 1 — счет в уме, переменная 2 — числовые ряды, то фактор 1 может быть идентифицирован как «арифметические способности». Переменные, входящие в фактор 2 (ос­ведомленность, словарный запас, сходство), позволяют интерпретировать его как фактор словесного понимания.

Таб л и ца 16.6 Факторная структура пяти показателей интеллекта после варимакс-вращения
Переменные   Рг И[18]
0,921 0,217 0,88
0,903 0,193 0,83
0,183 0,757 0,61
0,088 0,739 0,56
0,260 0,700 0,56
СКН* 1,773 1,694 3,44
Доля дисперсии 0,355 0,339 0,69

* СКН — сумма квадратов факторных нагрузок1

 

Проблема оценки значений факторов

После интерпретации факторной структуры допустима оценка значений факторов для объектов. Это позволяет перейти от множества исходных пере­менных к существенно меньшему числу факторов как новых переменных. Это может понадобиться исследователю как для более компактного представле­ния различий между объектами (или их группами), так и для дальнейшего анализа — регрессионного, дисперсионного и т. д. В этом смысле факторный анализ как общенаучный метод выполняет задачу сокращения размерности набора переменных с минимальными потерями исходной информации.

В качестве оценки значения фактора / для объекта к используется линейная

комбинация значений исходных переменных X.

р

■4 = ЕР/Л* =Р|/*1* +Р2/*2* + - + РР1ХРк , (16.6)

У=1

где/ — значение фактора с номером / для объекта к; Хд — значение признака с номером у для этого объекта; (3,^ — факторный коэффициент признака у для фактора /.

Поскольку известны корреляции между исходными переменными и кор­реляции этих переменных с факторами (факторные нагрузки), то в качестве наиболее состоятельной оценки факторных коэффициентов чаще всего вы­ступают коэффициенты множественной регрессии. В качестве «зависимой» пе­ременной выступает фактор, в качестве «независимых» — исходные перемен­ные, а вычисления производятся по формуле 15.3.

Вычисленные по модели множественной регрессии оценки факторных коэффициентов далее используются для вычисления всех оценок значений факторов для каждого объекта по формуле 16.6. Таким образом, исследова­тель переходит от множества Р переменных к небольшому числу М новых переменных-факторов, интерпретируемых через исходные переменные. От­метим, что средние значения каждой такой новой переменной для всех объек­тов равно 0, а стандартное отклонение близко (но меньше) 1.

Проблема оценки значений факторов связана с тем, что невозможно точно выразить общий фактор через исходные переменные, так как каждая из этих переменных содержит помимо общности и характерную часть, которую не­возможно отделить. Поэтому можно получить лишь оценку значений факто­ров по исходным переменным, надежность которой обладает большей или меньшей определенностью — в зависимости от вида исходных данных и фак­торной структуры.

Зависимость надежности факторных оценок от факторной структуры вы­ражается в следующем. Чем меньше суммарная общность всех переменных, тем меньше надежность факторных оценок всех факторов. Чем меньше ин­формативность фактора (сумма квадратов факторных нагрузок по столбцу), тем меньше надежность факторных оценок данного фактора.

В связи с надежностью факторных оценок особое значение приобретает качество измерения исходных переменных. Чем больше исходные переменные соответствуют требованиям, которые предъявляются к метрическим перемен­ным, тем надежнее факторные оценки. Если переменные измерены в поряд­ковой или, тем более, в дихотомической шкале, то надежность факторных оценок снижается до непредсказуемого уровня. Тем не менее, некоторые ав­торы (см. К. Иберла, 1980) на основе факторного моделирования доказыва­ют, что в случае исходных порядковых и даже дихотомических данных фак­торные оценки могут быть состоятельными. Условиями состоятельности факторных оценок являются действительно простая факторная структура, а также высокие значения общностей и факторных нагрузок переменных.

В заключение обзора математико-статистических идей факторного ана­лиза заметим, что современный факторный анализ — изящная математиче­ская процедура, имеющая достаточное статистическое обоснование. Это вы­годно отличает данный метод от остальных. Эта изящность, наряду с исходным психологическим обоснованием, однако, часто вводит в заблуждение нович­ка, ожидающего получить «готовый ответ» в результате применения фактор­ного анализа. Необходимо помнить, что факторный анализ не добавляет никакой новой информации к эмпирическим данным. Его задача — в обес­печении возможности интерпретировать данные. Качество же интерпрета­ции целиком зависит от исследователя, оттого, насколько и как он понимает исходные измерения, основы и процедуру факторного анализа.

ПОСЛЕДОВАТЕЛЬНОСТЬ ФАКТОРНОГО АНАЛИЗА

Особенность факторного анализа заключается в неопределенности реше­ния его основных проблем, изложенных в предыдущем параграфе. Нет чет­ких критериев качества их решения, есть лишь рекомендации, которыми руководствуется исследователь в своем стремлении содержательно интерпре­тировать получаемые результаты. Поэтому факторный анализ — это пошаго­вая процедура, где на каждом шаге исследователь принимает решение о даль­нейших преобразованиях данных. Главным же ориентиром на этом пути остается возможность получения содержательной интерпретации конечных результатов.

Весь процесс факторного анализа можно представить как выполнение шести этапов:

1. Выбор исходных данных.

2. Предварительное решение проблемы числа факторов.

3. Факторизация матрицы интеркорреляций.

4. Вращение факторов и их предварительная интерпретация.

5. Принятие решения о качестве факторной структуры.

6. Вычисление факторных коэффициентов и оценок.

Исследователь, в зависимости от своих целей, решает, сколько раз повто­рить эту последовательность, какие из этапов будут пропущены и насколько глубоко будет проработан каждый из них. Например, если исследователя ин­тересует только структура взаимосвязей признаков, то достаточно выполнить эту последовательность один раз, без последнего этапа.

Этап 1. Выбор исходных данных

Модель факторного анализа разрабатывалась для метрических данных. Поэтому первое требование к исходным данным — представление всех при­знаков в метрической шкале (не обязательно с одинаковыми средними и дис­персиями).

Включение в анализ порядковых или бинарных данных допустимо, но ис­следователь должен отдавать себе отчет, что искажения факторной структуры при этом будут соответствовать искажениям коэффициентов корреляций, и характер этих искажений неизвестен. В общем случае желательно перейти к единой шкале для всех признаков, либо ранговой, либо бинарной, затем вы­числять матрицу интеркорреляций, выбирая соответствующие меры взаимо­связи. Исследователь потеряет при этом существенную долю исходной ин­формации. А о допустимости дальнейшего вычисления значений факторных коэффициентов и оценок для объектов известно мало. Можно лишь сказать, что достоверность и ценность конечного результата обратно пропорциональ­ны доле потерянной исходной информации.

Если цель факторного анализа заключается только в определении струк­туры взаимосвязей переменных, то допустимо применение порядковых дан­ных, но перед проведением факторного анализа необходимо перейти к ран­гам по каждой переменной. Допустимо также использовать факторный анализ в отношении дихотомических переменных, если задача ограничивается оп­ределением структуры взаимосвязей и дихотомические корреляции между переменными не очень велики (не превышают 0,7)'.

Порядковые и даже дихотомические данные могут использоваться для вычисления оценок факторов, но при условии действительно простой фак­торной структуры, высоких значениях общностей и факторных нагрузок переменных, определяющих каждый фактор (К. Иберла, 1980). При этом же­лательно проверять устойчивость факторной структуры на параллельных вы­борках.

Как и в других многомерных методах, недопустимы функциональные за­висимости между переменными и корреляции, близкие к единице.

Количественное соотношение признаков и объектов зависит от целей исследования. Если цель анализа — изучение структуры взаимосвязей при­знаков, уменьшение их исходного количества путем перехода к новым пере­менным — факторам, то строгих ограничений нет. Желательно лишь, чтобы количество признаков было не меньше количества объектов. Если исследо­ватель хочет обнаружить и обосновать наличие факторов за взаимосвязями переменных, то желательно иметь в три раза больше объектов, чем призна­ков. Данное соотношение может сложиться и в процессе анализа — при отсе­ивании мало информативных переменных. Если же стоит задача обоснова­ния выявленной факторной структуры для генеральной совокупности, то объектов должно быть еще больше, для проверки устойчивости этой структу­ры на параллельных выборках.

Этап 2. Решение проблемы числа факторов

На этом этапе матрица интеркорреляций исходных признаков обрабаты­вается с использованием анализа главных компонент. Применяется крите­рий отсеивания Р. Кеттелла и критерий Кайзера — величины собственного значения фактора, большего 1 (ЕщепуаЬе, X > 1). Эти критерии не являются жесткими, поэтому далее проверяется несколько гипотез о числе факторов. Начинать при этом рекомендуется с максимально возможного числа факто­ров, с учетом обоих критериев, постепенно уменьшая их число.

Этап 3. Факторизация матрицы интеркорреляций

Выбирается метод факторизации, желательно — главных осей, наимень­ших квадратов или максимального правдоподобия. Задается число факторов, в соответствии с проверяемой гипотезой. Результатом данного этапа являет­ся матрица факторных нагрузок (факторная структура) до вращения, которая не подлежит интерпретации.

Полезной информацией на этом этапе могут являться суммарная доля дис­персии (информативность) факторов и значения общностей переменных. Суммарная доля дисперсии — показатель того, насколько полно выделяемые факторы могут представить данный набор признаков, а этот набор — выделя­емые факторы. Общность переменной — показатель ее «участия» в фактор­ном анализе, насколько она влияет на факторную структуру. Переменные с наименьшими общностями — ближайшие кандидаты на исключение из ана­лиза в дальнейшем.

Этап 4. Вращение факторов и их предварительная интерпретация

На этом этапе выбирается один из аналитических методов вращения фак­торов, обычно — варимакс-вращение (Уапшах погшайгес!). Существуют и дру­гие методы вращения, в том числе косоугольного, но они выходят за рамки нашего рассмотрения. В результате вращения достигается факторная струк­тура, наиболее доступная для интерпретации при данном соотношении пе­ременных и факторов.

Интерпретация факторов производится по таблице факторных нагрузок после вращения в следующем порядке. По каждой переменной (строке) выде­ляется наибольшая по абсолютной величине нагрузка — как доминирующая. Если вторая по величине нагрузка в строке отличается от уже выделенной менее чем на 0,2, то и она выделяется, но как второстепенная. После про­смотра всех строк — переменных, начинают просмотр столбцов — факторов. По каждому фактору выписывают наименования (обозначения) переменных, имеющих наибольшие нагрузки по этому фактору — выделенных на преды­дущем шаге. При этом обязательно учитывается знак факторной нагрузки переменной. Если знак отрицательный, это отмечается как противополож­ный полюс переменной. После такого просмотра всех факторов каждому из них присваивается наименование, обобщающее по смыслу включенные в него переменные. Если трудно подобрать термин из соответствующей теории, до­пускается наименование фактора по имени переменной, имеющей по срав­нению с другими наибольшую нагрузку по этому фактору.

Этап 5. Принятие решения о качестве факторной структуры

Формальное требование к факторной структуре сформулировал Л. Терстоун еще в 1930-х годах, назвав его принципом простой структуры. Геометрически принцип простой структуры означает, что все переменные располагаются на осях факторов, то есть каждая переменная имеет близкие к нулю нагрузки по всем факторам, кроме одного. На практике достижение такого результата с первого раза маловероятно, но качество факторной структуры определяется степенью приближения к простой структуре.

Следует отметить общий принцип соотношения качества факторной струк­туры и качества исходных данных: чем ниже качество исходных данных в смысле требований, предъявляемых к метрическим переменным, тем выше требования к простоте факторной структуры, величине общностей и фактор­ных нагрузок.

В настоящее время не существует формальных критериев соответствия факторной структуры простой. Поэтому основным критерием остается воз­можность хорошей содержательной интерпретации каждого фактора по двум и более исходным переменным. Если перед исследователем стоит дополни­тельно проблема обоснования устойчивости (воспроизводимости) факторной структуры в генеральной совокупности, то добавляется требование однознач­ного соотнесения каждой переменной с одним из факторов. Это требование означает, что каждая переменная имеет большую по абсолютной величине нагрузку (0,7 и выше) только по одному фактору и малые (0,2 и менее) — по всем остальным.

Можно предложить способы максимального приближения к простой структуре путем пошагового сокращения числа факторов и переменных.

1. Если по результатам интерпретации выявлен фактор, по которому ни одна из переменных не получила максимальной нагрузки (по строке), то это свидетельствует о необходимости сокращения количества факторов на один и повторения этапов 3 и 4 с новым числом факторов. То же касается фактора, идентифицируемого лишь по одной переменной, когда остальные в него не попадают даже с второстепенными нагрузками.

2. Определяются неоднозначные переменные. Каждая такая переменная имеет примерно одинаковые по абсолютной величине максимальные нагрузки по двум и более факторам. Если обосновывается устойчивость факторной структуры, то неоднозначной является переменная, у которой между макси­мальной и следующей за ней по величине нагрузкой разность менее 0,5. Нео­днозначные переменные поочередно удаляются из числа исходных перемен­ных, и каждый раз повторяются этапы 3 и 4.

Очевидно, что приближение к простой структуре связано с невосполни­мой потерей исходной эмпирической информации. И каждый раз исследо­ватель должен решать, насколько целесообразна эта потеря в свете стоящих перед ним задач. Наиболее жестки требования к простой структуре в случае обоснования устойчивости и воспроизводимости факторов, например, при разработке теста или факторной теоретической модели. Гораздо мягче тре­бования при решении наиболее часто встречающихся задач — при изуче­нии структуры взаимосвязей или при сокращении исходного набора при­знаков для дальнейшего исследования, например, различий между группами объектов.

Этап 6. Вычисление факторных коэффициентов и оценок

Это заключительный, наиболее однозначный и простой этап факторного анализа.

Оценки факторных коэффициентов являются коэффициентами линейного уравнения, связывающего значение фактора и значения исходных перемен­ных. Они показывают, с каким весом входят исходные значения каждой пе­ременной в оценку фактора. Факторные коэффициенты можно использовать для вычисления факторных оценок для новых объектов, не включенных ра­нее в факторный анализ.

Факторные оценки — значения факторов для каждого объекта (испытуе­мого). Их получение чаще всего и является конечным результатом факторно­го анализа. Вычисленные оценки факторов, как новые переменные, являют­ся независимыми, отражающими реальную структуру взаимосвязей исходных признаков и наиболее полно передающими исходную эмпирическую инфор­мацию. В этом факторные оценки выгодно отличаются от других способов интегрирования исходных данных, например от простого суммирования пун­ктов теста или анкеты в шкалы.

ПРИМЕР 16.2_____________________________________________________________________________________

До широкого распространения персональных компьютеров полновесный фактор­ный анализ был экзотической, весьма трудоемкой многоэтапной процедурой, ког­да очередной шаг исследователь выбирает по результатам выполнения предыду­щих этапов. В настоящее время можно контролировать процесс факторного анализа без «посредников» (программиста, операторов), пользуясь современным программ­ным обеспечением. Для этого не нужны знания программиста и математика, до­статочны осведомленность в основных математико-статистических идеях метода и умение «читать» промежуточные и конечные результаты факторного анализа. При этом факторный анализ может быть рекомендован для решения очень широкого круга не только исследовательских, но и практических задач. Перечислим некото­рые из них.

1. Факторный анализ как инструмент интерпретации позволяет быстро выделить группировки (кластеры) взаимосвязанных переменных, решая проблемы корреля­ционного анализа: наличия множества переменных и множества статистических проверок.

2. Факторный анализ как альтернатива простого суммирования значений исход­ных переменных позволяет учитывать реальную структуру данных и избегать из­лишних потерь драгоценной исходной информации. Затраты времени и сил на та­кую обработку данных при помощи факторного анализа часто меньше, чем при суммировании баллов «вручную». При этом выигрыш весьма ощутим — в деталь­ности и корректности получаемых результатов.

3. Как подготовительный этап для прогнозирования факторный анализ позволяет получить некоррелированные интегральные переменные (факторы), наиболее при­годные для применения в регрессионном или дискриминантном анализе.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.