Сделай Сам Свою Работу на 5

МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ ИДЕИ МЕТОДА





Исходным положением линейного МРА является возможность представ­ления значений «зависимой» переменной У через значения «независимых» переменных хь х2, ..., хР в виде линейного уравнения:

У= Ь + Ьххх + Ь2х2 + ... +Ьрхр + е,

где Ъ — свободный член (1п1егсер1), Ь,, ..., ЬР — Ь — коэффициенты регрессии

(ШзШпйагсНгей Сое/раеМз), е — ошибка оценки (КезШиаI). Коэффициенты рег­рессии вычисляются методом наименьших квадратов при решении системы из линейных уравнений, с минимизацией ошибки е.

После вычисления регрессионных коэффициентов по значениям незави­симых переменных для каждого из объектов могут быть вычислены оценки зависимой переменной У(РгесИс(ес1 Уа1иез)\

У= Ь + Ьххх + Ь2х2 + ...+ЬРхР. (15.2)

Сопоставление значений зависимой переменной У1 с их оценками У( по вы­борке испытуемых, для которых значения У1 известны, называется анализом остатков или ошибок (гезШиа1 апа/узи). Он позволяет оценить возможные по­грешности предсказания. Значения оценок У( могут быть вычислены и для испы­туемых, истинные значения зависимой переменной для которых неизвестны.

Далее можно вычислить коэффициент корреляции Пирсона между извест­ными значениями «зависимой» переменной и ее оценками. Это один из спо­собов получения коэффициента множественной корреляции (КМК) между «зависимой» и «независимыми» переменными. Коэффициент множественной корреляции — это мера линейной связи одной переменной с множеством дру­гих переменных; принимает положительные значения от 0 (отсутствие связи) до 1 (строгая прямая связь). КМК наряду с разностями между исходными и оцененными значениями «зависимой» переменной (ошибки е) — основные показатели качества модели множественной регрессии.



Если «зависимая» и «независимые» переменные представлены в ^значе­ниях, то уравнение регрессии принимает вид:

Гг1х, + р2х2+... +$рХр+е, (15.3)

где Р/,— стандартные коэффициенты регрессии, или р-коэффициенты (8Шпйагй1гей Сое$1аеМ5).

Стандартные коэффициенты регрессии связаны с исходными корреляци­ями следующим уравнением (в матричной форме):

В=К~[17]А, (15.4)

где В — вектор-столбец стандартных коэффициентов регрессии, К~{ — мат­рица, обратная корреляционной матрице «независимых» переменных, А — вектор-столбец корреляций «независимых» переменных с «зависимой» пере­менной. На практике регрессионный анализ начинается именно с вычисле­ния стандартных коэффициентов регрессии.



Напомним, что в случае двумерной регрессии — при наличии всего одной независимой переменной, уравнение 15.3 имеет вид:

V- = г •х

^ I Ху I '

то есть стандартный коэффициент регрессии равен коэффициенту корреля­ции зависимой и независимой переменных. При наличии двух и более неза­висимых переменных:

1Рх1 < К\

и р-коэффициент зависит не только от корреляции данной независимой и зависимой переменных, но и от того, коррелирует ли эта независимая пе­ременная с другими независимыми переменными. Знак р-коэффициента соответствует знаку коэффициента корреляции данной «независимой» и «за­висимой» переменной. Абсолютная величина Р-коэффициента является максимальной — равна коэффициенту корреляции с зависимой переменной, если данная независимая переменная не коррелирует ни с одной из других независимых переменных. Чем сильнее данная независимая переменная свя­зана с другими независимыми переменными, тем меньше р-коэффициент.

Произведение коэффициента р, на коэффициент корреляции г этой пе­ременной с «зависимой» переменной — это вклад данной переменной в дис­персию «зависимой» переменной. Ясно, что вклад переменной выше, если ее корреляция с зависимой переменной выше, а с другими независимыми пере­менными — ниже. Поэтому ценность независимой переменной для множе­ственной регрессии определяется не только ее корреляцией с зависимой пе­ременной (как в двумерной регрессии), но и ее «уникальностью» — слабой связью с другими независимыми переменными.



Если «зависимая» переменная представлена в г-значениях (дисперсия рав­на 1), то эта единичная дисперсия «зависимой» переменной Бу может быть выражена формулой:

Часть дисперсии «зависимой» переменной, обусловленная влиянием «не­зависимых» переменных, — это коэффициент множественной детерминации (КМД), который равен коэффициенту множественной корреляции в квадра­те или К1:

р

1СМД =2 = = 1- А-

Соответственно, второй способ вычленить КМК:


 

Интерпретация КМД очевидна: это та часть дисперсии «зависимой» пере­менной, которая определяется «независимыми» переменными. Следователь­но, (1 - КМД) — это дисперсия ошибки оценки. Например, если КМК = 0,8, то КМД = (КМК)2 = 0,64. Это означает, что 64% дисперсии «зависимой» пе­ременной определяется исходными переменными, а 36% ее дисперсии отно­сится к ошибке оценки.

Таким образом, основной показатель МРА — коэффициент множественной корреляции (К), который, подобно парному коэффициенту корреляции Пирсо­на, является мерой линейной взаимосвязи одной переменной с совокупностью других переменных. КМК «зависимой» переменной с набором «независимых» переменных, как и КМД, принимает только положительные значения, изме­няясь в пределах от 0 до 1. Статистическая значимость КМК определяется по критерию /^-Фишера для соответствующих степеней свободы.

Таким образом, основными целями МРА являются:

1. Определение того, в какой мере «зависимая» переменная связана с со­вокупностью «независимых» переменных, какова статистическая значимость этой взаимосвязи. Показатель — коэффициент множественной корреляции (КМК) и его статистическая значимость по критерию ^-Фишера.

2. Определение существенности вклада каждой «независимой» перемен­ной в оценку «зависимой» переменной, отсев несущественных для предска­зания «независимых» переменных. Показатели — регрессионные коэффици­енты их статистическая значимость по критерию /-Стыодента.

3. Анализ точности предсказания и вероятных ошибок оценки «зависи­мой» переменной. Показатель — квадрат КМК, интерпретируемый как доля дисперсии «зависимой» переменной, объясняемая совокупностью «незави­симых» переменных. Вероятные ошибки предсказания анализируются по рас­хождению (разности) действительных значений «зависимой» переменной и оцененных при помощи модели МРА.

4. Оценка (предсказание) неизвестных значений «зависимой» переменной по известным значениям «независимых» переменных. Осуществляется по вычисленным параметрам множественной регрессии.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.