Сделай Сам Свою Работу на 5

Логико-теоретические основы





Рассмотренный выше регрессионный анализ изучает изменение среднего уровня одного признака при изменении другого, т. е. ориентирован асимметрично на один из признаков. Однако по любому массиву значений двух сопряженных признаков (x и y) можно рассчитать два уравнения регрессии и построить две линии регрессии зависимости y от x и зависимости x от y:

Y = a1 ∙x + b1, X = a2 ∙y + b2.

       
   
 
 

 

 


При этом не только уравнения содержат разные коэффициенты пропорциональности, но и линии регрессии не совпадают, как и прогнозы по ним (x1 > x2). Как указывалось выше, причина того, что линии регрессии не совпадают в осью эллипса рассеяния, а значит, и друг с другом, состоит в том, что случайная изменчивость признаков не дает точно определить коэффициенты пропорциональности (регрессии) и, следовательно, точно охарактеризовать взаимозависимое изменение обоих признаков.

В то же время по графикам видно, что каждый коэффициент регрессии неточен по-своему, в результате чего линии регрессии лежат по разные стороны оси эллипса. Возникает вопрос, нельзя ли вычислить некий усредненный показатель взаимосвязи, в котором свойства коэффициентов регрессии обобщаются? Такой характеристикой (средней геометрической) для линейной зависимости выступает коэффициент корреляции:



.

Корреляционный анализ, состоящий в расчете и оценке значимости коэффициента корреляции, держит в поле зрения в равной мере оба изучаемых признака – как их сопряженную, так и общую изменчивость. Коэффициент корреляции призван численно выражать долю сопряженной вариации двух признаков в общей их вариации:

,

где Cxy – характеристика сопряженной изменчивости признаков,

Cx, Cy – характеристика общей изменчивости признаков.

Рабочая формула для расчетов имеет вид:

.

Когда степень сопряженной изменчивости признаков велика, коэффициент корреляции имеет большую величину, вплоть до r = ±1 – при функциональной зависимости. Если признаки варьируют независимо друг от друга и сопряженная изменчивость отсутствует, выборочный коэффициент корреляции приближается к нулю, хотя практически никогда не имеет арифметических нулевых значений. В любом случае для доказательства существования зависимости между признаками необходимо проверить статистическую гипотезу Но: "коэффициент корреляции значимо от нуля не отличается", r = 0, т. е. "в генеральной совокупности изучаемые признаки не зависят друг от друга". Значимость отличия коэффициента корреляции от нуля оценивается с помощью критерия Стьюдента.



T = (r–0)/ mr = r/ mr ~ T(0.05, n–2),

где .

Из приведенной формулы следует, что ошибка репрезентативности выборочного коэффициента корреляции определяется только объемом выборки и величиной самого показателя. Это позволяет предложить "таблицу значимых коэффициентов корреляции" (табл. 16П), в которой приведены минимальные значимые (достоверно отличные от нуля) коэффициенты корреляции при разных объемах выборок. Если коэффициенты корреляции выше табличных, то они также значимы, если ниже, то от нуля отличаются недостоверно.

Как статистический параметр, выборный коэффициент корреляции в той или иной степени соответствует генеральному параметру. Определить диапазон возможных значений генерального коэффициента корреляции можно с помощью доверительного интервала, хотя его нельзя построить непосредственно как для других выборочных параметров: r ±T(α,df)∙mr. Дело в том, что область изменений коэффициента ограничена рамками ±1, поэтому распределение выборочных коэффициентов корреляции в общем не соответствует нормальному (для него нужен диапазон изменчивости ±∞). Поэтому перед расчетом коэффициент корреляции переводят в величину, имеющую нормальное распределение по формуле: (или по табл. 14П, знак сохраняется), затем вычисляют ошибку коэффициентов: . Теперь доверительный интервал принимает вид: z ±T(α,df)∙mz. Далее отыскиваются границы интервала:



верхняя: maxz = z + T(α,df)∙mz

и нижняя: minz = z – T(α,df)∙mz.

После этого значения maxz и maxz с помощью таблицы 15П переводятся обратно, в прежние единицы maxr, minr; это и будут границы доверительного интервала для генерального значения коэффициента корреляции.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.