Сделай Сам Свою Работу на 5

Построение уравнения парной регрессии





Для проверки возможности использования линейной функции определяется разность ( ); если она по модулю меньше 0,1, то считается возможным применение линейной функции. В рассматриваемом примере ABS (0,898-0,995) = 0,097< 0,100. Значение определено по сгруппированным данным.

Для решения этой же задачи можно использовать величину , определяемую по формуле

, (58)

где m — число групп, на которое разделен диапазон значений факторного признака.

Если окажется меньше критического значения F- критерия, то нулевая гипотеза о возможности использования в качестве уравнения регрессии линейной функции не опровергается. Значение F -критерия определяется по таблице в зависимости от уровня значимости = 0,05 (вероятность Р = 0,95) и числа степеней свободы знаменателя ( ) и числителя ( ) (см. функцию F.расп. EXCEL).

При линейной связи параметры ( и ) уравнения парной регрессии:

(59)

находятся с помощью метода наименьших квадратов. Суть метода заключается в минимизации суммы квадратов отклонений теоритических значений результативного признака ( ) от его фактических значений ( ):

(60)

Условие (7.26) выполняется при равенстве нулю частных производных по параметрам и :



(61)

Сократим каждое уравнение системы (7.27) на (-2), раскроем скобки и получим следующую систему нормальных уравнений:

(62)

Поделим каждое уравнение системы (7.28) на объём статистической совокупности (n), тогда упомянутую систему можно представить в более наглядном виде:

(63)

Из первого уравнения системы (63) следует, что:

(64) Подставив полученное выражение во второе уравнение, получим:

. (65) Коэффициент корреляции определяется по формуле:

(66) Учитывая (65) и (66) получим

(67)

или . (68) Зная значения r, и можно вычислить по выражениям (68) и (64) параметры и линейного уравнения регрессии.

Параметр , нельзя использовать для непосредственной оценки влияния факторного признака на результативный при­знак из-за различия единиц измерения исследуемых показате­лей. Для этих целей вычисляют значение среднего коэффициента эластичности и бета-коэффициент:

(69)

(70)

Коэффициент эластичности показывает, на сколь­ко процентов изменяется результативный признак у при изменении факторного признака x на один процент.



Бета-коэффициент показывает, на какую часть своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину своего среднего квадратического отклонения.

 

Статистический анализ модели

Для того чтобы оценки и параметров уравнения регрессии обладали адекватностью ряд остатков должен удовлетворять следующим требованиям:

1. математическое ожидание равно нулю (критерий нулевого среднего);

2. величина является случайной переменной (критерий серий);

3. значения независимы между собой (критерий Дарбина-Уотсона);

4. дисперсия постоянна: для всех i, j (тест Гольдфельда-Квандта);

5. Остатки распределены по нормальному закону (свойство используется для проверки статистической значимости и построения доверительных интервалов при прогнозировании)

Отметим, что аппроксимировать уравнением парной регрессии у на х, имеет смысл только в том случае, если существует достаточно тесная статистическая зависимость между случайными величинами и линейный коэффициент корреляции является значимым, что и имеет место в рассматриваемом примере.

Оценка качества построенной модели

Формально качество модели определяется ее адекватностью и точностью. Эти свойства исследуются на основе анализа ряда остатков (отклонений расчетных значений от фактических):

(71)

При этом адекватность является более важной составляющей качества, но сначала рассмотрим характеристики точности и нормальности ряда остатков, так как некоторые из них используются при расчете различных критериев адекватности.



 

Характеристики точности

Под точностью понимается величина случайных ошибок. Сравнительный анализ точности имеет смысл только для адекватных моделей: среди них лучшей признается модель с меньшими значениями характеристик точности, к которым относятся:

- максимальная ошибка соответствует максимальному отклонению расчетных значений от фактических;

- средняя абсолютная ошибка

показывает, насколько в среднем отклоняются фактические значения от модели;

- средняя относительная ошибка

;

- остаточная дисперсия

;

- средняя квадратическая ошибка

. (72)

Средняя квадратическая ошибка является наиболее часто используемой характеристикой точности (что объясняется ее связью с остаточной дисперсией, которая играет центральную роль в регрессионном анализе). Значение средней квадратической ошибки всегда несколько больше значения средней абсолютной ошибки, но они имеют схожий смысл – характеризуют среднюю удаленность расчетных значений модели от фактических исходных данных. Обычно точность модели признается удовлетворительной если выполняется условие:

. (73)

К характеристикам точности можно отнести также множественный коэффициент детерминации

, (74) характеризующий долю дисперсии зависимой переменной, объясненной с помощью регрессии, и множественный коэффициент корреляции (индекс корреляции):

. (75)

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.