Пакет анализа Excel (Регрессия)
Построение линейной регрессии, оценивание ее параметров и их значимости можно выполнить значительнее быстрей при использовании пакета анализа Excel (Регрессия). Рассмотрим интерпретацию полученных результатов в общем случае (k объясняющих переменных) по данным примера 3.6.
Вывод итогов
| Регрессионная статистика
| Множественный R
| 0,940
| R-квадрат
| 0,884
| Нормированный R – квадрат
| 0,868
| Стандартная ошибка
| 22,87
| Наблюдения
|
|
В таблице регрессионной статистики приводятся значения:
Множественный R – коэффициент множественной корреляции ;
R-квадрат – коэффициент детерминации R2;
Нормированный R-квадрат – скорректированный R2 с поправкой на число степеней свободы;
Стандартная ошибка– стандартная ошибка регрессии S;
Наблюдения –число наблюдений n.
Дисперсионный анализ
|
| df
| SS
| MS
| F
| Значимость F
| Регрессия
|
| 28102,2
| 28102,2
| 53,69
| 0,00016
| Остаток
|
| 3663,7
| 523,3
|
|
| Итого
|
|
|
|
|
|
В таблице Дисперсионный анализприведены:
1. Столбец df - число степеней свободы, равное
для строки Регрессия df = k;
для строкиОстатокdf = n – k – 1;
для строкиИтогоdf = n – 1.
2. Столбец SS –сумма квадратов отклонений, равная
для строки Регрессия ;
для строкиОстаток ;
для строкиИтого .
3. Столбец MSдисперсии, определяемые по формуле MS = SS/df:
для строки Регрессия – факторная дисперсия;
для строкиОстаток– остаточная дисперсия.
4. Столбец F – расчетное значение F-критерия, вычисляемое по формуле
F = MS(регрессия)/MS(остаток).
5. Столбец Значимость F –значение уровня значимости, соответствующее вычисленной F-статистике.
Значимость F = FРАСП(F-статистика, df(регрессия), df(остаток)).
Если значимость F < стандартного уровня значимости, то R2 статистически значим.
| Коэффи-циенты
| Стандартная ошибка
| t-cта-тистика
| P-значение
| Нижние 95%
| Верхние 95%
| Y
| 65,92
| 11,74
| 5,61
| 0,00080
| 38,16
| 93,68
| X
| 0,107
| 0,014
| 7,32
| 0,00016
| 0,0728
| 0,142
|
В этой таблице указаны:
1. Коэффициенты– значения коэффициентов a, b.
2. Стандартная ошибка–стандартные ошибки коэффициентов регрессии Sa, Sb.
3. t-статистика – расчетные значения t-критерия, вычисляемые по формуле:
t-статистика = Коэффициенты / Стандартная ошибка.
4.Р-значение (значимость t)– это значение уровня значимости, соответствующее вычисленной t-статистике.
Р-значение = СТЬЮДРАСП(t-статистика, df(остаток)).
Если Р-значение < стандартного уровня значимости, то соответствующий коэффициент статистически значим.
5. Нижние 95% и Верхние 95%– нижние и верхние границы 95 %-ных доверительных интервалов для коэффициентов теоретического уравнения линейной регрессии.
ВЫВОД ОСТАТКА
| Наблюдение
| Предсказанное y
| Остатки e
|
| 72,70
| -29,70
|
| 82,91
| -20,91
|
| 94,53
| -4,53
|
| 105,72
| 5,27
|
| 117,56
| 12,44
|
| 129,70
| 19,29
|
| 144,22
| 20,77
|
| 166,49
| 24,50
|
| 268,13
| -27,13
|
В таблице ВЫВОД ОСТАТКАуказаны:
в столбце Наблюдение– номер наблюдения;
в столбце Предсказанное y– расчетные значения зависимой переменной;
в столбце Остатки e– разница между наблюдаемыми и расчетными значениями зависимой переменной.
Пример 3.6.Имеются данные (усл. ед.) о расходах на питание y и душевого дохода x для девяти групп семей:
Используя результаты работы пакета анализа Excel (Регрессия), проанализируем зависимость расходов на питание от величины душевого дохода.
Результаты регрессионного анализа принято записывать в виде:
где в скобках указаны стандартные ошибки коэффициентов регрессии.
Коэффициенты регрессии а = 65,92 и b = 0,107. Направление связи между y и xопределяет знак коэффициентарегрессии b = 0,107, т.е. связь является прямой и положительной. Коэффициент b = 0,107 показывает, что при увеличении душевого дохода на 1 усл. ед. расходы на питание увеличиваются на 0,107 усл. ед.
Оценим значимость коэффициентов полученной модели. Значимость коэффициентов (a, b) проверяется по t-тесту:
Р-значение (a) = 0,00080 < 0,01 < 0,05
Р-значение (b) = 0,00016 < 0,01 < 0,05,
следовательно, коэффициенты (a, b) значимы при 1 %-ном уровне, а тем более при 5 %-ном уровне значимости. Таким образом, коэффициенты регрессии значимы и модель адекватна исходным данным.
Результаты оценивания регрессии совместимы не только с полученными значениями коэффициентов регрессии, но и с некоторым их множеством (доверительным интервалом). С вероятностью 95 % доверительные интервалы для коэффициентов есть (38,16 – 93,68) для a и (0,0728 – 0,142) для b.
Качество модели оценивается коэффициентом детерминации R2.
Величина R2= 0,884 означает, что фактором душевого дохода можно объяснить 88,4 % вариации (разброса) расходов на питание.
Значимость R2 проверяется по F-тесту: значимость F = 0,00016 < 0,01 < 0,05, следовательно, R2 значим при 1 %-ном уровне, а тем более при 5 %-ном уровне значимости.
В случае парной линейной регрессии коэффициент корреляции можно определить как . Полученное значение коэффициента корреляции свидетельствует, что связь между расходами на питание и душевым доходом очень тесная.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|