Сделай Сам Свою Работу на 5

Доверительные интервалы и проверка гипотез для регрессии





Наша задача

  1. показать, как вычислять и интерпретировать линию регрессии,
  2. как вычислить, насколько эта линия хорошо соответствует данным.

 

Построение линии на основе данных

 

Наклон называют коэффициентом регрессии, сдвиг – константой регрессии.

 

Формула для линии наименьших квадратов имеет следующий вид:

 

Прогнозируемое значение Y = a + bX = ( - r ) + r

 

Формула вычисления остатков

 

 

Пример. Недельный объем производства

Количество выпущенных изделий, Х Затраты, Y
Среднее значение  
Стандартное отклонение  
Корреляция  

 

 

Вы, наверное, уже обратили внимание, что линия наименьших квадратов не является идеальным описанием данных. Она, несомненно, является полезной ха­рактеристикой основной тенденции, но все же не учитывает случайные отклонения данных от линии. В связи с этим возникает следующий вопрос:“Насколько полезна линия регрессии?” Ответ на этот вопрос основывается на двух важных показателях: стандартной ошибки оценки Se (абсолютная мера величины ошибок прогнозирования) и R2 (относительная мера того, как много удалось объяснить). Se в распечатках часто обозначают S.



Se = Sy для вычисления

Se = для интерпретации

 

R2 (произносится “r-квадрат”), который называют также коэффициентом детерминации, показывает, в какой мере изменчивость Y объясняется поведением X. Этот показатель вычисляется путем простого возведения в квадрат коэффициента корреляции, r (т.е. R2 = r2). Таким образом, доля вариации Y, определяемая выражением 1 – R2, оказывается необъясненной. Обычно большие значения R2 считаются более предпочтительными, поскольку указывают на более сильную взаимосвязь между Х и Y, которую можно использовать для прогнозирования и других целей. Однако на практике малые значения R2 вовсе необязательно указывают на то, что Х нельзя использовать для объяснения поведения Y; малые значения R2 могут просто указывать на то, что поведение Y объясняется не только Х, но и другими важными факторами.

Например, коэффициент корреляции совокупности данных, относящихся к производственным затратам, равняется 0,869193. Следовательно, значение R2 равно



 

R2 = 0,8691932 = 0,755, или 75,5%.

 

Это значение R2 говорит о том, что 75,5% вариации (изменчивости) недельных затрат объясняется количеством изделий, выпущенных за неделю. Остальная часть (24,5%) вариации общих затрат объясняется другими причинами.

 

 

 

Доверительные интервалы и проверка гипотез для регрессии

 

 

До сих пор мы занимались обобщением данных: оценивали силу взаимосвязи с помощью коэффициента корреляции, взаимосвязь с помощью линии наименьших квадратов, соответствие линии и данных с помощью стандартной ошибки оценки и R2. Сейчас настало время сделать следующий шаг и перейти от вычисления характеристик данных выборки к статистическим выводам относительно более крупной генеральной совокупности, которая нас, собственно, и интересует. Но что необходимо рассматривать в случае регрессии как генеральную совокупность? Ответ на этот вопрос дает линейная модель.

Предполагаем, что данные для обеих переменных извлечены независимо и соответствуют линейной модели. Она утверждает, что наблюдаемое значение Y определяется в генеральной совокупности характеризующейся прямой линией связью плюс случайная, имеющая нормальное распределение, ошибка:

Y = ( ,

где имеет нормальное распределение со средним значением ноль и постоянным стандартным отклонением .

 

 

Линейность является базовым допущением для статистических выводов в регрессионном и корреляционном анализе. Построение доверительных интервалов и проверка статистических гипотез для коэффициента регрессии предполагают, что линейность справедлива для генеральной совокупности. В частности, доверительные интервалы и проверки гипотез будут необоснованны, если соответствующая взаимосвязь окажется нелинейной или будет характеризоваться неодинаковой вариацией. Вам необходимо учитывать эти особенности: если линейная модель не соответствует вашим данным, то выводы, сделанные на основе регрессионного анализа, могут оказаться неверными.



 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.