Сделай Сам Свою Работу на 5

Проверка гипотезы о равенстве дисперсий





Занятие № 3

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Цель работы: изучить приёмы работы с инструментами Пакета анализа и встроенными функциями MS Excel для проверки статистических гипотез.

Основные положения

Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, проверяемое по выборке.

Выдвинутая гипотеза называется нулевой (или основной) и обозначается H0. Гипотеза, которая противоречит нулевой, называется конкурирующей (или альтернативной) и обозначается H1. Для проверки нулевой гипотезы используют критерий ‒ специально подобранную случайную величину, распределение которой известно. Значение критерия, вычисленное по выборкам, называется наблюдаемым (или экспериментальным) значением и обозначается Zнабл. Множество возможных значений критерия разбивается на два непересекающихся подмножества: одно из них содержит значения, при которых нулевая гипотеза отвергается (критическая область), а другое – при которых она принимается (область допустимых значений или область принятия гипотезы).

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области. Если наблюдаемое значение критерия принадлежит критической области, то основная гипотеза H0 отклоняется и принимается альтернативная гипотеза H1, если же Zнабл. принадлежит области допустимых значений, то принимается H0, отвергается H1.



Схема проверки гипотезы:

1. Формирование нулевой гипотезы H0 и конкурирующей гипотезы H1.

2. Выбор вероятности a − уровня значимости нулевой гипотезы H0.

3. Вычисление соответствующего уровню значимости критического значения статистики (статистического критерия) Zкр.

4. Вычисление по выборкам наблюдаемого значения критерия Zнабл..

5. Сравнение наблюдаемого значения критерия с критическим (проверка попадания критерия в критическую область). Если Zнабл. попадает в критическую область, то нулевая гипотеза H0 отвергается и принимается конкурирующая гипотеза H1. Если же нет, то нет оснований отвергать нулевую гипотезу.

В статистических пакетах обычно не используется значения задаваемого уровня значимости a. В выходных данных содержатся выборочные значения Zнабл. статистики критерия Z и вероятность того, что случайная величина Z (при условии, что верна гипотеза H0) превышает выборочное значение Zнабл., т. е. значение



Эта вероятность называется p-значением (p-level).

При двусторонней проверке p-значение равно

.

Таким образом, p – минимальный уровень значимости, при котором гипотеза может быть отвергнута.

Если p > a, где a − заданный уровень значимости, гипотеза H0 принимается на уровне значимости p. Если p < a − гипотеза H0 отклоняется, так как Zнабл. попадает в критическую область, причём вероятность ошибки первого рода равна p.

В MS Excel проверить некоторые гипотезы можно несколькими способами: с использованием встроенных функций и с помощью инструментов Пакета анализа.

 

Сравнение двух выборок, извлечённых из нормально

Распределённых генеральных совокупностей

Проверка гипотезы о равенстве дисперсий

На практике необходимость сравнения дисперсий возникает при сравнении точности приборов, инструментов, методов измерений.

Пусть генеральные совокупности X и Y распределены нормально. Требуется по двум независимым выборкам (x1, x2, …, xn) объёма n и (y1, y2, …, ym) объёма m, извлечённым из этих совокупностей, проверить гипотезу H0: D(X) = D(Y).

В качестве статистического критерия рассматривается отношение большей исправленной дисперсии к меньшей :

.

Если нулевая гипотеза H0: D(X) = D(Y) верна, то статистика F имеет распределение Фишера-Снедекора со степенями свободы

k1 = n1 - 1, k2= n2 -1, где n1 ‒ объём выборки, которая соответствует большей дисперсии, n2 ‒ объём выборки, которая соответствует меньшей дисперсии. Значение, вычисленное по формуле, обозначим Fнабл.. Если Fнабл < Fкр.(a, k1, k2 ), то нет оснований отвергать нулевую гипотезу.



Рассмотрим проверку гипотезы непосредственным расчётом по формулам с использованием встроенных функций.

Пример 1. На двух одинаково настроенных токарных станках обрабатываются детали. Отобраны две пробы: из деталей, изготовленных на 1-ом станке (выборка№1) n = 11 штук, на втором (выборка № 2) – m = 10 штук, и измерены их размеры в мм.

Выборка № 1: 10,7; 11,1; 11,1; 10,8; 11,2; 11,1; 11,0; 11,2; 10,9; 10,8; 11,0.

Выборка № 2: 10,8; 11,4; 11,5; 11,2; 10,9; 11,2; 11,1; 11,2; 11,0; 10,9.

Полагая, что размеры деталей подчиняются нормальному закону распределения, выяснить, с одинаковой ли точностью работают оба станка.

Решение. Введём выборочные данные в диапазоны А2:А11 и B2:B12 и тексты-метки в ячейки А1, B1,C2, C3, C4, C5, C6.

В ячейку D2 ввести формулу:=ДИСП(A2:A12). Получим значение исправленной выборочной дисперсии для 1 станка: 0,028909.

В ячейку D3 ввести формулу:=ДИСП(B2:B11). Получим значение исправленной выборочной дисперсии для 2 станка: 0,034333.

Так как D3 > D2, в ячейкуD4 введём формулу= D3/ D2. Получим наблюдаемое значение критерия: 1,752621.

Вычислим критические значения критерия. Функция FРАСПОБР(вероятность;степени_свободы1;

степени_свободы2) возвращает обратное значение для F-распределения вероятностей.

Зададим уровень значимости α = 0,05. В ячейки D5иD6введём соответственно формулы: =FРАСПОБР (0,05; 9; 10) и =FРАСПОБР(0,025; 9; 10). Получим в ячейках D5 и D6 критическиезначения Fкр.: 3,020383 и 3,778963.

Если в качестве альтернативной гипотезы рассматривается гипотеза H1: D(Y)> D(X), то уровню значимости α = 0,05 и степеням свободы k1 = 9 и k 2= 10 соответствует Fкр.= 3,020383. Так как Fнабл < . Fкр., то гипотеза H0: D(X) = D(Y) принимается.

При альтернативной гипотезе H1: D(Y) D(X)в качестве критического значения принимается Fкр.= 3,778963, также нет оснований отвергать нулевую гипотезу (1,752621<3,778963).

Вывод: нет оснований считать, что станки работают с различной точностью.

Для проверки гипотезы о равенстве дисперсий можно использовать функцию ФТЕСТ(Массив 1, Массив 2), которая определяет расчётное значение уровня значимости p в случае двусторонней критической области.

Введём в свободную ячейку, например в D7, формулу:

=ФТЕСТ(A2:A12; B2:B11). Получим результат: 0,394. (Уровень значимости для двусторонней критической области, а для односторонней - 0,197). Так как p > 0,05, то гипотеза H0 принимается на уровне значимости p.

Проверим нулевую гипотезу с помощью инструмента Пакета анализа «Двухвыборочный F-тест для дисперсии».Перейдём на вкладку Данные и в группе Анализ нажмём кнопку Анализ данных. В диалоговом окне Анализ данных выберем инструмент

«Двухвыборочный F-тест для дисперсии» и в окне диалога введём следующие значения:

 

Нажмём кнопку ОК и получим следующий результат:

В таблице результатов: df ‒ число степеней свободы; . Так как , то альтернативная гипотеза формулируется как H1: D(X) < D(Y) и строится левосторонняя критическая область в интервале (0; 0,331). Так как Fкр.= 0,331083845. Fнабл > Fкр., следовательно наблюдаемое значение критерия не попадает в критическую область, и нулевую гипотезу следует принять. Значение левосторонней критической точки (показатель F критическое одностороннее) рассчитывается по формуле: =FРАСПОБР (1-0,05;10; 9).

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.