Проверка гипотезы о равенстве дисперсий
Занятие № 3
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Цель работы: изучить приёмы работы с инструментами Пакета анализа и встроенными функциями MS Excel для проверки статистических гипотез.
Основные положения
Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, проверяемое по выборке.
Выдвинутая гипотеза называется нулевой (или основной) и обозначается H0. Гипотеза, которая противоречит нулевой, называется конкурирующей (или альтернативной) и обозначается H1. Для проверки нулевой гипотезы используют критерий ‒ специально подобранную случайную величину, распределение которой известно. Значение критерия, вычисленное по выборкам, называется наблюдаемым (или экспериментальным) значением и обозначается Zнабл. Множество возможных значений критерия разбивается на два непересекающихся подмножества: одно из них содержит значения, при которых нулевая гипотеза отвергается (критическая область), а другое – при которых она принимается (область допустимых значений или область принятия гипотезы).
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области. Если наблюдаемое значение критерия принадлежит критической области, то основная гипотеза H0 отклоняется и принимается альтернативная гипотеза H1, если же Zнабл. принадлежит области допустимых значений, то принимается H0, отвергается H1.
Схема проверки гипотезы:
1. Формирование нулевой гипотезы H0 и конкурирующей гипотезы H1.
2. Выбор вероятности a − уровня значимости нулевой гипотезы H0.
3. Вычисление соответствующего уровню значимости критического значения статистики (статистического критерия) Zкр.
4. Вычисление по выборкам наблюдаемого значения критерия Zнабл..
5. Сравнение наблюдаемого значения критерия с критическим (проверка попадания критерия в критическую область). Если Zнабл. попадает в критическую область, то нулевая гипотеза H0 отвергается и принимается конкурирующая гипотеза H1. Если же нет, то нет оснований отвергать нулевую гипотезу.
В статистических пакетах обычно не используется значения задаваемого уровня значимости a. В выходных данных содержатся выборочные значения Zнабл. статистики критерия Z и вероятность того, что случайная величина Z (при условии, что верна гипотеза H0) превышает выборочное значение Zнабл., т. е. значение
Эта вероятность называется p-значением (p-level).
При двусторонней проверке p-значение равно
.
Таким образом, p – минимальный уровень значимости, при котором гипотеза может быть отвергнута.
Если p > a, где a − заданный уровень значимости, гипотеза H0 принимается на уровне значимости p. Если p < a − гипотеза H0 отклоняется, так как Zнабл. попадает в критическую область, причём вероятность ошибки первого рода равна p.
В MS Excel проверить некоторые гипотезы можно несколькими способами: с использованием встроенных функций и с помощью инструментов Пакета анализа.
Сравнение двух выборок, извлечённых из нормально
Распределённых генеральных совокупностей
Проверка гипотезы о равенстве дисперсий
На практике необходимость сравнения дисперсий возникает при сравнении точности приборов, инструментов, методов измерений.
Пусть генеральные совокупности X и Y распределены нормально. Требуется по двум независимым выборкам (x1, x2, …, xn) объёма n и (y1, y2, …, ym) объёма m, извлечённым из этих совокупностей, проверить гипотезу H0: D(X) = D(Y).
В качестве статистического критерия рассматривается отношение большей исправленной дисперсии к меньшей :
.
Если нулевая гипотеза H0: D(X) = D(Y) верна, то статистика F имеет распределение Фишера-Снедекора со степенями свободы
k1 = n1 - 1, k2= n2 -1, где n1 ‒ объём выборки, которая соответствует большей дисперсии, n2 ‒ объём выборки, которая соответствует меньшей дисперсии. Значение, вычисленное по формуле, обозначим Fнабл.. Если Fнабл < Fкр.(a, k1, k2 ), то нет оснований отвергать нулевую гипотезу.
Рассмотрим проверку гипотезы непосредственным расчётом по формулам с использованием встроенных функций.
Пример 1. На двух одинаково настроенных токарных станках обрабатываются детали. Отобраны две пробы: из деталей, изготовленных на 1-ом станке (выборка№1) n = 11 штук, на втором (выборка № 2) – m = 10 штук, и измерены их размеры в мм.
Выборка № 1: 10,7; 11,1; 11,1; 10,8; 11,2; 11,1; 11,0; 11,2; 10,9; 10,8; 11,0.
Выборка № 2: 10,8; 11,4; 11,5; 11,2; 10,9; 11,2; 11,1; 11,2; 11,0; 10,9.
Полагая, что размеры деталей подчиняются нормальному закону распределения, выяснить, с одинаковой ли точностью работают оба станка.
Решение. Введём выборочные данные в диапазоны А2:А11 и B2:B12 и тексты-метки в ячейки А1, B1,C2, C3, C4, C5, C6.
В ячейку D2 ввести формулу:=ДИСП(A2:A12). Получим значение исправленной выборочной дисперсии для 1 станка: 0,028909.
В ячейку D3 ввести формулу:=ДИСП(B2:B11). Получим значение исправленной выборочной дисперсии для 2 станка: 0,034333.
Так как D3 > D2, в ячейкуD4 введём формулу= D3/ D2. Получим наблюдаемое значение критерия: 1,752621.
Вычислим критические значения критерия. Функция FРАСПОБР(вероятность;степени_свободы1;
степени_свободы2) возвращает обратное значение для F-распределения вероятностей.
Зададим уровень значимости α = 0,05. В ячейки D5иD6введём соответственно формулы: =FРАСПОБР (0,05; 9; 10) и =FРАСПОБР(0,025; 9; 10). Получим в ячейках D5 и D6 критическиезначения Fкр.: 3,020383 и 3,778963.
Если в качестве альтернативной гипотезы рассматривается гипотеза H1: D(Y)> D(X), то уровню значимости α = 0,05 и степеням свободы k1 = 9 и k 2= 10 соответствует Fкр.= 3,020383. Так как Fнабл < . Fкр., то гипотеза H0: D(X) = D(Y) принимается.
При альтернативной гипотезе H1: D(Y) ≠ D(X)в качестве критического значения принимается Fкр.= 3,778963, также нет оснований отвергать нулевую гипотезу (1,752621<3,778963).
Вывод: нет оснований считать, что станки работают с различной точностью.
Для проверки гипотезы о равенстве дисперсий можно использовать функцию ФТЕСТ(Массив 1, Массив 2), которая определяет расчётное значение уровня значимости p в случае двусторонней критической области.
Введём в свободную ячейку, например в D7, формулу:
=ФТЕСТ(A2:A12; B2:B11). Получим результат: 0,394. (Уровень значимости для двусторонней критической области, а для односторонней - 0,197). Так как p > 0,05, то гипотеза H0 принимается на уровне значимости p.
Проверим нулевую гипотезу с помощью инструмента Пакета анализа «Двухвыборочный F-тест для дисперсии».Перейдём на вкладку Данные и в группе Анализ нажмём кнопку Анализ данных. В диалоговом окне Анализ данных выберем инструмент
«Двухвыборочный F-тест для дисперсии» и в окне диалога введём следующие значения:
Нажмём кнопку ОК и получим следующий результат:
В таблице результатов: df ‒ число степеней свободы; . Так как , то альтернативная гипотеза формулируется как H1: D(X) < D(Y) и строится левосторонняя критическая область в интервале (0; 0,331). Так как Fкр.= 0,331083845. Fнабл > Fкр., следовательно наблюдаемое значение критерия не попадает в критическую область, и нулевую гипотезу следует принять. Значение левосторонней критической точки (показатель F критическое одностороннее) рассчитывается по формуле: =FРАСПОБР (1-0,05;10; 9).
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2025 stydopedia.ru Все материалы защищены законодательством РФ.
|