Уровень значимости. Критическая область

Основы теории проверки статистических гипотез.

Понятие статистической гипотезы

Статистическая гипотеза - это предположение о виде распределения или о величинах неизвестных параметров генеральной совокупности, которая может быть проверена на основании выборочных показателей.

Примеры статистическихгипотез:

Генеральная совокупность распределена по закону Гаусса (нормальному закону).

Дисперсии двух нормальных совокупностей равны между собой.

Для оценки величины генеральных параметров по выборочным показателям в биологии используется так называемая нулевая гипотеза, т.е. предположение о том, что генеральные параметры, о которых судят по выборочным данным, не отличаются друг от друга, и что разница, наблюдаемая между выборочными показателями, носит не систематический, а исключительно случайный характер.

Вместе с выдвинутоЙ гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место альтернативная ей гипотеза. Целесообразно их различать.

Нулевой (Но) называют выдвинутую гипотезу.

Альтернативной (Н₁) - гипотезу, противоречащую нулевой.

Различают гипотезы, которые содержат только одно и более одного предположений.

Гипотезу, содержащую только одно предположение называют простой,

а гипотезу, которая состоит из конечного или бесконечного числа простых гипотез - сложной.

Следует подчеркнуть статистический характер описанного метода проверки нулевой гипотезы, выражаемый, в частности, в том, что утверждение о справедливости нулевой гипотезы принимается не абсолютно, а лишь при некотором уровне значимости.

УРОВНЕМ ЗНАЧИМОСТИ называют процент маловероятных случаев, которые противоречат принятой гипотезе, ставят её под сомнение.

В биологических исследованиях обычно принимают уровень значимости 5%, которому соответствует вероятность Р=0,05.

В более ответственных случаях, когда выводы должны быть особенно строгими, принимается уровень значимости

1% или Р=0,01 и

0,1% или Р = 0,001.

Таким образом, вероятность, которой решено пренебречь при оценке генеральных параметров по данным выборочных наблюдений, выражается принятым уровнем значимости.

Вероятность же обратных случаев, когда гипотеза заслуживает доверие, называется ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТЬЮ.

Обычно в исследовательской практике при меняют три порога доверительной вероятности:

Р₁=0,95; Р₂=0,99; Р₃=0,999

Вероятности Р₁=0,95; соответствует t = 1,96

Р₂=0,99; cоответствует t = 2,58

Р₂=0,999; cоответствует t = 3,29

Величина доверительной вероятности или уровень значимости при проверке гипотез устанавливается самим исследователем в зависимости от степени точности, с какой проводится исследование и ответственности выводов, вытекающих из него.

Если Р≥0,05 или же Р<0,95, то отвергать нулевую гипотезу нет оснований.

Если Р<0,05 или Р≥0,95, нулевая гипотеза отвергается.

Ошибки 1 и 11 рода. Критерий значимости.

Уровень значимости. Критическая область

Решение об отклонении или принятии статистической гипотезы принимается по выборочным данным. Поэтому приходитcя считаться и с возможностью ошибочного решения. Различают ошибки I и II рода.

Ошибка 1 родасостоит в том, что будет отвергнута правильная гипотеза (т.е. будет отвергнута нулевая гипотеза, в то время, когда она верна)

Ошибка 1I родасостоит в том, что будет принята неправильная гипотеза (т.е. будет принята нулевая гипотеза, в то время, когда она не верна)

При отбрасывании нулевой гипотезы есть вероятность того, что она все-таки верна (т.е. мы совершаем ошибку I-ro рода), эту вероятность обозначают α. Вероятность α называется уровнем значимости.

Уровень значимости α - это вероятность совершить ошибку

I рода.

Вероятность ошибки II рода обозначают ß, а величину

1-ß-называют мощностью критерия.

Чем больше мощность, тем вероятность ошибки II рода меньше.

Допустимый процент возможных ошибок первого рода- вопрос взаимной договоренности, кроме всего прочего здесь должны приниматься во внимание возможные последствия принятия ошибочного решения. Ложные решения, например при экспертизе, могут иметь более серьезные последствия, чем ошибочно декларированная чистота химического реактива. Поэтому в первом случае должны быть предусмотрены более высокая достоверность и, следовательно, более низкое число возможных ошибок 1 рода, чем во втором случае.

Обычно придерживаются следующих правил.

Проверяемая гипотеза отбрасывается, если ошибка 1 рода может появиться в менее чем 100α = 1 % всех случаев (т.е. α 0,01). Тогда рассматриваемое различие считается значимым.

Проверяемая гипотеза принимается, когда ошибка 1 рода возможна в более чем 100α = 5% всех случаев (α 0,05). Тогда рассматриваемое различие считается незначимым.

Рассматриваемую гипотезу надо обсуждать дальше, если число возможных ошибок I рода лежит в интервале между 5% и 1 % (0,01 0,05). Обнаруженная разность интерпретируется как спорная. Часто дополнительные измерения могут прояснить ситуацию. Если по каким-либо причинам дополнительных измерений окажется недостаточно, то полученные данные следует интерпретировать в расчете на самый неблагоприятный случай.

Выбор α - дело договорное, иногда достаточно выбрать 100α = 10%, в отдельных случаях, практически, должна быть исключена возможность ошибочного решения (например, при оценке токсического действия фармацевтического препарата). Тогда проверяемая гипотеза отбрасывается, как только число возможных ошибок 1 рода достигает такого пренебрежительно малого уровня, как, например, 100α = 0,1 %.

Ошибки 1 и II рода зависят друг от друга. Чем меньше будет α, тем больше будет β (и наоборот). Поэтому, нет никакого смысла для проверки значимости выбирать слишком малое значение α, так как из-за этого очень вырастает неизвестное ß. Выбор α относится к фазе планирования эксперимента!

После того, как задались уровнем значимости, находят правило, в соответствии с которым принимается или отклоняется данная гипотеза. Такое правило называется статистическим критерием.

Статистический критерий- правило, в соответствии с которым принимается или отклоняется нулевая гипотеза.

Построение критерия заключается в выборе подходящей функции Т= Т(Х₁, ... ,Хп)от результатов наблюдений Х₁, ...• Х_n, которая служит мерой расхождения между опытными и гипотетическими значениями.

Эта Функция, являющаяся случайной величиной, называется статистикой критерия.

Статистика критерия- специально выработанная случайная величина, функция распределения которой известна.

При этом предполагается, что распределение вероятности Т=Т(₁, ... ,Х_п)может быть вычислено при допущении, что проверяемая гипотеза верна и что это распределение не зависит от характеристик гипотетического распределения.

После выбора определенного критерия множество всех возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая - при которых она принимается, Т.е. на критическую область и область принятия гипотезы.

Критическая область- совокупность значений критерия, при которых нулевую гипотезу отвергают.

Область принятия гипотезы- совокупность значений критерия, при которых нулевую гипотезу принимают.

Основной принцип проверки гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области - гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы - гипотезу принимают.

Поскольку критерий Т = Т(Х₁, ... ,Х_п)- одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами, и, следовательно, существуют точки, которые их разделяют. Такие точки называются критическими.

Критические значения критерия- это точки, отделяющие критическую область от области принятия гипотезы.

Критическое значениеТ_кр находится по распределению статистики Т такое, что если гипотеза верна, то вероятность события (Т критической области) равна α, а - заранее заданный уровень значимости, Т.е. это значение Т_кр статистики Т для которого Р(Т критической области) = α.

Различают односторонюю (правостороннюю или левостороннюю) и двустороннюю критическую области. Они определяются из следующих выражений:

правосторонняя - Р(Т>Т_кр) = α;

левосторонняя - Р(Т<Т_кр) = α

двусторонняя - P(T<T_кр1)+P(T>Tкр2) =аTкр1<Tкр2.

Если распределение критерия симметрично относительно нуля, то Р(Т<-Т_кр) = Р(Т>Т_КР), отсюда получаем Р(Т>Т_кр)= а/2.

Рис. 37. Критические области: левосторонняя, правосторонняя, двусторонняя

Критические точки находят по таблицам, соответствующим распределению критерия.

Критерии значимости делят на параметрические и непараметрические.

Первые строятся на основе параметров выборочной совокупности и представляют функции этих параметров,

вторые - функции от вариант данной совокупности с их частотами.

Параметрические критерии применимы лишь в тех случаях, когда генеральная совокупность, из которой взята выборка, распределяется нормально.

Непараметрические критерии применимы к распределениям самых различных форм. Последние имеют определенные преимущества по сравнению с параметрическими, благодаря меньшим требованиям к их применению, большему диапазону возможностей и, часто, большей простоте реализации. Конечно, нужно считаться и с часто более низкой точностью этих критериев по сравнению с парамстрическими.

Результаты статистических методов проверки часто бывают неудобны для аналитиков. Во многих случаях они делают незначимые (а>О,О5) или спорные различия, хотя на основе субъсктивного опыта уже установлено «истинное» различие. В подобных случаях часто помогают дополнительные измерения. Чем больше получено результатов, тем меньшие различия будут достоверно фиксироваться. Ни в коем случае нельзя соблазнятся заменой точных данных сомнительными на основании субъективной оценки.

Не нашли, что искали? Воспользуйтесь поиском по сайту: