Сделай Сам Свою Работу на 5

Уровень значимости. Критическая область





Основы теории проверки статистических гипотез.

Понятие статистической гипотезы

 

Статистическая гипотеза - это предположение о виде распределения или о величинах неизвестных параметров генеральной совокупности, которая может быть проверена на основании выборочных показателей.

Примеры статистическихгипотез:

Генеральная совокупность распределена по закону Гаусса (нормальному закону).

Дисперсии двух нормальных совокупностей равны между собой.

Для оценки величины генеральных параметров по выборочным показателям в биологии используется так называемая нулевая гипотеза, т.е. предположение о том, что генеральные параметры, о которых судят по выборочным данным, не отличаются друг от друга, и что разница, наблюдаемая между выборочными показателями, носит не систематический, а исключительно случайный характер.

Вместе с выдвинутоЙ гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место альтернативная ей гипотеза. Целесообразно их различать.

Нулевой (Но) называют выдвинутую гипотезу.

Альтернативной (Н1) - гипотезу, противоречащую нулевой.



Различают гипотезы, которые содержат только одно и бо­лее одного предположений.

Гипотезу, содержащую только одно предположение называют простой,

а гипотезу, которая состоит из конечного или бесконечного числа простых гипотез - сложной.

 

Следует подчеркнуть статистический характер описанного метода проверки нулевой гипотезы, выражаемый, в частности, в том, что утверждение о справедливости нулевой гипотезы принимается не абсолютно, а лишь при некотором уровне значимости.

УРОВНЕМ ЗНАЧИМОСТИ называют процент маловероятных случаев, которые противоречат принятой гипотезе, ставят её под сомнение.

В биологических исследованиях обычно принимают уровень значимости 5%, которому соответствует вероятность Р=0,05.

В более ответственных случаях, когда выводы должны быть особенно строгими, принимается уровень значимости

1% или Р=0,01 и

0,1% или Р = 0,001.

Таким образом, вероятность, которой решено пренебречь при оценке генеральных параметров по данным выборочных наблюдений, выражается принятым уровнем значимости.



Вероятность же обратных случаев, когда гипотеза заслуживает доверие, называется ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТЬЮ.

Обычно в исследовательской практике при меняют три порога доверительной вероятности:

Р1=0,95; Р2=0,99; Р3=0,999

Вероятности Р1=0,95; соответствует t = 1,96

Р2=0,99; cоответствует t = 2,58

Р2=0,999; cоответствует t = 3,29

 

Величина доверительной вероятности или уровень значимости при проверке гипотез устанавливается самим исследователем в зависимости от степени точности, с какой проводится исследование и ответственности выводов, вытекающих из него.

Если Р≥0,05 или же Р<0,95, то отвергать нулевую гипотезу нет оснований.

Если Р<0,05 или Р≥0,95, нулевая гипотеза отвергается.

 

Ошибки 1 и 11 рода. Критерий значимости.

Уровень значимости. Критическая область

Решение об отклонении или принятии статистической ги­потезы принимается по выборочным данным. Поэтому приходитcя­ считаться и с возможностью ошибочного решения. Различают ошибки I и II рода.

Ошибка 1 родасостоит в том, что будет отвергнута пра­вильная гипотеза (т.е. будет отвергнута нулевая гипотеза, в то время, когда она верна)

Ошибка 1I родасостоит в том, что будет принята непра­вильная гипотеза (т.е. будет принята нулевая гипотеза, в то вре­мя, когда она не верна)

При отбрасывании нулевой гипотезы есть вероятность того, что она все-таки верна (т.е. мы совершаем ошибку I-ro рода), эту вероятность обозначают α. Вероятность α называется уровнем значимости.

Уровень значимости α - это вероятность совершить ошиб­ку

I рода.



Вероятность ошибки II рода обозначают ß, а величину

1-ß-называют мощностью критерия.

Чем больше мощность, тем вероятность ошибки II рода меньше.

 


 

Допустимый процент возможных ошибок первого рода- ­вопрос взаимной договоренности, кроме всего прочего здесь должны приниматься во внимание возможные последствия при­нятия ошибочного решения. Ложные решения, например при экспертизе, могут иметь более серьезные последствия, чем оши­бочно декларированная чистота химического реактива. Поэтому в первом случае должны быть предусмотрены более высокая достоверность и, следовательно, более низкое число возможных ошибок 1 рода, чем во втором случае.

Обычно придерживаются следующих правил.

Проверяемая гипотеза отбрасывается, если ошибка 1 рода может появиться в менее чем 100α = 1 % всех случаев (т.е. α 0,01). Тогда рассматриваемое различие считается значимым.

Проверяемая гипотеза принимается, когда ошибка 1 рода возможна в более чем 100α = 5% всех случаев (α 0,05). Тогда рассматриваемое различие считается незначимым.

Рассматриваемую гипотезу надо обсуждать дальше, если число возможных ошибок I рода лежит в интервале между 5% и 1 % (0,01 0,05). Обнаруженная разность интерпретируется как спорная. Часто дополнительные измерения могут прояснить си­туацию. Если по каким-либо причинам дополнительных измере­ний окажется недостаточно, то полученные данные следует ин­терпретировать в расчете на самый неблагоприятный случай.

 

Выбор α - дело договорное, иногда достаточно выбрать 100α = 10%, в отдельных случаях, практически, должна быть ис­ключена возможность ошибочного решения (например, при оценке токсического действия фармацевтического препарата). Тогда проверяемая гипотеза отбрасывается, как только число возможных ошибок 1 рода достигает такого пренебрежительно малого уровня, как, например, 100α = 0,1 %.

Ошибки 1 и II рода зависят друг от друга. Чем меньше бу­дет α, тем больше будет β (и наоборот). Поэтому, нет никакого смысла для проверки значимости выбирать слишком малое зна­чение α, так как из-за этого очень вырастает неизвестное ß. Вы­бор α относится к фазе планирования эксперимента!

После того, как задались уровнем значимости, находят правило, в соответствии с которым принимается или отклоняется данная гипотеза. Такое правило называется статистическим критерием.

 

Статистический критерий- правило, в соответствии с ко­торым принимается или отклоняется нулевая гипотеза.

 

Построение критерия заключается в выборе подходящей функции Т= Т(Х1, ... ,Хп)от результатов наблюдений Х1, ...• Хn, которая служит мерой расхождения между опытными и гипотетическими значениями.


Эта Функция, являющаяся случайной величиной, называется статистикой критерия.

Статистика критерия- специально выработанная слу­чайная величина, функция распределения которой известна.

При этом предполагается, что распределение вероятности Т=Т(1, ... ,Хп)может быть вычислено при допущении, что прове­ряемая гипотеза верна и что это распределение не зависит от ха­рактеристик гипотетического распределения.

После выбора определенного критерия множество всех возможных значений разбивают на два непересекающихся под­множества: одно из них содержит значения критерия, при кото­рых нулевая гипотеза отвергается, а другая - при которых она принимается, Т.е. на критическую область и область принятия ги­потезы.

Критическая область- совокупность значений критерия, при которых нулевую гипотезу отвергают.

Область принятия гипотезы- совокупность значений кри­терия, при которых нулевую гипотезу принимают.

Основной принцип проверки гипотез можно сформулиро­вать так: если наблюдаемое значение критерия принадлежит кри­тической области - гипотезу отвергают, если наблюдаемое зна­чение критерия принадлежит области принятия гипотезы - гипо­тезу принимают.

Поскольку критерий Т = Т(Х1, ... ,Хп)- одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия ги­потезы также являются интервалами, и, следовательно, сущест­вуют точки, которые их разделяют. Такие точки называются кри­тическими.

Критические значения критерия- это точки, отделяющие критическую область от области принятия гипотезы.

Критическое значениеТкр находится по распределению статистики Т такое, что если гипотеза верна, то вероятность со­бытия (Т критической области) равна α, а - заранее заданный уровень значимости, Т.е. это значение Ткр статистики Т для кото­рого Р(Т критической области) = α.

Различают односторонюю (правостороннюю или левосто­роннюю) и двустороннюю критическую области. Они определя­ются из следующих выражений:

правосторонняя - Р(Т>Ткр) = α;

левосторонняя - Р(Т<Ткр) = α

двусторонняя - P(T<Tкр1)+P(T>Tкр2) Tкр1<Tкр2.

Если распределение критерия симметрично относительно нуля, то Р(Т<-Ткр) = Р(Т>ТКР), отсюда получаем Р(Т>Ткр)= а/2.

 

Рис. 37. Критические области: левосторонняя, правосторонняя, двусторонняя

Критические точки находят по таблицам, соответствующим распределению критерия.

Критерии значимости делят на параметрические и непара­метрические.

Первые строятся на основе параметров выборочной совокупности и представляют функции этих параметров,

вторые - функции от вариант данной совокупности с их частотами.

Па­раметрические критерии применимы лишь в тех случаях, когда генеральная совокупность, из которой взята выборка, распреде­ляется нормально.

Непараметрические критерии применимы к распределениям самых различных форм. Последние имеют определенные преимущества по сравне­нию с параметрическими, благодаря меньшим требованиям к их применению, большему диапазону возможностей и, часто, большей простоте реализации. Конечно, нужно считаться и с часто более низкой точностью этих критериев по сравнению с парамст­рическими.

Результаты статистических методов проверки часто быва­ют неудобны для аналитиков. Во многих случаях они делают не­значимые (а>О,О5) или спорные различия, хотя на основе субъск­тивного опыта уже установлено «истинное» различие. В подоб­ных случаях часто помогают дополнительные измерения. Чем больше получено результатов, тем меньшие различия будут дос­товерно фиксироваться. Ни в коем случае нельзя соблазнятся заменой точных данных сомнительными на основании субъек­тивной оценки.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.