Сделай Сам Свою Работу на 5

Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок.





МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ

ДЛЯ ПРЕПОДАВАТЕЛЯ

по дисциплине «Доказательная медицина»

для специальности 060101–Лечебное дело (очная форма обучения)

К ПРАКТИЧЕСКОМУ ЗАНЯТИЮ № 5

ТЕМА: «Методы сравнительной статистики»

 

Утверждена на кафедральном заседании

протокол № __3__ от «_12_» октября 2011 г.

 

Заведующий кафедрой к.м.н., доцент________(подпись) Шульмин А.В.

 

Составители:

к.м.н., доцент ________ (подпись) Козлов В.В.

 

к.ф-м.н., доцент ________(подпись) Аршукова И.Л.

 

ассистент ________ (подпись) Добрецова Е.А.

 

Красноярск


 

Наиболее часто встречающейся и достаточно сложной математико-статистической задачей является сравнение данных, полученных в процессе наблюденийилиэкспериментов в выборочных совокупностях. Исследователь старается описать результаты наблюдения количественными методами и «на выходе» получает числовой массив тех или иных доступных ему измерений - вариационный ряд. Однако, как правило, содержащаяся в результатах измерений содержательная информация, имеет гораздо большую ценность при сравнении ее с аналогичной информацией, но полученной некоторым иным образом. Например, это может быть ситуация сравнения опытных данных (когда мы как-то повлияли на изучаемый объект или явление) с контрольной группой, в которой никакого воздействия на объект наблюдения не было. Возможно и сравнение двух вариантов опытов. Возможно сравнение двух серий наблюдений, разделенных в пространстве и времени и т.п.



Допустим, что удается заметить какие-либо численные различия в характеристиках сравниваемых рядов. Первым делом возникает вопрос: какова вероятность, что эти различия неслучайны, и будут систематически повторяться в дальнейшем при воспроизведении условий эксперимента или наблюдения, т.е. выявленные различия являются статистически значимыми.

 

Выбор подходящего метода сравнения выборочных совокупностей определяется несколькими факторами: характером сравниваемых признаков (качественные или количественные), числом сопоставляемых групп, зависимостью или независимостью выборок, а также видом распределения признака.



Выборки являются независимыми, если набор объектов исследования в каждую из групп осуществлялся независимо от того, какие объекты исследования включены в другую группу. Так, в частности, происходит при рандомизации, когда распределение объектов происходит случайным образом. Примером сравнения независимых выборок может служить сопоставление данных анализа крови в группе пациентов с аналогичными показателями в группе здоровых.

Группы являются зависимыми (связанными) в динамических исследованиях, когда изучаются одни и те же объекты в разные моменты времени. Например, показатели анализа крови у одних и тех же пациентов до и после лечения.

От вида распределения и типа исследуемого признака зависит выбор подходящего математико-статистического критерия. Критерии делятся на два типа – параметрические и непараметрические.

Параметрические критерии – критерии, основанные на оценке параметров распределения, к которым относятся среднее арифметическое, среднеквадратическое отклонение, дисперсия. Они применимы только в том случае, если численные данные подчиняются нормальному распределению. Если распределение отличается от нормального, следует пользоваться так называемыми непараметрическими критериями.

Непараметрические критерии не основаны на оценке параметров распределения и вообще не требуют, чтобы данные подчинялись какому-то определенному типу распределения. Непараметрические критерии дают более грубые оценки, чем параметрические, но являются более универсальными. А параметрические методы более точны, но лишь в случае, если правильно определено распределение совокупности.



 

Перед тем как перейти к рассмотрению статистических критериев, введем понятия нулевой и альтернативной гипотез, которые нам потребуются в дальнейшем.

На каждом шаге процесса анализа данных выдвигаются две гипотезы. Первая обозначается и называется нулевой гипотезой. Вторая гипотеза обозначается и носит название альтернативной, т.е. противоположной по смыслу. Под «нулевой гипотезой» подразумевается допущение об отсутствии того или иного интересующего исследователя события, явления или эффекта, а под «альтернативной» - о его наличии. Обе гипотезы, как бы они не были сформулированы, обязательно должны иметь взаимоисключающее содержание.

Нулевая гипотеза не может быть отвергнута, если ее вероятность окажется выше некого наперед заданного уровня α, достаточно близкого к 0, т.е. . Эта величина α носит название уровень значимости нулевой гипотезы.

Альтернативная гипотеза может быть принята лишь в том случае, если ее вероятность достигнет некого наперед заданного уровня β или превзойдет его, т.е. . Эта величина β – уровень доверительной вероятности. И соответствует «уровням безошибочных прогнозов», т.е. вероятностям 095, 0.99 и 0.999 – это область практически достоверных событий. Соответственно, α очерчивает область событий практически невозможных с порогами вероятностей 0.05, 0,01 и 0.001.

Поскольку и – альтернативные гипотезы, то их суммарная вероятность равна единице. Следовательно, рост вероятности одной из гипотез автоматически приводит к снижению вероятности другой. Например, если , это означает то, что будет выполняться условие . И в этом случае нулевая гипотеза может быть отвергнута как событие практически невозможное, а альтернативная должна быть принята как событие практически достоверное. Если же , то . И в этой ситуации нулевая гипотеза не может быть отвергнута, а альтернативная не может быть принята.

Например, в процессе исследования ставится задача доказать наличие статистически значимых различий между результатами наблюдений в опытной и контрольной группах, это значит что данные, полученные при применении того или иного статистического критерия должны позволить отвергнуть нулевую гипотезу об отсутствии указанных различий.

Параметрические критерии

Заключение о случайности или неслучайности различий между выборочными совокупностями при использовании параметрических критериев осуществляется на основании сравнения параметров распределений, т.е. сводных числовых характеристик. Каждый из параметров компактно в виде одного единственного числа отражает некие характерные свойства распределения данной случайной величины. Они являются количественными мерами этих свойств. На практике, как правило, рассматривают лишь два параметра - среднее значение, являющееся «мерой положения математического центра» полученного вариационного ряда, и дисперсию, но чаще всего корень из нее - стандартное отклонение, являющиеся мерой вариации. Для этих параметров разработаны два наиболее популярных параметрических критерия: критерий Стьюдента и критерий Фишера.

Критерий Стьюдента (t-критерий) – критерий, основанный на сравнении средних значений выборок. Критерий Стьюдента является наиболее известным. С одной стороны, анализ средних значений сравнительно прост для вычислений. С другой стороны, средние величины наиболее наглядны и понятны.

Наиболее часто t-критерий используется в двух вариантах. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и опытная группа, состоящая из разных пациентов, количество которых в группах может быть различно. Во втором же случае используется так называемый парный t-критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп.

Критерий Стьюдента для независимых выборок:

Рассмотрим выборку объемом - пусть среднее вариант этой выборки равно М1, среднеквадратичное отклонение . И выборку объемом со средним М2, среднеквадратичным отклонением . При этом М1≠М1 а выборки подчиняются нормальному закону распределения. Обозначим разницу средних значений выборок .

Нулевая гипотеза в данном случае гласит: «Наблюдаемая разница между выборочными средними была получена случайным образом. не выходит за пределы своих собственных случайных колебаний». Как говорилось выше, нулевая гипотеза не может быть отвергнута, если ее вероятность превысит некоторый порог , называемый уровнем значимости.

Альтернативная гипотеза утверждает противоположное: «Наблюдаемая разница между выборочными средними не могла быть получена случайным образом. Наблюдаемая разница средних выходит за пределы возможных случайных колебаний». Альтернативная гипотеза может быть принята, если ее вероятность сравняется с некоторым порогом или превысит его.

Проверка гипотез производится при помощи критерия Стьюдента, обозначаемого символом :

где - стандартная ошибка или мера отклонения наблюдаемой разницы выборочных средних от теоретически возможной, «генеральной». Формально величина t показывает, во сколько раз разница выборочных средних превышает свою собственную случайную вариацию.

 

В случае независимых выборок критерий t рассчитывается следующим образом:

При этом как для первой, так и для второй выборки стандартная ошибка m рассчитывается по формуле:

Полученное значение критерия t сравнивают со стандартным табличным значением t-критерия Стьюдента для выбранного уровня значимости и числа степеней свободы .

Если , нулевая гипотеза не может быть отвергнута и различие выборочных средних считается «статистически незначимым» (при этом обязательно указывается, при каком уровне значимости это имеет место).

Если , то это означает что величина d оказалась за пределами своих собственных случайных колебаний. Такое различие называют «статистически значимым», т.е. нулевая гипотеза может быть отвергнута. Достоверность в статистическом смысле обозначает, что полученное различие предсказуемо: при повторении эксперимента или наблюдения в тех же условиях оно будет воспроизводиться с вероятностью β или более.

Например, при сравнении двух групп критерий tкр равен 2, и если полученное значение t больше 2, то различие статистически значимо и это можно утверждать с вероятностью безошибочного прогноза, равной 95 % (при tкр = 3 и более - с вероятностью безошибочного прогноза - 99 %). Величина критерия менее 2 свидетельствует об отсутствии статистической значимости различий сравниваемых показателей.

Пример:

Имеется две группы пациентов, численностью 247 и 116 человек. Средний возраст пациентов первой группы наблюдения составил 32,06±9,62 лет (М±σ), средний возраст пациентов второй группы – 39,22±6,39 лет. Сравним 2 группы пациентов по возрасту при условии, что возраста в обеих группах были распределены нормально.

В начале рассчитаем стандартные ошибки для возрастов в каждой группе.

Поскольку t больше tкр =3, то нулевая гипотеза отвергается и различия между группами по возрасту можно считать статистически значимыми (р<0,01).

Критерий Стьюдента для зависимых выборок:

Рассмотрим теперь случай зависимых выборок. Это такие массивы данных, в которых каждому числовому значению одной выборки обязательно соответствует парное, причинно и следственно связанное значение другой выборки. Это имеет место, когда какие-либо характеристики состояния организма регистрируются до некоторого воздействия на него и после или при разных вариантах воздействия, но обязательно у одних и тех же людей. Простейший пример, когда у некой группы людей измерили частоту пульса и величину артериального давления, потом попросили сделать, скажем, 20 приседаний, и провели те же измерения повторно. Понятно, что реакция сердечно-сосудистой системы каждого человека будет весьма индивидуальной, причем результаты измерений, полученные «после того», будут находиться в причинной и «исторической» связи с исходным состоянием «до того», т.е. в зависимости от них.

В этом случае при обнаружении ненулевой разницы выборочных средних результатов «до того» и «после того» также рассчитывается критерий

Однако, величина рассчитывается иным образом:

- это разница парных вариант: , квадрат которой, как видно из формулы, суммируется по всем парам.

Величина в данном случае зависит от того, насколько однородно будет изменяться измеряемая характеристика у разных объектов исследуемой группы. Действительно, если различие в каждой паре значений, полученных «до» и «после», будет нестабильно ( примерно с одинаковой вероятностью будет иметь то положительный, то отрицательный знак) или малосущественно (достаточно часто будут появляться нулевые парные разницы), то разница выборочных средних , естественно, будет стремиться к нулю. При этом непременно окажется больше нуля, даже в том крайнем случае, когда среди всех сравниваемых пар будет только одна единственная ненулевая разница. Напротив, если все парные различия будут иметь один и тот же знак (будут однонаправленными), то выборочные средние «до» и «после» существенно разойдутся на числовой оси и, соответственно, величина d окажется достаточно велика. Это приведет к снижению и, следовательно, увеличению критерия Стьюдента.

Проверка справедливости гипотез при этом производится так же, как и для независимых выборок:

- если , то различие выборочных средних признается статистически значимым;

- если , разница признается незначимой.

Различие лишь в том, что число степеней свободы для определения табличного значения в данном случае составляет , где n – число сравниваемых пар.

 

Упомянем также о ситуации, когда для установления достоверности различия средних результатов никаких расчетов с применением критерия Стьюдента просто не требуется. Это возможно в ситуации, когда максимальное значение одного из сравниваемых выборочных вариационных рядов заведомо меньше минимального значения другого вариационного ряда. Иными словами, значения обоих выборок занимают совершенно разные, не накладывающиеся друг на друга даже частично области на числовой оси. Если такое имеет место, то критерий Стьюдента лишь подтвердит заведомую достоверность различий средних значений сравниваемых выборок. Однако, такая «экспресс-оценка» достоверности возможна лишь в том случае, если сравниваемые выборки достаточно представительны - имеют объем порядка полутора десятков значений или более.

 

Критерий Фишера – критерий сравнения выборочных дисперсий.

На практике часто встречается ситуация, когда факторы, влияющие на состояние изучаемых объектов, вызывают не только и даже не столько сдвиг этих характеристик на числовой оси, сколько усиливают или ослабляют их межиндивидуальное разнообразие.

Количественным индикатором этих изменений является различие выборочных дисперсий. Однако, как всякая выборочная числовая характеристика, выборочная дисперсия величина случайная. Следовательно, наблюдаемое различие дисперсий тоже может оказаться случайным. Таким образом, к выборочным оценкам дисперсии полностью приложимы все те рассуждения, о которых шла речь при обсуждении источников различия выборочных средних.

Дисперсия имеет распределение c2 (распределение Пирсона), поэтому для ее анализа критерий Стьюдента неприменим. Для того, чтобы приблизить распределение к нормальному рассматривают разность логарифмов сравниваемых дисперсий, которая обозначается символом Z:

Величина Z имеет нормальное распределение и, соответственно, к ней может быть применен критерий Стьюдента.

На практике часто рассматривают отношение F большей из сравниваемых дисперсий к меньшей (следуя свойствам логарифмов):

Полученная величина критерия сравнивается с критическим табличным значением. И также как в предыдущих рассуждениях, нулевая гипотеза либо отвергается и различие выборочных дисперсий считается статистически достоверным, либо делается вывод, что нулевую гипотезу отвергнуть нельзя и разница выборочных дисперсий находится в границах практически возможных случайных колебаний.

Если на независимых выборках была обнаружена достоверность различия дисперсий, то их средние значения нельзя сравнивать по t- критерию Стьюдента!

Рассмотренный метод сравнения мер вариации и его модификации являются основой чрезвычайно мощного и информативного метода математико-статистического анализа данных, получившего название дисперсионный анализ.

 

Непараметрические критерии

Параметрические критерии обладают высокой информативностью, поскольку позволяют не только обнаружить достоверность различий, но и точно, конкретно демонстрируют их характер и степень. Однако, при всех несомненных достоинствах параметрические критерии обладают и рядом существенных недостатков - ограничениями их применимости. Самый серьезный из них - допущение о нормальности распределения сравниваемых величин. Втрое ограничение - непригодность таких критериев к выборкам малого объема (<10-15 измерений). На таких выборках параметры распределения (средние, дисперсии) могут резко измениться от добавления или убавления даже одного единственного числа. Третье – высокая чувствительность к артефактам, которые оказывают сильное слияние на параметры распределения, вызывая сдвиг средних значений в ту или иную сторону. В результате может «всплыть» различие, которого на самом деле нет или наоборот - оказаться «зашумленной» действительная разница. Влияние артефактов особенно велико на малых выборках. Специфика же медицинской работы состоит в том, что из-за сложности исследуемых процессов и явлений они, как правило, имеют дело именно с выборками малого объема, имеющими неизвестный закон распределения, часто полученными в результате достаточно грубых измерений, «нашпигованными» артефактами.

Для извлечения содержательной информации из числовых массивов такого рода были разработаны непараметрические критерии. Это критерии, применение которых не требует пересчета массивов исходных данных в компактно заменяющие их параметры распределения - средние значения, дисперсии или стандартные отклонения и т.д. - и их последующее сравнение.

Как следствие, не только теряет силу требование «нормальности» генеральной совокупности, но и, более того, закон распределения сравниваемых величин вообще не играет никакой роли. Особые, достаточно простые, способы преобразования исходных данных делают эту группу критериев еще и практически нечувствительными к артефактам. В результате, непараметрические критерии успешно работают даже на чрезвычайно малых выборках при наличии грубых измерений и грубых ошибок.

Рассмотрим критерии Манна-Уитни и Вилкоксона.

Критерий Манна-Уитни и критерий Вилкоксона – критерии ранговые, т.е. основанные на сравнении сумм рангов, полученных тем или иным образом из сравниваемых выборочных распределений. В данном конкретном случае рангом называется порядковый номер числа в ранжированном (расставленном в порядке возрастания) массиве данных – чем больше число, тем выше его ранг. При этом, если числа не повторяются, то их ранги в точности соответствуют их порядковым номерам. Если же некое число повторяется несколько раз, то всем им приписывается средний ранг. Продемонстрируем, как все это происходит и выглядит. Допустим, мы получили следующий вариационный ряд данных x:

5.6 11.7 -3.5 6.3 8 7.4 0.5 8 3 3.1 15.2 3.1 8 6.7 111 4.4

Здесь числа представлены в том порядке, как они были получены.

Расставим их в порядке возрастания и припишем порядковые номера, а также ранги R:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
x -3.5 0.5 3 3.1 3.1 4.4 5.6 6.3 6.7 7.4 8 8 8 11.7 15.2 111
R 1 2 3 4.5 4.5 6 7 8 9 10 12 12 12 14 15 16

Из приведенного примера хорошо видно, что при ранжировании происходит «линеаризация данных» - сглаживание их резких колебаний за счет того, что ранг числа не зависит от его абсолютной величины и разницы с соседними вариантами. Например, последнее число 111 чуть ли не на порядок превышает ближайшее к нему 15.2. Тем не менее, ранг его всего на 1 выше, чем у предпоследнего числа.

Ранговые критерии для сравнения выборочных совокупностей делятся на две группы – для независимых и зависимых выборок.

Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок.

Рассмотрим этот критерий на примере. Допустим, получены следующие данные о величине ЧСС в двух группах детей 2-3 и 4-5 лет:

x(2-3 года): 102, 87, 105, 110, 99, 90 (nx=6)

y(4-5 лет): 98, 100, 88, 92, 83, 95, 100, 92, 85, 94 (ny=10)

Сначала выборки смешивают и ранжируют как одну совокупность:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
83 85 87 88 90 92 92 94 95 98 99 100 100 102 105 110
R 1 2 3 4 5 6.5 6.5 8 9 10 11 12.5 12.5 14 15 16

Полученные ранги приписывают числам исходных рядов и подсчитывают их суммы:

x(2-3 года) 102 87 105 110 99 90  
Rx 14 3 15 16 11 5
y(4-5 лет) 98 100 88 92 83 95 100 92 85 94  
Ry 10 12.5 4 6.5 1 9 12.5 6.5 2 8

Далее полученные суммы включают в специальную формулу для подсчета критерия U:

В нашем примере получаем , .

В качестве берут меньшее из полученных значений (т.е. 17) и сравнивают его с критическими значениями, взятыми из специальной таблицы: для и для . Поскольку , нулевую гипотезу отвергнуть нельзя даже для и различие уровней ЧСС следует признать статистически незначимым.

Чтобы говорить о статистически значимых различиях, должно выполняться условие .

 

Критерий парных сравненийВилкоксона – ранговый критерий для сравнения зависимых выборок.

Рассмотрим его на примере. У 10 здоровых взрослых людей измеряли кровяное давление после введения кофеина и плацебо. Получены следующие данные для «верхнего», систолического давления СД:

x(кофеин)
y(плацебо)

Возникает вопрос, можно ли на основании этих данных полагать, что кофеин оказывает физиологическое действие.

Вначале значения одного ряда строго попарно вычитают из значений другого с учетом знака разницы d. Вычтем нижний ряд из верхнего:

 

x(кофеин)
y(плацебо)
d -4 -10

Далее разницы ранжируют по известным правилам, но при этом не учитывают знак разницы (т.е. ранжируют по модулю).Нулевую пару отбрасывают.

d -4 -10
R 1.5 1.5 7.5 7.5

Отдельно суммируют ранги для положительных и отрицательных разниц. В нашем случае получаем: , . В качестве значения критерия Tz берут меньшую сумму независимо от знака, т.е. Tz =11.5. Сравниваем это значение с «критиче­ским» из специальной таблицы, входом в которую является число сравниваемых пар, но лишь тех, которые не дают нулевые разницы. В нашем случае таковых 9. Тогда Tкр = 6 для и Tкр =2 для . Поскольку даже для первого уровня значимости, различий уровней СД нулевую гипотезу отвергнуть нельзя и различия не являются статистически значимыми (р<0,05). Иными словами, у нас нет пока оснований утверждать, что действие кофеина носит исключительно физиологический характер.

Смысл теста состоит в следующем. Если бы мы имели бесконечно большой ряд случайных разниц, то число и величина положительных разниц равнялись бы числу отрицательных и, соответственно, суммы их рангов были бы равны. На конечном и ограниченном числовом массиве опять же чисто случайно может иметь место «перекос» в сторону преимущественно положительных или отрицательных разниц. Это обстоятельство и учитывается в критических значениях критерия.

Tкр - это граница между практически возможными и практически невозможными значениями критерия. Соответственно, если , то полученная нами сумма рангов с достаточно высокой вероятностью могла возникнуть чисто случайно и о сдвиге одного числового ряда относительно другого ничего определенного сказать нельзя. Это недостоверное различие. Если же , то наблюдаемое различие положительных и отрицательных разниц не могло быть получено случайным образом. Это означает, что смещение значений в сопоставляемых числовых рядах объясняется действием какой-то систематически действующей, неслучайной причины, т.е. носит статистически достоверный (устойчивый и прогнозируемый) характер.

Как было показано выше, пары, имеющие одинаковые числовые значения и, соответственно, дающие нулевые разницы, исключаются из рассмотрения. И если таких случаев много, то «жесткость» критерия нарастает, поскольку Tкр тем меньше, чем меньше сравниваемых пар. Соответственно, увеличивается число ситуаций, когда нулевую гипотезу отвергнуть невозможно, и различие будет считаться незначимым. Более того, если число пар окажется меньше 6, то критерий Вилкоксона вообще перестанет «работать»: 6 - минимальное число пар, для которого еще существует Tкр. Для меньшего числа его просто невозможно рассчитать. А подобные ситуации в медико-биологической практике возникают довольно часто, поскольку многие измерения неизбежно приходится выполнять с достаточно высокой степенью грубости, и вероятность появления совпадающих значений здесь все еще весьма высока.

Критерий согласия Пирсона (критерий c2)

Критерии согласия позволяют определить степень соответствия эмпирических и теоретических распределений вероятностей, а также двух эмпирических распределений, полученных, например, в «контроле» и «опыте» или в различных вариантах «опыта» или «наблюдения». Этот критерий позволяет проверить гипотезу о схожести фактического, полученного на практике, распределения вероятностей случайной величины и теоретического.

Данный критерий может использоваться, например для сравнения частот встречаемости качественных или порядковых признаков в выборочных совокупностях.

Критерий записывается следующим образом:

c2

где k – число классов ряда распределения, - фактические (наблюдаемые) частоты встречаемости случайной величины в каждом i-ом классе (в виде целых чисел), - теоретически ожидаемые (вычисленные) частоты для данного класса, разница между ними.

Таким образом, c2 представляет собой вовсе не квадрат какого-то числа, а сумму по всем классам распределения данной случайной величины (от 1-го до k-го), величины квадратов разницы фактических и теоретических частот в каждом классе, отнесенных к теоретическим частотам для этих же классов.

Допустим, что по каждому классу распределения , т.е. фактические (наблюдаемые) и ожидаемые (вычисленные) частоты идеально совпадают. Тогда и, соответственно, c2= 0. Понятно, что такого рода ситуация может иметь место только в том случае, когда форма эмпирического распределения абсолютно идентична форме теоретической модели, рассчитанной по эмпирическим данным.

Допустим теперь, что хотя бы для одного из сравниваемых классов эмпирического и теоретического распределений, то есть для какого-то одного из них . Поскольку мы имеем дело с «суммой квадратов», то c2 автоматически станет больше нуля. Чем больше будет таких различий для разных классов и чем значительнее сами различия, тем больше будет «набегать» сумма квадратов. Следовательно, при различии наблюдаемых и ожидаемых частот сравниваемых распределений c2 может принимать любые положительные значения, вплоть до бесконечности. Нетрудно представить, что чем менее схожей будет форма сравниваемых распределений, тем большие числовые значения будет принимать c2 и, само собой, наоборот. Иными словами, c2 является мерой сходства/различия формы сравниваемых распределений вероятностей.

Технология использования критерия «Хи-квадрат» чрезвычайно проста. По приведенной выше формуле подсчитывается «экспериментальное» значение «Хи-квадрат» cэ2, которое сравнивают с табличным или «критическим» значением cкр2, взятым сообразно наличному числу степеней свободы). Далее, как всегда, проверяется выполнение двух неравенств:

- если cэ2< cкр2, то разница наблюдаемых (фактических) и ожидаемых (теоретических) частот сравниваемых распределений незначительна и не выходит за рамки ее собственных случайных колебаний, не превышает критического порога «возможного». Это не позволяет отвергнуть «нулевую гипотезу», согласно которой имеющие место различия частот носят случайный характер.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.