Сделай Сам Свою Работу на 5
 

Парные сравнения выборочных средних методом Шеффе

 

Дисперсионный анализ позволяет установить достоверность отличия нескольких средних арифметических друг от друга, но он не сообщает, какие именно средние от каких именно средних отличаются. Может статься, например, что действие фактора вызывает более или менее плавное изменение средних без заметных переломов в этой тенденции. При этом биологический вопрос может состоять в том, чтобы определить минимальную дозу фактора, которая по сравнению с контролем значимо влияет, изменяет среднюю для этой градации, т. е. определить "первую действующую концентрацию". Казалось бы, этот вопрос относится к задаче сравнения двух выборок: контрольная выборка поочередно сравнивается с выборками, полученными для все возрастающих доз фактора, а первое достоверное отличие средних как раз и означает, что данная доза уже "действующая". Однако с точки зрения статистики такое сравнение оказывается некорректным и неточным.

При таком "лобовом" попарном сравнении выборок одна из них (для градации контроля) все время участвует в этой процедуре, на основании которой формулируются разные статистические выводы о достоверности отличий средних с той или иной вероятностью. Тем самым эти выводы оказываются зависимыми друг от друга. Доверительная вероятность каждого из этих выводов, поэтому, от сравнения к сравнению уменьшается! Чем больше выводов сделано на одном и том же материале, тем меньше вероятность их справедливости.

Второе негативное обстоятельство связано с тем, что такая процедура учитывает далеко не всю информацию о явлении. Действительно, изменчивость вариант комплекса выборок (в нашем примере было 14 вариант в 4 выборках) определяется как действием изучаемого фактора, так и множеством других не учитываемых, случайных, причин. При сравнении же всего двух выборок (например, выборок 1 и 4) эта случайная изменчивость представлена не всем объемом информации, но только той частью, что проявилась в рамках этих двух сравниваемых выборок (две выборки содержат лишь 7 вариант). Поэтому оценки случайной изменчивости для двух выборок оказываются не столь точными, как могли бы быть по всем градациям.



Улучшить ситуацию позволяет метод попарного сравнения выборок, проводимый на базе однофакторного дисперсионного анализа (метод Шеффе). Для сравнения двух средних предлагается критерий F Фишера, в числителе которого стоит оценка действия фактора (разность средних) для любых двух сравниваемых градаций, а в знаменателе – оценка случайной изменчивости, общая для всего дисперсионного комплекса:

,

где M – средние арифметические для любых двух (i, j) градаций однофакторного дисперсионного комплекса,

S²случ.– оценка случайной изменчивости из таблицы дисперсионного анализа,

k – число градаций фактора,

ni, nj – объемы выборок сравниваемых градаций,

α – принятый уровень значимости (обычно α = 0.05)

df – число степеней свободы df1= k–1, df2 = (k–1)∙(n–1).

Отличия средних считаются достоверными, если расчетное значение критерия Фишера превысит табличное F(α,df1,df2) (табл. 7П).

Сопоставляя выборочные средние для первой и четвертой градаций нашего примера (табл. 7.3), имеем:

F1,4= (5.8–8)²/[(4–1)∙ 0.82∙(1/4+1/3)] = 3.37,

df1= 4–1 = 3; df2 = (4–1)∙(14–1) = 39,

F(0.05,3,39) = 2.87.

Полученное значение (3.37) больше табличного (2.87), следовательно, между средними арифметическими первой и последней градаций есть достоверное отличие; разные дозы фактора действительно вызывают изменение плодовитости дафний.

Сравнение выборок первой и второй градаций показывает, что низкие дозы фактора в них не позволяют говорить о существенном влиянии на дафний: для данных объемов выборок полученное значение критерия (0.69) меньше табличного (2.87).

F = (5.8–6.8)²/[(4–1)∙ 0.82∙(1/4+1/3)] = 0.69 < 2.87.

 

Непараметрический однофакторный дисперсионный анализ

Рассмотренные выше схемы дисперсионного анализа исходили из предположения о нормальном распределении изучаемого результативного признака. Когда для какого-либо признака нет уверенности, что выполняется предположение о нормальном распределении изучаемого признака, когда требуется провести анализ быстро и без особой точности, когда мало данных или они выражены качественными признаками, можно использовать схему непараметрического дисперсионного анализа. Этот метод более неприхотлив, но менее точен, нежели параметрический анализ. Он исследует распределения вариант в нескольких выборках. Нулевая гипотеза состоит в том, что распределения одинаковы, т. е. выборки вязы из одной генеральной совокупности.

Порядок вычислений состоит в том, что все варианты ранжируются в порядке возрастания. Затем суммируются ранги вариант по каждой выборке отдельно и рассчитывается критерий:

~ χ²(α,k–1),

где n – число всех вариант,

nj – объем j-й градации фактора,

Rj – сумма рангов для каждой j-й градации фактора,

k – число градаций фактора (j = 1, 2, … k).

 

При объеме выборок больше 5 вариант статистика H имеет распределение хи-квадрат с df = k–1 степенями свободы и сравнивается со значениями из табл. 9П.

Применим эту схему (табл. 7.4) к нашим данным из табл. 7.3, расположив их в строку.

 

№ п/п
Градация
Значение

 

Затем упорядочим и ранжируем. Для нескольких одинаковых значений берется средний ранг.

 

№ п/п
Градация
Значение
Ранг 1.5 1.5 7.5 7.5 7.5 7.5 11.5 11.5 11.5 11.5

 

Наконец, разнесем ранги по градациям и подсчитаем необходимые суммы.

Таблица 7.4

Градация
Значение
Ранг, R 1.5 1.5 7.5 7.5 11.5 7.5 11.5 11.5 7.5 11.5
Сумма, R       14.5           30.5    
n                    
R²/n       52.56       182.3     310.1    

 

Общий объем выборки равен n = 14. Величина критерия H составит:

.

По таблице хи-квадрат для α = 0.05 и df = 4–1 = 3 находим χ²(0.05,3) = 7.81. Полученное значение критерия (14.86) больше табличного (7.81), значит, отличие выборочных распределений достоверно. Химическая добавка действительно изменяет плодовитость дафний.

 

 



©2015- 2022 stydopedia.ru Все материалы защищены законодательством РФ.