Сделай Сам Свою Работу на 5

Критерий l Колмогорова – Смирнова





Этот критерий, обозначаемый греческой буквой l (ламбда), можно применять как для оценки расхождения между факти­ческими и теоретическими распределениями, так и для опреде­ления достоверности различий между любыми двумя распределе­ниями частот одного и того же признака, причем даже при неоди­наковом числе классов и частот у этих распределений. По своему назначению и возможностям он напоминает описанный выше критерий хи-квадрат, но более прост в применении. Нулевая гипотеза о случайности расхождения между сопоставляемыми распределениями отвергается и различия счи­таются достоверными, если эмпирическая величина критерия λ превосходит свое критическое значение для принятого порога доверительной вероятности, и наоборот, различия могут считаться случайными (нулевая гипотеза сохраняется), если эмпирический критерий не достигает требуемого значения квантили.

Для сравнения распределений при одинаковом числе клас­сов и одинаковой общей численности групп критерий λ вычисляется по формуле:

,

а при сравнении выборок разного объема:

,

где max|| – максимальная разность (без учета ее знака) между накопленными частотами в сравниваемых рас­пределениях,



a1 и a2частоты первого и второго рядов (это могут быть как две выборки, так и эмпирическое и теоретическое распределения);

п – общее число (сумма) всех вариант совокуп­ности;

п1 и п2 – объемы сравниваемых выборок.

Критерий λ не требует специальной таблицы для оценки значимости отличий, так как для любого числа классов предельные значения критерия λ, соответствующие трем порогам доверительной вероятности (0.95, 0.99 и 0.999), одинаковы и равны соответственно 1.36, 1.63 и 1.95.

Применение критерия λ можно показать на таком примере. Сравнивается плодовитость зимовавших (a1) и прибылых (a2) рыжих полевок, у которых частота встреч выводков разной ве­личины (число эмбрионов на самку, x) отличалась.

Таблица 6.11

x ni
a1
a2
Σa1  
Σa2  
Σa1/n1 0.00 0.00 0.02 0.14 0.39 0.71 0.89 0.97 0.98 0.98 1.00  
Σa2/n2 0.00 0.01 0.02 0.16 0.45 0.72 0.89 0.97 0.98 1.00 1.00  
Разность 0.003 0.006 0.005 0.019 0.058 0.003 0.002 0.000 0.009 0.024 0.000  

Требуется оценить достоверность расхождения между этими распределениями. Ход вычислений показан в таблице 6.11. Сначала получают накопленные частоты путем суммирования частот от первого класса до конца вариационного ряда (Σa), затем рассчитывают относительные накопленные частоты (Σa/n). После этой процедуры отыскивают максимальную разность (max) относительных частот в каком-либо классе.



В нашем случае максимальная разность между отношениями накопленных частот к объемам выборок составила

max = |0.39–0.45| = 0.058 (5-й класс),

откуда по формуле для сравнения распределений разного объема находим величину критерия:

= 0.67.

Поскольку найденная величина λ = 0.67 оказа­лась ниже критического значения даже для первого по­рога вероятности (λ(0.05) = 1.36), то нулевая гипотеза не отвергается и, следовательно, расхождения между сопоставляе­мыми распределениями носят случайный характер. Таким об­разом, существование возрастных отличий в плодовитости по­левок в данном случае остается недоказанным (полученными данными не подтверждается).

Отношения между статистиками t, T, F иχ²

Рассмотренные выше разнообразные критерии используют четыре статистики, поведение которых в своей основе базируется на законе нормального распределения, модифицированном для разных целей. Как указывалось ранее, нормальное соответствие относительной частоты (p) значений случайной величины (t)задается уравнением: . Значение случайной величины хи-квадрат представляет собой сумму нескольких нормально распределенных случайных величин, возведенных в квадрат: (df – число степеней свободы). По таблицам 4П и 9П нетрудно убедиться, что для df = 1 χ² = t² и границы критических областей для α=0.05 составляют χ² = t² = 1.96² = 3.84.



Распределение T Стьюдента использует распределение нормальное и хи-квадрат: . Распределение F Фишера использует два распределения хи-квадрат с разным числом степеней свободы: .


7

Задача "доказать отличие нескольких выборок"

("доказать влияние фактора")

 

При изучении и анализе сложных и многообразных причин­но-следственных отношений между объектами и явлениями биологу приходится учитывать целый комплекс внешних и внутренних факторов, от которых в конечном итоге зависят уровень и ход наблюдаемых процессов, те или иные биологиче­ские свойства живых организмов, их динамика и разнообразие. При этом зачастую важно оценивать не только роль одного из многочисленных внешних фак­торов, но и их взаимодействие при констелляционном влиянии на популяцию или организм.

Идейная база для изучения действия факторов содержится уже в методе сравнения двух выборок. Биологическим содержанием операции сравнения двух выборок, в конце концов, выступает поиск факторов, ответственных за смещение средних арифметических или усиление изменчивости признаков. Развивая это направление биометрического исследования, можно не ограничиваться только двумя "дозами" фактора, но изучить серию ситуаций, в которых фактор проявлял разную силу действия на результативный признак – от самого слабого, до самого сильного. При этом каждому уровню фактора будет соответствовать отдельная выборка и общая задача получит формулировку "сравнить несколько выборок". В терминах факториальной биометрии вопрос о влиянии фактора на признак звучит так: сказывается ли отличие условий получения разных выборок на качестве (значениях) вариант? В терминах статистики вопрос звучит несколько иначе: из одной ли генеральной совокупности отобраны все выборки, оценивают ли выборочные средние арифметические одну и ту же генеральную среднюю? Вариантов ответа может быть только два:

1. Все выборки отобраны из одной генеральной совокупности, условия возникновения вариант одни и те же.

2. Выборки отобраны из разных генеральных совокупностей, условия возникновения вариант выборок различаются.

В постановке вопроса можно уловить противоречие. Выше было сказано, что по условию задачи выборки формировались в разных условиях, и тут же предполагается, что условия были одинаковые. На самом деле противоречия нет, поскольку речь идет об определении чувствительности признака к действию фактора. Условия формирования выборок могут отличаться, но они могут никак и не сказаться на величине изучаемого признака, не отразиться на значениях вариант. Смысл статистического сравнения в том и состоит, чтобы оценить эффективность действия фактора на признак, доказать реальность реакции вариант выборок на разные условия их формирования. Круг методов сравнения нескольких выборок довольно широк, их выбор зависит от конкретной задачи (табл. 7.1).

Таблица 7.1

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.