Сделай Сам Свою Работу на 5

Биномиальное распределение





 

Во многом близко к нормальному. Отличие состоит лишь в том, что оно характеризует поведение дискретных признаков (выраженных целыми числами). Как правило, для описания биологических признаков подходит симметричное биномиальное распределение, у которого дисперсия много меньше средней.

Примерами описания признаков с помощью биномиального распределения могут служить число больных корнеплодов в пробе, число поврежденных участков на листьях, число волосков на единице площади шкурки, количество лучей в плавниках рыб, число хвостовых щитков у рептилий, плодовитость (размер выводка) самок и т. п. В основе биномиального распределения лежит альтернативное проявление изучаемого признака: он может присутствовать у единичного объекта или отсутствовать, проявиться или нет. Отдельный корнеплод может быть больным или здоровым (признак качественный), тогда проба из нескольких корнеплодов будет содержать некоторое число здоровых корнеплодов (признак количественный), а множество равнообъемных проб образует уже выборку чисел. (Кстати отметим, что подсчет числа однотипных объектов в пробе есть эффективный способ перевода качественных признаков в количественные.)



Главной "организующей силой" такого распределения является способ, с помощью которого получают значения случайной величины – это отбор проб. Пробой называют фиксированное (объемом m) множество объектов, которые могут быть только двух типов (например, белое или черное, ● и ■, ♀ и ♂,€и, 0 и 1). Получается, что каждая проба объединяет несколько (m) простых случайных величин.

Для формирования дискретных распределений используются большие группы объектов, либо территория (маршрут), либо процесс, которые разбиваются на пробы, – соответственно, на порции (группы), участки (площадки), отрезки (этапы), затем идет подсчет числа проб, содержащих то или иное число известных объектов. Значение отдельной варианты представляет собой число объектов определенного качества в отдельной пробе.

Если при этом вероятности появления объектов разного качества приблизительно равны (например, когда общее число поврежденных примерно равно числу здоровых корнеплодов), биномиальное распределение имеет симметричную, колоколообразную (но ступенчатую) форму, подобную нормальному распределению. Большие отклонения от условия равенства вероятностей элементарных событий порождают асимметричное распределение, и такое поведение случайной величины лучше описывать с помощью закона распределения Пуассона (см. ниже).



Одна из обычных и важных характеристик популяций животных, плодовитость самок, подчиняется биномиальному закону. Единичное событие – это появление или "непоявление" детеныша. Тогда пробой будет "число потенциальных детенышей у одной самки", объем которой равен значению максимальной плодовитости. Самка с наибольшей плодовитостью реализовала все возможные потенции. Самка с меньшим числом детенышей как бы не смогла реализовать потенциал полностью. При этом вероятность реализации отдельного события "детеныш появится" составляет p, а вероятность события "детеныш не появится" равна q = 1–p. В том случае, когда для отдельного детеныша вероятность появиться равна вероятности не появиться, p = q, самок с большим числом детенышей и вовсе почти без детенышей будет мало, в большинстве самки будут приносить около половины потенциально возможных детенышей; распределение будет строго симметричным. В случае неравенства вероятностей будет наблюдаться та или иная степень асимметрии.

Рассмотрим результаты изучения плодовитости серебристо-черных лисиц (число щенков на самку) (см. данные на стр. 33). Для построения вариационного ряда берем 8 классов, классовый интервал для этого дискретного признака составит dx = 1.



 

Плодовитость, x Частота, число самок, a Число эмбрионов
n

Рис. 3.4. Биномиальное распределение с параметрами n = 76, M = 4.95, S = 1.33. По оси абсцисс – число щенков лисицы на одну самку, по оси ординат – частости (относительные частоты)

 

Поместив значения на лист Excel нетрудно рассчитать (предлагаем читателю это сделать самостоятельно) все основные параметры распределения по рассмотренным выше формулам с использованием функций листа Excel =СРЗНАЧ и =СТАНДОТКЛОН:

= 4.96 экз./самку,

= 1.33 экз./самку,

экз./самку,

экз./самку.

Рассчитаем вероятности элементарных событий (появления–непоявления детенышей). Для этого сначала рассчитаем общее число появившихся детенышей. Оно равно сумме всех произведений числа детенышей в отдельном выводке (x) на частоту их встречаемости (a): NД = Σ(x∙a) = 377. Затем рассчитаем общее число потенциальных зародышей (суммарный объем всех проб с одинаковым объемом m = 8): NП = n∙8 = 76∙8 = 608 экз. Наконец, определим долю "реализовавшихся" детенышей среди потенциальных:

p = NД / NП = 377/ 608 = 0.62

и долю "не реализовавшихся":

q = 1– p = 1–0.62 = 0.38.

Эти ключевые характеристики сущности наблюдаемого процесса размножения могут говорить о том, что вероятность рождения отдельного детеныша (p = 0.62) превышает вероятность его нерождения (q = 0.38), что в выборке присутствуют животные с ненормально высокой плодовитостью, т. е. об асимметричности распределения. Проверить это предположение можно с помощью соответствующих показателей асимметрии и эксцесса, которые рассчитываются также проще, чем для непрерывного признака:

, mA = 0.28, TA = 0.2<T(0.05,∞).

, mE = 0.56, TE = 0.1<T(0.05,∞).

В данном случае, несмотря на некоторое отличие базовых вероятностей, асимметрию нельзя считать существенной.

Найденные выше вероятности p и q позволяют рассчитать параметры биномиального распределения по другим, более простым формулам:

M = m∙p = 8∙0.62 = 4.96 экз./самку,

1.37 экз./самку.

Результаты оказываются идентичными с точностью до величины ошибки округления.

Доверительный интервал для параметров биномиального распределения строится так же, как и для нормального распределения: M±TmM, S±TmS. Так, при уровне значимости α = 0.05 находим доверительный интервал, например, для стандартного отклонения:

S±Tms = 1.33±1.96∙0.118 = 1.33±0.231 экз./ самку.

Значение генерального стандартного отклонения находится в диапазоне от 1.09 до 1.56 экз./ самку.

Распределение Пуассона

 

Это вариант описания стохастического поведения дискретных признаков для случаев, когда базовая вероятность элементарных аль­тернативных событий неодинакова, одно из них наблюдается заметно чаще другого (p<<q) (классический пример – попадание гитлеровских авиационных бомб в разные кварталы Лондона). Закон Пуассона описывает редкие события, происходящих 1, 2, 3 и т. д. раз на сотни и тысячи обычных событий. Поведение биологических объектов, соответствующее закону Пуассона, наблюдается в том случае, когда по пробам случайно распределены редкие объекты. Примеры таких явлений ­– частота нарушений хромосомного аппарата на каж­дую тысячу митозов, встречаемость семян сорняка в большой серии навесок семян культурного растения, число повторных попаданий животных в ловушки, встречаемость животных на отрезках длинных маршрутов (или на пробных площадках обширной территории), отловы животных в отдельные промежутки времени при длительных наблюдениях.

Как и в случае с биномиальным распределением, случайная величина, распределенная по закону Пуассона, определяется подсчетом числа элементарных событий в пробе (в группе, в навеске, на участке, на этапе). Распределение Пуассо­на резко асимметрично, причем дисперсия равна средней арифмети­ческой, что может служить критерием для оценки характера распределения изучаемого признака (рис. 3.5).

В течение одного года (1946) пометили коль­цами и выпустили на волю 32 буревестника.

 

Число повторных отловов, x Число отловленных животных, a Число случаев повторного отлова, x∙a
n

В последующие пять лет часть из них отлавливали повторно: 7 экз. по одному разу, 7 – по два, 2 – по три, 1 экз. – четыре раза, 15 экз. окольцованных птиц повторно не попадались. Число классов составляет k = 4, интервал dx = 1. Асимметрия в частотах встречаемости птиц позволяет пред­полагать распределение Пуассона.

Расчеты показали, что средняя арифметическая (M) примерно равна дисперсии (S²):

mp = 4∙0.242 = 0.968 экз.,

1.121 экз., S² = 1.257,

S² ≈ M.

 

По крайней мере, проверка по критерию Фишера не выявила достоверных отличий между ними (подробнее см. с.91, 112):

F = 1.257/0.968 = 1.157<F(0.05,31,31) = 1.8.

Эта близость свидетельствует о соответствии наблюдаемого распределения закону Пуассона.

Рис. 3.5. Распределение Пуассона с пара­метрами n = 32, M ≈ S² = 0.968. По оси абсцисс – число повторных отловов, по оси ординат – частости (относительные частоты)

 

Доверительный интервал для параметров распределения Пуассона определить несколько сложнее, чем для других типов. В связи с асимметричностью распределения Пуассона для расчета левой и правой доверительных границ средней арифметической и дисперсии (как известно, эти значения равны) используют специальные фор­мулы с участием статистики хи-квадрат Пирсона (Браунли, 1977):

левая граница xлев. = 0.5 ∙ χ2(P, df1),

правая граница xправ. = 0.5 ∙ χ2 (α, df2),

где P – доверительная вероятность(обычно P = 0.95),

α – уровень значимости (обычно α = 0.05),

df – число степеней свободы: df1 = 2∙M, df2 = 2∙(M+1),

М – средняя арифметическая выборки,

χ2 – значение хи-квадрат по таблице 9П.

Доверительные границы для среднего числа повторных отловов составят: левая граница xлев. = 0.5 ∙χ2(0.95,2)= 0.5 ∙ 0.1 = 0.05,

правая граница xправ. = 0.5 ∙ χ2(0.05,4) = 0.5 ∙ 9.49 = 5.

Иными словами, число повторных отловов птиц может варьировать от 0 до 5 раз.

 

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.