Сделай Сам Свою Работу на 5

Этапы биометрического исследования





 

Биология по большей части остается наукой эмпирической: сбор фактов в поисках закономерностей проявления природных феноменов доминирует над объяснением существа этих процессов, построением теории (особенно количественной) и прогноза. Поиски "закономерностей" в биологии явно превалируют на поисками "законов", в первом случае говорят об эмпирической (индуктивной) науке, во втором – о теоретической (дедуктивной). Методы, рассмотренные в книге, обслуживают потребности первого научного направления. При этом сохраняется надежда, что законы биологии вырастут из обнаруженных закономерностей.

Математическая статистика, исследующая массовые проявления, служит средством доказательства существования той или иной закономерности, причинной обусловленности серии фактов. Факт сам по себе, раз случился, достоверен. Доказывать приходится достоверность существования причин, вызвавших факты к жизни и тем самым обеспечивающих их общность. Если наличие некоей причины обуславливает однотипность протекания биологических процессов, вызывает повторные появления сходных результатов, говорят о обнаружении закономерности. Закономерное – это повторяющееся, причем в зависимости от известных условий (причин). Биометрия представляет способы доказательства реальности эмпирических закономерностей.



Они служат необходимым средством достижения биологом своих целей, установленных исходя из существа биологической проблемы. В этом смысле для биометрического исследования очень важна точная формулировка биологического вопроса.

Мало обнаружить закономерность, необходимо еще и показать ее ре­альность, а для этого – оценить количественно. Статистический ана­лиз как раз и служит этой двойной задаче: во-первых, численно охарактеризовать биологический объект, явление или процесс, его масштабы и тенденции и, во-вторых, доказать объектив­ность его существования, специфичность, достоверность отличия от других явлений или процессов. Опираясь на полученный научный материал, статистика способна доказать несостоятельность выдвинутых гипотез, отделить, как зерна от плевел, истинные отличия от случайных, привнесенных неучтенными факторами, вычленить реальную закономерность из обилия сырого экспериментального материала.



К сожалению, исследователи зачастую подменяют цели исследования средствами их решения, что понятно из такого типичного вопроса: "Вот мои данные, как их нужно статистически обработать?" Конструктивный диалог может начаться только после ответа на другой вопрос, зачем эти данные нужно как-то обрабатывать, зачем вообще они были собраны? Нам кажется, что такой диалог должен быть внутренним и обязан предварять не столько обработку, сколько сбор данных. Как писал отец эмпирической науки Ф. Бэкон, "правильно поставленный вопрос есть половина ответа". Цель исследования организует его. Спланировать способ обработки нужно перед сбором фактических данных!

Ввиду очевидной сложности этого процесса, рассмотрим его основные этапы эмпирического исследования.

1. Определить объект исследования.Объект исследования – это не вид животного или растения, это исследуемый феномен со всеми относящимися к делу внешними компонентами, включая пространство (распространение) и время (динамика). Объектом биологии выступает жизнь, процессы жизнедеятельности, функционирования биосистем. Объектом частного биологического исследования выступает ограниченная во времени и пространстве биосистема. В частности, даже "фауна N-го района" понятие динамическое.

2. Определить проблему и актуальность исследования. Проблема ("Что плохо?") в научном плане есть отсутствие знаний об объекте исследования в определенной области его биологии. Потребность в недостающей информации появляется в том случае, когда уже имеются некоторые данные, обрисовывающие границы известного и обнажающие края неизвестного. Актуальность формулируется в терминах уже известного по отношению к еще неизвестному знанию. Приступая к исследованию фауны некоей территории, заранее понятно, что кто-то на ней живет, но кто именно и в каких количествах – остается пока неизвестным.



3. Определить цель исследования.Цель ("Чего хочется?") в обобщенном виде характеризует итог исследования. Например, изучить видовой состав и численность животных на определенной территории в определенный временной промежуток есть общая цель фаунистического исследования. Только на этом фоне возможны обобщения на больших территориях и временах, т. е. обнаружение неких общих закономерностей. Научная деятельность не может не быть целесообразной, она должна вести к определенной цели. Она определяет шаги исследования, выбор средств и методов, планирование трудовых и финансовых затрат. Цель служит постоянным критерием эффективности выполненных действий, основой рефлексии, ограничителем.

4. Определить задачи исследования. Задачами ("Что сделать?") отмечаются шаги к цели, это мост между ней и конкретными средствами ее достижения. Задачи могут быть как научного толка (тогда они предписывают конкретные действия, позволяющие решить частный вопрос специфическими методами), так и методические (определяющие пути разработки недостающих методических приемов работы или развитие инструментальной базы). Задачи – это руководства к действию, указания, как делать и что будет получено в результате, если предпринять такие-то действия.

Именно на этом этапе становится ясным, какими должны быть массивы собираемой количественной информации, вид количественных характеристик (переменных), их число, способы регистрации статуса объектов измерения и факторов среды, схемы опытов и т. п. Знание этих частностей необходимо, чтобы запланировать использование того или иного статистического анализа, предъявляющего свои требования к исходным данным. Точнее всего работают параметрические методы, но они требуют регистрации количественной информации в форме рациональных или натуральных чисел. Если же запланировать получение характеристик объектов в приблизительных полуколичественных шкалах (баллы, ранги) или вообще с помощью только качественных признаков, то следует помнить, что в конце концов придется пользоваться более грубыми непараметрическими методами статистики.

Понятно, что разработка задач требует от автора предметного знания и опыта аналогичной работы. В реальности практически никогда не удается сделать все, что запланировано, но часто удается получить важные побочные результаты помимо требуемых. Это заставляет переформулировать дефиниции проблемы, целей и задач, увязывая части исследования в целостную систему. Подобная итерация, повторное переосмысление и переработка теоретических и методических основ исследования – норма научной работы.

5. Сбор и накопление данных, изучение биологического явления.При сборе данных важно помнить правило "единообразия и равновероят­ности" собираемых выборок, чтобы свести к минимуму субъективные и систематические ошибки, уменьшающие точность измерений. Это условие относится к способу формирования выборок, суть которого заключается в создании одинаковых ус­ловий наблюдения и обеспечении равной вероятности получае­мых результатов: каждая варианта должна иметь возможность представлять весь спектр действующих факторов без ограничений; в противном случае состав выборки будет не гомогенным, и статистические законы будут проявляться "неправильно", что сделает невозможным применение точных статистических критериев.

6. Решение биометрической задачи. Статистика решает узкий круг за­дач, которые не подменяют более широкие функции биоло­гического исследования, но зато требуют жесткой определенности формулировок. Чтобы добиться требуемой строгости, исходно рыхлое словесное описание биологического вопроса предварительно необходимо перевести на язык методов статистики, после чего выполнить расчетные процедуры и в завершение получить требуемый ответ. Процедура решения биометрической задачи вклю­чает несколько последовательных этапов; в из числе:

конкретизация

формализация

выбор вида статистической задачи

выдвижение нулевой гипотезы

решение по алгоритму

статистический вывод

ответ на вопрос.

Конкретизация. Формулирование биологической задачи, требующей статистического решения, определения объекта исследования, характеристика условий (факторов, методов) получения выборки, определение численно выраженных свойств и признаков, явное определение отдельной варианты (объекта измерения) и всей выборки вариант. Подготовка данных для последующей обработки.

Формализация. Этот этап требует отойти несколько от биологического содержания задачи и дать ответы на вопросы общего характера "Что доказать?" и "Что описать?", предшествующие выбору конкретного статистического метода.

Ответ на вопрос "Что доказать?" помогает явно назвать один из четырех типов биометрических задач: доказать чужеродность варианты (принадлежность к классу вариант), доказать отличие двух выборок, доказать влияние фактора (отличие нескольких выборок), доказать зависимость признаков.

Ответ на вопрос "Что описать?" заставляет сделать выбор того обобщенного показателя, который интересует исследователя: описание может касаться величины признака (оценивается средней), его изменчивости (оценивается дисперсией), распределения частот (выражается вариационным рядом), выборки в целом (выражается совокупностью ранжированных вариант).

Выбор вида статистической задачи. В зависимости от характера имеющихся данных, способа описания и установленной задачи подбирается тот или иной статистический метод. Именно здесь отчетливее всего проявляются уровень биометрической подготовки исследователя, его профес­сионализм и мастерство, наконец, чутье на адекватный статисти­ческий метод. В этом смысле биометрия выступает как своеоб­разное искусство постановки статистической задачи. Вместе с тем многие биологические задачи решаются по принципу ана­логии. Это позволяет предложить "Определитель статистического метода", несколько формальных кри­териев подбора адекватного статистического приема (табл. 1.1), включая как раз те распространенные статистические приемы, что рассмотрены в настоящем пособии. С помощью этой таблицы можно предварительно подобрать метод, способный решить поставленную задачу, а затем уже непосредственно перейти к вычислительным процедурам по при­веденным в книге алгоритмам.

Таблица 1.1

Что доказать? Что изучено? Метод
Чужеродность варианты в выборке Величина Сравнение средней и варианты
Достоверность отличия двух выборок Величина Сравнение средних арифметических
Изменчивость Сравнение дисперсий
Распределение частот Сравнение эмпирического и теоретического распределений
  Сравнение двух эмпирических распределений
В целом Сравнение двух наборов значений
Достоверность отличия нескольких выборок Величина Дисперсионный анализ
Изменчивость Сравнение серии дисперсий
Распределение частот Сравнение нескольких эмпирических распределений
В целом Непараметрический дисперсионный анализ
Достоверность влияния фактора на признак Величина Дисперсионный анализ
Достоверность влияния признака на признак Величина Регрессионный анализ  
Достоверность сопряженности варьирования двух признаков Величина Корреляционный анализ

 

Выдвижение нулевой гипотезы. Этот этап призван дать четкую статисти­ческую формулировку поставленного вопроса. Нулевая гипоте­за – это предположение об отношениях объек­тов, выраженное в терминах статистики и предназначенное для дальнейшей статистической проверки. Во введении уже упоми­налось, что математическая статистика изучает случайные со­бытия, процессы и явления, поведение случайных величин. При этом она пытается отделить случайность от закономерности, случайные причины от систематических, доминирующих.

С по­зиций случайного, вероятностного характера явлений исходит и нулевая гипотеза. В самой общей форме эта гипотеза звучит так: "Отличия недостоверны". Согласно ей, например, наблюдаемые отличия двух выборок являются случайными, различия между выборочными параметрами есть ошибки репрезентативности; в действительности обе выборки вместе составляют один и тот же однородный материал и при­надлежат к одной генеральной совокупности. В процессе ста­тистического анализа нулевая гипотеза либо отвергается (опро­вергается, отклоняется), и тогда различия считаются достовер­ными, либо принимается (сохраняется). Последнее, однако, не означает доказательства случайности различий (их отсутствия), а лишь говорит о том, что при данном объеме и качестве мате­риала различия остаются недоказанными. Опираясь на полученный в процессе научной работы материал, статистика способна лишь доказать выдвинутые гипотезы или же отсеять и отвергнуть те предполо­жения, для которых недостаточно информации, отделить, как зерна от плевел, истинные отличия от случайных, привнесенных неучтенными факторами, вычленить реальную закономерность из обилия сырого экспериментального материала.

Решение по алгоритму. Реализация одного из алгоритмов статистических расчетов. Приведенные в книге алгоритмы вычислений, как правило, снабжены числовыми примерами, и их использование не должно вызывать особых затруднений. Однако при "ручном счете" воз­можны небольшие технические ошибки, способные, тем не менее, привести к неправильным результатам. Чтобы избежать этих ошибок или, по крайней мере, не пропустить их при вычислениях, необходимо придерживаться нескольких правил. Так, арифметические ошибки нетрудно выявить, если еще до начала расчетов ориентировочно прикинуть ожидаемый резуль­тат. Для этого полезно дважды пересчитывать рабочие форму­лы, меняя местами слагаемые и сомножители. При использова­нии стандартных формул целесообразно вначале выписать их в символьной форме и лишь затем подставлять числовые зна­чения. Очень важно также не путать сумму квадратов (Σx²) с квадратом суммы ((Σx)²) вариант, объем выборки (n) с чис­лом градаций или групп (k). Вероятность правильного ответа увеличится, если формировать таблицы вычислений по приведен­ному в книге алгоритму полностью. При этом полезно проверять схождение сумм по строкам и столбцам, а вычисленных величин – по модели анализа. Например, при вычислении критерия хи-квадрат сумма частот эмпирического распределения должна то­чно совпадать с суммой теоретических частот. На ошибку в расче­тах, как правило, указывает большое различие эмпирических и теоретических частот распределения, а также несовпадение вели­чины исходного признака с рассчитанным по регрессионной мо­дели. Кроме того, подозрение на допущенную ошибку должны вызывать отрицательные суммы квадратов (за исключением рег­рессионного и корреляционного анализов) и минусовые значе­ния критерия Стьюдента (его всегда берут по моду­лю), а также величины, в десятки и сотни раз превышающие табличные. Наконец, следует помнить, что если "на глаз" рас­пределение количественных признаков приближается к нор­мальному, то стандартное отклонение примерно равно четверти от всего размаха выборки: S≈(max–min)/4. Только распределение Пуассона имеет равные среднюю и дисперсию (MS²). Эффективен контроль за результатами и с помощью графических возможностей Excel. В частности, для контроля правильности применения критерия хи-квадрат необходимо сравнивать гистограммы эмпирических и теоретических частот.

Статистический вывод. Статистический вывод служит главным результатом статистического анализа – это заключение о справедливости или опровержении нулевой гипотезы. Строится он на основе срав­нения полученной (эмпирической) величины статистического критерия с табличной (теоретической). Если вычисленные зна­чения критерия больше табличного, говорят о достоверном от­личии (влиянии, исключении), если же меньше, то нулевая ги­потеза остается в силе. Это позволяет использовать статистиче­ский критерий для опровержения нулевой гипотезы. Когда статистический вывод отвергает нулевую гипотезу, отличия выборок считаются доказанными, если же не отвергает, то отсутствие отличий доказанным не считается. На практике для пра­вильного статистическо­го вывода можно вос­пользоваться упрощен­ной схемой сравнения эмпирических значений критерия с табличными (рис. 1.1). Числа 0.95 и 0.05 – это доверительная вероятность и уровень значимости (вероятность правильности или непра­вильности вывода). Разместив в этой схеме табличные и эмпирические значения критериев, нетрудно заметить, что вычисленная величина лежит правее табличной, в критической области, а это говорит о достоверности отличий сравниваемых параметров, в данном случае двух средних арифметических.

 
 

 

 


Рис. 1.1. Схема использования критериев. Отмечены критические зоны для уровней значимости α = 0.05 и α = 0.01 (до­верительные вероятности Р = 0.95 и Р = 0.99). Границами зон служат значе­ния критериев из таблиц Приложения при данном уровне значимости. Если вы­численные величины критерия попадают в критическую зону (правее табличных), значит, отличие сравниваемых параметров достоверно

 

Сказанное можно проиллюстрировать следующим примером. Пусть при сравнении двух средних арифметических нулевая гипотеза состояла в том, что отличие средних арифметических случайно. В расчетах было получено значение критерия T = 3.5. Табличная величина для этого слу­чая равна T = 2.1. Поскольку полученное значение критерия (3.5) больше табличного (2.1), можно утверждать, что эти средние арифметические достоверно отличаются. Слово "достоверно" значит буквально "статистически доказано": отличие двух сравниваемых средних и без того бросалось в гла­за, но лишь стати­стическое доказательст­во показало реальность этих различий, позволило рас­пространять конкретный вывод на все явление. Кри­терий доказал, что отличие средних не случайно, а законо­мерно.

Какую роль играют отмечен­ные на схеме значения вероятностей? Это станет ясным из сле­дующих рассуждений. Статистический вывод можно сделать с разной степенью достоверности, иначе говоря, – с разной степенью уверенности, или вероятности. Можно быть уверенным в правильности вывода на 95% (тогда до­верительная вероятность Р = 0.95) или на 99% (Р = 0.99). Аналогично говорят о степени "неуверенности", иначе – об уровне значимости. Его значения обычно берут равными 5%, 1%, 0.1% (или со­ответственно α = 0.05, α = 0.01, α = 0.001). Если точность проведения наб­людений или экспериментов невысока, если требуемый вывод не нуждается в особой точности (обычные условия проведения биологических исследований), то выбирается уровень значимос­ти α = 0.05. В таблицах Приложения приведены значения критериев при разных уровнях точности и числе сте­пеней свободы. Чем выше требуется точность вывода, тем выше берут табличное значе­ние критерия. Это понятно: чем точнее и ответственнее должен быть вывод, тем жестче требования к критерию. Подробнее статистический смысл уровня значимости объясняется в спе­циальных математических руководствах. Для практического же понимания достаточно знать, что уровень значимости – это приблизительная ожидаемая ошибка (ее вероятность) наших вы­водов. И с этой позиции 5% – достаточно мало.

Понятие числа степеней свободы – это число вариант (градаций, групп, случаев, т. е. объем выборки) без числа ограничивающих ус­ловий – конкретнее будет рассмотрено ниже.

Ответ на вопрос. Формулируется биологическое утверждение, доказанное статистически. Если удалось доказать достоверность неких отличий, то для биолога принципиально важна их направленность, не только факт отличий, например, средних арифметических, но и как именно они отличаются, какая величина превышает другую. Биологический ответ есть, по существу, перифраза статистического вывода, "одетого" в биологические термины и поэтому приобретающего биологический смысл и содержание.

7. Интерпретация результатов обработки. Биологическая интерпретация основывается на полученном статистиче­ском выводе. Если он не отвергает нулевую гипотезу, то важ­ных с биологической точки зрения заключений сделать нельзя. Дело в том, что, несмотря на сохранение гипотезы о случайнос­ти отличия (влияния) показателей, мы не можем быть в этом полностью уверены. Возможно, в нашем распоряжении просто оказалось недостаточно данных, чтобы получить точный показа­тель и сделать достоверный вывод. В этой ситуации остается продолжить исследование, которое, впрочем, может быть спла­нировано более оптимальным образом.

Если же статистический анализ выявил достоверность отли­чия, влияния или необходимость выбраковки варианты из сово­купности, то это дает основание сформулировать более содер­жательное и убедительное биологическое заключение, в част­ности, рассматривать выявленные отличия как результат дейст­вия какого-то систематического фактора, интерпретировать за­висимость как биологическую закономерность, говорить об особых свойствах "выпадающей" из совокупности объекта, варианты.

Решить статистическую задачу, т. е. доказать достоверность отличий статистических параметров, не так уж и сложно, достаточно грамотно сформулировать ее условия и провести соответствующие вычисли­тельные процедуры. Труднее установить, за счет чего эти разли­чия возникли. Действительно ли это следствие объективной био­логической закономерности или же результат неточно проведен­ного опыта, неконтролируемых (и неучтенных) условий, разных навыков у исполнителей и т. д. Для выяснения данного вопроса приходится контролировать всю информационную "атмосферу" в момент получения данных, как теоретические посылки, так и условия, при которых данные были получены. В этом случае удается правильно понять причины варьирования признаков, направления их изменчивости и в конечном итоге объяснить биологическое содержание формальных статистических выводов.


2

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.