Сделай Сам Свою Работу на 5

НУЛЕВАЯ ГИПОТЕЗА: Равенство средних в двух популяциях





Дисперсионный анализ

Основной целью дисперсионного анализа является исследование значимости различия между средними (для групп или переменных).

В действительности при исследовании статистической значимости различия между средними двух (или нескольких) групп, мы на самом деле сравниваем (т.е. анализируем) выборочные дисперсии. Фундаментальная концепция дисперсионного анализа предложена Фишером в 1920 году.

 

Основные понятия.

Признаки, изменяющиеся под воздействием тех или иных причин, называются РЕЗУЛЬТАТИВНЫМИ.

Например: вес, рост, физическое состояние организма или целой популяции. все это – признаки.

Действующие на результативные признаки причины принято называть факторами.

А такие средства воздействия, как дозы лекарственных или токсических веществ, нормы питания людей – это категории факторов.

Факторы делятся на контролируемые в опыте, или организованные

И неорганизованные, или неконтролируемые, действие которых на признак не регулируются.

Организованные факторы принято обозначать большими буквами латинского алфавита – А, В, С и т.д.



Результативные признаки - Х,У,Z….

Обычно каждый из факторов и результативный признак представлены некоторым количеством подразделений (групп), называемых ГРАДАЦИЯМИ.

Они обозначаются теми же буквами, что и факторы- А123….или В123

Градации факторов определяются степенью их воздействия на результативный признак.

Выборочная совокупность, организованная определенным образом для изучения эффективности действия организованных факторов на результативный признак, называется статистическим или дисперсионным комплексом.Структура такого комплекса определяется числом градаций, на которые подразделяются организованные факторы и учитываемый в опыте признак.

Форма дисперсионного комплекса дается таблицей, в которой число столбцов равно числу градаций одного или нескольких организованных факторов, а по строкам откладываются градации результативного признака.

В зависимости от числа учитываемых факторов, по которым проводится дисперсионный анализ, различают однофакторные, двухфакторные и многофакторные дисперсионные комплексы.



 

ОДНОФАКТОРНЫЙ АНАЛИЗ ОДНОФАКТОРНЫХ КОМПЛЕКСОВ МАЛЫХ ГРУПП.

Однофакторным называется комплекс, в котором учитывается действие только одного организованного фактора А.

Основная идея дисперсионного анализа состоит в сравнении групповой средней дисперсии, порождаемой воздействием фактора и остаточной дисперсии, обусловленной случайными причинами.

Если различие меду этими дисперсиями значимо, то фактор оказывает существенное влияние на измеряемую величину. В этом случае средние наблюдаемых значений на каждом уровне также значимо различаются.

Но- фактор НЕ влияет

Н1- фактор влияет

Для выборки объема n выборочная дисперсия вычисляется как сумма квадратов отклонений от выборочного среднего, деленная на n-1 (объем выборки минус единица). Таким образом, при фиксированном объеме выборки n дисперсия есть функция суммы квадратов (отклонений), обозначаемая, для краткости, SS (от английского Sum of Squares - Сумма квадратов). Далее слово выборочная мы часто опускаем, прекрасно понимая, что рассматривается выборочная дисперсия или оценка дисперсии.

В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты.

Целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.



НУЛЕВАЯ ГИПОТЕЗА: Равенство средних в двух популяциях

Рассмотрим следующий набор данных:

  Группа 1 Группа 2
Наблюдение 1 Наблюдение 2 Наблюдение 3 2 3 1 6 7 5
Среднее Сумма квадратов (СК) 2 2 6 2
Общее среднее Общая сумма квадратов 4 28
Внутригрупповая сумма квадратов Отклонений групповых средних от Общей средней 2+2=4
Остаточная (межгрупповая) сумма квадратов отклонений 28-4=24

Среднее 1 группы = (2+3+1)/3=2

Среднее 2 группы =(6+7+5)/3=6

Сумма квадратов разностей 1 группы =(2-2)2+(3-2)2 +(1-2)2=2

Сумма квадратов разностей 2 группы =(6-6)2+(7-6)2+(5-6)2=2

Общее среднее =(2+6)/2=4

Общая сумма квадратов разностей =(4-2)2+(4-3)2+(4-1)2+(4-6)2+(4-7)2+(4-5)2=4+1+9+4+9+1= 28(это общая средняя дисперсия)

 

Как видно из таблицы, общая сумма квадратов SS =28 разбита на компоненты:

 

Средние двух групп существенно различны (2 и 6 соответственно). Сумма квадратов отклонений внутри каждой группы равна 2.

 

ЭТО ВНУТРИГРУППОВАЯ ИЗМЕНЧИВОСТЬ .

Внутригрупповая изменчивость (SS) обычно называется остаточной компонентой или дисперсией ошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена.

Складывая их, получаем 4. Если теперь повторить эти вычисления без учета групповой принадлежности, то есть, если вычислить SS исходя из общего среднего этих двух выборок, то получим величину 28.

МЕЖГРУППОВАЯ ИЗМЕНЧИВОСТЬ. SS эффекта (или компоненту дисперсии между группами) можно объяснить различием между средними значениями в группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.

 

  ГЛАВНЫЙ ЭФФЕКТ
SS ст.св. σ F p
Эффект Ошибка 24.0 4.0 1 4 24.0 1.0 24.0 .008


Как видно из таблицы, общая сумма квадратов SS =28 разбита на компоненты:

сумму квадратов, обусловленную внутригрупповой изменчивостью (2+2=4; см. вторую строку таблицы)

и сумму квадратов, обусловленную различием средних значений между группами (28-(2+2)=24; см первую строку таблицы). Заметим, что MS в этой таблице есть средний квадрат, равный SS, деленная на число степеней свободы (ст.св).

SS ошибок и SS эффекта. Внутригрупповая изменчивость (SS) обычно называется остаточной компонентой или дисперсией ошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена. С другой стороны, SS эффекта (или компоненту дисперсии между группами) можно объяснить различием между средними значениями в группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.

Число степеней свободы Кобщ=N-1 = 6-1

Кмежгр=а-1= 2-1

К внгр= N-a=6-2=4

σм2= 24/1=24

σвг2=4/4=1

Критерий Фишера Fф=24/1=24

Из таблиц находим критерий Fst(р=0,05; kмг; kвн)= 7,71

Fф=>Fst 24> 7,71 следовательно нулевая гипотеза отвергается,

(о равенстве средних). Различие между средними статистически значимо.

Дисперсионный анализ однофакторных комплексов, состоящих из небольшого числа групп, проводится по следующей схеме:

1. Сгруппировать выборочный материал в комбинативную таблицу. Найти средние величины:

среднюю арифметическую всего комплекса, называемую общей средней ( ),

частные или групповые средние ( ) - по градациям фактора А.

2. Определяют общую сумму квадратов отклонений (Dy), равную сумме квадратов отклонений вариант от общей средней данного комплекса, т.е.

3. Вычисляют межгрупповую сумму квадратов ( D x), равную сумме квадратов отклонений групповых средних от общей средней, с учетом статистического ВЕСА (n) групповых средних. При одинаковом числе вариант в градациях комплекса этот показатель рассчитывается по формуле:

При разных числах вариант в градациях комплекса по следующей формуле:

4. Находят внутригрупповую сумму квадратов (Dz), т.е. сумму квадратов отклонений вариант от групповых средних:

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.