Сделай Сам Свою Работу на 5

Гипотеза о равенстве вектора средних значений постоянному вектору





Лабораторная работа №3

Тема: Проверка статистических гипотез

 

Проверка гипотез.

Проверка статистической гипотезы предполагает наличие выборочной совокупности данных, которая параметрически (своей функцией распределения) сравнивается с генеральной совокупностью или другой выборкой.

При проверке статистических гипотез используется понятие нулевой (прямой) и альтернативной (обратной, конкурирующей) гипотез. Прямая гипотеза (H0) является основной и обычно содержит утверждение об отсутствии различий между сравниваемыми величинами. Альтернативная гипотеза (Н1) представляется конкурирующей по отношению к нулевой и принимается после того, как отвергнута основная.

Суждения об истинности или ложности статистической гипотезы строятся на основе критериальной (тестовой) проверки. Существуют статистические критерии, отражающие результаты сравнений и принимающие наблюдаемые значения по выборочным данным, а также критерии критических значений, установленные теоретическим путем. В ходе сопоставления критериальных величин выясняется: можно принимать или следует отвергнуть нулевую гипотезу. Если наблюдаемое значение критерия не превышает критического, то, по крайней мере, теоретически отсутствуют основания, чтобы отвергнуть прямую (нулевую) гипотезу. В противоположном случае целесообразно предположить справедливость альтернативной гипотезы Н1.



Критериальная проверка статистических гипотез допускает определенную вероятность ошибки в выводах. При этом разделяют вероятность ошибки первого рода ‑ отвергнуть нулевую гипотезу, когда она справедлива, и второго рода ‑ принять нулевую гипотезу, когда она ложна.

В экономических и социологических исследованиях из двух вероятностных характеристик ошибок, которые допускаются при проверке гипотез ( и ) обычно используется ‑ вероятность ошибки первого рода. Наиболее распространенными на практике значениями являются: 0,01; 0,05; 0,1, что соответственно указывает на вероятность получения достоверного вывода ( ) равную: 0,99; 0,95; 0,90.

Критериальная проверка гипотезы, в сущности, означает сравнительную характеристику параметрических значений или самого распределения случайной величины. Так, значения нормально распределенной величины, расположенные в непосредственной близости от центра распределения (математического ожидания ) и априорно имеющие более высокую степень (вероятность) принадлежности изучаемой совокупности данных, соответственно будут принимать критериальные значения, подтверждающие несущественность их отклонений от .



В многомерном случае используются те же статистические критерии соответствия, что и в одномерном, но они изменяются с учетом многовекторной природы случайной величины. Чаще всего это критерии для проверки параметрических гипотез: t-Стьюдента, F-Фишера, проверки непараметрических гипотез ‑ . С целью упрощения расчетов, а в последующем и выводов в анализе многомерной случайной величины часто принимается предположение о нормальности ее распределения.

 

Гипотеза о равенстве вектора средних значений постоянному вектору

В многомерном случае имеем дело c m – числом выборочных средних, т.е. вектором средних значений: Вектор сравнивается с постоянным вектором Прямая гипотеза имеет вид при альтернативной

Согласно двум приведенным гипотезам все соответствуют или существенно отличаются от

Наблюдаемое значение T2-критериявычисляется по формуле:

T2 ‑ критерий известен как критерий Хотеллинга

Наблюденное значение сопоставляется с критическим, исчисляемым при заранее заданном уровне вероятности а ‑ допустить ошибку в выводах и числе степеней свободы v1 = m и v2 = п - т :



В формуле — табличное значение F-критерия Фишера для известных v1=m и v2=n-m. Многомерная гипотеза подтверждается при и не может быть принята, если

 

 

В многомерном статистическом анализе проверяется гипотеза о равенстве векторов средних значений для двух выборок имеет вид:

при этом конкурирующая гипотеза может быть записана следующим образом:

или в векторной форме:

Наблюдаемое значение T2-критериявычисляется по формуле:

где — векторы средних значений;

– количество объектов в первой и второй выборках;

‑ матрица, обратная объединенной ковариационной матрице: по выборочной совокупности данных, где K ‑ матрица центрированных значений с элементами .

Критические значения для Т2 находятся по формуле, включающей квантиль F-распределения Фишера-Снедекора, определяемый при заданном уровне значимости и с числом степеней свободы :

.

При нулевая гипотеза принимается, и вывод о равенстве векторов средних значений следует с вероятностью . Если же , то гипотеза о равенстве векторов средних значений отвергается.

Расчет частных критериев для сравнений одного или нескольких средних значений из каждой выборочной совокупности осуществляется по формуле:

,

где — вектор, нивелирующий средние значения, не участвующие в сравнении, .

Для частных оценок различий средних значений критические величины определяются формулой:

.

Сравнение ковариационных матриц, отражающих взаимосвязи изучаемых признаков, открывает возможность дополнить и уточнить гипотетические предположения относительно самих признаков. Это приобретает особенное значение, если принять во внимание, что даже специфические индивидуальные признаковые характеристики могут совпадать случайно.

Нулевая гипотеза о равенстве дисперсий отклоняется, если и принимается, когда .

Формула расчета статистики ,

где параметры b и определяются по формулам:

,

,

где n – объем выборки;

m ‑ число признаков, представляющих многомерную выборочную совокупность;

‑ матрица парных корреляций j показателя.

Величина W-критерия сравнивается с — табличными значениями ( ).

 

 

Задания

 

№1. На частном предприятии с численностью работников 70–а человек средний уровень выработки одного рабочего составляет 500+10a деталей в день при среднеквадратическом отклонении 16+a деталей. С целью корректировки среднего нормативного уровня выработки в сторону повышения администрацией была отобрана группа наиболее подготовленных рабочих и по ним установлен средний уровень выработки 580+9a деталей. Можно ли вводить новый нормативный уровень выработки, не опасаясь конфликтов с рабочими? Решить задачу при α=0,05 (a – номер варианта).

 

№2. Чтобы оценить производственную эффективность предложенной к внедрению технологии, проведена проверка качества продукции, выпущенной на старой и новой автоматических линиях, при этом получены следующие данные об удельном весе продукции высшего качества, в %:

 

№ партии Старая линия № партии Новая линия
58 – a 74 – a
62 – a 59 – a
51 – a 69 – a
67 – a 78 – a
41– a 82 – a
53 – a 75 – a
    86 – a
    63 – a

 

Установить, действительно ли новая линия, налаженная на передовую технологию, позволяет получать более высокий уровень качества продукции. Решить задачу при α=0,005 (a – номер варианта).

 

 

№3. Для оценки существенности воздействия состояния окружающей среды на здоровье людей в районе с неблагоприятной экологической обстановкой проведены обследования 12 отобранных случайных групп населения и получены данные, представленные в таблице.

Известно, что средний по стране уровень продолжительности жизни составляет 69 лет, средняя заболеваемость онкологическими заболеваниями составляет 580 человек на 100 тыс. человек, средний уровень младенческой смертности равен 12%. Определить, действительно ли экологическая обстановка оказывает негативное влияние на уровень здоровья. Найти доверительные интервалы по первому и второму походам. Решить задачу при α=0,01 (a – номер варианта).

 

Группа населения Средний уровень продолжительности жизни, лет Уровень заболеваемости болезнями дыхательных путей, на 100 тыс. человек Уровень младенческой смертности, %
64 + a 590 – a
58 + a 604 – a
67 + a 598 – a
66 + a 610 – a
71 + a 690 – a
56 + a 540 – a
58 + a 624 – a
62 + a 670 – a
64 + a 656 – a
61 + a 711 – a
63 + a 630 – a
68 + a 705 – a

 

№4. Проверить существенность различий уровня эффективности работы предприятий двух отраслей А и Б по следующим данным (проверить гипотезы о равенстве векторов средних значений и равенстве ковариационных матриц):

 

Отрасль А Отрасль Б
Предприятие Рентабельность производства, % Среднегодовая выработка одного работника, тыс. руб. Предприятие Рентабельность производства,% Среднегодовая выработка одного работника, тыс. руб.
14 + 0,5a 3,6 + 0,1a 4 + 0,5a 2,8 + 0,1a
18 + 0,5a 4,4 + 0,1a 7 + 0,5a 2,6 + 0,1a
12 + 0,5a 4,2 + 0,1a 12 + 0,5a 4,1 + 0,1a
16 + 0,5a 3,9 + 0,1a 6 + 0,5a 2,3 + 0,1a
11 + 0,5a 3,4 + 0,1a 8 + 0,5a 3,5 + 0,1a
9 + 0,5a 2,8 + 0,1a 11 + 0,5a 3,8 + 0,1a
      5 + 0,5a 2,2 + 0,1a
      11 + 0,5a 3,7 + 0,1a

 

Решить задачу при α=0,1.

 

№5.

Проверить, оказывает ли влияние на значения показателей муниципаль­ных районов Вологодской области наличие рядом расположенных городов.Проверку проводить для следующихе факторов, представленных в таблице.

 

№ варианта Показатель
Z1
Z2
Z43
Z45
Z49
Z50
Z51
Z52
Z53
Z54

 

Районы, расположенные рядом с городами: Великоустюгский, Вологодский, Грязовецкий, Сокольский, Череповецкий и Шекснинский.

Проверить гипотезы о равенстве средних значений в группах. Решить задачу при α=0,005.

 

№6.

Сравните вектора средних и ковариационные матрицы показателей Вологодской области с среднероссийскими значениями.

Найти доверительные интервалы по первому и второму подходам. Решить задачу при α=0,01.

 

№ варианта Показатель Х1 Показатель Х2 Показатель Х3
Z1 Z2 Z17
Z33 Z34 Z35
Z17 Z33 Z43
Z61 Z62 Z69
Z71 Z72 Z73
Z72 Z73 Z74
Z79 Z80 Z81
Z83 Z84 Z85
Z86 Z87 Z88
Z6 Z7 Z8

 

№7. Проверить существенность различий показателей 1998 и 2007 годов:

 

№ варианта Показатель Х1 Показатель Х2 Примечание
Z87, Z95 Z88, Z96 для западных районов ВО
Z87, Z95 Z88, Z96 для восточных районов ВО
Z87, Z95 Z88, Z96 для районов, расположенных рядом с промышленными центрами
Z87, Z95 Z88, Z96 для районов, расположенных далеко от промышленных центров
Z89, Z97 Z90, Z98 для западных районов ВО
Z89, Z97 Z90, Z98 для восточных районов ВО
Z91, Z99 Z92, Z100 для западных районов ВО
Z91, Z99 Z92, Z100 для восточных районов ВО
Z86, Z94 Z93, Z101 для районов, расположенных рядом с промышленными центрами
Z86, Z94 Z93, Z101 для районов, расположенных далеко от промышленных центров

 

Решить задачу при α=0,1.

 

 

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.