|
Гипотеза о равенстве вектора средних значений постоянному вектору
Лабораторная работа №3
Тема: Проверка статистических гипотез
Проверка гипотез.
Проверка статистической гипотезы предполагает наличие выборочной совокупности данных, которая параметрически (своей функцией распределения) сравнивается с генеральной совокупностью или другой выборкой.
При проверке статистических гипотез используется понятие нулевой (прямой) и альтернативной (обратной, конкурирующей) гипотез. Прямая гипотеза (H0) является основной и обычно содержит утверждение об отсутствии различий между сравниваемыми величинами. Альтернативная гипотеза (Н1) представляется конкурирующей по отношению к нулевой и принимается после того, как отвергнута основная.
Суждения об истинности или ложности статистической гипотезы строятся на основе критериальной (тестовой) проверки. Существуют статистические критерии, отражающие результаты сравнений и принимающие наблюдаемые значения по выборочным данным, а также критерии критических значений, установленные теоретическим путем. В ходе сопоставления критериальных величин выясняется: можно принимать или следует отвергнуть нулевую гипотезу. Если наблюдаемое значение критерия не превышает критического, то, по крайней мере, теоретически отсутствуют основания, чтобы отвергнуть прямую (нулевую) гипотезу. В противоположном случае целесообразно предположить справедливость альтернативной гипотезы Н1.
Критериальная проверка статистических гипотез допускает определенную вероятность ошибки в выводах. При этом разделяют вероятность ошибки первого рода ‑ отвергнуть нулевую гипотезу, когда она справедлива, и второго рода ‑ принять нулевую гипотезу, когда она ложна.
В экономических и социологических исследованиях из двух вероятностных характеристик ошибок, которые допускаются при проверке гипотез ( и ) обычно используется ‑ вероятность ошибки первого рода. Наиболее распространенными на практике значениями являются: 0,01; 0,05; 0,1, что соответственно указывает на вероятность получения достоверного вывода ( ) равную: 0,99; 0,95; 0,90.
Критериальная проверка гипотезы, в сущности, означает сравнительную характеристику параметрических значений или самого распределения случайной величины. Так, значения нормально распределенной величины, расположенные в непосредственной близости от центра распределения (математического ожидания ) и априорно имеющие более высокую степень (вероятность) принадлежности изучаемой совокупности данных, соответственно будут принимать критериальные значения, подтверждающие несущественность их отклонений от .
В многомерном случае используются те же статистические критерии соответствия, что и в одномерном, но они изменяются с учетом многовекторной природы случайной величины. Чаще всего это критерии для проверки параметрических гипотез: t-Стьюдента, F-Фишера, проверки непараметрических гипотез ‑ . С целью упрощения расчетов, а в последующем и выводов в анализе многомерной случайной величины часто принимается предположение о нормальности ее распределения.
Гипотеза о равенстве вектора средних значений постоянному вектору
В многомерном случае имеем дело c m – числом выборочных средних, т.е. вектором средних значений: Вектор сравнивается с постоянным вектором Прямая гипотеза имеет вид при альтернативной
Согласно двум приведенным гипотезам все соответствуют или существенно отличаются от
Наблюдаемое значение T2-критериявычисляется по формуле:
T2 ‑ критерий известен как критерий Хотеллинга
Наблюденное значение сопоставляется с критическим, исчисляемым при заранее заданном уровне вероятности а ‑ допустить ошибку в выводах и числе степеней свободы v1 = m и v2 = п - т :
В формуле — табличное значение F-критерия Фишера для известных v1=m и v2=n-m. Многомерная гипотеза подтверждается при и не может быть принята, если
В многомерном статистическом анализе проверяется гипотеза о равенстве векторов средних значений для двух выборок имеет вид:
при этом конкурирующая гипотеза может быть записана следующим образом:
или в векторной форме:
Наблюдаемое значение T2-критериявычисляется по формуле:
где — векторы средних значений;
– количество объектов в первой и второй выборках;
‑ матрица, обратная объединенной ковариационной матрице: по выборочной совокупности данных, где K ‑ матрица центрированных значений с элементами .
Критические значения для Т2 находятся по формуле, включающей квантиль F-распределения Фишера-Снедекора, определяемый при заданном уровне значимости и с числом степеней свободы :
.
При нулевая гипотеза принимается, и вывод о равенстве векторов средних значений следует с вероятностью . Если же , то гипотеза о равенстве векторов средних значений отвергается.
Расчет частных критериев для сравнений одного или нескольких средних значений из каждой выборочной совокупности осуществляется по формуле:
,
где — вектор, нивелирующий средние значения, не участвующие в сравнении, .
Для частных оценок различий средних значений критические величины определяются формулой:
.
Сравнение ковариационных матриц, отражающих взаимосвязи изучаемых признаков, открывает возможность дополнить и уточнить гипотетические предположения относительно самих признаков. Это приобретает особенное значение, если принять во внимание, что даже специфические индивидуальные признаковые характеристики могут совпадать случайно.
Нулевая гипотеза о равенстве дисперсий отклоняется, если и принимается, когда .
Формула расчета статистики ,
где параметры b и определяются по формулам:
,
,
где n – объем выборки;
m ‑ число признаков, представляющих многомерную выборочную совокупность;
‑ матрица парных корреляций j показателя.
Величина W-критерия сравнивается с — табличными значениями ( ).
Задания
№1. На частном предприятии с численностью работников 70–а человек средний уровень выработки одного рабочего составляет 500+10a деталей в день при среднеквадратическом отклонении 16+a деталей. С целью корректировки среднего нормативного уровня выработки в сторону повышения администрацией была отобрана группа наиболее подготовленных рабочих и по ним установлен средний уровень выработки 580+9a деталей. Можно ли вводить новый нормативный уровень выработки, не опасаясь конфликтов с рабочими? Решить задачу при α=0,05 (a – номер варианта).
№2. Чтобы оценить производственную эффективность предложенной к внедрению технологии, проведена проверка качества продукции, выпущенной на старой и новой автоматических линиях, при этом получены следующие данные об удельном весе продукции высшего качества, в %:
№ партии
| Старая линия
| № партии
| Новая линия
|
| 58 – a
|
| 74 – a
|
| 62 – a
|
| 59 – a
|
| 51 – a
|
| 69 – a
|
| 67 – a
|
| 78 – a
|
| 41– a
|
| 82 – a
|
| 53 – a
|
| 75 – a
|
|
|
| 86 – a
|
|
|
| 63 – a
|
Установить, действительно ли новая линия, налаженная на передовую технологию, позволяет получать более высокий уровень качества продукции. Решить задачу при α=0,005 (a – номер варианта).
№3. Для оценки существенности воздействия состояния окружающей среды на здоровье людей в районе с неблагоприятной экологической обстановкой проведены обследования 12 отобранных случайных групп населения и получены данные, представленные в таблице.
Известно, что средний по стране уровень продолжительности жизни составляет 69 лет, средняя заболеваемость онкологическими заболеваниями составляет 580 человек на 100 тыс. человек, средний уровень младенческой смертности равен 12%. Определить, действительно ли экологическая обстановка оказывает негативное влияние на уровень здоровья. Найти доверительные интервалы по первому и второму походам. Решить задачу при α=0,01 (a – номер варианта).
Группа населения
| Средний уровень продолжительности жизни, лет
| Уровень заболеваемости болезнями дыхательных путей,
на 100 тыс. человек
| Уровень младенческой смертности, %
|
| 64 + a
| 590 – a
|
|
| 58 + a
| 604 – a
|
|
| 67 + a
| 598 – a
|
|
| 66 + a
| 610 – a
|
|
| 71 + a
| 690 – a
|
|
| 56 + a
| 540 – a
|
|
| 58 + a
| 624 – a
|
|
| 62 + a
| 670 – a
|
|
| 64 + a
| 656 – a
|
|
| 61 + a
| 711 – a
|
|
| 63 + a
| 630 – a
|
|
| 68 + a
| 705 – a
|
|
№4. Проверить существенность различий уровня эффективности работы предприятий двух отраслей А и Б по следующим данным (проверить гипотезы о равенстве векторов средних значений и равенстве ковариационных матриц):
Отрасль А
| Отрасль Б
| Предприятие
| Рентабельность производства, %
| Среднегодовая выработка одного работника, тыс. руб.
| Предприятие
| Рентабельность производства,%
| Среднегодовая выработка одного работника,
тыс. руб.
|
| 14 + 0,5a
| 3,6 + 0,1a
|
| 4 + 0,5a
| 2,8 + 0,1a
|
| 18 + 0,5a
| 4,4 + 0,1a
|
| 7 + 0,5a
| 2,6 + 0,1a
|
| 12 + 0,5a
| 4,2 + 0,1a
|
| 12 + 0,5a
| 4,1 + 0,1a
|
| 16 + 0,5a
| 3,9 + 0,1a
|
| 6 + 0,5a
| 2,3 + 0,1a
|
| 11 + 0,5a
| 3,4 + 0,1a
|
| 8 + 0,5a
| 3,5 + 0,1a
|
| 9 + 0,5a
| 2,8 + 0,1a
|
| 11 + 0,5a
| 3,8 + 0,1a
|
|
|
|
| 5 + 0,5a
| 2,2 + 0,1a
|
|
|
|
| 11 + 0,5a
| 3,7 + 0,1a
|
Решить задачу при α=0,1.
№5.
Проверить, оказывает ли влияние на значения показателей муниципальных районов Вологодской области наличие рядом расположенных городов.Проверку проводить для следующихе факторов, представленных в таблице.
№ варианта
| Показатель
|
| Z1
|
| Z2
|
| Z43
|
| Z45
|
| Z49
|
| Z50
|
| Z51
|
| Z52
|
| Z53
|
| Z54
|
Районы, расположенные рядом с городами: Великоустюгский, Вологодский, Грязовецкий, Сокольский, Череповецкий и Шекснинский.
Проверить гипотезы о равенстве средних значений в группах. Решить задачу при α=0,005.
№6.
Сравните вектора средних и ковариационные матрицы показателей Вологодской области с среднероссийскими значениями.
Найти доверительные интервалы по первому и второму подходам. Решить задачу при α=0,01.
№ варианта
| Показатель Х1
| Показатель Х2
| Показатель Х3
|
| Z1
| Z2
| Z17
|
| Z33
| Z34
| Z35
|
| Z17
| Z33
| Z43
|
| Z61
| Z62
| Z69
|
| Z71
| Z72
| Z73
|
| Z72
| Z73
| Z74
|
| Z79
| Z80
| Z81
|
| Z83
| Z84
| Z85
|
| Z86
| Z87
| Z88
|
| Z6
| Z7
| Z8
|
№7. Проверить существенность различий показателей 1998 и 2007 годов:
№ варианта
| Показатель Х1
| Показатель Х2
| Примечание
|
| Z87, Z95
| Z88, Z96
| для западных районов ВО
|
| Z87, Z95
| Z88, Z96
| для восточных районов ВО
|
| Z87, Z95
| Z88, Z96
| для районов, расположенных рядом с промышленными центрами
|
| Z87, Z95
| Z88, Z96
| для районов, расположенных далеко от промышленных центров
|
| Z89, Z97
| Z90, Z98
| для западных районов ВО
|
| Z89, Z97
| Z90, Z98
| для восточных районов ВО
|
| Z91, Z99
| Z92, Z100
| для западных районов ВО
|
| Z91, Z99
| Z92, Z100
| для восточных районов ВО
|
| Z86, Z94
| Z93, Z101
| для районов, расположенных рядом с промышленными центрами
|
| Z86, Z94
| Z93, Z101
| для районов, расположенных далеко от промышленных центров
|
Решить задачу при α=0,1.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|