|
МАТЕМАТИЧЕМКАЯ СТАТИСТИКА
Математическая статистика
Программные вопросы
1. Генеральная и выборочная совокупности и их объёмы.
2. Вариационный и интервальный ряды распределения. Статистическое распределение. Полигон и гистограмма.
3. Основные характеристики вариационного ряда: выборочная средняя, низшая и высшая средние, мода и медиана, выборочная дисперсия и среднее квадратическое отклонение; исправленная дисперсия, стандарт, коэффициент вариации.
4. Статистическая гипотеза. Проверка гипотезы о нормальном распределении признака с помощью критериев согласия ─ Пирсона и ─ Смирнова.
5. Точечные и интервальные оценки генеральной средней и генерального среднего квадратического отклонения для нормально распределённого признака.
6. Ошибки выборочных оценок.
Решение типового примера
Пример 13.1.В таблице 1 приведены денежные затраты Х на животноводство, заданные выборкой по 60 хозяйствам области, дес. тыс. руб. на 100 голов.
Требуется для признака Х:
1. Построить интервальный ряд распределения; для каждого интервала подсчитать локальные, а также накопленные частоты; построить вариационный ряд;
2. Построить полигон и гистограмму;
3. Определить выборочную среднюю; а также низшую и высшую частные средние; моду и медиану; дисперсию и среднее квадратическое отклонение; коэффициент вариации;
4. Проверить при уровне значимости 0,05 гипотезу о нормальном законе распределения соответствующего признака с помощью критериев согласия χ2 ─ Пирсона и ─ Смирнова;
5. Найти точечные и интервальные оценки генеральной средней и среднего квадратического отклонения (при доверительной вероятности р = =0,95);
6. Найти ошибки выборочных оценок;
7. Произвести анализ всех вычисленных статистических параметров.
Таблица 13.1
Распределение затрат на животноводство
Решение.
1) Составим интервальный ряд для признака Х. Для этого найдём размах варьирования значений признака по формуле: RХ =Xmax - Xmin.
Из таблицы 13.1 следует: Xmax = 68 ; Xmin = 18 и RХ = 68 - 18 = 50.
Число интервалов m, на которые следует разбить интервал значений признака, найдём по формуле Стерджеса: m = 1+3,322 lg n, где n - объём выборки, то есть число единиц наблюдения.
В нашем примере n=60. Получим: m = 1+3,322•lg 60 = 1+3,322•1,778 = =6,9 ≈7.
Теперь рассчитаем шаг (длину частичного интервала) h по формуле:
h= = 7,1. Округление шага производится, как правило, в большую сторону. Таким образом, принимаем h=8.
За начало первого интервала принимаем такое значение из интервала [хmin- ; хmin), чтобы середина полученного интервала оказалась удобным для расчетов числом. В нашем случае за нижнюю границу интервала возьмём хmin - 2 = 18 - 2 = 16. В результате получим следующие границы интервалов: 16-24-32-40-48-56-64-72.
Подсчитаем частоту каждого интервала, то есть число вариант, попавших в этот интервал. Варианты, совпадающие с границами частичных интервалов, включают в правый интервал.
Для удобства подсчёта частот используют «метод конверта»:
Его вершины, стороны и диагонали обозначают одну единицу. Итого: 4 вершины, 4 стороны и 2 диагонали. Всего 10 единиц. Например,
2; -7; - 8; - 10.
Таблица 13.2
Распределение частот денежных затрат на животноводство
Ii
| Интервалы
| Середины
Интервала, xi
| Разноска
| Частоты
Ni
| Накопленные
Частоты niнак.
|
| 16 –24
24 – 32
32 – 40
40 – 48
48 – 56
56 – 64
64 – 72
|
|
|
|
|
| ∑
|
|
|
|
|
В табл. 13.2 произведена разноска значений признака Х, указаны интервалы, середины интервалов, частоты ni, накопленные частоты, равные сумме частот, попавших в предшествующие интервалы.
Интервалы и их частоты представляют собой интервальный ряд. Середины интервалов и соответствующие частоты дают вариационный ряд (табл. 13.3).
Таблица 13.3
Вариационный ряд
2) Графически интервальный ряд изображают с помощью гистограммы. Для её построения в прямоугольной системе координат на оси абсцисс откладывают отрезки, соответствующие интервалам вариационного ряда. На этих отрезках строят прямоугольники с высотами, равными частотам. Полученная ступенчатая фигура, состоящая из прямоугольников, и есть гистограмма. Для признака Х гистограмма изображена на рис. 13.1.
n
Рис. 13.1. Гистограмма распределения денежных затрат на животноводство
Для графического изображения дискретного ряда служит многоугольник (полигон). Для его построения на оси абсцисс откладываются варианты, а на оси ординат их частоты. Полученные точки соединяют отрезками. Полигон вариационного ряда признака Х изображён
на рис.13 2.
15
11
9
5
3
0 20 28 36 44 52 60 68 xi
Рис. 13.2. Полигон денежных затрат на животноводство
3) Для интервального ряда распределения выборочная средняя вычисляется по формуле:
,
где хi - середина i - го интервала, ni - частота i- го интервала, n – объём выборки.
Используя данные табл. 13.3., вычислим средние затраты на животноводство: = , то есть 455 тыс. руб. на 100 голов.
Низшая и высшая частные средние находятся по формулам:
и ,
причём в знаменателе суммируются частоты тех же групп, что и в числителе.
Вычисляем: ;
.
Для характеристики рядов распределения применяют также структурные средние: моду Мо и медиану Ме.
Мода – это варианта, которая наиболее часто встречается в данной совокупности, то есть варианта с наибольшей частотой.
Для интервального ряда (с равными интервалами) мода определяется по следующей формуле:
,
где h - шаг, - частота модального (содержащего моду) интервала; - частота домодального интервала; - частота послемодального интервала; - начало модального интервала.
В нашем случае Мо=40+ =46,4.
Медианой в статистике называют варианту, расположенную в середине вариационного ряда.
Для интервального ряда медиану определяют по формуле:
где хМе - начало медианного интервала (содержащего медиану), nн Me-1 - накопленная частота интервала, предшествующего медианному, nМе - локальная частота медианного интервала.
В нашем примере, используя данные таблицы 13.2, получим:
Ме=40 +8 ≈45,9
Дисперсия вариационного ряда служит для характеристики рассеяния значений признака вокруг среднего значения и вычисляется по формуле:
.
Для удобства вычислений дисперсии признака Х составим рабочую таблицу (см. табл. 13.4).
Таблица 3.4
I
|
|
|
|
|
|
|
|
| -25,5
-17,5
-9,5
-1,5
6,5
14,5
22.5
| 650,25
306,25
90,25
2,25
42,25
210,25
506,25
| 1950,75
1531,25
992,75
33,75
591,5 1892,25
1518,75
| ∑
|
|
|
|
|
|
Таким образом, .
Среднее квадратическое отклонение (стандарт) SX - это арифметическое значение квадратного корня из дисперсии.
.
Таблица 3.5
Характеристика
| Обозначение
| Значение
| Выборочная средняя, дес. тыс. руб.
|
|
45,5
| Размах варьирования, дес. тыс. руб.
|
RX
|
| Высшая средняя, дес. тыс. руб.
|
|
56,6
| Низшая средняя, дес. тыс. руб.
|
|
36,9
| Мода, дес, тыс. руб.
| Mo
| 46,4
| Медиана, дес. тыс. руб
| Me
| 45,9
| Дисперсия, кв. дес. тыс. руб.
| SX2
| 141,9
| Стандарт, дес. тыс. руб.
| SX
| 11,9
| Коэффициент вариации, %
| VX
| 2,62
| Для сравнения величин рассеяния вариационных рядов вычисляют коэффициент вариации Vх как процентное отношение стандарта к средней арифметической: .
Для признака Х: .
Результаты вычислений поместим в табл. 13.5.
4) Проверим гипотезу о соответствии данных ряда (табл. 3.3) нормальному закону распределения сначала по критерию Пирсона χ2. Для этого сравним наблюдаемые ni и теоретические nit (вычисленные в предположении нормального распределения) частоты. Теоретические частоты рассчитываются по формуле: , где nit ─ теоретические частоты, n ─ объём выборки, h ─ шаг (длина) частичного интервала, ─ нормированное отклонение, xi ─ середины частичных интервалов, ─ выборочная средняя, SХ ─ стандарт, ─ дифференциальная функция Лапласа (значения даны в приложении 1).
Таблица13. 6
Хi
| Ni
|
|
| nit
| ni-nit
|
|
|
| -2,14
| 0,0404
| 1,6
| 0,9
| 0,11
|
|
| -1,47
| 0,1354
| 5,5
|
|
| -0,8
| 0,2897
| 11,7
| 0,7
| 0,04
|
|
| -0,13
| 0,3956
| 16,0
| -1
| 0,06
|
|
| 0,8
| 0,2897
| 11,7
| 2,3
| 0,45
|
|
| 1,22
| 0,1895
| 7,6
| 1,7
| 0,28
|
|
| 1,89
| 0,0669
| 2,7
|
|
| ─
| ─
| 56,8
| ─
| 0,94
|
Критерий Пирсона применяется при условии, что все группы ряда включают частоты не меньшие 5 (т.е. ni 5). Если частота группы ряда менее 5, то эту группу следует объединить с соседней. Расчёты проверки критерия Пирсона поместим в табл. 6, вычислив предварительно , и используя, что .
Поскольку частоты крайних групп n1 = 3 < 5 и n7 = 3 < 5, то объединяем их с соседними группами.
Сумма последнего столбца определяет фактическую величину критерия Пирсона χф2 = 0,94. Эта величина сравнивается с предельным значением χкр2, значения которой даны в таблице (приложение 4) в зависимости от уровня значимости и числа степеней свободы , где ─ число групп вариационного ряда.
В условиях задачи, принимая надёжность результатов равной 95%(р=0,95), уровень значимости расчётов будет равен .
Число групп вариационного ряда, после объединения первой и второй, а так же шестой и седьмой групп, равна = 5, следовательно, число степеней свободы к = 5 - 3 = 2. Предельное значение критерия χкр2 при и к=2, находим по таблице приложения 4.
Сравнение фактического и критического значений даёт: .
Следовательно, с надёжностью р=95% можно принять гипотезу, что разность частот между фактическим и нормальным распределением несущественна, а получена за счёт случайных отклонений, и данное распределение вариант можно считать подчиняющимся закону нормального распределения.
Критерий Пирсона, как правило, используется, когда объём выборки n>100. Когда же 50<n<100, то наиболее эффективен критерий - Смирнова. Проверим гипотезу о нормальном распределении признака по этому критерию.
Критерий - Смирнова основан на определении существенности различий между накопленными частостями эмпирического Fi и теоретического Fit распределений.
Фактическое значение критерия ф2 вычисляют по формуле: , где Fi ─ накопленная частость i-ой группы,
Fit ─ теоретическое значение накопленной частости i-ой группы.
Вычисленное значение сравнивают с критическим значением , которое находится по таблице для величины n и уровня значимости . В частности, для = 0,05 .
Таблица 13.7
Xi
|
Фактическое распределение
|
Нормальное распределение
|
Fi- Fit
|
(Fi- Fit)2*10 6
| Частота ni
| Частость
| Накоплен. Частость Fi
| Частота nit
| Частость
| Накоплен. Частость Fit
|
|
| 0,050
| 0,050
| 1,6
| 0,027
| 0,027
| 0,023
|
|
|
| 0,083
| 0,133
| 5,5
| 0,092
| 0,119
| 0,014
|
|
|
| 0,183
| 0,316
| 11,7
| 0,195
| 0,314
| 0,002
|
|
|
| 0,250
| 0,566
| 16,0
| 0,267
| 0,581
| -0,015
|
|
|
| 0,233
| 0,799
| 11,7
| 0,195
| 0,776
| 0,023
|
|
|
| 0,150
| 0,949
| 7,6
| 0,127
| 0,903
| 0,046
|
|
|
| 1,050
| 0,999
| 2,7
| 0,045
| 0,948
| 0,051
|
|
|
| 0,999
|
| 56,8
|
|
|
| 6200
| Для n = 60 .
Расчёт поместим в таблицу 13.7, в которую также внесём сделанные ранее вычисления теоретических частот nit нормального распределения.
Сравнение фактического и предельного значений даёт: Следовательно, с надёжностью р = 0,95. можно полагать, что данная выборка подчиняется закону нормального распределения.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|