Сделай Сам Свою Работу на 5

МАТЕМАТИЧЕМКАЯ СТАТИСТИКА





Математическая статистика

Программные вопросы

1. Генеральная и выборочная совокупности и их объёмы.

2. Вариационный и интервальный ряды распределения. Статистическое распределение. Полигон и гистограмма.

3. Основные характеристики вариационного ряда: выборочная средняя, низшая и высшая средние, мода и медиана, выборочная дисперсия и среднее квадратическое отклонение; исправленная дисперсия, стандарт, коэффициент вариации.

4. Статистическая гипотеза. Проверка гипотезы о нормальном распределении признака с помощью критериев согласия ─ Пирсона и ─ Смирнова.

5. Точечные и интервальные оценки генеральной средней и генерального среднего квадратического отклонения для нормально распределённого признака.

6. Ошибки выборочных оценок.

 

Решение типового примера

 

Пример 13.1.В таблице 1 приведены денежные затраты Х на животноводство, заданные выборкой по 60 хозяйствам области, дес. тыс. руб. на 100 голов.

Требуется для признака Х:

1. Построить интервальный ряд распределения; для каждого интервала подсчитать локальные, а также накопленные частоты; построить вариационный ряд;



2. Построить полигон и гистограмму;

3. Определить выборочную среднюю; а также низшую и высшую частные средние; моду и медиану; дисперсию и среднее квадратическое отклонение; коэффициент вариации;

4. Проверить при уровне значимости 0,05 гипотезу о нормальном законе распределения соответствующего признака с помощью критериев согласия χ2 ─ Пирсона и ─ Смирнова;

5. Найти точечные и интервальные оценки генеральной средней и среднего квадратического отклонения (при доверительной вероятности р = =0,95);

6. Найти ошибки выборочных оценок;

7. Произвести анализ всех вычисленных статистических параметров.

Таблица 13.1

Распределение затрат на животноводство

X X X X X X
       

 

Решение.

1) Составим интервальный ряд для признака Х. Для этого найдём размах варьирования значений признака по формуле: RХ =Xmax - Xmin.

Из таблицы 13.1 следует: Xmax = 68 ; Xmin = 18 и RХ = 68 - 18 = 50.



Число интервалов m, на которые следует разбить интервал значений признака, найдём по формуле Стерджеса: m = 1+3,322 lg n, где n - объём выборки, то есть число единиц наблюдения.

В нашем примере n=60. Получим: m = 1+3,322•lg 60 = 1+3,322•1,778 = =6,9 ≈7.

 

Теперь рассчитаем шаг (длину частичного интервала) h по формуле:

h= = 7,1. Округление шага производится, как правило, в большую сторону. Таким образом, принимаем h=8.

За начало первого интервала принимаем такое значение из интервала [хmin- ; хmin), чтобы середина полученного интервала оказалась удобным для расчетов числом. В нашем случае за нижнюю границу интервала возьмём хmin - 2 = 18 - 2 = 16. В результате получим следующие границы интервалов: 16-24-32-40-48-56-64-72.

Подсчитаем частоту каждого интервала, то есть число вариант, попавших в этот интервал. Варианты, совпадающие с границами частичных интервалов, включают в правый интервал.

Для удобства подсчёта частот используют «метод конверта»:

Его вершины, стороны и диагонали обозначают одну единицу. Итого: 4 вершины, 4 стороны и 2 диагонали. Всего 10 единиц. Например,

2; -7; - 8; - 10.

Таблица 13.2

Распределение частот денежных затрат на животноводство

 

Ii Интервалы Середины Интервала, xi Разноска Частоты Ni Накопленные Частоты niнак.
16 –24 24 – 32 32 – 40 40 – 48 48 – 56 56 – 64 64 – 72
   

 

В табл. 13.2 произведена разноска значений признака Х, указаны интервалы, середины интервалов, частоты ni, накопленные частоты, равные сумме частот, попавших в предшествующие интервалы.



Интервалы и их частоты представляют собой интервальный ряд. Середины интервалов и соответствующие частоты дают вариационный ряд (табл. 13.3).

Таблица 13.3

Вариационный ряд

  Варианта, хi
  Частота, ni  

 

2) Графически интервальный ряд изображают с помощью гистограммы. Для её построения в прямоугольной системе координат на оси абсцисс откладывают отрезки, соответствующие интервалам вариационного ряда. На этих отрезках строят прямоугольники с высотами, равными частотам. Полученная ступенчатая фигура, состоящая из прямоугольников, и есть гистограмма. Для признака Х гистограмма изображена на рис. 13.1.

 

n

               
               
                 
                 
               
                 
               
                 
                 
                 
               
                 
               
                 
                 
 

Рис. 13.1. Гистограмма распределения денежных затрат на животноводство

 

Для графического изображения дискретного ряда служит многоугольник (полигон). Для его построения на оси абсцисс откладываются варианты, а на оси ординат их частоты. Полученные точки соединяют отрезками. Полигон вариационного ряда признака Х изображён

 

на рис.13 2.

15

11

9

5

3

0 20 28 36 44 52 60 68 xi

Рис. 13.2. Полигон денежных затрат на животноводство


3) Для интервального ряда распределения выборочная средняя вычисляется по формуле:

,

где хi - середина i - го интервала, ni - частота i- го интервала, n – объём выборки.

Используя данные табл. 13.3., вычислим средние затраты на животноводство: = , то есть 455 тыс. руб. на 100 голов.

Низшая и высшая частные средние находятся по формулам:

и ,

причём в знаменателе суммируются частоты тех же групп, что и в числителе.

Вычисляем: ;

.

Для характеристики рядов распределения применяют также структурные средние: моду Мо и медиану Ме.

Мода – это варианта, которая наиболее часто встречается в данной совокупности, то есть варианта с наибольшей частотой.

Для интервального ряда (с равными интервалами) мода определяется по следующей формуле:

,

где h - шаг, - частота модального (содержащего моду) интервала; - частота домодального интервала; - частота послемодального интервала; - начало модального интервала.

В нашем случае Мо=40+ =46,4.

Медианой в статистике называют варианту, расположенную в середине вариационного ряда.

Для интервального ряда медиану определяют по формуле:

где хМе - начало медианного интервала (содержащего медиану), nн Me-1 - накопленная частота интервала, предшествующего медианному, nМе - локальная частота медианного интервала.

В нашем примере, используя данные таблицы 13.2, получим:

Ме=40 +8 ≈45,9

Дисперсия вариационного ряда служит для характеристики рассеяния значений признака вокруг среднего значения и вычисляется по формуле:

.

Для удобства вычислений дисперсии признака Х составим рабочую таблицу (см. табл. 13.4).

Таблица 3.4

I
  -25,5 -17,5 -9,5 -1,5 6,5 14,5 22.5 650,25 306,25 90,25 2,25 42,25 210,25 506,25 1950,75 1531,25 992,75 33,75 591,5 1892,25 1518,75
     

 

Таким образом, .

Среднее квадратическое отклонение (стандарт) SX - это арифметическое значение квадратного корня из дисперсии.

.

Таблица 3.5

Характеристика Обозначение Значение
Выборочная средняя, дес. тыс. руб.     45,5
Размах варьирования, дес. тыс. руб.   RX  
Высшая средняя, дес. тыс. руб.     56,6
Низшая средняя, дес. тыс. руб.     36,9
Мода, дес, тыс. руб. Mo 46,4
Медиана, дес. тыс. руб Me 45,9
Дисперсия, кв. дес. тыс. руб. SX2 141,9
Стандарт, дес. тыс. руб. SX 11,9
Коэффициент вариации, % VX   2,62  

Для сравнения величин рассеяния вариационных рядов вычисляют коэффициент вариации Vх как процентное отношение стандарта к средней арифметической: .

Для признака Х: .

Результаты вычислений поместим в табл. 13.5.

 

4) Проверим гипотезу о соответствии данных ряда (табл. 3.3) нормальному закону распределения сначала по критерию Пирсона χ2. Для этого сравним наблюдаемые ni и теоретические nit (вычисленные в предположении нормального распределения) частоты. Теоретические частоты рассчитываются по формуле: , где nit ─ теоретические частоты, n ─ объём выборки, h ─ шаг (длина) частичного интервала, ─ нормированное отклонение, xi ─ середины частичных интервалов, ─ выборочная средняя, SХ ─ стандарт, ─ дифференциальная функция Лапласа (значения даны в приложении 1).

Таблица13. 6

Хi Ni nit ni-nit
-2,14 0,0404 1,6 0,9 0,11
-1,47 0,1354 5,5
-0,8 0,2897 11,7 0,7 0,04
-0,13 0,3956 16,0 -1 0,06
0,8 0,2897 11,7 2,3 0,45
1,22 0,1895 7,6 1,7 0,28
1,89 0,0669 2,7
56,8 0,94

 

 
Критерий Пирсона применяется при условии, что все группы ряда включают частоты не меньшие 5 (т.е. ni 5). Если частота группы ряда менее 5, то эту группу следует объединить с соседней. Расчёты проверки критерия Пирсона поместим в табл. 6, вычислив предварительно , и используя, что .

Поскольку частоты крайних групп n1 = 3 < 5 и n7 = 3 < 5, то объединяем их с соседними группами.

Сумма последнего столбца определяет фактическую величину критерия Пирсона χф2 = 0,94. Эта величина сравнивается с предельным значением χкр2, значения которой даны в таблице (приложение 4) в зависимости от уровня значимости и числа степеней свободы , где ─ число групп вариационного ряда.

В условиях задачи, принимая надёжность результатов равной 95%(р=0,95), уровень значимости расчётов будет равен .

Число групп вариационного ряда, после объединения первой и второй, а так же шестой и седьмой групп, равна = 5, следовательно, число степеней свободы к = 5 - 3 = 2. Предельное значение критерия χкр2 при и к=2, находим по таблице приложения 4.

Сравнение фактического и критического значений даёт: .

Следовательно, с надёжностью р=95% можно принять гипотезу, что разность частот между фактическим и нормальным распределением несущественна, а получена за счёт случайных отклонений, и данное распределение вариант можно считать подчиняющимся закону нормального распределения.

Критерий Пирсона, как правило, используется, когда объём выборки n>100. Когда же 50<n<100, то наиболее эффективен критерий - Смирнова. Проверим гипотезу о нормальном распределении признака по этому критерию.

Критерий - Смирнова основан на определении существенности различий между накопленными частостями эмпирического Fi и теоретического Fit распределений.

Фактическое значение критерия ф2 вычисляют по формуле: , где Fi ─ накопленная частость i-ой группы,

Fit ─ теоретическое значение накопленной частости i-ой группы.

Вычисленное значение сравнивают с критическим значением , которое находится по таблице для величины n и уровня значимости . В частности, для = 0,05 .

Таблица 13.7

  Xi   Фактическое распределение   Нормальное распределение     Fi- Fit   (Fi- Fit)2*10 6
Частота ni Частость Накоплен. Частость Fi Частота nit Частость Накоплен. Частость Fit
  0,050 0,050 1,6 0,027 0,027 0,023
0,083 0,133 5,5 0,092 0,119 0,014
0,183 0,316 11,7 0,195 0,314 0,002
0,250 0,566 16,0 0,267 0,581 -0,015
0,233 0,799 11,7 0,195 0,776 0,023
0,150 0,949 7,6 0,127 0,903 0,046
1,050 0,999 2,7 0,045 0,948 0,051
0,999   56,8       6200

Для n = 60 .

Расчёт поместим в таблицу 13.7, в которую также внесём сделанные ранее вычисления теоретических частот nit нормального распределения.

Сравнение фактического и предельного значений даёт: Следовательно, с надёжностью р = 0,95. можно полагать, что данная выборка подчиняется закону нормального распределения.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.