Сделай Сам Свою Работу на 5

Задача нахождения неизвестных параметров распределения





Часто при обработке статистического материала вовсе не возникает вопрос об определении законов распределения исследуемых слу­чайных величин. Обыкновенно это бывает связано с крайне недоста­точным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случай­ная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений - определить только некоторые параметры (числовые характеристики) случайной величины или системы случайных величин. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неизбежно значительный элемент случайности; поэтому случайными оказываются и все параметры, вычисленные на основе этих данных. B таких условиях может быть поставлена только задача об опреде­лении так называемых «оценок» или «подходящих значений» для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошиб­кам, чем всякие другие. С задачей отыскания «подходящих значений» числовых характеристик тесно связана задача оценки их точности, надежности. Таков далеко не полный перечень основных задач математиче­ской статистики. Мы перечислили только те из них, которые наиболее важны для нас по своим практическим применениям.



 

Простая статистическая совокупность.

Статистическая функция распределения.

(Первая задача математической статистики)

Предположим, что изучается некоторая случайная величина X, закон распределения которой в точности неизвестен, и требуется определить этот закон из опыта или проверить экспериментально гипотезу о том, что величина Х подчинена тому или иному закону. С этой целью над случайной величиной Х прозизводится ряд независимых опытов (наблюдений). В каждом из этих опытов случайная величина X принимает определенное значение. Совокупность наблю­денных значений величины и представляет собой первичный стати­стический материал, подлежащий обработке, осмыслению и научному анализу. Такая совокупность называется «простой статистической совокупностью» или «простым статистическим рядом». Обычно про­стая статистическая совокупность оформляется в виде таблицы с од­ним входом, в первом столбце которой стоит номер опыта, а во втором - наблюденное значение случайной величины.



Пример 1. Случайная величина β - количество преступлений за сутки. Проведено наблюдение в течение месяца. Результаты наблюдений сведены в простой статистический ряд:

i β i β i β
40 50 11 12 13 14 60 29 49 46 27 40 60

Простой статистический ряд представляет собой первичную форму записи статистического материала и может быть обработан различными способами. Одним из способов такой обработки является построение статистической функции распределения случайной величины.

Статистической функцией распределения случайной вели­чины Х называется частота события Х < х в данном стати­стическом материале.

F*(x)=P*(X<x).

Для того чтобы найти значение статистической функции распре­деления при данном х, достаточно подсчитать число опытов, в ко­торых величина Х приняла значение, меньшее чем х, и разделить на общее число n произведенных опытов.

График статистической функции распределения величины представлен на рис.

1 F(β)

       
   
 
 

 


Статистическая функция распределения любой случайной вели­чины—прерывной или непрерывной—представляет собой прерывную ступенчатую функцию, скачки которой соответствуют наблюденным значениям случайной величины и по величине равны частотам этих значений. Если каждое отдельное значение случайной величины Х было наблюдено только один раз, скачок статистической функции распределения в каждом наблюlенном значении равен 1/n, где n число наблюдений.



При увеличении числа опытов n, согласно теореме Бернулли, при любом х частота события Х < х приближается (сходится по вероят­ности) к вероятности этого события. Следовательно, при увеличе­нии n статистическая функция распределения F* (х) приближается (сходится по вероятности) к подлинной функции распределения F(x) случайной величины X.

Если Х—непрерывная случайная величина, то при увеличении числа наблюдений n число скачков функции (х) увеличивается, самые скачки уменьшаются и график функции F*(x) неограниченно приближается к плавной кривой F(x)—функции распределения ве­личины X.

В принципе построение статистической функции распределения уже решает задачу описания экспериментального материала. Однако при большом числе опытов n построение F* (х) описанным выше способом весьма трудоемко. Кроме того, часто бывает удобно — в смысле наглядности — пользоваться другими характеристиками ста­тистических распределений, аналогичными не функции распределе­ния F (х), а плотности f(x). С такими способами описания стати­стических данных мы познакомимся в следующем параграфе.

 

Статистический ряд. Гистограмма

 

При большом числе наблюдений (порядка сотен) простая стати­стическая совокупность перестает быть удобной формой записи статистического материала — она становится слишком громоздкой и мало наглядной. Для придания ему большей компактности и на­глядности статистический материал должен быть подвергнут до­полнительной обработке — строится так называемый «статистиче­ский ряд».

Предположим, что в нашем распоряжении результаты наблюдений над непрерывной случайной величиной X, оформленные в виде про­стой статистической совокупности. Разделим весь диапазон наблю­денных значений Х на интервалы или «разряды» и подсчитаем ко­личество значений mi приходящееся на каждый i-й разряд. Это число разделим на общее число наблюдений n и найдем частоту, соответ­ствующую данному разряду:

Рi =mi / n

Сумма частот всех разрядов, очевидно, должна быть равна единице,

Построим таблицу, в которой приведены разряды в порядке их расположения вдоль оси абсцисс и соответствующие частоты. Эта таблица называется статистическим рядом:

Ii х1, X2 x2; X3 ... Xi,Xi+1 • . • xk,xk+1
Pi P1 P2 ... Pi . . . рk

Здесь /,—обозначение i-го разряда; хi, Xi+1—его границы; рi'— соответствующая частота; k — число разрядов.

Пример 1. Результаты измерений () сведены в статистический ряд:

Ii -4; -3 -3; —2 -2; -1 -1; 0 0; 1 1:2 2; 3 3; 4
mi
Pi* 0,012 0,050 0,144 0,266 0,240 0,176 0,092 0,020

Здесь Ii обозначены интервалы значений ошибки наводки; mi—число наб­людений в данном интервале, рi = mi/n - соответствующие частоты.

При группировке наблюденных значений случайной величины по разрядам возникает вопрос о том, к какому разряду отнести значе­ние, находящееся в точности на границе двух разрядов. В этих случаях можно рекомендовать (чисто условно) считать данное зна­чение принадлежащим в равной мере к обоим разрядам и прибав­лять к числам m-i того и другого, разряда по 1/2.

Число разрядов, на которые следует группировать статистический материал, не должно быть слишком большим (тогда ряд распреде­ления становится невыразительным, и частоты в нем обнаруживают незакономерные колебания); с другой стороны, оно не должно быть слишком малым (при малом числе разрядов свойства распределения описываются статистическим рядом слишком грубо). Практика пока­зывает, что в большинстве случаев рационально выбирать число разрядов порядка 10—20. Чем богаче и однороднее статистический материал, тем большее число разрядов можно выбирать при состав­лении статистического ряда. Длины разрядов могут быть как одина­ковыми, так и различными. Проще, разумеется, брать их одинаковы­ми. Однако при оформлении данных о случайных величинах, рас­пределенных крайне неравномерно, иногда бывает удобно выбирать в области наибольшей плотности распределения разряды более узкие. чем в области малой плотности.

Статистический ряд часто оформляется графически в виде так называемой гистограммы.. Гистограмма строится следующим обра­зом. По оси абсцисс откладываются разряды, и на каждом из раз­рядов как их основании строится прямоугольник, площадь которого равна частоте данного разряда. Для построения гистограммы нужно частоту каждого разряда разделить на его длину и полученное число взять в качестве высоты прямоугольника. В случае равных по длине разрядов высоты прямоугольников пропорциональны соответствующим частотам. Из способа построения гистограммы следует, что полная площадь ее равна единице.

 
 

 


0 1 2 3 4 5 X

 

 

Очевидно, при увеличении числа опытов можно выбирать все более и более мелкие разряды; при этом гистограмма будет все более приближаться к некоторой кривой, ограничивающей площадь, равную единице. Нетрудно убедиться, что эта кривая представляет собой график плотности распределения величины X.

Пользуясь данными статистического ряда, можно приближенно построить и статистическую функцию распределения величины X. Построение точной статистической функции распределения с несколь­кими сотнями скачков во всех наблюденных значениях Х слишком трудоемко и себя не оправдывает.

 

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.