Задача нахождения неизвестных параметров распределения
Часто при обработке статистического материала вовсе не возникает вопрос об определении законов распределения исследуемых случайных величин. Обыкновенно это бывает связано с крайне недостаточным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случайная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений - определить только некоторые параметры (числовые характеристики) случайной величины или системы случайных величин. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неизбежно значительный элемент случайности; поэтому случайными оказываются и все параметры, вычисленные на основе этих данных. B таких условиях может быть поставлена только задача об определении так называемых «оценок» или «подходящих значений» для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошибкам, чем всякие другие. С задачей отыскания «подходящих значений» числовых характеристик тесно связана задача оценки их точности, надежности. Таков далеко не полный перечень основных задач математической статистики. Мы перечислили только те из них, которые наиболее важны для нас по своим практическим применениям.
Простая статистическая совокупность.
Статистическая функция распределения.
(Первая задача математической статистики)
Предположим, что изучается некоторая случайная величина X, закон распределения которой в точности неизвестен, и требуется определить этот закон из опыта или проверить экспериментально гипотезу о том, что величина Х подчинена тому или иному закону. С этой целью над случайной величиной Х прозизводится ряд независимых опытов (наблюдений). В каждом из этих опытов случайная величина X принимает определенное значение. Совокупность наблюденных значений величины и представляет собой первичный статистический материал, подлежащий обработке, осмыслению и научному анализу. Такая совокупность называется «простой статистической совокупностью» или «простым статистическим рядом». Обычно простая статистическая совокупность оформляется в виде таблицы с одним входом, в первом столбце которой стоит номер опыта, а во втором - наблюденное значение случайной величины.
Пример 1. Случайная величина β - количество преступлений за сутки. Проведено наблюдение в течение месяца. Результаты наблюдений сведены в простой статистический ряд:
i
| β
| i
| β
| i
| β
|
|
40 50
| 11 12 13 14
|
60 29 49
|
|
46 27
40 60
| Простой статистический ряд представляет собой первичную форму записи статистического материала и может быть обработан различными способами. Одним из способов такой обработки является построение статистической функции распределения случайной величины.
Статистической функцией распределения случайной величины Х называется частота события Х < х в данном статистическом материале.
F*(x)=P*(X<x).
Для того чтобы найти значение статистической функции распределения при данном х, достаточно подсчитать число опытов, в которых величина Х приняла значение, меньшее чем х, и разделить на общее число n произведенных опытов.
График статистической функции распределения величины представлен на рис.
1 F(β)
Статистическая функция распределения любой случайной величины—прерывной или непрерывной—представляет собой прерывную ступенчатую функцию, скачки которой соответствуют наблюденным значениям случайной величины и по величине равны частотам этих значений. Если каждое отдельное значение случайной величины Х было наблюдено только один раз, скачок статистической функции распределения в каждом наблюlенном значении равен 1/n, где n число наблюдений.
При увеличении числа опытов n, согласно теореме Бернулли, при любом х частота события Х < х приближается (сходится по вероятности) к вероятности этого события. Следовательно, при увеличении n статистическая функция распределения F* (х) приближается (сходится по вероятности) к подлинной функции распределения F(x) случайной величины X.
Если Х—непрерывная случайная величина, то при увеличении числа наблюдений n число скачков функции (х) увеличивается, самые скачки уменьшаются и график функции F*(x) неограниченно приближается к плавной кривой F(x)—функции распределения величины X.
В принципе построение статистической функции распределения уже решает задачу описания экспериментального материала. Однако при большом числе опытов n построение F* (х) описанным выше способом весьма трудоемко. Кроме того, часто бывает удобно — в смысле наглядности — пользоваться другими характеристиками статистических распределений, аналогичными не функции распределения F (х), а плотности f(x). С такими способами описания статистических данных мы познакомимся в следующем параграфе.
Статистический ряд. Гистограмма
При большом числе наблюдений (порядка сотен) простая статистическая совокупность перестает быть удобной формой записи статистического материала — она становится слишком громоздкой и мало наглядной. Для придания ему большей компактности и наглядности статистический материал должен быть подвергнут дополнительной обработке — строится так называемый «статистический ряд».
Предположим, что в нашем распоряжении результаты наблюдений над непрерывной случайной величиной X, оформленные в виде простой статистической совокупности. Разделим весь диапазон наблюденных значений Х на интервалы или «разряды» и подсчитаем количество значений mi приходящееся на каждый i-й разряд. Это число разделим на общее число наблюдений n и найдем частоту, соответствующую данному разряду:
Рi =mi / n
Сумма частот всех разрядов, очевидно, должна быть равна единице,
Построим таблицу, в которой приведены разряды в порядке их расположения вдоль оси абсцисс и соответствующие частоты. Эта таблица называется статистическим рядом:
Ii
| х1, X2
| x2; X3
| ...
| Xi,Xi+1
| • . •
| xk,xk+1
| Pi
| P1
| P2
| ...
| Pi
| . . .
| рk
| Здесь /,—обозначение i-го разряда; хi, Xi+1—его границы; рi'— соответствующая частота; k — число разрядов.
Пример 1. Результаты измерений () сведены в статистический ряд:
Ii
| -4; -3
| -3; —2
| -2; -1
| -1; 0
| 0; 1
| 1:2
| 2; 3
| 3; 4
| mi
|
|
|
|
|
|
|
|
| Pi*
| 0,012
| 0,050
| 0,144
| 0,266
| 0,240
| 0,176
| 0,092
| 0,020
| Здесь Ii обозначены интервалы значений ошибки наводки; mi—число наблюдений в данном интервале, рi = mi/n - соответствующие частоты.
При группировке наблюденных значений случайной величины по разрядам возникает вопрос о том, к какому разряду отнести значение, находящееся в точности на границе двух разрядов. В этих случаях можно рекомендовать (чисто условно) считать данное значение принадлежащим в равной мере к обоим разрядам и прибавлять к числам m-i того и другого, разряда по 1/2.
Число разрядов, на которые следует группировать статистический материал, не должно быть слишком большим (тогда ряд распределения становится невыразительным, и частоты в нем обнаруживают незакономерные колебания); с другой стороны, оно не должно быть слишком малым (при малом числе разрядов свойства распределения описываются статистическим рядом слишком грубо). Практика показывает, что в большинстве случаев рационально выбирать число разрядов порядка 10—20. Чем богаче и однороднее статистический материал, тем большее число разрядов можно выбирать при составлении статистического ряда. Длины разрядов могут быть как одинаковыми, так и различными. Проще, разумеется, брать их одинаковыми. Однако при оформлении данных о случайных величинах, распределенных крайне неравномерно, иногда бывает удобно выбирать в области наибольшей плотности распределения разряды более узкие. чем в области малой плотности.
Статистический ряд часто оформляется графически в виде так называемой гистограммы.. Гистограмма строится следующим образом. По оси абсцисс откладываются разряды, и на каждом из разрядов как их основании строится прямоугольник, площадь которого равна частоте данного разряда. Для построения гистограммы нужно частоту каждого разряда разделить на его длину и полученное число взять в качестве высоты прямоугольника. В случае равных по длине разрядов высоты прямоугольников пропорциональны соответствующим частотам. Из способа построения гистограммы следует, что полная площадь ее равна единице.
0 1 2 3 4 5 X
Очевидно, при увеличении числа опытов можно выбирать все более и более мелкие разряды; при этом гистограмма будет все более приближаться к некоторой кривой, ограничивающей площадь, равную единице. Нетрудно убедиться, что эта кривая представляет собой график плотности распределения величины X.
Пользуясь данными статистического ряда, можно приближенно построить и статистическую функцию распределения величины X. Построение точной статистической функции распределения с несколькими сотнями скачков во всех наблюденных значениях Х слишком трудоемко и себя не оправдывает.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2025 stydopedia.ru Все материалы защищены законодательством РФ.
|