Системы случайных величин
На практике часто бывает так, что результаты опыта описываются не одной, а несколькими случайными величинами Например, если опыт - работа предприятия за некоторый период времени, то он может характеризоваться такими величинами:
- количество работающих;
- величина произведенной продукции;
- фонд заработной платы;
- количество поставщиков;
- количество потребителей и т.д.
Результаты такого опыта, как медосмотр, также могут быть описаны несколькими случайными величинами:
- возраст,
- рост,
- вес,
- наличие хронических заболеваний и т.д.
В таких случаях говорят, что речь идет о системе случайных величин ( ), которую еще называют многомерной случайной величиной или случайным вектором. Величины называются компонентами системы или координатами многомерной случайной величины (случайного вектора). В систему могут входить только дискретные случайные величины, или только непрерывные, или и те, и другие.
Свойства системы определяются не только свойствами отдельных входящих в систему величин, но и взаимодействием, связью между ними. Например, число работающих на предприятии и величина произведенной продукции обычно связаны между собой, также как часто бывают связаны возраст и наличие хронических заболеваний. Это обстоятельство учитывается при описании и исследовании многомерных случайных величин.
Описание и исследование системы из многих случайных величин является очень непростой задачей, поэтому часто из общей системы выделяют систему двух случайных величин и и исследуют её.
Изначально сведения о такой системе представляют собой ряд зарегистрированных значений той и другой случайной величины. Для удобства дальнейшего исследования эти значения вносят в корреляционную таблицу следующего вида.
|
|
| . . .
|
|
|
|
|
| . . .
|
|
|
|
|
| . . .
|
|
| . . .
| . . .
| . . .
| . . .
| . . .
| . . .
|
|
|
| . . .
|
|
|
|
|
| . . .
|
|
| В первой строке таблицы в порядке возрастания указаны все значения, которые принимает компонента : , в первом столбце, также в порядке возрастания - значения, которые принимает компонента : . В клетках указаны частоты каждой пары вида .
Если каждая пара значений случайных величин встречается один раз, корреляционная таблица может иметь более простой вид.
При исследовании системы случайных величин важен вопрос, существует ли взаимосвязь между величинами, т.е. оказывают ли значения одной величины на значения другой. Если эта взаимосвязь существует, то каков её вид и какова теснота связи между величинами.
Чтобы получить ответ на этот вопрос, данные корреляционной таблицы представляют графически в виде поля рассеяния, отмечая точками на координатной плоскости каждую зарегистрированную пару значений случайных величин.
По положению точек делают вывод о наличии зависимости и её типе. На практике проявление взаимосвязи между величинами искажается действием множества случайных факторов. Установление функциональной взаимосвязи между величинами, освобождённое от влияния случайностей, является как бы возвращением, регрессией к истинной зависимости. Поэтому уравнение, описывающее зависимость между величинами, называется уравнением регрессии, линия, соответствующая этому уравнению, называется линией регрессии.
Выделяют два типа регрессии: линейную и не линейную.
Уравнения линейной регрессии можно найти по формулам:

Черта сверху означает среднее значение, каждое из которых можно найти по формулам:

Теснота связи между величинами в случае линейной регрессии может быть оценена с помощью коэффициента корреляции:
.
Значения коэффициента корреляции заключены в следующих пределах:
.
Если , то говорят о положительной корреляции, если , то говорят об отрицательной корреляции.
В случае нелинейной регрессии её уравнение может быть найдено с помощью метода наименьших квадратов. Теснота связи между величинами может быть оценена с помощью индекса корреляции:
.
В этой формуле - зарегистрированные значения величины ;
- значения величины , рассчитанные по формуле функциональной зависимости, найденной методом наименьших квадратов;
- среднее арифметическое значений величины ;
- количество зарегистрированных в эксперименте пар значений величин и .
Индекс корреляции может принимать значения от 0 до 1.
Пример. Система двух случайных величин Х и Y задана таблицей:
Х
| Y
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| Изобразить поле рассеяния, установить тип регрессии, составить уравнения линий регрессии и нарисовать их на поле рассеяния, оценить тесноту связи между величинами.
Положение точек на поле рассеяния позволяет сделать вывод о линейной регрессии, т.е. линейной зависимости между величинами. Для большей наглядности можно отметить средние значения у при соответствующих значениях х:
;
;
;
.
Указанные значения отмечены кружками на поле рассеяния.
Уравнения линейной регрессии найдём по соответствующим формулам.
Найдем необходимые для этого средние величины:





Выпишем уравнение регрессии Y по Х:
.
После преобразований это уравнение можно привести к виду:
.
График данной линии нарисован на поле рассеяния под номером 1.
Выпишем уравнение регрессии Х по Y:
.
После преобразований это уравнение можно привести к виду:
.
График этой линии нарисован на поле рассеяния под номером 2.
Поскольку зависимость между величинами линейная, тесноту связи между ними оценим с помощью коэффициента корреляции:

Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2025 stydopedia.ru Все материалы защищены законодательством РФ.
|