Сделай Сам Свою Работу на 5

Системы случайных величин





На практике часто бывает так, что результаты опыта описываются не одной, а несколькими случайными величинами Например, если опыт - работа предприятия за некоторый период времени, то он может характеризоваться такими величинами:

- количество работающих;

- величина произведенной продукции;

- фонд заработной платы;

- количество поставщиков;

- количество потребителей и т.д.

Результаты такого опыта, как медосмотр, также могут быть описаны несколькими случайными величинами:

- возраст,

- рост,

- вес,

- наличие хронических заболеваний и т.д.

В таких случаях говорят, что речь идет о системе случайных величин ( ), которую еще называют многомерной случайной величиной или случайным вектором. Величины называются компонентами системы или координатами многомерной случайной величины (случайного вектора). В систему могут входить только дискретные случайные величины, или только непрерывные, или и те, и другие.

Свойства системы определяются не только свойствами отдельных входящих в систему величин, но и взаимодействием, связью между ними. Например, число работающих на предприятии и величина произведенной продукции обычно связаны между собой, также как часто бывают связаны возраст и наличие хронических заболеваний. Это обстоятельство учитывается при описании и исследовании многомерных случайных величин.



Описание и исследование системы из многих случайных величин является очень непростой задачей, поэтому часто из общей системы выделяют систему двух случайных величин и и исследуют её.

Изначально сведения о такой системе представляют собой ряд зарегистрированных значений той и другой случайной величины. Для удобства дальнейшего исследования эти значения вносят в корреляционную таблицу следующего вида.

. . .
. . .
. . .
. . . . . . . . . . . . . . . . . .
. . .
. . .

В первой строке таблицы в порядке возрастания указаны все значения, которые принимает компонента : , в первом столбце, также в порядке возрастания - значения, которые принимает компонента : . В клетках указаны частоты каждой пары вида .



Если каждая пара значений случайных величин встречается один раз, корреляционная таблица может иметь более простой вид.

. . .
. . .

При исследовании системы случайных величин важен вопрос, существует ли взаимосвязь между величинами, т.е. оказывают ли значения одной величины на значения другой. Если эта взаимосвязь существует, то каков её вид и какова теснота связи между величинами.

Чтобы получить ответ на этот вопрос, данные корреляционной таблицы представляют графически в виде поля рассеяния, отмечая точками на координатной плоскости каждую зарегистрированную пару значений случайных величин.

По положению точек делают вывод о наличии зависимости и её типе. На практике проявление взаимосвязи между величинами искажается действием множества случайных факторов. Установление функциональной взаимосвязи между величинами, освобождённое от влияния случайностей, является как бы возвращением, регрессией к истинной зависимости. Поэтому уравнение, описывающее зависимость между величинами, называется уравнением регрессии, линия, соответствующая этому уравнению, называется линией регрессии.

Выделяют два типа регрессии: линейную и не линейную.

Уравнения линейной регрессии можно найти по формулам:

Черта сверху означает среднее значение, каждое из которых можно найти по формулам:

Теснота связи между величинами в случае линейной регрессии может быть оценена с помощью коэффициента корреляции:

.

Значения коэффициента корреляции заключены в следующих пределах:

.

Если , то говорят о положительной корреляции, если , то говорят об отрицательной корреляции.



В случае нелинейной регрессии её уравнение может быть найдено с помощью метода наименьших квадратов. Теснота связи между величинами может быть оценена с помощью индекса корреляции:

.

В этой формуле - зарегистрированные значения величины ;

- значения величины , рассчитанные по формуле функциональной зависимости, найденной методом наименьших квадратов;

- среднее арифметическое значений величины ;

- количество зарегистрированных в эксперименте пар значений величин и .

Индекс корреляции может принимать значения от 0 до 1.

Пример. Система двух случайных величин Х и Y задана таблицей:

Х Y
         
       
     
         
 

Изобразить поле рассеяния, установить тип регрессии, составить уравнения линий регрессии и нарисовать их на поле рассеяния, оценить тесноту связи между величинами.

Положение точек на поле рассеяния позволяет сделать вывод о линейной регрессии, т.е. линейной зависимости между величинами. Для большей наглядности можно отметить средние значения у при соответствующих значениях х:

;

;

;

.

Указанные значения отмечены кружками на поле рассеяния.

Уравнения линейной регрессии найдём по соответствующим формулам.

Найдем необходимые для этого средние величины:

Выпишем уравнение регрессии Y по Х:

.

После преобразований это уравнение можно привести к виду:

.

График данной линии нарисован на поле рассеяния под номером 1.

Выпишем уравнение регрессии Х по Y:

.

После преобразований это уравнение можно привести к виду:

.

График этой линии нарисован на поле рассеяния под номером 2.

Поскольку зависимость между величинами линейная, тесноту связи между ними оценим с помощью коэффициента корреляции:

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.