Сделай Сам Свою Работу на 5

Функциональные и стохастическиеКлассификация связизависимостей между социально-экономическими показателями. Статистические методы моделирования связи





ТВЕРСКОЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

(ТвГТУ)

ИДПО

 

Кафедра «Бухгалтерский учет и финансы»

Специальность: Финансы и кредит

 

 

КУРСОВОЙ ПРОЕКТ
по дисциплине «Эконометрика»

 

Студента Епихина Артёма Владимировича

(фамилия, имя, отчество)

На тему: «Исследование взаимосвязи социально-экономических явлений с помощью регрессионного анализа»

 

Руководитель работы:

канд. тех. наук, доцент

___________________ А.С. Коновалова

 

Исполнитель:

студент группы ФиК-1з-324-13(3 курс)

Епихин А.В.

 

 

Тверь, 2016


ОглавлениеСодержание

Введение. 3

1. Аналитическая часть. 4

1.1. Основные понятия корреляционного и регрессионного анализа. 4

1.2. Классификация зависимостей между социально-экономическими показателями 8

1.3. Моделирование зависимостей между социально-экономическими показателями методом корреляционно-регрессионного анализа. 12

2. Проектная часть. 17

2.1. Информационно-методическое обеспечение эконометрического исследования 17

2.2. Пример эконометрического исследования. 18

Заключение. 27

Список использованных источников. 28

ВВЕДЕНИЕ 3



ГЛАВА1: СУЩНОСТЬ ИССЛЕДОВАНИЯ ВЗАИМОСВЯЗЕЙ ПРИЗНАКОВ. ОСОБЕННОСТИ РЕГРЕССИОННОГО АНАЛИЗА 5

1.1. Основные понятия корреляционного и регрессионного анализа 5

1.2. Функциональные и стохастические связи. Статистические методы моделирования связи. 9

1.3. Статистическое моделирование связи методом корреляционного и регрессионного анализа 14

1.4. Условия применения и ограничения корреляционно-регрессионного метода 17

ГЛАВА2: Проектная часть – Регрессионный анализ уровня бедности в России. 20

2.1. Постановка задачи. 20

2.2. Построение корреляционно-регрессионной модели. 23

2.3. Построение модели бедности (множественная регрессия) 34

ЗАКЛЮЧЕНИЕ 38

ПРИЛОЖЕНИЯ. 41

 


 

 

Введение

 

С исторических времен и до наших дней, все явления и процессы, протекающие в хозяйственной деятельности любой страны, в той или иной степени связаны между собой. Изучение этой взаимосвязи имеет особо важное значение в связи с тем, что оно позволяет выявить закономерности развития и осуществить прогнозирование этих явлений и процессов.



В эконометрической практике каждый процесс можно рассматривать с двух сторон. Во-первых, он испытывает влияние других явлений и процессов и выступает как результат этого влияния. Во-вторых, каждое явление в свою очередь выступает как фактор, оказывающий влияние на другие явления и процессы. Поэтому признаки, которые испытывают влияние, называются результативными; признаки, которые оказывают влияние – факторные или объясняющими.

Результативные признаки обозначаются через Y, факторные через X. Поэтому в общем виде взаимосвязь между результатом и факторами можно записать формулой: fy =(x1 ,x2 …) следовательно, Y является функцией от всех X.

Если на результат оказывает влияние один фактор, то в этом случае изучается корреляция и регрессия, которые носят название парных; если на результат оказывает влияние несколько факторов, то изучается множественная корреляция и множественная регрессия.

Регрессионный анализ предполагает построение экономико-математических моделей, выражающих зависимости между случайными переменными. Проведение подобного анализа влечет за собой расчет показателей корреляции, поэтому, как правило, при изучении взаимосвязи социально-экономических явлений проводится корреляционно-регрессионный анализ.

В процессе развития статистики и эконометрики происходят постоянные изменения стратегий и методов, основанных на построении и спецификации моделей.

Представляется, что анализ тематики «исследование взаимосвязи социально-экономических явлений с помощью регрессионного анализа» достаточно актуален и представляет научный и практический интерес.



Цель исследования проекта – изучение взаимосвязи между долей населения с денежными доходами ниже величины прожиточного минимумаи дефицитом денежного дохода (в процентах от общего объема денежных доходов населения) в Российской Федерации.разработка проектных решений по информационно-методическому обеспечению… Достижение данной цели требует решение следующих задач: систематизация основ корреляционного и регрессионного анализа; разработка и апробация информационно-методического обеспечения тематического эконометрического исследования.

- измерение силы взаимосвязи между изучаемыми признаками;

- построение соответствующей модели взаимосвязи;

- проведение углубленного корреляционного анализа и проверка качества построенной модели.

В курсовом проекте, Объектом исследования послужила динамика уровня бедности в России за период 1992-2014 гг.– эконометрические модели.

Предмет исследования – статистические характеристики уровня бедности (доли населения с денежными доходами ниже величины прожиточного минимума) в России.показатели качества эконометрических моделей.


ГЛАВА 1: СУЩНОСТЬ ИССЛЕДОВАНИЯ ВЗАИМОСВЯЗЕЙ ПРИЗНАКОВ. ОСОБЕННОСТИ РЕГРЕССИОННОГО АНАЛИЗА1. Аналитическая часть

Основные понятия корреляционного и регрессионного анализа

 

Как отмечалось в предыдущем параграфе, Изучение взаимосвязи наблюдаемых процессов и явлений занимает важное место в эконометрике. При этом полнота построения модели, определяется количественными характеристиками причинно-следственных связей между ними, а также оценкой наиболее существенных из них.

Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи[1]. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Достаточно часто функциональная связь проявляется в физике, химии других технических науках. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.

Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной[1]. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.

Например, некоторое увеличение аргумента повлечет за собой лишь среднее увеличение или уменьшение (в зависимости от направленности) функции, тогда как конкретные значения у отдельных единиц наблюдения будут отличаться от среднего. Такие зависимости встречаются повсеместно. Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесенных удобрений. Очевидно, что последние участвуют в формировании урожая. Но для каждого конкретного поля, участка одно и, то, же количество внесенных удобрений вызовет разный прирост урожайности, так как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – увеличение массы внесенных удобрений ведет к росту урожайности.

По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными.

Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.

Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной[3].

Указанные выше классификационные признаки наиболее часто встречаются в статистическом анализе. Но кроме перечисленных различают также непосредственные, косвенные и ложные связи. Собственно, суть каждой из них очевидна из названия. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная формально и, как правило, подтвержденная только количественными оценками. Она не имеет под собой качественной основы или же бессмысленна.

По силе различаются слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей[1].

В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей, мнение которых более объективно объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др[3].

Поэтому в данном контексте можно говорить о корреляционном анализе в широком смысле – когда всесторонне характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в узком смысле – когда исследуется сила связи – и регрессионный анализ, в ходе которого оцениваются ее форма и воздействие одних факторов на другие.

Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.

Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.

Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей.

Традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов[8]. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования.

Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. На практике это положение чаще всего принимается априори. Собственно, эти методы – параметрические – и принято называть корреляционными.

Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является и простота вычислений.

Таким образом,

 

 

Функциональные и стохастическиеКлассификация связизависимостей между социально-экономическими показателями. Статистические методы моделирования связи

 

Между различными явлениями и их признаками необходимо прежде всего выделить 2 типа связей: функциональную (жестко детерминированную) и статистическую (стохастически детерминированную) [Ссылки].

В соответствии с жестко детерминистическим представлением о функционировании экономических систем необходимость и закономерность однозначно проявляются в каждом отдельном явлении, то есть любое действие вызывает строго определенный результат; случайными (непредвиденными заранее) воздействиями при этом пренебрегают. Поэтому при заданных начальных условиях состояние такой системы может быть определено с вероятностью, равной 1. Разновидностью такой закономерности является функциональная связь[12].

Задача регрессионного анализа состоит в пСвязь признака у с признаком х называется функциональной, если каждому возможному значению независимого признака х соответствует 1 или несколько строго определенных значений зависимого признака у. Определение функциональной связи может быть легко обобщено для случая многих признаков х1,х2 …хn . Метод включения и исключения переменных сХарактерной особенностью функциональных связей является то, что в каждом отдельном случае известен полный перечень факторов, определяющих значение зависимого (результативного) признака, а также точный механизм их влияния, выраженный определенным уравнением.

Функциональную связь можно представить уравнением[12]:

yi= f(xi),

где yi - результативный признак ( i = 1, … , n);

f(xi) - известная функция связи результативного и факторного признаков;

xi - факторный признак.

В реальной общественной жизни ввиду неполноты информации жестко детерминированной системы, может возникнуть неопределенность, из-за которой эта система по своей природе должна рассматриваться как вероятностная, при этом связь между признаками становится стохастической.

Стохастическая связь – это связь между величинами, при которой одна из них, случайная величина у, реагирует на изменение другой величины х или других величин х1,х2 …хn (случайных или неслучайных) изменением закона распределения. Это обуславливается тем, что зависимая переменная (результативный признак), кроме рассматриваемых независимых, подвержена влиянию ряда неучтенных или неконтролируемых (случайных) факторов, а также некоторых неизбежных ошибок измерения переменных. Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть предсказаны с достаточной точностью, а только указаны с определенной вероятностью[12].

Характерной особенностью стохастических связей является то, что они проявляются во всей совокупности, а не в каждой ее единице. Причём неизвестен ни полный перечень факторов, определяющих значение результативного признака, ни точный механизм их функционирования и взаимодействия с результативным признаком. Всегда имеет место влияние случайного. Появляющиеся различные значения зависимой переменной – реализация случайной величины.

Модель Однако при небольшой взаимосвязи между пеМодель стохастической связи может быть представлена в общем виде уравнением:

ŷi = f(xi) + ei ,

где ŷi - расчётное значение результативного признака;

f(xi) - часть результативного признака, сформировавшаяся под воздействием учтенных известных факторных признаков(одного или множества), находящихся в стохастической связи с признаком;

ei - часть результативного признака, возникшая вследствие действия неконтролируемых или неучтенных факторов, а также измерения признаков, неизбежно сопровождающегося некоторыми случайными ошибками. За, если Проявление стохастических связей подвержено действию закона больших чисел: лишь в достаточно большом числе единиц индивидуальные особенности сгладятся, случайности взаимопогасятся, и зависимость, если она имеет существенную силу, проявится достаточно отчётливо[12].

Корреляционная связь существует там, где взаимосвязанные явления характеризуются только случайными величинами. При такой связи среднее значение (математическое ожидание) случайной величины результативного признака у закономерно изменяется в зависимости от изменения другой величины х или других случайных величин х1,х2 …хn. Корреляционная связь проявляется не в каждом отдельном случае, а во всей совокупности в целом. Только при достаточно большом количестве случаев каждому значению случайного признака х будет соответствовать распределение средних значений случайного признака у. Наличие корреляционных связей присуще многим общественным явлениям. Задача регрессионного анализа

Корреляционная связь – понятие более узкое, чем стохастическая связь. Последняя может отражаться не только в изменении средней величины, но и в вариации одного признака в зависимости от другого, то есть любой другой характеристики вариации[12]. Таким образом, корреляционная связь является частным случаем стохастической связи.

Прямые и обратные связи. В зависимости от направления действия, функциональные и стохастические связи могут быть прямые и обратные. При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора, то есть с увеличением факторного признака увеличивается и результативный, и, наоборот, с уменьшением факторного признака уменьшается и результативный признак.

В противном случае между рассматриваемыми величинами существуют обратные связи. Например, чем выше квалификация рабочего (разряд), тем выше уровень производительности труда – прямая связь. А чем выше производительность труда, тем ниже себестоимость единицы продукции – обратная связь. строении модели, позволяющей по значениям

Прямолинейные и криволинейные связи. По аналитическому выражению (форме) связи могут быть прямолинейными и криволинейными. При прямолинейной связи с возрастанием значения факторного признака происходит непрерывное возрастание (или убывание) значений результативного признака. Математически такая связь представляется уравнением прямой, а графически – прямой линией. Отсюда ее более короткое название – линейная связь. При криволинейных связях с возрастанием значения факторного признака возрастание (или убывание) результативного признака происходит неравномерно, или же направление его изменения меняется на обратное[12]. Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т.д.).

Однофакторные и многофакторные связи. По количеству факторов, действующих на результативный признак, связи различаются: однофакторные (один фактор) и многофакторные (два и более факторов). Однофакторные (простые) связи обычно называются парными (т.к. рассматривается пара признаков). Например, корреляционная связь между прибылью и производительностью труда. В случае многофакторной (множественной) связи имеют в виду, что все факторы действуют комплексно, то есть одновременно и во взаимосвязи. Например, корреляционная связь между производительностью труда и уровнем организации труда, автоматизации производства, квалификации рабочих, производственным стажем, простоями и другими факторными признаками. С помощью множественной корреляции можно охватить весь комплекс факторных признаков и объективно отразить существующие множественные связи.

Для исследования стохастических связей широко используется метод сопоставления двух параллельных рядов, метод аналитических группировок, корреляционный анализ, регрессионный анализ и некоторые непараметрические методы[12].

 

 

Метод сопоставления двух параллельных рядов является одним из простейших методов. Для этого факторы, характеризующие результативный признак располагают в возрастающем или убывающем порядке (в зависимости от эволюции процесса и цели исследования), а затем прослеживают изменение величины результативного признака. Сопоставление и анализ расположенных таким образом рядов значений изучаемых величин позволяют установить наличие связи и ее направление. Зависимость между факторами и показателями может прослеживаться во времени (параллельные динамические ряды). Регрессионный

Метод аналитических группировок тоже относится к простейшим методам. Чтобы выявить зависимость с помощью этого метода, нужно произвести группировку единиц совокупности по факторному признаку и для каждой группы вычислить среднее или относительное значение результативного признака. Сопоставляя затем изменения результативного признака по мере изменения факторного можно выявить направление, характер и тесноту связи между ними. Задача является основным средством

В общем виде задача статистики в области изучения взаимосвязей состоит не только в количественной оценке их наличия, направления и силы связи, но и в определении формы (аналитического выражения) влияния факторных признаков на результативный. За это

, являются ли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественной корреляции. При сравнении качества регрессии, и необъясненной дисперсии. Корень

1.3. Статистическое Моделирование зависимостей
между социально-экономическими показателями связи методом корреляционно-го и регрессионного анализа

 

Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей (причинный характер которых должен быть выяснен с помощью теоретического анализа) и оценки факторов, оказывающих наибольшее влияние на результативный признак[14].

Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчётных значений зависимой переменной (функции регрессии). Решение всех названных задач приводит к необходимости комплексного использования этих методов. Рассмотрим

за .

Корреляционный и регрессионный анализ. Исследование связей в условиях массового наблюдения и действия случайных факторов осуществляется, как правило, с помощью экономико-статистических моделей. В широком смысле модель – это аналог, условный образ (изображение, описание, схема, чертёж и т.п.) какого-либо объекта, процесса или события, приближенно воссоздающий «оригинал»[14]. Модель представляет собой логическое или математическое описание компонентов и функций, отображающих существенные свойства моделируемого объекта или процесса, даёт возможность установить основные закономерности изменения оригинала. В модели оперируют показателями, исчисленными для качественно однородных массовых явлений (совокупностей). Выражение и модели в виде функциональных уравнений используют для расчёта средних значений моделируемого показателя по набору заданных величин и для выявления степени влияния на него отдельных факторов. Метод включения и

 

. По количеству включаемых факторов модели могут быть однофакторными и многофакторными (два и более факторов).

В зависимости от познавательной цели статистические модели подразделяются на структурные, динамические и модели связи.

 

Двухмерная линейная модель корреляционного и регрессионного анализа (однофакторный линейный корреляционный и регрессионный анализ)[18]. Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного анализа х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ. Овладение теорией и практикой построения и анализа двухмерной модели корреляционного и регрессионного анализа представляет собой исходную основу для изучения многофакторных стохастических связей. . Однако и

Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Сложность заключается в том, что из множества функций необходимо найти такую, которая лучше других выражает реально существующие связи между анализируемыми признаками. Выбор типов функции может опираться на теоретические знания об изучаемом явлении, опят предыдущих аналогичных исследований, или осуществляться эмпирически – перебором и оценкой функций разных типов и т.п.[18].

 

При изучении связи экономических показателей производства (деятельности) используют различного вида уравнения прямолинейной и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчётов преобразуют (путём логарифмирования или замены переменных) в линейную форму. Уравнение однофакторной (парной) линейной корреляционной связи имеет вид:

ŷ = a0 + a1x ,

где ŷ - теоретические значения результативного признака, полученные по уравнению регрессии;

a0 , a1 - коэффициенты (параметры) уравнения регрессии. Задача по знаПоскольку a0 является средним значением у в точке х=0, экономическая интерпретация часто затруднена или вообще невозможна. За это иногда за

К. Коэффициент парной линейной регрессии a1 имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Вышеприведенное уравнение показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, то есть вариацию у, приходящуюся на единицу вариации х. Знак a1 указывает направление этого изменения.

Параметры уравнения a0 , a1 находят методом наименьших квадратов (метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выравненных ŷ:

S(yi – ŷ)2 = S(yi – a0 – a1xi)2 ® min [18].

Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:

 
 

Решим эту систему в общем виде:

 
 

 
 

 
 

 
 

Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:

Определив значения a0 , a1 и подставив их в уравнение связи ŷ = a0 + a1x , находим значения ŷ, зависящие только от заданного значения х.

это иногда зависимую переменную

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.