Принципы построения статистических группировок
1. При построении группировки первоначально решается вопрос о выборе группировочного признака.
Группировочным признакомназывается признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки.
2. Определение числа групп, на которые надо разбить исследуемую совокупность.
Число групп зависит от задач исследования, численности совокупности, вида признака, а также от степени вариации признака.
При построении группировки по качественному признаку групп будет столько, сколько имеется градаций, видов, состояний у этого признака. Пример: при группировке населения по полу можно выделить только две группы: мужчины и женщины.
При группировке по количественному признакуво внимание принимается степень колеблемости группировочного признака: чем больше его колеблемость, тем больше следует образовать групп.
Кроме того, учитывается численность изучаемой совокупности. Зависимость между числом групп и численностью единиц совокупности выражается формулой Стерджесса:
,
где n – число групп;
N – число единиц совокупности.
3. После определения числа групп следует определить интервалы группировки.
Интервал – это значения варьирующего признака, лежащие в определенных границах.
Каждый интервал имеет верхнюю и нижнюю границы.
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем.
Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы в зависимости от их величины бывают:
а) равные интервалы устанавливаются, если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер (например, при группировке рабочих одной профессии по размеру заработной платы, посевов какой-то культуры – по урожайности).
Величина равного интервала определяется по следующей формуле:
,
где наибольшее и наименьшее значения признака, число групп.
Если в результате деления получится нецелое число и возникнет необходимость в округлении, то округлять нужно, как правило, в большую сторону.
б) неравные интервалы строятся, если группировочный признак имеет сильную вариацию.
По обозначению границ выделяют интервалы:
а) открытые – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у последнего;
б) закрытыми называются интервалы, у которых обозначены обе границы.
№
| Открытые интервалы
| Закрытые интервалы
|
| До 300
| 200 – 300
|
| 300 – 400
| 300 – 400
|
| 400 – 500
| 400 – 500
|
| 500 и более
| 500 – 600
|
При группировке по количественному признаку границы интервалов могут быть обозначены по – разному:
а) если в основании группировки лежит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Таким образом, верхняя граница i-го интервала равна нижней границе i+1-го интервала. Возникает вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. В таких случаях нижнюю границу можно формировать по принципу “включительно”, а верхнюю – по принципу “исключительно”
б) если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.
Следует также отметить, что группировки также могут быть:
1) первичными – производятся на основе анализа первичного статистического материала;
2) вторичными – образование новых групп на основе осуществленной группировки.
Получение новых групп на основе имеющихся возможно двумя способами перегруппировки:
§ Объединением первоначальных интервалов (путем их укрупнения);
§ Долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности). В результате ее проведения рассчитывают, какая часть единиц наблюдения перейдет из старой интервальной группы в новую.
4. После определения группировочного признака и границ групп строится ряд распределения.
Ряды распределения
Результатом первичной группировки собранных статистических данных, как правило, является построение ряда распределения.
Ряд распределения –это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку
В зависимости от признака, положенного в основание ряда распределения, различают атрибутивные и вариационные ряды распределения.
1. Атрибутивными называют рады распределения, построенные по качественным признакам.
2. Вариационными называют ряды распределения, построенные по количественному признаку.
Любой ряд состоит из двух элементов: значений вариант и частот.
Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т.е. конкретное значение варьирующего признака.
Частоты – это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.
Частостями называют частоты, выраженные в долях единицы или в процентах к итогу.
В зависимости от характера вариации признака различают вариационные ряды:
а) дискретные (признак принимает только целые значения);
б) интервальные (признак может принимать любые значения в определенных пределах).
Удобнее всего ряды распределения анализировать при помощи их графического изображения, позволяющего следить и о форме распределения.
Для атрибутивных рядов, как правило, строят секторные или прямоугольные диаграммы. Которые отражают структуру явления, если части диаграмм представляют собой удельные веса по каждому значению атрибутивного признака, и его масштабы, если размеры диаграмм пропорциональны масштабам явлений.
По данным таблицы 2 построим секторную диаграмму.
Распределение предприятий и организаций по формам собственности на 1 января 2003 г.,%
Полигон используется при изображении дискретных вариационных рядов. На оси абсцисс откладывают значения вариант, а на оси ординат – соответствующие им частоты или частости, полученные точки соединяют отрезками.
Для изображения интервального вариационного ряда применяется гистограмма, имеющая вид многоступенчатой фигуры. Состоящей из прямоугольников. По оси абсцисс откладывают значения границ интервальных групп, которые будут являться основаниями прямоугольников. Высота прямоугольников соответствует частоте или частости интервала, значения которого откладывают по оси ординат. Гистограмма может быть преобразована в полигон распределения.
При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Это необходимо сделать для устранения влияния величины интервала на распределение и получение возможности сравнивать частоты. Плотность распределения– это частота, рассчитанная на единицу ширины интервала, т.е. сколько единиц в каждой группе приходится на единицу величины интервала.
Для изображения вариационных рядов может также использоваться кумулятивная кривая. При помощи кумуляты(кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.
Пример:
Распределение предприятий общепита по размеру товарооборота
Объем товарооборота, млн.руб
| Число предприятий
| До 200
200-400
400-600
свыше 600
итого
|
|
Интервальный ряд может быть преобразован в дискретный. Для этого нижнюю и верхнюю границу интервала складывают и делят пополам.
В результате получают:
х
| f
| x’
| f
| Накопленная частота
| До 200
200-400
400-600
свыше 600
итого
|
|
итого
|
|
|
Рисунок – Полигон распределения товарооборота предприятий общественного питания.
Интервальный ряд распределения изображается гистограммой распределения.
Рисунок – гистограмма распределения.
Ряд распределения может также изображаться в виде кумуляты.
Рисунок – кумулята распределения.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|