Основы группировки данных
Программа разработки предусматривает реализуемые на втором этапе статистического исследования сводку и группировку статистических данных. Эти операции, осуществляемые на основе статистических таблиц, позволяют систематизировать полученные в ходе наблюдения данные, провести обработку и подсчет групповых итогов, расчеты простейших производных величин (статистических коэффициентов, средних величин). На этом же этапе, для повышения наглядности данных, предусматривается использование графических изображений. Иногда (в официальной статистике — почти всегда) на этом заканчивается весь процесс обработки собранных данных.
Группировка — основа статистической разработки (систематизации) первичного материала. Группировка, правильно спланированная на этапе подготовки исследования, позволяет облегчить регистрацию или повысить точность измерений на этапе сбора исходных данных без снижения результативности исследования в целом. Группировка собранной исходной информации определяет весь ход статистического анализа.
В ходе статистической разработки исследователю приходится сталкиваться со следующими вариантами группировок, каждый из которых имеет свои методические особенности:
• разделение анализируемой статистической совокупности на группы по тем или иным признакам. С такого рода группировкой приходится сталкиваться уже при подготовке программы сбора и в ходе реализации программы разработки любого исследования;
• объединение мелких однородных групп в более крупные. Этот вариант группировки применяется, как правило, уже в процессе статистической обработки данных, если выясняется несостоятельность мелких групп (малое число наблюдений, нечетко выраженный характер распределений и т.п.). Возможность такой группировки целесообразно предусмотреть уже на этапе подготовки программы сбора данных, т.е. обеспечить возможность укрупнения групп в соответствии с общепринятыми границами групп;
• комплексная группировка обеспечивает формирование комплексных оценок на основе многих учетных признаков, даже если они разнородны. Такая группировка часто делается на основе специально разрабатываемых алгоритмов или экспертных оценок (по аналогии — постановка диагноза на основе многих симптомов и результатов лабораторных обследований). Такая группировка представляет весьма сложную задачу и нередко сама по себе является самостоятельной целью исследования.
Выделяют следующие основные виды группировки в зависимости от конкретной цели статистического исследования (табл. 1).
Таблица 1
Классификация статистических группировок
Аналитические
| Структурные
| Типологические
| Специальные (балансовые, матричные и т.д.)
| Характеризуют взаимосвязи между признаками, проявляют основные тенденции
| Выявляют состав, структуру обследованных групп
| Характеризуют основные группы (типы групп признаков)
| Используются при составлении балансов предприятий и учреждений, отраслей промышленности и т.п.
|
Аналитическая группировка выявляет взаимосвязи между явлениями (признаками их характеризующими). При этом они подразделяются на факторные и результативные. Взаимосвязь проявляется в систематическом изменении результативного признака в связи с изменением факторного. Например: температура тела влияет на частоту пульса, в зависимости от величины роста изменяется вес и т.п.
Структурная группировка выявляет состав, строение однородной в качественном отношении статистической совокупности. Например: состав больных по полу, возрасту, диагнозу и т.п. Сопоставление данных структурной группировки во времени дает представление о структурных сдвигах.
Группировка типологическая — с ее помощью в статистической совокупности выделяются качественно однородные в существенном отношении группы. Например: группы больных с одинаковым диагнозом, с одинаковым исходом заболеваний и т.п.
При статистической разработке материала любого исследования необходимо учитывать существующие правила и стандарты определения группировочных признаков и границ групп (возрастно-половые группировки, группировки по категориям тяжести труда и т.п.). Несоблюдение правил формирования этих группировок ведет к потере ценности данных.
В национальной статистике выделяют следующие возрастно-половые группы (в границах точного возраста):
1) Дети до 3 лет. Эта группа находится под наблюдением детских консультаций и обслуживается детскими яслями. Из них часто выделяются дети в возрасте 1 и 2 года жизни;
2) Дошкольники — дети от 3 до 7 лет. Обслуживаются детскими садами;
3) Дети и подростки школьного возраста от 7 до 13 лет и 13—16 лет;
4) Подростки от 16 до 18 лет;
5) Трудоспособный контингент — мужчины 16—60 лет, женщины 16—55 лет;
6) Лица пенсионного возраста — мужчины 60 лет и старше, женщины 55 лет и старше;
7) Женщины репродуктивного возраста — обычно от 15 до 45 лет.
Иногда для группировки по возрасту используют одногодичные или (для взрослых) пятилетние, реже десятилетние интервалы. Группировка с пятилетним интервалом выглядит следующим образом: до 20 лет, 20—24, 25—29, 30—35 и т.д. С десятилетним интервалом: до 20 лет, 20—29, 30—39 и т.д. При изучении заболеваемости в связи с производственными факторами обычно используются аналогичные 5- и 10-летние интервалы группировок по стажу работы: 1—4 года, 5—9 лет, 10—14 лет и т.д. При этом, к группе 1—4 года относятся лица со стажем от 1 года до 4 лет 11 мес. 29 дней. Аналогично, к группе со стажем от 5 до 10 лет относятся лица, отработавшие от 5 лет до 9 лет 11 мес. и 29 дней.
В ряде случаев целесообразно расчленять отдельные крупные группы на более мелкие. Например: до 20 лет, 20—29, 30—39, 40—44, 45—49, 50—59, 60 и старше.
Группировка данных по своей сути представляет собой принцип классификации, т.е. установление принадлежности явлений и объектов к определенным классам. В государственной статистике для этого используются классификаторы — специальные справочники, инструкции и указатели в виде алфавитных и систематических словарей, дополняемых стандартным перечнем объектов и их групп. Использование классификаторов в официальной статистике является обязательным и имеет силу государственного стандарта. Основные классификаторы рассчитаны на длительное использование. Однако, с течением времени они пересматриваются, дополняются, в них вносятся необходимые коррективы. Так, с 1983 до 1999 года в СССР, а затем в России общепринятой считалась Международная статистическая классификация болезней, травм и причин смерти 9-го пересмотра. С 1999 года была введена классификация 10-го пересмотра (с 01.01.99 г. по Приказу Минздрава России № 3 от 12.01.98 г.).
В медико-биологических научных исследованиях использование государственных и международных классификаторов болезней и причин смерти не является строго обязательным. Однако, только их прямое применение или возможность путем вторичной группировки привести данные исследований в рамки, определяемые общепринятыми классификаторами, гарантирует сопоставимость статистических материалов о заболеваемости, причинах смерти разных категорий населения на различных территориях страны и зарубежом.
Вопросы по теме занятия.
1. Основные этапы научного исследования.
2. Цели, задачи и план исследования.
3.Способы получения исходных данных для исследования.
4. Понятия текущего и единовременного наблюдения.
5. Сплошное и не сплошное исследование. Методы.
6. Виды выборок.
7. Понятия повторной и бесповторной выборки.
8. Оценка численности выборки для доли в случае повторного отбора.
9. Оценка численности выборки для доли в случае бесповторного отбора.
10. Оценка численности выборки для среднего в случае повторного отбора.
11. Оценка численности выборки для среднего в случае бесповторного отбора.
12. Группировка собранной исходной информации.
Тестовые задания по теме.
1. Первый этап статистического исследования включает в себя
1) анализ результатов
2) вычисление первичных итогов
3) определение целей и задач, составление плана исследования
4) углубленную математико-статистическая обработку данных
Правильный ответ: в
2. По охвату статистической совокупности исследование может быть
1) сплошное или единичное
2) сплошное или не сплошное
3) не сплошное или выборочное
4) первичное или вторичное
Правильный ответ: б
3. Ко второму этапу статистического исследования относится
1) анализ полученных результатов, выводы
2) наблюдение, сводка и группировка полученных статистических материалов
3) определение целей и задач
4) углубленная математико-статистическая обработка данных
Правильный ответ: б
4. Признаки, подлежащие регистрации в ходе статистического исследования, называются
1) количественные
2) учетные
3) качественные
4) случайные
Правильный ответ: б
5. Учетные признаки по виду могут быть
1) качественные или количественные
2) первичные или факторные
3) результативные или вторичные
4) вероятные или достоверные
Правильный ответ: а
6. По роли в статистической совокупности учетные признаки можно подразделить на
1) достоверные и невозможные
2) первичные и вторичные
3) качественные и вероятные
4) факторные и результативные
Правильный ответ: г
7. Сбор данных при переписях населения относится к наблюдению
1) текущему
2) единовременному
3) случайному
4) математическому
Правильный ответ: б
8. Исследование, предполагающее регистрацию всех случаев, составляющих генеральную совокупность, называется
1) первичным
2) случайным
3) выборочным
4) сплошным
Правильный ответ: г
9. Совокупность, состоящая из относительно однородных элементов, объединенных наступлением определенного признака, называется
1) группой
2) когортой
3) классом
4) выборкой
Правильный ответ: б
10. Ошибки, связанные с неправильным выбором объекта исследования, использованием неправильных группировок, называются
1) методические
2) логические
3) математические
4) статистические
Правильный ответ: а
11. Ошибки, заключающиеся в необоснованном использовании различных статистических критериев и приводящие к искажению сущности результатов исследования, называются
1) логические
2) статистические
3) математические
4) методические
Правильный ответ: а
12. Четвертый этап статистического исследования включает в себя
1) анализ полученных результатов, выводы
2) определение целей и задач
3) вычисление первичных итогов
4) углубленная математико-статистическая обработка данных
Правильный ответ: а
13. Выбор объекта и единицы наблюдения, а также учетных признаков, подлежащих регистрации в ходе исследования, включает в себя
1) план исследования
2) схему исследования
3) шаблон исследования
4) программу исследования
Правильный ответ: г
14. Диагноз заболевания – это признак
1) статистический
2) случайный
3) количественный
4) качественный
Правильный ответ: г
15. Признак, изменяющий свое значение под влиянием другого, связанного с ним, называется
1) первичный
2) факторный
3) результативный
4) вторичный
Правильный ответ: в
16. Репрезентативность, определяемая числом наблюдений, гарантирующим получение статистически достоверных данных, называется
1) количественная
2) качественная
3) математическая
4) статистическая
Правильный ответ: а
17. Структурное соответствие выборочной и генеральной совокупностей – это репрезентативность
1) статистическая
2) количественная
3) качественная
4) математическая
Правильный ответ: в
18. Выборка, в которую каждый элемент генеральной совокупности имеет известную и равную вероятность отбора, называется
1) стратифицированной
2) простой случайной
3) систематической
4) кластерная
Правильный ответ: б
19. В случае, когда совокупность делится на подгруппы, а затем из каждой подгруппы случайным образом выбираются элементы, то такая выборка будет называться
1) систематическая
2) простая случайная
3) стратифицированная
4) кластерная
Правильный ответ: в
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2025 stydopedia.ru Все материалы защищены законодательством РФ.
|