Сделай Сам Свою Работу на 5

Л.Н. Маслова, М.Л. Суховский





СОВЕРШЕНСТВОВАНИЕ МЕТОДИКИ ОБРАБОТКИ АНКЕТНЫХ ДАННЫХ НА СЧЕТНО-ПЕРФОРАЦИОННЫХ МАШИНАХ*

Проведение конкретных социологических обследований большей частью основано на методе анкетирования. Массовость проводимых обследований, а также большой объем первичной информации об объекте обследования, содержащийся в анкете, настоятельно требуют совершенствовать методику машинной обработки анкет.

Как показывает опыт, материалы анкетных обследований можно успешно обрабатывать на 80-колонных счетно-перфорационных машинах (СПМ). Основные этапы обработки анкет на СПМ:

а) подготовка анкет к перфорации;

б) перенесение анкетной информации на перфокарты;

в) получение на основе перфокарт сводной информации, необходимой для анализа,

Все эти этапы обработки взаимосвязаны друг с другом, и наиболее правильное решение каждого из них сказывается на эффективности обработки анкет на СПМ в целом.

В данной статье освещены некоторые вопросы совершенствования методики обработки материалов анкетных обследований. При этом ставились задачи максимального сокращения затрат ручного труда при подготовке анкет к машинной обработке, получения на СПМ как можно более широкого круга показателей, используемых при анализе, выдачи результатов расчетов в удобной для анализа



 

 

табличной форме и в форме перфокарт, пригодной для дальнейшей обработки на электронных вычислительных машинах (ЭВМ).

Перенос зашифрованной информации с анкет на перфокарты осуществляется в порядке, определяемом макетом перфорации. В тех случаях, когда шифры всех реквизитов анкеты возможно разместить в одной 80-колонной перфокарте, порядок расположения реквизитов в макете перфорации соответствующих расположению в анкете*. Предварительная подготовка анкет к перфорации ограничивается в основном шифровкой анкетных данных, которые необходимо перенести на перфокарты.

Но в практике часто применяют анкеты с таким объемом информации, шифры которой не могут разместиться на одной 80-колон-иой перфокарте. В этом случае приходится пользоваться двумя и более макетами. Чтобы получить сводную информацию (табуляграммы), реквизиты в этих макетах размещаются не в порядке их расположения в анкете, а выборочно. Такое распределение реквизитов по макетам значительно увеличивает трудоемкость ручной подготовки анкет к машинной обработке, так как возникает необходимость определенным образом отмечать, к какому макету относятся те или иные реквизиты. Применять трафареты в этих случаях неудобно, так как анкеты занимают несколько листов. Поскольку оператору при перфорации приходится перфорировать цифры не подряд, а выборочно, производительность его труда падает, а количество ошибок увеличивается.



Однако, как показывает опыт, без ручной разметки данных анкет по макетам и выборочной перфорации вручную можно обойтись, заменив эту работу машинной. Порядок перфорации массивов перфокарт по нескольким макетам следующий. 1

Подготовка анкеты к передаче на машиносчетную станцию такая же, как и при перфорации по одному макету, т.е. шифры реквизитов проставляются в анкете в порядке расположения вопросов в ней. Все реквизиты анкеты в виде шифров переносятся на перфокарты по необходимому количеству макетов в порядке расположения этих шифров в анкете. Назовем перфокарты, пробитые таким образом, и макеты, по которым они пробиваются, первичными.

 

 

Для примера возьмем анкету, содержащую 100 вопросов. Предположим, что в соответствии с табуляторами, которые необходимо получить, все реквизиты анкеты распределены по трем макетам. Назовем эти макеты итоговыми. Причем каждый из макетов содержит вопросы, которые расположены в анкете не подряд, а в разных местах.

Прежде чем автоматически изготовить массивы итоговых перфокарт, пробиваемых по трем макетам, необходимо отперфорировать массивы первичных перфокарт. Предположим, что все шифры анкеты по сумме знаков могут разместиться в двух 80-колонных перфокартах. Макеты первичных перфокарт составим таким образом, чтобы с 1 по 50 вопросы анкеты разместились в одном макете, а с 51 по 100 вопросы - в другом макете (макеты №1 и 2 первичных перфокарт). В обоих макетах первичных перфокарт надо предусмотреть перфорацию в одних и тех же колонках номера анкеты и однозначного номера макета. Оператор с одной анкеты переносит на перфокарту данные сначала по макету № 1, а затек по макету № 2, после чего переходит к перфорации данных следующей анкеты. После перфорации первичные перфокарты контролируются, а затем поступают на табуляцию. Первичные перфокарты обоих макетов (№1 в 2) должны быть рассортированы по номеру анкеты и составлять единый массив. Табулятор настраивается на совместную работу с итоговым перфоратором в соответствии с одним из трех макетов итоговых перфокарт. Шифры, которые нужно отперфорировать, автоматически отбираются во время табуляции первичных перфокарт макетов № 1 и 2, заносятся в определенные разряды счетчиков табуляторов, а затем с головок счетчика автоматически переносятся на итоговые перфокарты в порядке их расположения в макете итоговых перфокарт. Контрольный аппарат табулятора настраивается на контроль по номеру анкеты. Управлять отборочными устройствами табулятора можно или от насечки, пробитой на перфокартах одного из макетов, или от цифровой пробивки, соответствующей номеру первичного макета. Таким образом, за один пропуск перфокарт через табулятор получаем массив перфокарт, отперфорированный по одному из итоговых макетов. Для перфорации итоговых перфокарт по другому макету необходимо соответствующим образом настроить табулятор и итоговый перфоратор и еще раз протабулировать тот же первичный



 

 

массив перфокарт. Готовая перфорация контролируется путем сопоставления контрольных сумм, полученных по массивам первичных и итоговых перфокарт.

Итак, по массиву первичных перфокарт автоматически можно отперфорировать перфокарты, содержащие ответы на любое сочетание вопросов анкеты в пределах 80 колонок.

Подобным же образом можно автоматически макетировать, если данные анкетного обследования будут предварительно нанесены графическими отметками на специальные перфокарты, предназначенные для автоматической перфорации на считывающем перфораторе. В этом случае шифры реквизитов анкеты заносятся карандашом на специальные перфокарты в порядке расположения их в анкете. Так как едкость одной перфокарты с графическими отметками составляет 27 колонок, одной анкете будут соответствовать несколько перфокарт с графическими отметками. Следует предусмотреть, чтобы номер анкеты и порядковый номер перфокарты с графическими отметками в пределах анкеты проставлялись в одних и тех же колонках. После графической отметки перфокарт со всех анкет производится автоматическая перфорация на считывающем перфораторе, т.е. подготовка первичного массива перфокарт. В дальнейшем автоматическое макетирование выполняется в порядке, описанном выше.

Устраняя трудоемкую, ручную операцию разбивки вопросов каждой анкеты по различным макетам и уменьшая трудоемкость при ручной перфорации, способ автоматического макетирования позволяет в короткие сроки изготовить перфокарты по любому макету для получения большого количества табуляграмм с различными сочетаниями вопросов анкеты.

Среди работ в процессе подготовки материалов обследования к машинной обработке, выполняемых вручную, шифровка анкет – одна из наиболее трудоемких.

Однако опыт свидетельствует, что ручную шифровку некоторых вопросов анкеты можно заменить машинной. Это относится к шифровке интервалов различных показателей (например, возраст, стаж работы и др.). В анкетах проставляются непосредственные значения признаков, например возраст и стаж работы - в годах, зарплата - в рублях, которые и переносятся на перфокарты. Кроме того, в макете перфорации предусматриваются свободные колонки

 

 

для автоматической перфорации шифров интервалов признаков. Порядок автоматической перфорации следующий.

После перенесения информации на перфокарты полученный массив перфокарт сортируется по колонкам одного из признаков, подлежащих шифровке по интервалам. Отсортированные перфокарты разделяются прокладками на несколько групп в соответствии с значениями признаков, попадающих в определенный интервал. Пробивку шифров интервалов можно выполнить на репродукторе или позиционном итоговом перфораторе, коммутируя поочередно шифр интервала на импульсаторе с той колонкой, которая отведена для шифра интервала данного признака, и пропуская через репродуктор или итоговый перфоратор группы перфокарт с соответствующими данному интервалу значениями признака. Подобная автоматическая перфорация осуществляется с большой скоростью (техническая скорость 100-120 карт в мин.) и легко контролируется ("на прокол" или "на просвет").

Применение автоматической шифровки интервалов различных показателей имеет некоторые преимущества. Прежде всего, частично устраняется ручная шифровка и сопутствующие ей ошибки. Наличие в перфокарте прямого значения признака повышает точность расчетов различных статистических величин, в то же время создается возможность автоматически получать всевозможные группировки с помощью пробитых в перфокартах шифров интервалов. Кроме того, отказ от вынесения крайних значений интервалов и их шифров в анкету сокращает ее объем.

Совершенствование методики следующего этапа обработки данных анкетного обследования на СПМ – получение сводной аналитической информации – имеет целью получение как можно более широкого круга материалов, необходимых для анализа, сокращение до минимума доработки табуляграмм на клавишных вычислительных машинах, выдачу сводной информации в удобной для анализа форме - в форме таблиц.

Комплект СПМ, состоящий из табулятора Т-5МВ, электронной вычислительной приставки и позиционного итогового перфоратора, позволяет автоматически вычислить довольно обширную сводную информации.

С его помощью, кроме распределения обследованных по составу (абсолютному и в процентах), по первичным материалам анкет-

 

 

ных обследований можно вычислять средние значения различных показателей определенных групп обследованных, величину дисперсии, квадрат коэффициента вариации и ошибку среднего арифметического. Менее эффективно (в силу большой сложности алгоритма вычислений), но тем не менее возможно получение парных коэффициентов корреляции.

Данные обработки, характеризующие структуру обследованных, печатаются в табуляграмме как в абсолютном выражении, так и в процентах одной, двух, трех и более степеней итогов в соответствии с размерностью комбинационных таблиц, используемых при анализе. Для получения рядов распределения в абсолютном выражении отобранный массив перфокарт сортируют по колонкам группировочных признаков, а затем табулируют с автоконтролером по этим признакам. Подсчет количества карт в разрезе группировочных признаков соответствует численности обследованных по определенным группам.

Процентный состав обследованных вычисляется по одному из двух вариантов расчетов в зависимости от сложности таблицы и количества групп в старших группировочных признаках.

По первому варианту целесообразно вычислять несложные таблицы (с одной или двумя степенями итогов). Для вычисления таблицы с одной степенью итогов (например, распределение всех обследованных по возрастным группам) табулятор агрегатируют с электронной вычислительной приставкой, настроенной на выполнение деления, контрольный аппарат табулятора настраивают на контроль по группировочному признаку (возрастной группе). На промежуточных ходах табулятора выполняется деление ,

где mi - счет карт по группировочному признаку (возрастной группе);

n – то же, по всему массиву (устанавливается на импульсатор промежуточных ходов, поэтому эту величину необходимо определить заранее);

pi – удельный вес данной группы в общей численности.

Сумма частных по массиву при правильной настройке и работе машин должна быть равна или близка в 100%.

При расчете процентного состава обследованных по двухстепенной таблице (например, распределение обследованных по полу, а в пределах пола - по возрасту) по предыдущему варианту расче

 

тов предварительно определяют счет карт по каждому шифру старшего признака (например, по полу), а затем вычисляют процентный состав точно так же, как и для таблицы с одной степенью итогов, с той лишь разницей, что на импульсаторе необходимо установить цифру счета карт по каждому шифру старшего группировочного признака перед пропуском соответствующей группы карт.

Для получения более сложных группировочных таблиц с одновременным вычислением процентного состава обследованных целесообразно пользоваться следующим вариантом вычислений. Табулятор агрегатируют с итоговым перфоратором, контрольный аппарат табулятора настраивают на контроль по всем группировочным признакам в соответствии с заданной таблицей, а счетчики табулятора на "счет карт" для получения всех необходимых степеней итогов. Одновременно необходимо предусмотреть передачу в счетчик значений группировочных признаков (для итоговой перфорации) с первой карты каждой группа, его гашение и накопление счетчиками табулятора контрольных сумм тех же группировочных признаков для счетного контроля итоговой перфорации.

При смене частных групп на итоговую перфокарту переносятся шифры группировочных признаков и счет карт по частной группе.

При смене промежуточных групп в соответствующих итоговых перфокартах дополнительно пробивается счет карт по промежуточным группам, при смене общих групп - счет карт по общим группам и т.д. Выверенные итоговые перфокарты табулируются. Табулятор работает совместно с ЭВП. Необходимо, чтобы итоговые перфокарты сохраняли порядок итоговой перфорации и закладывались в табулятор цифровой сеткой к оператору, срезанным углом влево. При таком расположении перфокарт общие итоги будут поступать в счетчики табулятора первыми. При коммутации необходимо пользоваться обратной нумерацией колонок нижних и верхних щеток. Табулятор настраивают на контроль по всем необходимым группировочным признакам. За один пропуск перфокарт через табулятор путем последовательного деления на ЭВП "счета карт" более младших признаков на "счет карт" по более старшим группировочным признакам можно получить процентный состав обследованных двух, трех, четырех и более степеней итога. В одной табуляграмме в зависимости от необходимости можно печатать или только процентный состав по всем группировочным признакам, или одновременно с про-

 

 

центным составом численность в абсолютном выражении по этим же группам. На СПМ легко можно получать средние значения различных признаков по определенным группам обследованных (например, средний возраст, средняя зарплата, средний стаж работы мужчин и женщин с различным семейным положением). Для вычисления средних величин табулятор агрегатируется с ЭВП, счетчики табулятора суммируют значения признаков (возраст, зарплата, стаж работы и т.д.) и счет карт в разрезе группировочных признаков в автоконтроле осуществляется только по частным группам. При смене частной группы накопленные в счетчиках суммы значений признаков последовательно передаются в ЭВП в качестве делимого. Делителем является "счет карт" (численность по данной группе). Настроив агрегат на выполнение совмещенных делений, за один пропуск перфокарт можно получить от одного до семи средних значений признаков на одного человека (частных от делений).

Помимо средних величин на СПМ можно выполнить расчет дисперсии, квадрата ошибки среднеарифметического, квадрата коэффициента вариации и квадратов парных коэффициентов корреляции. Поскольку вычисления среднеквадратического отклонения, ошибки среднего арифметического, коэффициента вариации, парных коэффициентов корреляции предполагают извлечение корня, что невозможно выполнить на СПМ за один пропуск перфокарт на табуляторе, составленная нами программа рассчитана на нахождение квадратов этих статистических величин.

По определению дисперсии

, (1)

где i =1,2,..., n;

xi – значения величины x, соответствующее i -тому наблюдению;

n – количество наблюдений (счет карт в группе).

Непосредственно по формуле (1) вычисления на СПМ производить неудобно. Поэтому для расчета дисперсии была использована другая расчетная формула, а именно

(2)

 

 

По этому алгоритму расчет дисперсии по одному признаку можно выполнить за один пропуск исходного массива перфокарт через табулятор.

Табулятор настраивают на автоконтроль группировочного признака по частным группам и агрегатируют с ЭВП. Исходный массив перфокарт сортируют по колонкам группировочного признака.

На карточных ходах табулятора счетчики накапливают , счет карт, а в сумматоре ЭВП происходит накопление . При смене группировочного признака на промежуточных ходах из сумматора ЭВП передается в счетчик табулятора, затем вычисляются величины , , n2 и вывод табулятора. Одновременно с вычислением n2 выполняется вычитание [ ], а затем деление полученной разности на n2 и выдача величины дисперсии на печать. На печать в целях облегчения контроля вычислений можно выводить также и промежуточные результаты вычисления дисперсии.

Схема вычисления дисперсии составлена для трехразрядных значений xi и n. Для значений xi большей разрядности величина дисперсии может быть рассчитана с меньшей степенью точности, так как при расчете будут отброшены один или несколько младших разрядов значений xi.

По определению ошибки среднего арифметического

или

Таким образом, расчет можно производить по схеме, аналогичной вычислению дисперсии, с той лишь разницей, что в данном случае не надо находить n2 и в качестве делителя вместо n2 используется .

Следующая формула коэффициента детерминации удобна для вычисления на СПМ

 

 

Ввиду относительно большой сложности алгоритма, значения за один прогон исходного массива перфокарт на табуляторе получить невозможно. Поэтому для вычисления квадрата коэффициента корреляции на первом этапе получаем два массива итоговых перфокарт, содержащих промежуточные результаты вычислений, а именно: , , ; , .

Итоговые перфокарты двух массивов объединяются путем сортировки по общему группировочному признаку, а затем табулируются при одновременной работе ЭВП. На основании массива итоговых перфокарт вычисляем величину .

На основании этого же массива итоговых перфокарт можно вычислить и дисперсию квадрат ошибки среднего арифметического, квадрат коэффициента вариации или

Обычно сводная информация, получаемая в результате обработки данных на СПМ, выдается в виде табуляграммы. Но из-за того что большая часть табуляграмм имеет вертикальное расположение итогов (в соответствии с вертикальным расположением шифров сказуемого в табуляграмме), а эта форма выдачи неудобна для анализа, приходится вручную переносить итоги из табуляграмм в таблицы. Опыт работы некоторых машиносчетных станций свидетельствует также о возможности получения части сводной информации непосредственно в форме табуляграмм-таблиц. На стандартном оборудовании это эффективно лишь в том случае, если младший группировочный признак имеет максимум 10 позиций. Процесс получения таких табуляграмм даже менее трудоемок, чем табуляграмм с вертикальным расположением итогов (за счет устранения сортировки по младшему группировочному признаку и меньшему количеству промежуточных ходов при табулировании).

При большем же числе позиций младшего группировочного признака приходится делить массив перфокарт на несколько массивов по определенным шифрам этого признака (число возможных позиций его

 

 

в каждом массиве не должно превышать десяти) и пропускать каждый массив на табуляторе отдельно. Затем табуляграммы разных массивов подклеиваются по горизонтали одна к другой в порядке возрастания шифров.

Модернизация табулятора Т-5М путем установления на нем дополнительного импульсатора, питающегося от плюсовой длины, обеспечивает получение табуляграмм – таблиц непосредственно по всему массиву перфокарт даже в том случае, если количество позиций в младшем группировочном признаке меньше.

Совершенствование методики обработки анкет с помощью счетно-перфорационных машин, отдельные вопросы которого рассмотрены выше, позволяет значительно уменьшить применение ручного труда, повысить качество получаемой сводной информации.

 

 

 

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.