В СОЦИОЛОГИЧЕСКОМ ИССЛЕДОВАНИИ
В марксистской социологии имеются давние традиции по применению, методов статистического наблюдения. В настоящее время без них практически немыслимо проведение эмпирических социологических исследований.
В целом эти методы могут быть разделены на сплошные и несплошные. Сплошное статистическое наблюдение требует полного охвата объекта исследования, всех его элементов без исключения.
Сплошное исследование некоторых социальных объектов по многим причинам может оказаться или очень трудоемким, или требующим больших денежных затрат, или просто невозможным. В этих случаях используются методы несплошного наблюдения, которыо очень хорошо себя зарекомендовали в различных областях науки и техники.
Строгому научно обоснованному выбору части социальных объектов как методу исследования всей совокупности большое значение придавал В. И. Ленин. Он предлагал провести выборку «для изучения небольшого числа типичных предприятий (фабрик, совхозов) и учреждений (а) наилучших, образцовых; ({5) средних и (^) наихудших»1.
Наиболее часто в социологии используются три метода несплошного наблюдения: 1. Монографический, 2. Метод основного массива, 3. Выборочный.
Монографический метод, строго говоря, выходит за рамки чисто статистического наблюдения, ибо наряду с фиксацией статистических данных предполагает детальное качественное описание массовых явлений. Выбираемая для монографического исследования часть объекта очень часто является типичной, в бпределеипом смысле, для всего объекта или для важнейших его элементов.
1 Ленин В. И. Поли. собр. соч., т. 53, с. 152. 200
Именно эта особенность, дающая возможность глубокого проникновения в сущность изучаемых массовых явлений, представляет важнейшее достоинство монографического метода, который, как правило, применяется в социологии в комбинации со сплошным или различными видами несплошного исследования.
Известно, например, какую роль В. И. Ленин отводил мопографи-ческому методу наблюдения за состоянием сельского хозяйства в пашей стране в целях его скорейшего подъема. В. И. Ленин выделял три группы крестьянских хозяйств по уровню их развития: «... поставленные заведомо хорошо, сносно и неудовлетворительно. Одпо типичное хозяйство каждой из этих последних трех групп должно быть не менее двух раз в год описываемо подробно с точным указанием всех дапных об описываемом хозяйстве...»2.
Значение монографического метода не ограничивается применением лишь к типичным объектам социологического исследования. Он оказывается весьма полезиым при изучении объектов в социальном эксперименте, когда зарождается передовой опыт, намечаются ростки прогрессивных явлений.
Методом основного массива, как правило, изучается большая часть объекта социологического исследования или его важнейшие элементы. Этот метод находит применение, например, в некоторых социологических исследованиях, проводимых с помощью контент-анализа.
Разновидностью метода осповного массива являются экспертные опросы, так как при организации таких опросов стараются привлечь большую часть наиболее компетентных экспертов.
Наиболее широкое распространение в социологических исследованиях получил выборочный метод. В этой главе подробно рассматривается суть этого метода и основные процедуры его применения в социологии.
Основные понятия выборочного метода
Генеральная и выборочная совокупности. Множество социальных объектов, которые являются предметом изучения в пределах, очерченных программой социологического исследования и террнторналь-по-временными границами, образует генеральную совокупность.
Любую генеральную совокупность характеризует некоторый явно задаваемый признак (или набор признаков), по значению которого всегда можно однозначно определить, относится данный объект к генеральной совокупности или пет. Так, в качестве генеральной совокупности мы можем рассматривать жителей данного города, про-мышленно-производствешшй персонал предприятия, студентов всей страны и т. п. Часть объектов генеральной совокупности, выступающих в качестве объектов наблюдения, называется выборочной совокупностью. Иными словами, если генеральная совокупность вклю-
а Там.же, т. 43, с. 282-283.
чает вес без исключения единицы, составляющие объект исследования, то выборочная совокупность представляет собой специальным образом отобранную часть генеральной совокупности. При этом статистическое наблюдение осуществляется именно за элементами выборочной совокупности.
Внимательный читатель может заметить, что метод основного массива и метод монографического исследования также предполагают статистическое наблюдение некоторой части исследуемой сово-куппости. В чем же характерный признак выборки? Выборочная совокупность обычно конструируется таким образом, чтобы при минимуме исследуемых объектов удавалось с необходимой степенью гарантии представить всю генеральную совокупность.
Единица отбора и единица наблюдения.Единицей отбора называют элементы генеральной совокупности, которые выступают единицами счета в различных процедурах отбора, формирующих выборку.
Единицами наблюдения называют элементы сформированной выборочной совокупности, которые непосредственно подвергаются статистическому наблюдению. Единица отбора и единица наблюдения представляют собой социальные объекты, обладающие характеристиками, существенными для предмета конкретного социологического исследования. Они могут совпадать (в простых схемах отбора) и различаться (при сложных комбинированных схемах отбора).
Систематические и случайные ошибки статистического наблюдения. Приполучении социальной информации выборочным методом могут возникать ошибки различного рода. Причинами могут быть неточность данных, сообщенных социологу респондентом, неправильная фиксация получаемых сведений пли неправильное измерение переменных, характеризующих единицы наблюдения, и т. д. Эти ошибки, называемые иногда ошибками регистрации, могут быть разделены на два типа: случайные и систематические.
Систематической ошибкой регистрации называется ошибка, выражающая некоторые существенные .связи, возникающие в процессе регистрации между объектом, субъектом и условиями проведения наблюдения. Систематическая ошибка может быть значительной по своей величине из-за одностороннего искажения (в сторону увеличения .или уменьшения) исследуемой характеристики. Происходящее вследствие этого накопление ошибки по исследуемой совокупности в целом может зачеркнуть результаты всего исследования. Систематическая ошибка регистрации может возникнуть при любом типе статистического наблюдения, в том числе и при проведении выборочного или сплошного обследования.
Характерным примером систематической ошибки являются данные о женатых мужчинах и замужних женщинах во Всесоюзной переписи 1970 г. По результатам переписи в целом по Союзу оказалось 53,0 млн. женатых мужчин и 54,2 млн. замужних женщин. Систематическая ошибка, зафиксированная в этой переписи, образовалась из-за погрешностей в ответах, возникающих от различной оценки своего семейного положения мужчинами и женщинами.
Случайные ошибки регистрации отражают менее существенные связи между объектом, субъектом и условиями регистрации и складываются из различных статистических погрешностей в процессе наблюдения. Погрешности, имея различную направленность в отдельных единицах наблюдения, проявляют тенденцию к взаимному погашению при обобщении результатов регистрации по всей исследуемой совокупности.
Таким образом, в отличие от систематической случайная ошибка вызывается при наблюдении причинами, носящими вероятностный характер.
Типичные ошибки выборочного социологического исследования. Ошибки регистрации встречаются при любом типе статистического наблюдения и, следовательно, свойственны н выборочному методу исследования.
Кроме того, в выборочном исследовании могут появиться ошибки, возникающие при различных отклонениях от планируемой выборки. Можно выделить два наиболее типичных вида отклонения от плана выборки.
1. Замена намеченных при планировании, выборки единиц па-блюдения другими, более доступными, которые, однако, оказываются неполноценными с точки зрения выработанного плава выборки. Такого рода ошибки могут возникать при использовании недостаточно квалифицированных интервьюеров. Например, опрос планируется провести в каждой десятой квартире жилого массива. Никого не застав в выбранных квартирах, интервьюер иногда обращается в соседние квартиры и берет интервью. В итоге в выборке оказывается значительная доля пенсионеров, больших по размеру семей и слабо представлены одинокие лица и малочисленные семьи. Ошибок этого типа (ошибок подстановки) можпо избежать, контролируя деятельность анкетеров и интервьюеров и качество собранной ими информации. В противном случае они могут привести к серьезным систематическим ошибкам.
2. Неполный охват выборочной совокупности, т. е. неполучепие информации от части единиц наблюдения, включенных в выборку (например, недополучение почтовых анкет, не полностью заполненные анкеты).
Эти ошибки устанавливаются путем сравнения реально сформированной выборки с ее планом. Ошибки подобного рода «снимаются» так называемой процедурой «корректировки» выборки, т. е. путем специального пересчета значений изучаемого признака с учетом того, какая именно часть выборочной совокупности выпала из обследования.
Распространенными ошибками в выборочном социологическом исследовании являются ошибки, возникающие при неправильной разработке плана выборки. Только правильно намеченный и, конечно, реализованный план формирования выборочной совокупности может дать определенные гарантии для распространения выводов, полученных по выборке, на всю генеральную совокупность. Во многих книгах в качестве примера смещения, возникающего
из-за неправильного планирования выборки, приводится известный опрос, проведенный «Лптэрари Дайджест» («Литературное обозрение») относительно исхода президентских выборов 1936 г. в США.
Кандидатами на этих выборах были Ф. Д. Рузвельт и А. М. Лап-дон. Редакция журнала организовала план выборки следующим образом. В выборку попали более двух миллионов американцев, выбранных при помощи случайного отбора из списков, имеющихся в телефонных книгах. По всей стране попавшим в выборку лицам были разосланы открытки с просьбой назвать фамилию .будущего президента. Затратив огромную сумму на рассылку, сбор и обработку полученных открыток, журнал информировал общественность, что на предстоящих выборах президентом США с большим перевесом будет избран А. М. Ландон. Результаты выборов опровергли этот прогноз.
В то же время социологи Д. Гэллап н Э. Роупер правильно предсказали победу Ф. Д. Рузвельта, основываясь только па четырех тысячах анкет.
Ошибочный прогноз относительно возможного президента объ-яспяется неправильным планом выборки, который не обеспечил полного отражения в ней всей генеральной совокупности: в телефонных книгах, которые использовались для организации выборки, были представлены лишь наиболее обеспеченные слои американского населения, в частности домовладельцы. Поскольку обеспеченные слои американцев составляют меньшую часть генеральной совокупности, го распространение мнения этой части населения на всю страну в целом оказалось ошибочным.
Ошибки часто возникают и в тех случаях, когда в выборочную совокупность преимущественно попадают представители одинаковых социальных групп. Так, почтовые анкеты чаще заполняют лн-ца с более высоким уровнем образования, причем мужчины чаще, чем женщины, пенсионеры чаще, чем работающие и т. д.
Социолог самое пристальное внимание должен уделять анализу возможностей возникновения ошибок смещения в выборочных социологических исследованиях.
Репрезентативность выборки. Выборка в определенном смысле должна быть моделью генеральной совокупности, что и позволяет на ее основе оценивать характеристики этой совокупности. Однако нет необходимости моделировать в выборке все аспекты генеральной совокупности, достаточно лишь значимых с точки зрения задач исследования. Свойство выборки отражать, моделировать эти характеристики будем называть репрезентативностью.
Основной принцип построения выборки (точнее, вероятностного отбора) состоит в том, чтобы обеспечить всем элементам генеральной совокупноси равные шансы попасть в выборку. Однако даже самое аккуратное соблюдение этого принципа не гарантирует выборку от искажений. Эти искажения — случайные ошибки — внутренне присущи выборочному методу. Они появляются в результате того, что обследуются не все единицы совокупности, а только выборка, и, следовательно, результат будет неточен, так как единицы совокуп-
лости не тождественны между собой. Значение случайной ошибки можно сравнительно легко вычислить, используя аппарат, разрабо-ташшй в статистической теории выборочного метода. Таким образом, репрезентативность выборки будет определяться двумя компонентами: ошибками регистрации и случайными ошибками.
В идеальной ситуации в сплошном исследовании отсутствуют ошибки репрезентативности, благодаря чему при правильной организации наблюдения ошибка выборочного исследования больше ошибки наблюдения при сплошном обследовании. Однако в социологии применение сплошного обследования требует значительного числа анкетеров и интервьюеров, а это ведет к тому, что иногда привлекаются недостаточно квалифицированные кадры, участие которых в исследовании увеличивает ошибку регистрации. И наоборот, применение выборочного исследования при решении тех же вопросов позволяет использовать более подготовленные кадры специалистов, обеспечить лучший их инструктаж, контроль за его выполнением. Это ведет к уменьшению ошибки регистрации. И еслги случайная ошибка не велика, то ошибка выборочного наблюдения в целом может оказаться меньше ошибки сплошного исследования. Таким образом, при определенных условиях выборочный метод оказывается более точным, чем сплошной, что еще раз подчеркивает его преимущество при организации и проведении эмпирических социологических исследований.
Простой случайный отбор
Основа выборки. Для организации простых схем отбора (простой случайной, систематической или серийной выборок) необходима информация обо всех элементах генеральной совокупности или хотя бы их перечень.
Основой выборки называют перечень элементов генеральной совокупности, если он удовлетворяет требованиям полноты, точности, адекватности, удобства работы с ним, отсутствия дублирования единиц наблюдения. Основой могут служить алфавитные списки сотрудников учреждения, номера пропусков, по которым можно идентифицировать определенные единицы, и т. п.
Полнота. Под полнотой подразумевается представленность всех ■единиц данной генеральной совокупности в основе выборки. Если некоторые единицы, которые по предположению должны быть в списке, не зарегистрированы' в нем, то список является неполным.
Неполнота основы выборки приводит к серьезным ошибкам в том случае если ие включенные в выборочную совокупность единицы наблюдения имеют существенные особенности и их достаточно много.
Отсутствие дублирования. Если некоторые единицы наблюдения генеральной совокупности будут включены в основу выборки более Чем один раз, то они могут повторяться и в выборке (например, в том случае, когда человек переезжает из одного района в другой и ■Включается в новый список раньше, чем исключается из старого).
Точность. Информация о каждой единице отбора должна быть точной. Основа выборки не должна содержать несуществующих единиц. Подобные неточности встречаются в избирательных списках, когда отсутствуют вновь прибывшие в данный населенный пункт, или остаются лица, изменившие свое местожительство, умершие, жильцы снесенных домов и т. п.
Адекватность. Оспова выборки, адекватная для решения одних, задач, может быть неадекватной для других. Например, полный список работников промышленного предприятия может быть хорошей основой для формирования выборочной совокупности при исследовании проблем удовлетворенности трудом работников данного предприятия, уровня их социальной активности и т. д. Но если изучается удовлетворенность трудом или социальная активность п т. flue всех работников предприятия, а только молодежи, то этот полный список может послужить лишь для формирования новой основы выборки — списка молодежи.
Если основа охватывает не все социальные объекты генеральной совокупности, то она может использоваться как основа выборки для той части генеральной совокупности, которая представлена полностью, а выбор единиц наблюдения из остальной части следует организовать по другим источникам.
Удобство. Удобство работы с основой выборки — существенное-условие повышения качества результатов. Удобно, когда единицы,, составляющие основу выборки, пропумерованы, когда имеющиеся сведения о них дают возможность с полной определенностью опознавать эти единицы. Если основа выборки находится в одном централизованном месте и ее структура соответствует реальной структуре изучаемых социальных объектов, это не только облегчает работу социолога, но и является необходимым требованием к исследованию, значительно повышающим его качество.
Одной из причин возникновения сложных схем выборки (многоступенчатых, комбинированных и т. п.) является невозможность, обеспечить основу выборки для очень больших генеральных совокупностей, обладающих сложной структурой.
К настоящему времени сложились представления об основе, которая могла бы удовлетворить требованиям организации современных социологических исследований, быть действенной для различного типа исследований.' Такой основой является социальная карта. Социальная карта. Подобно тому как географическая карта является ориентиром в пространственном движении, социальная карта должна стать ориентиром в исследовании социальных объектов. Социальная карта представляет собой пространственное распределение всевозможных социальных показателей для определенных экономико-географических регионов. Такая карта может служить основой всех выборочных исследований в каждом регионе, области, районе, городе и т. п.
Процесс составления, социальной карты складывается из следующих этапов.
1. Сбор информации о размещении и движении населения, о&
осповных постоянных и сезонных потоках паселепия, которые выражаются в демографических показателях.
2. Сбор социально-экономической информации относительно про фессионального состава населения: данные о квалификации, зара ботной плате, соотношения между работающими и неработающими, распределение уровня семейных доходов и т. д.
3. Сбор социологической информации: условия труда и быта; дан ные о проведении досуга, о его структуре по различным социальным
группам; данные о различных формах социальной активности, образовательном уровне, средствах массовой коммуникации, об активности партийных и общественных организаций и т. д.
Возрастающий интерес социологов к построению социальных карт связан в значительной степени с прикладными задачами выборочного обследования. Для более углубленной разработки социальных проблем необходима и более основательная исходная социальная информация: карта размещения социальных групп, распространенности средств массовых коммуникаций и т. д., т. е. социальная карта.
Процедура простого случайного отбора. По сформированной основе выборки легко реализовать процедуру простого случайного отбора. Для этого требуется соблюдение равенства шансов попадания единиц отбора в выборочную совокупность. Выделяют: а) простой •случайный бесповторный отбор и б) простой случайный повторный отбор.
Осуществляться каждая из разновидностей процедуры может различными способами. Опишем один из них. Пусть основа выборки содержит N единиц. Тогда, чтобы выбрать п единиц наблюдения в выборочную совокупность, напишем все номера от 1 до N на отдельные карточки, тщательно их перемешаем и наугад вынем одну из них. Номер вытащенной карточки задает соответствующую единицу наблюдения, попавшую в выборочную совокупность. Затем карточка возвращается на место, они снова перемешиваются, наугад вынимается новая карточка, и так далее продолжается п раз. Так реализуется процедура простого случайного повторного отбора.
Если извлеченную карточку не возвращать назад, а откладывать в сторону, то тот же процесс приведет нас к простой случайно бес-' повторной выборке размером в п единиц наблюдения или, как еще говорят, объемом в п единиц.
Описанная процедура простого случайного отбора становится чрезвычайно трудоемкой, если число N, задающее объем основы выборки, велико. Главная трудность состоит в том, что обеспечение равной вероятности попадания единицы наблюдения в выборочную совокупность требует очень тщательного перемешивания.
Чтобы устранить трудности, возникающие при исследовании больших генеральных совокупностей (а именно таких большинство в социологии), для реализации простого случайного отбора пользуются так называемыми таблицами случайных чисел. Они содержат те или иные случайные цифры, полученные путем реализации некоторого физического случайного процесса, В литературе приводятся различ-
иые последовательности случайных чисел объемом от нескольких десятков до миллиона цифр (табл. 14).
Продемонстрируем, как работать с таблицей случайных чисел, на гипотетическом примере, когда из совокупности заранее пронумерованных 300 единиц необходимо выбрать 7 единиц наблюдения. Поскольку N = 300 — трехзначное число, а в табл. 14 даны пятизначные числа, будем использовать только три последних цифры каждого числа.
Таблица 14, Таблица случайных чисел *
Строка
| (i)
| (2)
| (3)
| (4)
|
| 1 2 3 4 5
| 10 097 37 542 08 422 99 013 12 807
| 32 533 04 805 68 953 02 529 99 970
| 76 520 64 894 19 645 09 376 80157
| 13 586 74 296 09 303 70 715 30 147
| 34 673 24 805 23 209 38 311 64 032
| Строка (1) (2) (3) W (Г>)
1 10 097 32 533 76 520 13 586 34 673
2 37 542 04 805 64 894 74 296 24 805
3 08 422 68 953 19 645 09 303 23 209
4 99 013 02 529 09 376 70 715 38 311
5 12 807 99 970 80157 30 147 64 032
* В таблице дан фрагмент 1500 случайных чисел, приведенных в книге: Статистические методы анализа информации в социологических исследованиях. М., 1972, с. 305—308.
Начиная с первого числа, двигаясь по строке, получим первый номер 97. Числа более 300 пропускаем и, продолжая этот процесс далее, получим ряд чисел:
296, 209, 13, 157, 147, 32.
Это и есть номера единиц наблюдения, попавших в формируемую выборку.
При организации бесповторного отбора приходится пропускать и числа (если они попадаются), которые встречаются второй раз в этом ряду.
Начинать процесс выбора случайных чисел можно с любого места таблицы и вести его в любом направлении (по строкам, столбцам и т. п.) или выбирая только определенные столбцы. Если имеющиеся под рукой таблицы достаточно длинны, то при решении очередной задачи выбора рекомендуется начинать с нового места таблицы.
Расчет характеристик простой случайной выборки. Цель любого выборочного исследования состоит в том, чтобы, сформировав выборку, собрать по ней информацию и на основе этой информации оценить искомые характеристики генеральной совокупности.
Наиболее распространенной в социологических исследованиях задачей является оценка среднего значения признака (или доли в случае качественного признака) в генеральной совокупности.
Проиллюстрируем на примере нахождение выборочной оценки среднего генеральной совокупности. Предположим, что оценивается среднее число газет и общественно-политических журналов, выписываемых сотрудниками некоторого производственного коллектива. Рассмотрим по порядку все необходимые операции и их результаты.
Составляется основа выборки, т. с. список всех единиц отбора. В качестве такой основы может быть взят алфавитпый список всех сотрудников, пронумерованных последовательно (табл. 15). В целях наглядности вместе с основой выборки приводятся и все истинные значения единиц отбора, еще неизвестные исследователю. В дальнейшем сопоставим истинное значение искомого параметра и выборочную оценку.
Таблиц» 15. Распределение членов коллектива по числу выписываемых газет и журналов
Номер индивида 0)
| Число выписываемых газет и журна-лов (*.)
| Номер индивида (1)
| Число выписываемых газет и журна-лоо (*.)
| Номер индивида (1)
| Число выписываемых газет и журна-лов (*.)
| Ночер индивида (О
| Число выписываемых газет и журна-лов р.)
|
|
|
|
|
| Г,
|
|
|
|
|
|
|
|
|
|
|
|
| If»
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| О
|
|
|
|
|
|
|
|
|
| 3 1
|
|
|
|
|
|
|
|
|
|
|
|
| N
| = 50
|
i=
| Л = 150
| | | | | | | | | | | Число Число Число Число
пыписы- выписы- выписы- лыпкгы-
Помер наемых Номер паемых Номер ваемых Номер вае'мых
индивида газет и индивида газет и индивида газет и индивида газет и
О') журна- (i) журна- (i) журна- (i) журна-
лов /хл лоп (х.\ лов (*Л лов (хл
1 2 14 6 26 Г, 38 3
2 2 15 5 27 3 39 4
3 0 If» 0 28 10 40 3
4 0 17 1 29 2 41 1
5 1 18 4 30 5 42 2 к 2 19 3 31 4 43 3
7 5 20 5 32 8 44 5
8 3 21 2 33 2 45 3
9 5 22 4 34 3 46 1
10 3 23 3 35 2 47 2
11 3 24 0 36 1 48 3
12 4 25 1 37 1 40 4
13 3 I 50 2
N = 50 2*1 = 15° 1=1
Общая сумма выписываемых газет н журналов равна 150. Среднее число выписываемых газет и журналов на каждого сотрудника равно (.1 = 150/50 = 3.
Среднее квадратнческое отклонение для генеральной совокупности равно
/ 60
а „Л/ ^к____ =1/^=17
f Л-1 У 49 ' '
Сумма квадратов отклонений равна 146 при условии, что одно значение квадрата отклонения, а именно от единицы отбора 28, было исключено из суммы. Это значение, равное 49, резко увеличивает сумму, будучи нетипичным для генеральной совокупности. Такое «исключение» экстремального отклонения нередко применяется при обработке первичной социальной информации в том случае,
когда предусмотрено возведение в квадрат, а само отклонение в 2—3 раза превышает среднее значение параметра.
Однако ни среднее значение параметра, ни среднее квадрати-ческое отклонение перед началом исследования не известны. В про-тивпом случае само исследование было бы излишним.
Естественно предположить при анализе вышеприведенного примера, что каждый респондент (единица отбора и единица наблюде-лия) выписывает несколько газет и журналов и что количество выписываемых газет и журналов не слишком сильно варьирует (если бы путем выборочного исследования потребовалось определить, скажем, объем личных библиотек, положение исследователя осложнилось бы). Исходя из этих соображений, полагаем достаточной выборку, состоящую из пяти респондентов. Проверить правильности определения объема выборки можно только после обработки результатов пилотажного исследования.
Предположим, что случайный выбор из табл. 15 дал следующие результаты: выбраны номера 18, 4, 28, 39, 22; они соответствуют значениям признаков 4, 0, 10, 4, 4.
Среднее арифметическое по выборке х = 22/5 = 4,4, дисперсия
5* = Jl^L = 12,24, a s = 3,5.
Такое значительное отклонение от истинпого значения средней объясняется тем, что п выборку попал респондент № 28, исключенный при подсчете дисперсии для генеральной совокупности как нетипичный. Однако при формировании выборки еще неизвестно, что данный респондент нетипичен. По сам факт, что среднее квад-ратическое отклонение приближается по величине к средней, должен насторожить исследователей.
Для большей паглядности выразим s в процентах от величины средней: (3,5 :4,4) • 100% = 79%, т. е. среднее отклонение значений признака от выборочной средней арифметической величины составляет 79%. В таких случаях целесообразно увеличить объем выборки, например, в 2 раза. В результате были отобраны номера: 44, 2, 12, 26, 14, 27, 35, 9, 8, 49; значения признака 5, 2, 4, 6, 1, 3, 2, 5, 3, 4.
Среднее арифметическое — 3,6, дисперсия sl = 2,26, среднее квадратическое отклонение s = 1,5. Теперь оно составляет приблизительно 40% от величины средней. При больших дисперсиях объем выборки увеличивают с учетом практических возможностей до тех пор, пока дисперсия не перестает уменьшаться. Дальнейшее увеличение объема выборки является нецелесообразным. Обычно исследователь приходит к некоторому компромиссному решению относительно объема выборки в зависимости от требуемой точности, а также средств и времени, которыми он располагает.
Сводка необходимых формул для простой случайной выборки. В рассмотренном гипотетическом примере легко было оценить качество выборочной оценки среднего (перед глазами была информация обо всей генеральной совокупности). Но как провести его оцен-
.210
ку в реальном исследовании, когда имеется только информация, полученная из выборки?
На помощь приходит статистическая теория выборочного метода. Она позволяет при условии реализации случайного отбора достичь по крайней мере следующих двух целей:
1. По заданной априори необходимой степепи точности выводов (формализуемой с помощью понятия доверительной вероятности) найти возможные интервалы, изменения характеристик генеральной совокупности (доверительные интервалы). И наоборот, рассчитать доверительную вероятность отклонения характеристики генеральной совокупности от выборочной по заданной величине доверительного интервала.
2. Найти объем планируемой выборки, позволяющей достигнуть р пределах требуемой точпости расчета выборочных характеристик необходимую доверительную вероятность.
Дадим сводку необходимых для достижепия этих целей формул3.
Чтобы уметь применять приведенные формулы при планировании выборки в эмпирическом социологическом исследовании, познакомимся несколько подробнее с основными понятиями выборочного* метода — «доверительная вероятность» и «доверительный интервал».
Теоретико-вероятностные теоремы, восходящие к закону больших чисел, позволяют с определенной вероятностью, обозначаемой (1 —а), утверждать, что для изучаемого признака отклонения выборочной средней от гепералыюй не превысят некоторой величины Д, называемой предельной ошибкой выборки.
В одпой из формулировок ото утверждение записывается следующим образом:
р{-Д<(х-М)<Д} = 1-а. (1)
Используя формулу табл. 16 для предельной ошибки Д =» *= Zy -^-, при повторном случайном отборе получим выражение
p\i-Z^L.<n<x + Z^] = 2<l>(z)=*l-a, (2)
I У" У« J v '
где а, Ф(2), Z, а, Д описаны в примечании к табл. 16.
Смысл приведенного соотношения следующий: с доперительпой вероятностью (1 —а) можно утверждать, что генеральное среднее-
лежит в интервале (х — Z —-=-; х -\- Z 1, который и называется
\ У« К» /
Доверительным интервалом, а определяет как бы степень доверия к данным, получаемым по рассчитанным с его помощью выбороч-вым характеристикам. Отсюда и название а — уровепь значимости.
* Знание формул необходимо для практической работы социолога, а также для дальнейшего понимания материала главы. Впрочем, без большого-ущерба при первом чтении можно опустить формулы и текст, их сопровождающий. В гаком случае придется возвращаться к табл. 16 каждый раз, когда в последующем изложении будет использоваться та или иная формула из этой сводки.
Таблица 16. Сводная таблица формул для расчета характеристик простои случайной выборки
■Обозначения: М — средняя ошибка выборки, р — доля единиц с данным значением признаки, 4 = 1 — р — доля единиц, в которых этот признак отсутствует, п — объем выборки, N — объем генеральной совокупности, д — предельная ошибка, Z — числа, определяемые но таблице критических точек стандартного нормального распределения (см. табл. А приложения), а — уровень значимости, ц, о> — генеральные среднее и дисперсия.
Примечание. При расчете характеристик бесповторного случайного отбора, с которым практически всегда имеет дело социолог, можно пользоваться более, простыми формулами дли случая повторного отбора, если объем генеральной совокупности значительно больше объема выборки.
Принятие того или иного уровня значимости, например 5%-пого ■(а =0,05), зависит от целей данного социологического исследования, требований к степени гарантии его результатов. Социолог должен четко понимать, что, выбрав, скажем, уровень значимости, равный 5%, и рассчитав на основе его выборочные характеристики, мы £удем утверждать наличие некоторого эффекта, который на самом деле может оказаться несправедливым приблизительно в пяти процентах случаев.
Пример.При обследовании 900 человек — лиц трудоспособного возраста — определен их средний возраст. Для вероятности (1 — а) = = 0,90 необходимо найти доверительный интервал, в котором содержится генеральное среднее. Поскольку дисперсия признака неизвестна, оценим се приблизительно по значению размаха для генеральной совокупности.
С этой целью воспользуемся соотношением связи среднего квадратичного отклонения с размахом
<Т» T"ax-Jmln f (3)
2i2
справедливым в предположении нормального характера распределения. Здесь Xm«i — хт1п— вариационный размах генеральной совокупности, а V — величина, зависящая от объема выборки, значения которой можно найти в табл. 17.
Так как по всей генеральной совокупности верхняя граница трудоспособности в.СССР — 60 лет, а нижняя—16, то хт,х~хт1п = = 60—16 = 44, следовательно (для п>100 — последний столбец
Таблица
|
|
|
|
|
|
| Объем выборки п
|
|
|
|
|
|
| V
| 2,3
| 3,1
| 3,7
| 4,1
| 4,5
| 5,0
| Таблица 17
Объем
Выборки 5 10 20 30 50 100
п
V 2,3 3,1 3,7 4,1 4,5 5,0
табл. 17), получим приближенное значение среднеквадратичного отклонения о = -^- = 8,8.
Пользуясь выражением для средней ошибки простого случайного повторного отбора (см. табл. 16) М= у —^-, получим М = 8,8/У900 =
■= 0,29. Предельная ошибка рассчитывается по формуле Д = ZM (см. табл. 16).
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|