Систематическая и серийная выборки
Систематический отбор. В социологических исследованиях иногда применяется несколько упрощенный вариант простого случайного отбора, который носит название систематического. Основа выборки для него характеризуется теми же требованиями, что и для простого случайного отбора. Инымп словами, основу выборки составляют различные алфавитные списки, картотеки учреждений, домовые книги и т. п. При систематическом отборе выбор единиц наблюдения осуществляется через один и тот же интервал к из исходного списка. Например, при к = 20 выбирается 3, 23, 43, 63 и т. д. единиц списка.
Таким образом, элементы выборочной совокупности однозначно определяются при систематическом отборе номером первого элемента (тройки в нашем лримере) и величиной интервала к.
В одной из схем систематического отбора в качестве первого элемента выбирается средний элемент списка или стоящий рядом с ним. Так, если список генеральной совокупности пронумерован
от 1 до N, то номер первого элемента может быть определеп по
N -4- I
формулам —5-—, если N — нечетное и N/2, если N — четное число.
Более распространен выбор первой единицы отбора случайным образом (например, по таблице случайных чисел).
Величина к зависит от характера поставленной проблемы, от разброса значений исследуемой характеристики генеральной совокупности.
Если решен вопрос об объеме планируемой выборки, то число определяется в зависимости от объема генеральной совокупности и объема выборки (п).
Если Л' — кратное числа п, то интервал определяется по формуле к = —. Если N некратно п, то реальный объем выборки пр
и планируемый объем псл при различных способах вычисления числа к связаны следующими соотношениями:
если к — I — J, то пр > пал; (4)
Г N 1 если к = — -f-1, то пр ^ ппл,. (5)
Здесь [ ] означает целую часть числа.
Поясним сказанное на примере: пусть N=19 и п = 5, чему равно А? Тогда к равно либо 3, либо 4.
При к = 3 в выборку попадает больше пяти элементов — в данном случае 6 или 7. При к = 4 в выборку попадут пять или четыре элемента.
Расчет характеристик систематической выборки. В связи о тем что систематическая выборка определяется как разновидность простого случайного отбора, ее характеристики рассчитываются с помощью соответствующих формул табл. 16.
В примере с подписчиками газет и журналов (см. табл. 15) и систематическую выборку объемом 5 единиц попали номера респоп-дентов 10, 20, 30, 40, 50, для которых соответствующее число выписываемых газет равно 3, 5, 5, 3, 2. Среднее по выборке равно 3,6, а дисперсия — 1,44 (а=1,2).
Применяя для простоты формулы повторной случайной выборки,
получаем М = -^- = -^- = 0,54.
Таким образом, с вероятностью 0,95 можно утверждать, что доверительный интервал для генеральной средней имеет следующие границы: (3,6 ± 1,96 • 0,54) = (3,6 ± 1,05) = (2,55; 4,65).
Возможности и ограничения систематической выборки. Систематическая выборка является экономным и удобным способом формирования выборочной совокупности. Однако при ее применении в социологических исследованиях необходимо следить за тем, чтобы список, используемый в качестве основы выборки, не обладал по-
рядком, отражающим периодичность в значениях изучаемой характеристики.
Проиллюстрируем это положение. При составлении основы выборки для опроса рабочих в одном из цехов завода выбранный интервал может совпасть с числом рабочих в бригаде, в списке которой первым окажется бригадир. При систематическом отборе повышаются шансы попадания в выборку только одних бригадиров. При такой реализации выборки повышается вероятность получения значительных систематических ошибок.
Предварительное расположение элементов генеральной совокупности по убыванию или возрастанию исследуемой характеристики позволит избавиться от этой опасности. Так, если в рассмотренном примере основа выборки организуется на базе платежной ведомости, в которой лица расположены в порядке возрастания их заработной платы, то опасность попадания только на одних бригадиров исключается.
Систематическая выборка из-за простоты реализации получила широкое применение в социологических исследованиях.
Серийная (гнездовая) выборка. При серийной выборке единицы отбора представляют собой статистические серии, т. е. совокупности статистически различимых единиц. В качестве таких единиц могут выступать семья, бригада, школьный класс, небольшие производственные коллективы в учреждениях, почтовые отделения, врачеб-пые участки, населенные пункты, территориальные общности и т. п. Отобранные в выборку серии подвергаются сплошному или выборочному обследованию. Второй вариант используется в практике социологических исследований гораздо чаще, чем первый. Собственно говоря, любая многоступенчатая выборка представляет собой, гнездовую выборку, в которой единицы отбора на высших ступенях являются гнездами из единиц отбора нижних ступеней.
Организация серийной выборки. Серийная выборка имеет существенные организационные преимущества перед простой случайной выборкой, так как значительно легче произвести отбор и изучение лескольких коллективов, бригад, цехов и т. д., находящихся на одном месте, чем нескольких сотен пространственно разбросанпых людей. Процедура отбора позволяет сконцентрировать выборку в сравнительно небольшом числе пунктов.
Серийная выборка может организовываться по -схемам простой случайной и систематической выборок. Наконец, она может формироваться после предварительного районирования генеральной совокупности.
В первых двух случаях к информации о генеральной совокупности — основе выборки — предъявляются те же требования, что и ко всем вероятностным выборкам: размещение элементов генеральной совокупности (серий) не должно быть каким-либо образом систематизировано.
Метод маршрутного опроса. Этот метод социологи часто используют, когда единицей наблюдения выступает семья.
В выборочную совокупность, например, намечено включить опрс-
деленное число случайно отобранных семей или квартир. На карте города или населенного пункта нумеруются все улицы. С помощью таблицы случайных чисел отбираются большие числа, которые позволяют идентифицировать семьи или квартиры, попавшие в выборку. Каждое большое число рассматривается как состоящее из трех компонентов: первые две или три цифры в нем указывают номер улицы, следующая цифра — номер дома, последняя цифра — номер квартиры в выбранном доме.
Например, число 42—25—3 указывает квартиру № 3 дома № 25 на 42-й улице.
Организация серийной выборки методом маршрутного опроса наиболее приспособлена к городам, где преобладают отдельные квартиры, или к населенным пунктам, где еще сохраняется частное домовладение (в последнем случае отпадает необходимость выбирать номер квартиры).
Возможности и ограничения серийной выборки. При серийной выборке всегда имеет место занижение по сравнению с генеральной совокупностью дисперсии изучаемого признака в силу определенного сходства единиц в сериях.
Например, вполне объяснима заметная связь между членами семьи. Характер профессий детей в определенной мере может зависеть от профессии родителей. Очевидна связь членов семьи в отношении их социальной принадлежности.
С точки зрения статистика, сходство элементов серий приводит к избыточности однотипной, повторяющейся информации. Социолог должен учитывать этот органически присущий серийной выборке статистический порок при прочих равных условиях, выбирая в качестве гнезд такие общности, которые содержат максимально разнородные конечные единицы наблюдения. Так, при изучении, скажем, качества медицинского обслуживания населепия города разумно в виде гнезд выбрать совокупность жителей, обслуживаемых отдельными почтовыми отделениями, или проживающих на территории отдельных жэков, но никак не врачебные участки, поскольку последний выбор привел бы к искажению результатов.
Расчет характеристик серийной выборки. Расчет характеристик серийной выборки имеет некоторое отличие от простой случайной и систематической выборок. Это отличие связано прежде всего с вычислением дисперсий и ошибки выборки.
Вычисление средней ошибки серийной выборки основано на дисперсии серийных средних.
Пример. Из генеральной совокупности, включающей 16 семей, сделана серийная выборка, состоящая из четырех семей (в каждой семье по 4 человека)'. Перед исследователями стоит задача найти оценку средней заработной платы в генеральной совокупности, оценку ее дисперсии и среднюю ошибку выборки (табл. 18).
Средняя ошибка бесповторной серийной выборки определяется
Дружинин II. К. Математическая статистика в экономике. М., 1971, с. 193.
по формуле
N-V-7W=V' (6)
где Si — дисперсия серийных средних; С —число серий в генеральной совокупности (равных по численности); с — число серий js выборке.
Таблица 18. Данные для примера
Расчет дисперсии серийных средних:
(v*) (=«-=)'
81,75 —1,75 3,0625
86,75 3,25 10,5625
80,75 3,25 10,5625
78,75 -4,75 22,5625
х = 83,5 S = 46,75
Тогда
с» _ «J5 _ U an. м _ 1/"ii^2.f!illi\ = 1 53
В зависимости от выбранной доверительной вероятности средняя заработная плата для генеральной совокупности 83,5 ±21,53. Например, исследователь может с вероятностью в 0,95 утверждать, что в данной генеральной совокупности средняя заработная плата пе меньше 80,6 руб. и не больше 86,5 руб.
Так как вычисление ошибки для серийной выборки основано на дисперсии серийных средних, то серийный отбор будет тем репрезентативнее, чем меньше степень колеблемости серийных средних, измеряемая величиной их дисперсии.
Стратифицированный отбор
Понятие стратифицированной выборки. Вероятностная выборка с любой техникой отбора (простая случайная, систематическая, серийная или многоступенчатая) становится стратифицированной,
если процедурам отбора предшествует выделение в генеральной совокупности однородных частей, называемых стратами.
В статистическом, смысле стратификация соответствует выделению таких статистически однородных групп, колеблемость изучаемых признаков которых внутри меньше, чем между ними.
Эта дифференциация внутри генеральной совокупности на качественно более однородные группы содержательно связана с предметом исследования.
Стратификация совокупности оказывается необходимой во всех случаях, когда совокупность является неоднородной по социальным, экономическим и другим характеристикам единиц наблюдения.
Так, исследуя профессиональную ориентацию школьников в пределах одного города, можно в одну страту отнести 16 школ, расположенных в районе старых застроек, во вторую — 20 школ, расположенных в районах новостроек. Для опроса можно отобрать выпускников из двух школ первой страты, а также из двух школ второй страты. Если такая группировка школ действительно отражает различия районов, которые существенно учитывать в исследовании профессиональной структуры, то колеблемость изучаемых признаков внутри каждой группы школ должна быть меньше, чем между группами.
В качестве страт могут быть использованы как естественпыо образования, так и специально формируемые для определенного исследования. Например, такими стратами могут выступать экономико-географические регионы или области страны, города, классифицированные по их административному статусу и по численности населения. Стратами могут выступать и идеальные образования. Примером является выделение в генеральной совокупности при исследовании отношения молодежи к труду шести групп по содержанию трудаs.
Стратифицирующий признак. Признак, по значениям которого производится стратификация генеральной совокупности, называется признаком стратификации. Стратификация может проводиться по одному или нескольким признакам.
Организация стратифицированной выборки. Организация стратифицированной выборки требует представления о характере распределения по всей совокупности тех признаков, которые должны быть положены в основу образования типических групп, или страт. Неправильный выбор признака для группировки элементов. генеральной совокупности может не увеличить репрезентативность выборочных данных по сравнению со случайной выборкой того жо объема.
Организация стратифицированной репрезентативной выборки связана на практике с известными трудностями, особенно если выделенные страты неравночисленны. Математическая статистика рекомендует в этих случаях, чтобы размеры выборки из каждой стра-
* Человек и его работа. М., 1967,
ты были пропорциональны средним квадратическим отклонениям в соответствующих стратах генеральной совокупности. Но дисперсии, пак правило, неизвестны. Поэтому часто при организации отбора из страт генеральной совокупности производится отбор пропорционально их размеру (доле) в общей численности совокупности.
Еще один употребляемый в социологии вариант выбора — это> отбор одинакового количества единиц наблюдения из неравных типических групп.
Выборка организуется в зависимости от рассмотренных вариантов отбора с объемом, который рассчитывается по следующим формулам.
1. Пропорционально среднеквадратическому отклонению st в i-й типической группе, найденному по результатам пробного исследо вания. Размер (и,) выборки из г'-й типической группы равен
Щ = п—,—1—,
S "л
где n — объем всей выборки; Л', — объем i-й. группы в генеральной совокупности; / — количество групп. Весь объем выборки равен
П = 2 ni-t=l
2. Пропорционально размеру групп: nt — п -ту-? где N объем гене-
i
ральной совокупности. Весь объем выборки равен п = 2 ni-
j=i
3. Отбор равного числа единиц наблюдения nt = пг = ,.. = п, = с. Вес* объем выборки определяется по формуле п = 1с.
Расчет характеристик стратифицированной выборки. Характеристики такой выборки рассчитываются как «взвешенные» величины: показатели по каждой страте комбинируются в общую среднюю; вклад групповых средних пропорционален «весу» каждой страты в выборочной или генеральной совокупности.
В стратифицированной выборке общая дисперсия выборки имеет как бы два источника: дисперсию групповых средних, которые характеризуют каждую страту s|, и среднюю дисперсию из дисперсий
впутри каждой из отих страт s\. Первую составляющую принято называть межгрупповой дисперсией, а вторую — внутригрупповой. дисперсией.
Это записывается следующим образом:
«■ = *! + «?. (7)
Расчет средней ошибки при отборе, пропорциональном численности единиц в стратах, производится по формуле
или, если пренебречь отношением n/N,
м = ]/-!-• (0)
В выражениях (8) и (9) «? вычисляется исходя из формулы (7), т. е. *'i = s2 — s|, где s2 — общая дисперсия выборки — подсчиты-вается каЪ для простой выборки, пе принимая во внимание стратификацию.
Таблица 19. Данные к примеру
Группа (i>
Семья I | II | Ш | IV | V
Расходы на подписку, руб.
1 3 10 15 17 14
2 2 6 12 1120
7- = 11Jj=2,5 х^=8 ^ = 13,5*"4=14 х^ == 17
Из соотношения для средней ошибки (7) следует, что ошибка стратифицированной выборки меньше средней ошибки чисто случайной выборки либо равна ей, когда межгрупповая дисперсия, равна нулю.
Пример. Предположим, что выборка содержит 5 страт (группы семей по среднему доходу"). Необходимо определить величину расходов на годовую подписку. Из каждой i-fi страты взяты по две семьи (объем выборки п = 10, см. табл. 19).
Расчет:
(Vs) (5i-;)a
2,5 —8,5 72,25
8,0 —3 9,00
132,5 л 13,5 2,5 6,25 Л=—§—=2С>5
14,0 3,0 9,00
17,0 0,0 36,00
г= 11 2 = 132,5
Найдем дисперсию, не учитывая расслоение семей на 5 групп:
Nn/n«, ('С') ('Г")*
1 3 —8 64
2 2 —9 81
3 10 —1 1
4 С -5 25
' Дружинин И. К. Указ. соч., с. 195.
314 5 15 4 1(5 «'=-^=31,4
0 12 11
7 It О О
8 17 (i 3(1
9 И З Я 10 20 U 81
x= 11 2 = 314
Отсюда внутригрушювая дисперсия sj = 31,4 — 26,5 = 4,9, ошибка для стратифицированной выборки М = |/ -ттр = 0,7.
Для случайной выборки М = у ,' = 1,77.
Таким образом, как впдпо из рассмотренного примера, стратифицированная выборка при прочих равных условиях дает более точные результаты.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|