Сделай Сам Свою Работу на 5

Систематическая и серийная выборки





Систематический отбор. В социологических исследованиях иногда применяется несколько упрощенный вариант простого случайного отбора, который носит название систематического. Основа выборки для него характеризуется теми же требованиями, что и для простого случайного отбора. Инымп словами, основу выборки составляют раз­личные алфавитные списки, картотеки учреждений, домовые книги и т. п. При систематическом отборе выбор единиц наблюдения осу­ществляется через один и тот же интервал к из исходного списка. Например, при к = 20 выбирается 3, 23, 43, 63 и т. д. единиц списка.

Таким образом, элементы выборочной совокупности однозначно определяются при систематическом отборе номером первого элемен­та (тройки в нашем лримере) и величиной интервала к.

В одной из схем систематического отбора в качестве первого элемента выбирается средний элемент списка или стоящий рядом с ним. Так, если список генеральной совокупности пронумерован

от 1 до N, то номер первого элемента может быть определеп по

N -4- I

формулам —5-—, если N — нечетное и N/2, если N — четное число.

Более распространен выбор первой единицы отбора случайным об­разом (например, по таблице случайных чисел).



Величина к зависит от характера поставленной проблемы, от разброса значений исследуемой характеристики генеральной сово­купности.

Если решен вопрос об объеме планируемой выборки, то число определяется в зависимости от объема генеральной совокупности и объема выборки (п).

Если Л' — кратное числа п, то интервал определяется по фор­муле к = —. Если N некратно п, то реальный объем выборки пр

и планируемый объем псл при различных способах вычисления числа к связаны следующими соотношениями:

если к — I — J, то пр > пал; (4)

Г N 1
если к = — -f-1, то пр ^ ппл,. (5)

Здесь [ ] означает целую часть числа.

Поясним сказанное на примере: пусть N=19 и п = 5, чему равно А? Тогда к равно либо 3, либо 4.

При к = 3 в выборку попадает больше пяти элементов — в дан­ном случае 6 или 7. При к = 4 в выборку попадут пять или четыре элемента.

Расчет характеристик систематической выборки. В связи о тем что систематическая выборка определяется как разновидность про­стого случайного отбора, ее характеристики рассчитываются с по­мощью соответствующих формул табл. 16.



В примере с подписчиками газет и журналов (см. табл. 15) и систематическую выборку объемом 5 единиц попали номера респоп-дентов 10, 20, 30, 40, 50, для которых соответствующее число вы­писываемых газет равно 3, 5, 5, 3, 2. Среднее по выборке равно 3,6, а дисперсия — 1,44 (а=1,2).

Применяя для простоты формулы повторной случайной выборки,

получаем М = -^- = -^- = 0,54.

Таким образом, с вероятностью 0,95 можно утверждать, что до­верительный интервал для генеральной средней имеет следующие границы: (3,6 ± 1,96 • 0,54) = (3,6 ± 1,05) = (2,55; 4,65).

Возможности и ограничения систематической выборки. Система­тическая выборка является экономным и удобным способом форми­рования выборочной совокупности. Однако при ее применении в социологических исследованиях необходимо следить за тем, чтобы список, используемый в качестве основы выборки, не обладал по-

рядком, отражающим периодичность в значениях изучаемой харак­теристики.

Проиллюстрируем это положение. При составлении основы вы­борки для опроса рабочих в одном из цехов завода выбранный интервал может совпасть с числом рабочих в бригаде, в списке ко­торой первым окажется бригадир. При систематическом отборе повышаются шансы попадания в выборку только одних бригадиров. При такой реализации выборки повышается вероятность получения значительных систематических ошибок.

Предварительное расположение элементов генеральной совокуп­ности по убыванию или возрастанию исследуемой характеристики позволит избавиться от этой опасности. Так, если в рассмотренном примере основа выборки организуется на базе платежной ведомости, в которой лица расположены в порядке возрастания их заработной платы, то опасность попадания только на одних бригадиров исклю­чается.



Систематическая выборка из-за простоты реализации получила широкое применение в социологических исследованиях.

Серийная (гнездовая) выборка. При серийной выборке единицы отбора представляют собой статистические серии, т. е. совокупности статистически различимых единиц. В качестве таких единиц могут выступать семья, бригада, школьный класс, небольшие производ­ственные коллективы в учреждениях, почтовые отделения, врачеб-пые участки, населенные пункты, территориальные общности и т. п. Отобранные в выборку серии подвергаются сплошному или выбо­рочному обследованию. Второй вариант используется в практике социологических исследований гораздо чаще, чем первый. Собствен­но говоря, любая многоступенчатая выборка представляет собой, гнездовую выборку, в которой единицы отбора на высших ступенях являются гнездами из единиц отбора нижних ступеней.

Организация серийной выборки. Серийная выборка имеет суще­ственные организационные преимущества перед простой случайной выборкой, так как значительно легче произвести отбор и изучение лескольких коллективов, бригад, цехов и т. д., находящихся на одном месте, чем нескольких сотен пространственно разбросанпых людей. Процедура отбора позволяет сконцентрировать выборку в сравнительно небольшом числе пунктов.

Серийная выборка может организовываться по -схемам простой случайной и систематической выборок. Наконец, она может форми­роваться после предварительного районирования генеральной сово­купности.

В первых двух случаях к информации о генеральной совокупно­сти — основе выборки — предъявляются те же требования, что и ко всем вероятностным выборкам: размещение элементов генеральной совокупности (серий) не должно быть каким-либо образом система­тизировано.

Метод маршрутного опроса. Этот метод социологи часто исполь­зуют, когда единицей наблюдения выступает семья.

В выборочную совокупность, например, намечено включить опрс-

деленное число случайно отобранных семей или квартир. На карте города или населенного пункта нумеруются все улицы. С помощью таблицы случайных чисел отбираются большие числа, которые поз­воляют идентифицировать семьи или квартиры, попавшие в выбор­ку. Каждое большое число рассматривается как состоящее из трех компонентов: первые две или три цифры в нем указывают номер улицы, следующая цифра — номер дома, последняя цифра — номер квартиры в выбранном доме.

Например, число 42—25—3 указывает квартиру № 3 дома № 25 на 42-й улице.

Организация серийной выборки методом маршрутного опроса наиболее приспособлена к городам, где преобладают отдельные квартиры, или к населенным пунктам, где еще сохраняется частное домовладение (в последнем случае отпадает необходимость выбирать номер квартиры).

Возможности и ограничения серийной выборки. При серийной выборке всегда имеет место занижение по сравнению с генеральной совокупностью дисперсии изучаемого признака в силу определен­ного сходства единиц в сериях.

Например, вполне объяснима заметная связь между членами семьи. Характер профессий детей в определенной мере может зави­сеть от профессии родителей. Очевидна связь членов семьи в отно­шении их социальной принадлежности.

С точки зрения статистика, сходство элементов серий приводит к избыточности однотипной, повторяющейся информации. Социолог должен учитывать этот органически присущий серийной выборке статистический порок при прочих равных условиях, выбирая в ка­честве гнезд такие общности, которые содержат максимально разно­родные конечные единицы наблюдения. Так, при изучении, ска­жем, качества медицинского обслуживания населепия города разум­но в виде гнезд выбрать совокупность жителей, обслуживаемых отдельными почтовыми отделениями, или проживающих на терри­тории отдельных жэков, но никак не врачебные участки, поскольку последний выбор привел бы к искажению результатов.

Расчет характеристик серийной выборки. Расчет характеристик серийной выборки имеет некоторое отличие от простой случайной и систематической выборок. Это отличие связано прежде всего с вычислением дисперсий и ошибки выборки.

Вычисление средней ошибки серийной выборки основано на дис­персии серийных средних.

Пример. Из генеральной совокупности, включающей 16 семей, сделана серийная выборка, состоящая из четырех семей (в каждой семье по 4 человека)'. Перед исследователями стоит задача найти оценку средней заработной платы в генеральной совокупности, оцен­ку ее дисперсии и среднюю ошибку выборки (табл. 18).

Средняя ошибка бесповторной серийной выборки определяется

Дружинин II. К. Математическая статистика в экономике. М., 1971, с. 193.

по формуле

N-V-7W=V' (6)

где Si — дисперсия серийных средних; С —число серий в гене­ральной совокупности (равных по численности); с — число серий js выборке.

Таблица 18. Данные для примера

Расчет дисперсии серийных средних:

(v*) (=«-=)'

81,75 —1,75 3,0625

86,75 3,25 10,5625

80,75 3,25 10,5625

78,75 -4,75 22,5625

х = 83,5 S = 46,75

Тогда

с» _ «J5 _ U an. м _ 1/"ii^2.f!illi\ = 1 53

В зависимости от выбранной доверительной вероятности средняя заработная плата для генеральной совокупности 83,5 ±21,53. На­пример, исследователь может с вероятностью в 0,95 утверждать, что в данной генеральной совокупности средняя заработная плата пе меньше 80,6 руб. и не больше 86,5 руб.

Так как вычисление ошибки для серийной выборки основано на дисперсии серийных средних, то серийный отбор будет тем репре­зентативнее, чем меньше степень колеблемости серийных средних, измеряемая величиной их дисперсии.

Стратифицированный отбор

Понятие стратифицированной выборки. Вероятностная выборка с любой техникой отбора (простая случайная, систематическая, се­рийная или многоступенчатая) становится стратифицированной,

если процедурам отбора предшествует выделение в генеральной со­вокупности однородных частей, называемых стратами.

В статистическом, смысле стратификация соответствует выделе­нию таких статистически однородных групп, колеблемость изучае­мых признаков которых внутри меньше, чем между ними.

Эта дифференциация внутри генеральной совокупности на ка­чественно более однородные группы содержательно связана с пред­метом исследования.

Стратификация совокупности оказывается необходимой во всех случаях, когда совокупность является неоднородной по социальным, экономическим и другим характеристикам единиц наблюдения.

Так, исследуя профессиональную ориентацию школьников в пре­делах одного города, можно в одну страту отнести 16 школ, распо­ложенных в районе старых застроек, во вторую — 20 школ, распо­ложенных в районах новостроек. Для опроса можно отобрать вы­пускников из двух школ первой страты, а также из двух школ второй страты. Если такая группировка школ действительно отра­жает различия районов, которые существенно учитывать в исследо­вании профессиональной структуры, то колеблемость изучаемых признаков внутри каждой группы школ должна быть меньше, чем между группами.

В качестве страт могут быть использованы как естественпыо образования, так и специально формируемые для определенного исследования. Например, такими стратами могут выступать эконо­мико-географические регионы или области страны, города, класси­фицированные по их административному статусу и по численности населения. Стратами могут выступать и идеальные образования. Примером является выделение в генеральной совокупности при ис­следовании отношения молодежи к труду шести групп по содер­жанию трудаs.

Стратифицирующий признак. Признак, по значениям которого производится стратификация генеральной совокупности, называется признаком стратификации. Стратификация может проводиться по одному или нескольким признакам.

Организация стратифицированной выборки. Организация стра­тифицированной выборки требует представления о характере рас­пределения по всей совокупности тех признаков, которые должны быть положены в основу образования типических групп, или страт. Неправильный выбор признака для группировки элементов. ге­неральной совокупности может не увеличить репрезентативность выборочных данных по сравнению со случайной выборкой того жо объема.

Организация стратифицированной репрезентативной выборки связана на практике с известными трудностями, особенно если вы­деленные страты неравночисленны. Математическая статистика ре­комендует в этих случаях, чтобы размеры выборки из каждой стра-

* Человек и его работа. М., 1967,

ты были пропорциональны средним квадратическим отклонениям в соответствующих стратах генеральной совокупности. Но дисперсии, пак правило, неизвестны. Поэтому часто при организации отбора из страт генеральной совокупности производится отбор пропорциональ­но их размеру (доле) в общей численности совокупности.

Еще один употребляемый в социологии вариант выбора — это> отбор одинакового количества единиц наблюдения из неравных ти­пических групп.

Выборка организуется в зависимости от рассмотренных вариан­тов отбора с объемом, который рассчитывается по следующим формулам.

1. Пропорционально среднеквадратическому отклонению st в i-й
типической группе, найденному по результатам пробного исследо­
вания. Размер (и,) выборки из г'-й типической группы равен

Щ = п—,1,

S "л

где n — объем всей выборки; Л', — объем i-й. группы в генеральной совокупности; / — количество групп. Весь объем выборки равен

П = 2 ni-t=l

2. Пропорционально размеру групп: nt — п -ту-? где N объем гене-

i

ральной совокупности. Весь объем выборки равен п = 2 ni-

j=i

3. Отбор равного числа единиц наблюдения nt = пг = ,.. = п, = с.
Вес* объем выборки определяется по формуле п = 1с.

Расчет характеристик стратифицированной выборки. Характери­стики такой выборки рассчитываются как «взвешенные» величины: показатели по каждой страте комбинируются в общую среднюю; вклад групповых средних пропорционален «весу» каждой страты в выборочной или генеральной совокупности.

В стратифицированной выборке общая дисперсия выборки имеет как бы два источника: дисперсию групповых средних, которые ха­рактеризуют каждую страту s|, и среднюю дисперсию из дисперсий

впутри каждой из отих страт s\. Первую составляющую принято называть межгрупповой дисперсией, а вторую — внутригрупповой. дисперсией.

Это записывается следующим образом:

«■ = *! + «?. (7)

Расчет средней ошибки при отборе, пропорциональном числен­ности единиц в стратах, производится по формуле

или, если пренебречь отношением n/N,

м = ]/-!-• (0)

В выражениях (8) и (9) «? вычисляется исходя из формулы (7), т. е. *'i = s2 — s|, где s2 — общая дисперсия выборки — подсчиты-вается каЪ для простой выборки, пе принимая во внимание страти­фикацию.

Таблица 19. Данные к примеру

Группа (i>

Семья I | II | Ш | IV | V

Расходы на подписку, руб.

1 3 10 15 17 14

2 2 6 12 1120

7- = 11Jj=2,5 х^=8 ^ = 13,5*"4=14 х^ == 17

Из соотношения для средней ошибки (7) следует, что ошибка стратифицированной выборки меньше средней ошибки чисто слу­чайной выборки либо равна ей, когда межгрупповая дисперсия, равна нулю.

Пример. Предположим, что выборка содержит 5 страт (группы семей по среднему доходу"). Необходимо определить величину рас­ходов на годовую подписку. Из каждой i-fi страты взяты по две семьи (объем выборки п = 10, см. табл. 19).

Расчет:

(Vs) (5i-;)a

2,5 —8,5 72,25

8,0 —3 9,00

132,5 л
13,5 2,5 6,25 Л=—§—=>5

14,0 3,0 9,00

17,0 0,0 36,00

г= 11 2 = 132,5

Найдем дисперсию, не учитывая расслоение семей на 5 групп:

Nn/n«, ('С') ('Г")*

1 3 —8 64

2 2 —9 81

3 10 —1 1

4 С -5 25

' Дружинин И. К. Указ. соч., с. 195.

314 5 15 4 1(5 «'=-^=31,4

0 12 11

7 It О О

8 17 (i 3(1

9 И З Я
10 20 U 81

x= 11 2 = 314

Отсюда внутригрушювая дисперсия sj = 31,4 — 26,5 = 4,9, ошибка для стратифицированной выборки М = |/ -ттр = 0,7.

Для случайной выборки М = у ,' = 1,77.

Таким образом, как впдпо из рассмотренного примера, страти­фицированная выборка при прочих равных условиях дает более точные результаты.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.