Сделай Сам Свою Работу на 5

Билет № 18 Показатель полной устойчивости. Проверка устойчивости шкал.





Билет № 17

Шкала Гуттмана

1) Основное допущение состоит в том, что аттитюд представляет собой некоторую одномерную структуру, а ответы респондента, выражающие его, на хорошей шкале должны представлять собой определенную связность и иерархию. По мнению Гутмана, это означает, что респондент с определенным аттитюдом принимает (соглашается) с одними высказываниями и не принимает др. Т. о., высказывания образуют определенный упорядоченный набор: от тех, которые принимаются большинством людей до тех, которые принимаются единицами.

Метод основан на принципе гомогенности, а сама шкала носит кумулятивный характер: пункты сформулированы и упорядочены т. о., что выбор респондентом любого из них предполагает автоматическое согласие со всеми пунктами более низкого ранга. Измерение аттитюда заключается в том, что респондент указывает те высказывания на шкале, которые он может принять; при этом он пользуется только дихотомическими ответами («да — нет» или «согласен — не согласен»). Оценкой аттитюда является оценка соответствующего класса (пункта) шкалы. Т. о., если известен полученный респондентом итоговый балл, можно предсказывать его ответы по всем утверждениям.



Порядок построения Ш. Г.: 1) формируется исходный список утверждений; 2) регистрируется принятие-непринятие каждого утверждения; 3) проводится статистическая обработка по каждому утверждению; 4) отбраковываются непригодные пункты (ошибка не должна превышать 10%); 5) оставшиеся пункты упорядочиваются: на первое место ставится пункт, получивший наибольшее число ответов «да» (принимаемый всеми); за ним — получивший меньшее число утвердительных ответов, и так вплоть до пунктов, с которыми не согласился почти никто и вообще никто.

Преимущества Ш. Г. вполне очевидны: 1) одномерность шкалы достигается строгими методами; 2) процесс измерения достаточно прост. В то же время Ш. Г. адресован ряд серьезных критических замечаний, основной из которых — невозможность построения одномерной шкалы во многих случаях (напр., при измерении художественных предпочтений)

2)— понятие, с к-рым тесно связано представление о шкалограммном анализе — совокупности вычислительных процедур, предназначенных для обработки данных в соответствии с моделью, предложенной в 40-х гг. Л. Гуттманом (Гутманом).



Идеи и методы, развитые Гуттманом, стали весьма популярны среди исследователей в области соц. наук из-за их простоты и естественности.

Шкалограммный анализ (в основной своей части) предназначен для обработки данных, образованных ответами респондентов на вопросы анкеты или теста, причем все вопросы допускают ответы только вида "да" или "нет". Рез-том применения метода служат шкала вопросов и шкала респондентов, согласованные с т. зр. модели, предложенной Гуттманом. Помимо этого используется ряд числовых индексов, с помощью к-рых можно оценить, насколько исходные дан ные согласуются с моделью шкалограммного анализа.

 

В тех случаях, когда шкалы Гуттмана ока­зываются адекватными исходным данным, их применение эффективно ввиду удобства интер­претации компонент модели и простоты вычис­лительных процедур.

Примером шкалы Гуттмана может послужить следующая шкала: табл. 3.

Чтобы построить шкалу, отражающую единственный показатель, Гуттман предлагает испытуемым из выборки начальный набор пунктов и регистрирует их реакции на пункты шкалы, в которых приведены готовые образцы ответов. Эти образцы, которые называются классами шкалы, выстроены в определенном ступенчатом порядке. Испытуемый может не принять ни одного из пунктов этого набора (оценка 0), может принять только пункт А (оценка 1), может принять только пункты А и Б (оценка 2), может принять А, БиВ (оценка 3) и так далее. Если ответы испытуемого не укладываются в схему шкалы (например, он принимает только пункт Вине принимает пункты с меньшими значениями по шкале), то предполагается, что он сделал не менее одной ошибки в ответах. Анализируя количество сделанных в ответах ошибок, можно определить, до какой степени первоначальный набор пунктов отражает одномерное свойство (т. е. насколько эти пункты поддаются шкалированию). Окончательная шкала получается путем исключения непригодных пунктов и повторного тестирования испытуемых из выборки, пока не будет разработан набор пунктов, пригодных для шкалирования.



Чтобы оценить установки человека, его просят отметить на шкале те высказывания, которые для него приемлемы. Варианты шкалы Гуттмана используются в исследованиях актуальности установок для определения сфер принятия и отвержения (см. главу 6). Итоговой оценкой является оценка соответствующего класса шкалы или (если ответы испытуемого не укладываются в схему шкалы) оценка класса шкалы, ближайшего к этим ответам. Из описания процедуры получения оценки следует, что почти невозможно разработать идеальную одномерную шкалу. Возможно, дело в том, что люди в действительности реагируют не на единственный гипотетический параметр, а на какой — то другой или сразу на несколько параметров.

Билет № 18 Показатель полной устойчивости. Проверка устойчивости шкал.

К концу XIX в. статистика пополнилась новыми методологичес­кими идеями, зародились теории устойчивости, корреляции и ре­грессии. Теория устойчивости возникла как попытка объяснить повторяемость данных в динамике, выявленную Кегле. Ее автор — .Вильгельм Лексис (1837—1914) — немецкий статистик и экономист, сторонник применения математических методов в экономике, преподавал в ряде университетов Германии. В опублико­ванной в 1879 г. работе «О теории стабильности статистических рядов» Лексис изложил выдвинутую им теорию устойчивости, которая породила много противников и последователей и оказала большое влияние на развитие статистики в XX в.

В широком плане исследование Лексиса отражало централь­ную концептуальную проблему статистики, которая явно обозна­чилась в XIX в — проблему однородности данных. Лексис понимал устойчивость ряда динамики как случайности. отклонений уровней динамического ряда от общей средней. Он построил свою теорию на примере анализа колеблемости альтернативных признаков (рождения женщин — рождения мужчин, первые браки —не пер­вые браки). Если различия между уровнями ряда случайны, то в основе ряда лежит некое постоянное число — вероятность (напри­мер, вероятность рождения мальчиков), основанная на многолет­них данных. Ее оценкой является средняя доля р. Тогда диспер­сия доли равна: r'2 = pq)n, где q=\—р, п—среднее число наблю­дений в году (например, среднегодовая численность населения). Если ряд стабилен, то дисперсия долей по годам должна быть близка к г2. Дисперсия долей равна:

где Pi — доля в i-м году, т — число лет в ряде динамики.

Соотношение этих двух дисперсий представляет собой меру устойчивости — коэффициент дивергенции (число Лексиса), ко­торое Лексис в честь Котле обозначил буквой Q : Q2 = R2/r2.

Для больших случайных выборок (т. е. при протяженном, ста­бильном ряде, динамики) Q=1. Если коэффициент Q близок Kl, ряд является нормально устойчивым, т. с. колеблемости каждого уровня не выходит за границы общей колеблемости. При этом го­ды (или серии) выбраны из однородной совокупности (например, соотношение мальчиков и девочек среди родившихся в разные го­ды в разных местностях). Если же годы (или серии) представля­ют разнородную совокупность, то R>r и Q>1 (например, доля умерших резко возрастает, если начинается война или эпидемия). Этот случай Лексис назвал сверхнормальным рассеянием, или поднормальной устойчивостью. Наконец, может быть R<r и Q<1 — случай поднормального рассеяния, или сверхнормальной устойчивости. Такая устойчнвость практически не встречается; сравнительно редко можно ожидать нормальную устойчивость, основным является случай поднормальной устойчивости. Это за­ключение Лексиса было использовано оппонентами Кетле для обоснования значимости воли человека. Делался вывод, что раз данные по годам могут быть неоднородны, то Кетле был неправ, утверждая объективность закономерностей, отсутствие свободы волн. В действительности, теория устойчивости Лексиса не отри­цает объективности статистических закономерностей, а лишь сви­детельствует об изменчивости их проявлении во времени и в про­странстве.

Если отклонения в динамическом ряду превышают случайную величину, т. е. ряд не являе1С.я нормально устойчивым, то Лексис считал необходимым выделение однородных подсерий. Если Кетле нормальное распределение казалось повсеместным, то в теории Лексиса оно трактуется как результат классификации данных. И если в антропометричсских исследованиях Кетле нормальное распределение было обычным, то при переходе к социальным пе­ременным нормальное распределение стало редким. Чтобы исклю­чить вариацию данных, вызванную внешними причинами, и достичь нормальной устойчивости, Лексис предложил использовать метод наименьших квадратов. Он ввел разграничение типов динамики: эволюторный — главное проявление основных тенденций, ундуляторный — волнообразное развитие во времени, периодический — правильное повторение волн, осцилляторный — беспорядочные колебания уровней.

Создав теорию устойчивости, Лексис предвосхитил открытие соответствия между анализом дисперсии и статистической связи, Что позже стали ставить в заслугу Р. А. Фишеру (см. гл. 6). Не даром теорию устойчивости назвали теорией дисперсии. Лексис ввел формулы, которые позволяли измерить дисперсию трех видов: общую, внутригрупповую и межгрупповую, и определил ранг каждой из них (число степеней свободы). Он вывел широко из­устное правило сложения дисперсий. Число Лексиса есть не что иное, как отношение межгрупповой дисперсии (R2) к общей (г2). позже, в XX в. были выведены соотношения между числом Лексиса -критерием х2 Пирсона, а также между Q и F-критерием Фишера. Последователь Лсксиса —В. И. Борткевич (см. гл. 5, 5} развил его концепцию и распространил теорию устойчивости с относительных чисел (долей) на средние величины. Математичес­кие обобщения теории устойчивости сделаны великими русскими учеными А. А. Чупровым и Л. А. Марковым.

Лексис внес значительный вклад в разработку методов демо­графии. Им создан графический метод демографического анали­за, получивший название демографический сетки Лексиса, усовер­шенствовано составление таблиц смертности, метод условного по­коления.

 

Устойчивость измерения выражается в однозначности информации, которую мы извлекаем с помощью данной процедуры. Нередко устойчивость ошибочно отождествляют с надежностью процедуры в целом. И хотя последняя зависит не только от устойчивости, но также от обоснованности и правильности операций, подобное смешение не случайно: проверка инструмента на устойчивость - важнейшее условие его надежности.

1) Наиболее распространенный прием контроля на устойчивость — повторное измерение. Один и тот же объект измеряется дважды с двух-трехнедельным временным интервалом и с помощью одинаковой процедуры. Шкала считается устойчивой, если совпадения между первой и второй сериями измерений будут достаточно высокими.

В отличие от проверки на устойчивость измерения физических объектов социолог или психолог сталкивается здесь с особой проблемой — влиянием психологической установки человека, возникающей после первого замера. Люди могут намеренно или непроизвольно подгонять данные второго замера к предыдущим. Или же, напротив, интуитивно сопротивляясь повторному эксперименту, они покажут новые результаты.

Чтобы устранить такой эффект, используют контрольную группу (см. гл. V, эксперимент, с. 203—205). Простейший же способ снять влияние установки первого замера - производить повторный замер спустя достаточное время после первого (например, две недели) и на достаточно большой выборке испытуемых (около 50 человек). Составив таблицу двух замеров для всех обследуемых, мы далее анализируем, какова общая устойчивость данных и от чего зависят отклонения между двумя замерами (+ означает совпадение, - несовпадение данных двух замеров, табл. 2, пример Г.И. Саганенко).

 

При повторных изменениях используют различные оценки устойчивости данных, одна из которых - это процент полных совпадений ответов на серию вопросов в двух последовательных пробах методики. Соответствующая формула:

п

W = ¾ = р,

N

где в числителе п - количество полностью совпавших пар ответов, а в знаменателе N - общая численность испытуемых, р - процент устойчивости. По этой формуле для примера в табл. 1 получим:

W = — = 90% полной устойчивости исходных данных.

Однако ее можно повысить, заменив некоторые пункты, в частности № 3, по которому обнаружен наибольший разброс (всего лишь 50% совпадений). Основной критерий устойчивости информации - анализ данных по строке. Если анализировать эти итоги по колонкам, найдем, что некоторые субъекты (В и Г особенно) дали большой разброс, а некоторые (А и Б) — почти не дали разброса. Те пункты шкалы, в которых обнаружено несовпадение даже у весьма "устойчивых" субъектов, должны быть переформулированы.

Другим весьма полезным показателем полной устойчивости является мера сдвига, оцененная как стреднеарифметическая ошибка различения градаций шкалы. Этот показатель обозначает, какую долю градации данной шкалы (в среднем) все испытуемые как бы не улавливают, т.е. каковы истинные границы различения градаций.

Например, уточним среднеарифметическую ошибку в различении трехчленной шкалы согласия-несогласия с каким-то суждением (пусть это будет суждение о привлекательности некоторого занятия на досуге). Приведем схему (табл. 3) и расчеты, используя данные таблицы Г.И. Саганенко.

В испытании участвует 28 человек, из которых 17 полностью повторяют свои оценки данного занятия в обеих пробах (сумма по диагонали схемы: 7 + 6 + 4 = 17) а остальные 11 испытуемых дают разные ответы в двух пробах. Для оценки искомой ошибки вычисляем отличия ответов респондентов как сдвиги между II и I пробами, например во II пробе из тех, кто в I пробе ответил "занятие привлекательно", 3 человека сообщили, что оно "не очень привлекательно", т.е. это разность (2 - 1) 3. Теперь суммируем все разности в ответах и получим меру среднеарифметической ошибки различения пунктов градации данной шкалы:

ï 2-1 ï* 3 + ï 1-2 ï * 4 +ï 3-2ï*1 + ï2-3ï*3

½ Δ½ = —————————————————————— = 0,39

Значит, среднеарифметический "сдвиг" в оценке по трехчленной шкале составляет около 40% одного ее деления, т.е. менее половины деления, что в общем можно признать удовлетворительным, хотя и не идеальным. (Ниже, говоря о правильности измерения, мы покажем, как можно было бы уменьшить эту ошибку.)

Рассматривая устойчивость как воспроизводимость результатов измерений, можно использовать и иные показатели ее меры [181, с. 33-34] наряду с обычными расчетами корреляции итогов двух последовательных измерений. Показатели, рекомендуемые Г.И. Саганенко, представляются нам наиболее адекватными и наглядными.

Какая же мера устойчивости удовлетворительна? Это зависит от существа измеряемого свойства, его значимости для целей и задач исследования. В принципе для немногочленной шкалы среднеарифметическая ошибка различения градаций в 40% ее деления невысока, а соответствующая мера устойчивости (100% - 40% = 60%) вполне достаточна, ибо не перекрываются границы между двумя соседними интервалами шкалы. Если неустойчивость составила не 40%, а 60%, т.е. более половины деления шкалы, то ошибка была бы явно недопустима, ибо в среднем испытуемые не различают две соседние градации из трех.

Для многочленных шкал, например из 10 градаций, ошибка в 60% одного деления не слишком велика, так как перекрываются два деления из 10, т.е. не 2/3, а 0,2 общей "длины" шкалы. Если при обработке данных градации укрупнить, объединяя две соседние, то ошибка минимизируется до вполне уверенного уровня устойчивости.

Помимо показателей полной устойчивости шкалы возможны также показатели ее относительной устойчивости. Они полезны при сравнении разных шкал, например для выбора из нескольких вариантов наиболее правильной и точной шкалы (о чем говорится ниже в этом же разделе) или для того, чтобы сопоставить уровни устойчивости измерения разных свойств, каждое из которых фиксируется шкалами разного типа и разной степени дробности.

Но, повторяем, независимо от вида оценки или способа ее расчетов все эти показатели следует соотносить с существом изучаемой проблемы и мерой строгости, предъявляемой к достоверности данных, исходя из характера исследования.

2) Использование нескольких лиц для измерения одного свойства. Случается, что шкала неустойчива потому, что ее пункты произвольно интерпретируются самими исследователями. В особенности это характерно для шкал качественной классификации объектов. В таких (номинальных) шкалах группы объектов классифицируют с помощью описания всех качественных признаков, по которым каждый объект относится к определенному пункту шкалы ¾ классу.

Предположим, что выделено несколько признаков (с соответствующими индикаторами) для отнесения общественной деятельности в высшую категорию по уровню активности. Чтобы выполнить эту операцию однозначно, нужно убедиться, что признаки ясно различимы и при соотнесении видов деятельности с пунктами шкалы не возникает путаницы.

В этом случае объект измеряют одновременно несколько (минимум трое) лаборантов, использующих единую процедуру. Если данные, полученные разными лаборантами, высоко согласуются, шкала устойчивая, если нет — неустойчива, и мы начинаем искать другую, более приемлемую размерную величину. Причина неустойчивости шкалы — в плохом отборе индикаторов.

3) Наконец, третий прием контроля эталона измерения на устойчивость — "расщепление шкалы". Шкала раздваивается на две половины.

Если окажется, что измерения по каждой из них совпадают, их можно рассматривать как равноценные шкалы, суммировать данные и впредь пользоваться одновременно обеими половинами, образующими теперь единую и более надежную шкалу, чем каждая из ее составляющих.

Покажем технику "расщепления" на примере. Возьмем объектом измерения уровень удовлетворенности рабочего своей специальностью. Данные получаем путем анкетного опроса.

Проектируем две шкалы, пункты которых будут отвечать одному из пяти уровней удовлетворенности специальностью (схема 5). Каждому уровню соответствуют два суждения. Нечетные пункты образуют одну, а четные - другую половину испытываемой шкалы.

Далее производим следующие операции: (а) все 10 пунктов четной и нечетной половин перетасовываются в произвольном порядке; (б) опрашиваемым предъявляют набор из 10 суждений с просьбой указать свое согласие или несогласие по каждому из них; (в) после опроса достаточной группы лиц (не менее 50 человек) из числа обследуемой совокупности данные группируются по двум шкалам раздельно: по нечетной половине - (a1), (b1), (с1), (d1),(e1) и по четной шкале - (а2), (Ь2), (с2), (d2), (е2).

Основная операция - (г) сопоставление итогов измерения по двум половинам испытываемой шкалы. Если корреляция между ними будет достаточно высока, эти половины можно рассматривать как части единого инструмента, измеряющего общий континуум свойств. В случае необходимости "выпадающие" суждения следует переформулировать, чтобы получить приемлемую корреляцию.

В таком случае итоговую шкалу образуют все 10 суждений, которые в случайном порядке предъявляются общим списком. В итоговый показатель для данного лица суммируются все баллы суждений, с которыми он выразил согласие.

Обозначив ранжированные пункты баллами от 5 (для a1и а2- высшая оценка) до 1 (elи е2- низшая оценка), предположим, что некий субъект выразил согласие с пунктами a1+ b2, отвергнув все остальные. Его суммарный балл по шкале равен 5 + 4 = 9.

Точность и правильность измерения зависят от (а) степени устойчивости измеряемого объекта или свойства, (б) чувствительности эталона измерения (дробности пунктов шкалы), (в) отсутствия систематических ошибок измерения и, конечно, (г) от устойчивости измерения.

Социальные объекты, подлежащие измерению, обладают различной степенью устойчивости. Скажем, установление состояния удовлетворенности какой-то деятельностью будет заведомо менее точным, чем регистрация частоты поведенческих актов. В первом случае сам объект измерения нестабилен. В дурном настроении человек может выражать недовольство своей работой, а в хорошем расположении духа он будет уверять, что та же работа ему очень нравится. Но вряд ли его настроение отразится на информации о том, как часто он задерживается на работе после окончания смены.

Дробность метрики — чувствительность шкалы — прямо связана с точностью измерения. Шкалы в 10 делений измеряет точнее, чем в 5 или 3 деления. Но дробность пунктов шкалы нельзя увеличивать беспредельно. Надо установить оптимум, удовлетворяющий двум требованиям: максимум градаций шкалы при условии высокой устойчивости результатов измерения. Постепенно повышая дробность эталона измерения и параллельно 1 проверяя шкалу на устойчивость, мы найдем границу, за пределами которой дальнейшее повышение дробности влечет понижение устойчивости. Это и есть оптимум чувствительности шкалы с учетом меры устойчивости измеряемого свойства. Таким образом, достижение устойчивых данных при максимальной дробности метрики повышает точность измерения. Оно будет удовлетворительно точным, если абсолютная ошибка измерения не превышает 0,5 деления шкалы. Вместе с тем, если ошибка вообще отсутствует | Δ | = 0, то не исключено, что шкала обладает заниженной чувствительностью (особенно в случаях, когда мы предполагаем достаточную вариабельность измеряемого свойства).

Но измерение может быть вполне точным и вместе с тем... неправильным, постоянно воспроизводя какую-то систематическую ошибку, как это случается с испорченным термометром, в котором ртутный столбик изначально был фиксирован на неверной исходной отметке и постоянно завышает температуру, скажем на 0,8 градусов.

При квантификации социальных характеристик проблема правильности, т.е. отсутствия уклонений от истинного значения измеряемого свойства, намного сложнее, ибо часто мы в принципе не способны установить, каковы же эти истинные значения измеряемых свойств (скажем, мнений людей по каким-то вопросам). Мы можем лишь, сопоставляя разные способы фиксирования данного свойства, добиваться устранения замеченных систематических ошибок. Каковы же эти систематические ошибки?

Одна из возможных — отсутствие "разброса" информации по шкале вследствие того, что какие-то ее пункты "не работают", т.е. не реагируют на определенное состояние измеряемого свойства. Например, при опросе все ответы концентрируются в позитивном или только в негативном полюсе шкалы. Конечно, это может быть и результатом единодушия оценок, но может быть и результатом того, что сама шкала неудачна, например, содержит какой-то пункт, сформулированный с сильным нормативным давлением на опрашиваемых. Допустим, задан вопрос об употреблении алкоголя и крайне негативный вариант ответа гласит: "Я пью систематически и обычно до бесчувственного состояния". Сомнительно, чтобы даже заведомый алкоголик отметил такой пункт как показатель своего отношения к спиртному. Скорее всего, он выберет суждение менее неприятного свойства, например: "Я выпиваю довольно часто". Крайне отрицательный пункт шкалы здесь "не работает": он отпугивает. Вследствие этого шкала неправильна.

Другой причиной неправильности может быть плохая различительная способность соседних пунктов шкалы высокой дробности. Попробуйте, например, упорядочить свое отношение к 24 занятиям в свободное время так, чтобы уверенно указать не только наилюбимейшее и полностью отвергаемое занятие, но все оставшиеся из предложенного перечня расположить так же аккуратно и уверенно в порядке убывания их привлекательности. Психологически это просто невозможно, так что "срединная" часть этой так называемой ранговой шкалы будет крайне сомнительной, а вся шкала неточной и неправильной. Систематическая ошибка, скорее всего, скажется на том, что социально престижные занятия будут отмечаться как более привлекательные (хотя не исключено, что фактически данные лица ими не интересуются), а социально непрестижные будут попадать в нижние уровни ранжированного ряда.

Во всех подобных случаях опытная проверка шкалы на устойчивость данных обнаружит ошибки. Но часто это показывает уже первая проба.

Правильность и точность измерения можно повысить путем расчета относительной ошибки измерения.

Относительная ошибка позволяет сопоставлять правильность замеров по двум и более шкалам разной чувствительности и таким путем отработать оптимальный инструмент. Напомним, что в отличие от абсолютной относительная ошибка исчисляется не в долях погрешности деления шкалы, а в соизмеримом, определенным образом нормированном показателе.

Приведем пример расчета относительной ошибки измерения. Предположим, что в семичленной шкале оценок фиксируется намерение женщин иметь детей. В обследовании участвуют 100 молодых замужних женщин, которые дали следующие ответы на вопрос: "В какой мере Вы согласны с тем, что было бы желательно иметь ребенка?".

Семичленная шкала на интенсивность мнения имеет вид:

Полюса шкалы интерпретируются, а промежуточные пункты не имеют словесной интерпретации.

При некотором навыке и достаточном исследовательском опыте мы часто интуитивно угадываем, какова должна быть дробность метрики, обеспечивающая устойчивую информацию. Но, приступая к измерению сложных объектов, с которыми ранее не приходилось сталкиваться, социолог должен проделать ряд экспериментов, отрабатывая шкалу на точность и правильность.

Допустим, что по указанной шкале получено следующее распределение ответов 100 опрошенных:

Пункты шкалы: (7) (6) (5) (4) (3) (2) (1)
Частоты ответов (100 чел.)

Оценки 3, 2 и 1 (крайне негативное отношение к суждению) встречаются очень редко, и эту часть шкалы можно признать плохо работающей: в сумме здесь сосредоточено менее 5% всех ответов. Большинство женщин либо явно хотели бы иметь детей, либо не очень в этом уверены, и почти нет таких, кто отвергает идею иметь ребенка. Значит, в нашей шкале работают градации 7, 6, 5 и 4, где "4" фактически наиболее негативная установка. Диапазон работающей части шкалы: 7-4 = 3. Относительная ошибка данной шкалы определяется предложенной Г.И. Саганенко формулой:

Проверив шкалу на устойчивость, как было описано выше, мы, предположим,

получили значение w = 0,75, т.е. 75% полного совпадения ответов в двух последовательных пробах, что определенно недостаточно. При этом

Теперь испробуем на устойчивость пятичленную и трехчленную шкалы, задавая тот же вопрос аналогичной (или той же самой) группе испытуемых в 100 человек. Допустим, что мы получим такие распределения (табл. 4).

Как видно, в пятичленной и трехчленной шкалах работают все градации, так что в негативной зоне оказывается соответственно 25 % и 32 % ответов (сравните с семибалльной шкалой, где в этой зоне менее 50%). Показатели полной устойчивости двух последних шкал, проверенные повторными опросами, допустим, дали соответственно

0,95 и 0,99 (в семибалльной - 0,75).

Но относительные ошибки при условии, что все градации обеих шкал работают, таковы:

округленно 0,24 и 0,49. Получаем, что относительные ошибки семичленной шкалы (0,25) и пятичленной (0,24) практически одинаковы, а трехчленной - существенно выше (0,49).

Какая из трех шкал более надежна? Вопрос решается при сравнении устойчивости шкалы и величины относительной ошибки. Устойчивость данных по пятичленной и трехчленной шкалам сопоставима: 95% и 99%. Иными словами, опрашиваемые хорошо различают градации этих шкал, лучше, чем в семичленной шкале: там устойчивость равна 75%. По этой причине последнюю надо

забраковать. Остается выбор из двух оставшихся. Пятичленная шкала имеет высокую устойчивость и небольшую ошибку, а трехчленная - более высокую устойчивость и приемлемую ошибку (меньше половины градации шкалы). Но в отношении к трем градациям это составит 0,49 / 3 =0,16, а для пятичленной - 0,24 / 5 = 0,05 длины шкалы. Следовательно, пятичленная шкала втрое чувствительнее, а значит, правильнее и точнее.

Суммируем все сказанное о проверке надежности шкал в следующей схеме (схема 6).

 

Билет № 19

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.