3. Исключаются также суждения, содержащие слова «все», «всегда», «никто», «никогда», так как этим словам люди обычно придают различный смысл, что затрудняет интерпретацию.
В результате исходный список из 350—400 суждений сокращается до 100—120. Следующим этапом является «судейская» процедура, позволяющая определить шкальное значение для каждого суждения и провести среди них окончательный отбор. Терстоун предложил разделить гипотетический континуум благожелательного-неблагожелательного отношения к церкви на 11 категорий (от «А» до «К»), разделенных субъективно равными интервалами. Требование субъективного равенства интервалов между градациями весьма существенно для построения шкалы Терстоуна и обычно его специально подчеркивают в инструкции для «судей» (например, «Представьте, что карточки с буквами от „А" до “К" представляют расположенные на равном расстоянии градации шкалы, так что градации „А" соответствует максимально благожелательное отношение к Х (объекту установки), а „К" — максимально неблагожелательное, негативное отношение»). Каждое из утверждений списка печатается на отдельной карточке, которые и раздаются «судьям» (в конструировании шкалы установок по отношению к церкви участвовало 300 таких экспертов). Задача «судей» заключается в том, чтобы разложить все 100—120 суждений по 11 рубрикам соответственно степени выраженного в них благожелательного или неблагожелательного отношения к объекту остановки.
Подчеркнем, что «судей» не просят высказать их собственное мнение, они должны лишь рассортировать высказывания.
Шкальное значение (балл) каждого из высказываний определяется распределением оценок «судей», поэтому началом следующего этапа (собственно построения шкалы) является подсчет процента экспертов, положивших высказывание в определенную стопку. Далее подсчитывается суммарный (кумулятивный) процент «судей», отнесших суждение к данной градации и предшествующим градациям. Терстоун присваивал использовавшимся градациям числовые значения от 1 (градация «А», максимально благожелательное отношение к церкви) до 11 (градация «К»). Проиллюстрируем дальнейшее на примере гипотетического суждения N, данные для которого представлены в таблице 1.
Таблица.1
Распределение «судейских» оценок для суждения N
Градация (числовое значение) | «А» (1) | «В» (2) | «С» (3) | «D» (4) | «Е» (5) | «F» (6) | «G» (7) | «Н» (8) | «I» (9) | «J» (10) | «K» (11) |
Процент судей, отнесших суждение к данной градации | 1 | 2 | 2 | 1 | 3 | 33 | 34 | 12 | 7 | 3 | 2 |
Кумулятивный процент | 1 | 3 | 5 | 6 | 9 | 42 | 76 | 88 | 95 | 98 | 100 |
Распределение кумулятивных (накопленных) процентов позволяет вычислить значения медианы и междуквартильного размаха. Медиана, или процентиль 50 в распределении накопленных частот, — это такое значение на шкале «А» — «К», относительно которого половина судей дала большие, а другая половина — меньшие оценки данного утверждения. Медиана, таким образом, делит пополам упорядоченное множество значений признака. Вычислить медиану мы можем по следующей формуле:
В методе Терстоуна ширина интервала между соседними численными градациями по определению равна 1 (равнокажущиеся интервалы). В используемом нами примере границами интервала, где расположена медиана (процентиль 50), являются градации «F» и «G» (см. табл. 1). Фактической нижней границей интервала медианы будет значение 6,5, отсюда:
Значение медианы и принимается за шкальный балл («цену») суждения. Для гипотетического суждения N в нашем примере он оказался равен 6,7. (В принципе более простым является графический метод нахождения медианы. Для этогона миллиметровой бумаге строится кривая накопленных процентов — огива, позволяющая легко найти числовое значение, соответствующее процентилю 50.)
Ясно, однако, что не все суждения, получившие оценку «судей», в равной мере пригодны для шкалы: некоторые из суждений получат весьма согласованные и единодушные оценки экспертов, тогда как другие вызовут разнобой во мнениях. Для оценки внутренней согласованности отдельных высказываний шкалы Терстоун применил меру разброса судейских оценок — междуквартильный размах. (Здесь снова вместо распределения абсолютных частот экспертных оценок используется распределение процентилей, т. е. накопленные частоты выражают в кумулятивных процентах, что позволяет сравнивать выборки разного объема.) Междуквартильный размах — это расстояние между первым и третьим квартилем распределения. Первый квартиль (Q1 ) задается точкой на оси, до которой лежит 25% полученных оценок суждения, а третий ((Q3 ) — точкой, выше которой лежит 25% оценок. (Легко видеть, что второму квартилю соответствует медиана.) Для вычисления междуквартильного размаха (Q3 ¾ Q1 ) сначала устанавливаются значения, соответствующие первому и третьему квартилям распределения. Для этого используются формулы, аналогичные формуле для медианы, с соответствующими поправками: берется фактическая нижняя граница интервала соответствующего квартиля, кумулятивный процент для нижней границы интервала данного квартиля и т. д. Так, для первого квартиля формула подсчета такова:
Для нашего примера с суждением N:
Читатель может самостоятельно выписать аналогичную формулу для третьего квартиля (75 процентиль), произвести необходимые подсчеты и убедиться, что для вымышленного суждения N междуквартильный размах (Q3 ¾ Q1 ) составит 1,7. Те суждения, для которых разброс оценок, измеренный через междуквартильный размах, оказывается слишком велик, исключаются из шкалы Терстоуна. Предполагается, что высказывание, получившее столь разные оценки, воспринимается слишком неоднозначно. Так, Терстоун исключил из первоначально предъявленного «судьям» списка 90 высказываний из 130. В результирующей шкале оставляют одно-два высказывания для каждого деления шкалы, чтобы все градации предполагаемого установочного континуума оказались в равной мере представлены.
Если получившуюся шкалу предъявить теперь группе респондентов, то индивидуальным баллом каждого субъекта, выражающим меру «благожелательность» его установки, можно считать медиану (или средний балл) всех суждений, с которыми он согласился.
Многие критики шкалы Терстоуна указывали на возможность влияния на получаемые результаты характеристик «судейской» группы и широты диапазона предлагаемых суждений. Все же существуют веские основания считать, что такая шкала обладает вполне удовлетворительной воспроизводимостью и в среднем диапазоне дает уровень измерения, превосходящий ординальный (является так называемой шкалой разностей). Удаление или прибавление пункта шкалы не меняет шкальных значений других пунктов-высказываний. Приведем некоторые примеры высказываний, включенных Терстоуном в окончательный вариант шкалы установок по отношению к церкви (в скобках указан шкальный балл суждения):
· «Я думаю, что церковь – это наиважнейший социальный институт в современной Америке» (0,2);
· «Когда я нахожусь в храме, мне доставляет удовольствие наблюдать за службой, особенно если при этом звучит хорошая музыка» (4,0);
· «Я ощущаю потребность в какой-то религии, но не нахожу того, что мне нужно, ни в одной из существующих церквей» (6,1);
· «С моей точки зрения, церковь безнадежно устарела» (9,1).
В основе шкалы Гутмана также лежит идея кумулятивности: одни высказвания-пункты имеют большую «нагрузку» на одномерном континууме шкалируемой переменно-признака, другие – меньшую. Модель шкалирования, предложенная Гутманом, подразумевает, что в идеальном случае респондент, согласившийся с более «нагруженным» пунктом, согласится и со всеми менее «нагруженными». Таким образом, знание максимального шкального балла респондента позволяет полностью воссоздать паттерн его ответов. Шкалируемая переменная-признак не обязательно является установкой, она может характеризовать поведение: одна из первых гутмановских шкал, например, содержала пункты, описывающиен симптомы реактивного невроза, расстройства сна, тошнота, страх и т.п. В предложенной Гутманом процедуре обычно используется совокупность дихотомических вопросов, т.е. вопросов, на которые могут быть даны лишь два ответа: “да” или “нет”, “согласен” или “не согласен”. Совокупность вопросов или утверждений, составляющих гутмановскую шкалу, должна обладать одним существенным свойством: вероятность положительного ответа монотонно возрастает с ростом значения шкалируемой (латентной) переменной. Отсюда следует, что субъекты, имеющие больший шкальный балл, т.е. большее значение латентной переменной, с большей вероятностью дают положительный ответ на каждый отдельный вопрос. Это условие легко проиллюстрировать на примере следующих вопросов о росте (для простоты изложения предположим, что ошибка измерения отсутствует, т.е. все респонденты знают и точно сообщают свой истинный рост):
1.Верно ли, что Ваш рост превышает 1,50 м?
2.Верно ли, что Ваш рост превышает 1,60 м?
3.Верно ли, что Ваш рост превышает 1,70 м?
Эти вопросы образуют идеальную гутмановскую шкалу: если ошибка измерения отсутствует, любой респондент, ответивший положительно на вопрос 3, дает положительный ответ и на вопросы 2 и 1. Вообще, зная максимальный балл респондента, мы можем полностью воссоздать его паттерн ответов. Для вопросов о росте все возможные паттерны ответов (шкальные типы) приведены в табл. 2.
Таблица 2
Ответы на вопросы о росте для четырех гипотетических респондентов
Вопрос, № п/п Респондент |
1 | 2 | 3 |
А | + | + | + |
Б | + | + | ¾ |
В | + | ¾ | ¾ |
Г | ¾ | ¾ | ¾ |
Если респондентов и вопросы расположить на одной шкале латентной переменной (в данном случае, «роста»), то станет очевидным, что респонденты реагируют на вопросы в зависимости от своего ранга (положения) на этой же шкале: респондент данного роста, позитивно прореагировавший на некий вопрос-пункт, будет также позитивно реагировать на все пункты, имеющие более низкий ранг (в нашем примере, на все более «низкорослые» вопросы-пункты). Скажем, для примера с ростом совместное упорядочение вопросов и респондентов на гутмановской шкале могло бы выглядеть, как на рисунке 2.
|
|
|
|||||||||
Низкий рост Высокий рост
Рис. 2. Шкала Гутмана для трех вопросов о росте и четырех респондентов
Легко видеть, что в нашем примере самыми «популярными» (имеющими наибольшую частоту положительных ответов) будут менее «нагруженные» по шкалируемой переменной вопросы. С другой стороны, большее число положительных ответов будет у тех респондентов, для которых значение шкалируемой переменной выше.
Для того чтобы определить, является ли данная совокупность вопросов шкалируемой, т.е. дает ли она хорошее приближение к идеальной модели шкалирования по Гутману, нужно, во-первых, убедиться, что вопросы по своему смыслу могут соответствовать вышеописанному условию монотонного возрастания вероятности положительного ответа. Так, например, рассмотренные выше вопросы шкалы социальной дистанции Богардуса теоретически могут составить гутмановскую шкалу. Однако так называемые точечные вопросы ¾ например: «Верно ли, что Ваш рост равен 1,65 м?» ¾ наверняка не могут быть использованы в рамках рассматриваемой шкальной модели. Дальнейшая процедура построения гутмановской шкалы заключается в проверке соответствия реальных данных модели совершенной шкалы Гутмана и ее лучше рассмотреть на конкретном примере.
Допустим, некий социолог пытается измерить переменную «благопристойность», которую он почему-то связывает со стремлением следовать нормативным предписаниям, регулирующим публичное (т. е. безличное) социальное общение. Среди использованных им вопросов есть три следующих:
1. Вы обычно стучите в дверь кабинета или комнаты, прежде чем войти (верно, неверно).
2. В публичных обсуждениях или дискуссиях Вы высказываете свое мнение лишь тогда, когда Вас прямо об этом попросят (верно, неверно).
3. Вы предпочтете промолчать, если Вам покажется, что Ваше справедливое и существенное замечание может вызвать раздражение у окружающих (верно, неверно).
Конечно, можно предположить, что некоторые из изобретенных исследователем вопросов отражают скорее «социальную тревожность» или «конформизм», но в данном случае мы будем руководствоваться тем, что идеальных индикаторов не бывает: бывают индикаторы, дающие лучшее или худшее приближение к идеальной шкале для реальных данных.
Итак, социологу предстоит проверить, насколько полученное им эмпирическое распределение ответов соответствует тем теоретически возможным паттернам ответов на три вопроса, которые в таблице 6.2 образуют безупречный «параллелограмм», характерный для идеальной гутмановской шкалы. Для случая трех вопросов возможны четыре «правильных» паттерна ответов, обозначаемых обычно как школьные типы ответов:
социологический индекс шкала
1. + + +
2. + + ¾
3. + ¾¾
4. ¾ — —
Предположим, что наш социолог получил следующую картину распределения шкальных типов (см. табл. 3).
Таблица 3
Распределение ответов для шкальных типов
Вопросы Ответы |
Вопрос 1 («стук в дверь») | Вопрос 2 («публичная дискуссия») | Вопрос 3 («опасение вызвать раздражение») | Число случаев, N |
Паттерн ответа («+» — «верно», «—» — «неверно»): |
+ | + | + | 30 |
+ | + | — | 50 | |
+ | — | — | 45 | |
— | — | — | 10 | |
Всего 135 |
Судя по таблице 6.3, априорное упорядочение вопросов совпало с реальным: самый «легкий» первый вопрос оказался и самым популярным, тогда как на самый «тяжелый» вопрос шкалы положительно ответили лишь 30 опрошенных: нежелание высказывать свою точку зрения требует значительно большего количества «благопристойности», чем привычка стучать в дверь.
Если бы использованный нами исходный порядок вопросов не совпал бы с их реальным ранжированием по числу позитивных ответов, то это само по себе не доказывало бы «нешкалируемости» данной совокупности пунктов: для того, чтобы получить столь же красивую «гутмановскую» картину распределения ответов, как в предыдущей таблице 6.2, было бы достаточно просто переставить столбцы таблицы так, чтобы первым оказался самый популярный вопрос с наибольшим числом положительных ответов и т. д. (Упорядоченную таким образом таблицу обычно называют шкалограммной матрицей, или шкалограммой.)
Реальной проблемой в нашем примере, как и в большинстве случаев построения гутмановской шкалы, стало наличие так называемых нешкальных типов, т. е. таких паттернов ответа, которые попросту не укладываются в логику одномерной модели с монотонно возрастающей вероятностью ответа. Примером «нешкального» паттерна мог бы быть положительный ответ на третий вопрос при отрицательных ответах на первые два вопроса (— — +). То обстоятельство, что некий респондент, бесцеремонно входящий в чужую дверь без стука, боится открыто выразить свое мнение, может быть и случайной ошибкой, и результатом влияния какой-то посторонней переменной: возможно, отвечая на третий вопрос, этот человек думал не о хороших манерах, а о том, что высказывать свое мнение открыто в его привычной среде «невыгодно», недальновидно и т. п. Для того чтобы проверить шкальную гипотезу о том, что данная совокупность вопросов дает хорошее приближение к гутмановской шкале, нам следует трактовать «нешкальные» типы ответа как ошибки и оценить, насколько велико отклонение от идеальной модели. Пусть наш исследователь получил следующее распределение «нешкальных» типов (см. табл. 4).
Разумно предположить, что «нешкальный» тип — — + можно отнести к шкальному типу — — — с одной ошибкой. Второй «нешкальный» паттерн ответа — + + можно рассматривать как отклонение от школьного типа + + + также с одной ошибкой (если бы мы отнесли этот «нешкальный» паттерн к типу — — —, то ошибок было бы две, а не одна). Существуют разные способы оценки приемлемости наблюдаемых отклонений от совершенной шкалы, содержащей лишь шкальные паттерны ответа. Здесь мы воспользуемся самым простым и грубым, рассчитав коэффициент воспроизводимости шкалы Rep (от англ. reproducibility) по следующей формуле:
В нашем примере мы, основываясь на идеальной модели шкалы, можем воспроизвести (предсказать) по три ответа для 143 респондентов. Всего мы сделаем 429 предсказаний для отдельных ответов. Из них 8 ответов окажутся ошибочными (каждая ошибка будет отличаться от ожидаемого ответа только на 1 балл). Коэффициент воспроизводимости составит, таким образом, 0,98 (или 98%).
Таблица 4
Распределение ответов для «нешкальных» типов
Вопросы Ответы |
Вопрос 1 («стук в дверь») |
Вопрос 2 («публичная дискуссия») |
Вопрос 3 («опасение вызвать раздражение») |
Число случаев |
Паттерн ответа: |
— | — | + | 3 |
— | + | — | 5 | |
Всего 8 |
На практике принято считать приемлемым любое значение коэффициента воспроизводимости, которое превышает 0,90 (90%). Очевидно, что 100%-й воспроизводимостью может обладать лишь совершенная гутмановская шкала.
Если полученное значение коэффициента воспроизводимости превосходит заданный порог, данная совокупность вопросов может использоваться в качестве шкалы Гутмана. При этом вопросам присваиваются шкальные значения, отражающие их ранжирование по шкале (скажем, 1, 2 и 3), так что самый «легкий» вопрос получает самый низкий балл. Респонденты получают индивидуальный балл, соответствующий их шкальным типам (число положительных ответов либо суммарный балл).
Следует помнить о том, что полученная шкала отражает наличие определенной упорядоченности в той матрице реальных данных, для которых проверялась гутмановская модель. Иными словами, вывод о том, что данная совокупность вопросов составляет шкалу Гутмана, верен для данной выборки и для данной серии наблюдений. Перенос шкалы с одной популяции на другую требует новых данных и нового обоснования.
Мы рассмотрели лишь некоторые, относительно простые, методы конструирования индексов и шкал в социологии. Проанализированные нами примеры подтверждают полезность шкал для повышения качества социологического измерения (т. е. его надежности и валидности) и для экономного представления эмпирической информации, получаемой в ходе исследования. Наконец, анализ моделей измерения, лежащих в основании любой шкалы, часто помогает прояснить природу теоретических понятий и взаимосвязей между ними. Еще одним шагом к содержательным и основанным на реальных эмпирических наблюдениях выводам является анализ данных.
Библиографический список
1. Аванесов В.С. Тесты в социологическом исследовании. М.: Наука, 2010.
2. Грин Б.Ф. Измерение установки // Математические методы в современной буржуазной социологии. М.: Прогресс, 2009.
3. Девятко И.Ф. Диагностическая процедура в социологии: очерк истории и теории. М.: Наука, 2008.
4. Клигер С.А., Косолапов М.С., Толстова Ю.Н. Шкалирование при сборе и анализе социологической информации. М.: Наука, 2009.
5. Осипов Г.В., Андреев Э.П. Методы измерения в социологии. М.: Наука, 2010.
6. Толстова Ю.Н. Логика математического анализа социологических данных. М.: Наука, 2009.
7. Ядов В.А. Социологическое исследование: методология, программа, методы. 2-е изд. М.: Наука, 2010. Гл. 3.
10-09-2015, 15:28