Каждая переменная имеет определенные значения, которые в совокупности исчерпывают диапазон возможных изменений. Количество значений переменной практически бесконечно. Переменная «национальность» включает сколь угодно много позиций – национальностей, «возраст» может фиксироваться самыми маленькими интервалами, «удовлетворенность» при желании идентифицируется в терминах «очень удовлетворен», «не очень удовлетворен», «удовлетворен», «скорее удовлетворен, чем неудовлетворен»... Предположим, что, устанавливая значения переменных в системе «мировых координат», мы стремимся к расширению их диапазона, т.е. к увеличению точности измерений. Такая стратегия приводит к экстенсивному пространству переменных, границы которого в принципе не определены.
Пространство признаков напоминает ящик, разделенный на множество ячеек. Каждая ячейка – класс, образованный пересечением значений переменных.
Хотя каждый исследователь стремится к детализации картины мира, он вынужден работать в очень ограниченном пространстве. Спрашивается: каково пространство минимальной размерности? Если значения переменной сводятся к дихотомии, ее диапазон минимизируется. «Да будут слова ваши «да – да», «нет – нет», а что сверх того, то от лукавого», – эта заповедь предписывает сводить переменную «образование» к градациям, предположим, «высшее – не высшее», «национальность» к «русский – не русский», «пол» – к «женщина – не женщина». В конечном счете система координат приобретает вид бинарного пространства переменных – четырехклеточной матрицы.
Четырехклеточные матрицы – наименее точная и наиболее надежная форма представления данных. Существует обширный класс статистик, измеряющих интенсивность связи дихотомических переменных. Немаловажное преимущество дихотомий заключается также в том, что к ним сводятся все типы шкал, применяемых в социологии и психологии. Например, успешность карьеры можно измерить в шкале «очень успешная – успешная / средняя / неуспешная / очень неуспешная». Эта шкала относительно легко переводится в дихотомию «успешная – неуспешная» путем сложения соседних градаций. Необходимость укрупнения возникает, как правило, в тех случаях, когда отдельные классы оказываются недостаточно наполненными. Сведение к дихотомиям решает проблему унификации измерений при использовании многомерных классификаций.
Пространство признаков, образующее для аналитика систему мировых координат, обладает различной размерностью. Мы можем ограничиться в своем взгляде на мир одной переменной, и тогда он превратится в одномерный, линейный мир. Например, в зондажах общественного мнения можно задать респонденту только один вопрос: за кого он собирается голосовать. Никакого иного измерения, кроме этой «электоральной установки», не существует. В данном случае система мировых координат сводится к одной оси, имеющей два значения и более. Однако сбор социологической информации по одной переменной практикуется крайне редко. Исследователя интересуют и другие параметры, позволяющие дифференцировать объекты. Если нужны не просто сведения, а объяснения переменной, пространство признаков становится многомерным.
Как только мы «сформатировали» реальность в двумерной таблице, возникает вопрос: каковы основания судить о том, что первая переменная каким-либо образом связана со второй. Предположим, что первая переменная означает образование, а вторая—доход. Есть люди с высоким образованием и высоким доходом, но немало богатых людей и среди не окончивших среднюю школу. Если мы произведем «обмер» одного-единственного человека и установим у него высокое образование и низкий доход, мы не сможем сказать ничего определенного о взаимосвязи признаков. В данном случае мы имеем дело с сингулярностью (singularis, лат. – отдельный, одиночный). Сингулярности молчат. Одно наблюдение – мало, два наблюдения – тоже мало, мало и трех. Статистический вывод начинает работать тогда, когда единиц исследования достаточно много. «Достаточно много» означает, что при условии равновероятного попадания в каждую клетку пространства признаков наполнение каждой из них составит не менее семи единиц. Тогда единицы начнут образовывать конфигурации в нашем идеальном пространстве признаков и смогут сказать кое-что, к примеру, о взаимосвязи образования и дохода.
Здесь возникает эффект эпистемической инверсии – уже не единица исследования характеризуется определенным признаком, а сам признак характеризуется частотой – количеством единиц, которым присущ данный признак. Сотни и тысячи респондентов сообщают о себе самые различные сведения, и ни один из этих людей не интересует социолога. Социолога интересует, во-первых, сколько людей подпадает под значение переменной, т.е. наполнение класса, во-вторых, каково распределение частот по всему континууму переменной, в-третьих, как меняется распределение при введении в группировку второго, третьего и энного признаков, и, в-четвертых, имеется ли связь между признаками и насколько она меняется в различных контекстах.
Если иметь в виду только формальную структуру социологической теории, избавленную от содержательных концептуализаций, можно сказать, что в ней нет ничего, кроме пространства переменных и единиц, размещаемых в пространстве в соответствии со значениями переменных. Модификации этой «кристаллической решетки» теории определяются количеством переменных и количеством единиц исследования. Соответственно устанавливаются типы пространства переменных.
Тип 1. Много единиц – мало переменных. Крупномасштабные обследования, включающие десятки тысяч исследовательских единиц, требуют огромных затрат. В переписях населения и референдумах производится сплошной опрос, и учетчики посещают практически каждую семью. Несомненно, при таком охвате статистики стремятся получить как можно больше сведений.
Тип 2. Мало единиц – много переменных. Когда в фокусе внимания исследователя находится мало единиц, появляется возможность подробно изучить каждую из них. Подобная стратегия относится к «качественной» и ориентирована на описание случая (casestudy)[6] .
Вполне возможна ситуация, когда осуществляется обследование одного или нескольких объектов в рамках хорошо разработанной теории и валидизированной системы переменных. В этом случае исследование называется монографическим. Его цель – не получение нового научного обобщения, а выставление диагноза обследуемому объекту.
Тип 3 – промежуточный: достаточное количество единиц – достаточное количество переменных. В нормальном социологическом исследовании переменных должно быть столько, сколько по силам обработать персоналу лаборатории. Массив же должен быть достаточным для проверки гипотезы максимальной размерности.
Переменные представляют собой различного вида «линейки», которые «прикладываются» к объектам. В этих линейках – различное число градаций, расстояния между градациями могут быть равными, неравными и вообще неизвестными. Кроме того, сами «линейки» могут претерпевать изменения под влиянием внешних обстоятельств. Коротко говоря, средства измерения могут быть хорошими и плохими. Все это создает в совокупности проблему качества социологического инструментария. Инструмент должен отвечать требованиям релевантности, валидности, надежности, точности и устойчивости.
Релевантность – это обоснование применимости измерителя к измеряемому признаку. Проблема релевантности связана с тем обстоятельством, что «наблюдаемая реальность», если таковая вообще существует, представляет или скрывает некую «подлинную» реальность, соответствующую своему понятию. Ошибки релевантности возникают до процедуры измерения, и, даже если инструмент обладает высокой степенью совершенства, он может быть нерелевантен для определенного признака.
Когда инструмент создан, возникает вопрос о возможном отклонении результата измерения от истинного значения. Надежность – это вероятность отклонения приписываемого объекту значения от истинной его характеристики. Надежность является интегральной характеристикой инструмента, включающей правильность, точность и устойчивость и валидность.
Как оценивается уровень надежности? Ведь вариация истинных и ошибочных замеров на самом деле неизвестна. Для решения этой задачи используются три техники косвенного оценивания: «тест-ретест», параллельные измерения и деление шкалы.
«Тест-ретест» показывает вероятность возникновения различных результатов при двух замерах одного и того же объекта одинаковым инструментом, но не дает никаких сведений об источнике ошибки. В частности, при повторном интервьюировании очень велика вероятность влияния первого замера на второй и последующие. Нормы морали предписывают держать свое слово, и те, у кого семь пятниц на неделе, не одобряются. Поэтому респондент склонен давать сходный ответ, если он запомнил его при первом опросе. В итоге оценка надежности инструмента будет явно завышена. На самом деле социологические признаки (особенно мнения и оценки) меняются. Если изменения будут зафиксированы, «тест-ретест» в данном случае покажет заниженную надежность.
Параллельные измерения избавлены от погрешностей, присущих «тест-ретесту». Измерительный инструмент применяется в двух формах одновременно. Например, для измерения установки можно использовать два разных тест-вопросника. Если полученные два ряда коррелируют, инструмент принимается. В данном случае остается неясным, какая форма основная, а какая параллельная. Выбор обычно осуществляется на основе произвольных критериев. Кроме того, разработка параллельных инструментов – дело довольно трудоемкое и, как правило, не оправдывает себя.
Деление шкалы заключаетсяв интерпретации двух частей континуума и более как отдельных шкал. Предположим, измерительным инструментом является совокупность вопросов. Она делится на две группы, например, на вопросы с четной и нечетной нумерацией. По каждой группе подсчитываются средние значения переменной. Затем вычисляется коэффициент корреляции – мера надежности шкалы.
Отклонение результата измерения от истинного значения признака может быть обусловлено систематической ошибкой. В данном случае речь идет о правильности. Инструмент создает систематическую ошибку, например, в тех случаях, когда шкалы несбалансированы, респонденты неверно понимают вопросы, сказывается влияние интервьюера и т.п. Смещения шкалы, как правило, возникают при ранжировании объектов по списку. Позиции, стоящие в начале списка, обычно отмечаются чаще, чем последние. Такой инструмент является неправильным. Правильным будет предъявлять респондентам карточки с наименованием объектов оценивания, не забывая их перемешивать.
Точность измерения – это количество градаций переменной, которое может быть изменено в зависимости от задач исследования. Возраст принято исчислять годами, но для младших дошкольников разница в несколько месяцев не менее важна, чем разница в несколько лет для взрослых. Расстояние от дома до работы может быть подсчитано с точностью до ста метров, однако такая точность вряд ли понадобится. Чем больше градаций, тем более точные данные получает исследователь. При этом вероятность отклонения результатов от истинных значений признака возрастает – надежность снижается.
Количество делений шкалы – результат разумного компромисса между стремлением к точности и требованиями надежности. Более точный инструмент, как правило, больше подвержен всякого рода неприятностям. Но надежность грубого инструмента не компенсирует грубости результатов. Как правило, при многократном повторении замеров и при отсутствии систематической ошибки их средняя приближается к истинному значению признака.
Устойчивость – это воспроизводимость результатов при многократных замерах. Дело в том, что меняться может не только характеристика объекта, но и сам измерительный инструмент. Он может быть точным и правильным, но неустойчивым. В отличие от правильности устойчивость нарушается по причине случайных ошибок. Устойчивость обратно пропорциональна точности. Чем чувствительнее инструмент, тем больше вариация получаемых данных. В технике устойчивость измерительного прибора в большинстве случаев можно уверенно контролировать. В социологии же, особенно при измерении установок, вторичный замер соотносится уже не со «старым» признаком, а с тем, к которому уже было применено воздействие инструмента.
Валидность инструмента связана с отношением между измерительным инструментом и результатами измерения. Предполагается, что если инструмент валидный, то существуют определенные эмпирические отношения между результатами его применения и другими свойствами или переменными. Эти отношения лежат в основе предикативной валидности – корреляции между результатами измерения и внешними критериями.
Наиболее распространенный критерий валидности связан с методом «известной группы». Предположим, надо оценить валидность тест-вопросника для измерения политического консерватизма. В качестве внешнего критерия можно избрать социально-экономический статус. Мотивы такого выбора обусловлены теоретическим выводом, что консервативные установки более представлены в среднем классе, чем в среди бедных.
Если же обнаружится, что в среднем и низшем классах примерно одинаковое количество консервативно настроенных, предикативная валидность инструмента становится сомнительной. Высокая корреляция между социально-экономическим статусом и консервативной установкой, измеренной определенным образом, не валидизирует инструмент, а только не отвергает его. Это связано с тем, что независимый критерий может не иметь никакого отношения к консерватизму.
Конструктная валидность связывает измерительный инструмент со структурой теории. Она основывается на следующем рассуждении. Во-первых, предполагается, что инструмент измеряет определенное свойство; во-вторых, это предположение интерпретируется в терминах теории; в-третьих, устанавливается круг свойств, связанных или не связанных с инструментом; в-четвертых, предполагаемые отношения подтверждаются либо не подтверждаются эмпирическими данными, Если предсказание подтверждается, то инструмент считается валидным. В случае неподтверждения допустимы три версии: 1) инструмент не измеряет предполагаемое свойство; 2) ошибочна теоретическая модель, лежащая в основе предсказания; 3) неверно измерены критерии проверки предсказания.
Социологический опрос проводится методом интервьюирования на основе нижеприведенного бланка опроса.
Г.С. БАТЫГИН
ЛЕКЦИИ ПО МЕТОДОЛОГИИ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ М:, Аспект Пресс, 1995 г.
[1] Чесноков С.В. Детерминационый анализ социологических данных в режиме диалога: Препринт / Всесоюзный научно-исследовательский институт системных исследований. М.: ВНИИСИ, 1980. С. 45.
[2] Чесноков С.В. Основы гуманитарных измерений: Препринт / Всесоюзный научно-исследовательский институт системных исследований. М.: ВНИИСИ, 1985. С. 5, 17.
[3] Саганенко Г.И. Социологическая информация: статистическая оценка надежности исходных данных социологического исследования. Л.: Наука, 1979. С. 14.
[4] Клигер С.А., Косолапов М.С., Толстова Ю.Н. Шкалирование при сборе и анализе социологической информации, М,: Наука, 1977. С. 20.
[5] Там же. С. 22.
[6] Platt J. Cases... of cases of cases // What is a case: Exploring the foundations of social inquiry / Ed. by Ch. Ragin, H. Becker. Cambridge: Cambridge University Press, 1992.
10-09-2015, 15:41