Нормы и интерпретация результатов теста

Глава XIV

ПРОСТЕЙШИЕ МЕТОДЫ

СТАТИСТИЧЕСКОЙ ОБРАБОТКИ МАТЕРИАЛОВ ПСИХОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ

Статистические методы применяются при обработке материалов психологических исследований для того, чтобы извлечь из тех ко­личественных данных, которые получены в экспериментах, при оп­росе и наблюдениях, возможно больше полезной информации. В ча­стности, в обработке данных, получаемых при испытаниях по пси­хологической диагностике, это будет информация об индивидуаль­но-психологических особенностях испытуемых. Вообще психологи­ческие исследования обычно строятся с опорой на количественные данные. Вот пример.

К школьному психологу обратился шестиклассник Саня Ю. с прось­бой испытать его двигательный темп. Саню очень интересовал бас­кетбол, и он собирался вступить в баскетбольную команду, а бас­кетболист, несомненно, должен иметь высокий двигательный темп. Психолог разработал план небольшого исследования. Он начал с того, что попросил Саню так быстро, как он только может, ставить точки в центре кружков, нарисованных на листке бумаги. За одну минуту Саня поставил 137 точек. Насколько этот темп характерен для Сани? Чтобы установить это, психолог попросил Саню повто­рить эту пробу 25 раз. Действительно, некоторые результаты пре­вышали первоначально полученное число, но некоторые оказались и поменьше. Психолог просуммировал все полученные за 25 проб ре­зультаты, а сумму разделил на 25 — таким путем он получил сред­нее арифметическое по всем пробам. Это среднее арифметическое составило 141. Таков по этой пробе максимальный темп Сани. Можно ли считать этот темп высоким? Потребовался еще один шаг в исследовании. Психолог сформировал группу из 50 шестиклассни­ков, не отличающихся ни от Сани, ни друг от друга по возрасту бо­лее чем на полгода. С этими ребятами психолог также провел сна­чала по несколько тренировочных проб, чтобы получить надежные данные об их темпе, и, наконец, последнюю пробу, для обработки.

Все эти экспериментальные данные в виде средних арифметиче­ских были построены в один порядковый ряд, который был разбит по десяткам (по децилям). Санины данные вышли в десятку с наи­более быстрыми результатами. По этим количественным данным психолог сделал вывод о том, что Саня обладает сравнительно вы­соким двигательным темпом, о чем и было ему сообщено.

Современная математическая статистика представляет собой большую и сложную систему знаний. Нельзя рассчитывать на то, что каждый психолог, сделавший диагностику своей специально­стью, овладеет этими знаниями. Между тем статистика нужна пси­хологу постоянно в его повседневной работе. Специалисты-статис­тики разработали целый комплекс простых методов, которые со­вершенно доступны любому человеку, не забывшему то, что он вы­учил еще в средней школе.

В зависимости от требований, которые предъявляют к статистике различные области науки и практики, создаются пособия по геоло­гической, медицинской, биологической, психологической статисти­ке. (См., например: Суходольский Г.В. Основы математической ста­тистики для психологов. Л., 1972). В этой главе даются простейшие методы статистики для психологов. Все необходимые для их приме­нения вычисления можно выполнять на ручном компьютере, а то и на простых счетах. Уместное, грамотное применение этих методов позволит практику и исследователю, проведя начальную обработку, получить общую картину того, что дают количественные результаты его исследований, оперативно проконтролировать ход исследований. В дальнейшем, если возникнет такая необходимость, материалы ис­следований могут быть переданы для более глубокой разработки специалисту-статистику на большой компьютер.

Статистические шкалы. Применение тех или других статисти­ческих методов определяется тем, к какой статистической шкале относится полученный материал. С. Стивене предложил различать четыре статистические шкалы: шкалу наименований (или номина­тивную), шкалу порядка, шкалу интервалов и шкалу отношений.

Зная типические особенности каждой шкалы, нетрудно устано­вить, к какой из шкал следует отнести подлежащий статистической обработке материал.

Шкала наименований. К этой шкале относятся материалы, в которых изучаемые объекты отличаются друг от друга по их каче­ству. При обработке таких материалов нет никакой нужды в том, чтобы располагать эти объекты в каком-то порядке, исходя из их характеристик. В принципе объекты можно располагать в любой последовательности. Вот пример: изучается состав международной научной конференции. Среди участников есть французы, англичане, датчане, немцы и русские (рис. 1). Имеет ли значение порядок, в котором будут расположены участники при изучении состава кон­ференции? Можно распо­ложить их по алфавиту, это удобно, но ясно, что ника­кого принципиального зна­чения в этом расположении нет. При переводе этих ма­териалов на другой язык (а значит, и на другой алфа­вит) этот порядок будет нарушен. Можно располо­жить национальные группы по числу участников. Но при сравнении этого материала с материалом другой конференции найдем, что вряд ли этот порядок окажется таким же. Отнесенные к шкале на­именований объекты можно размещать в любой последовательности в зависимости от цели исследования.

При статистической обработке такого рода материалов нужно считаться с тем, каким числом единиц представлен каждый объект. Имеются весьма эффективные статистические методы, позволяю­щие по этим числовым данным прийти к научно значимым выводам (например, метод хи-квадрат).

Шкала порядка. Если в шкале наименований порядок следова­ния изучаемых объектов практически не играет никакой роли, то в шкале порядка — это видно из ее названия — именно на эту по­следовательность переключается все внимание. К этой шкале в ста­тистике относят такие исследовательские материалы, в которых рассмотрению подлежат объекты, принадлежащие к одному или не­скольким классам, но отличающиеся при сравнении одного с другим: больше—меньше, выше—ниже и т.п.

Проще всего показать типические особенности шкалы порядка, если обратиться к публикуемым итогам любых спортивных соревно­ваний. В этих итогах последовательно перечисляются участники, занявшие соответственно первое, второе, третье и прочие по поряд­ку места. Но в информации об итогах соревнований нередко отсут­ствуют или отходят на второй план сведения о фактических дости­жениях спортсменов, а на первый план ставятся их порядковые места. Допустим, шахматист Д. занял в соревнованиях первое ме­сто. Каковы же его достижения? Оказывается, он набрал 12 очков. Шахматист Е. занял второе место. Его достижение — 10 очков.

Третье место занял Ж. с 8 очками, четвертое — З. с 6 очками и т.д. В сообщениях о соревновании разница в достижениях при разме­щении шахматистов отходит на второй план, а на первом остаются их порядковые места. В том, что именно порядковому месту отво­дится главное значение, есть свой смысл. В самом деле, в нашем примере 3. набрал 6, а Д. — 12 очков. Это абсолютные их дости­жения — выигранные ими партии. Если попытаться истолковать эту разницу в достижениях чисто арифметически, то пришлось бы признать, что 3. играет вдвое хуже, чем Д. Но с этим нельзя согла­ситься. Обстоятельства соревнований не всегда просты, как не все­гда просто и то, как провел их тот или другой участник. Поэтому, воздерживаясь от арифметической абсолютизации, ограничиваются тем, что устанавливают: шахматист 3. отстает от занявшего первое место Д. на три порядковых места.

Заметим, что в других соревнованиях расклад абсолютных дос­тижений может быть иным: занявший первое место может всего на пол-очка опережать ближайших участников. Важно, что он набрал наибольшее количество очков. Только от этого зависит его порядко­вое место.

Шкала интервалов. К ней относятся такие материалы, в которых дана количественная оценка изучаемого объекта в фиксированных еди­ницах. Вернемся к опытам, которые провел психолог с Саней. В опытах учитывалось, сколько точек может поставить, работая с максимально доступной ему скоростью, сам Саня и каждый из его сверстников. Оценочными единицами в опытах служило число точек. Подсчитав их, исследователь получил то абсолютное число точек, которое оказалось возможным поставить за отведенное время каждому участнику опытов. Главная трудность при отнесении материалов к шкале интервалов со­стоит в том, что нужно располагать такой единицей, которая была бы при всех повторных измерениях тождественной самой себе, т.е. одина­ковой и неизменной. В примере с шахматистами (шкала порядка) такой единицы вообще не существует.

В самом деле, учитывается число партий, выигранных каждым участником соревнований. Но ясно, что партии далеко не одинако­вы. Возможно, что участник соревнований, занявший четвертое ме­сто — он выиграл шесть партий, — выиграл труднейшую партию у самого лидера! Но в окончательных итогах как бы принимается, что все выигранные партии одинаковы. В действительности же этого нет. Поэтому при работе с подобными материалами уместно их оценивать в соответствии с требованиями шкалы порядка, а не шкалы интервалов. Материалы, соответствующие шкале интерва­лов, должны иметь единицу измерения.

Шкала отношений. К этой шкале относятся материалы, в ко­торых учитываются не только число фиксированных единиц, как в шкале интервалов, но и отношения полученных суммарных итогов между собой. Чтобы работать с такими отношениями, нужно иметь некую абсолютную точку, от которой и ведется отсчет. При изуче­нии психологических объектов эта шкала практически неприменима.

О параметрических и непараметрических методах стати­стики. Приступая к статистической обработке своих исследований, психолог должен решить, какие методы ему более подходят по осо­бенностям его материала — параметрические или непараметриче­ские. Различие между ними легко понять. Вспомним, что говори­лось об измерении двигательной скорости шестиклассников. Как обработать эти данные? Нужно записать все произведенные изме­рения — в данном случае это будет число точек, поставленных ка­ждым испытуемым, — затем требуется вычислить для каждого ис­пытуемого среднее арифметическое по результатам опытов. Далее следует расположить все эти данные в их последовательности, на­пример, начиная с наименьших к наибольшим. Для облегчения обо­зримости этих данных их обычно объединяют в группы; в этом слу­чае можно объединить по 5—9 измерений в группе. Вообще же при таком объединении желательно, если общее число случаев не более ста, чтобы общее число групп было порядка двенадцати. Получи­лась такая таблица (с. 249).

Далее нужно установить, сколько раз в опытах встретились чи­словые значения, соответствующие каждой группе. Сделав это, нужно для каждой группы записать ее численность. Полученные в такой таблице данные носят название распределения численностей. Рекомендуется представить это распределение в виде диаграммы — полигона распределения. Контуры этого полигона помогут решить вопрос о статистических методах обработки. Нередко они напоми­нают контуры колокола, с наивысшей точкой в центре полигона и с симметричными ветвями, отходящими в ту и другую сторону. Такой контур соответствует кривой нормального распределения. Это поня­тие было введено в математическую статистику К.Ф. Гауссом (1777—1855), поэтому кривую именуют также кривой Гаусса. Он же дал математическое описание этой кривой. Для построения кри­вой Гаусса (или кривой нормального распределения) теоретически требуется очень большое количество случаев. Практически же при­ходится довольствоваться тем фактическим материалом, который накоплен в исследовании. Если данные, которыми располагает ис­следователь, при их внимательном рассмотрении или после перено­са их на диаграмму, лишь в незначительной степени расходятся с кривой нормального распределения, то это дает право исследовате­лю применять в статистической обработке параметрические методы, исходные положения которых основываются на нормальной (О математически обоснованных способах определения того, можно ли считать данное распределение нормальным, см., например, в кн.: Урбах В.Ю. Математиче­ская статистика для биологов и медиков. М., 1963. С. 66) кривой распределения Гаусса. Нормальное распределение называют пара­метрическим потому, что для построения и анализа кривой Гаусса достаточно иметь всего два параметра: среднее арифметическое, значение которого должно соответствовать высоте перпендикуляра, восстановленного в центре кривой, и так называемое среднее квад-ратическое, или стандартное, отклонение — величины, характери­зующей размах колебаний данной кривой; о способах вычисления той и другой величины будет далее рассказано.

Параметрические методы обладают для исследователя многими преимуществами, но нельзя забывать о том, что применение их правомерно только тогда, когда обрабатываемые данные показывают распределение, лишь несущественно отличающееся от гауссова.

При невозможности применить параметрические методы, надлежит обратиться к непараметрическим. Эти методы успешно разрабаты­вались в последние 3—4 десятилетия, и их разработка была вызва­на прежде всего потребностями ряда наук; в частности, психологии. Они показали свою высокую эффективность. Вместе с тем они не требуют сложной вычислительной работы.

Современному психологу-исследователю нужно исходить из того, что «существует большое количество данных либо вообще не под­дающихся анализу с помощью кривой нормального распределения, либо не удовлетворяющих основным предпосылкам, необходимым для ее использования» (Рунион Р. Справочник по непараметриче­ской статистике. М., 1982. С. 11.).

Генеральная совокупность и выборка. Психологу постоянно придется иметь дело с этими двумя понятиями. Генеральная сово­купность, или просто совокупность, — это множество, все элемен­ты которого обладают какими-то общими признаками. Так, все под­ростки-шестиклассники 12 лет (от 11,5 до 12,5) образуют совокуп­ность. Дети того же возраста, но не обучающиеся в школе, или же обучающиеся, но не в шестых классах, не подлежат включению в эту совокупность.

В ходе конкретизации проблем своего исследования психологу неизбежно придется обозначить границы изучаемой им совокупно­сти. Следует ли включать в изучаемую совокупность детей того же возраста, но обучающихся в колледжах, гимназиях, лицеях и других подобных учебных заведениях? В ответе на этот и на другие такие же вопросы может помочь статистика.

В подавляющем большинстве случаев исследователь не в состоя­нии охватить в изучении всю совокупность. Приходится, хотя это и связано с некоторой утратой информации, взять для изучения лишь часть совокупности, ее и называют выборкой. Задача исследователя заключается в том, чтобы подобрать такую выборку, которая репре­зентировала бы, представляла совокупность; другими словами, при­знаки элементов совокупности должны быть представлены в выбор­ке. Составить такую выборку, в точности повторяющую все разно­образные сочетания признаков, которые имеются в элементах сово­купности, вряд ли возможно. Поэтому некоторые потери в инфор­мации оказываются неизбежными. Важно, чтобы в выборке были сохранены существенные, с точки зрения данного исследования, признаки совокупности. Возможны случаи, и для их обнаружения есть статистические методы, когда задачи исследования требуют создания двух выборок одной совокупности; при этом нужно уста­новить, не взяты ли выборки из разных совокупностей. Эти и дру­гие подобные казусы нужно иметь в виду психологу при обработке результатов выборочных исследований.

Следует рассмотреть типы задач, с которыми чаще всего имеет дело психолог. Соответственно приводятся и статистиче­ские методы, которые приложимы для обработки психологических материалов, направленных на решение этих задач.

Первый тип задач. Психологу нужно дать сжатую и достаточ­но информативную характеристику психологических особенностей какой-то выборки, например, школьников определенного класса. Чтобы подойти к решению этой задачи, необходимо располагать ре­зультатами диагностических испытаний; эти испытания, разумеется, следует заранее спланировать так, чтобы они давали информацию о тех особенностях группы, которые в этом конкретном случае инте­ресуют психолога. Это могут быть особенности умственного разви­тия, психофизиологические особенности, данные об изменении ра­ботоспособности и т.д.

Получив все экспериментальные результаты и материалы наблю­дений, следует подумать о том, как их подать пользователю в ком­пактном виде, чтобы при этом свести к минимуму потерю информа­ции. В перечне статистических методов, используемых при решении подобных задач, обычно находят свое место и параметрические и непараметрические методы, о возможностях применения тех и дру­гих, как было сказано выше, судят по полученному материалу. Об этих статистических методах и их использовании пойдет речь ниже.

Второй тип задач. Это, пожалуй, наиболее часто встречающие­ся задачи в исследовательской и практической деятельности психолога: сравниваются между собой несколько выборок, чтобы установить, являются ли выборки независимыми или принадлежат одной и той же совокупности. Так, проведя эксперименты в восьмых классах двух раз­личных школ, психолог сравнивает эти выборки между собой.

К этому же типу относятся задачи с определением тесноты связи двух рядов показателей, полученных на одной и той же выборке; в такой обработке чаще всего применяют метод корреляций.

Третий тип задач — это задачи, в которых обработке подлежат временные ряды, в них расположены показатели, меняющиеся во времени; их называют также динамическими рядами. В предшест­вующих типах задач фактор времени не принимался во внимание и ма­териал анализировался так, как будто он весь поступил в руки иссле­дователя в одно и то же время. Такое допущение можно оправдать тем, что за тот короткий период времени, который был затрачен на собира­ние материала, он не потерпел существенных изменений. Но психологу приходится работать и с таким материалом, в котором наибольший ин­терес представляют как раз его изменения во времени. Допустим, пси­холог намерен изучить изменение работоспособности школьников в те­чение учебной четверти. В этом случае информативными будут показа­тели, по которым можно судить о динамике работоспособности. Берясь за такой материал, психолог должен понимать, что при анализе дина­мических рядов нет смысла пользоваться средним арифметическим ря­да, так как оно замаскирует нужную информацию о динамике.

В предыдущих главах упоминалось о лонгитюдинальном исследо­вании, т.е. таком, в котором однообразный по содержанию психоло­гический материал по одной выборке собирается в течение дли­тельного времени. Показатели лонгитюда — это также динамиче­ские ряды, и при их обработке следует пользоваться методами, предназначенными для таких рядов.

Четвертый тип задач — задачи, возникающие перед психоло­гом, занимающимся конструированием диагностических методик, проверкой и обработкой результатов их применения. Отчасти об этих задачах уже говорилось в других главах, но не уделялось вни­мания специально статистике. Психологическая диагностика, в осо­бенности тестология, имеет целый ряд канонических правил, при­менение которых должно обеспечивать высокое качество информа­ции, получаемой посредством диагностических методик. Так, мето­дика должна быть надежной, гомогенной, валидной. По упрочив­шимся в тестологии правилам, все эти свойства проверяются стати­стическими методами.

Здесь уместно высказать некоторые соображения о возможностях статистики в проведении психологического исследования.

Статистика как таковая не создает новой научной информации. Эта информация либо содержится, либо не


9-09-2015, 17:43


Страницы: 1 2 3 4 5 6
Разделы сайта