Федеральная служба государственной статистики, http // www . gks . ru [5]. Это вспомогательный источник, который служил, во-первых, как справочник всех доступных публикаций Госкомстата, а, во-вторых, содержал минимальную методическую информацию и некоторые реальные данные, касающиеся моей проблемы. Это также достоверный источник. Ещё более доступный, чем предыдущий, так как любой находящийся в глобальной сети интернет может зайти на этот сайт. Он, безусловно, релевантен, так как содержит интересующие меня показатели. Но не достаточно полный, поскольку не все эти показатели представлены в разрезе регионов. Тем не менее, при исключении части показателей из анализа или пересмотре их системы этот источник может претендовать на статус основного эмпирического источника, так как содержит наиболее свежую (актуальную) информацию.
Социально-экономическое положение России. 2000 год. / Государственный комитет Российской Федерации по статистике. Сб. стат. материалов. М., 2000 [16]. Этот источник имелся у меня совершенно случайно. И хотя он достаточно старый (2000 год) и содержал далеко не полную информацию, он сослужил хорошую службу, так как, просматривая его, я получила первое представление о том, какие данные об имущественном благосостоянии по регионам могут быть и, соответственно, как можно спланировать анализ. Источник достоверный, малодоступный (на нем даже нет выходных данных, так что я думаю, это почти разовая публикация, которую не понятно, можно ли вообще приобрести), частично релевантный и частично полный. С информацией, несколько утратившей на данный момент свою актуальность.
Труд и занятость в России. 2005: Стат. сб. / Росстат. – М., 2006. – 502 с. [17]. Я просматривала этот источник, но он практически не пригодился, так как был хотя и релевантен, но неполон: он ориентирован на учет всевозможных показателей, связанных с трудом. Так что сведений о пенсиях там просто нет, например.
Регионы России. Основные социально-экономические показатели городов. 2005: Стат. сб. /Росстат. М., 2006. – 383 с. [18]. Источник также был просмотрен, но не использован, поскольку, хотя являлся достоверным и достаточно доступным, оказался не вполне релевантен (содержал информацию лишь о более или менее крупных городах, а не о регионах), кроме того, информация о каждом городе занимала отдельную страницу, то есть, была крайне неудобно организована для обобщения ее в статистическую таблицу. Были представлены не все интересующие меня показатели уровня жизни, то есть, он был неполон.
Качество ресурса в целом
Что же, настало время дать характеристику ресурсу в целом, без разделения его на отдельные источники. Как следует из описания источников выше, некоторые из них оказались практически бесполезными и не использовались в работе (а на этапе поиска ресурсов количество таких было и того больше). Основная проблема была не в достоверности и доступности (с этим, по большому счету, все было в порядке), а именно в релевантности (в первую очередь) и в полноте (во вторую очередь). Особенно это касалось теоретических ресурсов и методических (в той части, которая не касалась непосредственно статистического анализа). Как ни странно, хотя проблема, безусловно, изучается, найти те ресурсы, которые бы «попали в точку» оказалось непросто. И я бы сказала, таких не было найдено. Основная проблема касается отсутствия теорий и методик, связанных именно с анализом межрегиональных различий. Я даже не нашла, например, есть ли какое-то преимущество анализа отдельных регионов, скажем, над анализом федеральных округов, никаких теоретических сведений об устойчивости показателей по регионам (т.е., имеет ли смысл строить кластерную модель на данных отдельного года), словом, нет ответов на все те вопросы, без которых начинающий исследователь чувствует себя немного «плавающим» в своей теме.
Что касается эмпирического источника, то естественно, что в данной работе используются данные региональной статистики. Положительным моментом, связанным с использованием официальных статистических данных для характеристики уровня жизни населения является «повсеместный охват всей территории страны и единообразная методологияи методика получения данных, что важно для межрегиональных сравнений» [2]. Л. А. Беляева отмечает и недостатки, связанные с использованием официальной статистики: недоучёт реальных доходов вследствие их сокрытия населением, условности, связанные с расчётом величины прожиточного минимума (она используется в моей работе), а также – принципиальный недостаток, связанный с потерей связи опубликованных данных со многими параметрами, которые влияют на положение каждого отдельного индивида. Но в данном случае меня интересуют межрегиональные сопоставления, это во-первых, а во вторых – общие закономерности в развитии регионов, так что от точной оценки доходов тут, конечно, мало что зависит. Поэтому я считаю, что эмпирические источники содержат все те данные, которые я задумывала проанализировать в этой работе. Это отдельные данные по регионам таких показателей (за 2004 год), как индексы неравенства доходов (Джини и коэффициент фондов), соотношение среднедушевых доходов с прожиточными минимумом (ПМ), соотношение средней заработной платы с ПМ, соотношение средней пенсии с прожиточным минимумом, а также – процент населения с доходами, ниже ПМ. Что же я пытаюсь установить, проводя кластерный анализ с таким набором параметров? Ясно, что в России есть «богатые» и «бедные» регионы. Однако, поскольку прожиточный минимум в бедных регионах, как правило ниже ПМ в богатых, можно предположить, что в этом плане уровень жизни в первых и вторых может и не слишком различаться. Ответ на этот вопрос (есть ли обособленные группы регионов или нет) и поможет дать проводимый далее анализ.
Итак, если выставлять оценку, например, по пятибалльной шкале различным частям информационного ресурса, то теоретический я бы оценила на «удовлетворительно», методический – на «хорошо», эмпирический – на «отлично». А раз так, то минимальная информационная база для моего исследования обеспечена. Я считаю, что по ходу работы недостающие источники можно будет «добрать».
Гипотезы
Проведенный анализ информационных ресурсов по теме позволяет выдвинуть следующие гипотезы, касающиеся различных его частей.
Гипотезы по теоретической части:
1. Российским регионам на современном этапе присуща заметная неоднородность по уровню имущественной обеспеченности.
2. При этом все же можно выделить группы регионов, более или менее однородных по различным показателям имущественной обеспеченности. Эти группы можно назвать типами регионов.
3. Ряд регионов (такие, как, например, Москва, С.-Петербург, возможно – некоторые северные «нефтяные» регионы) очень сильно выделяются из остальной массы регионов так, что их сложно отнести к какой-либо группе.
Гипотезы по методической части:
1. Регионам России присущи существенные различия по таким показателям, предоставляемым Госкомстатом России, как индекс Джини, коэффициент фондов, соотношение средних заработных плат, назначенных пенсий с прожиточным минимумом в регионе.
2. Поскольку все перечисленные показатели из предыдущей гипотезы имеют отношение к имущественной обеспеченности, то можно образовать группы регионов, схожих по средним значениям данных показателей. Например, похожих одновременно и средним значением индекса Джини, и средним значением соотношения средней заработной платы и прожиточного минимума.
3. Некоторые регионы при проведении кластерного анализа будут иметь тенденцию выделяться в отдельные кластеры, что свидетельствует об их «непохожести» на остальные регионы.
Гипотезы по эмпирической части. Эти отличаются максимальной конкретностью:
1. «Бедные» регионы Северного Кавказа в кластерном анализе методом K-means с 2, 3, 4 и 5 кластерами с показателями индекса Джини, соотношения средней заработной платы к прожиточному минимуму и соотношения средней пенсии к прожиточному минимуму всё время будут относиться к одному и тому же кластеру.
2. (о сохранении структуры распределения регионов по кластерам со временем) Например, если провести повторный кластерный анализ по тем же переменным на данных 2005 года (т.е. данных следующего года после 2004, которые я нашла), состав каждого из кластеров будет, по крайней мере, на 90% такой же, как и для первого кластерного анализа.
3. В кластерном анализе методом K-means с 2, 3, 4 и 5 кластерами с показателями индекса Джини, соотношения средней заработной платы к прожиточному минимуму и соотношения средней пенсии к прожиточному минимуму такой регион, как г. Москва всегда будет образовывать обособленный кластер, поскольку он слишком непохож на остальные регионы.
Заключение
Попытка подбора информационных ресурсов по теме «Региональные различия имущественной обеспеченности россиян» дала результаты, которые можно назвать, скорее, удовлетворительными, чем идеальными, т.е., не лишенные серьезных недостатков. Вообще говоря, по имущественной обеспеченности есть, конечно, очень много публикаций и данных теоретического, методического и эмпирического характера, поскольку проблема актуальна. И исследования начались не вчера, то есть, материала, конечно, много. Наиболее сложной в моем случае, тем не менее, оказалась ситуация с теоретическим ресурсом, так как сложно было найти публикации, которые бы точно соответствовали региональной направленности моего исследования. Ведь вопрос межрегиональных различий возникает далеко не всегда. Очень много публикаций пытается сравнивать между собой различные классы, людей разных профессий и так далее, описывает новые особенности социальной стратификации и т.д., а региональный аспект, который является ключевым в моей теме, остается невыделенным. То есть, хотя с надежностью и доступностью теоретических ресурсов проблем, в принципе, нет, есть проблемы с релевантностью. Впрочем, я думаю, что нужные мне теоретические публикации все же есть, но данной темой надо заниматься более длительное время, тогда они со временем найдутся. Выходит, даже грамотно спланированный поиск информационных ресурсов не обязательно приведет к получению их исчерпывающего набора. Важны, наверное, также и консультации руководителей, экспертов, специалистов, которые могли бы посоветовать, где и как искать. Этой возможностью поиска я воспользовалась в меньшей степени.
Есть проблемы и в части методики. То есть, со статистическим анализом как бы все хорошо. Есть необходимая литература в которой все объясняется, ее надо только прочитать. Тут проблема вытекает из недостаточного теоретического ресурса. Не ясны именно методы межрегионального анализа, то есть, какие показатели имущественного неравенства наиболее характерны, а на какие в межрегиональном исследовании можно было бы не очень обращать внимание. В какой мере эти показатели характеризуют одно и то же явление, в какой мере – разные. То есть, недостаток статей, в которых бы описывались аналогичные задачи препятствует тому, чтобы грамотно построить собственное исследование. Какие показатели используются, за какой период, какие регионы исключаются из анализа? Эти же проблемы препятствуют и правильному объяснению полученных результатов. То есть, не с чем сравнить собственные изыскания. Вот я предложила процедуру кластерного анализа для разложения регионов на группы. Но в отсутствии навыка и знания аналогичных исследований, я, например, не смогу объяснить, почему вдруг два похожих друг на друга региона оказались в разных кластерах. И чем же они так принципиально различаются. В самом деле, нет ни одной публикации, где бы такая методика кластеризации регионов описывалась. Так что, например, о метаанализе (где бы сравнивались мои выводы с выводами других исследователей) не может быть и речи.
Наиболее удачным, пожалуй, следует признать эмпирический ресурс, поскольку он оказался представленным в моей работе наиболее полно. Действительно Госкомстат выпускает множество различных публикаций и их нужно только найти. Есть, конечно, проблемы с доступностью такой информации, но при желании ее можно получить. Есть проблемы с переводом данных с бумаги в компьютер для анализа, но и это проблемы чисто технические, которые решаемы. Можно, конечно, сказать, что я достала не самые свежие данные, то есть, ресурс не вполне удовлетворяет требованиям полноты, но, в конце концов, это учебная исследовательская работа, поэтому в данном случае большой проблемы нет.
В целом, я считаю, что не смотря на очевидные трудности, связанные с полнотой и релевантностью теоретических и методических ресурсов, данную тему можно развивать, по возможности наращивая объем этих ресурсов. Методы и данные, то есть, эмпирическая база для исследования есть, и эту тему можно развивать в ходе кабинетных исследований (с помощью вторичного анализа). Подытоживая все сказанное, мне приходит на ум такая мысль, что успех подобной исследовательской работы не исчерпывается только лишь эмпирическим, методическим и теоретическим ресурсом. Ощущается нехватка «социального» ресурса, то есть, знания имен тех исследователей, которые занимаются подобными проблемами, развитой сети контактов с ними, чтобы ориентироваться в этой теме, ориентироваться в том, что уже изучено, как изучено, что перспективнее всего изучать.
Если говорить о той работе, которую я фактически провела, сделав тот анализ, который задумывался (в рамках подготовки реферата на схожую тему по социальной статистике), то в полученной 6-кластерной модели обнаружены значительные различия в социальном и экономическом развитии регионов, попавших в разные кластеры. Каждый кластер имеет свои особенности, которые так или иначе могут быть объяснены. Был получен один большой кластер, отражающий характерное в среднем положение регионов по России, а также 5 более мелких, менее характерных для России кластера. В работе удалось обнаружить, что большинство регионов находится в положении близком к среднему по всей России, и лишь небольшая часть регионов сильно отличается от средних показателей. В основном это было заметно на бедных регионах Кавказа и богатых регионов центральной части РФ. Примером может послужить Москва постоянно отделявшаяся в обособленный кластер.
То есть, видно, что многие из тех гипотез, которые я сформулировала выше, были проверены и некоторые из них – подтверждены. Таким образом, с помощью проведения вторичного анализа я получила такие результаты, которые, с одной стороны, интересны сами по себе, а с другой стороны, на которые можно опираться в дальнейшей работе, то есть, моя работа, в свою очередь сама расширяет круг теоретических и методических ресурсов по выбранной проблематике.
Список использованных источников
1. Социальное положение и уровень жизни населения России. 2005: Стат. сб. / Росстат. -М., 2005
2. Суринов А. Е. Статистика доходов населения. М.: ЗАО «Финстатинформ», 2001 – 239 с.
3. Статистика рынка товаров и услуг: Учебник. – 2-е изд. перераб. и доп. / И.К. Беляевский, Г.Д. Кулагина, Л.А. Данченок и др.; Под ред. И.К. Беляевского. – М.: Финансы и статистика, 2002. – 656 с.
4. Беляева, Л.А. Материальное неравенство в России. Реальность и тенденции // Социологические исследования, 2007, №11.
5. Федеральная служба государственной статистики, http//www.gks.ru
6. Бююль, А., Цёфель, П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. – Диасофт, 2005
7. Гайдышев, И. Анализ и обработка данных. Специальный справочник – С.-Пб., 2001
8. SPSS 13.0. Справочная система.
9. Кластерный анализ в задачах социально-экономического прогнозирования, http://www.ref.by/refs/49/28133/1.html
10. Суринов А.Е. Обследование бюджетов домашних хозяйств в России. Проблемы и перспективы // Вопросы статистики, №9, 2003. С. 3-9.
11. Шашнов С.А. Сбережения домашних хозяйств и проблемы их статистического изучения на микроуровне // Вопросы статистики, №1, 2003. С. 13-25.
12. А.А. Агеенко, Е.В. Шорина, С.А. Ладива Новые подходы в обследовании домашних хозяйств // Вопросы статистики, №12, 2002. С. 70-72.
13. Салин В.Н. Проблемы статистического анализа структуры потребления продуктов питания // Вопросы статистики, №12, 2002. С. 28-34.
14. Интернет-университет информационных технологий. 13. Лекция: Методы кластерного анализа. Иерархические методы, http://www.intuit.ru/department/database/datamining/13/datamining_13.html
15. Кунец Н.Л. Кластерный анализ в портфельном инвестировании. Курсовая работа. http://www.5ballov.ru/referats/preview/71794/1
16. Социально-экономическое положение России. 2000 год. / Государственный комитет Российской Федерации по статистике. Сб. стат. материалов. М., 2000.
17. Труд и занятость в России. 2005: Стат. сб. / Росстат. – М., 2006. – 502 с.
18. Регионы России. Основные социально-экономические показатели городов. 2005: Стат. сб. /Росстат. М., 2006. – 383 с.
19. Тихонова Н. Е. На пути к новой стратификации российского общества // Общественные науки и современность, №3, 1998. С. 24-37.
20. В.В. Радаев, О.И. Шкаратан. Социальная стратификация. – М. : Аспект-пресс, 1996. – 318 с.
21. Беляева Л. А. Социальная стратификация и средний класс в России: 10 лет постсоветского развития – М., 2001. – 185 с.
22. Бутенко И.А. Какого обращения заслуживают социологические данные? // Социологические исследования. 2002. № 1.
10-09-2015, 16:08