Основные этапы статистического исследования явлений общественной жизни

Содержание

Введение

1. Методика получения исходных данных

2. Статистическая сводка и группировка первичных данных

2.1 Группировка

2.2 Определение средней арифметической и структурных средних

2.3 Гистограмма и кумулята

2.4 Стоимость основных фондов

2.5 Объем продукции

3. Корреляционный анализ

3.1 Исследование связи между факторным и результативным признаками. Построение корреляционной таблицы

3.2 Определение степени тесноты связи

4. Регрессионный анализ

4.1 Моделирование

4.2 Прогнозирование

Заключение

Использованная литература и программы

Введение

Статистическое исследование явлений общественной жизни начинается с этапа статистического наблюдения, в ходе которого, в соответствии с познавательными целями и задачами, формируется массив исходных данных об изучаемом объекте, т.е. формируется информационная база исследования, на которой осуществляется учет и контроль, планирование, статистический анализ и управление. На этом этапе используются методы массового наблюдения, основанные на "законе больших чисел", т.к. количественные закономерности массовых явлений отчетливо проявляются при изучении лишь достаточно большого числа социально-экономических явлений и процессов.

Любое статистическое наблюдение должно подготавливаться и проводится по четко разработанному плану, который включает вопросы методологии, организации и техники сбора данных, контроля её качества и достоверности. Таким образом, статистическое наблюдение должно иметь программу и организационный план проведения. При этом необходимо решить вопросы о способе, форме, виде, средствах, сроках, месте организации и проведения наблюдения и т.д., чем, в свою очередь, и определяется его планомерность.

Статистическое наблюдение должно проводиться не стихийно, от случая к случаю, а систематически: либо непрерывно, либо периодически - через равные промежутки времени. Это обуславливается пространственно-временной вариацией изучаемых социально-экономических явлений и процессов.

Статистическое наблюдение может проводиться органами государственной статистики, научно-исследовательскими институтами, экономическими и аналитическими службами различных организационных структур.

Вторым этапом статистического исследования является статистическая сводка и группировка данных статистического наблюдения. В результате статистического наблюдения получают сведения о каждой единице совокупности, которая обладает многочисленными признаками, изменяющимися во времени и пространстве. В этих условиях возникает необходимость в систематизации и обобщении результатов статистического наблюдения и получении на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, с тем чтобы стало возможным выявить характерные особенности, специфические черты статистической совокупности в целом и отдельных её составляющих и обнаружить закономерности изучаемых социально-экономических явлений и процессов. Из сказанного следует необходимость сводки первичного статистического материала.

Статистическая сводка проводится по специально разработанной программе, обеспечивающей полноту и достоверность получаемых результатов. Эта программа содержит перечень групп, на которые может быть разбита совокупность единиц наблюдения по отдельным признакам, а также систему показателей, характеризующих изучаемую совокупность явлений в целом и отдельных её частей.

Третий этап статистического исследования - анализ статистической информации. На данном этапе по результатам статистического исследования получаются выводы, полезные для практических действий, а также проводится прогнозирование исследуемого явления или процесса.

1. Методика получения исходных данных

С целью изучения зависимости объема продукции от стоимости основных фондов за период 2006-2007гг. территориальным органом государственной статистики по Челябинской области организовано статистическое исследование приборостроительных предприятий.

Произведена 20-ти процентная типическая выборка.

Объект статистического наблюдения - совокупность приборостроительных предприятий г. Челябинск и Челябинской области. Отчетной единицей статистического наблюдения является приборостроительное предприятие.

С целью совершенствования системы выборочных обследований приборостроительных предприятий Госкомстатом РФ разработана целевая Программа.

Согласно Программе с целью экономии ресурсов будут исследованы 20% от общего числа предприятий Челябинской области, действующих на дату проведения работ. В состав мероприятий Программы включен ряд организационно-методологических и программно-технологических работ, обеспечивающих подготовку и проведение выборочных обследований приборостроительных предприятий, тематика которых охватывает такой вопрос как зависимость объема продукции от стоимости основных фондов. В целях обеспечения надлежащих процедур подготовки выборочных обследований предприятий в состав мероприятий Программы включены также вопросы обучения персонала по обследованию и проведению информационно-разъяснительной работы. Реализацию Программы предполагается осуществить в течение 2008-2009 гг. Результаты выборочного наблюдения приборостроительных предприятий г. Челябинск и Челябинской области по двум показателям (объем продукции и стоимость основных фондов) приведены в таблице 1.


Таблица 1. Основные показатели деятельности приборостроительных предприятий г. Челябинск и Челябинской области за период 2006 - 2007 гг.

№ завода

Стоимость основных фондов,

млн. руб.

Объем продукции, млн. руб. № завода

Стоимость основных фондов,

млн. руб.

Объем продукции, млн. руб.
1 3,9 4,2 20 5 6,2
2 5,9 6,4 21 4,4 7,1
3 6,8 5,2 22 5 6,9
4 2,3 1,5 23 6,3 5,6
5 4,2 2,5 24 5,2 4,8
6 7,5 11,9 25 6,8 5,1
7 6,7 9,4 26 8,3 4,3
8 5,5 4,4 27 7,8 5,7
9 6 5,6 28 4,1 6,4
10 7,6 12,6 29 5,3 8,8
11 3,2 1,9 30 7,3 6,4
12 6,6 5,8 31 7,5 9,1
13 6,2 3,5 32 6,4 10,3
14 7,2 8,9 33 6,9 8,5
15 5,5 3,6 34 6,2 10,7
16 7,2 7,9 35 5,7 7,6
17 5,1 3,5 36 4,4 6,9
18 6,3 3,9 37 4,8 4,3
19 4,7 2,4

2. Статистическая сводка и группировка первичных данных

2.1 Группировка

По данным статистического наблюдения видно, что вариация признаков проявляется в сравнительно узких границах и распределение носит равномерный характер. В этом случае строят группировку с равными интервалами. Количество групп зависит в первую очередь от степени колеблемости признака: чем больше колеблемость признака (размах вариации), тем больше можно образовать групп. Ниже приведены формулы для построения статистической группировки.

Т. к. объем выборочной совокупности не большой, то для определения числа групп воспользуемся формулой:

(1.1)

Величина интервала h по формуле:

; (1.2)

Полученную по формуле (1.2) величину, которая будет являться шагом интервала, округляют (округление не должно отличаться от исходного значения более, чем на 10-15%). При этом для первого интервала нижней границей будет являться , а верхней - (+ h ) и т.д. Таким образом, нижняя граница i-го интервала равна верхней границе (i-1) - го интервала.

Результаты группировки заносятся в таблицу.

Далее определяются величины показателей, характеризующих группы, и разносятся по каждой группе. В этом случае идет речь о рядах распределения, т.е. об упорядоченном распределении единиц совокупности по определенному признаку.

2.2 Определение средней арифметической и структурных средних

Для характеристики среднего значения признака в вариационном ряду применяются: средняя арифметическая (взвешенная), мода и медиана.

Расчет средней арифметической производится по сгруппированным данным, т.к некоторые значения признака повторяются.

Средняя арифметическая взвешенная определяется по формуле:

; (2.1)

Мода - наиболее часто встречающееся значение признака.

В интервальном ряду определяется модальный интервал, т.е. интервал с наибольшим количеством повторений признака.

Значение моды определяется по формуле:

(2.2)

Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Положение медианы определяется ее номером. Медианным является первый интервал, в котором сумма накопленных частот превысит половину общего числа наблюдений.

Численное значение медианы определяется по формуле:

; (2.3)

2.3 Гистограмма и кумулята

Анализ рядов распределения можно наглядно проводить на основе их графического представления.

Гистограмма применяется для изображения интервального вариационного ряда. При построении на оси Х откладываются величины интервалов, а частоты изображаются прямоугольниками, построенных на соответствующих интервалах. В результате мы получаем столбиковую диаграмму.

При помощи кумуляты изображается ряд накопленных частот. При построении на оси Х откладываются варианты ряда, а по оси У - накопленные частоты.

Предельные ошибки определения средних арифметических и доли (ошибки репрезентативности)

Предельная ошибка выборки ∆х определяется по формуле:

; (3.1)

t зависит от вероятности, с которой гарантируется величина предельной ошибки.

Выборка предприятий - случайная и бесповторная. При случайной бесповторной выборке величина средней квадратической ошибки рассчитывается по формуле:

; (3.2)

; (3.3)

Интервальная оценка генеральной средней будет равна:

; (3.4)

Доля (ошибка репрезентативности) вычисляется по формуле:

(3.5)

Доверительный интервал для генеральной доли:

; (3.6)

2.4 Стоимость основных фондов

По формулам (1.1) и (1.2) определяем:

;

; ;

Результаты группировки приведены в таблице 2. При этом накопленные частоты определяются путем последовательного суммирования частот по группам.


Таблица 2 Группировка приборостроительных предприятий по стоимости основных фондов в 2000 г.

Стоимость основных фондов,

млн. руб. (х)

Число предприятий, частота повторений признака () Накопленные частоты Середина интервала ()
[2,3; 3,3) 2 2 2,8
[3,3; 4,3) 3 5 3,8
[4,3; 5,3) 8 13 4,8
[5,3; 6,3) 8 21 5,8
[6,3; 7,3) 10 31 6,8
[7,3; 8,3] 6 37 7,8
Итого 37 31,8

По формулам (2.1), (2.2) и (2.3) рассчитываем среднюю стоимость основных фондов в целом по 37 предприятиям:

Модальный интервал (см. табл.2) - пятый (6,3-7,3], т.к он имеет наибольшую частоту (10). Медианный интервал - четвертый (5,3-6,3], т.к это первый интервал, в котором величина накопленных частот больше 18,5.

Построим гистограмму (рис.1), на которой отразим распределение предприятий по признаку х . Выделим на ней модальный интервал.

Рис. 1 Распределение приборостроительных предприятий по стоимости основных фондов

Анализируя диаграмму на рис.1, видно, что в рассматриваемой совокупности приборостроительных предприятий Челябинской области наиболее часто встречаются предприятия со стоимостью основных фондов 6,63 млн. руб. Величина медианы свидетельствует о том, что 50% предприятий имеют основных фондов на сумму 6,05 млн. руб.

Построим график кумуляты по данным таблицы 2.

Рис.2 Кумулята распределения предприятий по стоимости основных фондов

Рассчитаем предельную ошибку средней арифметической и ошибку репрезентативности по формулам (3.1 - 3.6). При вероятности 0, 99 t= 2,68 (по таблице Удвоенная нормированная функция Лапласа):

;

Интервальная оценка генеральной средней равна:

Таким образом, с вероятностью 0,99 можно утверждать, что средняя стоимость основных фондов по 37 предприятиям находится в интервале от 5,36 до 6,44 млн. руб. Решим задачу определения доли предприятий, стоимость основных фондов которых лежит в модальном интервале [6,3; 7,3). Согласно таблице 2 численность таких предприятий составляет , а относительная частота:

.

Тогда ошибка репрезентативности согласно (3.5) равна:

Найдем доверительный интервал для данного показателя: 27%, 10% 44%, т.е. с вероятностью 0,99 можно утверждать, что доля предприятий, стоимость основных фондов которых лежит в пределах от 6,3 до 7,3 млн. руб., находится в пределах от 10 до 44% (т.е. у 19-81 предприятий в генеральной совокупности).

2.5 Объем продукции

Аналогично проведенным выше расчетам (пункт 2.5) произведем расчеты необходимых величин по результативному признаку. Результаты группировки оформим в виде таблицы 3. По формулам (1.1) и (1.2) определяем: ; ;

Таблица 3 Группировка приборостроительных предприятий по объему продукции в 2000г.

Объем продукции, млн. руб. (у ) Число предприятий () Накопленные частоты Середина интервала,
[1,5; 3,4) 4 4 2,45
[3,4; 5,2) 10 14 4,3
[5,2; 7,1) 11 25 6,15
[7,1; 9,0) 6 31 8,05
[9,0; 10,9) 4 35 9,95
[10,9; 12,8] 2 37 11,85
Итого 37 42,75

По формулам (2.1), (2.2) и (2.3) рассчитываем средний объем продукции в целом по 37 предприятиям:

Модальным и медианным интервалом является третий [5,2; 7,1) (см. табл.3) - т.к. он имеет наибольшую частоту (10) и является первым интервалом, в котором величина накопленных частот больше 18,5.

млн. руб.

Построим гистограмму (рис.3), на которой отразим распределение предприятий по признаку у . Выделим на ней модальный интервал.

Рис.3 Распределение приборостроительных предприятий по объему продукции

Анализируя диаграмму на рис.3, видно, что в рассматриваемой совокупности приборостроительных предприятий Челябинской области наиболее часто встречаются предприятия с объемом выпускаемой продукции на 5,52 млн. руб. Величина медианы свидетельствует о том, что 50% предприятий имеют объем продукции на сумму 5,58 млн. руб.

Построим график кумуляты по данным таблицы 3.

Рис.3 Кумулята распределения предприятий по объему продукции

Рассчитаем предельную ошибку средней арифметической и ошибку репрезентативности по формулам (3.1 - 3.6):

;

;

Интервальная оценка генеральной средней будет равна:

Таким образом, с вероятностью 0,99 можно утверждать, что средняя стоимость в целом по 37 предприятиям находится в интервале от 5,23 до 7,37 млн. руб.

Ошибка репрезентативности:

Решим задачу определения доли предприятий, объем продукции которых лежит в модальном интервале [5,2; 7,1]. Согласно таблице 3 численность таких предприятий составляет , а относительная частота:

.

Тогда ошибка репрезентативности согласно (3.5) равна:

Найдем доверительный интервал для данного показателя: 30%, 12% 48%, т.е. с вероятностью 0,99 можно утверждать, что объем продукции в размере от 5,2 до 7,1 млн. руб. наблюдается у доли предприятий, которая расположена в пределах от 12 до 48% (т.е. у 22-89 предприятий в генеральной совокупности).

3. Корреляционный анализ

3.1 Исследование связи между факторным и результативным признаками. Построение корреляционной таблицы

Сгруппируем предприятия по двум признакам одновременно, считая, что объем продукции является результативным признаком, а стоимость основных фондов - факторным.

Результаты отразим в таблице 4 - наглядно представляем статистическую зависимость объема продукции от стоимости основных фондов (т.е. каждому отдельному значению х соответствует не одно, а несколько значений у ).

Таблица 4 Взаимозависимость факторного и результативного признаков

у

х

[1,5; 3,4) [3,4; 5,2) [5,2; 7,1) [7,1; 9,0) [9,0; 10,9) [10,9; 12,8] fi
[2,3; 3,3) 2 - - - - - 2
[3,3; 4,3) 1 1 1 - - - 3
[4,3; 5,3) 1 3 3 1 - - 8
[5,3; 6,3) - 3 2 2 1 - 8
[6,3; 7,3) - 2 3 3 2 - 10
[7,3; 8,3] - 1 2 - 1 2 6
4 10 11 6 4 2 37

Графически такая зависимость объема продукции от стоимости основных фондов может быть представлена с помощью поля корреляции, изображенного на рис.3.

Рис.3 Корреляционное поле

3.2 Определение степени тесноты связи

Для установления самого факта наличия (или отсутствия) статистически значимой зависимости между объемом продукции и стоимостью основных фондов приборостроительного предприятия воспользуемся двумя измерителями статистической связи: эмпирическое корреляционное отношение и линейный коэффициент корреляции.

Эмпирическое корреляционное отношение вычисляется по формуле:

(5.1)

характеризует вариацию результативного признака (стоимости основных средств) под влиянием всех факторов, формирующих уровень признака у единиц совокупности данных. И рассчитывается:

; (5.2)

Межгрупповая дисперсия отражает систематическую вариацию результативного признака (объема продукции), т.е. те различия, которые возникают под влиянием фактора, положенного в основу группировки (стоимость основных средств). Средняя внутригрупповая дисперсия характеризует случайную вариацию результативного признака, возникающих под влиянием других, неучтенных факторов и не зависит от признака-фактора, положенного в основу группировки. Эти показатели определяются по формулам:

; (5.3)

; (5.4)

; (5.5)

; (5.6)

Для нахождения эмпирического корреляционного отношения рассчитаем эти показатели:

1)

2)

3)

4)

5)

Тогда эмпирическое корреляционное отношение будет равно:

Такое значение корреляционного отношения говорит о том, что изменение объема продукции во многом объясняется вариацией стоимости основных фондов.

Линейный коэффициент корреляции вычисляется по формуле:

; (5.7)

==

Степень тесноты связи зависит от близости |r | к единице , чем ближе он к единице, тем теснее считается связь. Т.к. r>0, то связь между факторным и результативным признаком прямая, и r>0,5, то эта связь умеренная. Т.е. более крупные предприятия имеют, как правило, больший объем произведенной продукции.

4. Регрессионный анализ

4.1 Моделирование

После выявления наличия связей между х и у, оценки степени их тесноты, можно перейти к математическому описанию статистической зависимости с использованием регрессионного анализа. Проанализировав полученные данные (пункты 3.1 и 3.2), можно сделать вывод о том, что с возрастанием стоимости основных фондов объем продукции в целом увеличивается. Таким образом, остановим свой выбор на линейной модели:

(6.1)

О возможности применения линейной модели для описания зависимости объема продукции от стоимости основных фондов можно говорить, если выполняется следующее неравенство:

Следовательно, гипотеза о линейной модели связи принимается.

Для нахождения параметров a иb воспользуемся методом наименьших квадратов:



10-09-2015, 16:01


Страницы: 1 2
Разделы сайта