Социальное прогнозирование в сфере демографических процессов

вперед.

Рабочая формула метода экспоненциального сглаживания:

(2)

где t – период, предшествующий прогнозному; t +1 – прогнозный период; - прогнозируемый показатель; - параметр сглаживания; -фактическое значение исследуемого показателя за период, предшествующий прогнозному; экспоненциально взвешенная средняя для периода, предшествующего прогнозному.

При прогнозировании данным методом возникает два затруднения:

1) выбор значения параметра сглаживания α ;

2) определение начального значения U _о .

От величины α будет зависеть, как быстро снижается вес влияния предшествующих наблюдений. Чем больше α , тем меньше сказывается влияние предшествующих лет. Если значение α близко к единице, то это приводит к учету при прогнозе в основном влияния лишь последних наблюдений; если близко к нулю, то веса, по которым взвешиваются уровни временного ряда, убывают медленно, т.е. при прогнозе учитываются все (или почти все) прошлые наблюдения. Таким образом, если есть уверенность, что начальные условия, на основании которых разрабатывается прогноз, достоверны, следует использовать небольшую величину параметра сглаживания (α→0). Когда параметр сглаживания мал, то исследуемая функция ведет себя как средняя из большого числа прошлых уровней. Если нет достаточной уверенности в начальных условиях прогнозирования, то следует использовать большую величину α, что приведет к учету при прогнозе в основном влияния последних наблюдений.

Точного метода для выбора оптимальной величины параметра сглаживания α нет. В отдельных случаях автор данного метода профессор Браун предлагал определять величину α, исходя из длины интервала сглаживания. При этом α вычисляется по формуле:

(3)

где n – число наблюдений, входящих в интервал сглаживания.

Задача выбора U _о (экспоненциально взвешенного среднего начального) решается следующими путями:

1) если есть данные о развитии явления в прошлом, то можно воспользоваться средней арифметической, и U _о равен этой средней арифметической;

2) если таких сведений нет, то в качестве U _о используют исходное первое значение базы прогноза Y ₁ .

Также можно воспользоваться экспертными оценками.

Используем метод экспоненциального сглаживания для составления прогнозных значений. Величина параметра сглаживания для показателя численности населения составит: , для показателей «число родившихся» и «число умерших», «число прибывших» и «число выбывших»: . Значения близки к нулю, следовательно, веса, по которым взвешиваются уровни временного ряда, убывают медленно, т.е. при прогнозе учитываются все (или почти все) прошлые наблюдения.

Определяем начальное значение U _о для показателя численности населения двумя способами:

1 Способ (средняя арифметическая):

2 Способ (первое значение базы прогноза):

Рассчитываем экспоненциально взвешенную среднюю для каждого года, используя формулу 2, занесем результаты в таблицу.

Таблица 4

Расчет прогнозного значения численности населения Оренбургской области методом экпоненциального сглаживания.

года	Численность постоянного населения на 1 января, человек	Экспоненциально взвешенная средняя Ut		Расчет средней относительной ошибки
I способ	II способ	I способ		II способ
1	1990	2 151 097	2176434	2 151 097	1,18		0,00
2	1991	2 159 743	2174021	2 151 097	0,66		0,40
3	1992	2 168 257	2172661	2 151 920	0,20		0,75
…
19	2008	2 119 003	2175920	2 171 738		2,69		2,49
20	2009	2 111 531	2170499	2 166 716		2,79		2,61
прогноз	2010	2 164 883	2 161 460
итого	43 528 685	27,20		29,84
Средняя относительная ошибка ɛ						1,36		1,49
Средняя абсолютная ошибка Δ						-6064		5441
Средняя квадратическая ошибка						33749		36868

Величина средней относительной ошибки при расчете 2-м способом выше, но оба значения свидетельствуют о высокой точности прогноза.

Данные о прогнозных значениях показателей других демографических показателей, представим в таблице (расчет полученных параметров в Приложении 2).

Таблица 5

Прогнозные значения абсолютных показателей родившихся и умерших, прибывших и выбывших в Оренбургской области, полученные методом экспоненциального сглаживания.

Абсолютный показатель, человек	2006	2007	2008	Прогноз на 2009		Δ			ε
I способ определения экспоненциально взвешенного среднего начального
Родившиеся	23 335	25 776	26 947	23 915		-135		3 275	9,94
Умершие	31 583	31 000	30 904	30 754		64		2 571	8,14
II способ определения экспоненциально взвешенного среднего начального
Родившиеся	23 335	25 776	26 947	25 150		-4296		5 386	20,14
Умершие	31 583	31 000	30 904	29 557		1 241		2 965	14,91
I способ определения экспоненциально взвешенного среднего начального
Прибывшие	31 949	25 570	28 053	37 366	-3539		15857			35,27
Выбывшие	33 225	29 085	25 603	36311	-2070		8458			20,04
II способ определения экспоненциально взвешенного среднего начального
Прибывшие	31 949	25 570	28 053	41 292	-16856		19228			49,84
Выбывшие	33 225	29 085	25 603	38 162	-8348		9757			24,83

Так же как и с показателем численности населения, величина средней относительной ошибки при расчете 2-м способом выше, что свидетельствует о нецелесообразности применения первого значения базы прогноза в качестве экспоненциально взвешенной U _о . В целом точность прогноза для показателей естественного движения населения находится в границах высокой точности, для показателей миграционного движения точность прогноза удовлетворительная.

2.3 Нахождение прогнозных значений методом наименьших квадратов

демографический прогноз население численность

Сущность метода наименьших квадратов состоит в минимизации суммы квадратических отклонений между наблюдаемыми и расчетными величинами. Расчетные величины находятся по подобранному уравнению – уравнению регрессии.

Чем меньше расстояние между фактическими значениями и расчетными, тем более точен прогноз, построенный на основе уравнения регрессии. Теоретический анализ сущности изучаемого явления, изменение которого отображается временным рядом, служит основой для выбора кривой. Иногда принимаются во внимание соображения о характере роста уровней ряда. Для нахождения прогнозных значений численности населения часто предполагается, что рост идет в геометрической прогрессии, и тогда сглаживание производится по показательной функции.

(4)

где - численность населения в прогнозный период; - численность населения в период, предшествующий прогнозному; е - основные натурального логарифма; k - общий коэффициент прироста населения, выраженный в долях единиц, рассчитанный по формуле: (5)

где M - число родившихся за период; N – число умерших за период; П - число прибывших за период; В – число выбывших за период; S – средняя численность населения за период; t- период, на который разрабатывается прогноз.

Согласно имеющимся данным, численность населения Оренбургской области на 1 января 2008 года составила 2 119 003 чел., на 1 января 2009 – 2 111 531 чел., за 2008 год родилось 26 947 чел., умерло 30 904 чел., 25 570 чел. прибыло и 29 085 чел. выбыло. Рассчитаем численность населения в 2010-2012 гг. при условии, что коэффициент общего прироста населения () останется неизменным на всем протяжении прогнозных лет:

чел.

Сглаживание временных рядов методом наименьших квадратов служит для отражения закономерности развития изучаемого явления. В аналитическом выражении тренда время рассматривается как независимая переменная, а уровни ряда выступают как функция этой независимой переменной. Ясно, что развитие явления зависит не от того, сколько лет прошло с отправного момента, а от того, какие факторы влияли на его развитие, в каком направлении и с какой интенсивностью. Развитие явления во времени выступает как результат действия этих факторов.

Правильно установить тип кривой, тип аналитической зависимости от времени – одна из самых трудных задач предпрогнозного анализа.

Подбор вида функции, описывающей тренд, параметры которой определяются методом наименьших квадратов, производится в большинстве случаев эмпирически, путем построения ряда функций и сравнения их между собой по величине среднеквадратической ошибки, вычисляемой по формуле:

(6)

где – фактические значения ряда динамики;– расчетные (сглаженные) значения ряда динамики; n – число уровней временного ряда; р – число параметров, определяемых в формулах, описывающих тренд.

С помощью программы Excel проверим предположение о том, что изменение численности населения в Оренбургской области, хорошо апроксимируется экспоненциальной линией тренда.

Рис. 1. Динамика численности населения в Оренбургской области с экспоненциальной линией тренда.

Видно, что разница между фактическими и сглаженными значениями данного ряда очень велика. Невысокий коэффициент достоверности аппроксимации также подтверждает, что использовать данный тип тренда нецелесообразно.

Наибольшее приближение к фактическим уровням данного динамического ряда дает функция полинома второй степени.

Рис. 2. Динамика численности населения в Оренбургской области с полиномиальной линией тренда.

При использовании уравнения полинома третьей степени, коэффициент аппроксимации увеличивается до 0,97, но при этом усложняется и сама модель, что может отрицательно сказаться на ее прогностических возможностях.

Уравнение регрессии примет вид:

(7)

- выровненные, т.е. лишенные колебаний, уровни тренда для лет с номером i ; а - это средний (выровненный) уровень тренда на момент или период, принятый за начало отсчета времени, т.е. t = 0; b - это средний за весь период среднегодовой прирост, который изменяется равномерно со средним ускорением, равным 2с; c - константа, главный параметр параболы II порядка.

Параметры a , b и c оцениваются методом наименьших квадратов и отвечают принципу максимального правдоподобия: сумма квадратов отклонений фактических уровней от тренда (от выровненных по уравнению тренда уровней) должна быть минимальной для данного типа уравнения.

На диаграмме уравнение тренда имеет вид: , где =0 в 1990г.

При этом нумерация периодов начинается с t =1. Однако рациональнее начало отсчета времени перенести в середину ряда, т.е. при нечетном п - на период (момент) с номером (п + 1 )/2, а при четном числе уровней ряда - на середину между периодом с номером n /2 и (n/2)+1. Расчет параметров тренда при переносе отсчета времени на середину ряда приведен в приложении 3. Тогда уравнение тренда принимает вид: , где =0,5 в 2000г.

За период 1990-2009г показатель численности населения в Оренбургской области убывал в номинальной оценке ускоренно, со средним ускорением человек за год; средняя убыль населения за весь период составила 3 087 человек; средний уровень численности населения на середину периода был равен 22 084 35 чел.

Для оценки надежности тренда необходимо оценить надежность его главного параметра – ускорения. Средняя ошибка репрезентативности выборочной оценки параметра с вычисляется по формуле:

(8)

Где S ( t ) – оценка генерального показателя колеблемости, учитывающая потерю степеней свободы и определяемая по формуле 6.

Используя данные приложения 3, найдем искомые величины:

Отношение параметра с (половина ускорения) к его средней ошибке - это t-критерий Стьюдента:

Табличное значение критерия Стъюдента Фактическая величина критерия больше табличного, следовательно, вероятность нулевой гипотезы (о равенстве параметра с нулю) чрезвычайно мала. Достоверно известно, что тренд существовал, и что численность населения Оренбургской области снижалась не случайно.

Прогноз по этой модели заключается в подстановке в уравнение тренда номера периода, который прогнозируется. Для 2010 года период времени t = 10,5, прогнозное значение составит:

₂₀₁₀ ==2 069 907 чел.

Полученное прогнозное значение является точечным и не учитывает колеблемость уровней показателя.

При прогнозе с учетом случайной колеблемости учитывается как вызванная колеблемостью ошибка репрезентативности выборочной оценки тренда, так и колебания уровней в отдельные периоды (моменты) относительно тренда.

Общая формула средней ошибки прогноза положения параболического тренда на период с номером от середины базы расчета тренда имеет вид:

(9)

Средняя ошибка тренда на 2010 год равна:

Вероятность того, что фактическая ошибка не превысит одного среднего квадратического отклонения, т.е. m равна при нормальном распределении 0,68. Чтобы получить доверительный интервал прогноза линии тренда с большей вероятностью, например с вероятностью 0,95,среднюю ошибку нужно умножить на величину t-критерия Стъюдента для вероятности 0,95 и n - p степеней свободы.

Получаем вероятную ошибку:

с вероятностью 95% можно утверждать, что тренд численности населения в Оренбургской области в 2010 году проходит в границах 2 069 907±13 307 или от 2 056 600 до 2 083 214 человек.

Определив ошибку репрезентативности выборочной оценки тренда, и колебания уровней в отдельные периоды (моменты) относительно тренда, получаем единую формулу средней ошибки прогноза конкретного отдельного уровня:

(10)

Для искомого прогнозного значения: 11 286 .

Таким образом, для прогнозного значения показателя численности населения на 1 января 2010 года определены границы доверительного интервала 2 046 096 – 2 093 718 человек.

Аналогично рассчитываем прогнозные значения на 2011-2012 годы:

₂₀₁₁ =2 045 646 чел.

Доверительный интервал: (2 020 126; 2 071 166).

₂₀₁₂ =2 019 459 чел.

Доверительный интервал: (1 991 780; 2 047 138)

Средняя относительная ошибка , что свидетельствует о высокой точности прогноза.

Расчет прогнозных значений для других показателей приведен в приложении 3, сведем полученные результаты в общую таблицу:

Таблица 5

Прогнозные значения абсолютных показателей родившихся и умерших, прибывших и выбывших в Оренбургской области, полученные методом наименьших квадратов.

Абсолютный показатель, человек	2006	2007	2008	Прогноз на 2009	Прогноз на 2010	Прогноз на 2011	Δ		ε
Родившиеся	23335	25776	26947	29 253	31 220	33 395	0	1135	4,13
Умершие	31 583	31 000	30 904	30 190	29 392	28 470	0	1420	3,69
Абсолютный показатель, человек	2007	2008	2009	Прогноз на 2010	Прогноз на 2011	Прогноз на 2012	Δ		ε
Прибывшие	31 949	25 570	28 053	29 586	31 144	33 202	0,11	3499	7,68
Выбывшие	33 225	29 085	25 603	24 352	22 589	20 826	0	2437	5,17

Величины относительной ошибки свидетельствуют о высокой точности прогноза. По имеющимся данным видно, что при наметившихся тенденциях естественный прирост населения в прогнозируемые годы увеличится (увеличение рождаемости и снижение смертности), как и миграционный прирост.

Для сравнения полученных результатов составим сводную таблицу по всем применяемым методам:

Численность постоянного населения на 1 января, человек
МСС			МЭС			МНК
2007		2 125 503			2 125 503			2 125 503
2008		2 119 003			2 119 003			2 119 003
2009		2 111 531			2 111 531			2 111 531
прогноз
2010		2 116 188			2 164 883			2 069 907
2011		2 117 127			2 045 646
2012		2 115 261			2 019 459
Ср. абсолют. оценка		299			-6064			0,38
Ср. квадрат. оценка		1 478			33749			8628
Ср. относит. ошибка		0,05			1,36			0,017
Число родившихся, чел.				Число умерших, чел.
МСС	МЭС	МНК		МСС	МЭС		МНК
2 006		23335	23335	23335		31 583	31 583		31 583
2 007		25776	25776	25776		31 000	31 000		31 000
2 008		26947	26947	26947		30 904	30 904		30 904
прогноз
2 009	25 743		23 915	29 253		31 130	30 754		30 190
2 010	25 754		31 220		31 087	29 392
2 011	26 125		33 395		31 026	28 470
Ср. абсолют. оценка	-85		-135	0		32	64		0
Ср. квадрат. оценка	594		3 275	1135		795	2 571		1420
Ср. относит. ошибка	2		9,94	4,13		2,02	8,14		3,69
Число прибывших, человек					Число выбывших, человек
МСС		МЭС	МНК		МСС	МЭС		МНК
2007	31 949		31 949	31 949		33 225	33 225		33 225
2008	25 570		25 570	25 570		29 085	29 085		29 085
2009	28 053		28 053	28 053		25 603	25 603		25 603
прогноз
2010	29 352		37 366	29 586		28 144	36311		24 352
2011	28 091		31 144		28 457	22 589
2012	28 078		33 202		27 506	20 826
Ср. абсолют. оценка	11		-3539	0,11		32	-2070		0
Ср. квадрат. оценка	2 177		15857	3499		1 161	8458		2437
Ср. относит. ошибка	5		35,27	7,68		2	20,04		5,17

Как видно из таблицы, значения средней квадратической оценки средней относительной ошибки у показателей минимальны для метода скользящей средней, и в целом данный метод дает хорошие результаты при прогнозировании демографических процессов. Кроме того, метод прост в использовании, что открывает широкие возможности для его применения. Метод наименьших квадратов более сложен в работе, но позволяет получить также достоверные результаты при условии подбора вида линии тренда, хорошо аппроксимирующей исходный динамический ряд.

Применение метода экспоненциального сглаживания целесообразно только при условии использования среднего уровня ряда в качестве начального значения экспоненциальной взвешенной. Но и в этом случае, полученные результаты являются самыми ненадежными по сравнению с прогнозированием другими методами.

Следует отметить, что прогнозирование методами экстраполяции основывается на использовании простого методологического аппарата и часто используется для получения будущих оценок социально-экономических процессов. Оправдано их использование и в частности при построении демографических прогнозов, поскольку процессы естественного и миграционного движения достаточно инерционны и не подвержены резким скачкам в уровнях.

Заключение

В соответствии с поставленными задачами в данной работе были исследованы 4 группы методов, используемых при прогнозировании демографических процессов:

1) методы экстраполяции;

2) экономико-математические методы, позволяющие разработать многофакторные динамические модели;

3) методы передвижки возрастов и когорт;

4) методы экспертных оценок.

Опираясь на имеющиеся в распоряжении данные, для практической части работы, была выбрана первая группа методов.

10-09-2015, 16:25

Страницы: 1 2 3 4

Социальное прогнозирование в сфере демографических процессов

Разделы сайта