Социальное прогнозирование в сфере демографических процессов

вперед.

Рабочая формула метода экспоненциального сглаживания:

(2)

где t – период, предшествующий прогнозному; t +1 – прогнозный период; - прогнозируемый показатель; - параметр сглаживания; -фактическое значение исследуемого показателя за период, предшествующий прогнозному; экспоненциально взвешенная средняя для периода, предшествующего прогнозному.

При прогнозировании данным методом возникает два затруднения:

1) выбор значения параметра сглаживания α ;

2) определение начального значения U о .

От величины α будет зависеть, как быстро снижается вес влияния предшествующих наблюдений. Чем больше α , тем меньше сказывается влияние предшествующих лет. Если значение α близко к единице, то это приводит к учету при прогнозе в основном влияния лишь последних наблюдений; если близко к нулю, то веса, по которым взвешиваются уровни временного ряда, убывают медленно, т.е. при прогнозе учитываются все (или почти все) прошлые наблюдения. Таким образом, если есть уверенность, что начальные условия, на основании которых разрабатывается прогноз, достоверны, следует использовать небольшую величину параметра сглаживания (α→0). Когда параметр сглаживания мал, то исследуемая функция ведет себя как средняя из большого числа прошлых уровней. Если нет достаточной уверенности в начальных условиях прогнозирования, то следует использовать большую величину α, что приведет к учету при прогнозе в основном влияния последних наблюдений.

Точного метода для выбора оптимальной величины параметра сглаживания α нет. В отдельных случаях автор данного метода профессор Браун предлагал определять величину α, исходя из длины интервала сглаживания. При этом α вычисляется по формуле:

(3)

где n – число наблюдений, входящих в интервал сглаживания.

Задача выбора U о (экспоненциально взвешенного среднего начального) решается следующими путями:

1) если есть данные о развитии явления в прошлом, то можно воспользоваться средней арифметической, и U о равен этой средней арифметической;

2) если таких сведений нет, то в качестве U о используют исходное первое значение базы прогноза Y 1 .

Также можно воспользоваться экспертными оценками.

Используем метод экспоненциального сглаживания для составления прогнозных значений. Величина параметра сглаживания для показателя численности населения составит: , для показателей «число родившихся» и «число умерших», «число прибывших» и «число выбывших»: . Значения близки к нулю, следовательно, веса, по которым взвешиваются уровни временного ряда, убывают медленно, т.е. при прогнозе учитываются все (или почти все) прошлые наблюдения.

Определяем начальное значение U о для показателя численности населения двумя способами:

1 Способ (средняя арифметическая):

2 Способ (первое значение базы прогноза):

Рассчитываем экспоненциально взвешенную среднюю для каждого года, используя формулу 2, занесем результаты в таблицу.

Таблица 4

Расчет прогнозного значения численности населения Оренбургской области методом экпоненциального сглаживания.

года Численность постоянного населения на 1 января, человек Экспоненциально взвешенная средняя Ut

Расчет средней относительной ошибки

I способ II способ I способ II способ
1 1990 2 151 097 2176434 2 151 097 1,18 0,00
2 1991 2 159 743 2174021 2 151 097 0,66 0,40
3 1992 2 168 257 2172661 2 151 920 0,20 0,75
19 2008 2 119 003 2175920 2 171 738 2,69 2,49
20 2009 2 111 531 2170499 2 166 716 2,79 2,61
прогноз 2010 2 164 883 2 161 460
итого 43 528 685 27,20 29,84
Средняя относительная ошибка ɛ 1,36 1,49
Средняя абсолютная ошибка Δ -6064 5441
Средняя квадратическая ошибка 33749 36868

Величина средней относительной ошибки при расчете 2-м способом выше, но оба значения свидетельствуют о высокой точности прогноза.

Данные о прогнозных значениях показателей других демографических показателей, представим в таблице (расчет полученных параметров в Приложении 2).


Таблица 5

Прогнозные значения абсолютных показателей родившихся и умерших, прибывших и выбывших в Оренбургской области, полученные методом экспоненциального сглаживания.

Абсолютный показатель, человек 2006 2007 2008 Прогноз на 2009 Δ ε
I способ определения экспоненциально взвешенного среднего начального
Родившиеся 23 335 25 776 26 947 23 915 -135 3 275 9,94
Умершие 31 583 31 000 30 904 30 754 64 2 571 8,14
II способ определения экспоненциально взвешенного среднего начального
Родившиеся 23 335 25 776 26 947 25 150 -4296 5 386 20,14
Умершие 31 583 31 000 30 904 29 557 1 241 2 965 14,91
I способ определения экспоненциально взвешенного среднего начального
Прибывшие 31 949 25 570 28 053 37 366 -3539 15857 35,27
Выбывшие 33 225 29 085 25 603 36311 -2070 8458 20,04
II способ определения экспоненциально взвешенного среднего начального
Прибывшие 31 949 25 570 28 053 41 292 -16856 19228 49,84
Выбывшие 33 225 29 085 25 603 38 162 -8348 9757 24,83

Так же как и с показателем численности населения, величина средней относительной ошибки при расчете 2-м способом выше, что свидетельствует о нецелесообразности применения первого значения базы прогноза в качестве экспоненциально взвешенной U о . В целом точность прогноза для показателей естественного движения населения находится в границах высокой точности, для показателей миграционного движения точность прогноза удовлетворительная.

2.3 Нахождение прогнозных значений методом наименьших квадратов

демографический прогноз население численность

Сущность метода наименьших квадратов состоит в минимизации суммы квадратических отклонений между наблюдаемыми и расчетными величинами. Расчетные величины находятся по подобранному уравнению – уравнению регрессии.

Чем меньше расстояние между фактическими значениями и расчетными, тем более точен прогноз, построенный на основе уравнения регрессии. Теоретический анализ сущности изучаемого явления, изменение которого отображается временным рядом, служит основой для выбора кривой. Иногда принимаются во внимание соображения о характере роста уровней ряда. Для нахождения прогнозных значений численности населения часто предполагается, что рост идет в геометрической прогрессии, и тогда сглаживание производится по показательной функции.

(4)

где - численность населения в прогнозный период; - численность населения в период, предшествующий прогнозному; е - основные натурального логарифма; k - общий коэффициент прироста населения, выраженный в долях единиц, рассчитанный по формуле: (5)

где M - число родившихся за период; N – число умерших за период; П - число прибывших за период; В – число выбывших за период; S – средняя численность населения за период; t- период, на который разрабатывается прогноз.

Согласно имеющимся данным, численность населения Оренбургской области на 1 января 2008 года составила 2 119 003 чел., на 1 января 2009 – 2 111 531 чел., за 2008 год родилось 26 947 чел., умерло 30 904 чел., 25 570 чел. прибыло и 29 085 чел. выбыло. Рассчитаем численность населения в 2010-2012 гг. при условии, что коэффициент общего прироста населения () останется неизменным на всем протяжении прогнозных лет:


чел.

чел.

чел.

Сглаживание временных рядов методом наименьших квадратов служит для отражения закономерности развития изучаемого явления. В аналитическом выражении тренда время рассматривается как независимая переменная, а уровни ряда выступают как функция этой независимой переменной. Ясно, что развитие явления зависит не от того, сколько лет прошло с отправного момента, а от того, какие факторы влияли на его развитие, в каком направлении и с какой интенсивностью. Развитие явления во времени выступает как результат действия этих факторов.

Правильно установить тип кривой, тип аналитической зависимости от времени – одна из самых трудных задач предпрогнозного анализа.

Подбор вида функции, описывающей тренд, параметры которой определяются методом наименьших квадратов, производится в большинстве случаев эмпирически, путем построения ряда функций и сравнения их между собой по величине среднеквадратической ошибки, вычисляемой по формуле:

(6)

где – фактические значения ряда динамики;– расчетные (сглаженные) значения ряда динамики; n – число уровней временного ряда; р – число параметров, определяемых в формулах, описывающих тренд.

С помощью программы Excel проверим предположение о том, что изменение численности населения в Оренбургской области, хорошо апроксимируется экспоненциальной линией тренда.


Рис. 1. Динамика численности населения в Оренбургской области с экспоненциальной линией тренда.

Видно, что разница между фактическими и сглаженными значениями данного ряда очень велика. Невысокий коэффициент достоверности аппроксимации также подтверждает, что использовать данный тип тренда нецелесообразно.

Наибольшее приближение к фактическим уровням данного динамического ряда дает функция полинома второй степени.

Рис. 2. Динамика численности населения в Оренбургской области с полиномиальной линией тренда.


При использовании уравнения полинома третьей степени, коэффициент аппроксимации увеличивается до 0,97, но при этом усложняется и сама модель, что может отрицательно сказаться на ее прогностических возможностях.

Уравнение регрессии примет вид:

(7)

- выровненные, т.е. лишенные колебаний, уровни тренда для лет с номером i ; а - это средний (выровненный) уровень тренда на момент или период, принятый за начало отсчета времени, т.е. t = 0; b - это средний за весь период среднегодовой прирост, который изменяется равномерно со средним ускорением, равным 2с; c - константа, главный параметр параболы II порядка.

Параметры a , b и c оцениваются методом наименьших квадратов и отвечают принципу максимального правдоподобия: сумма квадратов отклонений фактических уровней от тренда (от выровненных по уравнению тренда уровней) должна быть минимальной для данного типа уравнения.

На диаграмме уравнение тренда имеет вид: , где =0 в 1990г.

При этом нумерация периодов начинается с t =1. Однако рациональнее начало отсчета времени перенести в середину ряда, т.е. при нечетном п - на период (момент) с номером (п + 1 )/2, а при четном числе уровней ряда - на середину между периодом с номером n /2 и (n/2)+1. Расчет параметров тренда при переносе отсчета времени на середину ряда приведен в приложении 3. Тогда уравнение тренда принимает вид: , где =0,5 в 2000г.

За период 1990-2009г показатель численности населения в Оренбургской области убывал в номинальной оценке ускоренно, со средним ускорением человек за год; средняя убыль населения за весь период составила 3 087 человек; средний уровень численности населения на середину периода был равен 22 084 35 чел.

Для оценки надежности тренда необходимо оценить надежность его главного параметра – ускорения. Средняя ошибка репрезентативности выборочной оценки параметра с вычисляется по формуле:

(8)

Где S ( t ) – оценка генерального показателя колеблемости, учитывающая потерю степеней свободы и определяемая по формуле 6.

Используя данные приложения 3, найдем искомые величины:

Отношение параметра с (половина ускорения) к его средней ошибке - это t-критерий Стьюдента:

Табличное значение критерия Стъюдента Фактическая величина критерия больше табличного, следовательно, вероятность нулевой гипотезы (о равенстве параметра с нулю) чрезвычайно мала. Достоверно известно, что тренд существовал, и что численность населения Оренбургской области снижалась не случайно.

Прогноз по этой модели заключается в подстановке в уравнение тренда номера периода, который прогнозируется. Для 2010 года период времени t = 10,5, прогнозное значение составит:

2010 ==2 069 907 чел.


Полученное прогнозное значение является точечным и не учитывает колеблемость уровней показателя.

При прогнозе с учетом случайной колеблемости учитывается как вызванная колеблемостью ошибка репрезентативности выборочной оценки тренда, так и колебания уровней в отдельные периоды (моменты) относительно тренда.

Общая формула средней ошибки прогноза положения параболического тренда на период с номером от середины базы расчета тренда имеет вид:

(9)

Средняя ошибка тренда на 2010 год равна:

Вероятность того, что фактическая ошибка не превысит одного среднего квадратического отклонения, т.е. m равна при нормальном распределении 0,68. Чтобы получить доверительный интервал прогноза линии тренда с большей вероятностью, например с вероятностью 0,95,среднюю ошибку нужно умножить на величину t-критерия Стъюдента для вероятности 0,95 и n - p степеней свободы.

Получаем вероятную ошибку:

с вероятностью 95% можно утверждать, что тренд численности населения в Оренбургской области в 2010 году проходит в границах 2 069 907±13 307 или от 2 056 600 до 2 083 214 человек.

Определив ошибку репрезентативности выборочной оценки тренда, и колебания уровней в отдельные периоды (моменты) относительно тренда, получаем единую формулу средней ошибки прогноза конкретного отдельного уровня:

(10)

Для искомого прогнозного значения: 11 286 .

Таким образом, для прогнозного значения показателя численности населения на 1 января 2010 года определены границы доверительного интервала 2 046 096 – 2 093 718 человек.

Аналогично рассчитываем прогнозные значения на 2011-2012 годы:

2011 =2 045 646 чел.

Доверительный интервал: (2 020 126; 2 071 166).

2012 =2 019 459 чел.

Доверительный интервал: (1 991 780; 2 047 138)

Средняя относительная ошибка , что свидетельствует о высокой точности прогноза.

Расчет прогнозных значений для других показателей приведен в приложении 3, сведем полученные результаты в общую таблицу:


Таблица 5

Прогнозные значения абсолютных показателей родившихся и умерших, прибывших и выбывших в Оренбургской области, полученные методом наименьших квадратов.

Абсолютный показатель, человек 2006 2007 2008 Прогноз на 2009 Прогноз на 2010 Прогноз на 2011 Δ ε
Родившиеся 23335 25776 26947 29 253 31 220 33 395 0 1135 4,13
Умершие 31 583 31 000 30 904 30 190 29 392 28 470 0 1420 3,69
Абсолютный показатель, человек 2007 2008 2009 Прогноз на 2010 Прогноз на 2011 Прогноз на 2012 Δ ε
Прибывшие 31 949 25 570 28 053 29 586 31 144 33 202 0,11 3499 7,68
Выбывшие 33 225 29 085 25 603 24 352 22 589 20 826 0 2437 5,17

Величины относительной ошибки свидетельствуют о высокой точности прогноза. По имеющимся данным видно, что при наметившихся тенденциях естественный прирост населения в прогнозируемые годы увеличится (увеличение рождаемости и снижение смертности), как и миграционный прирост.

Для сравнения полученных результатов составим сводную таблицу по всем применяемым методам:

Численность постоянного населения на 1 января, человек
МСС МЭС МНК
2007 2 125 503 2 125 503 2 125 503
2008 2 119 003 2 119 003 2 119 003
2009 2 111 531 2 111 531 2 111 531
прогноз
2010 2 116 188 2 164 883 2 069 907
2011 2 117 127 2 045 646
2012 2 115 261 2 019 459
Ср. абсолют. оценка 299 -6064 0,38
Ср. квадрат. оценка 1 478 33749 8628
Ср. относит. ошибка 0,05 1,36 0,017
Число родившихся, чел. Число умерших, чел.
МСС МЭС МНК МСС МЭС МНК
2 006 23335 23335 23335 31 583 31 583 31 583
2 007 25776 25776 25776 31 000 31 000 31 000
2 008 26947 26947 26947 30 904 30 904 30 904
прогноз
2 009 25 743 23 915 29 253 31 130 30 754 30 190
2 010 25 754 31 220 31 087 29 392
2 011 26 125 33 395 31 026 28 470
Ср. абсолют. оценка -85 -135 0 32 64 0
Ср. квадрат. оценка 594 3 275 1135 795 2 571 1420
Ср. относит. ошибка 2 9,94 4,13 2,02 8,14 3,69
Число прибывших, человек Число выбывших, человек
МСС МЭС МНК МСС МЭС МНК
2007 31 949 31 949 31 949 33 225 33 225 33 225
2008 25 570 25 570 25 570 29 085 29 085 29 085
2009 28 053 28 053 28 053 25 603 25 603 25 603
прогноз
2010 29 352 37 366 29 586 28 144 36311 24 352
2011 28 091 31 144 28 457 22 589
2012 28 078 33 202 27 506 20 826
Ср. абсолют. оценка 11 -3539 0,11 32 -2070 0
Ср. квадрат. оценка 2 177 15857 3499 1 161 8458 2437
Ср. относит. ошибка 5 35,27 7,68 2 20,04 5,17

Как видно из таблицы, значения средней квадратической оценки средней относительной ошибки у показателей минимальны для метода скользящей средней, и в целом данный метод дает хорошие результаты при прогнозировании демографических процессов. Кроме того, метод прост в использовании, что открывает широкие возможности для его применения. Метод наименьших квадратов более сложен в работе, но позволяет получить также достоверные результаты при условии подбора вида линии тренда, хорошо аппроксимирующей исходный динамический ряд.

Применение метода экспоненциального сглаживания целесообразно только при условии использования среднего уровня ряда в качестве начального значения экспоненциальной взвешенной. Но и в этом случае, полученные результаты являются самыми ненадежными по сравнению с прогнозированием другими методами.

Следует отметить, что прогнозирование методами экстраполяции основывается на использовании простого методологического аппарата и часто используется для получения будущих оценок социально-экономических процессов. Оправдано их использование и в частности при построении демографических прогнозов, поскольку процессы естественного и миграционного движения достаточно инерционны и не подвержены резким скачкам в уровнях.


Заключение

В соответствии с поставленными задачами в данной работе были исследованы 4 группы методов, используемых при прогнозировании демографических процессов:

1) методы экстраполяции;

2) экономико-математические методы, позволяющие разработать многофакторные динамические модели;

3) методы передвижки возрастов и когорт;

4) методы экспертных оценок.

Опираясь на имеющиеся в распоряжении данные, для практической части работы, была выбрана первая группа методов.


10-09-2015, 16:25


Страницы: 1 2 3 4
Разделы сайта