Тема: Методи за експоненциално изглаждане. Прогнозиране на базата на метода на експоненциалното изглаждане

Задачите за прогнозиране се основават на промяната в някои данни във времето (продажби, търсене, предлагане, БВП, въглеродни емисии, население ...) и проектирането на тези промени в бъдещето. За съжаление, тенденциите, идентифицирани в исторически данни, могат да бъдат нарушени от различни непредвидени обстоятелства. Така че данните в бъдеще може да се различават значително от случилото се в миналото. Това е проблемът с прогнозирането.

Съществуват обаче техники (наречени експоненциално изглаждане), които позволяват не само да се опитаме да предскажем бъдещето, но и да изразим числено несигурността на всичко, свързано с прогнозата. Численото изразяване на несигурността чрез създаване на прогнозни интервали е наистина безценно, но често се пренебрегва в света на прогнозите.

Изтеглете бележка в или формат, примери във формат

Изходни данни

Да приемем, че сте фен на Властелинът на пръстените и правите и продавате мечове от три години (Фигура 1). Нека изведем продажбите графично (фиг. 2). Търсенето се удвои за три години - може би това е тенденция? Ще се върнем към тази идея малко по-късно. Има няколко пика и спадове на графиката, което може да е знак за сезонност. По-специално, пиковете са през месеци 12, 24 и 36, които се оказват през декември. Но може би това е просто съвпадение? Нека разберем.

Просто експоненциално изглаждане

Методите за експоненциално изглаждане разчитат на прогнозиране на бъдещето от данни от миналото, където по-новите наблюдения имат повече тежест от по-старите. Такова претегляне е възможно благодарение на изглаждащите константи. Първият метод за експоненциално изглаждане, който ще опитаме, се нарича просто експоненциално изглаждане (PES). експоненциално изглаждане, SES). Той използва само една изглаждаща константа.

Простото експоненциално изглаждане предполага, че вашите времеви серии от данни имат два компонента: ниво (или средна стойност) и някаква грешка около тази стойност. Няма тенденция или сезонни колебания - има само ниво, около което търсенето се колебае, заобиколено от малки грешки тук и там. Като дава предпочитание на по-нови наблюдения, TEC може да предизвика промени в това ниво. На езика на формулите,

Търсене в момент t = ниво + случайна грешка около нивото в момент t

И така, как намирате приблизителната стойност на нивото? Ако приемем, че всички времеви стойности имат една и съща стойност, тогава трябва просто да изчислим тяхната средна стойност. Това обаче е лоша идея. Трябва да се отдаде по-голяма тежест на последните наблюдения.

Нека създадем няколко нива. Изчислете базовата линия за първата година:

ниво 0 = средно търсене за първата година (месеци 1-12)

За търсенето на мечове то е 163. Използваме ниво 0 (163) като прогноза за търсенето за месец 1. Търсенето през месец 1 е 165, което е 2 меча над ниво 0. Струва си да актуализирате базовата апроксимация. Просто експоненциално изглаждащо уравнение:

ниво 1 = ниво 0 + няколко процента × (търсене 1 - ниво 0)

ниво 2 = ниво 1 + няколко процента × (търсене 2 - ниво 1)

и т.н. „Няколко процента“ се нарича изглаждаща константа и се обозначава с алфа. Може да бъде всяко число от 0 до 100% (0 до 1). По-късно ще научите как да изберете алфа стойност. AT общ случайстойност за различни точки във времето:

Ниво текущ период = ниво предишен период +
алфа × (текущ период на търсене - ниво предишен период)

Бъдещото търсене е равно на последно изчисленото ниво (фиг. 3). Тъй като не знаете какво е алфа, задайте клетка C2 на 0,5 като начало. След като моделът е изграден, намерете алфа, така че сумата от квадратите на грешката да е E2 (или стандартно отклонение– F2) бяха минимални. За да направите това, стартирайте опцията Намиране на решение. За да направите това, преминете през менюто ДАННИ –> Намиране на решение, и поставете в прозореца Опции за търсене на решениенеобходимите стойности (фиг. 4). За да покажете резултатите от прогнозата на диаграмата, първо изберете диапазона A6:B41 и изградете проста линейна диаграма. След това щракнете с десния бутон върху диаграмата, изберете опцията Изберете данни.В прозореца, който се отваря, създайте втори ред и вмъкнете в него прогнози от диапазона A42:B53 (фиг. 5).

Може би имате тенденция

За да проверите това предположение, е достатъчно да се побере линейна регресияпод данните за търсенето и извършете t-тест за нарастването на тази тренд линия (както в ). Ако наклонът на линията е различен от нула и е статистически значим (в теста на Стюдънт, стойността Рпо-малко от 0,05), данните имат тенденция (фиг. 6).

Използвахме функцията LINEST, която връща 10 описателни статистики (ако не сте използвали тази функция преди, препоръчвам я) и функцията INDEX, която ви позволява да "извадите" само трите необходими статистики, а не целия набор. Оказа се, че наклонът е 2,54 и той е значителен, тъй като тестът на Стюдънт показа, че 0,000000012 е значително по-малко от 0,05. Така че тенденция има и остава да я включим в прогнозата.

Експоненциално изглаждане на Holt с корекция на тренда

Често се нарича двойно експоненциално изглаждане, защото има два изглаждащи параметъра, алфа, а не един. Ако времевата последователност има линеен тренд, тогава:

търсене във времето t = ниво + t × тенденция + случайно отклонениениво в момент t

Експоненциалното изглаждане на Holt с корекция на тренда има две нови уравнения, едното за нивото, докато се движи напред във времето, а другото за тренда. Уравнението на нивото съдържа изглаждащия параметър алфа, а уравнението на тенденцията съдържа гама. Ето как изглежда новото уравнение на ниво:

ниво 1 = ниво 0 + тенденция 0 + алфа × (търсене 1 - (ниво 0 + тенденция 0))

забележи, че ниво 0 + тенденция 0е само прогноза в една стъпка от първоначалните стойности до месец 1, така че търсене 1 – (ниво 0 + тенденция 0)е едностепенно отклонение. По този начин уравнението за приближение на основно ниво ще бъде както следва:

ниво на текущ период = ниво на предходен период + тенденция на предходен период + алфа × (търсене на текущия период - (ниво на предходен период) + тенденция на предходен период))

Уравнение за актуализиране на тенденцията:

текущ период на тенденция = предходен период на тенденция + гама × алфа × (текущ период на търсене – (ниво предишен период) + предишен период на тенденция))

Изглаждането на Холт в Excel е подобно на обикновеното изглаждане (фиг. 7) и, както по-горе, целта е да се намерят два коефициента, като същевременно се минимизира сумата от квадратните грешки (фиг. 8). За да получите първоначалното ниво и стойности на тенденция (в клетки C5 и D5 на фигура 7), изградете диаграма за първите 18 месеца на продажбите и добавете линия на тенденция с уравнение към нея. Въведете първоначалната стойност на тренда от 0,8369 и първоначалното ниво от 155,88 в клетки C5 и D5. Прогнозните данни могат да бъдат представени графично (фиг. 9).

Ориз. 7. Експоненциално изглаждане на Holt с корекция на тренда; За да увеличите изображение, щракнете с десния бутон върху него и изберете Отворете изображението в нов раздел

Намиране на модели в данните

Има начин да се тества предсказуемият модел за сила - да се сравнят грешките със себе си, изместени с една стъпка (или няколко стъпки). Ако отклоненията са случайни, тогава моделът не може да бъде подобрен. Възможно е обаче да има сезонен фактор в данните за търсенето. Концепцията за грешка, която корелира със собствената си версия за различен период, се нарича автокорелация (за повече информация относно автокорелацията вижте ). За да изчислите автокорелацията, започнете с данни за грешки в прогнозата за всеки период (прехвърлете колона F на фигура 7 в колона B на фигура 10). Следваща дефиниция средна грешкапрогноза (Фигура 10, клетка B39; формула в клетка: =СРЕДНО(B3:B38)). В колона C се изчислява отклонението на прогнозната грешка от средната стойност; формула в клетка C3: =B3-B$39. След това последователно преместете колона C с колона надясно и ред надолу. Формули в клетки D39: =SUMPRODUCT($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Какво може да означава „синхронно движение“ с колона C за една от колоните D: O. Например, ако колони C и D са синхронни, тогава число, което е отрицателно в една от тях, трябва да бъде отрицателно в другата, положително в една , положителен в приятел. Това означава, че сборът от произведенията на двете колони ще бъде значителен (разликите се натрупват). Или, което е същото, колкото по-близо до нула е стойността в диапазона D41:O41, толкова по-ниска е корелацията на колоната (съответно от D до O) с колона C (фиг. 11).

Една автокорелация е над критичната стойност. Изместената година грешка корелира сама със себе си. Това означава 12-месечен сезонен цикъл. И това не е изненадващо. Ако погледнете графиката на търсенето (Фигура 2), се оказва, че има пикове в търсенето всяка Коледа и спадове през април-май. Помислете за техника за прогнозиране, която отчита сезонността.

Мултипликативно експоненциално изглаждане на Холт-Уинтърс

Методът се нарича мултипликативен (от multiplicate - умножавам), защото използва умножение за отчитане на сезонността:

Търсене към момент t = (ниво + t × тенденция) × сезонна корекция към момент t × всички оставащи нередовни корекции, които не можем да отчетем

Изглаждането на Holt-Winters се нарича още тройно експоненциално изглаждане, защото има три изглаждащи параметъра (алфа, гама и делта сезонен фактор). Например, ако има 12-месечен сезонен цикъл:

Месечна прогноза 39 = (ниво 36 + 3 × тенденция 36) x сезонност 27

При анализ на данните е необходимо да се установи каква е тенденцията в серията данни и каква е сезонността. За да извършите изчисления по метода на Holt-Winters, трябва:

Гладки исторически данни с помощта на метода на пълзящата средна.
Сравнете изгладената версия на времевия ред с оригинала, за да получите груба оценка на сезонността.
Вземете нови данни без сезонен компонент.
Намерете приближения за ниво и тенденция въз основа на тези нови данни.

Започнете с оригиналните данни (колони A и B на Фигура 12) и добавете колона C с изгладени стойности въз основа на подвижната средна. Тъй като сезонността има 12-месечни цикли, има смисъл да се използва 12-месечна средна стойност. Има малък проблем с тази средна стойност. 12 е четно число. Ако изгладите търсенето за месец 7, трябва ли да се счита за средното търсене от месеци 1 до 12 или от 2 до 13? За да се справим с тази трудност, трябва да изгладим търсенето с помощта на „пълзяща средна 2x12“. Тоест, вземете половината от двете средни стойности от месеци 1 до 12 и от 2 до 13. Формулата в клетка C8 е: =(СРЕДНО(B3:B14)+СРЕДНО(B2:B13))/2.

Изгладени данни за месеци 1–6 и 31–36 не могат да бъдат получени, тъй като няма достатъчно предишни и следващи периоди. За по-голяма яснота оригиналните и изгладени данни могат да бъдат показани на диаграма (фиг. 13).

Сега, в колона D, разделете първоначалната стойност на изгладената стойност, за да получите оценка на сезонната корекция (колона D на фигура 12). Формула в клетка D8: =B8/C8. Обърнете внимание на пикове от 20% над нормалното търсене през месеци 12 и 24 (декември), докато през пролетта има спадове. Тази техника за изглаждане ви дава две точкови оценкиза всеки месец (общо 24 месеца). Колона E е средната стойност на тези два фактора. Формулата в клетка E1 е: =СРЕДНО(D14,D26). За по-голяма яснота нивото на сезонните колебания може да бъде представено графично (фиг. 14).

Вече можете да получите сезонно коригирани данни. Формула в клетка G1: =B2/E2. Изградете графика въз основа на данните в колона G, допълнете я с линия на тенденция, покажете уравнението на тенденцията на диаграмата (фиг. 15) и използвайте коефициентите в следващите изчисления.

Оформете нов лист, както е показано на фиг. 16. Заменете стойностите в диапазона E5:E16 от фиг. 12 области E2:E13. Вземете стойностите на C16 и D16 от уравнението на тренд линията на фиг. 15. Задайте стойностите на изглаждащите константи да започват от около 0,5. Разширете стойностите в ред 17 в диапазона от месеци 1 до 36. Стартирайте Намиране на решениеза оптимизиране на коефициентите на изглаждане (фиг. 18). Формула в клетка B53: =(C$52+(A53-A$52)*D$52)*E41.

Сега в направената прогноза трябва да проверите автокорелациите (фиг. 18). Тъй като всички стойности са разположени между горната и долната граница, разбирате, че моделът е свършил добра работа за разбиране на структурата на стойностите на търсенето.

Изграждане на доверителен интервал за прогнозата

Така че имаме доста работеща прогноза. Как задавате горни и долни граници, които могат да се използват за правене на реалистични предположения? Симулацията Монте Карло, с която вече се запознахте (вижте също), ще ви помогне за това. Въпросът е да се генерират бъдещи сценарии на поведение на търсенето и да се определи групата, в която попадат 95% от тях.

Премахнете прогнозата от клетки B53:B64 от листа на Excel (вижте Фиг. 17). Там ще напишете търсене въз основа на симулацията. Последният може да се генерира с помощта на функцията NORMINV. За следващите месеци просто трябва да му предоставите средната стойност (0), стандартното разпределение (10,37 от клетка $H$2) и произволно числоот 0 до 1. Функцията ще върне отклонението с вероятност, съответстваща на камбанообразната крива. Поставете симулация на грешка в една стъпка в клетка G53: =NORMINV(RAND();0;H$2). Разтягането на тази формула до G64 ви дава симулации на грешката на прогнозата за 12-месечна прогноза с една стъпка (Фигура 19). Вашите симулационни стойности ще се различават от тези, показани на фигурата (ето защо това е симулация!).

С Forecast Error имате всичко необходимо, за да актуализирате нивото, тенденцията и сезонния фактор. Затова изберете клетки C52:F52 и ги разтегнете до ред 64. В резултат на това имате симулирана грешка в прогнозата и самата прогноза. Отивайки от обратното, е възможно да се предвидят стойностите на търсенето. Вмъкнете формулата в клетка B53: =F53+G53 и я разтегнете до B64 (фиг. 20, диапазон B53:F64). Сега можете да натиснете бутона F9, като всеки път актуализирате прогнозата. Поставете резултатите от 1000 симулации в клетки A71:L1070, като всеки път транспонирате стойности от диапазона B53:B64 към диапазона A71:L71, A72:L72, ... A1070:L1070. Ако ви притеснява, напишете VBA кода.

Сега имате 1000 сценария за всеки месец и можете да използвате функцията PERCENTILE, за да получите горната и долната граница в средата на 95% доверителен интервал. В клетка A66 формулата е: = ПРОЦЕНТИЛ (A71: A1070, 0,975) и в клетка A67: = ПРОЦЕНТИЛ (A71: A1070, 0,025).

Както обикновено, за яснота данните могат да бъдат представени в графична форма(фиг. 21).

Има две интересни точки на графиката:

Маржът на грешка се увеличава с времето. Има смисъл. Несигурността се натрупва всеки месец.
По същия начин грешката се увеличава в частите, попадащи в периоди на сезонно увеличение на търсенето. С последващото си падане грешката се свива.

По материал от книга на Джон Форман. – М.: Издател Алпина, 2016. – С. 329–381

1. Основни методически положения.

Простият метод на експоненциално изглаждане използва претеглена (експоненциална) пълзяща средна на всички предишни наблюдения. Този модел най-често се прилага за данни, в които е необходимо да се оцени наличието на връзка между анализираните показатели (тенденция) или зависимостта на анализираните данни. Целта на експоненциалното изглаждане е да се оцени текущото състояние, резултатите от което ще определят всички бъдещи прогнози.

Експоненциалното изглаждане осигурявапостоянно актуализиране на модела поради най-новите данни. Този метод се основава на осредняване (изглаждане) на времевата поредица от минали наблюдения в низходяща (експоненциална) посока. Тоест на по-късните събития се придава по-голяма тежест. Теглото се задава, както следва: за последното наблюдение теглото ще бъде стойността α, за предпоследното - (1-α), за това, което е било преди него - (1-α) 2 и т.н.

В изгладена форма новата прогноза (за времеви период t + 1) може да бъде представена като среднопретеглена стойност на последното наблюдение на количество в момент t и предишната му прогноза за същия период t. Освен това теглото α се присвоява на наблюдаваната стойност, а теглото (1- α) се присвоява на прогнозата; се приема, че 0< α<1. Это правило в общем виде можно записать следующим образом.

Нова прогноза = [α*(последно наблюдение)]+[(1- α)*последна прогноза]

къде е прогнозната стойност за следващия период;

α е изглаждащата константа;

Y t е наблюдението на стойността за текущия период t;

Предишната изгладена прогноза на тази стойност за периода t.

Експоненциалното изглаждане е процедура за непрекъснато преразглеждане на прогнозните резултати в светлината на най-новите развития.

Изглаждащата константа α е претеглен фактор. Реалната му стойност се определя от степента, в която текущото наблюдение трябва да повлияе на прогнозираната стойност. Ако α е близо до 1, тогава прогнозата взема предвид стойността на грешката на последната прогноза. Обратно, за малки стойности на α, прогнозираната стойност е най-близка до предишната прогноза. Може да се разглежда като претеглена средна стойност на всички минали наблюдения с тегла, намаляващи експоненциално с „възрастта“ на данните.

Таблица 2.1

Сравнение на влиянието на различни стойности на изглаждащите константи

Константата α е ключът към анализа на данните. Ако се изисква прогнозираните стойности да са стабилни и случайните отклонения да са изгладени, е необходимо да изберете малка стойност на α. Голяма стойност на константата α има смисъл, ако имате нужда от бърз отговор на промени в спектъра на наблюдение.

2. Практически пример за експоненциално изглаждане.

Представени са данните на компанията по отношение на обема на продажбите (хиляди единици) за седем години, изглаждащата константа е взета равна на 0,1 и 0,6. Данните за 7 години съставляват тестовата част; върху тях е необходимо да се оцени ефективността на всеки един от моделите. За експоненциално изглаждане на серията първоначалната стойност се приема равна на 500 (първата стойност на действителните данни или средната стойност за 3-5 периода се записва в изгладената стойност за 2-ро тримесечие).

Таблица 2.2

Изходни данни

време	Действителна стойност (действителна)	Изгладена стойност	Грешка в прогнозата
година	четвърт	0,1	0,1
превъзходен	според формулата
			#N/A		0,00
		500,00		-150,00
		485,00	485,00	-235,00
		461,50	461,50	-61,50
			455,35	455,35	-5,35
		454,82	454,82	-104,82
		444,33	444,33	-244,33
		419,90	419,90	-119,90
			407,91	407,91	-57,91
		402,12	402,12	-202,12
		381,91	381,91	-231,91
		358,72	358,72	41,28
			362,84	362,84	187,16
		381,56	381,56	-31,56
		378,40	378,40	-128,40
		365,56	365,56	184,44
			384,01	384,01	165,99
		400,61	400,61	-0,61
		400,55	400,55	-50,55
		395,49	395,49	204,51
			415,94	415,94	334,06
		449,35	449,35	50,65
		454,41	454,41	-54,41
		448,97	448,97	201,03
			469,07	469,07	380,93

На фиг. 2.1 показва прогноза, базирана на експоненциално изглаждане с изглаждаща константа от 0,1.

Ориз. 2.1. Експоненциално изглаждане

Решение в Excel.

1. Изберете менюто "Инструменти" - "Анализ на данни". От списъка с инструменти за анализ изберете Експоненциално изглаждане. Ако в менюто "Инструменти" няма анализ на данни, тогава трябва да инсталирате "Пакет за анализ". За да направите това, намерете елемента "Настройки" в "Параметри" и в диалоговия прозорец, който се показва, поставете отметка в квадратчето за "Пакет за анализ", щракнете върху OK.

2. Диалоговият прозорец, показан на фиг. 2.2.

3. В полето "интервал на въвеждане" въведете стойностите на първоначалните данни (плюс една свободна клетка).

4. Поставете отметка в квадратчето „етикети“ (ако въведеният диапазон съдържа имена на колони).

5. Въведете стойност (1-α) в полето за коефициент на затихване.

6. В полето "интервал за въвеждане" въведете стойността на клетката, в която искате да видите получените стойности.

7. Поставете отметка в квадратчето "Опции" - "Извеждане на графика", за да го изградите автоматично.

Ориз. 2.2. Диалогов прозорец за експоненциално изглаждане

3. Задачата на лабораторната работа.

Има първоначални данни за обемите на производство на маслодобивно предприятие за 2 години, представени в таблица 2.3:

Таблица 2.3

Изходни данни

Извършете експоненциално изглаждане на серията. Вземете експоненциалния коефициент на изглаждане равен на 0,1; 0,2; 0,3. Коментирайте резултатите. Можете да използвате статистическите данни, представени в Приложение 1.

Прост и логически ясен модел на времеви редове има следната форма:

Y t = b + e t

y, = b + rn (11.5)

където b е константа, e е случайна грешка. Константата b е относително стабилна за всеки интервал от време, но може също така да се променя бавно с течение на времето. Един интуитивен начин за извличане на стойността на b от данните е да се използва изглаждане на пълзяща средна, при което на последните наблюдения се дават по-високи тегла от предпоследните, предпоследните са с по-голяма тежест от предпоследните и т.н. Простото експоненциално изглаждане е точно това. Тук експоненциално намаляващи тегла се присвояват на по-стари наблюдения, докато, за разлика от подвижната средна, се вземат предвид всички предишни наблюдения от серията, а не само тези, които са попаднали в определен прозорец. Точната формула за просто експоненциално изглаждане е:

S t = a y t + (1 - a) S t -1

Когато тази формула се прилага рекурсивно, всяка нова изгладена стойност (която също е прогноза) се изчислява като среднопретеглена стойност на текущото наблюдение и изгладената серия. Очевидно резултатът от изглаждането зависи от параметъра a . Ако a е 1, тогава предишните наблюдения се игнорират напълно. Ако a е 0, тогава текущите наблюдения се игнорират. Стойности на a между 0 и 1 дават междинни резултати. Емпиричните изследвания показват, че простото експоненциално изглаждане често дава доста точна прогноза.

На практика обикновено се препоръчва да се приема по-малко от 0,30. Въпреки това, изборът на по-голямо от 0,30 понякога дава по-точна прогноза. Това означава, че все още е по-добре да се оцени оптималната стойност на a от реални данни, отколкото да се използват общи препоръки.

На практика оптималният параметър за изглаждане често се търси с помощта на процедура за търсене в мрежа. Възможният диапазон от стойности на параметрите е разделен от решетка с определена стъпка. Например, помислете за мрежа от стойности от a = 0,1 до a = 0,9 със стъпка от 0,1. След това се избира стойността на a, за която сумата от квадрати (или средни квадрати) на остатъците (наблюдавани стойности минус прогнози една стъпка напред) е минимална.

Microsoft Excel предоставя функцията за експоненциално изглаждане, която обикновено се използва за изглаждане на нивата на емпиричен времеви ред въз основа на простия метод на експоненциално изглаждане. За да извикате тази функция, изберете Инструменти Þ Анализ на данни от лентата с менюта. На екрана ще се отвори прозорецът за анализ на данни, в който трябва да изберете стойността Експоненциално изглаждане (Експоненциално изглаждане). В резултат на това ще се появи диалоговият прозорец Експоненциално изглаждане.

В диалоговия прозорец Експоненциално изглаждане се задават почти същите параметри като в диалоговия прозорец Плъзгаща средна, обсъден по-горе.

1. Входен диапазон (Входни данни) - в това поле се въвежда диапазон от клетки, съдържащи стойностите на изследвания параметър.

2. Етикети - това поле за отметка е отметнато, ако
първият ред (колона) във входния диапазон съдържа заглавка. Ако заглавката липсва, отметката трябва да бъде изчистена. В този случай стандартните имена ще бъдат автоматично генерирани за данните от изходния диапазон.

3. Фактор на затихване - в това поле се въвежда стойността на избрания експоненциален коефициент на изглаждане a. Стойността по подразбиране е a = 0,3.

4. Изходни опции - в тази група, освен че можете да зададете диапазон от клетки за изходни данни в полето Изходен диапазон, можете също да изисквате автоматично изчертаване на графика, за което трябва да поставите отметка на опцията Извеждане на диаграма и да изчислите стандартно грешки, за които трябва да поставите отметка на опцията Standard Errog (Стандартни грешки).

Задача 2.С помощта на програмата Microsoft Excel, използвайки функцията Exponential Smoothing, на базата на данните за обема на изхода от Задача 1, изчислете изгладените изходни нива и стандартните грешки. След това представете действителните и предвидените данни с помощта на диаграма. Подсказка: трябва да получите таблица и графика, подобни на тези в задача 1, но с различни изгладени нива и стандартни грешки.

Метод на аналитично подравняване

където са теоретичните стойности на времевия ред, изчислени съгласно съответното аналитично уравнение в момент t.

Дефинирането на теоретичните (изчислените) стойности се извършва на базата на така наречения адекватен математически модел, който най-добре отразява основната тенденция в развитието на динамичния ред.

Най-простите модели (формули), изразяващи тенденцията на развитие, са следните:

Линейна функция, чиято графика е права линия:

Експоненциална функция:

Y t = a 0 * a 1 t

Степенна функция от втори ред, чиято графика е парабола:

Y t = a 0 + a 1 * t + a 2 * t 2

Логаритмична функция:

Y t = a 0 + a 1 * ln T

Функционалните параметри обикновено се изчисляват с помощта на метода на най-малките квадрати, при който минималната точка от сумата на квадратите на отклоненията между теоретичното и емпиричното ниво се приема като решение:

където - подравнени (изчислени) нива, а Yt - действителни нива.

Параметрите на уравнение a i, удовлетворяващи това условие, могат да бъдат намерени чрез решаване на системата от нормални уравнения. Въз основа на намереното уравнение на тенденцията се изчисляват подравнените нива.

подравняване по права линиясе използва в случаите, когато абсолютните печалби са практически постоянни, т.е. когато нивата се променят в аритметична прогресия (или близка до нея).

Подравняване чрез експоненциална функциясе прилага, когато серията отразява развитието в геометричната професия, т.е. факторите на растеж на веригата са практически постоянни.

Подравняване на мощностната функция(парабола от втори ред) се използва, когато времевият ред се променя с постоянни темпове на растеж на веригата.

Нивелиране чрез логаритмична функциясе използва, когато серията отразява развитие с по-бавен растеж в края на периода, т.е. когато нарастването на крайните нива на динамичния ред клони към нула.

Според изчислените параметри се синтезира трендовият модел на функцията, т.е. получаване на стойности a 0 , a 1 , a ,2 и заместването им в желаното уравнение.

Правилността на изчисленията на аналитичните нива може да се провери чрез следното условие: сумата от стойностите на емпиричните серии трябва да съвпада със сумата на изчислените нива на подравнените серии. В този случай може да възникне малка грешка в изчисленията поради закръгляване на изчислените стойности:

За да се оцени точността на модела на тенденцията, се използва коефициентът на определяне:

където е дисперсията на теоретичните данни, получени от тренд модела, и е дисперсията на емпиричните данни.

Моделът на тенденцията е адекватен на изследвания процес и отразява тенденцията на неговото развитие при стойности на R 2, близки до 1.

След като изберете най-адекватния модел, можете да направите прогноза за всеки от периодите. При правенето на прогнози те оперират не с точкова, а с интервална оценка, определяща т. нар. доверителни интервали на прогнозата. Стойността на доверителния интервал се определя най-общо, както следва:

къде е стандартното отклонение от тренда; та-таблична стойност на t-теста на Student на ниво на значимост а, което зависи от нивото на значимост а(%) и брой степени на свобода k = n- T.Стойността - се определя по формулата:

където и са действителните и изчислените стойности на нивата на динамичната серия; П -брой нива на редове; T- броя на параметрите в уравнението на тенденцията (за уравнението на правата линия T - 2, за уравнение на парабола от 2-ри ред t = 3).

След необходимите изчисления се определя интервал, в който с определена вероятност ще се намира прогнозираната стойност.

Използването на Microsoft Excel за изграждане на модели на тенденции е доста просто. Първо, емпиричните времеви редове трябва да бъдат представени като диаграма от един от следните типове: хистограма, стълбовидна диаграма, графика, точкова диаграма, диаграма с площи и след това щракнете с десния бутон върху един от маркерите за данни на диаграмата. В резултат на това самата времева серия ще бъде маркирана на диаграмата и контекстното меню ще се отвори на екрана. От това меню изберете командата Add Trendline. Ще се покаже диалоговият прозорец Добавяне на линия на тенденция.

В раздела Тип на този диалогов прозорец е избран желаният тип тенденция:

1. линеен (Линеен);

2. логаритмичен (Логаритмичен);

3. полином, от 2-ра до 6-та степен включително (Полином);

4. мощност (Power);

5. експоненциален (Exponential);

6. пълзяща средна, с индикация за периода на изглаждане от 2 до 15 (Moving Average).

В раздела Опции на този диалогов прозорец се задават допълнителни опции за тенденция.

1. Име на трендовата линия (Име на изгладената крива) - в тази група се избира името, което ще се показва на графиката, за да посочи функцията, използвана за изглаждане на времевия ред. Възможни са следните опции:

♦ Автоматично – Когато радиобутонът е зададен на тази позиция, Microsoft Excel автоматично генерира името на функцията за изглаждане на тренда въз основа на избрания тип тренд, като Linear (Линейна функция).

♦ По избор - Когато радиобутонът е настроен на тази позиция, можете да въведете свое собствено име за функцията на тенденцията в полето вдясно, с дължина до 256 знака.

2. Прогноза (Forecast) - в тази група можете да посочите колко периода напред (поле Forward) искате да проектирате тренд линия в бъдещето и колко периода назад (поле Backward) искате да проектирате тренд линия в миналото (тези полета не са налични в режим на подвижна средна).

3. Задаване на пресечна точка (пресечна крива с Y-ос в точка) - това квадратче за отметка и полето за въвеждане, разположено вдясно, ви позволяват директно да посочите точката, в която тренд линията трябва да пресича Y-оста (тези полета не са налични за всички режими).

4. Показване на уравнението на диаграмата - когато тази опция е отметната, уравнение, описващо изглаждащата тренд линия, ще бъде показано на диаграмата.

5. Покажете стойността R-квадрат на диаграмата R2)-когато това квадратче е отметнато, диаграмата ще показва стойността на коефициента на детерминация.

Лентите за грешки също могат да бъдат показани заедно с линия на тенденция върху графика на времеви серии. За да вмъкнете ленти за грешки, изберете серия от данни, щракнете с десния бутон върху нея и изберете командата Форматиране на серия от данни от изскачащото контекстно меню. На екрана ще се отвори диалоговият прозорец Форматиране на серия от данни, в който трябва да отидете в раздела Y ленти за грешки (Y-грешки).

В този раздел, с помощта на превключвателя Количество на грешката, вие избирате вида на баровете и опцията за тяхното изчисляване в зависимост от вида на грешката.

1. Фиксирана стойност (Fixed value) - когато превключвателят е поставен в тази позиция, постоянната стойност, посочена в полето на брояча вдясно, се приема като стойност на допустимата грешка;

2. Процент (относителна стойност) - когато превключвателят е настроен на тази позиция, допустимото отклонение се изчислява за всяка точка от данни, въз основа на процентната стойност, посочена в полето на брояча вдясно;

3. Стандартно отклонение(я) - когато превключвателят е настроен на тази позиция, стандартното отклонение се изчислява за всяка точка от данни, което след това се умножава по числото, посочено в полето на брояча вдясно (множител);

4. Стандартна грешка - когато превключвателят е поставен в тази позиция, се приема стойността на стандартната грешка, която е постоянна за всички данни;

5. По избор (По избор) - когато превключвателят е настроен на тази позиция, произволен масив от стойности на отклонение се въвежда в положителна и / или отрицателна посока (можете да въведете връзки към диапазон от клетки).

Лентите за грешки също могат да бъдат форматирани. За да направите това, изберете ги, като щракнете с десния бутон на мишката и изберете командата Format Error Bars от изскачащото контекстно меню.

Задача 3.С помощта на програмата Microsoft Excel, въз основа на данните за обема на изданието на Задача 1, трябва:

Представете времева серия като графика, изградена с помощта на съветника за диаграми. След това добавете линия на тенденция, като изберете най-подходящата версия на уравнението.

Представете резултатите под формата на таблица "Избор на уравнението на тренда":

Таблица "Избор на уравнението на тренда"

Представете избраното уравнение графично, като нанесете данните за името на получената функция и стойността на достоверността на апроксимацията (R 2).

Задача 4. Отговорете на следните въпроси:

1. При анализ на тенденцията за определен набор от данни коефициентът на детерминация за линейния модел се оказа 0,95, за логаритмичния модел - 0,8, а за полинома от трета степен - 0,9636. Кой трендов модел е най-адекватен за изследвания процес:

а) линейни;

б) логаритмичен;

в) полином от 3-та степен.

2. Според данните, представени в задача 1, прогнозирайте обема на продукцията през 2003 г. Каква обща тенденция в поведението на изследваното количество следва от резултатите от вашата прогноза:

а) има спад в производството;

б) производството остава на същото ниво;

в) има увеличение на производството.

В този материал бяха разгледани основните характеристики на времевия ред, моделите на разлагане на времевия ред, както и основните методи за изглаждане на серията - методът на плъзгащата се средна, експоненциалното изглаждане и аналитичното подравняване. За да разреши тези проблеми, Microsoft Excel предлага инструменти като Moving Average (Moving Average) и Exponential Smoothing (Exponential Smoothing), които ви позволяват да изгладите нивата на емпиричен времеви ред, както и командата Add Trendiine (Добавяне на тренд линия ), което ви позволява да изграждате модели на тенденции и да правите прогноза въз основа на наличните стойности на времевия ред.

P.S. За да активирате пакета за анализ на данни, изберете командата Инструменти → Анализ на данни (Инструменти → Анализ на данни).

Ако липсва анализ на данни, трябва да изпълните следните стъпки:

1. Изберете командата Инструменти → Добавки (Добавки).

2. Изберете Analysis ToolPak от предложения списък с настройки и след това щракнете върху OK. След това пакетът за персонализиране на Data Analysis ще бъде изтеглен и свързан с Excel. Съответната команда ще се появи в менюто Инструменти.

©2015-2019 сайт
Всички права принадлежат на техните автори. Този сайт не претендира за авторство, но предоставя безплатно използване.
Дата на създаване на страницата: 2016-04-27

Екстраполация - това е метод на научно изследване, който се основава на разпространението на минали и настоящи тенденции, модели, връзки с бъдещото развитие на обекта на прогнозиране. Екстраполационните методи включват метод на пълзяща средна, метод на експоненциално изглаждане, метод на най-малките квадрати.

Метод на експоненциално изглаждане най-ефективни при разработването на средносрочни прогнози. Допустимо е при прогнозиране само за един период напред. Основните му предимства са простотата на изчислителната процедура и възможността да се вземат предвид теглата на първоначалната информация. Работната формула на метода на експоненциалното изглаждане е:

Има два проблема с прогнозирането с помощта на този метод:

избор на стойността на изглаждащия параметър α;
определяне на началната стойност Uo.

Стойността на α зависи колко бързо намалява тежестта на влиянието на предишни наблюдения. Колкото по-голямо е α, толкова по-малко е влиянието на предишни години. Ако стойността на α е близка до единица, това води до отчитане в прогнозата главно на влиянието само на последните наблюдения. Ако стойността на α е близка до нула, тогава теглата, с които се претеглят нивата на динамичния ред, намаляват бавно, т.е. прогнозата взема предвид всички (или почти всички) минали наблюдения.

По този начин, ако има увереност, че първоначалните условия, въз основа на които е разработена прогнозата, са надеждни, трябва да се използва малка стойност на изглаждащия параметър (α→0). Когато параметърът на изглаждане е малък, изследваната функция се държи като средна стойност на голям брой минали нива. Ако няма достатъчно доверие в началните условия на прогнозата, тогава трябва да се използва голяма стойност на α, което ще доведе до отчитане в прогнозата главно на влиянието на последните наблюдения.

Няма точен метод за избор на оптималната стойност на изглаждащия параметър α. В някои случаи авторът на този метод, професор Браун, предложи да се определи стойността на α въз основа на дължината на интервала на изглаждане. В този случай α се изчислява по формулата:

където n е броят на наблюденията, включени в интервала на изглаждане.

Uo проблем с избора (експоненциално претеглена първоначална средна) се решава по следните начини:

ако има данни за развитието на явлението в миналото, тогава можете да използвате средното аритметично и да приравните Uo към него;
ако няма такава информация, тогава първоначалната първа стойност на прогнозната база Y1 се използва като Uo.

Можете също да използвате експертни мнения.

Имайте предвид, че когато изучавате икономически времеви редове и прогнозирате икономически процеси, методът на експоненциалното изглаждане не винаги „работи“. Това се дължи на факта, че икономическите времеви редове са твърде кратки (15-20 наблюдения), а в случаите, когато растежът и темповете на растеж са високи, този метод не „успява“ да отрази всички промени.

Пример за прилагане на метода на експоненциалното изглаждане за разработване на прогноза

Задача . Има данни, характеризиращи нивото на безработицата в региона, %

Изградете прогноза за нивото на безработица в региона за месеците ноември, декември, януари, като използвате методите: пълзяща средна, експоненциално изглаждане, най-малки квадрати.
Изчислете грешките в получените прогнози, като използвате всеки метод.
Сравнете получените резултати, направете изводи.

Решение за експоненциално изглаждане

1) Определете стойността на параметъра за изглаждане по формулата:

където n е броят на наблюденията, включени в интервала на изглаждане. α = 2/ (10+1) = 0,2

2) Определяме първоначалната стойност Uo по два начина:
Метод I (средно аритметично) Uo = (2,99 + 2,66 + 2,63 + 2,56 + 2,40 + 2,22 + 1,97 + 1,72 + 1,56 + 1,42)/ 10 = 22,13/10 = 2,21
Метод II (взимаме първата стойност на прогнозната база) Uo = 2,99

3) Изчислете експоненциално претеглената средна стойност за всеки период, като използвате формулата

където t е периодът, предхождащ прогнозния период; t+1 – прогнозен период; Ut+1 - прогнозен индикатор; α - параметър на изглаждане; Уt е действителната стойност на изследвания показател за периода, предхождащ прогнозата; Ut - експоненциално претеглена средна стойност за периода, предхождащ прогнозния период.

Например:
Ufeb \u003d 2,99 * 0,2 + (1-0,2) * 2,21 \u003d 2,37 (I метод)
Umart \u003d 2,66 * 0,2 + (1-0,2) * 2,37 \u003d 2,43 (I метод) и т.н.

Ufeb \u003d 2,99 * 0,2 + (1-0,2) * 2,99 \u003d 2,99 (II метод)
Umart \u003d 2,66 * 0,2 + (1-0,2) * 2,99 \u003d 2,92 (II метод)
Uapr \u003d 2,63 * 0,2 + (1-0,2) * 2,92 \u003d 2,86 (II метод) и т.н.

4) Използвайки същата формула, изчисляваме прогнозираната стойност
Ноември \u003d 1,42 * 0,2 + (1-0,2) * 2,08 \u003d 1,95 (I метод)
Ноември \u003d 1,42 * 0,2 + (1-0,2) * 2,18 \u003d 2,03 (II метод)
Поставяме резултатите в таблица.

5) Изчислете средната относителна грешка по формулата:

ε = 209,58/10 = 20,96% (метод I)
ε = 255,63/10 = 25,56% (метод II)

Във всеки случай точност на прогнозата е задоволително, тъй като средната относителна грешка попада в рамките на 20-50%.

След като решихме този проблем чрез методи пълзяща средна и най-малки квадрати Нека направим изводи.

Експоненциалното изглаждане е по-сложен метод на среднопретеглена стойност. Всяка нова прогноза се основава на предишната прогноза плюс процентната разлика между тази прогноза и действителната стойност на серията в този момент.

F t \u003d F t -1 + (A t -1 - F t -1) (2)

Където: F t – прогноза за период t

F t-1– прогноза за период t-1

- изглаждаща константа

A t - 1 – реално търсене или продажби за периода t-1

Изглаждащата константа е процент от грешката при прогнозиране. Всяка нова прогноза е равна на предишната прогноза плюс процент от предишната грешка.

Чувствителността на корекцията на прогнозата към грешката се определя от константата на изглаждане, колкото по-близка е нейната стойност до 0, толкова по-бавно прогнозата ще се коригира спрямо грешките на прогнозата (т.е. колкото по-голяма е степента на изглаждане). Обратно, колкото по-близо е стойността до 1,0, толкова по-висока е чувствителността и по-малко изглаждане.

Изборът на изглаждаща константа е най-вече въпрос на свободен избор или проба и грешка. Целта е да се избере изглаждаща константа, така че, от една страна, прогнозата да остане достатъчно чувствителна към реални промени в данните от времевия ред, а от друга страна, да изглади добре скоковете, причинени от случайни фактори. Често използваните стойности са в диапазона от 0,05 до 0,50.

Експоненциалното изглаждане е един от най-широко използваните методи за прогнозиране, отчасти поради минималните изисквания за съхранение и лекотата на изчисление, и отчасти поради лекотата, с която системата от коефициенти на усилване може да бъде променена чрез просто промяна на стойността на .

Таблица 3. Експоненциално изглаждане

месечен цикъл	Действително търсене	α = 0,1	α = 0,4
прогноза	грешка	прогноза	грешка
	10 000	-	-	-	-
	11 200	10 000	11 200-10 000=1 200	10 000	11 200-10 000=1 200
	11 500	10 000+0,1(11 200-10 000)=10 120	11 500-10 120=1 380	10 000+0,4(11 200-10 000)=10 480	11 500-10 480=1 020
	13 200	10 120+0,1(11 500-10 120)=10 258	13 200-10 258=2 942	10 480+0,4(11 500-10 480)=10 888	13 200-10 888=2 312
	14 500	10 258+0,1(13 200-10 258)=10 552	14 500-10 552=3 948	10 888+0,4(13 200-10 888)=11 813	14 500-11 813=2 687
	-	10 552+0,1(14 500-10 552)=10 947	-	11 813+0,4(14 500-11 813)=12 888	-

Методи за Trend

Има два важни метода, които могат да се използват за разработване на прогнози, когато е налице тенденция. Един от тях включва използването на уравнение на тренда; друг е експоненциално изглаждащо разширение.

Уравнение на тенденцията:

Уравнението на линейната тенденция има следната форма:

Y t = a + δ∙ t (3)

Където: T - определен брой периоди от време от t=0;

Y t– прогноза за периода T;

α - значение Y tпри t=0

δ - наклон на линията.

Директни коефициенти α и δ , може да се изчисли от исторически данни за определен период, като се използват следните две уравнения:

δ= , (4)

α = , (5)

Където: н - брой периоди,

г– стойност на динамичния ред

Таблица 3. Ниво на тенденция.

Период (t)	година	Ниво на продажби (y)	t∙y	t2
		10 000	10 000
			11 200	22 400
			11 500	34 500
			13 200	52 800
			14 500	72 500
Обща сума:		-	60 400	192 200

Нека изчислим коефициентите на тренд линията:

δ=

И така, линията на тренда Y t = α + δ ∙ t

в нашия случай, Y t = 43 900+1 100 ∙t,

Където t = 0за период 0.

Нека направим уравнение за период 6 (2015) и 7 (2016):

– прогноза за 2015г.

Y 7 \u003d 43 900 + 1 100 * 7 \u003d 51 600

Нека изградим графика:

Експоненциално изглаждане на тренда

Може да се използва вариант на просто експоненциално изглаждане, когато времевият ред показва тенденция. Тази вариация се нарича експоненциално изглаждане, изглаждане, базирано на тенденции, или понякога двойно изглаждане. Различава се от простото експоненциално изглаждане, което се използва само когато данните се променят около някаква средна стойност или имат скокови или постепенни промени.

Ако серията има тенденция и се използва просто експоненциално изглаждане, тогава всички прогнози ще изостават от тенденцията. Например, ако данните се увеличат, тогава всяка прогноза ще бъде подценена. Обратно, намаляването на данните дава надценена прогноза. Графично показване на данните може да покаже кога двойното изглаждане е за предпочитане пред простото изглаждане.

Прогнозата, коригирана спрямо тенденцията (TAF), се състои от два елемента: изгладена грешка и коефициент на тенденция.

TAF t +1 = S t + T t, (6)

Където: S t – изгладена прогноза;

T t – оценка на текущата тенденция

И S t = TAF t + α 1 (A t - TAF t) , (7)

T t \u003d T t-1 + α 2 (TAF t -TAF t-1 - T t-1) (8)

Където α 1 , α 2са изглаждащи константи.

За да използвате този метод, трябва да изберете стойностите на α 1, α 2 (по обичайния начин на монтиране) и да направите първоначална прогноза и оценка на тенденциите.

Таблица 4. Експоненциално изглаждане на тенденцията.