Аналитично изглаждане на времеви редове. Уравнение на тенденцията

Права линия - трендови стойности на рентабилността (линейна тенденция, конструирана въз основа на данни от действителните стойности на рентабилността).


Пример 14.6. Да изградим линеен тренд на лихвените проценти по кредитите въз основа на статистически данни, публикувани в Бюлетин по банкова статистика № 4 (47) за 1997 г.

Вторият етап е да се намерят стойностите на параметрите на уравнението. Параметрите на трендовите модели се определят с помощта на система от нормални уравнения. В случай на прилагане на линеен тренд, използвайте следната система от уравнения, която се решава с помощта на метода най-малки квадрати

Пример 14.7. Ако приемем наличието на циклични колебания, ще проведем хармоничен анализ на динамиката на отклоненията от линейния тренд на данните за лихвите по кредитите (y, - y,).

Линейният тренд добре отразява тенденцията на промени под въздействието на много различни фактори, които се променят по различни начини според различни модели. Резултатът от тези фактори с взаимното премахване на характеристиките на отделните фактори е

При b = 1 имаме линеен тренд, b = 2 – параболичен и т.н. Формулярът за мощност е гъвкав, подходящ за показване на промени с различни мерки за пропорционалност на промените във времето. Строго условие е задължителното преминаване през началото на координатите при t = 0, y = 0. Можете да усложните формата на тенденцията y = a + th или y = a + th, но тези уравнения не могат да бъдат логаритмирани, трудно е да изчисляване на параметрите и те се използват изключително рядко.

За линейна тенденция нормалните уравнения на най-малките квадрати имат формата

Във формула (9.33) сумирането от = -(l-1) 2 до / = (l-1) 2 като цяло формула (9.33) е подобна на формулата за линейната тенденция (9.29).

Съгласно формула (9.29) параметрите на линейния тренд са равни на a = 1894/11 = 172,2 c/ha 2>L = 486/110 = 4,418 c/ha. Уравнението на линейния тренд има формата y = 172,2 + 4,418/, където (= 0 през 1987 г. Това означава, че средното действително и изравнено ниво, отнесено към средата на периода, т.е. 1991 г., е равно на 172 c 1 хектар, а средногодишният прираст е 4,418 ц/ха годишно.

Тъй като според табл. 9.4, вече е установено, че трендът има линейна форма, ние изчисляваме средногодишното абсолютно увеличение, т.е. параметър b на уравнението на линейния тренд

Флуктуацията е умерена, не е силна. За сравнение представяме показатели (без изчисления) за колебания в добива на картофи, данни от таблици 9.1 и 9.5 - отклонение от линейния тренд s(t) = 14,38 кг на 1 ха, v(t) = 8,35%.

За да се получат достатъчно надеждни граници за прогнозиране на позицията на тенденцията, да речем, с вероятност от 0,9, че грешката няма да бъде по-голяма от зададената, трябва средна грешкаумножете по стойността на /-теста на Стюдънт при определената вероятност (или значимост 1 - 0,9 = 0,1) и с равен брой степени на свобода, за линейна тенденция, N - 2, т.е. 15. Тази стойност е 1,753. Получаваме максималната грешка с дадена вероятност

Друг метод за измерване на корелацията във времеви редове може да бъде корелацията между тези на верижните индикатори на серията, които са константи на техните тенденции. При линейните тенденции това са верижни абсолютни увеличения. След като ги изчислихме от оригиналните динамични серии (axl, ayi), намираме коефициента на корелация между абсолютните промени, използвайки формула (9.52) или по-точно, използвайки формула (9.51), тъй като средните промени не са нула, за разлика от средните отклонения от тенденциите . Допустимостта на този метод се основава на факта, че разликата между съседните нива се състои главно от колебания и делът на тенденцията в тях е малък, следователно изкривяването на корелацията от тенденцията е много голямо с кумулативен ефект върху дълъг период, много малък - за всяка година поотделно. Трябва обаче да помним, че това е вярно само за серии с c-експонента значително по-малка от единица. В нашия пример, за сериите на доходност c-to-index е 0,144, за себестойността е 0,350. Корелационният коефициент на верижните абсолютни промени е 0,928, което е много близко до корелационния коефициент на отклоненията от тенденциите.

В един от предишните примери разгледахме двумесечната производствена прогноза за определена компания от Дъблин. Оценките са получени за 1997 г. с помощта на метода на линейния тренд и добавяне. Прогнозните стойности са дадени в тонове

k стойности за оценка на доверителните интервали на прогнозата спрямо линейна тенденция с вероятност от 0,8

Адаптивно моделиране на линейни тенденции с помощта на експоненциални подвижни средни.

Алгоритъм за изчисляване на параметрите на линейния тренд

Изчислете параметрите на линейния тренд като първо приближение

Определете крайните стойности на параметрите на линейния тренд

Грешките на EMA могат да влошат качеството на прогнозата. В този случай, когато изчислявате параметрите на линеен тренд, трябва да спрете на стъпка 2 от този алгоритъм.

LN - линеен тренд, сезонността не се взема предвид

Ако приемем, че промените в цените, противно на съображенията за ефективност за дълги периоди от време, се определят от множество и често нелинейни обратни връзки, тогава въз основа на теорията на хаоса е възможно да се изградят подобрени модели, които описват влиянието на миналото върху настоящето (виж -). Драматични пазарни сривове при липса на значителни промениинформация, внезапни промени в условията за достъп и срокове, когато една компания премине някакъв невидим праг в кредитния сектор - всичко това са прояви на нелинейност. Действителното поведение на финансовите пазари по-скоро противоречи на правилата за обръщане на линейните тенденции, отколкото ги потвърждава.

Методът на последователните разлики е следният: ако серията съдържа линеен тренд, тогава оригиналните данни се заменят с първите разлики

Стойностите на Lu нямат ясно дефинирана тенденция, те варират около средното ниво, което означава, че има линейна тенденция (линейна тенденция) в серията. Подобно заключение може да се направи и за серията x: абсолютните увеличения нямат систематична посока, те са приблизително стабилни и следователно серията се характеризира с линеен тренд.

Това доведе до идеята за измерване на корелацията не на самите нива x, yy, а на първите разлики Dx, = x, - , 6y, - y, - y,.., (с линейни тенденции). IN общ случайБеше установено, че е необходимо да се съпоставят отклоненията от тенденциите (минус цикличния компонент) Ey -y, - %, Ex = x, - %, (y, % - тенденции във времеви редове).

На графиката на фиг. 5.3 ясно показва наличието на тенденция на нарастване. Може да съществува линейна тенденция.

Параметрите на линейния тренд могат да се интерпретират, както следва: a - началното ниво на динамичния ред в момент t = 0 b - средното абсолютно увеличение на нивата на реда за периода. Във връзка с този динамичен ред можем да кажем, че темпът на нарастване на номиналната месечна работна заплата за 10 месеца на 1999 г. варира от ниво 82,66% при средномесечно абсолютно увеличение от 4,72 на сто. точка. Стойностите на нивата на времеви редове, изчислени с помощта на линеен тренд, се определят по два начина. Първо, можете последователно да замените стойностите / = 1, 2,..., l в намереното уравнение на тенденцията, т.е.

Второ, в съответствие с интерпретацията на параметрите на линейния тренд, всяко следващо ниво на серията е сумата от предишното ниво и средното абсолютно увеличение на веригата, т.е.

Така първоначалното ниво на серията според уравнението на експоненциалния тренд е 83,96 (сравнете с първоначалното ниво от 82,66 в линейния тренд), а средният коефициент на растеж на веригата е 1,046. Следователно можем да кажем това

Уравнението на линейната тенденция е y = at + b.

Параметрите на уравненията на функцията на тенденцията се намират с помощта на теорията на корелацията, използвайки метода на най-малките квадрати.

1. Метод на най-малките квадрати.
Методът на най-малките квадрати (LSM) е един от начините за противодействие на грешките при измерване (както във физиката, грешка при отклонение).
Този метод обикновено се използва за намиране на параметрите на уравнения (линии, хиперболи, параболи и т.н.)
Този метод включва минимизиране на сумата от квадратните отклонения.
Значението на MNC може да бъде изразено чрез тази графика

2. Анализ на точността на определяне на оценките на параметрите на уравнението на тенденцията (използвайки таблицата на ученика, намираме таблицата TT и правим интервална прогноза, т.е. идентифицираме средноквадратичната грешка)

3. Проверка на хипотези относно коефициентите линейно уравнениетенденция (статистика, тест на Стюдънт, тест на Фишер)

Тестване за автокорелация на остатъци.
Важна предпоставка за конструиране на качествен регресионен модел с помощта на OLS е независимостта на стойностите случайни отклоненияот стойностите на отклонение във всички други наблюдения. Това гарантира, че няма корелация между каквито и да било отклонения и по-специално между съседни отклонения.
Автокорелация (серийна корелация) Автокорелацията на остатъците (дисперсиите) е често срещана при регресионния анализ при използване на данни от времеви редове и много рядка при използване на данни от напречно сечение.
Проверка за хетероскедастичност.
1) Чрез графичен анализ на остатъците.
В този случай стойностите на обяснителната променлива X са нанесени по абсцисната ос, а отклоненията e i или техните квадрати e 2 i са нанесени по ординатната ос.
Ако има определена връзка между отклоненията, тогава възниква хетероскедастичност. Липсата на зависимост най-вероятно ще означава липса на хетероскедастност.
2) Използване на тест рангова корелацияКопиеносец.
Коефициент на рангова корелация на Спирман.

36. Методи за измерване на стабилността на динамичните тенденции (рангов коефициент на Спирман).

Концепцията за „устойчивост“ се използва по много различни начини. Във връзка с научното изследване на динамиката ще разгледаме два аспекта на това понятие: 1) стабилността като категория, противоположна на флуктуацията; 2) стабилност на посоката на изменение, т.е. устойчивост на тенденцията.

Стабилността във втория смисъл характеризира не самите нива, а процеса на тяхното насочено изменение. Можете да разберете например колко устойчив е процесът на намаляване на специфичните разходи за ресурси за производството на единица продукция, устойчива ли е тенденцията за намаляване на детската смъртност и т.н. От тази гледна точка пълната стабилност на промяната на посоката в нивата на динамична серия трябва да се разглежда такава промяна, в процеса на която всяко следващо ниво е или по-високо от всички предишни (продължителен растеж), или по-ниско от всички предишни (продължителен спад). Всяко нарушение на строго подредената последователност от нива показва непълна стабилност на промените.


От дефиницията на понятието стабилност на тренда следва и методът за конструиране на индикатора й. Като индикатор за стабилност може да се използва коефициентът на рангова корелация на Спирман - rx.

където n е броят на нивата;

I е разликата между ранговете на нивата и броя на периодите от време.

При пълно съвпадение на ранговете на нивата, като се започне от най-малкото, и броя на периодите (моментите) от време според техните хронологичен редкоефициентът на рангова корелация е +1. Тази стойност съответства на случая на пълна стабилност на нарастващите нива. Когато ранговете на нивата са напълно противоположни на ранговете на годините, коефициентът на Спирман е равен на -1, което означава пълна стабилност на процеса на намаляване на нивата. При хаотично редуване на нивата коефициентът е близо до нула, което означава нестабилност на всяка тенденция.

Отрицателно значение rx показва низходяща тенденция в нивата, като устойчивостта на тази тенденция е под средната.

Трябва да се има предвид, че дори при 100% стабилност на тенденцията, може да има колебания в нивата в динамиката и коефициентът на тяхната стабилност ще бъде под 100%. При слаби колебания, но още по-слаба тенденция, напротив, е възможен коефициент на стабилност на високо ниво, но коефициент на стабилност на тенденцията, близък до нула. Като цяло и двата индикатора, разбира се, са пряко свързани: най-често се наблюдава по-голяма стабилност на нивата едновременно с по-голяма стабилност на тренда.

37. Моделиране на тенденцията на поредица от динамика при наличие на структурни промени.

Еднократните промени в естеството на тенденцията на динамичния ред, причинени от структурни промени в икономиката или други фактори, трябва да се разграничават от сезонните и цикличните колебания. В този случай, започвайки от определен момент t, естеството на динамиката на изследвания индикатор се променя, което води до промяна в параметрите на тенденцията, която описва тази динамика.

Моментът t е придружен от значителни промени в редица фактори, които оказват силно влияние върху изследвания показател.Моделиране на тенденцията на динамичен ред при наличие на структурни промени.Най-често тези промени са причинени от промени в общата икономическа ситуация или глобални събития, довели до промяна в структурата на икономиката. Ако изследваният динамичен ред включва съответния момент във времето, тогава една от задачите на неговото изследване е да изясни въпроса дали общите структурни промени значително са повлияли на характера на тази тенденция.

Ако това влияние е значително, тогава трябва да се използват модели на частична линейна регресия за моделиране на тенденцията на този времеви ред, т.е. разделете първоначалната популация на 2 подпопулации (преди време t и след) и съставете уравнения на линейна регресия отделно за всяка подпопулация.

Ако структурните промени са имали леко въздействие върху естеството на тенденцията на серията Моделиране на тенденцията на времева серия при наличие на структурни промени., тогава тя може да бъде написана с помощта на уравнение на тенденцията, което е еднакво за целия набор от данни.

Всеки от описаните по-горе подходи има своите положителни и отрицателни страни. Когато се конструира частично линеен модел, остатъчната сума на квадратите се намалява в сравнение с уравнението на тренда, което е еднакво за цялата популация. Но разделянето на популацията на части води до загуба на броя на наблюденията и до намаляване на броя на степените на свобода във всяко уравнение на частично-линейния модел. Конструирането на едно уравнение на тенденцията ви позволява да поддържате броя на наблюденията в първоначалната съвкупност, но остатъчната сума на квадратите за това уравнение ще бъде по-висока в сравнение с частично линейния модел. Очевидно изборът на модел зависи от съотношението между намалението остатъчна дисперсияи загубата на броя на степените на свобода при преминаване от единично регресионно уравнение към частично линеен модел.

38. Регресионен анализ на свързани времеви редове.

Многовариантните времеви редове, показващи зависимостта на ефективна характеристика от един или повече факторни, се наричат ​​свързани динамични редове. Използването на методите на най-малките квадрати за обработка на времеви редове не изисква да се правят предположения относно законите на разпределение на първоначалните данни. Въпреки това, когато се използва методът на най-малките квадрати за обработка на свързани серии, трябва да се вземе предвид наличието на автокорелация (авторегресия), която не беше взета предвид при обработката на едномерни времеви серии, тъй като нейното присъствие допринесе за по-плътна и ясна идентифициране на тенденцията на развитие на разглеждания социално-икономически феномен във времето.

Откриване на автокорелация в нивата на серия от динамика

В динамиката на икономическите процеси съществува връзка между нивата, особено тясно разположените. Удобно е да се представи под формата на корелация между редовете y1,y2,y3,…..yn h y1+h, y2+h,…, yn+h. Изместването във времето L се нарича изместване, а самото явление на взаимовръзка се нарича автокорелация.

Автокорелационната зависимост е особено значима между следващите и предходните нива на динамичния ред.

Има два вида автокорелация:

Автокорелация при наблюдения на една или повече променливи;

Автокорелация на грешките или автокорелация при отклонения от тренда.

Наличието на последното води до изкривяване на средните стойности квадратни грешкирегресионни коефициенти, което затруднява конструирането на доверителни интервали за регресионните коефициенти, както и проверката на тяхната значимост.

Автокорелацията се измерва с помощта на коефициента на циклична автокорелация, който може да се изчислява не само между съседни нива, т.е. изместени с един период, но също и между изместени с произволен брой времеви единици (L). Това изместване, наречено забавяне във времето, също определя реда на автокорелационните коефициенти: първи ред (при L=1), втори ред (при L=2) и т.н. Въпреки това, най-голям интерес за изследването представлява изчисляването на нецикличния коефициент (първи ред), тъй като най-сериозните изкривявания на резултатите от анализа възникват, когато има корелация между началните нива на серията и същите нива, изместени от една единица време.

За да се прецени наличието или отсъствието на автокорелация в изследваната поредица, действителната стойност на автокорелационните коефициенти се сравнява с табличната (критична) стойност за 5% или 1% ниво на значимост.

Ако действителната стойност на коефициента на автокорелация е по-малка от табличната стойност, тогава може да се приеме хипотезата за липса на автокорелация в серията. Когато действителната стойност е по-голяма от табличната стойност, можем да заключим, че има автокорелация в динамичните серии.

Когато се използват полиноми с различни степени, параметрите на уравнението на тенденцията се оценяват с помощта на метода на най-малките квадрати (LSM) по същия начин, както параметрите на регресионно уравнение се оценяват въз основа на пространствени данни. Нивата на динамичния ред се разглеждат като зависима променлива, а факторът време се разглежда като независима променлива T,което обикновено се изразява до естествени числа 1, 2, ..., П.

Параметрите на нелинейните функции се оценяват чрез методите на най-малките квадрати след линеаризация, т.е. привеждането им в линейна форма. Нека разгледаме използването на най-малките квадрати за някои нелинейни функции, които не бяха обсъдени подробно в главата за регресия.

Да се ​​оценят параметрите на експоненциалната крива y = ab 1 или експоненти y = e a+s (или y = aeс ) като се вземат логаритми, функциите се редуцират до линейната форма lny = ln a + t ln b или експоненти: lny = а + bt.След това системата е изградена нормални уравнения

Пример 5.1

Броят на регистрираните пътнотранспортни произшествия (на 100 000 души население) в Новгородска област за 2000–2008 г. се характеризира с данни:

Въз основа на графиката беше избрана експоненциална крива / За да се изгради система от нормални уравнения, бяха изчислени спомагателни величини

Системата от нормални уравнения беше

Решавайки го, получаваме стойностите

Съответно имаме експоненциална или експоненциална крива

През периода от 2000 г. до 2008 г. броят на пътнотранспортните произшествия нараства средно с 13,5% годишно. Експонентата описва тенденцията на оригиналния времеви ред доста добре: коефициентът на детерминация е 0,9202. Следователно тази тенденция обяснява 92% от колебанията в серийните нива и само 8% от тях са свързани със случайни фактори.

Оценката на параметрите на кривите с насищане има някои специфики: експонента на модификация, логистична крива, крива на Gompertz, хипербола на формата.За тези функции първо трябва да се определи асимптотота. Ако може да бъде зададен от изследователя въз основа на анализ на времеви редове, тогава други параметри могат да бъдат оценени с помощта на OLS. В тези случаи тези функции се свеждат до линейна форма. Нека разгледаме оценката на параметрите на тези криви, като използваме отделни примери, започвайки с модифицираната експонента.

Пример 5.2

Нивото на механизация на труда (в%) се характеризира с времеви редове(Таблица 5.2)

Таблица 5.2.Изчисляване на параметрите на модифицираната експонента y = c аб" T

Y = с-у

Тъй като нивото на механизация на труда не може да надвишава 100%, има обективно определена горна асимптота c = 100. За оценка на параметрите АИ bНека редуцираме разглежданата функция до линейна форма; означават (s-y) с Yи вземете логаритъма:

За нашия пример, въз основа на данните в последния ред на таблицата. 3, имаме система от уравнения

След като го решим, получаваме ln А= 3,06311; вътре b= -0,19744. Съответно, потенцирайки, получаваме: т.е. уравнението.

Ако отидете от Yкъм началните нива на реда, уравнението на модифицираната експонента ще бъде , където параметърът показва средния темп на намаляване на нивото на използване на ръчен труд за 1998–2005 г. Изчислените стойности на y, т.е. може да се намери чрез заместване на съответните t стойности в уравнението 0.8208 ". Или въз основа на уравнението In 7 = 3.06311 - 0.19744 g, с компютърна обработка In U се определя и след това 100 - д 1pu. И така, при t = 8 In Y= = 1,48363 и 100 – e1"48363 = 100 – 4,40892 = 95,59108 = 95,6 (вижте последната колона на таблицата). Поради известно отклонение в оценките (тъй като OLS се прилага към логаритми) Hu, ЕХу, въпреки че в примера тези стойности са доста близки една до друга.

Ако асимптотата c не е посочена, тогава оценката на параметрите на модифицираната експоненциална става по-сложна. В тези случаи могат да се използват различни методи за оценка: метод на три суми, метод на три точки, използване на регресия, метод на Briant. Нека разгледаме използването на регресионния метод за оценка на параметрите на модифициран експонент от формата y = c – аб° С.

Пример 5.3

В таблицата са представени данни за рекламните разходи на компанията за 10 месеца. на годината.

Таблица 5.3.Данни за разходите за реклама на компанията за 10 месеца. година (в хиляди рубли)

Нека намерим верижните абсолютни нараствания в нашата серия и ги представим чрез параметрите на нашата функция, T.e.z = такси"– с + ab"~л =аб" 1 (1 – б). Известно е, че за модифициран експоненциал, логаритъма на абсолютните увеличения зависи линейно от времевия фактор t. Следователно можем да напишем, че lnz = Ιηα + (f – 1) lnb + ln(l – b). Нека означим Ιηα + ln(l – b) с д.Тогава lnz = d+(t- 1) lnb, т.е. линейно уравнение в логаритми. Използвайки метода на най-малките квадрати, получаваме оценки на параметрите d, lnb и съответно параметъра b.В разглеждания пример, въз основа на графиките на табл. 5,3 lnz и (T - 1) е намерено уравнението на регресията: lnz = 4,519641 – 0,20882 (t – 1). Въз основа на него получаваме lnb = -0.20882; b = 0,811538. 4,519641 = In a + In (1 – b) = In [α (1 – b)]. Тогава α (1 – b) = e4,519641, следователно параметърът =91,80264/(1-0,811538) = 487,1145.

След това можете да намерите оценка на параметъра c като средна стойност на стойностите c = при+ ab", намерено за всеки месец (вижте последната колона на таблица 5.3). Максималният размер на рекламните разходи ще бъде 516,4 хиляди рубли. Желаното уравнение на тенденцията ще приеме формата

Разгледаният метод е приложим, ако абсолютните увеличения са положителни стойности. Ако някои увеличения се окажат по-малки от нула, тогава е необходимо да се изгладят нивата на времевия ред, като се използва методът на подвижната средна.

За логистичната крива на Пърл–Рийд по подобен начин параметрите a и b могат да бъдат намерени чрез методите на най-малките квадрати, ако е дадена асимптота c. Тогава тази функцияпреобразувани в линейни от логаритми означават с Yи вземете логаритъм, т.е. ). Следващи параметри а и бсе определят чрез най-малки квадрати, както в примера в табл. 5.3.

За логистична крива от формата, параметрите a и b могат да бъдат оценени чрез методите на най-малките квадрати, ако е дадена асимптота c, тъй като в този случай функцията е линеаризирана: ; означават с Yстойност и вземете логаритъм: След това, използвайки най-малките квадрати, оценяваме параметрите АИ b.

При практически изчисления стойността на горната асимптота на логистичната крива може да се определи въз основа на същността на развитието на явлението, различни видовеограничения за растежа му (потребителски стандарти, законодателство), както и графично.

Ако горната асимптота не е посочена, тогава могат да се използват различни методи за оценка на параметрите: Fisher, Yule, Rhodes, Neir и др. Сравнителна оценка и преглед на тези методи е представена в работата на E. M. Chetyrkin.

Нека използваме пример, за да покажем изчисляването на параметрите на логистична крива, използвайки метода на Фишер.

Пример 5.4

Производството на продукта се характеризира с данните, представени в табл. 5.4.

Таблица 5.4.Изчисляване на параметрите на логистичната крива

Методът на Фишер се основава на определяне на производната на логистичната крива. Диференцирайки тази функция по отношение на t, получаваме уравнението

Нека означим скоростта на нарастване на логистичната крива с . Тогава, т.е. За z,ние имаме линейна функцияс параметри АИ . За да се намери решение, е необходимо да се оцени z,. Ако приемем, че интервалите между нивата в динамичните серии са равни, Фишър предложи приблизително да оцени под формата на уравнението , където П- 1. За нашия пример z стойностите са представени в колона 3 на таблицата. 5.4. След това прилагаме метода на най-малките квадрати към уравнението: , т.е. изграждаме регресия z(oty(, като вземаме данни от t = 2 до f = 8. Регресионното уравнение ще бъде написано във формата Въз основа на него намираме параметрите a и c за логистичната крива. Параметър а = 0,806. Това уравнение е статистически значимо: F-тестът е 689,6; Р 2 = 0,996. Съответно за него са значими и параметрите: f-критерий за параметъра Ае равно на 47,2 и за параметъра е равно на -26,2. От тогава тези. горната асимптота на производството е 403 единици.

След като са намерени параметрите a и c, намираме параметъра b. За да направим това, нека представим функцията като Нека я обозначим с Yизраз от лявата страна на равенството, т.е.-Тогава имаме уравнението. Нека вземем логаритми от него:. В това уравнение свободният член е In b. Може да се определи от първото уравнение на системата от нормални уравнения, а именно За нашия пример имаме уравнението . Съответно логистичната крива ще бъде записана във формуляра

Теоретичните стойности на тази функция са представени в колона 6 на таблицата. 5.4 (намира се чрез заместване на съответните t стойности). Те се доближават доста до оригиналните данни: коефициентът на корелация между тях е 0,999; поради факта, че при изчисленията са използвани логаритми. Ако приемем, че максималната стойност на производствения обем е 400 единици, т.е. приложим метода на най-малките квадрати към уравнението, тогава получаваме b ==67,5; параметър Апо време на компютърна обработка се определя като -а =-0,8. Съответно уравнението на тенденцията ще бъде записано във формата . Резултатите от двете уравнения са доста близки.

Параметрите на кривата на Gompertz могат също да бъдат оценени по метода на най-малките квадрати, ако е дадена асимптотата c, тъй като в този случай тази функция се свежда до линейна форма.Като вземем логаритъм, получаваме уравнението .

Логаритмувайки втори път, получаваме уравнението , Означавайки с y*, lgb с INи Ig(lga) до A, записваме кривата на Gompertz в линейна форма, за оценка на параметрите на която прилагаме най-малките квадрати.

При практическо приложениеКривата на Gompertz може да има известни затруднения с времеви серии с нарастваща тенденция. В този случай се посочват горната асимптота c и логаритмите. Когато в изчисленията се използват повтарящи се логаритми, само положителни стойностиНека демонстрираме възможността за оценка на параметрите на кривата на Gompertz с горна асимптота, като използваме примера за динамиката на запасите на предприятието в началото на всеки месец (хиляди долари).

Таблица 5.5.Изчисляване на параметрите на кривата на Gompertz

Съгласно формула (9.29) параметрите на линейния тренд са равни а = 1894/11 = 172,2 c/ha; b= 486/110 = 4,418 c/ha. Уравнението на линейната тенденция има формата:

г = 172,2 + 4,418T, Където t = 0 през 1987 г. Това означава, че средното действително и изравнено ниво се отнасят към средата на периода, т.е. до 1991 г., равно на 172 ц/ха годишно, средногодишното увеличение е 4,418 ц/ха годишно

Параметрите на параболичния тренд съгласно (9.23) са равни на b = 4,418; а = 177,75; c =-0,5571. Уравнението на параболичния тренд има формата у̃ = 177,75 + 4,418T - 0.5571t 2; T= 0 през 1991 г. Това означава, че абсолютното увеличение на добива се забавя средно с 2·0,56 c/ha на година на година. Самият абсолютен ръст вече не е константа на параболичния тренд, а е средна стойност за периода. В годината, взета за начална точка, т.е. 1991 г. трендът минава през точката с ордината 77,75 ц/ха; Свободният срок на параболичен тренд не е средното ниво за периода. Параметрите на експоненциалния тренд се изчисляват с помощта на формули (9.32) и (9.33) ln А= 56,5658/11 = 5,1423; потенциране, получаваме А= 171.1; вътре к= 2,853:110 = 0,025936; потенциране, получаваме к = 1,02628.

Уравнението на експоненциалния тренд е: y= 171,1 1,02628 T.

Това означава, че средната годишна доходност за периода е 102,63%. В точка К е началната точка, трендът преминава точката с ордината 171,1 ц/ха.

Нивата, изчислени с помощта на уравненията на тренда, са записани в последните три колони на таблицата. 9.5. Както се вижда от тези данни. Изчислените стойности на нивата и за трите вида тенденции не се различават много, тъй като както ускорението на параболата, така и скоростта на растеж на експоненциала са малки. Параболата има съществена разлика - растежът на нивата е спрял от 1995 г., докато при линеен тренд нивата продължават да растат, а при експоненциален тренд скоростта им се ускорява. Следователно за прогнозите за бъдещето тези три тренда не са равни: при екстраполиране на параболата към бъдещи години нивата рязко ще се отклоняват от правата линия и експоненциалната, както се вижда от табл. 9.6. Тази таблица показва разпечатка на решението на компютър с помощта на програмата Statgraphics за същите три тенденции. Разликата между техните свободни термини и посочените по-горе се обяснява с факта, че програмата номерира годините не от средата, а от началото, така че свободните термини на тенденциите се отнасят за 1986 г., за която t = 0. експоненциалното уравнение на разпечатката е оставено в логаритмична форма. Прогнозата се прави за 5 години напред, т.е. до 2001 г. Когато началото на координатите (референтен момент) в уравнението на параболата се промени, средното абсолютно увеличение, параметърът b.тъй като в резултат на отрицателното ускорение прирастът намалява през цялото време, а максимумът му е в началото на периода. Единствената константа на параболата е ускорението.


Редът „Данни“ показва нивата на оригиналната серия; „Обобщена прогноза“ означава обобщени данни за прогноза. В следващите редове има уравнения на права линия, параболи, експоненти - в логаритмична форма. Колоната ME означава средната разлика между нивата на оригиналната серия и нивата на тренда (подравнени). За права линия и парабола това несъответствие винаги е нула. Нивата на степента са средно с 0,48852 по-ниски от нивата на оригиналната серия. Възможно е точно съвпадение, ако истинската тенденция е експоненциална; в случая няма случайност, но разликата е малка. Графиката на MAE е дисперсията s 2 -мярка за променливостта на действителните нива спрямо тенденцията, както е обсъдено в параграф 9.7. Колона MAE - средно линейно отклонение на нивата от тенденцията в абсолютна стойност (виж параграф 5.8); колона MARE - относително линейно отклонение в проценти. Тук те са представени като индикатори за пригодността на избрания тип тенденция. Параболата е с по-малка дисперсия и модул на отклонение: за периода 1986 - 1996г. по-близо до реалните нива. Но изборът на тип тенденция не може да се сведе само до този критерий. Всъщност забавянето на растежа е резултат от голямо отрицателно отклонение, т.е. провал на реколтата през 1996 г.

Втората половина на таблицата е прогноза за нивата на доходност за три вида тенденции за години; t = 12, 13, 14, 15 и 16 от началото (1986). Прогнозираните нива за експоненциала до 16-та година не са много по-високи от тези за правата линия. Нивата на параболичните тенденции намаляват, все повече се отклоняват от другите тенденции.

Както може да се види в табл. 9.4, когато се изчисляват параметрите на тренда, нивата на оригиналната серия се включват с различни тегла - стойности tpи техните квадратчета. Следователно влиянието на колебанията на нивата върху параметрите на тенденцията зависи от това кое число на годината е година на реколта или година на бедност. Ако настъпи рязко отклонение в година с нулево число ( t i = 0), тогава няма да има никакъв ефект върху параметрите на тенденцията, но ако удари началото и края на серията, ще има силен ефект. Следователно, еднократно аналитично подравняванене освобождава напълно параметрите на тренда от влиянието на флуктуациите, а при силни флуктуации те могат да бъдат силно изкривени, което в нашия пример се случи с параболата. За по-нататъшно елиминиране на изкривяващото влияние на колебанията върху параметрите на тенденцията, трябва да се приложи метод на множествено плъзгащо подравняване.

Тази техника се състои в това, че параметрите на тенденцията не се изчисляват веднага за цялата серия, а метод на плъзгане, първи за първи Tпериоди от време или моменти, след това за периода от 2 до t + 1, от 3-ти до (t + 2) ниво и др. Ако броят на началните нива на серията е равен на П,и дължината на всяка плъзгаща се основа за изчисляване на параметрите е равна на T,тогава броят на такива подвижни бази t или индивидуалните стойности на параметрите, които ще бъдат определени от тях, ще бъде:

Л = n + 1 - T.

Прилагането на техниката на плъзгащо се многократно подравняване, както се вижда от горните изчисления, е възможно само при достатъчно голямо числонивата на редовете обикновено са 15 или повече. Нека разгледаме тази техника, използвайки данните в таблица 1 като пример. 9.4 - динамика на цените на стоки без горива в развиващите се страни, което отново дава възможност на читателя да участва в малък научно изследване. Използвайки същия пример, ще продължим техниката на прогнозиране в раздел 9.10.

Ако изчислим параметри от 11 в нашата серия - летни периоди(през 11 нива), тогава T= 17 + 1 - 11 = 7. Смисълът на многократното плъзгащо подравняване е, че при последователни измествания на базата за изчисляване на параметрите, в нейните краища и в средата ще има различни нивас отклонения от тренда с различен знак и величина. Следователно, с някои промени в основата, параметрите ще бъдат надценени, с други ще бъдат подценени, а с последващо осредняване на стойностите на параметрите за всички промени на изчислителната база ще има допълнително взаимно премахване на изкривяванията в параметрите на тенденцията чрез колебания в нивата.

Множественото плъзгащо се подравняване не само ви позволява да получите по-точна и надеждна оценка на параметрите на тренда, но и да контролирате правилния избор на типа уравнение на тренда. Ако се окаже, че параметърът на водещия тренд, неговата константа, когато се изчислява с помощта на подвижни бази, не се колебае произволно, а систематично променя стойността си по значителен начин, това означава, че типът тренд е избран неправилно, този параметър не е константа .

Що се отнася до свободния член по време на многократно изравняване, няма нужда и освен това е просто неправилно да се изчислява стойността му като средна за всички базови смени, тъй като с този метод отделните нива на оригиналната серия биха били включени в изчислението на средното с различни тегла, а сумата от изравнените нива ще се разминава със сумата на членовете на оригиналната серия. Свободният термин на тенденцията е средна стойностниво за периода, при условие че времето се брои от средата на периода. При броене от началото, ако е първото ниво t i= 1, свободният член ще бъде равен на: a 0 = у̅ - b((N-1)/2). Препоръчително е дължината на подвижната база за изчисляване на параметрите на тренда да бъде избрана най-малко 9-11 нива, за да се смекчат достатъчно колебанията в нивата. Ако началният ред е много дълъг, основата може да бъде до 0,7 - 0,8 от дължината му. За да се елиминира влиянието на дългопериодичните (циклични) колебания върху параметрите на тенденцията, броят на базовите смени трябва да бъде равен или кратен на дължината на цикъла на колебание. Тогава началото и краят на основата последователно ще „преминат“ през всички фази на цикъла и при осредняване на параметъра за всички смени, неговите изкривявания от циклични колебания ще се компенсират взаимно. Друг начин е да се вземе дължината на подвижната основа равна на дължината на цикъла, така че началото на основата и краят на основата винаги да попадат в една и съща фаза на цикъла на трептене.

Тъй като според табл. 9.4, вече е установено, че тенденцията има линейна форма, изчисляваме средногодишното абсолютно увеличение, т.е. bуравнения на линеен тренд по плъзгащ се начин на 11-годишна база (вижте таблица 9.7). Той също така съдържа изчислението на данните, необходими за последващото изследване на променливостта в параграф 9.7. Нека разгледаме по-подробно техниката на многократно подравняване с помощта на плъзгащи се основи. Нека изчислим параметъра bза всички бази данни:


Нека покажем пример за подробно изчисление на параметрите на уравнението на тенденцията въз основа на следните данни (виж таблицата) с помощта на калкулатор.

Уравнението на линейната тенденция е y = at + b.
1. Намерете параметрите на уравнението, като използвате метода на най-малките квадрати.
Система от уравнения на най-малките квадрати:
a 0 n + a 1 ∑t = ∑y
a 0 ∑t + a 1 ∑t 2 = ∑y t

T г t 2 y 2 t y y(t) (y-y cp) 2 (y-y(t)) 2 (t-t p) 2 (y-y(t)) : y
1 17.4 1 302.76 17.4 12.26 895.01 26.47 30.25 0.3
2 26.9 4 723.61 53.8 18.63 416.84 68.39 20.25 0.31
3 23 9 529 69 25 591.3 4.02 12.25 0.0872
4 23.7 16 561.69 94.8 31.38 557.75 58.98 6.25 0.32
5 27.2 25 739.84 136 37.75 404.68 111.4 2.25 0.39
6 34.5 36 1190.25 207 44.13 164.27 92.72 0.25 0.28
7 50.7 49 2570.49 354.9 50.5 11.45 0.0383 0.25 0.0039
8 61.4 64 3769.96 491.2 56.88 198.34 20.44 2.25 0.0736
9 69.3 81 4802.49 623.7 63.25 483.27 36.56 6.25 0.0872
10 94.4 100 8911.36 944 69.63 2216.84 613.62 12.25 0.26
11 61.1 121 3733.21 672.1 76 189.98 222.11 20.25 0.24
12 78.2 144 6115.24 938.4 82.38 953.78 17.46 30.25 0.0534
78 567.8 650 33949.9 4602.3 567.8 7083.5 1272.21 143 2.41

За нашите данни системата от уравнения има формата:
12a 0 + 78a 1 = 567,8
78a 0 + 650a 1 = 4602,3
От първото уравнение изразяваме 0 и го заместваме във второто уравнение
Получаваме a 0 = 6,37, a 1 = 5,88

Забележка: стойностите на колона № 6 y(t) се изчисляват въз основа на полученото уравнение на тренда. Например t = 1: y(1) = 6,37*1 + 5,88 = 12,26

Уравнение на тенденцията

y = 6,37 t + 5,88

Нека оценим качеството на уравнението на тенденцията, като използваме абсолютната грешка на приближението.


Тъй като грешката е повече от 15%, не е препоръчително да използвате това уравнение като тенденция.

Средни стойности:


дисперсия

Стандартно отклонение

Коефициент на еластичност


Коефициентът на еластичност е по-малък от 1. Следователно, ако X се промени с 1%, Y ще се промени с по-малко от 1%. С други думи, влиянието на X върху Y не е значително.

Коефициент на определяне

тези. в 82,04% от случаите засяга промените в данните. С други думи, точността на избора на уравнението на тренда е висока

2. Анализ на точността на определяне на оценките на параметрите на уравнението на тенденцията.
Дисперсия на грешката на уравнението.

където m = 1 е броят на влияещите фактори в трендовия модел.

Стандартна грешка на уравнението.



3. Тестване на хипотези относно коефициентите на уравнението на линейния тренд.
1) t-статистика. t тест на ученика.
С помощта на таблицата на ученика намираме Ttable
T таблица (n-m-1;α/2) = (10;0,025) = 2,228

>
Статистическата значимост на коефициента a 0 е потвърдена. Оценката на параметъра a 0 е значима и времевият ред има тенденция.


Статистическата значимост на коефициента a 1 не е потвърдена.

Доверителен интервал за коефициентите на уравнението на тренда.
Нека определим доверителните интервали на коефициентите на тренда, които с надеждност от 95% ще бъдат както следва:
(a 1 - t obs S a 1 ; a 1 + t obs S a 1)
(6.375 - 2.228*0.943; 6.375 + 2.228*0.943)
(4.27;8.48)
(a 0 - t obs S a 0 ; a 0 + t obs S a 0)
(5.88 - 2.228*6.942; 5.88 + 2.228*6.942)
(-9.59;21.35)
Тъй като точка 0 (нула) е вътре доверителен интервал, Че интервална оценкакоефициент a 0 е статистически незначим.
2) F-статистика. Критерий на Фишер.


Fkp = 4,84
Тъй като F > Fkp, коефициентът на детерминация е статистически значим

Проверка за автокорелация на остатъците.
Важна предпоставка за конструиране на качествен регресионен модел с помощта на OLS е независимостта на стойностите на случайните отклонения от стойностите на отклоненията във всички други наблюдения. Това гарантира, че няма корелация между каквито и да било отклонения и по-специално между съседни отклонения.
Автокорелация (серийна корелация)се определя като корелация между наблюдаваните индикатори, подредени във времето (времеви серии) или пространство (кръстосани серии). Автокорелацията на остатъците (дисперсиите) е често срещана при регресионния анализ при използване на данни от времеви редове и много рядка при използване на данни от напречно сечение.
При икономическите проблеми се среща много по-често положителна автокорелация, отколкото отрицателна автокорелация. В повечето случаи положителната автокорелация се дължи на насоченото постоянно влияние на някои фактори, които не са взети предвид в модела.
Отрицателна автокорелациявсъщност означава, че едно положително отклонение е последвано от отрицателно и обратно. Тази ситуация може да възникне, ако една и съща връзка между търсенето на безалкохолни напитки и доходите се разглежда според сезонните данни (зима-лято).
Между основните причини, предизвикващи автокорелация, могат да се разграничат следните:
1. Грешки в спецификацията. Неотчитането на важна обяснителна променлива в модела или неправилен избор на формата на зависимост обикновено води до системни отклонения на точките на наблюдение от регресионната линия, което може да доведе до автокорелация.
2. Инерция. много икономически показатели(инфлация, безработица, БНП и т.н.) имат определена цикличност, свързана с вълнообразността на бизнес активността. Следователно промяната в показателите не се случва моментално, а има известна инерция.
3. Ефект на паяжина. В много производствени и други области икономическите индикатори реагират на промените в икономическите условия със закъснение (времево забавяне).
4. Изглаждане на данните. Често данните за определен дълъг период от време се получават чрез осредняване на данните за съставните му интервали. Това може да доведе до известно изглаждане на колебанията, възникнали в рамките на разглеждания период, което от своя страна може да предизвика автокорелация.
Последствията от автокорелацията са подобни на тези хетероскедастичност: Заключенията от t- и F-статистиките, които определят значимостта на коефициента на регресия и коефициента на детерминация, може да са неправилни.

Автокорелационно откриване
1. Графичен метод
Има редица опции за графично дефиниране на автокорелация. Един от тях свързва отклоненията e i с моментите на тяхното получаване i. В този случай или времето на получаване на статистически данни, или поредният номер на наблюдението се нанасят по абсцисната ос, а отклоненията e i (или оценките на отклоненията) се нанасят по ординатната ос.
Естествено е да се предположи, че ако има определена връзка между отклоненията, тогава има автокорелация. Липсата на зависимост най-вероятно ще означава липса на автокорелация.
Автокорелацията става по-ясна, ако начертаете зависимостта на e i от e i-1
Тест на Дърбин-Уотсън.
Този критерий е най-известният за откриване на автокорелация.
При Статистически анализрегресионни уравнения на начална фазачесто проверяват осъществимостта на една предпоставка: условията за статистическа независимост на отклоненията помежду си. В този случай се проверява некорелацията на съседните стойности e i.

г y(x) e i = y-y(x) д 2 (e i - e i-1) 2
17.4 12.26 5.14 26.47 0
26.9 18.63 8.27 68.39 9.77
23 25 -2 4.02 105.57
23.7 31.38 -7.68 58.98 32.2
27.2 37.75 -10.55 111.4 8.26
34.5 44.13 -9.63 92.72 0.86
50.7 50.5 0.2 0.0384 96.53
61.4 56.88 4.52 20.44 18.71
69.3 63.25 6.05 36.56 2.33
94.4 69.63 24.77 613.62 350.63
61.1 76 -14.9 222.11 1574.09
78.2 82.38 -4.18 17.46 115.03
1272.21 2313.98

За да анализирате корелацията на отклоненията, използвайте Статистика на Дърбин-Уотсън:


Критичните стойности d 1 и d 2 се определят въз основа на специални таблици за необходимото ниво на значимост α, броя на наблюденията n = 12 и броя на обяснителните променливи m = 1.
Няма автокорелация, ако е изпълнено следното условие:
d 1< DW и d 2 < DW < 4 - d 2 .
Без да се позовавате на таблици, можете да използвате приблизително правило и да приемете, че няма автокорелация на остатъците, ако 1,5< DW < 2.5. Поскольку 1.5 < 1.82 < 2.5, то автокорреляция остатков отсъстващ.
За по-надеждно заключение е препоръчително да се обърнете към табличните стойности.
Използвайки таблицата на Дърбин-Уотсън за n=12 и k=1 (5% ниво на значимост), намираме: d 1 = 1,08; d2 = 1,36.
От 1.08< 1.82 и 1.36 < 1.82 < 4 - 1.36, то автокорреляция остатков отсъстващ.

Проверка за хетероскедастичност.
1) Чрез графичен анализ на остатъците.
В този случай стойностите на обяснителната променлива X са нанесени по абсцисната ос, а отклоненията e i или техните квадрати e 2 i са нанесени по ординатната ос.
Ако има определена връзка между отклоненията, тогава възниква хетероскедастичност. Липсата на зависимост най-вероятно ще означава липса на хетероскедастност.
2) Използване на корелационния тест на Spearman.
Коефициент на рангова корелация на Спирман.
Нека присвоим рангове на функция Y и фактор X. Намерете сумата от разликата на квадратите d 2.
Използвайки формулата, изчисляваме коефициента на рангова корелация на Spearman.

t таблица (n-m-1;α/2) = (10;0,05/2) = 2,228
Тъй като Tob< tтабл, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции. Другими словами, коэффициент ранговой корреляции статистически - не значим.
Нека проверим хипотезата H 0: няма хетероскедастичност.
Тъй като 2,228 > 0,45, се приема хипотезата за липса на хетероскедастичност.
T e i ранг X, d x ранг e i , d y (d x - d y) 2
1 -5.14 1 4 9
2 -8.27 2 2 0
3 2 3 7 16
4 7.68 4 9 25
5 10.55 5 11 36
6 9.63 6 10 16
7 -0.2 7 6 1
8 -4.52 8 5 9
Споделете с приятели или запазете за себе си:

Зареждане...