Намерете средната грешка на приближението. Оценка на качеството на регресионното уравнение

За цялостна оценкакачеството на конструирания иконометричен, определят се характеристики като коефициент на детерминация, индекс на корелация, средна относителна грешка на приближаване и се проверява значимостта на регресионното уравнение с помощта на Е- Критерий на Фишер. Изброените характеристики са доста универсални и могат да се прилагат както за линейни, така и за нелинейни модели, както и за модели с две или повече факторни променливи. Определяне на стойност при изчисляването на всички изброени характеристикикачеството се играе от редица остатъци ε i, което се изчислява чрез изваждане от действителните (получени от наблюдения) стойности на изследваната черта y iстойности, изчислени съгласно уравнението на модела y pi.

Коефициент на определяне

показва каква част от промяната в изследвания признак е взета предвид в модела. С други думи, коефициентът на определяне показва каква част от промяната в изследваната променлива може да бъде изчислена въз основа на промените във факторните променливи, включени в модела, като се използва избраният тип функция, която свързва факторните променливи и изследваната характеристика в уравнението на модела.

Коефициент на определяне R2може да приема стойности от 0 до 1. Колкото по-близо е коефициентът на детерминация R2към единицата, на по-добро качествомодели.

Индекс на корелация може лесно да се изчисли, като се знае коефициентът на детерминация:

Индекс на корелация Рхарактеризира плътността на избрания тип връзка при изграждането на модела между факторите, взети предвид в модела, и изследваната променлива. В случай на линейна регресия на двойка, неговата абсолютна стойност съвпада с коефициента на корелация на двойката r(x, y), което разгледахме по-рано, и характеризира стегнатостта на линейната връзка между хи г. Стойностите на индекса на корелация, очевидно, също са в диапазона от 0 до 1. Колкото по-близо е стойността Рдо единство, колкото по-тясно избраният тип функция свързва факторните променливи и изследваната черта, толкова по-добро е качеството на модела.

(2.11)

изразява се в проценти и характеризира точността на модела. Приемлива точност на модела при решаване практически задачиможе да се определи въз основа на съображения за икономическа осъществимост, като се вземе предвид конкретната ситуация. Широко използван критерий е, че точността се счита за задоволителна, ако средната стойност относителна грешкапо-малко от 15%. Ако Е отн.ср.по-малко от 5%, тогава се казва, че моделът има висока точност. Не се препоръчва използването на модели с незадоволителна точност за анализ и прогнозиране, т.е. Е отн.ср.повече от 15%.

F-тест на Fisher използвани за оценка на значимостта на регресионното уравнение. Изчислената стойност на F-критерия се определя от отношението:

. (2.12)

критична стойност Е-критерият се определя от таблици при дадено ниво на значимост α и степени на свобода (можете да използвате функцията FDISP в Excel). Ето, още ме броят на факторите, взети предвид в модела, не броят на наблюденията. Ако изчислената стойност е по-голяма от критичната стойност, тогава уравнението на модела се признава за значимо. Колкото по-голяма е изчислената стойност Е-критерии, толкова по-добро е качеството на модела.

Нека определим качествените характеристики на линейния модел, за който сме конструирали Пример 1. Нека използваме данните от таблица 2. Коефициент на определяне:

Следователно в рамките на линейния модел промяната в обема на продажбите с 90,1% се обяснява с промяната в температурата на въздуха.

Индекс на корелация

.

Стойността на индекса на корелация в случай на сдвоен линеен модел, както виждаме, наистина е равна по модул на коефициента на корелация между съответните променливи (обем на продажби и температура). Тъй като получената стойност е достатъчно близка до единица, можем да заключим, че има тясна линейна връзка между изследваната променлива (обем на продажби) и факторната променлива (температура).

F-тест на Fisher

критична стойност F крпри α = 0,1; v 1 =1; ν 2 =7-1-1=5 е равно на 4,06. Прогнозна стойност Е-критерият е по-голям от табличния, следователно уравнението на модела е значимо.

Средна относителна апроксимационна грешка

Изграденият линейно двоен регресионен модел е с незадоволителна точност (>15%) и не се препоръчва използването му за анализ и прогнозиране.

В резултат на това, въпреки факта, че повечето от статистическите характеристики отговарят на критериите за тях, моделът на линейна двойка регресия не е подходящ за прогнозиране на обема на продажбите в зависимост от температурата на въздуха. Нелинейният характер на връзката между тези променливи според данните от наблюденията е доста ясно видим на фиг.1. Направеният анализ потвърди това.

Индикатори за корелация и детерминация

Регресия на линейна двойка

Въз основа на подкрепящите данни, които са изчислени в табл. 2, изчисляваме индикатора за близост на комуникацията.

Този показател е примерен линеен коефициенткорелация, изчислена с помощта на формула.

Въз основа на резултатите от изчисляването на коефициента на корелация може да се заключи, че връзката между фактора и получената черта е пряка и силна (според скалата на Chaddock).

Квадратът на коефициента на корелация се нарича коефициент на детерминация, който показва съотношението на вариацията на резултантния признак, обяснена с вариацията на факторния признак.

Обикновено, давайки тълкуване на коефициента на детерминация, той се изразява като процент.

R 2 \u003d 0,847 2 \u003d 0,7181

тези. в 71,81% от случаите промяната на факторния признак води до промяна на резултантния признак. Точността на избора на регресионното уравнение е доста висока. Останалите 28,19% от промяната на Y се обясняват с фактори, които не са взети предвид в модела.

Регресия на двойка мощност

Близостта на връзката между резултантния знак и знака на фактора за регресия на степенна двойка се определя с помощта на коефициента на корелация:

Замествайки известните данни, получаваме:

Индикатор за определяне.

тези. в 69% от случаите промяната във факторния признак води до промяна в резултатния признак. Точността на избора на регресионното уравнение е средна. Останалите 31% от промяната на Y се обясняват с фактори, които не са взети предвид в модела.

Средна апроксимационна грешка

Регресия на линейна двойка

Нека оценим качеството на регресионното уравнение, като използваме абсолютната грешка на приближението. Средната апроксимационна грешка е средното отклонение на изчислените стойности от действителните:

Регресия на двойка мощност

Средната апроксимационна грешка е средното отклонение на изчислените стойности от действителните:

Приблизителната грешка в рамките на 5%-7% показва добър избор на регресионното уравнение спрямо оригиналните данни.

Тъй като грешката е по-голяма от 7%, това уравнение не е желателно да се използва като регресия.

Оценка с помощта на F-критерия на Fisher на статистическата надеждност на резултатите от регресионното моделиране

Регресия на линейна двойка

Коефициентът на детерминация R 2 се използва за проверка на значимостта на уравнението линейна регресияв общи линии.

Значимостта на регресионния модел се проверява с помощта на F-теста на Фишер, чиято изчислена стойност се намира като съотношение на дисперсията на първоначалната серия от наблюдения на изследвания показател и безпристрастната оценка на дисперсията на остатъчната последователност за този модел.

Ако изчислената стойност с k 1 =(m) и k 2 =(n-m-1) степени на свобода е по-голяма от табличната стойност при дадено ниво на значимост, тогава моделът се счита за значим.

Оценката на статистическата значимост на сдвоената линейна регресия се извършва по следния алгоритъм:

където m=1 за регресия по двойки.

Тъй като действителната стойност на F >

Регресия на двойка мощност

Подобно на линейната регресия на двойката, ще оценим регресията на степенната двойка

където m е броят на факторите в модела.

1. Изложена е нулева хипотеза, че уравнението като цяло е статистически незначимо: H 0: R 2 =0 при ниво на значимост b.

2. Определете действителната стойност на F-критерия:

където m=1 за регресия по двойки.

3. Табличната стойност се определя от таблиците за разпределение на Фишер за дадено ниво на значимост, като се има предвид, че броят на степените на свобода за обща сумаквадрати (по-голяма дисперсия) е 1, а броят на степените на свобода на остатъчната сума от квадрати (по-ниска дисперсия) при линейна регресия е n-2.

F таблица е максимално възможната стойност на критерия под влияние на случайни фактори за дадени степени на свобода и ниво на значимост b. Ниво на значимост b - вероятността за отхвърляне на правилната хипотеза, при условие че е вярна. Обикновено b се приема равно на 0,05 или 0,01.

4. Ако действителната стойност на F-критерия е по-малка от стойността на таблицата, тогава те казват, че няма причина да се отхвърли нулевата хипотеза.

В противен случай нулевата хипотеза се отхвърля и с вероятност (1-b) се приема алтернативната хипотеза за статистическата значимост на уравнението като цяло.

Таблична стойност на критерия със степени на свобода:

k 1 \u003d 1 и k 2 \u003d 8, F таблица \u003d 5,32

Тъй като действителната стойност на F > F таблица, коефициентът на детерминация е статистически значим (намерената оценка на регресионното уравнение е статистически надеждна).

Въз основа на резултатите от анализа, ние заключаваме, че коефициентите на определяне както за линейната регресия по двойки, така и за регресията по мощностни двойки са статистически значими.

Тъй като линейната регресия по двойки има по-висок (експоненциален) коефициент на определяне, ние вярваме, че тя описва адекватно връзката между фактора и резултантната характеристика.

Нека проверим хипотезата H 0 за равенството на индивидуалните регресионни коефициенти на нула (с алтернативата H 1 не е равно) при ниво на значимост b=0,05.

Ако основната хипотеза се окаже невярна, приемаме алтернативната. За да се провери тази хипотеза, се използва t-тестът на Student.

Стойността на t-теста, получена от данни от наблюдения (наричана още наблюдавана или действителна), се сравнява с табличната (критична) стойност, определена от таблиците за разпределение на Стюдънт (които обикновено се дават в края на учебниците и семинарите по статистика или иконометрия ).

Табличната стойност се определя в зависимост от нивото на значимост (b) и броя на степените на свобода, което в случай на регресия с линейна двойка е (n-2), n е броят на наблюденията.

Ако действителната стойност на t-критерия е по-голяма от табличната (по абсолютна стойност), тогава основната хипотеза се отхвърля и се счита, че с вероятност (1-b) параметърът или статистическата характеристика в населениезначително различен от нула.

Ако действителната стойност на t-критерия е по-малка от табличната (по модул), тогава няма причина да се отхвърли основната хипотеза, т.е. параметър или статистическа характеристика в общата съвкупност не се различава значително от нула при ниво на значимост b.

t crit (n-m-1;b/2) = (30;0,025) = 2,042

От 1.7< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.

От 0.56< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Доверителен интервал за коефициентите на регресионното уравнение.

Нека определим доверителните интервали на регресионните коефициенти, които с 95% надеждност ще бъдат както следва:

  • (b - t критичен S b; b + t критичен S b)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

Тъй като точка 0 (нула) е вътре доверителен интервал, тогава интервална оценкакоефициент b е статистически незначим.

  • (a - t критичен S a; a + t критичен S a)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

С вероятност от 95% може да се твърди, че стойността на този параметър ще лежи в намерения интервал.

Тъй като точката 0 (нула) се намира в рамките на доверителния интервал, интервалната оценка на коефициента a е статистически незначима.

2) F-статистика. Критерий на Фишер.

Коефициентът на детерминация R 2 се използва за проверка на значимостта на уравнението на линейната регресия като цяло.

Значимостта на регресионния модел се проверява с помощта на F-теста на Фишер, чиято изчислена стойност се намира като съотношение на дисперсията на първоначалната серия от наблюдения на изследвания показател и безпристрастната оценка на дисперсията на остатъчната последователност за този модел.

Ако изчислената стойност с k 1 =(m) и k 2 =(n-m-1) степени на свобода е по-голяма от табличната стойност при дадено ниво на значимост, тогава моделът се счита за значим.

където m е броят на факторите в модела.

Оценката на статистическата значимост на сдвоената линейна регресия се извършва по следния алгоритъм:

  • 1. Изложена е нулева хипотеза, че уравнението като цяло е статистически незначимо: H 0: R 2 =0 при ниво на значимост b.
  • 2. След това определете действителната стойност на F-критерия:

където m=1 за регресия по двойки.

3. Стойността на таблицата се определя от таблиците за разпределение на Фишер за дадено ниво на значимост, като се има предвид, че броят на степените на свобода за общата сума на квадратите (по-голяма дисперсия) е 1, а броят на степените на свобода за остатъчната сума на квадрати (по-ниска дисперсия) при линейна регресия е n-2.

F таблица е максимално възможната стойност на критерия под влияние на случайни фактори за дадени степени на свобода и ниво на значимост b. Ниво на значимост b - вероятността за отхвърляне на правилната хипотеза, при условие че е вярна. Обикновено b се приема равно на 0,05 или 0,01.

4. Ако действителната стойност на F-критерия е по-малка от стойността на таблицата, тогава те казват, че няма причина да се отхвърли нулевата хипотеза.

В противен случай нулевата хипотеза се отхвърля и с вероятност (1-b) се приема алтернативната хипотеза за статистическата значимост на уравнението като цяло.

Таблична стойност на критерия със степени на свобода k 1 \u003d 1 и k 2 \u003d 30, F таблица \u003d 4,17

Тъй като действителната стойност на F< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Връзката между F-теста на Fisher и t-статистиката на Student се изразява чрез равенството:

Качествени показатели на регресионното уравнение.

Проверете за автокорелация на остатъците.

Важна предпоставка за конструирането на висококачествен регресионен модел за най-малките квадрати е независимостта на стойностите случайни отклоненияот стойностите на отклонение във всички други наблюдения. Това гарантира, че няма корелация между каквито и да било отклонения и по-специално между съседни отклонения.

Автокорелацията (серийна корелация) се определя като корелация между наблюдаваните индикатори, подредени във времето (времеви серии) или в пространството (кръстосани серии). Автокорелацията на остатъците (извънредните стойности) обикновено се среща в регресионен анализкогато се използват данни от времеви редове и много рядко, когато се използват данни от напречно сечение.

При икономически проблеми положителната автокорелация е много по-често срещана от отрицателната автокорелация. В повечето случаи положителната автокорелация се дължи на насочено постоянно влияние на някои фактори, които не са взети предвид в модела.

Отрицателната автокорелация всъщност означава, че положително отклонение е последвано от отрицателно и обратно. Такава ситуация може да възникне, ако същата връзка между търсенето на безалкохолни напитки и доходите се разглежда според сезонните данни (зима-лято).

Сред основните причини за автокорелация са следните:

  • 1. Грешки в спецификацията. Неотчитането на важна обяснителна променлива в модела или грешният избор на формата на зависимост обикновено води до системни отклонения на точките на наблюдение от регресионната линия, което може да доведе до автокорелация.
  • 2. Инерция. много икономически показатели(инфлация, безработица, БНП и др.) имат определена цикличност, свързана с вълнообразността на бизнес активността. Следователно промяната в показателите не се случва моментално, а има известна инерция.
  • 3. Уеб ефект. В много промишлени и други области икономическите индикатори реагират на промените в икономическите условия със закъснение (времево забавяне).
  • 4. Изглаждане на данните. Често данните за определен дълъг период от време се получават чрез осредняване на данните за съставните му интервали. Това може да доведе до известно изглаждане на колебанията, които са съществували в рамките на разглеждания период, което от своя страна може да предизвика автокорелация.

Последиците от автокорелацията са подобни на тези от хетероскедастичността: заключенията за t- и F-статистиките, които определят значимостта на коефициента на регресия и коефициента на детерминация, може да са неправилни.


Емпиричните регресионни коефициенти b 0 , b 1 ще бъдат определени с помощта на инструмента "Регресия" на добавката "Анализ на данни" на процесора за електронни таблици MS Excel.

Алгоритъмът за определяне на коефициентите е както следва.

1. Въведете изходните данни в електронната таблица MS Excel.

2. Извикайте добавката Data Analysis (Фигура 2).

3. Изберете инструмента за анализ Regression (Фигура 3).

4. Попълнете съответните позиции на прозореца Regression (Фигура 4).

5. Натиснете бутона OK на прозореца Regression и вземете протокола за решаване на проблема (Фигура 5)


Фигура 3 - Избор на инструмента за регресия




Фигура 4 - Регресия на прозореца

Фигура 5 - Протокол за решаване на проблема

Фигура 5 показва, че емпиричните регресионни коефициенти са съответно равни на

b 0 = 223,

b 1 = 0,0088.

Тогава уравнението на сдвоената линейна регресия, което свързва стойността на месечната пенсия y със стойността на екзистенц минимума, има вида

.(3.2)

Освен това, в съответствие със задачата, е необходимо да се оцени стегнатостта на статистическата връзка между жизнения минимум x и месечната пенсия y. Тази оценка може да се направи с помощта на коефициента на корелация. Стойността на този коефициент на фигура 5 е обозначена като кратно R и е равна съответно на 0,038. Тъй като теоретично стойността на този коефициент е в диапазона от -1 до +1, можем да заключим, че статистическата връзка между екзистенц минимума x и месечната пенсия y не е значима.

Параметърът "R - квадрат", показан на фигура 5, е квадратът на корелационния коефициент и се нарича коефициент на детерминация. Стойността на този коефициент характеризира частта от дисперсията на зависимата променлива y, обяснена чрез регресия (обяснителната променлива x). Съответно, стойността на 1- характеризира съотношението на дисперсията на променливата y, причинена от влиянието на всички други обяснителни променливи, които не са взети предвид в иконометричния модел. Фигура 5 показва, че делът на всички обяснителни променливи, които не са взети предвид в получения иконометричен модел, е приблизително 1-0,00145 = 0,998 или 99,8%.



На следващия етап, в съответствие със задачата, е необходимо да се определи степента на връзка между обяснителната променлива x и зависимата променлива y, като се използва коефициентът на еластичност. Коефициентът на еластичност за сдвоен линеен регресионен модел се определя като:

Следователно при промяна на издръжката с 1% месечната пенсия се променя с 0,000758%.

. (3.4)

За да направите това, допълваме оригиналната таблица 1 с две колони, в които определяме стойностите, изчислени с помощта на зависимост (3.2) и стойността на разликата.

Таблица 3.2. Изчисляване на средната апроксимационна грешка.

Тогава средната грешка на приближението е равна на

.

От практиката е известно, че стойността на средната грешка на приближението не трябва да надвишава (12 ... 15)%

На последния етап ще оценим статистическата надеждност на моделирането с помощта на F - критерия на Фишер. За да направим това, ще проверим нулевата хипотеза H 0 за статистическата незначимост на полученото регресионно уравнение според условието:

ако при дадено ниво на значимост a = 0,05 теоретичната (изчислена) стойност на F-критерия е по-голяма от неговата критична стойност F crit (таблица), тогава нулевата хипотеза се отхвърля и полученото регресионно уравнение се приема за значително.

От фигура 5 следва, че Fcalc = 0.0058. Критичната стойност на F-критерия се определя с помощта на статистическата функция FDISP (Фигура 6). Входните параметри на функцията са нивото на значимост (вероятност) и броя на степените на свобода 1 и 2. За сдвоения регресионен модел броят на степените на свобода е съответно равен на 1 (една обяснителна променлива) и n-2 = 6-2=4.



Фигура 6 - Прозорец на статистическата функция FDISP

Фигура 6 показва, че критичната стойност на F-критерия е 7,71.

Тъй като F изч< F крит, то нулевая гипотеза не отвергается и полученное регресионно уравнениестатистически незначими.

13. Изграждане на модели множествена регресияизползвайки EXCEL.

В съответствие с опцията за задание, използвайки статистически материал, е необходимо.

1. Изградете линейно уравнениемножествена регресия обясни икономически смисълнеговите параметри.

2. Да се ​​даде сравнителна оценка на близостта на връзката на факторите с продуктивния атрибут, като се използват средни (общи) коефициенти на еластичност.

3. Оценете статистическа значимострегресионни коефициенти с помощта на t-теста на Стюдънт и нулевата хипотеза за значимостта на уравнението с помощта на F-теста.

4. Оценете качеството на уравнението чрез определяне на средната апроксимационна грешка.

Изходните данни за изграждане на сдвоен регресионен модел са дадени в таблица 3.3.

Таблица 3.3. Изходни данни.

Нетна печалба, млн. USD Оборот на капитала, мл. щатски долари, х 1 Използван капитал, мл. щатски долари, х 2
6,6 6,9 83,6
2,7 93,6 25,4
1,6 10,0 6,4
2,4 31,5 12,5
3,3 36,7 14,3
1,8 13,8 6,5
2,4 64,8 22,7
1,6 30,4 15,8
1,4 12,1 9,3
0,9 31,3 18,9

Технологията за конструиране на регресионното уравнение е подобна на алгоритъма, описан в параграф 3.1. Протоколът за конструиране на регресионното уравнение е показан на фигура 7.

РЕЗУЛТАТИ
Регресионна статистика
Множество R 0,901759207
R-квадрат 0,813169667
Нормализиран R-квадрат 0,759789572
стандартна грешка 0,789962026
Наблюдения
Дисперсионен анализ
df ГОСПОЖИЦА Е
Регресия 9,50635999 15,23357468
остатък 0,624040003
Обща сума
Коефициенти t-статистика
Y-пресечка 1,113140304 2,270238114
Променлива X 1 -0,000592199 -0,061275574
Променлива X 2 0,063902851 5,496523193

Фигура 7. Резултати.

Между различни методипрогнозиране, е невъзможно да не се подчертае приближението. С негова помощ можете да правите приблизителни изчисления и да изчислявате планираните показатели, като заменяте оригиналните обекти с по-прости. В Excel също има възможност за използване на този метод за прогнозиране и анализ. Нека да разгледаме как този метод може да се приложи в посочената програма с вградени инструменти.

Наименованието на този метод идва от латинската дума proxima - „най-близкият“ Това е приближение чрез опростяване и изглаждане на известни индикатори, подреждането им в тенденция, която е в основата му. Но този методможе да се използва не само за прогнозиране, но и за изследване на съществуващи резултати. В крайна сметка приближението всъщност е опростяване на първоначалните данни, а опростената версия е по-лесна за изучаване.

Основният инструмент, с който се извършва изглаждане в Excel, е изграждането на линия на тренда. Изводът е, че въз основа на съществуващите индикатори се попълва графиката на функцията за бъдещи периоди. Основната цел на тренд линията, както можете да предположите, е да се правят прогнози или да се идентифицира обща тенденция.

Но може да се изгради с помощта на един от петте вида приближения:

  • Линеен;
  • експоненциален;
  • логаритмичен;
  • полином;
  • Мощност.

Нека разгледаме всяка от опциите по-подробно поотделно.

Метод 1: Линейно изглаждане

Първо, нека разгледаме най-простото приближение, а именно използването линейна функция. Ще се спрем на него по-подробно, тъй като ще заявим общи точкихарактерни за други методи, а именно изграждането на графика и някои други нюанси, на които няма да се спираме, когато разглеждаме следващите опции.

Първо, нека изградим графика, въз основа на която ще извършим процедурата за изглаждане. За да изградим графика, нека вземем таблица, в която цената на единица продукция, произведена от предприятието, и съответната печалба за даден период са посочени на месечна база. Графична функция, който ще изградим, ще покаже зависимостта на увеличението на печалбата от намаляването на себестойността на продукцията.


Използваното в този случай изглаждане се описва със следната формула:

В нашия конкретен случай формулата има следния вид:

y=-0,1156x+72,255

Стойността на надеждността на приближението е равна на 0,9418 , което е доста приемлив резултат, характеризиращ изглаждането като надеждно.

Метод 2: Експоненциално приближение

Сега нека разгледаме експоненциалния тип приближение в Excel.


Общата форма на изглаждащата функция е следната:

където де основата натурален логаритъм.

В нашия конкретен случай формулата прие следната форма:

y=6282.7*e^(-0.012*x)

Метод 3: логаритмично изглаждане

Сега е ред да разгледаме метода на логаритмично приближение.


AT общ изгледформулата за изглаждане изглежда така:

където вътрее натурален логаритъм. Оттук и името на метода.

В нашия случай формулата има следния вид:

y=-62.81ln(x)+404.96

Метод 4: Полиномно изглаждане

Дойде време да разгледаме метода на полиномно изглаждане.


Формулата, която описва този тип изглаждане, има следната форма:

y=8E-08x^6-0,0003x^5+0,3725x^4-269,33x^3+109525x^2-2E+07x+2E+09

Метод 5: мощност изглаждане

В заключение, разгледайте метода за приближаване на мощността в Excel.


Този метод се използва ефективно в случаи на интензивна промяна на функционалните данни. Важно е да се отбележи, че тази опция е приложима само ако функцията и аргументът не приемат отрицателни или нулеви стойности.

Общата формула, описваща този метод, е следната:

В нашия конкретен случай това изглежда така:

y = 6E+18x^(-6,512)

Както можете да видите, когато използваме конкретните данни, които използвахме за примера, методът на полиномна апроксимация с полином от шеста степен показа най-високо ниво на надеждност ( 0,9844 ), най-ниското ниво на доверие в линеен метод (0,9418 ). Но това изобщо не означава, че същата тенденция ще бъде при използване на други примери. Не, нивото на ефективност на горните методи може да варира значително в зависимост от конкретния тип функция, за която ще бъде изградена тренд линията. Следователно, ако избраният метод е най-ефективен за тази функция, това изобщо не означава, че той ще бъде оптимален и в друга ситуация.

Ако не можете веднага да определите въз основа на горните препоръки кой тип приближение е подходящ конкретно за вашия случай, тогава има смисъл да опитате всички методи. След като очертаете линията на тенденцията и видите нейното ниво на увереност, можете да изберете най-добрата опция.

Споделете с приятели или запазете за себе си:

Зареждане...