Знайти середню помилку апроксимації. Оцінка якості рівняння регресії

Для загальної оцінкиЯкість побудованої економетричної визначаються такі характеристики як коефіцієнт детермінації, індекс кореляції, середня відносна помилка апроксимації, а також перевіряється значущість рівняння регресії за допомогою F-Крітерія Фішера. Перелічені характеристики є досить універсальними і можуть застосовуватися як для лінійних, так і для нелінійних моделей, а також моделей із двома та більш факторними змінними. Визначальне значення при обчисленні всіх перерахованих характеристикякості грає ряд залишків ε i, який обчислюється шляхом віднімання з фактичних (отриманих за спостереженнями) значень досліджуваної ознаки y iзначень, розрахованих за рівнянням моделі y рi.

Коефіцієнт детермінації

показує, яка частка зміни досліджуваного ознаки враховано моделі. Іншими словами коефіцієнт детермінації показує, яка частина зміни досліджуваної змінної може бути обчислена, виходячи зі змін, включених у модель факторних змінних за допомогою обраного типу функції, що зв'язує факторні змінні та досліджувану ознаку в рівнянні моделі.

Коефіцієнт детермінації R 2може приймати значення від 0 до 1. Чим ближче коефіцієнт детермінації R 2до одиниці, тим краща якістьмоделі.

Індекс кореляції можна легко обчислити, знаючи коефіцієнт детермінації:

Індекс кореляції Rхарактеризує тісноту обраного при побудові моделі типу зв'язку між врахованими в моделі факторами та змінною, що досліджується. У разі лінійної парної регресії його значення абсолютної величини збігається з коефіцієнтом парної кореляції r(x, y), який ми розглянули раніше, і характеризує тісноту лінійного зв'язку між xі y. Значення індексу кореляції, очевидно, також лежать в інтервалі від 0 до 1. Чим ближче величина Rдо одиниці, тим вибраний вид функції пов'язує між собою факторні змінні і досліджуваний ознака, тим краще якість моделі.

(2.11)

виражається у відсотках та характеризує точність моделі. Прийнятна точність моделі при вирішенні практичних завданьможе визначатися, з міркувань економічної доцільності з урахуванням конкретної ситуації. Широко застосовується критерій, відповідно до якого точність вважається задовільною, якщо середня відносна похибкаменше 15%. Якщо E отн.менше 5%, то кажуть, що модель має високу точність. Не рекомендується застосовувати для аналізу та прогнозу моделі з незадовільною точністю, тобто коли E отн.більше ніж 15%.

F-критерій Фішера використовується з метою оцінки значущості рівняння регресії. Розрахункове значення F-критерію визначається із співвідношення:

. (2.12)

Критичне значення F-критерія визначається за таблицями при заданому рівні значимості α і ступенях свободи (можна використовувати функцію FРАСПОБР Excel). Тут, як і раніше, m- Число факторів, врахованих в моделі, n– кількість спостережень. Якщо розрахункове значення більше критичного, то рівняння моделі визнається значущим. Чим більше розрахункове значення F-Критерію, тим краще якість моделі.

Визначимо характеристики якості збудованої нами лінійної моделі для Приклад 1. Скористаємося даними Таблиці 2. Коефіцієнт детермінації:

Отже, у межах лінійної моделі зміна обсягу продажу на 90,1% пояснюється зміною температури повітря.

Індекс кореляції

.

Значення індексу кореляції у разі парної лінійної моделі, як ми бачимо, дійсно по модулю дорівнює коефіцієнту кореляції між відповідними змінними (обсяг продажів і температура). Оскільки отримане значення досить близько до одиниці, то можна зробити висновок про наявність тісного лінійного зв'язку між досліджуваною змінною (обсяг продажів) та факторною змінною (температура).

F-критерій Фішера

Критичне значення F крпри α = 0,1; ν 1 =1; ν 2 =7-1-1=5 дорівнює 4,06. Розрахункове значення F-Критерію більше табличного, отже, рівняння моделі є значущим.

Середня відносна помилка апроксимації

Побудована лінійна модель парної регресії має незадовільну точність (>15%), і її рекомендується використовуватиме аналізу та прогнозування.

У результаті, незважаючи на те, що більшість статистичних характеристик задовольняють критеріям, що висуваються до них, лінійна модель парної регресії непридатна для прогнозування обсягу продажів залежно від температури повітря. Нелінійний характер залежності між зазначеними змінними за даними спостережень добре видно на Рис.1. Проведений аналіз це підтвердив.

Показники кореляції та детермінації

Лінійної парної регресії

Спираючись на допоміжні дані, розраховані в табл. 2, розраховуємо показник тісноти зв'язку.

Таким показником є ​​вибірковий лінійний коефіцієнткореляції, що розраховується з використанням формули.

За результатами розрахунку коефіцієнта кореляції можна дійти невтішного висновку, що зв'язок між факторним і результативним ознакою пряма і сильна (за шкалою Чеддока).

Квадрат коефіцієнта кореляції називається коефіцієнтом детермінації, який показує частку варіації результативної ознаки, пояснену варіацією факторної ознаки.

Зазвичай, даючи інтерпретацію коефіцієнта детермінації, його виражають у відсотках.

R 2 = 0.847 2 = 0.7181

тобто. у 71.81% випадків зміни факторної ознаки призводить до зміни та результатуючої ознаки. Точність підбору рівняння регресії досить висока. Інші 28.19% зміни Y пояснюються факторами, які не враховані в моделі.

Ступеневої парної регресії

Тісноту зв'язку результатуючої та факторної ознаки для статечної парної регресії визначимо з використанням коефіцієнта кореляції:

Підставивши відомі дані, отримаємо:

Показник детермінації.

тобто. у 69% випадків зміни факторної ознаки призводить до зміни та результатуючої ознаки. Точність підбору рівняння регресії – середня. Інші 31% зміни Y пояснюються факторами, які не враховані в моделі.

Середня помилка апроксимації

Лінійної парної регресії

Оцінимо якість рівняння регресії за допомогою помилки абсолютної апроксимації. Середня помилка апроксимації - середнє відхилення розрахункових значень від фактичних:

Ступеневої парної регресії

Середня помилка апроксимації - середнє відхилення розрахункових значень від фактичних:

Помилка апроксимації в межах 5%-7% свідчить про хороший вибір рівняння регресії до вихідних даних.

Оскільки помилка більше 7%, то дане рівняння не бажано використовувати як регресію.

Оцінка за допомогою F-критерію Фішера статистичної надійності результатів регресійного моделювання

Лінійної парної регресії

Коефіцієнт детермінації R 2 використовується для перевірки суттєвості рівняння лінійної регресіїв цілому.

Перевірка значущості моделі регресії проводиться з використанням F-критерію Фішера, розрахункове значення якого перебуває як відношення дисперсії вихідного ряду спостережень показника, що вивчається, і незміщеної оцінки дисперсії залишкової послідовності для даної моделі.

Якщо розрахункове значення з k 1 =(m) і k 2 =(n-m-1) ступенями свободи більше табличного при заданому рівні значущості, модель вважається значущою.

Оцінка статистичної значущості парної лінійної регресії проводиться у разі наступного алгоритму:

де m=1 для парної регресії.

Оскільки фактичне значення F>

Ступеневої парної регресії

Аналогічно лінійної парної регресії проведемо оцінку статечної парної регресії

де m – число факторів у моделі.

1. Висувається нульова гіпотеза у тому, що рівняння загалом статистично незначимо: H 0: R 2 =0 лише на рівні значимості б.

2. Визначаємо фактичне значення F-критерію:

де m=1 для парної регресії.

3. Табличне значення визначається за таблицями розподілу Фішера для заданого рівня значущості, враховуючи, що число ступенів свободи загальної сумиквадратів (більшої дисперсії) дорівнює 1 і число ступенів свободи залишкової суми квадратів (меншої дисперсії) при лінійній регресії дорівнює n-2.

F табл - це максимально можливе значення критерію під впливом випадкових факторів при даних ступенях свободи та рівні значущості б. Рівень значущості б - можливість відкинути правильну гіпотезу за умови, що вона вірна. Зазвичай приймається дорівнює 0,05 або 0,01.

4. Якщо фактичне значення F-критерію менше табличного, то кажуть, що немає підстав відхиляти нульову гіпотезу.

В іншому випадку, нульова гіпотеза відхиляється і з ймовірністю (1-б) приймається альтернативна гіпотеза про статистичну значущість рівняння в цілому.

Табличне значення критерію зі ступенями свободи:

k 1 =1 і k 2 =8, F табл = 5.32

Оскільки фактичне значення F > F табл, коефіцієнт детермінації статистично значущий (знайдена оцінка рівняння регресії статистично надійна).

За результатами аналізу робимо висновок, що коефіцієнти детермінації як для лінійної парної регресії, так і для статечної парної регресії є статистично значущими.

Оскільки лінійна парна регресії має вищий коефіцієнт (показово) детермінації, вважаємо, що саме вона адекватно описує залежність між факторною та результативною ознакою.

Перевіримо гіпотезу H 0 про рівність окремих коефіцієнтів регресії нулю (при альтернативі H 1 не дорівнює) лише на рівні значимості б=0.05.

Якщо основна гіпотеза виявиться неправильною, ми приймаємо альтернативну. Для перевірки цієї гіпотези використовується t-критерій Стьюдента.

Знайдене за даними спостережень значення t-критерію (його ще називають спостерігається або фактичним) порівнюється з табличним (критичним) значенням, що визначається за таблицями розподілу Стьюдента (які зазвичай наводяться в кінці підручників та практикумів зі статистики чи економетрики).

Табличне значення визначається залежно від рівня значущості (б) та числа ступенів свободи, яке у разі лінійної парної регресії дорівнює (n-2), n-число спостережень.

Якщо фактичне значення t-критерію більше табличного (за модулем), то основну гіпотезу відкидають і вважають, що з ймовірністю (1-б) параметр або статистична характеристика генеральної сукупностіЗначно відрізняється від нуля.

Якщо фактичне значення t-критерію менше табличного (за модулем), немає підстав відкидати основну гіпотезу, тобто. параметр чи статистична характеристика у генеральній сукупності незначно відрізняється від нуля за рівня значимості б.

t критий (n-m-1; б/2) = (30; 0.025) = 2.042

Оскільки 1.7< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.

Оскільки 0.56< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Довірчий інтервал коефіцієнтів рівняння регресії.

Визначимо довірчі інтервали коефіцієнтів регресії, які з надійністю 95% будуть такими:

  • (b - t крит S b; b + t крит S b)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

Так як точка 0 (нуль) лежить усередині довірчого інтервалу, то інтервальна оцінкакоефіцієнта b статистично незначима.

  • (a - t критий S a ; a + t критий S a)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

Імовірно, 95% можна стверджувати, що значення даного параметра будуть лежати в знайденому інтервалі.

Оскільки точка 0 (нуль) лежить усередині довірчого інтервалу, то інтервальна оцінка коефіцієнта статистично незначна.

2) F-статистика. Критерій Фішера.

Коефіцієнт детермінації R 2 використовується для перевірки суттєвості рівняння лінійної регресії загалом.

Перевірка значущості моделі регресії проводиться з використанням F-критерію Фішера, розрахункове значення якого перебуває як відношення дисперсії вихідного ряду спостережень показника, що вивчається, і незміщеної оцінки дисперсії залишкової послідовності для даної моделі.

Якщо розрахункове значення з k 1 =(m) і k 2 =(n-m-1) ступенями свободи більше табличного при заданому рівні значущості, модель вважається значущою.

де m – число факторів у моделі.

Оцінка статистичної значущості парної лінійної регресії проводиться у разі наступного алгоритму:

  • 1. Висувається нульова гіпотеза у тому, що рівняння загалом статистично незначимо: H 0: R 2 =0 лише на рівні значимості б.
  • 2. Далі визначають фактичне значення F-критерію:

де m=1 для парної регресії.

3. Табличне значення визначається за таблицями розподілу Фішера для заданого рівня значимості, враховуючи, що кількість ступенів свободи для загальної суми квадратів (більшої дисперсії) дорівнює 1 і число ступенів свободи залишкової суми квадратів (меншої дисперсії) при лінійній регресії дорівнює n-2 .

F табл - це максимально можливе значення критерію під впливом випадкових факторів при даних ступенях свободи та рівні значущості б. Рівень значущості б - можливість відкинути правильну гіпотезу за умови, що вона вірна. Зазвичай приймається дорівнює 0,05 або 0,01.

4. Якщо фактичне значення F-критерію менше табличного, то кажуть, що немає підстав відхиляти нульову гіпотезу.

В іншому випадку, нульова гіпотеза відхиляється і з ймовірністю (1-б) приймається альтернативна гіпотеза про статистичну значущість рівняння в цілому.

Табличне значення критерію зі ступенями свободи k 1 =1 і k 2 =30 F табл = 4.17

Оскільки фактичне значення F< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Зв'язок між F-критерієм Фішера та t-статистикою Стьюдента виражається рівністю:

Показники якості рівняння регресії.

Перевірка на наявність автокореляції залишків.

Важливою передумовою побудови якісної регресійної моделі МНК є незалежність значень випадкових відхиленьвід значень відхилень у всіх інших спостереженнях. Це гарантує відсутність корелювання між будь-якими відхиленнями і, зокрема, між сусідніми відхиленнями.

Автокореляція (послідовна кореляція) визначається як кореляція між показниками, що спостерігаються, упорядкованими в часі (тимчасові ряди) або в просторі (перехресні ряди). Автокореляція залишків (відхилень) зазвичай зустрічається в регресійний аналізпри використанні даних часових рядів та дуже рідко при використанні перехресних даних.

В економічних завданнях значно частіше трапляється позитивна автокореляція, ніж негативна автокореляція. Найчастіше позитивна автокореляція викликається спрямованим постійним впливом деяких неврахованих у моделі чинників.

Негативна автокореляція фактично означає, що за позитивним відхиленням слідує негативне і навпаки. Така ситуація може мати місце, якщо ту саму залежність між попитом на прохолодні напої та доходами розглядати за сезонними даними (зима-літо).

Серед основних причин, що викликають автокореляцію, можна виділити такі:

  • 1. Помилки специфікації. Неврахування у моделі будь-якої важливої ​​пояснюючої змінної чи неправильний вибір форми залежності зазвичай призводять до системним відхиленням точок спостереження лінії регресії, що може зумовити автокореляцію.
  • 2. Інерція. Багато економічні показники(інфляція, безробіття, ВНП і т.д.) мають певну циклічність, пов'язану з хвилеподібністю ділової активності. Тому зміна показників відбувається не миттєво, а має певну інертність.
  • 3. Ефект павутиння. У багатьох виробничих та інших сферах економічні показники реагують зміну економічних умов із запізненням (тимчасовим лагом).
  • 4. Згладжування даних. Найчастіше дані по деякому тривалому часовому періоду отримують усереднення даних по складових його інтервалах. Це може призвести до певного згладжування коливань, які були всередині періоду, що розглядається, що в свою чергу може бути причиною автокореляції.

Наслідки автокореляції схожі з наслідками гетероскедастичності: висновки з t- та F-статистиків, що визначають значущість коефіцієнта регресії та коефіцієнта детермінації, можливо, будуть невірними.


Емпіричні коефіцієнти регресії b 0 , b 1 визначатимемо за допомогою інструмента «Регресія» надбудови «Аналіз даних» табличного процесора MS Excel.

Алгоритм визначення коефіцієнтів ось у чому.

1. Вхідні дані в табличний процесор MS Excel.

2. Викликаємо надбудову Аналіз даних (рисунок 2).

3. Вибираємо інструмент аналізу Регресія (рисунок 3).

4. Заповнюємо відповідні позиції вікна Регресія (рис. 4).

5. Натискаємо кнопку ОК вікна Регресія та отримуємо протокол розв'язання задачі (рисунок 5)


Рисунок 3 – Вибір інструменту Регресія




Рисунок 4 – Вікно Регресія

Рисунок 5 – Протокол розв'язання задачі

З малюнка 5 видно, що емпіричні коефіцієнти регресії відповідно дорівнюють

b 0 = 223,

b 1 = 0,0088.

Тоді рівняння парної лінійної регресії, що зв'язує величину щомісячної пенсії з величиною прожиткового мінімуму має вигляд

.(3.2)

Далі, відповідно до завдання необхідно оцінити тісноту статистичного зв'язку між величиною прожиткового мінімуму х та величиною щомісячної пенсії у. Цю оцінку можна зробити за допомогою коефіцієнта кореляції. Величина цього коефіцієнта малюнку 5 позначена як множинний R і дорівнює 0,038. Оскільки теоретично величина даного коефіцієнта знаходиться в межах від -1 до +1, то можна зробити висновок про не суттєвість статистичного зв'язку між величиною прожиткового мінімуму х і величиною щомісячної пенсії у.

Параметр «R – квадрат», представлений малюнку 5 є квадрат коефіцієнта кореляції і називається коефіцієнтом детермінації. Розмір даного коефіцієнта характеризує частку дисперсії залежної змінної у, пояснену регресією (що пояснює змінної х). Відповідно величина 1- характеризує частку дисперсії змінної у, викликану впливом решти, неврахованих в економетричної моделі пояснюють змінних. З малюнка 5 видно, частка всіх неврахованих в отриманої економетричної моделі пояснюючих змінних приблизно становить 1- 0,00145 = 0,998 чи 99,8%.



На наступному етапі, відповідно до завдання необхідно визначити ступінь зв'язку пояснюючої змінної х із залежною змінною у, використовуючи коефіцієнт еластичності. Коефіцієнт еластичності для моделі парної лінійної регресії визначається як:

Отже, за зміни прожиткового мінімуму на 1% величина щомісячної пенсії змінюється на 0,000758%.

. (3.4)

Для цього вихідну таблицю 1 доповнюємо двома колонками, в яких визначаємо значення розраховані з використанням залежності (3.2) і значення різниці .

Таблиця 3.2. Розрахунок середньої помилки апроксимації.

Тоді середня помилка апроксимації дорівнює

.

З практики відомо, що значення середньої помилки апроксимації не повинно перевищувати (12...15)%

На останньому етапі виконаємо оцінку статистичної надійності моделювання за допомогою F - критерію Фішера. Для цього виконаємо перевірку нульової гіпотези Н 0 про статистичну не значущість отриманого рівняння регресії за умовою:

якщо за заданому рівні значимості a = 0,05 теоретичне (розрахункове) значення F-критерію більше його критичного значення F крит (табличного), то нульова гіпотеза відкидається, і отримане рівняння регресії приймається значним.

З малюнка 5 випливає, що F розрахунок = 0,0058. Критичне значення F-критерію визначаємо за допомогою використання статистичної функції FРАСПОБР (рисунок 6). Вхідними параметрами функції є рівень значущості (імовірність) і число ступенів свободи 1 і 2. Для моделі парної регресії число ступенів свободи відповідно дорівнює 1 (одна змінна, що пояснює) і n-2 = 6-2=4.



Рисунок 6 – Вікно статистичної функції FРАСПОБР

З малюнка 6 видно, що критичне значення F-критерію дорівнює 7,71.

Так як F розрах< F крит, то нулевая гипотеза не отвергается и полученное регресійне рівняннястатистично незначимо.

13. Побудова моделі множинної регресіїіз використанням EXCEL.

Відповідно до варіанта завдання, використовуючи статистичний матеріал, необхідно.

1. Побудувати лінійне рівняннямножинної регресії пояснити економічний сенсйого параметрів.

2. Дати порівняльну оцінку тісноти зв'язку факторів із результативною ознакою за допомогою середніх (загальних) коефіцієнтів еластичності.

3. Оцінити статистичну значимістькоефіцієнтів регресії за допомогою t-критерію Стьюдента та нульової гіпотези про значущість рівняння за допомогою F-критерію.

4. Оцінити якість рівняння у вигляді визначення середньої помилки апроксимації.

Вихідні дані для побудови моделі парної регресії наведено у таблиці 3.3.

Таблиця 3.3. Початкові дані.

Чистий дохід, млн. доларів США у Оборот капіталу, мол. дол. США, х 1 Використаний капітал, мол. дол. США, х 2
6,6 6,9 83,6
2,7 93,6 25,4
1,6 10,0 6,4
2,4 31,5 12,5
3,3 36,7 14,3
1,8 13,8 6,5
2,4 64,8 22,7
1,6 30,4 15,8
1,4 12,1 9,3
0,9 31,3 18,9

Технологія побудови рівняння регресії аналогічна алгоритму, викладеному у пункті 3.1. Протокол побудови рівняння регресії показано малюнку 7.

ВИСНОВОК ПІДСУМКІВ
Регресійна статистика
Множинний R 0,901759207
R-квадрат 0,813169667
Нормований R-квадрат 0,759789572
Стандартна помилка 0,789962026
Спостереження
Дисперсійний аналіз
df MS F
Регресія 9,50635999 15,23357468
Залишок 0,624040003
Разом
Коефіцієнти t-статистика
Y-перетин 1,113140304 2,270238114
Змінна X 1 -0,000592199 -0,061275574
Змінна X 2 0,063902851 5,496523193

Малюнок 7. Виведення підсумків.

Серед різних методівпрогнозування не можна виділити апроксимацію. З її допомогою можна проводити приблизні підрахунки та обчислювати заплановані показники, шляхом заміни вихідних об'єктів більш прості. В Екселі теж існує можливість використання цього методу для прогнозування та аналізу. Давайте розглянемо, як цей метод можна застосувати у програмі вбудованими інструментами.

Найменування даного методу походить від латинського слова proxima - "найближча" Саме наближення шляхом спрощення та згладжування відомих показників, вибудовування їх у тенденцію і є його основою. Але даний методможна використовувати як для прогнозування, але й дослідження вже існуючих результатів. Адже апроксимація є, по суті, спрощенням вихідних даних, а спрощений варіант легше дослідити.

Головний інструмент, за допомогою якого проводиться згладжування в Excel - це побудова лінії тренду. Суть у тому, що у основі вже існуючих показників добудовується графік функції майбутні періоди. Основне призначення лінії тренду, як не складно здогадатися, це складання прогнозів чи виявлення загальної тенденції.

Але вона може бути побудована із застосуванням одного з п'яти видів апроксимації:

  • Лінійний;
  • експоненційної;
  • Логарифмічній;
  • поліноміальної;
  • Ступіньної.

Розглянемо кожен із варіантів докладніше окремо.

Спосіб 1: лінійне згладжування

Насамперед, давайте розглянемо найпростіший варіант апроксимації, а саме за допомогою лінійної функції. На ньому ми зупинимося найдокладніше, оскільки викладемо загальні моментихарактерні й інших способів, саме побудова графіка та інші нюанси, у яких під час розгляду наступних варіантів вже зупинятися не будемо.

Насамперед, побудуємо графік, на підставі якого проводитимемо процедуру згладжування. Для побудови графіка візьмемо таблицю, де помісячно зазначена собівартість одиниці виробленої підприємством, і відповідна прибуток у цьому періоді. Графічна функція, яку ми побудуємо, відображатиме залежність збільшення прибутку від зменшення собівартості продукції.


Згладжування, яке використовується в даному випадку, описується такою формулою:

У нашому випадку формула приймає такий вид:

y=-0,1156x+72,255

Розмір достовірності апроксимації в нас дорівнює 0,9418 , що досить прийнятним результатом, характеризує згладжування, як достовірне.

Спосіб 2: експоненційна апроксимація

Тепер давайте розглянемо експоненційний тип апроксимації Ексель.


Загальний вигляд функції згладжування при цьому такий:

де e– це підстава натурального логарифму.

У нашому випадку формула прийняла таку форму:

y=6282,7*e^(-0,012*x)

Спосіб 3: логарифмічне згладжування

Тепер настала черга розглянути метод логарифмічної апроксимації.


У загальному виглядіформула згладжування виглядає так:

де ln- Це величина натурального логарифму. Звідси й найменування способу.

У нашому випадку формула набуває такого вигляду:

y=-62,81ln(x)+404,96

Спосіб 4: поліноміальне згладжування

Настала черга розглянути метод поліноміального згладжування.


Формула, яка описує даний тип згладжування, набула наступного вигляду:

y=8E-08x^6-0,0003x^5+0,3725x^4-269,33x^3+109525x^2-2E+07x+2E+09

Спосіб 5: статечне згладжування

На завершення розглянемо метод статечної апроксимації в Excel.


Цей спосіб ефективно використовується у випадках інтенсивної зміни даних функції. Важливо врахувати, що цей варіант застосовується лише за умови, що функція та аргумент не приймають негативних або нульових значень.

Загальна формула, що описує цей метод має такий вигляд:

У нашому випадку вона виглядає так:

y = 6E+18x^(-6,512)

Як бачимо, при використанні конкретних даних, які ми застосовували для прикладу, найбільший рівень достовірності показав метод поліноміальної апроксимації з поліномом шостою ( 0,9844 ), найменший рівень достовірності у лінійного методу (0,9418 ). Але це зовсім не означає, що така тенденція буде при використанні інших прикладів. Ні, рівень ефективності у наведених вище методів може значно відрізнятися, залежно від конкретного виду функції, для якої будуватиметься лінія тренду. Тому, якщо для цієї функції обраний метод найефективніший, це зовсім не означає, що він також буде оптимальним і в іншій ситуації.

Якщо ви поки що не можете відразу визначити, ґрунтуючись на наведених вище рекомендаціях, який вид апроксимації підійде саме у вашому випадку, тобто сенс спробувати всі методи. Після побудови лінії тренду та перегляду її рівня достовірності можна буде вибрати оптимальний варіант.

Поділіться з друзями або збережіть для себе:

Завантаження...