Апроксимація дослідних даних. Метод найменших квадратів

КУРСОВА РОБОТА

з дисципліни: Інформатика

Тема: Апроксимація функції методом найменших квадратів

Вступ

1.Постановка задачі

2.Розрахункові формули

Розрахунок за допомогою таблиць, виконаних засобами Microsoft Excel

Схема алгоритму

Розрахунок у програмі MathCad

Результати, отримані за допомогою функції Лінейн

Подання результатів у вигляді графіків


Вступ

Метою курсової роботиє поглиблення знань з інформатики, розвиток та закріплення навичок роботи з табличним процесором Microsoft Excel та програмним продуктом MathCAD та застосування їх для вирішення завдань за допомогою ЕОМ з предметної галузі, пов'язаної з дослідженнями.

Апроксимація (від латинського "approximare" - "наближатися") - наближений вираз будь-яких математичних об'єктів (наприклад, чисел або функцій) через інші простіші, зручніші у користуванні або просто більш відомі. У наукових дослідженнях апроксимація застосовується для опису, аналізу, узагальнення та подальшого використання емпіричних результатів.

Як відомо, між величинами може існувати точний (функціональний) зв'язок, коли одному значенню аргументу відповідає одне певне значення, і менш точний (кореляційний) зв'язок, коли одному конкретному значенню аргументу відповідає наближене значення або деяка множина значень функції, тією чи іншою мірою близьких друг до друга. При веденні наукових досліджень, обробці результатів спостереження або експерименту зазвичай доводиться стикатися з другим варіантом.

При вивченні кількісних залежностей різних показників, значення яких визначаються емпірично, як правило, є деяка їхня варіабельність. Частково вона задається неоднорідністю самих об'єктів, що вивчаються, неживої і, особливо, живої природи, частково - обумовлюється похибкою спостереження та кількісної обробки матеріалів. Остання складова не завжди вдається виключити повністю, можна лише мінімізувати її ретельним вибором адекватного методу дослідження та акуратністю роботи. Тому при виконанні будь-якої науково-дослідної роботи виникає проблема виявлення справжнього характеру залежності показників, що вивчаються, цього чи іншого ступеня замаскованих неврахованістю варіабельності: значень. Для цього і застосовується апроксимація - наближений опис кореляційної залежності змінних відповідним рівнянням функціональної залежності, що передає основну тенденцію залежності (або її "тренд").

При виборі апроксимації слід з конкретної завдання дослідження. Зазвичай, що простіше рівняння використовується для апроксимації, тим більше приблизно одержуваний опис залежності. Тому важливо зчитувати, наскільки суттєві і чим зумовлені відхилення конкретних значень від тренда, що отримується. При описі залежності емпірично визначених значень можна досягти і набагато більшої точності, використовуючи якесь складніше, багато параметричне рівняння. Однак немає сенсу прагнути з максимальною точністю передати випадкові відхилення величин у конкретних рядах емпіричних даних. Набагато важливіше вловити загальну закономірність, яка в даному випадку найбільш логічно і з прийнятною точністю виражається саме двопараметричним рівнянням статечної функції. Отже, обираючи метод апроксимації, дослідник завжди йде компроміс: вирішує, якою мірою у разі доцільно і доречно «пожертвувати» деталями і, наскільки узагальнено слід висловити залежність зіставлюваних змінних. Поряд із виявленням закономірностей, замаскованих випадковими відхиленнямиемпіричних даних від загальної закономірності апроксимація дозволяє також вирішувати багато інших важливих завдань: формалізувати знайдену залежність; знайти невідомі значення залежної змінної шляхом інтерполяції або, якщо це припустимо, екстраполяції.

У кожному завданні формулюються умови завдання, вихідні дані, форма видачі результатів, вказуються основні математичні залежностідля вирішення задачі. Відповідно до методу розв'язання задачі розробляється алгоритм розв'язання, який подається у графічній формі.

1. Постановка задачі

1. Використовуючи метод найменших квадратів функцію, задану таблично, апроксимувати:

а) багаточлен першого ступеня;

б) багаточлен другого ступеня;

в) експоненційною залежністю.

Для кожної залежності обчислити коефіцієнт детермінованості.

Обчислити коефіцієнт кореляції (тільки у разі).

Для кожної залежності побудувати лінію тренду.

Використовуючи функцію Лінейн обчислити числові характеристикизалежно від.

Порівняти свої обчислення з результатами, отриманими за допомогою функції Лінейн.

Зробити висновок, яка з отриманих формул найкращим чиномапроксимує функцію.

Написати програму однією з мов програмування та порівняти результати рахунку з отриманими вище.

Варіант 3. Функція задана в табл. 1.

Таблиця 1.

xyxyxyxyxy0.281.052.349.113.3329.434.2386.445.55187.540.872.872.6516.863.4137.454.8390.856.32200.451.656.432.7717.973.5542.444.9299.066.66212.971.998.962.8318.993.8556.945.14120.457.13275.742.088.083.0623.754.0175.085.23139.657. 25321.43

2. Розрахункові формули

Часто при аналізі емпіричних даних виникає необхідність знайти функціональну залежність між величинами x та y, які отримані в результаті досвіду чи вимірювань.

Хi (незалежна величина) задається експериментатором, а yi, звана емпіричними або дослідними значеннями, виходить в результаті досвіду.

Аналітичний вид функціональної залежності, що існує між величинами x та y зазвичай невідомий, тому виникає практично важливе завдання – знайти емпіричну формулу

(де - параметри), значення якої за можливо мало відрізнялися б від досвідчених значень.

Згідно з методом найменших квадратів найкращими коефіцієнтамивважаються ті, котрим сума квадратів відхилень знайденої емпіричної функції від заданих значень функції буде мінімальною.

Використовуючи необхідну умову екстремуму функції кількох змінних - рівність нулю приватних похідних, знаходять набір коефіцієнтів, які доставляють мінімум функції, що визначається формулою (2) і отримують нормальну систему визначення коефіцієнтів:

Отже, знаходження коефіцієнтів зводиться до рішення системи (3).

Вигляд системи (3) залежить від цього, з якого класу емпіричних формул шукаємо залежність (1). У разі лінійної залежності система (3) набуде вигляду:

У разі квадратичної залежності система (3) набуде вигляду:

У ряді випадків як емпірична формула беруть функцію в яку невизначені коефіцієнти входять нелінійно. У цьому іноді завдання вдається лінеаризувати тобто. звести до лінійної. До таких залежностей належить експоненційна залежність

де a1і a2 невизначені коефіцієнти.

Лінеаризація досягається шляхом логарифмування рівності (6), після чого отримуємо співвідношення

Позначимо і відповідно через і тоді залежність (6) може бути записана у вигляді, що дозволяє застосувати формули (4) із заміною a1 на і на.

Графік відновленої функціональної залежності y(x) за результатами вимірів (xi, yi), i=1,2,…,n називається кривою регресії. Для перевірки згоди збудованої кривої регресії з результатами експерименту зазвичай вводять такі числові характеристики: коефіцієнт кореляції (лінійна залежність), кореляційне відношеннята коефіцієнт детермінованості.

Коефіцієнт кореляції є мірою лінійного зв'язку між залежними. випадковими величинами: він показує, наскільки добре у середньому може бути представлена ​​одна з величин у вигляді лінійної функції від іншої.

Коефіцієнт кореляції обчислюється за такою формулою:

де – середнє арифметичне значеннявідповідно x, y.

Коефіцієнт кореляції між випадковими величинами по абсолютній величині вбирається у 1. Чим ближче до 1, тим більше лінійна зв'язок між x і y.

У разі нелінійного кореляційного зв'язку умовні середні значення розташовуються біля кривої лінії. В цьому випадку як характеристику сили зв'язку рекомендується використовувати кореляційне відношення, інтерпретація якого не залежить від виду досліджуваної залежності.

Кореляційне відношення обчислюється за такою формулою:

де ж чисельник характеризує розсіювання умовних середніх у безумовного середнього.

Завжди. Рівність = відповідає випадковим некорельованим величинам; = і тоді, коли є точна функціональна зв'язок між x і y. У разі лінійної залежності y від x кореляційне відношення збігається із квадратом коефіцієнта кореляції. Величина використовується як індикатор відхилення регресії від лінійної.

Кореляційне відношення є мірою кореляційного зв'язку y c x у будь-якій формі, але не може дати уявлення про ступінь наближеності емпіричних даних до спеціальної форми. Щоб з'ясувати наскільки точно побудована крива відображає емпіричні дані вводиться ще одна характеристика - коефіцієнт детермінованості.


де Sост = - залишкова сума квадратів, що характеризує відхилення експериментальних даних від теоретичних. повна - повна сума квадратів, де середнє значення yi.

Регресійна сума квадратів, що характеризує розкид даних.

Чим менша залишкова сума квадратів порівняно з загальною сумоюквадратів, тим більше значення коефіцієнта детермінованості r2, який показує, наскільки добре рівняння, отримане за допомогою регресійного аналізупояснює взаємозв'язки між змінними. Якщо він дорівнює 1, має місце повна кореляція з моделлю, тобто. немає різниці між фактичним та оцінним значеннями y. В іншому випадку, якщо коефіцієнт детермінованості дорівнює 0, то рівняння регресії невдало для передбачення значень y.

Коефіцієнт детермінованості завжди перевищує кореляційне ставлення. У разі коли виконується рівність можна вважати, що побудована емпірична формула найбільш точно відображає емпіричні дані.

3. Розрахунок за допомогою таблиць, виконаних засобами Microsoft Excel

Для проведення розрахунків дані доцільно розмістити у вигляді таблиці 2, використовуючи засоби табличного процесора Microsoft Excel.

Таблиця 2

ABCDEFGHI10,281,050,07840,2940,0219520,0061470,082320,048790,01366120,872,870,75692,49690,6585030,5728982,1723031,0543120,91725131,656,432,722510,60954,4921257,41200617,505681,8609753,07060841, 998,963,960117,83047,88059915,6823935,48252,192774,36361352,088,084,326416,80648,99891218,7177434,957312,0893924,34593562,349,115,475621,317412,812929,982249,882722,2093735,16993272,6516, 867,022544,67918,6096349,31551118,39942,8249447,48610182,7717,977,672949,776921,2539358,87339137,8822,8887048,00170992,8318,998,008953,741722,6651964,14248152,0892,9439138, 331272103,0623,759,363672,67528,6526287,677222,38553,1675839,692803113,3329,4311,088998,001936,92604122,9637326,34633,38201511,26211123,4137,4511,6281127,704539,65182135,2127435, 47233,62300712,35445133,5542,4412,6025150,66244,73888158,823534,85013,74809113,30572143,8556,9414,8225219,21957,06663219,7065843,99324,04199815,56169154,0175,0816,0801301,070864, 4812258,56961207,2944,31855417,3174164,2386,4417,8929365,641275,68697320,15591546,6624,45945 118,86348174,8390,8523,3289438,8055112,6786544,23762119,4314,5092121,77948184,9299,0624,2064487,3752119,0955585,94982397,8864,59572622,61097195,14120,4526,4196619,113135,7967697, 99533182,2414,79123524,62695205,23139,6527,3529730,3695143,0557748,18113819,8324,93913925,8317215,55187,5430,80251040,847170,9539948,7945776,7015,23399229,04866226,32200,4539,94241266, 844252,4361595,3958006,4545,30056533,49957236,66212,9744,35561418,38295,40831967,4199446,4125,36115135,70527247,13275,7450,83691966,026362,46712584,3914017,775,61945840,06674257,25321, 4352,56252330,368381,07812762,81616895,165,7727841,852652695,932089,99453,310511850,652417,56977 Пояснимо, як таблиця 2 складається.

Крок 1. У комірки А1: A25 заносимо значення xi.

Крок 2. У комірки B1: B25 заносимо значення уi.

Крок 3.В комірку С1 вводимо формулу = А1 ^ 2.

Крок 4. У комірки С1: С25 ця формула копіюється.

Крок 5.У комірку D1 вводимо формулу = А1 * B1.

Крок 6. У комірки D1: D25 ця формула копіюється.

Крок 7.В комірку F1 вводимо формулу = А1^4.

Крок 8. У комірки F1: F25 ця формула копіюється.

Крок 9. У комірку G1 вводимо формулу = А1 ^ 2 * B1.

Крок 10. У комірки G1: G25 ця формула копіюється.

Крок 11. У комірку H1 вводимо формулу = LN(B1).

Крок 12. У комірки H1: H25 ця формула копіюється.

Крок 13.В комірку I1 вводимо формулу = А1 * LN (B1).

Крок 14. У комірки I1: I25 ця формула копіюється.

Наступні кроки робимо за допомогою автопідсумовування S .

Крок 15. У комірку А26 вводимо формулу = СУМ(А1: А25).

Крок 16. У комірку В26 вводимо формулу = СУМ(В1: В25).

Крок 17. У комірку С26 вводимо формулу = СУМ(С1: С25).

Крок 18. У комірку D26 вводимо формулу = СУМ(D1: D25).

Крок 19. У комірку E26 вводимо формулу = СУМ(E1: E25).

Крок 20. У комірку F26 вводимо формулу = СУМ(F1: F25).

Крок 21. У комірку G26 вводимо формулу = СУМ(G1: G25).

Крок 22. У комірку H26 вводимо формулу = СУМ(H1:H25).

Крок 23. У комірку I26 вводимо формулу = СУМ(I1: I25).

Апроксимуємо функцію лінійною функцією. Для визначення коефіцієнтів та скористаємося системою (4). Використовуючи підсумкові суми таблиці 2, розташовані в осередках A26, B26, C26 та D26, запишемо систему (4) у вигляді

вирішивши яку, отримаємо в.

Систему вирішували шляхом Крамера. Суть якого полягає у наступному. Розглянемо систему n алгебраїчних лінійних рівняньз n невідомими:

Визначником системи називається визначник матриці системи:

Позначимо - визначник, який вийде з визначника системи заміною j-го стовпця на стовпець

Таким чином, лінійна апроксимація має вигляд

Рішення системи (11) проводимо, використовуючи засоби Microsoft Excel. Результати представлені у таблиці 3.

Таблиця 3

ABCDE282595,932089,992995,93453,310511850,653031Зворотна матриця320,212802-0,04503a1=-88,9208133-0,045036,017

У таблиці 3 у осередках A32:B33 записана формула (=МОБР(А28:В29)).

У осередках Е32:Е33 записана формула (=МУМНОЖ(А32:В33),(C28:С29)).

Далі апроксимуємо функцію квадратичною функцією. Для визначення коефіцієнтів a1, a2 та a3 скористаємося системою (5). Використовуючи підсумкові суми таблиці 2, розташовані в осередках A26, B26, C26, D26, E26, F26, G26 запишемо систему (5) у вигляді

вирішивши яку, отримаємо a1=10,663624, та

Таким чином, квадратична апроксимація має вигляд

Рішення системи (16) проводимо, використовуючи засоби Microsoft Excel. Результати представлені у таблиці 4.

Таблиця 4

ABCDEF362595,93453,31052089,993795,93453,31052417,56811850,65538453,31052417,56813982,9971327,3453940Обратная матрица410,632687-0,314390,033846a1=10,66362442-0,314390,184534-0,021712a2=-18, 924512430,033846-0,021710,002728a3=8,0272305

У таблиці 4 у осередках А41:С43 записана формула (=МОБР(А36:С38)).

У осередках F41:F43 записана формула (=МУМНОЖ(А41:C43),(D36:D38)).

Тепер апроксимуємо функцію експоненційною функцією. Для визначення коефіцієнтів та прологарифмуємо значення і, використовуючи підсумкові суми таблиці 2, розташовані в осередках A26, C26, H26 та I26, отримаємо систему

Вирішивши систему (18), отримаємо в.

Після потенціювання отримаємо.

Таким чином, експоненційна апроксимація має вигляд

Рішення системи (18) проводимо, використовуючи засоби Microsoft Excel. Результати представлені у таблиці 5.

Таблиця 5

BCDEF462595,9390,977134795,93453,3105415,07974849Зворотна матрицас=0,667679 500,212802-0,04503а2=0,774368 51-09

У осередках А50:В51 записана формула (=МОБР(А46:В47)).

У комірці Е51 записана формула = EXP (E49).

Обчислимо середнє арифметичне та за формулами:

Результати розрахунку та засобами Microsoft Excel представлені у таблиці 6.

Таблиця 6

BC54Xср=3,837255Yср=83,5996

У комірці В54 записана формула = А26/25.

У комірці В55 записана формула = В26/25

Таблиця 7

ABJKLMNO10,281,05293,645412,653676814,4365987,97624,444081,88177520,872,87239,54098,8042766517,2682774,7226,7334610,91071731,656,43168,78534,7838445955,147448,035726,395820,32073741, 998,96137,87433,4121485571,0770,7358817,368220,02062652,088,08132,7033,0877525703,2112,138714,2039422,82478262,349,11111,52582,2416085548,70151,488211,4985887,99584272,6516, 8679,233251,4094444454,174178,5730,000622,83382582,7717,9770,039911,1389164307,244311,46313,4777091,73059692,8318,9965,074791,0144524174,4373,4915,7914362,382273103,0623,7546, 515110,604043581,975620,344117,375498,423061113,3329,4327,474820,2572522934,346983,819852,2462113,94466123,4137,4519,715110,18252129,786725,90914,090409102,2541133,5542,4411,821040, 0824841694,113797,89844,861044143,3219143,8556,94-0,341240,000164710,7343741,750,023142342,3946154,0175,08-1,472190,0298672,58358265,3212126,0007996,9257164,2386,441, 1157090,1542928,067872219,6288148,75781214,778174,8390,857,1981970,98565252,56831397,703245,648 1,172456239,0241103,718163,9776121,868195,14120,4548,00871,6972881357,952471,908425,17881258,6007205,23139,6578,0671,9398923141,64743,1629470,45155769,9408215,55187,54178,02912, 93368410803,61725,38421200,5291951,06226,32200,45290,11626,16429613654,0227,28786126,28273577,409236,66212,97365,18687,968216736,76,038755767,788515795,87247,13275,74632,679910,8425336917, 931944,47565,1469344766,92257,25321,43811,667611,647256563,37121,842677,966445516,82695,932089,93830,94585,207919964427404,823786,286115678,1С у м м ыОстаточные суммыXY лінейн.квадр.експон.

Пояснимо як вона складається.

Осередки А1:А26 і В1:В26 вже заповнені.

Крок 1.В комірку J1 вводимо формулу = (А1-$ B $ 54) * (B1 - $ B $ 55).

Крок 2. У осередку J2: J25 ця формула копіюється.

Крок 3.В комірку K1 вводимо формулу = (А1-$ B $ 54) ^2.

Крок 4. У комірки k2: K25 ця формула копіюється.

Крок 5.У комірку L1 вводимо формулу = (B1-$B$55)^2.

Крок 6. У комірки L2: L25 ця формула копіюється.

Крок 7.В комірку M1 вводимо формулу = ($E$32+$E$33*A1-B1)^2.

Крок 8. У комірки M2: M25 ця формула копіюється.

Крок 9.В комірку N1 вводимо формулу = ($F$41+$F$42*A1+$F$43*A1^2-B1)^2.

Крок 10. У комірки N2: N25 ця формула копіюється.

Крок 11.У комірку O1 вводимо формулу = ($E$51*EXP($E$50*A1)-B1)^2.

Крок 12. У осередку O2: O25 ця формула копіюється.

Наступні кроки робимо за допомогою авто підсумовування S .

Крок 13.У комірку J26 вводимо формулу = CУММ(J1:J25).

Крок 14.У комірку K26 вводимо формулу = CУММ(K1:K25).

Крок 15. У комірку L26 вводимо формулу = CУММ (L1: L25).

Крок 16.У комірку M26 вводимо формулу = CУММ(M1:M25).

Крок 17.У комірку N26 вводимо формулу = CУММ(N1:N25).

Крок 18. У комірку O26 вводимо формулу = CУММ (O1: O25).

Тепер проведемо розрахунки коефіцієнта кореляції за формулою (8) (тільки для лінійної апроксимації) та коефіцієнта детермінованості за формулою (10). Результати розрахунків засобами Microsoft Excel представлені у таблиці 8.

Таблиця 8

AB57Коефіцієнт кореляції0,92883358Коефіцієнт детермінованості (лінійна апроксимація)0,8627325960Коефіцієнт детермінованості (квадратична апроксимація)0,9810356162Коефіцієнт3 детермінований0 У осередку E57 записана формула = J26/(K26*L26)^(1/2).

У осередку E59 записана формула = 1-M26/L26.

У комірці E61 записана формула = 1-N26/L26.

У комірці E63 записана формула = 1-O26/L26.

Аналіз результатів розрахунків показує, що квадратична апроксимація найкраще описує експериментальні дані.

Схема алгоритму

Рис. 1. Схема алгоритму програми розрахунку.

5. Розрахунок у програмі MathCad

Лінійна регресія

· line (x, y) - вектор із двох елементів (b, a) коефіцієнтів лінійної регресії b+ax;

· x - вектор дійсних даних аргументу;

· y - вектор дійсних даних значень того самого розміру.

Малюнок 2.

Поліноміальна регресія означає наближення даних (х1, у1) поліномом k-го ступеняПри k=i поліном є пряма лінія, при k=2 - параболою, при k=3 - кубічної параболою тощо. Як правило, на практиці застосовуються<5.

· regress (x, y, k) – вектор коефіцієнтів для побудови поліноміальної регресії даних;

· interp (s, x, y, t) – результат поліноміальної регресії;

· s = regress (x, y, k);

· x - вектор дійсних даних аргументу, елементи якого в порядку зростання;

· y - вектор дійсних даних значень того самого розміру;

· k - ступінь полінома регресії (ціле позитивне число);

· t – значення аргументу полінома регресії.

Малюнок 3

Крім розглянутих, Mathcad вбудовано ще кілька видів трипараметричної регресії, їх реалізація дещо відрізняється від наведених вище варіантів регресії тим, що для них, крім масиву даних, потрібно задати деякі початкові значення коефіцієнтів a, b, c. Використовуйте відповідний вид регресії, якщо добре уявляєте, якою залежністю описується ваш масив даних. Коли тип регресії погано відбиває послідовність даних, її результат часто буває незадовільним і навіть різним залежно від вибору початкових значень. Кожна функція видає вектор уточнених параметрів a, b, c.

Результати, отримані за допомогою функції ЛІНІЙН

Розглянемо призначення функції ЛІНІЙН.

Ця функція використовує метод найменших квадратів, щоб обчислити пряму лінію, яка найкраще апроксимує наявні дані.

Функція повертає масив, який визначає отриману пряму. Рівняння для прямої лінії має такий вигляд:

M1x1 + m2x2 + ... + b або y = mx + b,

алгоритм табличний microsoft програмний

Для отримання результатів необхідно створити табличну формулу, яка займатиме 5 рядків та 2 стовпці. Цей інтервал може розташовуватись у довільному місці на робочому аркуші. У цей інтервал потрібно ввести функцію ЛІНІЙН.

В результаті повинні заповнитися всі осередки інтервалу А65: В69 (як показано в таблиці 9).

Таблиця 9.

АВ6544,95997-88,9208663,73946615,92346670,86273234,5183168144,55492369172239,227404,82

Пояснимо призначення деяких величин, які у таблиці 9.

Величини, розташовані в осередках А65 і В65 характеризують відповідно нахил і зсув. - коефіцієнт детермінованості. - F-спостережуване значення. - Число ступенів свободи.

Подання результатів у вигляді графіків

Рис. 4. Графік лінійної апроксимації

Рис. 5. Графік квадратичної апроксимації

Рис. 6. Графік експоненційної апроксимації

Висновки

Зробимо висновки щодо результатів отриманих даних.

Аналіз результатів розрахунків показує, що квадратична апроксимація найкраще визначає експериментальні дані, т.к. лінія тренду неї найточніше відбиває поведінка функції цьому ділянці.

Порівнюючи результати, отримані за допомогою функції Лінейн, бачимо, що вони повністю збігаються з обчисленнями, проведеними вище. Це свідчить про те, що обчислення правильні.

Результати, отримані за допомогою програми MathCad, повністю збігаються зі значеннями, наведеними вище. Це свідчить про вірність обчислень.

Список використаної літератури

  1. Б.П. Демидович, І.А. Марон. Основи обчислювальної математики. М: Державне видавництво фізико-математичної литературы.
  2. Інформатика: Підручник за ред. проф. Н.В. Макарової. М: Фінанси та статистика, 2007.
  3. Інформатика: Практикум з технології роботи на комп'ютері за ред. проф. Н.В. Макарової. М: Фінанси та статистика, 2010.
  4. В.Б. Ком'ягін. Програмування в Excel мовою Visual Basic. М: Радіо та зв'язок, 2007.
  5. Н. Ніколь, Р. Альбрехт. Excel. Електронні таблиці. М: Вид. "ЕКОМ", 2008.
  6. Методичні вказівки до виконання курсової роботи з інформатики (для студентів заочного відділення усіх спеціальностей), за ред. Журова Г. Н., СПбДГІ(ТУ), 2011.

КУРСОВА РОБОТА

Апроксимація функції методом найменших квадратів


Вступ

емпіричний mathcad апроксимація

Метою курсової роботи є поглиблення знань з інформатики, розвиток та закріплення навичок роботи з табличним процесором Microsoft Excel та MathCAD. Застосування для вирішення завдань з допомогою ЕОМ з предметної області, що з дослідженнями.

У кожному завданні формулюються умови завдання, вихідні дані, форма видачі результатів, вказуються основні математичні залежності для розв'язання задачі. Контрольний розрахунок дозволяє переконатися у правильності роботи програми.

Поняття апроксимація є наближеним виразом будь-яких математичних об'єктів (наприклад, чисел або функцій) через інші більш прості, більш зручні у використанні або просто більш відомі. У наукових дослідженнях апроксимація застосовується для опису, аналізу, узагальнення та подальшого використання емпіричних результатів.

Як відомо, між величинами може існувати точний (функціональний) зв'язок, коли одному значенню аргументу відповідає одне певне значення, і менш точний (кореляційний) зв'язок, коли одному конкретному значенню аргументу відповідає наближене значення або деяка множина значень функції, тією чи іншою мірою близьких друг до друга. При веденні наукових досліджень, обробці результатів спостереження чи експерименту зазвичай доводиться стикатися з другим варіантом. При вивченні кількісних залежностей різних показників, значення яких визначаються емпірично, як правило, є деяка їхня варіабельність. Частково вона задається неоднорідністю самих об'єктів, що вивчаються, неживої і, особливо, живої природи, частково обумовлюється похибкою спостереження та кількісної обробки матеріалів. Остання складова не завжди вдається виключити повністю, можна лише мінімізувати її ретельним вибором адекватного методу дослідження та акуратністю роботи.

Фахівці в галузі автоматизації технологічних процесів та виробництв мають справу з великим обсягом експериментальних даних, для обробки яких використовується комп'ютер. Вихідні дані та отримані результати обчислень можуть бути представлені в табличній формі, використовуючи табличні процесори (електронні таблиці) і, зокрема, Excel. Курсова робота з інформатики дозволяє студенту закріпити і розвинути навички роботи за допомогою базових комп'ютерних технологій при вирішенні завдань у сфері професійної діяльності. для колективної роботи


1. Загальні відомості


Дуже часто, особливо при аналізі емпіричних даних, виникає необхідність знайти в явному вигляді функціональну залежність між величинами xі у, що отримані в результаті вимірювань.

При аналітичному дослідженні взаємозв'язку між двома величинами x та y виробляють ряд спостережень і в результаті виходить таблиця значень:


XX1 x1 xiXnуy1 y1 yiYn

Ця таблиця зазвичай виходить як результат будь-яких експериментів, у яких x,(незалежна величина) задається експериментатором, а у,виходить у результаті досвіду. Тому ці значення у,називатимемо емпіричними чи досвідченими значеннями.

Між величинами x та y існує функціональна залежність, але її аналітичний вигляд зазвичай невідомий, тому виникає практично важливе завдання – знайти емпіричну формулу


y =f (x; a 1, a 2,…, am ), (1)


(де a1 , a2 ,…, am- Параметри), значення якої при x = x,можливо мало відрізнялися б від досвідчених значень у, (i = 1,2,…, д).

Зазвичай вказують клас функцій (наприклад, безліч лінійних, статечних, показових і т.п.), з якого вибирається функція f(x), і далі визначаються найкращі значення параметрів.

Якщо емпіричну формулу (1) підставити вихідні x,то отримаємо теоретичні значення

YTi= f (xi; a 1, a 2……am) , де i = 1,2,…, n.


Різниці yiT- уi, називаються відхиленнями і є відстані по вертикалі від точок Miдо графіка емпіричної функції

Згідно з методом найменших квадратів найкращими коефіцієнтами a1 , a2 ,…, amвважаються ті, для яких сума квадратів відхилень знайденої емпіричної функції від заданих значень функції



буде мінімальною.

Пояснимо геометричне значення методу найменших квадратів.

Кожна пара чисел ( xi, yi) з вихідної таблиці визначає точку Miна площині XOY.Використовуючи формулу (1) при різних значеннях коефіцієнтів a1 , a2 ,…, amможна побудувати низку кривих, які є графіками функції (1). Завдання полягає у визначенні коефіцієнтів a1 , a2 ,…, amтаким чином, щоб сума квадратів відстаней по вертикалі від точок Mi (xi, yi) до графіка функції (1) була найменшою (рис. 1).



Побудова емпіричної формули складається з двох етапів: з'ясування загального виду цієї формули та визначення її найкращих параметрів.

Якщо невідомий характер залежності між цими величинами x та y, то вид емпіричної залежності є довільним. Перевага надається простим формулам, що мають хорошу точність. Вдалий вибір емпіричної формули значною мірою залежить від знань дослідника в предметній галузі, використовуючи які може вказати клас функцій з теоретичних міркувань. Велике значення має зображення отриманих даних у декартових або спеціальних системах координат (напівлогарифмічній, логарифмічній і т.д.). За положенням точок можна приблизно вгадати загальний вигляд залежності шляхом встановлення подібності між побудованим графіком та зразками відомих кривих.

Визначення найкращих коефіцієнтів a1 , a2,…, amщо входять до емпіричної формули виробляють добре відомим аналітичними методами.

Для того, щоб знайти набір коефіцієнтів a1 , a2 …..am, які доставляють мінімум функції S, яка визначається формулою (2), використовуємо необхідну умову екстремуму функції кількох змінних - рівність нулю приватних похідних.

В результаті отримаємо нормальну систему для визначення коефіцієнтів ai(i = 1,2,…, m):



Таким чином, знаходження коефіцієнтів aiзводиться до вирішення системи (3). Ця система спрощується, якщо емпірична формула (1) лінійна щодо параметрів aiтоді система (3) - буде лінійною.


1.1 Лінійна залежність


Конкретний вид системи (3) залежить від цього, з якого класу емпіричних формул шукаємо залежність (1). У разі лінійної залежності y = a1 + a2 xсистема (3) набуде вигляду:


Ця лінійна система може бути вирішена будь-яким відомим методом (методом Гауса, простих ітерацій, формулами Крамера).


1.2 Квадратична залежність


У разі квадратичної залежності y = a1 + a2 x + a3x 2система (3) набуде вигляду:



1.3 Експонентна залежність


У ряді випадків як емпірична формула беруть функцію в яку невизначені коефіцієнти входять нелінійно. У цьому іноді завдання вдається лінеаризувати тобто. звести до лінійної. До таких залежностей належить експоненційна залежність


y = a1 * ea2x (6)


де a 1і a 2, невизначені кофіцієнти.

Лінеаризація досягається шляхом логарифмування рівності (6), після чого отримуємо співвідношення

ln y = ln a 1+a 2x (7)


Позначимо ln ута ln axвідповідно через tі cтоді залежність (6) може бути записана у вигляді t = a1 + a2 хщо дозволяє застосувати формули (4) із заміною a1 на cі уiна ti


1.4 Елементи теорії кореляції


Графік відновленої функціональної залежності у(х)за результатами вимірювань (х i, уi),i = 1,2, K, nназивається кривою регресії. Для перевірки згоди збудованої кривої регресії з результатами експерименту зазвичай вводять такі числові характеристики: коефіцієнт кореляції (лінійна залежність), кореляційне відношення та коефіцієнт детермінованості. При цьому результати зазвичай групують і репрезентують у формі кореляційної таблиці. У кожній клітині цієї таблиці наводяться чисельності niJ - тих пар (х, у), компоненти яких потрапляють у відповідні інтервали угруповання з кожної змінної. Припускаючи довжини інтервалів угруповання (по кожному змінному) рівними між собою, вибирають центри х i(відповідно уi) цих інтервалів та числа niJ- як основа для розрахунків.

p align="justify"> Коефіцієнт кореляції є мірою лінійного зв'язку між залежними випадковими величинами: він показує, наскільки добре в середньому може бути представлена ​​одна з величин у вигляді лінійної функції від іншої.

Коефіцієнт кореляції обчислюється за такою формулою:


де, і - середнє арифметичне значення відповідно хі у.

Коефіцієнт кореляції між випадковими величинами за абсолютною величиною вбирається у 1. Чим ближче |р| до 1, тим вже лінійний зв'язок між х і у.

У разі нелінійного кореляційного зв'язку умовні середні значення розташовуються біля кривої лінії. В цьому випадку як характеристику сили зв'язку рекомендується використовувати кореляційне відношення, інтерпретація якого не залежить від виду досліджуваної залежності.

Кореляційне відношення обчислюється за такою формулою:



де ni = , nf= , а чисельник характеризує розсіювання умовних середніх у,біля середнього середнього y.

Завжди. Рівність = 0 відповідає некорельованим випадковим величинам; = 1 тоді і тільки тоді, коли є точний функціональний зв'язок між yта x. У разі лінійної залежності yвід x кореляційне відношення збігається із квадратом коефіцієнта кореляції. Величина - ? 2 використовується як індикатор відхилення регресії від лінійної.

Кореляційне відношення є мірою кореляційного зв'язку yз xв будь-якій формі, але не може дати уявлення про ступінь наближеності емпіричних даних до спеціальної форми. Щоб з'ясувати, наскільки точно побудована крива відображає емпіричні дані, вводиться ще одна характеристика - коефіцієнт детермінованості.

Для його опису розглянемо такі величини. - Повна сума квадратів, де середнє значення.

Можна довести таку рівність

Перше доданок дорівнює Sост = і називається залишковою сумою квадратів. Воно характеризує відхилення експериментальних від теоритичних.

Другий доданок дорівнює Sрегр = 2 і називається регресійною сумою квадратів і воно характеризує розкид даних.

Очевидно, що справедлива наступна рівність S повний = S зуст + S регр.

Коефіцієнт детермінованості визначається за такою формулою:



Чим менша залишкова сума квадратів у порівнянні із загальною сумою квадратів, тим більше значення коефіцієнта детермінованості r2 , Який показує, наскільки добре рівняння, отримане за допомогою регресійного аналізу, пояснює взаємозв'язки між змінними. Якщо він дорівнює 1, має місце повна кореляція з моделлю, тобто. немає різниці між фактичним та оцінним значеннями y. У протилежному випадку, якщо коефіцієнт детермінованості дорівнює 0, то рівняння регресії невдало для передбачення значень y

Коефіцієнт детермінованості завжди перевищує кореляційне ставлення. У разі коли виконується рівність r 2 = можна вважати, що побудована емпірична формула найбільш точно відображає емпіричні дані.


2. Постановка задачі


1. Використовуючи метод найменших квадратів функцію, задану таблично, апроксимувати

а) багаточлен першого ступеня;

б) багаточлен другого ступеня;

в) експоненційною залежністю.

Для кожної залежності обчислити коефіцієнт детермінованості.

Обчислити коефіцієнт кореляції (тільки у разі).

Для кожної залежності побудувати лінію тренду.

Використовуючи функцію Лінейн обчислити числові характеристики в залежності від.

Порівняти свої обчислення з результатами, отриманими за допомогою функції Лінейн.

Зробити висновок, яка з отриманих формул якнайкраще апроксимує функцію.

Написати програму однією з мов програмування та порівняти результати рахунку з отриманими вище.


3. Вихідні дані


Функція задана малюнком 1.



4. Розрахунок апроксимацій у табличному процесорі Excel


Для розрахунків доцільно скористатися табличним процесором Microsoft Excel. І дані розмістити як показано малюнку 2.



Для цього заносимо:

· у комірки A6:A30 заносимо значення xi .

· у комірки B6:B30 заносимо значення уi .

· в комірку C6 вводимо формулу = А6 2.

· у комірки C7:C30 ця формула копіюється.

· у комірку D6 вводимо формулу = А6 * В6.

· у комірки D7:D30 ця формула копіюється.

· у комірку F6 вводимо формулу =А6^4.

· у комірки F7:F30 ця формула копіюється.

· у комірку G6 вводимо формулу =А6^2*В6.

· у комірки G7:G30 ця формула копіюється.

· у комірку H6 вводимо формулу =LN(B6).

· у комірки H7:H30 ця формула копіюється.

· у комірку I6 вводимо формулу =A6*LN(B6).

· у комірки I7:I30 ця формула копіюється. Наступні кроки робимо за допомогою автопідсумовування

· в комірку А33 вводимо формулу = СУМ (А6: А30).

· в комірку B33 вводимо формулу = СУМ (В6: В30).

· в комірку C33 вводимо формулу = СУМ (С6: С30).

· в комірку D33 вводимо формулу = СУМ (D6: D30).

· у комірку E33 вводимо формулу = СУМ (E6: E30).

· у комірку F33 вводимо формулу = СУМ (F6: F30).

· в комірку G33 вводимо формулу = СУМ (G6: G30).

· в комірку H33 вводимо формулу = СУМ (H6: H30).

· в комірку I33 вводимо формулу = СУМ (I6: I30).

Апроксимуємо функцію y = f(x) лінійною функцією y = a1 + a2x. Для визначення коефіцієнтів a 1та a 2скористаємося системою (4). Використовуючи підсумкові суми таблиці 2, розташовані в осередках A33, B33, C33 та D33, запишемо систему (4) у вигляді



вирішивши яку, отримаємо a 1= -24,7164 та a2 = 11,63183

Таким чином, лінійна апроксимація має вигляд y=-24,7164 + 11,63183х (12)

Рішення системи (11) проводили, використовуючи засоби Microsoft Excel. Результати представлені малюнку 3:



У таблиці в осередках A38:B39 записана формула (=МОБР (A35:B36)). У осередках E38:E39 записана формула (=МУМНОЖ (A38:B39, C35:C36)).


Далі апроксимуємо функцію y = f(x) квадратичною функцією y = a1 + a2 x + a3 x2. Для визначення коефіцієнтів a 1, a 2та a 3скористаємося системою (5). Використовуючи підсумкові суми таблиці 2, розташовані в осередках A33, B33, C33, D33, E33, F33 і G33 запишемо систему (5) у вигляді:



Вирішивши яку, отримаємо a 1= 1,580946, a 2= -0,60819 та a3 = 0,954171 (14)

Таким чином, квадратична апроксимація має вигляд:

у = 1,580946-0,60819х +0,954171х2

Рішення системи (13) проводили, використовуючи засоби Microsoft Excel. Результати представлені малюнку 4.



У таблиці в осередках A46:C48 записана формула (=МОБР (A41:C43)). У осередках F46:F48 записана формула (=МУМНОЖ (A41:C43, D46:D48)).

Тепер апроксимуємо функцію y = f(х) експоненційною функцією y = a1 ea2x. Для визначення коефіцієнтів a1 і a2 прологарифмуємо значення yiі використовуючи підсумкові суми таблиці 2, розташовані в осередках A26, C26, H26 та I26 отримаємо систему:



де з = ln (a1 ).

Вирішивши систему (10) знайдемо з =0,506435, a2 = 0.409819.

Після потенціювання отримаємо a1 = 1,659365.

Таким чином, експоненційна апроксимація має вигляд y = 1,659365 * e0,4098194x

Рішення системи (15) проводили, використовуючи засоби Microsoft Excel. Результати представлені малюнку 5.


У таблиці в осередках A55:B56 записана формула (=МОБР (A51:B52)). У осередках E54:E56 записана формула (=МУМНОЖ (A51:B52, С51:С52)). У комірці E56 записана формула = EXP (E54).

Обчислимо середнє арифметичне x і у за формулами:



Результати розрахунку x та yзасобами Microsoft Excel представлені малюнку 6.



У осередку B58 записана формула =A33/25. У комірці B59 записана формула = B33/25.

Таблиця 2


Пояснимо як таблиця малюнку 7 складається.

Осередки A6:A33 і B6:B33 вже заповнені (див. рис. 2).

· у комірку J6 вводимо формулу =(A6-$B$58)*(B6-$B$59).

· у комірки J7:J30 ця формула копіюється.

· у комірку K6 вводимо формулу =(А6-$В$58)^ 2.

· у комірки K7:K30 ця формула копіюється.

· у комірку L6 вводимо формулу =(В1-$В$59)^2.

· у комірки L7:L30 ця формула копіюється.

· у комірку M6 вводимо формулу =($Е$38+$Е$39*А6-В6)^2.

· у комірки M7:M30 ця формула копіюється.

· у комірку N6 вводимо формулу =($F$46 +$F$47*A6 +$F$48*A6 Л6-В6)^2.

· у комірки N7:N30 ця формула копіюється.

· у комірку O6 вводимо формулу =($Е$56*ЕХР ($Е$55*А6) - В6)^2.

· у комірки O7:O30 ця формула копіюється.

Наступні кроки робимо за допомогою автопідсумовування.

· у комірку J33 вводимо формулу = CYMM (J6: J30).

· в комірку K33 вводимо формулу = СУМ (К6: К30).

· у комірку L33 вводимо формулу = CYMM (L6: L30).

· в комірку M33 вводимо формулу = СУМ (М6: М30).

· в комірку N33 вводимо формулу = СУМ (N6: N30).

· у комірку O33 вводимо формулу = СУМ (06:030).

Тепер проведемо розрахунки коефіцієнта кореляції за формулою (8) (тільки для лінійної апроксимації) та коефіцієнта детермінованості за формулою (10). Результати розрахунків засобами Microsoft Ехcеl представлені малюнку 7.



В табл. Формула =1 - O33/L33.

Аналіз результатів розрахунків показує, що квадратична апроксимація найкраще описує експериментальні дані.


4.1 Побудова графіків у Excel


Виділимо комірки A1: A25, після цього звернемося до майстра діаграм. Виберемо точковий графік. Після того як діаграма буде побудована, клацніть правою кнопкою мишки на лінії графіка і виберемо додати лінію тренда (відповідно лінійну, експоненційну, статечну та поліноміальну другого ступеня).

Графік лінійної апроксимації


Графік квадратичної апроксимації


Графік експоненційної апроксимації.


5. Апроксимація функції за допомогою MathCAD


Апроксимація даних з урахуванням їх статистичних параметрів відноситься до задач регресії. Вони зазвичай виникають при обробці експериментальних даних, отриманих в результаті вимірювань процесів або фізичних явищ, статистичних за своєю природою (як, наприклад, вимірювання радіометрії і ядерної геофізики), або на високому рівні перешкод (шумів). Завданням регресійного аналізу є добір математичних формул, які найкраще описують експериментальні дані.


.1 Лінійна регресія


Лінійна регресія у системі Mathcad виконується за векторами аргументу Хта відліків Yфункціями:

intercept (x, y)- обчислює параметр а1 , усунення лінії регресії по вертикалі (див. рис.)

slope (x, y)- обчислює параметр a2 , кутовий коефіцієнт лінії регресії (див. рис.)

y(x) = a1+a2*x


Функція corr (у, y(x))обчислює коефіцієнт кореляції ПірсонаЧим він ближчий до 1, тим точніше дані, що обробляються, відповідають лінійній залежності (див. рис.).

.2 Поліномінальна регресія


Одновимірна поліноміальна регресія з довільним ступенем n полінома і з довільними координатами відліків Mathcad виконується функціями:

regress (х, у, n)- обчислює вектор S,у складі якого є коефіцієнти aiполінома n-й ступеня;

значення коефіцієнтів aiможуть бути витягнуті з вектора Sфункцією submatrix (S, 3, length(S) - 1, 0, 0).

Отримані значення коефіцієнтів використовуємо у рівнянні регресії


y(x) = a1+a2*x+a3*x2 (Див. рис.)

.3 Нелінійна регресія


Для простих типових формул апроксимації передбачено низку функцій нелінійної регресії, у яких параметри функцій підбираються програмою Mathcad.

До них належить функція expfit (x, y, s),яка повертає вектор, що містить коефіцієнти a1, a2і a3експоненційної функції

y(x) = a1 ^exp (a2x) + a3.У вектор Sвводяться початкові значення коефіцієнтів a1, a2і a3першого наближення.


Висновок


Аналіз результатів розрахунків показує, що лінійна апроксимація найкраще описує експериментальні дані.

Результати, отримані за допомогою програми MathCAD, повністю збігаються зі значеннями, отриманими за допомогою Excel. Це свідчить про вірність обчислень.


Список використаної літератури

  1. Інформатика: Підручник/За ред. проф. Н.В. Макарової. М.: Фінанси та статистика 2007
  2. Інформатика: Практикум з технології роботи на комп'ютері/Під. ред. проф. Н.В. Макарової. М Фінанси та статистика, 2011.
  3. Н.С. Піскунов. Диференційне та інтегральне числення, 2010.
  4. Інформатика, апроксимація методом найменших квадратів, методичні вказівки, Санкт-Петербург, 2009.
Репетиторство

Потрібна допомога з вивчення якоїсь теми?

Наші фахівці проконсультують або нададуть репетиторські послуги з цікавої для вас тематики.
Надішліть заявкуіз зазначенням теми прямо зараз, щоб дізнатися про можливість отримання консультації.

АППРОКСИМАЦІЯ ФУНКЦІЇ МЕТОДОМ НАЙМЕНШИХ

КВАДРАТІВ


1. Мета роботи

2. Методичні вказівки

2.2 Постановка задачі

2.3 Методика вибору апроксимуючої функції

2.4 Загальна методика вирішення

2.5 Методика розв'язання нормальних рівнянь

2.7 Методика обчислення зворотної матриці

3. Ручний рахунок

3.1 Вихідні дані

3.2 Система нормальних рівнянь

3.3 Рішення систем шляхом зворотної матриці

4. Схема алгоритмів

5. Текст програми

6. Результати машинного розрахунку

1. Мета роботи

Справжня курсова робота є завершальним розділом дисципліни «Обчислювальна математика та програмування» та вимагає від студента у процесі її виконання вирішення наступних завдань:

а) практичного освоєння типових обчислювальних методів прикладної інформатики; б) вдосконалення навичок розробки алгоритмів та побудови програм мовою високого рівня.

Практичне виконання курсової роботи передбачає вирішення типових інженерних завдань обробки даних з використанням методів матричної алгебри, розв'язання систем лінійних рівнянь алгебри чисельного інтегрування. Навички, які набувають у процесі виконання курсової роботи, є основою для використання обчислювальних методів прикладної математики та техніки програмування у процесі вивчення всіх подальших дисциплін при виконанні курсових та дипломних проектів.

2. Методичні вказівки

2.2 Постановка задачі

При вивченні залежностей між величинами важливим завданням є наближене уявлення (апроксимація) цих залежностей за допомогою відомих функцій або їх комбінацій, підібраних належним чином. Підхід до такого завдання і конкретний метод її вирішення визначаються вибором критерію якості наближення, що використовується, і формою подання вихідних даних.

2.3 Методика вибору апроксимуючої функції

Апроксимуючу функцію вибирають із деякого сімейства функцій, котрій заданий вид функції, але залишаються невизначеними (і підлягають визначенню) її параметри тобто.

Визначення апроксимуючої функції ? поділяється на два основні етапи:

Підбір відповідного виду функції;

Знаходження її параметрів відповідно до критерію МНК.

Підбір виду функції є складне завдання, яке вирішується методом проб і послідовних наближень. Вихідні дані, представлені в графічній формі (родини точок або криві), зіставляється з сімейством графіків ряду типових функцій, які зазвичай використовуються для цілей апроксимації. Деякі типи функцій , що використовуються в роботі, наведені в таблиці 1.

Докладніші відомості про поведінку функцій, які можуть бути використані в задачах апроксимації, можна знайти у довідковій літературі. У більшості завдань курсової роботи вид апроксимуючої функції заданий.

2.4 Загальна методика вирішення

Після того як обраний вид апроксимуючої функції (або ця функція задана) і, отже, визначена функціональна залежність (1), необхідно знайти відповідно до вимог МНК значення параметрів 1, 2, …, m. Як уже зазначалося, параметри повинні бути визначені таким чином, щоб значення критерію в кожній із розглянутих завдань було найменшим порівняно з його значенням за інших можливих значень параметрів.

Для розв'язання задачі підставимо вираз (1) у відповідний вираз і проведемо необхідні операції підсумовування або інтегрування (залежно від виду I). В результаті величина I, що називається надалі критерієм апроксимації, є функцією шуканих параметрів

Наступне зводитися до пошуку мінімуму цієї функції змінних З k; визначення значень K =C k * , к=1,m, відповідних цьому елементу I, і є метою розв'язуваної задачі.


Типи функцій Таблиця 1

Вид функції Назва функції
Y=C 1 +C 2 ·x Лінійна
Y=C 1 +C 2 ·x+C 3 ·x 2 Квадратична (параболічна)
Y= Раціональна (поліном n-го ступеня)
Y=C 1 +C 2 · Назад пропорційна
Y=C 1 +C 2 · Ступінна дробово-раціональна
Y= Дробно-раціональна(першого ступеня)
Y = C 1 + C 2 · X C3 Ступінь
Y=C 1 +C 2 ·a C3 · x Показова
Y=C 1 +C 2 ·log a x Логарифмічна
Y=C 1 +C 2 ·X n (0 Ірраціональна, алгебраїчна
Y=C 1 ·sinx+C 2 cosx Тригонометричні функції (і зворотні до них)

Можливі наступні два підходи до вирішення цієї задачі: використання відомих умов мінімуму функції кількох змінних або безпосереднє відшукання точки мінімуму функції будь-яким із чисельних методів.

Для реалізації першого із зазначених підходів скористаємося необхідною умовою мінімуму функції (1) кількох змінних, відповідно до яких у точці мінімуму повинні дорівнювати нулю приватні похідні цієї функції за всіма її аргументами

Отримані m рівностей слід розглядати як систему рівнянь щодо шуканих 1, 2, …, m. При довільному вигляді функціональної залежності (1) рівняння (3) виявляється нелінійним щодо величин C k та їх вирішення потребує застосування наближених чисельних методів.

Використання рівності (3) дають лише необхідні, але недостатні умови мінімуму (2). Тому потрібно уточнити, чи забезпечують знайдені значення C k * саме мінімум функції . У загальному випадку таке уточнення виходить за рамки даної курсової роботи, і пропоновані для курсової роботи завдання підібрані так, що знайдене рішення системи (3) відповідає саме мінімуму I. Однак, оскільки величина I невід'ємна (як сума квадратів) та нижня її межа є 0 (I=0), то, якщо існує рішення системи (3) єдино, воно відповідає саме мінімум I.

При поданні апроксимуючої функції загальним виразом (1) відповідні нормальним рівнянням (3) виявляються нелінійними щодо шуканих С к. їх вирішення може бути пов'язане зі значними труднощами. У таких випадках доцільним є безпосередній пошук мінімуму функції в області можливих значень її аргументів, не пов'язаний з використанням співвідношень (3). Загальна ідея подібного пошуку зводиться до зміни значень аргументів С до обчислення на кожному кроці відповідного значення функції I до мінімального або досить близько до нього.

2.5 Методика розв'язання нормальних рівнянь

Один із можливих способів мінімізації критерію апроксимації (2) передбачає вирішення системи нормальних рівнянь (3). При виборі як апроксимуюча функція лінійної функції шуканих параметрів нормальні рівняння являють собою систему лінійних рівнянь алгебри.

Систему n лінійних рівнянь загального виду:

(4) можна записати за допомогою матричних позначень у наступному вигляді: А Х = В,

; ; (5)

квадратна матриця А називається матрицею системиа вектора Х і В відповідно вектором-стовпцем невідомих системі вектором-стовпцем її вільних членів .

У матричному вигляді вихідну систему n лінійних рівнянь можна записати і так:

Рішення системи лінійних рівнянь зводиться до пошуку значень елементів вектора-стовпця (х i), званих корінням системи. Щоб ця система мала єдине рішення, рівняння, що входить до неї n, повинно бути лінійно незалежним. Необхідною і достатньою умовою є нерівність нулю визначника системи, тобто. Δ=detA≠0.

Алгоритм розв'язання системи лінійних рівнянь поділяється на прямі та ітераційні. Насправді ніякий спосіб може бути нескінченним. Для отримання точного рішення ітераційні методи вимагають нескінченної кількості арифметичних операцій. практично це число доводиться брати кінцевим і тому рішення в принципі має деяку помилку, навіть якщо знехтувати помилки округлень, що супроводжують більшість обчислень. Що ж до прямих методів, то вони навіть за кінцевої кількості операцій можуть у принципі дати точне рішення, якщо воно існує.

Прямі та кінцеві методи дозволяють знайти розв'язання системи рівнянь за кінцеве число кроків. Це рішення буде точним, якщо всі проміжки обчислення проводяться з обмеженою точністю.

2.7 Методика обчислення зворотної матриці

Один з методів розв'язання системи лінійних рівнянь (4), записуємо в матричній формі А Х = В, пов'язаний з використанням зворотної матриці А -1 . У цьому випадку розв'язання системи рівнянь виходить у вигляді

де А -1 -матриця, що визначається наступним чином.

Нехай А – квадратна матриця розміром n х n з ненульовим визначником detA≠0. Тоді існує зворотна матриця R=A -1 , обумовлена ​​умовою A R = E,

де Е - одинична матриця, всі елементи головної діагоналі якої рівні I, а елементи поза цією діагоналі -0, Е =, де Е i - вектор-стовпець. Матриця К -квадратна матриця розміром n х n.

де Rj - вектор-стовпець.

Розглянемо її перший стовпець R=(r 11 , r 21 ,…, r n 1) T , де Т означає транспонування. Неважко перевірити, що добуток A·R дорівнює першому стовпцю E 1 =(1, 0, …, 0) Т одиничної матриці Е, тобто. вектор R 1 можна розглянути як розв'язання системи лінійних рівнянь A·R 1 =E 1. Аналогічно m-й стовпець матриці R , Rm, 1≤ m ≤ n, являє собою рішення рівняння A·Rm=Em, де Em=(0, …, 1, 0) T m -й стовпець одиничної матриці Е.

Таким чином, зворотна матриця R являє собою набір рішень n систем лінійних рівнянь

A·Rm=Em, 1≤ m≤n.

Для вирішення цих систем можна застосовувати будь-які методи, розроблені для вирішення рівнянь алгебри. Проте метод Гаусса дає можливість вирішувати всі ці n систем одночасно, незалежно один від одного. Справді, всі ці системи рівнянь відрізняються лише правою частиною, проте перетворення, які проводяться у процесі прямого ходу методу Гаусса, повністю визначаються елементами матриці коефіцієнтів (матриці А). Отже, у схемах алгоритмів зміні підлягають лише блоки, пов'язані з перетворенням вектора В. У нашому випадку одночасно перетворюватимуться n векторів Em, 1≤ m≤n. Результатом рішення також буде не один вектор, а n векторів Rm, 1≤ m≤n.

3. Ручний рахунок

3.1 Вихідні дані

Xi 0,3 0,5 0,7 0,9 1,1
Yi 1,2 0,7 0,3 -0,3 -1,4

3.2 Система нормальних рівнянь

3.3 Рішення систем шляхом зворотної матриці

апроксимація квадрат функція лінійний рівняння

5 3,5 2,6 0,5 5 3,5 2,6 0,5

3,5 2,85 2,43 -0,89 0 0,4 0,61 -1,24

2,56 2,43 2,44 -1,86 0 0,638 1,109 -2,116

0 0,4 0,61 -1,24

0 0 0,136 -0,138

Результати розрахунку:

1 =1,71; 2 =-1,552; 3 =-1,015;

Апроксимуюча функція:

4 . Текст програми

mass=arrayof real;

mass1=array of real;

mass2=array of real;

X, Y, E, y1, delta: mass;

big,r,sum,temp,maxD,Q:real;

i, j, k, l, num: byte;

Procedure VVOD(var E: mass);

For i:=1 to 5 do

Function FI (i, k: integer): real;

if i=1 then FI:=1;

if i=2 then FI:=Sin(x[k]);

if i=3 then FI:=Cos(x[k]);

Procedure PEREST(i:integer;var a:mass1;var b:mass2);

for l:= i to 3 do

if abs(a) > big then

big:=a; writeln (big:6:4);

writeln("Перестановка рівнянь");

if num<>i then

for j:=i до 3 do

a:=a;

writeln("Введіть значення Х");

writeln("__________________");

writeln("Введіть значення Y");

writeln("___________________");

For i:=1 to 3 do

For j:=1 to 3 do

For k:=1 to 5 do

begin A:= A+FI(i,k)*FI(j,k); write(a:7:5); end;

writeln("________________________");

writeln("МатрицяКоефіцієнтівAi,j");

For i:=1 to 3 do

For j:=1 to 3 do

write (A:5:2, " ");

For i:=1 to 3 do

For j:=1 to 5 do

B[i]:=B[i]+Y[j]*FI(i,j);

writeln("__________________________");

writeln( ‘Матриця Коефіцієнтів Bi”);

For i:=1 to 3 do

write(B[i]:5:2, " ");

for i:=1 to 2 do

for k:=i+1 to 3 do

Q:=a/a; writeln("g=", Q);

for j:=i+1 to 3 do

a:=a-Q*a; writeln("a=",a);

b[k]:=b[k]-Q*b[i]; writeln("b=",b[k]);

x1[n]:=b[n]/a;

for i:=2 downto 1 do

for j:=i+1 to 3 do

sum:=sum-a*x1[j];

x1[i]:=sum/a;

writeln("__________________________");

writeln ("Значення коефіцієнтів");

writeln("_________________________");

for i:=1 to 3 do

writeln("C",i,"=",x1[i]);

for i:=1 to 5 do

y1[i]:= x1[k]*FI(k,i) + x1*FI(k+1,i) + x1*FI(k+2,i);

delta[i]:=abs (y[i]-y1[i]);

writeln (y1[i]);

for i:=1 to 3 do

write (x1[i]:7:3);

for i:=1 to 5 do

якщо delta[i]>maxD then maxD:=delta;

writeln ("max Delta=", maxD:5:3);

5 . Результати машинного розрахунку

1 =1,511; 2 =-1,237; 3 =-1,11;

Висновок

У процесі виконання курсової роботи я практично освоїв типові обчислювальні методи прикладної математики, вдосконалював навички розробки алгоритмів та побудови програм мовами високого рівня. Отримав навички, що є основою для використання обчислювальних методів прикладної математики та техніки програмування у процесі вивчення всіх подальших дисциплін під час виконання курсових та дипломних проектів.

Апроксимація дослідних даних - це метод, заснований на заміні експериментально отриманих даних аналітичною функцією, що найбільш близько проходить або збігається в вузлових точках з вихідними значеннями (даними отриманими в ході досвіду або експерименту). В даний час існує два способи визначення аналітичної функції:

За допомогою побудови інтерполяційного багаточлена n-ступеня, що проходить безпосередньо через усі точкизаданого масиву даних. У даному випадку апроксимуюча функція подається у вигляді: інтерполяційного багаточлена у формі Лагранжа або інтерполяційного багаточлена у формі Ньютона.

За допомогою побудови апроксимуючого багаточлена n-ступеня, що проходить в найближчій близькості від точокіз заданого масиву даних. Таким чином, апроксимуюча функція згладжує всі випадкові перешкоди (або похибки), які можуть виникати при виконанні експерименту: значення, що вимірюються в ході досвіду, залежать від випадкових факторів, які коливаються за своїми власними випадковими законами (похибки вимірювань або приладів, неточність або помилки досвіду). У разі апроксимуюча функція визначається методом найменших квадратів.

Метод найменших квадратів(В англомовній літературі Ordinary Least Squares, OLS) - математичний метод, заснований на визначенні апроксимуючої функції, яка будується в найближчій близькості від точок із заданого масиву експериментальних даних. Близькість вихідної та апроксимуючої функції F(x) визначається числовою мірою, а саме: сума квадратів відхилень експериментальних даних від апроксимуючої кривої F(x) має бути найменшою.

Апроксимуюча крива, побудована за методом найменших квадратів

Метод найменших квадратів використовується:

Для вирішення перевизначених систем рівнянь коли кількість рівнянь перевищує кількість невідомих;

Для пошуку рішення у разі звичайних (не перевизначених) нелінійних систем рівнянь;

Для апроксимації точкових значень деякою апроксимуючою функцією.

Апроксимуюча функція методом найменших квадратів визначається з умови мінімуму суми квадратів відхилень розрахункової апроксимуючої функції від заданого масиву експериментальних даних. Цей критерій методу найменших квадратів записується у вигляді наступного виразу:

Значення розрахункової апроксимуючої функції у вузлових точках

Заданий масив експериментальних даних у вузлових точках.

Квадратичний критерій має низку "хороших" властивостей, таких, як диференційність, забезпечення єдиного розв'язання задачі апроксимації при поліноміальних апроксимуючих функціях.

Залежно від умов завдання апроксимуюча функція є багаточленом ступеня m

Ступінь апроксимуючої функції не залежить від числа вузлових точок, але її розмірність повинна бути завжди меншою за розмірність (кількість точок) заданого масиву експериментальних даних.

∙ Якщо ступінь апроксимуючої функції m=1, то ми апроксимуємо табличну функцію прямою лінією (лінійна регресія).

∙ Якщо ступінь апроксимуючої функції m=2, то ми апроксимуємо табличну функцію квадратичною параболою (квадратична апроксимація).

∙ Якщо ступінь апроксимуючої функції m=3, то ми апроксимуємо табличну функцію кубічною параболою (кубічна апроксимація).

У випадку, коли потрібно побудувати апроксимуючий многочлен ступеня m для заданих табличних значень, умова мінімуму суми квадратів відхилень за всіма вузловими точками переписується у такому виде:

- невідомі коефіцієнти апроксимуючого багаточлена ступеня m;

Кількість заданих табличних значень.

Необхідною умовою існування мінімуму функції є рівність нуля її приватних похідних за невідомими змінними . В результаті отримаємо наступну систему рівнянь:

Перетворимо отриману лінійну систему рівнянь: розкриємо дужки і перенесемо вільні доданки в праву частину виразу. В результаті отримана система лінійних виразів алгебри буде записуватися в наступному вигляді:

Дана система лінійних виразів алгебри може бути переписана в матричному вигляді:

В результаті було отримано систему лінійних рівнянь розмірністю m+1, що складається з m+1 невідомих. Дана система може бути вирішена за допомогою будь-якого методу розв'язання лінійних рівнянь алгебри (наприклад, методом Гаусса). Через війну рішення знайдено невідомі параметри апроксимуючої функції, які забезпечують мінімальну суму квадратів відхилень апроксимуючої функції від вихідних даних, тобто. найкраще можливе квадратичне наближення. Слід пам'ятати, що при зміні навіть одного значення вихідних даних усі коефіцієнти змінять свої значення, оскільки вони повністю визначаються вихідними даними.

Апроксимація вихідних даних лінійною залежністю

(лінійна регресія)

Як приклад розглянемо методику визначення апроксимуючої функції, яка задана у вигляді лінійної залежності. Відповідно до методу найменших квадратів умова мінімуму суми квадратів відхилень записується у такому вигляді:

Координати вузлових точок таблиці;

Невідомі коефіцієнти апроксимуючої функції, заданої у вигляді лінійної залежності.

Необхідною умовою існування мінімуму функції є рівність нуля її приватних похідних за невідомими змінними. В результаті отримуємо таку систему рівнянь:

Перетворимо отриману лінійну систему рівнянь.

Вирішуємо отриману систему лінійних рівнянь. Коефіцієнти апроксимуючої функції в аналітичному вигляді визначаються в такий спосіб (метод Крамера):

Дані коефіцієнти забезпечують побудову лінійної апроксимуючої функції відповідно до критерію мінімізації суми квадратів апроксимуючої функції від заданих табличних значень (експериментальні дані).

Алгоритм реалізації методу найменших квадратів

1. Початкові дані:

Задано масив експериментальних даних із кількістю вимірювань N

Задано ступінь апроксимуючого багаточлена (m)

2. Алгоритм обчислення:

2.1. Визначаються коефіцієнти для побудови системи рівнянь розмірністю

Коефіцієнти системи рівнянь (ліва частина рівняння)

- Індекс номера стовпця квадратної матриці системи рівнянь

Вільні члени системи лінійних рівнянь (права частина рівняння)

- індекс номера рядка квадратної матриці системи рівнянь

2.2. Формування системи лінійних рівнянь розмірністю.

2.3. Розв'язання системи лінійних рівнянь з метою визначення невідомих коефіцієнтів апроксимуючого багаточлена ступеня m.

2.4.Визначення суми квадратів відхилень апроксимуючого багаточлена від вихідних значень по всіх вузлових точках

Знайдене значення суми квадратів відхилень є мінімально можливим.

Апроксимація за допомогою інших функцій

Слід зазначити, що при апроксимації вихідних даних відповідно до методу найменших квадратів як апроксимуючу функцію іноді використовують логарифмічну функцію, експоненційну функцію і статечну функцію.

Логарифмічна апроксимація

Розглянемо випадок, коли апроксимуюча функція задана логарифмічною функцією виду:

Апроксимація (від латинського "approximate" - "наближатися") - наближений вираз будь-яких математичних об'єктів (наприклад, чисел або функцій) через інші простіші, зручніші у користуванні або просто більш відомі. У наукових дослідженнях апроксимація застосовується для опису, аналізу, узагальнення та подальшого використання емпіричних результатів.

Як відомо, між величинами може існувати точний (функціональний) зв'язок, коли одному значенню аргументу відповідає одне певне значення.

При виборі апроксимації слід з конкретної завдання дослідження. Зазвичай, що простіше рівняння використовується для апроксимації, тим більше приблизно одержуваний опис залежності. Тому важливо зчитувати, наскільки суттєві і чим зумовлені відхилення конкретних значень від тренда, що отримується. При описі залежності емпірично визначених значень можна досягти і набагато більшої точності, використовуючи якесь складніше, багатопараметричне рівняння. Однак немає сенсу прагнути з максимальною точністю передати випадкові відхилення величин у конкретних рядах емпіричних даних. Вибираючи метод апроксимації, дослідник завжди йде на компроміс: вирішує, якою мірою в даному випадку доцільно і доречно «пожертвувати» деталями і, наскільки узагальнено слід висловити залежність змінних, що зіставляються. Поруч із виявленням закономірностей замаскованих випадковими відхиленнями емпіричних даних від загальної закономірності, апроксимація дозволяє також вирішувати багато інших важливих завдань: формалізувати знайдену залежність; знайти невідомі значення залежної змінної шляхом інтерполяції або, якщо це припустимо, екстраполяції.

Метою даної курсової є вивчення теоретичних основ апроксимації табульованої функції методом найменших квадратів, і, застосовуючи теоретичні знання, знаходження апроксимуючих поліномів. Знаходження апроксимуючих поліномів у рамках даної курсової роботи слід шляхом написання програми мовою Pascal, що реалізує розроблений алгоритм знаходження коефіцієнтів апроксимуючого полінома, а також вирішити це завдання засобами MathCad.

У цій роботі програма на мові Pascal розроблена в оболонці PascalABC версія 1.0 beta. Розв'язання задачі в середовищі MathCad виробляли Mathcad версія 14.0.0.163.

Постановка задачі

У цій роботі необхідно виконати наступне:

1. Розробити алгоритм знаходження коефіцієнтів трьох апроксимуючих поліномів (багаточленів) виду

для табульованої функції y=f(x):

для ступеня поліномів n = 2, 4, 5.

2. Побудувати блок-схему алгоритму.

3. Створити програму мовою Pascal, що реалізує розроблений алгоритм.

5. Побудувати графіки 3-х отриманих функцій, що наближають, в одній системі координат. На графіці мають бути і вихідні точки i , y i ) .

6. Розв'язати завдання засобами MathCAD.

Результати розв'язання задачі за допомогою створеної програми на мові Pascal та в середовищі MathCAD потрібно подати у вигляді побудованих за допомогою знайдених коефіцієнтів трьох поліномів; таблиці, що містить отримані за допомогою знайдених поліномів значення функції у точках хi та середньоквадратичних відхилень.

Побудова емпіричних формул шляхом найменших квадратів

Дуже часто, особливо при аналізі емпіричних даних виникає необхідність знайти у явному вигляді функціональну залежність між величинами x та y, які отримані в результаті вимірювань.

При аналітичному дослідженні взаємозв'язку між двома величинами x та y виробляють ряд спостережень і в результаті виходить таблиця значень:

x ¼ ¼
y ¼ ¼

Ця таблиця зазвичай виходить як результат будь-яких експериментів, у яких

Поділіться з друзями або збережіть для себе:

Завантаження...