Апроксимация на експериментални данни. Метод на най-малките квадрати

КУРСОВА РАБОТА

дисциплина: Информатика

Тема: Апроксимация на функция чрез метод най-малки квадрати

Въведение

1. Постановка на проблема

2. Формули за изчисление

Изчисляване с помощта на таблици, направени по средства Microsoft Excel

Алгоритъмна схема

Изчисление в MathCad

Линейни резултати

Представяне на резултатите под формата на графики


Въведение

цел срочна писмена работае задълбочаване на знанията по компютърни науки, развитие и консолидиране на умения за работа с табличния процесор Microsoft Excel и софтуерния продукт MathCAD и приложението им за решаване на задачи с помощта на компютър от предметната област, свързана с изследване.

Апроксимация (от латинското "approximare" - "приближаване") - приблизителен израз на всякакви математически обекти (например числа или функции) чрез други по-прости, по-удобни за използване или просто по-известни. В научните изследвания апроксимацията се използва за описване, анализиране, обобщаване и по-нататъшно използване на емпирични резултати.

Както е известно, между стойностите може да има точна (функционална) връзка, когато една стойност на аргумента съответства на една конкретна стойност, и по-малко точна (корелационна) връзка, когато една конкретна стойност на аргумента съответства на приблизителна стойност или някакъв набор от функционални стойности, които са повече или по-малко близки една до друга. При администриране научно изследване, обработката на резултатите от наблюдение или експеримент обикновено трябва да се справи с втория вариант.

При изучаване на количествените зависимости на различни показатели, чиито стойности се определят емпирично, като правило има известна променливост. Отчасти се определя от разнородността на изследваните обекти на неживата и особено от живата природа и отчасти от грешката на наблюдението и количествената обработка на материалите. Не винаги е възможно последният компонент да се елиминира напълно, той може да бъде сведен до минимум само чрез внимателен избор на адекватен метод на изследване и точност на работа. Следователно, когато се извършва всякаква изследователска работа, възниква проблемът с идентифицирането на истинската природа на зависимостта на изследваните показатели, в една или друга степен, маскирани от пренебрегването на променливостта: стойности. За това се използва апроксимация - приблизително описание на корелационната зависимост на променливите чрез подходящо уравнение на функционалната зависимост, което предава основната тенденция на зависимостта (или нейната "тенденция").

При избора на приближение трябва да се изхожда от конкретната задача на изследването. Обикновено колкото по-просто е уравнението, използвано за апроксимация, толкова по-приближено е полученото описание на зависимостта. Ето защо е важно да се прочете колко значими и какво е причинило отклоненията на конкретни стойности от резултантната тенденция. Когато се описва зависимостта на емпирично определени стойности, може да се постигне много по-голяма точност, като се използва някое по-сложно, многопараметрично уравнение. Въпреки това, няма смисъл да се опитвате да предадете случайни отклонения на стойностите в конкретни серии от емпирични данни с максимална точност. Много по-важно е да се улови общата закономерност, която в случая най-логично и с приемлива точност се изразява именно чрез двупараметричното уравнение степенна функция. По този начин, когато избира метод на приближение, изследователят винаги прави компромис: той решава до каква степен в този случай е целесъобразно и уместно да се „пожертват“ детайлите и съответно колко обобщено трябва да се изрази зависимостта на сравняваните променливи. Заедно с идентифицирането на маскирани модели случайни отклоненияемпирични данни от общия модел, приближението също ви позволява да решите много други важни проблеми: формализиране на намерената зависимост; намиране на неизвестни стойности на зависимата променлива чрез интерполация или, ако е приложимо, екстраполация.

Във всяка задача се формулират условията на задачата, изходните данни, формулярът за издаване на резултати, основните математически зависимостиза решаване на проблема. В съответствие с метода за решаване на задачата е разработен алгоритъм за решение, който е представен в графична форма.

1. Постановка на проблема

1. Използвайки метода на най-малките квадрати, приближете функцията, дадена в таблицата:

а) полином от първа степен;

б) полином от втора степен;

в) експоненциална зависимост.

За всяка зависимост изчислете коефициента на детерминизъм.

Изчислете коефициента на корелация (само в случай а).

Начертайте линия на тенденция за всяка зависимост.

Изчислете с помощта на функцията LINEST числови характеристикив зависимост от.

Сравнете вашите изчисления с резултатите, получени с помощта на функцията LINEST.

Решете коя от формулите по най-добрия начинприближава функцията.

Напишете програма на един от езиците за програмиране и сравнете резултатите от изчисленията с получените по-горе.

Вариант 3. Функцията е дадена в табл. един.

Маса 1.

xyxyxyxyxy0.281.052.349.113.3329.434.2386.445.55187.540.872.872.6516.863.4137.454.8390.856.32200.451.656.432.7717.973.5542.444.9299.066.66212.971.998.962.8318.993.8556.945.14120.457.13275.742.088.083.0623.754.0175.085.23139.657. 25321.43

2. Формули за изчисление

Често, когато се анализират емпирични данни, става необходимо да се намери функционална връзка между стойностите на x и y, които са получени в резултат на опит или измервания.

Xi (независима стойност) се задава от експериментатора, а yi, наречени емпирични или експериментални стойности, се получава в резултат на експеримента.

Аналитичната форма на функционалната връзка, която съществува между стойностите x и y, обикновено е неизвестна, следователно възниква практически важна задача - да се намери емпирична формула

(където са параметрите), стойностите на които вероятно биха се различавали малко от експерименталните стойности.

По метода на най-малките квадрати най-добрите коефициентиразглеждат се тези, за които сумата от квадратните отклонения на намерената емпирична функция от дадените стойности на функцията ще бъде минимална.

Използвайки необходимото условие за екстремума на функция на няколко променливи - равенство на нула на частни производни, се намира набор от коефициенти, който осигурява минимум на функцията, определена с формула (2), и се получава нормална система за определяне на коефициентите :

Така намирането на коефициентите се свежда до решаване на система (3).

Видът на системата (3) зависи от класа емпирични формули, от които търсим зависимост (1). В случай на линейна зависимост системата (3) ще приеме формата:

В случай на квадратична зависимост системата (3) ще приеме формата:

В някои случаи като емпирична формула се приема функция, в която нелинейно влизат несигурни коефициенти. В този случай понякога проблемът може да бъде линеаризиран, т.е. намали до линейно. Сред такива зависимости е експоненциалната зависимост

където a1 и a2 са недефинирани коефициенти.

Линеаризацията се постига чрез вземане на логаритъм на равенство (6), след което се получава отношението

Означаваме и, съответно, с и, тогава зависимостта (6) може да бъде записана във формата, която ни позволява да приложим формули (4) с a1, заменени с и с.

Графиката на възстановената функционална зависимост y(x) въз основа на резултатите от измерванията (xi, yi), i=1,2,…,n се нарича регресионна крива. За да се провери съответствието на построената регресионна крива с резултатите от експеримента, обикновено се въвеждат следните числени характеристики: коефициент на корелация (линейна зависимост), корелационна връзкаи коефициент на детерминизъм.

Коефициентът на корелация е мярка за линейната връзка между зависимите случайни променливи: показва колко добре, средно, едно от количествата може да бъде представено като линейна функция на другото.

Коефициентът на корелация се изчислява по формулата:

къде е средното аритметична стойностсъответно в x, y.

Коефициентът на корелация между случайните променливи не надвишава по абсолютна стойност 1. Колкото по-близо е до 1, толкова по-тясна е линейната връзка между x и y.

В случай на нелинейна корелация, условните средни стойности са разположени близо до кривата линия. В този случай, като характеристика на силата на връзката, се препоръчва да се използва съотношението на корелация, чието тълкуване не зависи от вида на изследваната зависимост.

Коефициентът на корелация се изчислява по формулата:

където числителят характеризира дисперсията на условните средни около безусловната средна стойност.

Е винаги. Равенство = съответства на произволни некорелирани променливи; = ако и само ако има точна функционална връзка между x и y. При линейна зависимост на y от x съотношението на корелация съвпада с квадрата на коефициента на корелация. Стойността се използва като индикатор за отклонението на регресията от линейността.

Коефициентът на корелация е мярка за корелацията y c x във всякаква форма, но не може да даде представа за степента на близост на емпиричните данни до специална форма. За да разберете колко точно построената крива отразява емпиричните данни, се въвежда още една характеристика - коефициентът на детерминация.


където Sres = - остатъчна сума от квадрати, която характеризира отклонението на експерименталните данни от теоретичните total - обща сума от квадрати, където средната стойност е yi.

Регресионна сума от квадрати, характеризиращи разпространението на данните.

Колкото по-малък е остатъчният сбор от квадрати в сравнение с общата сумаквадрати, толкова по-голяма е стойността на коефициента на детерминизъм r2, който показва колко добро е уравнението, получено с помощта на регресионен анализ, обяснява връзките между променливите. Ако е равно на 1, тогава има пълна корелация с модела, т.е. няма разлика между действителните и прогнозните стойности на y. В противен случай, ако коефициентът на детерминизъм е 0, тогава регресионното уравнение не успява да предвиди y стойности.

Коефициентът на детерминизъм винаги не надвишава съотношението на корелация. В случай, че равенството е изпълнено, тогава можем да приемем, че построената емпирична формула най-точно отразява емпиричните данни.

3. Изчисляване с помощта на таблици, направени с помощта на Microsoft Excel

За изчисления е препоръчително да подредите данните във формата на таблица 2, като използвате електронната таблица Microsoft Excel.

таблица 2

ABCDEFGHI10,281,050,07840,2940,0219520,0061470,082320,048790,01366120,872,870,75692,49690,6585030,5728982,1723031,0543120,91725131,656,432,722510,60954,4921257,41200617,505681,8609753,07060841, 998,963,960117,83047,88059915,6823935,48252,192774,36361352,088,084,326416,80648,99891218,7177434,957312,0893924,34593562,349,115,475621,317412,812929,982249,882722,2093735,16993272,6516, 867,022544,67918,6096349,31551118,39942,8249447,48610182,7717,977,672949,776921,2539358,87339137,8822,8887048,00170992,8318,998,008953,741722,6651964,14248152,0892,9439138, 331272103,0623,759,363672,67528,6526287,677222,38553,1675839,692803113,3329,4311,088998,001936,92604122,9637326,34633,38201511,26211123,4137,4511,6281127,704539,65182135,2127435, 47233,62300712,35445133,5542,4412,6025150,66244,73888158,823534,85013,74809113,30572143,8556,9414,8225219,21957,06663219,7065843,99324,04199815,56169154,0175,0816,0801301,070864, 4812258,56961207,2944,31855417,3174164,2386,4417,8929365,641275,68697320,15591546,6624,45945 118,86348174,8390,8523,3289438,8055112,6786544,23762119,4314,5092121,77948184,9299,0624,2064487,3752119,0955585,94982397,8864,59572622,61097195,14120,4526,4196619,113135,7967697, 99533182,2414,79123524,62695205,23139,6527,3529730,3695143,0557748,18113819,8324,93913925,8317215,55187,5430,80251040,847170,9539948,7945776,7015,23399229,04866226,32200,4539,94241266, 844252,4361595,3958006,4545,30056533,49957236,66212,9744,35561418,38295,40831967,4199446,4125,36115135,70527247,13275,7450,83691966,026362,46712584,3914017,775,61945840,06674257,25321, 4352.56252330.368381.07812762.81616895.165.7727841.852652695.932089.99453.310511850.652417.56813982.9971327.3490.97713415.0797 Нека обясним как се съставя Таблица 2.

Стъпка 1. В клетки A1: A25 въвеждаме стойностите xi.

Стъпка 2. В клетки B1:B25 въвеждаме стойностите на yi.

Стъпка 3. В клетка C1 въведете формулата = A1 ^ 2.

Стъпка 4. Тази формула се копира в клетки C1:C25.

Стъпка 5. В клетка D1 въведете формулата = A1 * B1.

Стъпка 6. Тази формула се копира в клетки D1:D25.

Стъпка 7. В клетка F1 въведете формулата = A1 ^ 4.

Стъпка 8. В клетки F1:F25 тази формула се копира.

Стъпка 9. В клетка G1 въведете формулата =A1^2*B1.

Стъпка 10. Тази формула се копира в клетки G1:G25.

Стъпка 11. В клетка H1 въведете формулата = LN (B1).

Стъпка 12. Тази формула се копира в клетки H1:H25.

Стъпка 13. В клетка I1 въведете формулата = A1 * LN (B1).

Стъпка 14. Тази формула се копира в клетки I1:I25.

Извършваме следните стъпки с помощта на автоматично сумиране С .

Стъпка 15. В клетка A26 въведете формулата = SUM (A1: A25).

Стъпка 16. В клетка B26 въведете формулата = SUM (B1: B25).

Стъпка 17. В клетка C26 въведете формулата = SUM (C1: C25).

Стъпка 18. В клетка D26 въведете формулата = SUM (D1: D25).

Стъпка 19. В клетка E26 въведете формулата = SUM (E1: E25).

Стъпка 20. В клетка F26 въведете формулата = SUM (F1: F25).

Стъпка 21. В клетка G26 въведете формулата = SUM (G1: G25).

Стъпка 22. В клетка H26 въведете формулата = SUM(H1:H25).

Стъпка 23. В клетка I26 въведете формулата = SUM(I1:I25).

Ние приближаваме функцията линейна функция. За определяне на коефициентите и използваме система (4). Използвайки сумите от таблица 2, разположени в клетки A26, B26, C26 и D26, записваме система (4) като

решавайки което, получаваме и.

Системата е решена по метода на Крамер. Същността на която е следната. Да разгледаме система от n алгебрични линейни уравненияс n неизвестни:

Системната детерминанта е системната матрична детерминанта:

Означаваме - детерминантата, която ще се получи от детерминантата на системата Δ чрез замяна на j-тата колона с колоната

Така линейното приближение има формата

Решаваме система (11) с помощта на инструменти на Microsoft Excel. Резултатите са представени в таблица 3.

Таблица 3

ABCDE282595.932089.992995.93453.310511850.653031

В таблица 3 клетки A32:B33 съдържат формулата (=MOBR(A28:B29)).

Клетки E32:E33 съдържат формулата (=MULTI(A32:B33),(C28:C29)).

След това приближаваме функцията квадратична функция. За определяне на коефициентите a1, a2 и a3 използваме система (5). Използвайки сумите от таблица 2, разположени в клетки A26, B26, C26, D26, E26, F26, G26, записваме система (5) като

решавайки което, получаваме a1=10,663624 и

По този начин квадратичното приближение има формата

Решаваме система (16) с помощта на инструменти на Microsoft Excel. Резултатите са представени в таблица 4.

Таблица 4

ABCDEF362595,93453,31052089,993795,93453,31052417,56811850,65538453,31052417,56813982,9971327,3453940Обратная матрица410,632687-0,314390,033846a1=10,66362442-0,314390,184534-0,021712a2=-18, 924512430.033846-0.021710.002728a3=8.0272305

В таблица 4 клетки A41:C43 съдържат формулата (=MOBR(A36:C38)).

Клетки F41:F43 съдържат формулата (=MMULT(A41:C43),(D36:D38)).

Сега приближаваме функцията експоненциална функция. За да определим коефициентите и да вземем логаритъма на стойностите и, използвайки сумите от таблица 2, разположени в клетки A26, C26, H26 и I26, получаваме системата

Решавайки система (18), получаваме и.

След потенциране получаваме

По този начин експоненциалното приближение има формата

Решаваме система (18) с помощта на инструменти на Microsoft Excel. Резултатите са представени в таблица 5.

Таблица 5

BCDEF462595.9390.977134795.93453.3105415.07974849 Обратна матрица=0.667679 500.212802-0.04503a2=0.774368 51-0.045030.011736a1=1.949707

Клетки A50:B51 съдържат формулата (=MOBR(A46:B47)).

Клетка E51 съдържа формулата=EXP(E49).

Изчислете средноаритметично и по формулите:

Резултатите от изчисленията и инструментите на Microsoft Excel са представени в таблица 6.

Таблица 6

BC54Xav=3.837255Yav=83.5996

Клетка B54 съдържа формулата =A26/25.

Клетка B55 съдържа формулата = B26/25

Таблица 7

ABJKLMNO10,281,05293,645412,653676814,4365987,97624,444081,88177520,872,87239,54098,8042766517,2682774,7226,7334610,91071731,656,43168,78534,7838445955,147448,035726,395820,32073741, 998,96137,87433,4121485571,0770,7358817,368220,02062652,088,08132,7033,0877525703,2112,138714,2039422,82478262,349,11111,52582,2416085548,70151,488211,4985887,99584272,6516, 8679,233251,4094444454,174178,5730,000622,83382582,7717,9770,039911,1389164307,244311,46313,4777091,73059692,8318,9965,074791,0144524174,4373,4915,7914362,382273103,0623,7546, 515110,604043581,975620,344117,375498,423061113,3329,4327,474820,2572522934,346983,819852,2462113,94466123,4137,4519,715110,18252129,786725,90914,090409102,2541133,5542,4411,821040, 0824841694,113797,89844,861044143,3219143,8556,94-0,341240,000164710,7343741,750,023142342,3946154,0175,08-1,472190,0298672,58358265,3212126,0007996,9257164,2386,441, 1157090.1542928.067872219.6288148.75781214.778174.8390.857 1,172456239,0241103,718163,9776121,868195,14120,4548,00871,6972881357,952471,908425,17881258,6007205,23139,6578,0671,9398923141,64743,1629470,45155769,9408215,55187,54178,02912, 93368410803,61725,38421200,5291951,06226,32200,45290,11626,16429613654,0227,28786126,28273577,409236,66212,97365,18687,968216736,76,038755767,788515795,87247,13275,74632,679910,8425336917, 931944,47565,1469344766,92257,25321,43811,667611,647256563,37121,842677,966445516,82695,932089,93830,94585,207919964427404,823786,286115678,1С у м м ыОстаточные суммыXY линейна квадратна експозиция

Нека обясним как се прави.

Клетките A1:A26 и B1:B26 вече са попълнени.

Стъпка 1. В клетка J1 въведете формулата = (A1-$B$54)*(B1-$B$55).

Стъпка 2. Тази формула се копира в клетки J2:J25.

Стъпка 3. В клетка K1 въведете формулата = (A1-$B$54)^2.

Стъпка 4. Тази формула се копира в клетки k2:K25.

Стъпка 5. В клетка L1 въведете формулата = (B1-$B$55)^2.

Стъпка 6. Тази формула се копира в клетки L2:L25.

Стъпка 7. В клетка M1 въведете формулата = ($E$32+$E$33*A1-B1)^2.

Стъпка 8. Тази формула се копира в клетки M2:M25.

Стъпка 9. В клетка N1 въведете формулата = ($F$41+$F$42*A1+$F$43*A1^2-B1)^2.

Стъпка 10. В клетки N2:N25 тази формула се копира.

Стъпка 11. В клетка O1 въведете формулата = ($E$51*EXP($E$50*A1)-B1)^2.

Стъпка 12. Тази формула се копира в клетки O2:O25.

Извършваме следните стъпки, като използваме автоматично сумиране С .

Стъпка 13. В клетка J26 въведете формулата = SUM (J1: J25).

Стъпка 14. В клетка K26 въведете формулата = SUM(K1:K25).

Стъпка 15. В клетка L26 въведете формулата = SUM (L1: L25).

Стъпка 16. В клетка M26 въведете формулата = SUM(M1:M25).

Стъпка 17. В клетка N26 въведете формулата = SUM(N1:N25).

Стъпка 18. В клетка O26 въведете формулата = SUM (O1: O25).

Сега нека изчислим коефициента на корелация, използвайки формула (8) (само за линейно приближение) и коефициента на детерминизъм, използвайки формула (10). Резултатите от изчисленията с помощта на Microsoft Excel са представени в таблица 8.

Таблица 8

AB57 Коефициент на корелация 0,92883358 Коефициент на детерминизъм (линейно приближение) 0,8627325960 Коефициент на детерминизъм (квадратично приближение) 0,9810356162 Коефициент на детерминизъм (експоненциално приближение) 0,42057863 Клетка E57 съдържа формулата =J26/(K26*L26)^(1/2).

Клетка E59 съдържа формулата=1-M26/L26.

Клетка E61 съдържа формулата=1-N26/L26.

Клетка E63 съдържа формулата=1-O26/L26.

Анализът на резултатите от изчисленията показва, че квадратичното приближение най-добре описва експерименталните данни.

Алгоритъмна схема

Ориз. 1. Схема на алгоритъма за изчислителната програма.

5. Изчисляване в MathCad

Линейна регресия

· линия (x, y) - двуелементен вектор (b, a) на коефициентите линейна регресия b+брадва;

· x е векторът на реалните данни на аргумента;

· y е вектор от реални стойности на данни с еднакъв размер.

Фигура 2.

Полиномна регресия означава напасване на данните (x1, y1) с полином k-та степенЗа k=i полиномът е права линия, за k=2 е парабола, за k=3 е кубична парабола и т.н. Като правило, к<5.

· regress (x,y,k) - вектор от коефициенти за изграждане на регресия на полиномни данни;

· interp (s,x,y,t) - резултат от полиномна регресия;

· s=регресия(x,y,k);

· x е вектор от реални аргументни данни, чиито елементи са подредени във възходящ ред;

· y е вектор от реални стойности на данни със същия размер;

· k е степента на регресионния полином (цяло положително число);

· t е стойността на аргумента на регресионния полином.

Фигура 3

В допълнение към разгледаните, в Mathcad са вградени още няколко типа трипараметрична регресия, тяхното изпълнение е малко по-различно от горните опции за регресия, тъй като за тях, в допълнение към масива от данни, се изисква да зададете някои начални стойности на коефициентите a, b, c. Използвайте подходящия тип регресия, ако имате добра представа каква зависимост описва вашия масив от данни. Когато типът на регресията не отразява добре последователността от данни, тогава нейният резултат често е незадоволителен и дори много различен в зависимост от избора на начални стойности. Всяка от функциите произвежда вектор от прецизирани параметри a, b, c.

LINEST Резултати

Помислете за целта на функцията LINEST.

Тази функция използва метода на най-малките квадрати, за да изчисли правата линия, която най-добре отговаря на наличните данни.

Функцията връща масив, който описва получения ред. Уравнението за права линия е:

M1x1 + m2x2 + ... + b или y = mx + b,

алгоритъм табличен софтуер на Microsoft

За да получите резултатите, трябва да създадете формула за електронна таблица, която ще обхваща 5 реда и 2 колони. Този интервал може да бъде поставен навсякъде в работния лист. В този интервал трябва да въведете функцията LINEST.

В резултат на това всички клетки от интервала A65:B69 трябва да бъдат запълнени (както е показано в таблица 9).

Таблица 9

АВ6544,95997-88,9208663,73946615,92346670,86273234,5183168144,55492369172239,227404,82

Нека обясним предназначението на някои от количествата, разположени в таблица 9.

Стойностите, разположени в клетки A65 и B65, характеризират съответно наклона и отместването - коефициент на детерминизъм - F-наблюдавана стойност - брой степени на свобода.

Представяне на резултатите под формата на графики

Ориз. 4. Графика на линейна апроксимация

Ориз. 5. Графика на квадратично приближение

Ориз. 6. График на експоненциална апроксимация

заключения

Нека направим изводи въз основа на резултатите от получените данни.

Анализът на резултатите от изчислението показва, че квадратичното приближение най-добре описва експерименталните данни, тъй като тренд линията за него най-точно отразява поведението на функцията в тази област.

Сравнявайки резултатите, получени с помощта на функцията LINEST, виждаме, че те напълно съвпадат с извършените по-горе изчисления. Това показва, че изчисленията са правилни.

Резултатите, получени с помощта на програмата MathCad, напълно съответстват на стойностите, дадени по-горе. Това показва правилността на изчисленията.

Библиография

  1. Б.П. Демидович, И.А. Кестеняво. Основи на изчислителната математика. М: Държавно издателство за физико-математическа литература.
  2. Информатика: Учебник, изд. проф. Н.В. Макарова. М: Финанси и статистика, 2007 г.
  3. Информатика: Практикум по компютърна техника, изд. проф. Н.В. Макарова. М: Финанси и статистика, 2010.
  4. В.Б. Комягин. Програмиране в Excel във Visual Basic. М: Радио и комуникация, 2007.
  5. Н. Никол, Р. Албрехт. Excel. Електронни таблици. М: Изд. "ЕКОМ", 2008г.
  6. Указания за изпълнение на курсова работа по компютърни науки (за студенти от кореспондентския отдел на всички специалности), изд. Журова Г. Н., СПбГГИ(ТУ), 2011.

КУРСОВА РАБОТА

Апроксимация на функция по метода на най-малките квадрати


Въведение

емпирично приближение на mathcad

Целта на курсовата работа е да задълбочи знанията по компютърни науки, да развие и консолидира умения за работа с електронни таблици Microsoft Excel и MathCAD. Приложението им за решаване на задачи с помощта на компютър от предметната област, свързана с изследване.

Във всяка задача са формулирани условията на проблема, изходните данни, формулярът за издаване на резултати, посочени са основните математически зависимости за решаване на проблема Контролното изчисление ви позволява да проверите правилната работа на програмата.

Концепцията за апроксимация е приблизително изразяване на някои математически обекти (например числа или функции) чрез други, които са по-прости, по-удобни за използване или просто по-известни. В научните изследвания апроксимацията се използва за описване, анализиране, обобщаване и по-нататъшно използване на емпирични резултати.

Както е известно, между стойностите може да има точна (функционална) връзка, когато една стойност на аргумента съответства на една конкретна стойност, и по-малко точна (корелационна) връзка, когато една конкретна стойност на аргумента съответства на приблизителна стойност или някакъв набор от функционални стойности, които са повече или по-малко близки една до друга. Когато провеждате научни изследвания, обработвате резултатите от наблюдение или експеримент, обикновено трябва да се справите с втория вариант. При изучаване на количествените зависимости на различни показатели, чиито стойности се определят емпирично, като правило има известна променливост. Отчасти се определя от разнородността на изследваните обекти на неживата и особено от живата природа, отчасти поради грешката на наблюдението и количествената обработка на материалите. Не винаги е възможно последният компонент да се елиминира напълно, той може да бъде сведен до минимум само чрез внимателен избор на адекватен метод на изследване и точност на работа.

Специалистите в областта на автоматизацията на технологични процеси и производства боравят с голямо количество експериментални данни, за чиято обработка се използва компютър. Първоначалните данни и получените резултати от изчисленията могат да бъдат представени в таблична форма с помощта на процесори за електронни таблици (електронни таблици) и по-специално Excel. Курсовата работа по компютърни науки позволява на студента да консолидира и развие умения за работа с помощта на основни компютърни технологии при решаване на проблеми в областта на професионалната дейност - система за компютърна алгебра от класа на системите за автоматизирано проектиране, фокусирана върху подготовката на интерактивни документи с изчисления и визуална поддръжка, е лесен за използване и се прилага за работа в екип.


1. Главна информация


Много често, особено когато се анализират емпирични данни, става необходимо да се намери изрично функционалната връзка между количествата хи при, които се получават в резултат на измервания.

При аналитично изследване на връзката между две величини x и y се правят поредица от наблюдения и резултатът е таблица със стойности:


xx1 х1 хазхнyy1 г1 газYн

Тази таблица обикновено се получава в резултат на някои експерименти, в които х,(независима стойност) се задава от експериментатора и y,получени в резултат на опит. Следователно тези стойности y,ще се наричат ​​емпирични или експериментални стойности.

Съществува функционална връзка между стойностите x и y, но нейната аналитична форма обикновено е неизвестна, така че възниква практически важна задача - да се намери емпирична формула


y=f (x; a 1, а 2,…, съм ), (1)


(където а1 , а2 ,…, ам- параметри), стойностите на които при х=х,вероятно ще се различава малко от експерименталните стойности y, (i = 1,2,…, П).

Обикновено посочвайте класа функции (например набор от линейни, степенни, експоненциални и т.н.), от които е избрана функцията f(x), след което се определят най-добрите стойности на параметрите.

Ако в емпиричната формула (1) заместим инициала х,тогава получаваме теоретичните стойности

YTаз= f (хаз; а 1, а 2……ам) , където аз = 1,2,…, н.


Разлики газT- приаз, се наричат ​​отклонения и представляват вертикалните разстояния от точките Мазкъм графиката на емпиричната функция.

Според метода на най-малките квадрати най-добрите коефициенти а1 , а2 ,…, амразглеждат се тези, за които сумата от квадратите на отклоненията на намерената емпирична функция от дадените стойности на функцията



ще бъде минимален.

Нека обясним геометричния смисъл на метода на най-малките квадрати.

Всяка двойка числа ( хаз, газ) от изходната таблица дефинира точка Мазна повърхността XOY.Използване на формула (1) за различни стойности на коефициентите а1 , а2 ,…, амвъзможно е да се построи поредица от криви, които са графики на функцията (1). Проблемът е да се определят коефициентите а1 , а2 ,…, амтака че сумата от квадратите на вертикалните разстояния от точките Маз (хаз, газ) към графиката на функция (1) беше най-малък (фиг. 1).



Изграждането на емпирична формула се състои от два етапа: намиране на общата форма на тази формула и определяне на нейните най-добри параметри.

Ако характерът на връзката между дадените величини x и г, то формата на емпиричната зависимост е произволна. Предпочитание се дава на прости формули с добра точност. Успешният избор на емпирична формула до голяма степен зависи от познанията на изследователя в предметната област, използвайки които той може да посочи класа на функциите от теоретични съображения. От голямо значение е представянето на получените данни в декартови или специални координатни системи (полулогаритмични, логаритмични и др.). По позицията на точките може грубо да се познае общата форма на зависимостта, като се установи приликата между построената графика и проби от известни криви.

Определяне на най-добрите коефициенти а1 , а2,…, амвключени в емпиричната формула, получена чрез добре познати аналитични методи.

Да се ​​намери набор от коефициенти а1 , а2 …..ам, които доставят минимума на функцията S, дефинирана с формула (2), използваме необходимото условие за екстремума на функция на няколко променливи - равенство на нула на частни производни.

В резултат на това получаваме нормална система за определяне на коефициентите ааз(i = 1,2,…, м):



По този начин намирането на коефициентите аазсвежда до решаваща система (3). Тази система е опростена, ако емпиричната формула (1) е линейна по отношение на параметрите ааз, тогава системата (3) ще бъде линейна.


1.1 Линейна връзка


Конкретната форма на системата (3) зависи от класа емпирични формули, от които търсим зависимост (1). В случай на линейна зависимост y=a1 +a2 хсистема (3) ще приеме формата:


Тази линейна система може да бъде решена с всеки известен метод (метод на Гаус, прости итерации, формули на Крамер).


1.2 Квадратна зависимост


В случай на квадратична зависимост y=a1 +a2 х + а3х 2система (3) ще приеме формата:



1.3 Експоненциална зависимост


В някои случаи като емпирична формула се приема функция, в която нелинейно влизат несигурни коефициенти. В този случай понякога проблемът може да бъде линеаризиран, т.е. намали до линейно. Сред такива зависимости е експоненциалната зависимост


y=a1 a2x (6)


къде 1и а 2, неопределени коефициенти.

Линеаризацията се постига чрез вземане на логаритъм на равенство (6), след което се получава отношението

ln y = ln a 1+а 2х (7)


Означаваме ln прии л.н ахсъответно чрез Tи ° С, тогава зависимостта (6) може да бъде записана като t = а1 +a2 х, което ни позволява да приложим формули (4) със замяната а1 на ° Си приазна Tаз


1.4 Елементи на корелационната теория


График на възстановената функционална зависимост y(x)според резултатите от измерванията (х аз, приаз),i = 1,2, K, ннаречена регресионна крива. За да се провери съответствието на построената регресионна крива с резултатите от експеримента, обикновено се въвеждат следните числени характеристики: коефициент на корелация (линейна зависимост), съотношение на корелация и коефициент на детерминизъм. В този случай резултатите обикновено се групират и представят под формата на корелационна таблица. Във всяка клетка на тази таблица са дадени числата нiJ - тези двойки (x, y), чиито компоненти попадат в съответните интервали за групиране за всяка променлива. Ако приемем, че дължините на интервалите на групиране (за всяка променлива) са равни една на друга, изберете центровете x аз(съответно приаз) от тези интервали и броя нiJ- като основа за изчисления.

Коефициентът на корелация е мярка за линейната връзка между зависимите случайни променливи: той показва колко добре средно една от променливите може да бъде представена като линейна функция на другата.

Коефициентът на корелация се изчислява по формулата:


където и са съответно средноаритметичното хи при.

Коефициентът на корелация между случайните променливи не превишава по абсолютна стойност 1. Колкото по-близо е |р| до 1, толкова по-тясна е линейната връзка между x и г.

В случай на нелинейна корелация, условните средни стойности са разположени близо до кривата линия. В този случай, като характеристика на силата на връзката, се препоръчва да се използва съотношението на корелация, чието тълкуване не зависи от вида на изследваната зависимост.

Коефициентът на корелация се изчислява по формулата:



където наз = , нf= , а числителят характеризира дисперсията на условните средни стойности y,за безусловно средно г.

Е винаги. Равенство = 0 съответства на некорелирани случайни променливи; = 1 ако и само ако има точна функционална връзка между ги х. В случай на линейна зависимост гот x съотношението на корелация съвпада с квадрата на коефициента на корелация. Стойност - ? 2 се използва като индикатор за отклонението на регресията от линейността.

Коефициентът на корелация е мярка за корелация гс хпод каквато и да е форма, но не може да даде представа за степента на сближаване на емпиричните данни със специална форма. За да разберете колко точно построената крива отразява емпиричните данни, се въвежда още една характеристика - коефициентът на детерминизъм.

За да го опишете, разгледайте следните количества. е общият сбор на квадратите, където е средната стойност.

Можем да докажем следното равенство

Първият член е равен на Sres = и се нарича остатъчна сума от квадрати. Характеризира отклонението на експерименталните от теоретичните.

Вторият член е равен на Sreg = 2 и се нарича регресионна сума на квадратите и характеризира разпространението на данните.

Очевидно е, че следващото равенство S пълен = С ост + С рег.

Коефициентът на детерминизъм се определя по формулата:



Колкото по-малка е остатъчната сума на квадратите в сравнение с общата сума на квадратите, толкова по-голяма е стойността на коефициента на детерминизъм r2 , което показва колко добре уравнението, генерирано от регресионния анализ, обяснява връзките между променливите. Ако е равно на 1, тогава има пълна корелация с модела, т.е. няма разлика между действителните и прогнозните стойности на y. В противен случай, ако коефициентът на детерминизъм е 0, тогава регресионното уравнение не успява да предвиди стойностите на y

Коефициентът на детерминизъм винаги не надвишава съотношението на корелация. В случай, когато равенството r 2 = тогава можем да приемем, че построената емпирична формула най-точно отразява емпиричните данни.


2. Постановка на проблема


1. Използвайки метода на най-малките квадрати, функцията, посочена в таблицата, се апроксимира

а) полином от първа степен;

б) полином от втора степен;

в) експоненциална зависимост.

За всяка зависимост изчислете коефициента на детерминизъм.

Изчислете коефициента на корелация (само в случай а).

Начертайте линия на тенденция за всяка зависимост.

С помощта на функцията LINEST изчислете числените характеристики на зависимостта от.

Сравнете вашите изчисления с резултатите, получени с помощта на функцията LINEST.

Направете заключение коя от получените формули най-добре приближава функцията.

Напишете програма на един от езиците за програмиране и сравнете резултатите от изчисленията с получените по-горе.


3. Изходни данни


Функцията е дадена на фигура 1.



4. Изчисляване на приближения в електронната таблица Excel


За изчисления е препоръчително да използвате електронна таблица на Microsoft Excel. И подредете данните, както е показано на фигура 2.



За това въвеждаме:

· в клетки A6:A30 въвеждаме стойностите xi .

· в клетки B6: B30 въвеждаме стойностите на ui .

· в клетка C6 въведете формулата =A6^ 2.

· тази формула се копира в клетки C7:C30.

· В клетка D6 въведете формулата =A6*B6.

· тази формула се копира в клетки D7:D30.

· в клетка F6 въведете формулата =A6^4.

· тази формула се копира в клетки F7:F30.

· в клетка G6 въвеждаме формулата =A6^2*B6.

· тази формула се копира в клетки G7:G30.

· в клетка H6 въведете формулата =LN(B6).

· тази формула се копира в клетки H7:H30.

· в клетка I6 въведете формулата =A6*LN(B6).

· тази формула се копира в клетки I7:I30. Извършваме следните стъпки с помощта на автоматично сумиране

· в клетка A33 въведете формулата = SUM (A6: A30).

· в клетка B33 въведете формулата = SUM (B6: B30).

· в клетка C33 въведете формулата = SUM (C6: C30).

· в клетка D33 въведете формулата = SUM (D6: D30).

· в клетка E33 въведете формулата =SUM (E6:E30).

· в клетка F33 въведете формулата = SUM (F6: F30).

· в клетка G33 въведете формулата = SUM (G6: G30).

· в клетка H33 въведете формулата = SUM (H6: H30).

· в клетка I33 въведете формулата = SUM (I6: I30).

Ние приближаваме функцията y=f(x) линейна функция y=a1 +a2х. За определяне на коефициентите a 1и а 2използваме система (4). Използвайки сумите от таблица 2, разположени в клетки A33, B33, C33 и D33, записваме система (4) като



решавайки което, получаваме a 1= -24,7164 и a2 = 11,63183

Така линейното приближение има формата y= -24,7164 + 11,63183x (12)

Система (11) беше решена с помощта на Microsoft Excel. Резултатите са представени на фигура 3:



В таблицата клетки A38:B39 съдържат формулата (=NBR (A35:B36)). Клетки E38:E39 съдържат формулата (=MULTI(A38:B39, C35:C36)).


След това приближаваме функцията y=f(x) квадратична функция y=a1 +a2 х + а3 х2. За определяне на коефициентите a 1, а 2и а 3използваме система (5). Използвайки сумите от таблица 2, разположени в клетки A33, B33, C33, D33, E33, F33 и G33, записваме система (5) като:



Решавайки кое, получаваме a 1= 1,580946, а 2= -0,60819 и a3 = 0,954171 (14)

Така квадратичното приближение има формата:

y \u003d 1,580946 -0,60819x + 0,954171 x2

Система (13) беше решена с помощта на Microsoft Excel. Резултатите са представени на фигура 4.



В таблицата клетки A46:C48 съдържат формулата (=NBR (A41:C43)). Клетки F46:F48 съдържат формулата (=MULTI(A41:C43, D46:D48)).

Сега приближаваме функцията y=f(x) експоненциална функция y=a1 дa2x. За определяне на коефициентите а1 и а2 вземете логаритъма на стойностите гази използвайки сумите от таблица 2, разположени в клетки A26, C26, H26 и I26, получаваме системата:



където с = ln(a1 ).

Решаваща система (10) намираме c =0,506435, а2 = 0.409819.

След потенциране получаваме a1 = 1,659365.

По този начин експоненциалното приближение има формата y = 1,659365*e0,4098194x

Система (15) беше решена с помощта на Microsoft Excel. Резултатите са показани на фигура 5.


В таблицата клетки A55:B56 съдържат формулата (=NBR (A51:B52)). Клетки E54:E56 съдържат формулата (=МНОЖЕСТВО(A51:B52, C51:C52)). Клетка E56 съдържа формулата =EXP(E54).

Изчислете средноаритметичната стойност на x и y по формулите:



Резултати от изчислението x и гИнструментите на Microsoft Excel са показани на фигура 6.



Клетка B58 съдържа формулата =A33/25. Клетка B59 съдържа формулата =B33/25.

таблица 2


Нека обясним как се компилира таблицата на фигура 7.

Клетките A6:A33 и B6:B33 вече са попълнени (вижте Фигура 2).

· в клетка J6 въведете формулата =(A6-$B$58)*(B6-$B$59).

· тази формула се копира в клетки J7:J30.

· в клетка K6 въведете формулата =(A6-$B$58)^ 2.

· тази формула се копира в клетки K7:K30.

· в клетка L6 въведете формулата =(B1-$B$59)^2.

· тази формула се копира в клетки L7:L30.

· в клетка M6 въведете формулата =($E$38+$E$39*A6-B6)^2.

· тази формула се копира в клетки M7:M30.

· в клетка N6 въведете формулата =($F$46 +$F$47*A6 +$F$48*A6 L6-B6)^2.

· тази формула се копира в клетки N7:N30.

· в клетка O6 въведете формулата =($E$56*EXP ($E$55*A6) - B6)^2.

· тази формула се копира в клетки O7:O30.

Следващите стъпки се извършват с помощта на автоматично сумиране.

· в клетка J33 въведете формулата =CYMM (J6:J30).

· в клетка K33 въведете формулата = SUM (K6: K30).

· в клетка L33 въведете формулата =CYMM (L6:L30).

· в клетка M33 въведете формулата = SUM (M6: M30).

· в клетка N33 въведете формулата = SUM (N6: N30).

· в клетка O33 въведете формулата = SUM (06:030).

Сега нека изчислим коефициента на корелация, използвайки формула (8) (само за линейно приближение) и коефициента на детерминизъм, използвайки формула (10). Резултатите от изчисленията с помощта на Microsoft Excel са показани на фигура 7.



В таблица 8 клетка B61 съдържа формулата =J33/(K33*L33^(1/2). Клетка B62 съдържа формулата =1 - M33/L33. Клетка B63 съдържа формулата =1 - N33/L33. Клетка B64 съдържа формула =1 - O33/L33.

Анализът на резултатите от изчисленията показва, че квадратичното приближение най-добре описва експерименталните данни.


4.1 Графика в Excel


Нека изберем клетки A1: A25, след което ще се обърнем към съветника за диаграма. Нека изберем диаграма на разсейване. След като диаграмата е построена, щракнете с десния бутон върху линията на диаграмата и изберете да добавите линия на тенденция (съответно линейна, експоненциална, степенна и полиномна от втора степен).

График на линейно приближение


График на квадратично приближение


Експоненциална диаграма.


5. Апроксимация на функция с помощта на MathCAD


Апроксимацията на данни, като се вземат предвид техните статистически параметри, се отнася до регресионни проблеми. Те обикновено възникват по време на обработката на експериментални данни, получени в резултат на измервания на процеси или физични явления със статистически характер (като измервания в радиометрията и ядрената геофизика), или при високо ниво на смущения (шум). Задачата на регресионния анализ е изборът на математически формули, които най-добре описват експерименталните данни.


.1 Линейна регресия


Линейната регресия в системата Mathcad се извършва върху векторите на аргумента хи четения Yфункции:

прихващане (x, y)- изчислява параметъра а1 , вертикално изместване на регресионната линия (вижте фиг.)

наклон (x, y)- изчислява параметъра а2 , наклон на регресионната линия (виж фигурата)

y(x) = a1+a2*x


функция кор(y, y(x))изчислява Коефициент на корелация на Пиърсън.Колкото по-близо е до 1, толкова по-точно обработваните данни съответстват на линейна зависимост (вижте Фиг.)

.2 Полиномиална регресия


Едномерна полиномна регресия с произволна степен n на полинома и с произволни примерни координати в Mathcad се изпълнява от функциите:

регресия(x, y, n)- изчислява вектор С,който съдържа коефициентите aiполином нта степен;

Стойности на коефициента aiмогат да бъдат извлечени от вектора Сфункция подматрица (S, 3, дължина(S) - 1, 0, 0).

Получените стойности на коефициентите се използват в регресионното уравнение


y(x) = a1+a2*x+a3*x2 (вижте снимката.)

.3 Нелинейна регресия


За прости стандартни формули за приближение са предоставени редица нелинейни регресионни функции, в които параметрите на функцията се избират от програмата Mathcad.

Сред тях е функцията expfit(x, y, s),който връща вектор, съдържащ коефициентите а1, а2и a3експоненциална функция

y(x) = a1 ^exp (a2x) + a3.V вектор Свъвеждат се първоначалните стойности на коефициентите а1, а2и a3първо приближение.


Заключение


Анализът на резултатите от изчисленията показва, че линейното приближение най-добре описва експерименталните данни.

Резултатите, получени с помощта на програмата MathCAD, напълно съответстват на стойностите, получени с помощта на Excel. Това показва правилността на изчисленията.


Библиография

  1. Информатика: Учебник / Ред. проф. Н.В. Макарова. М.: Финанси и статистика 2007
  2. Информатика: Уъркшоп по компютърни технологии / Под. Изд. проф. Н.В. Макарова. М Финанси и статистика, 2011.
  3. Н.С. Пискунов. Диференциално и интегрално смятане, 2010.
  4. Информатика, Апроксимация по метода на най-малките квадрати, указания, Санкт Петербург, 2009 г.
Обучение

Нуждаете се от помощ при изучаването на тема?

Нашите експерти ще съветват или предоставят услуги за обучение по теми, които ви интересуват.
Подайте заявлениепосочване на темата точно сега, за да разберете за възможността за получаване на консултация.

АПРОКСИМАЦИЯ НА ФУНКЦИЯ ПО МЕТОД НА НАЙ-МАЛКО

КВАДРАТ


1. Целта на работата

2. Насоки

2.2 Постановка на проблема

2.3 Метод за избор на апроксимираща функция

2.4 Обща техника на решение

2.5 Техника за решаване на нормални уравнения

2.7 Метод за изчисляване на обратната матрица

3. Ръчна сметка

3.1 Изходни данни

3.2 Система от нормални уравнения

3.3 Решаване на системи по метода на обратната матрица

4. Схема на алгоритмите

5. Програмен текст

6. Резултати от машинното изчисление

1. Целта на работата

Тази курсова работа е заключителен раздел на дисциплината "Изчислителна математика и програмиране" и изисква от студента да реши следните задачи в процеса на нейното изпълнение:

а) практическо разработване на типични изчислителни методи на приложната информатика; б) подобряване на уменията за разработване на алгоритми и изграждане на програми на език от високо ниво.

Практическото изпълнение на курсовата работа включва решаване на типични инженерни задачи за обработка на данни с помощта на методите на матричната алгебра, решаване на системи от линейни алгебрични уравнения на числено интегриране. Уменията, придобити в процеса на завършване на курсовата работа, са в основата на използването на изчислителните методи на приложната математика и техниките за програмиране в процеса на изучаване на всички следващи дисциплини в курса и дипломните проекти.

2. Насоки

2.2 Постановка на проблема

При изучаването на зависимостите между величините важна задача е приблизителното представяне (приближаване) на тези зависимости с помощта на известни функции или техните комбинации, избрани по подходящ начин. Подходът към такъв проблем и конкретният метод за решаването му се определят от избора на използвания критерий за качество на приближението и формата на представяне на изходните данни.

2.3 Метод за избор на апроксимираща функция

Апроксимиращата функция се избира от определено семейство функции, за които е дадена формата на функцията, но нейните параметри остават недефинирани (и трябва да бъдат определени), т.е.

Дефинирането на апроксимиращата функция φ е разделено на два основни етапа:

Избор на подходящ тип функция;

Намиране на неговите параметри в съответствие с критерия на най-малките квадрати.

Изборът на типа функция е сложен проблем, решаван чрез пробни и последователни приближения. Първоначалните данни, представени в графична форма (семейства от точки или криви), се сравняват със семейство от графики на редица типични функции, които обикновено се използват за целите на приближението. Някои видове функции, използвани в курсовата работа, са показани в таблица 1.

По-подробна информация за поведението на функциите, които могат да се използват при апроксимационни задачи, може да се намери в справочната литература. В повечето задачи от курсовата работа се дава видът на апроксимиращата функция.

2.4 Обща техника на решение

След като е избран типът на апроксимиращата функция (или тази функция е зададена) и следователно е определена функционалната зависимост (1), е необходимо да се намерят стойностите на параметрите C 1, C 2, ... , C m в съответствие с изискванията на LSM. Както вече беше споменато, параметрите трябва да бъдат определени по такъв начин, че стойността на критерия във всяка от разглежданите задачи да е най-малка в сравнение със стойността му за други възможни стойности на параметрите.

За да решим проблема, заместваме израз (1) в съответния израз и извършваме необходимите операции на сумиране или интегриране (в зависимост от вида на I). В резултат на това стойността I, наричана по-долу критерий за приближение, е представена чрез функция на желаните параметри

Следното се свежда до намиране на минимума на тази функция от променливи С k ; определяне на стойности C k =C k * , k=1,m, съответстващи на този елемент I, и е целта на решаваната задача.


Типове функции Таблица 1

Тип функция Име на функцията
Y=C 1 +C 2 x Линеен
Y \u003d C 1 + C 2 x + C 3 x 2 Квадратичен (параболичен)
Y= Рационално (полином от n-та степен)
Y=C1 +C2 обратно порпорционален
Y=C1 +C2 Мощност фракционна рационална
Y= Дробно-рационален (от първа степен)
Y=C 1 +C 2 X C3 Мощност
Y=C 1 +C 2 a C3 x Демонстрация
Y=C 1 +C 2 log a x логаритмичен
Y \u003d C 1 + C 2 X n (0 Ирационален, алгебричен
Y=C 1 sinx+C 2 cosx Тригонометрични функции (и техните обратни)

Възможни са следните два подхода за решаване на този проблем: използване на известните условия за минимум на функция от няколко променливи или директно намиране на минималната точка на функцията чрез някой от числените методи.

За да реализираме първия от тези подходи, използваме необходимото минимално условие за функцията (1) на няколко променливи, според което частните производни на тази функция по отношение на всички нейни аргументи трябва да бъдат равни на нула в минималната точка

Получените m равенства трябва да се разглеждат като система от уравнения по отношение на търсените С 1 , С 2 ,…, С m . За произволна форма на функционална зависимост (1) уравнение (3) се оказва нелинейно по отношение на стойностите на C k и тяхното решение изисква използването на приблизителни числени методи.

Използването на равенството (3) дава само необходими, но недостатъчни условия за минимума (2). Следователно е необходимо да се изясни дали намерените стойности C k * осигуряват точно минимума на функцията . В общия случай такова усъвършенстване е извън обхвата на тази курсова работа и задачите, предложени за курсовата работа, са избрани така, че намереното решение на система (3) да съответства точно на минималното I. Въпреки това, тъй като стойността на I е неотрицателен (като сбор от квадрати) и долната му граница е 0 (I=0), тогава ако има уникално решение на система (3), то съответства точно на минимума на I.

Когато апроксимиращата функция е представена чрез общия израз (1), съответните нормални уравнения (3) се оказват нелинейни по отношение на желаното C c. Решението им може да бъде свързано със значителни трудности. В такива случаи е за предпочитане директно да търсите минимума на функцията в диапазона от възможни стойности на неговите аргументи C k, които не са свързани с използването на отношения (3). Общата идея на такова търсене е да се променят стойностите на аргументите C до и да се изчислява на всяка стъпка съответната стойност на функцията I до минимума или достатъчно близо до него.

2.5 Техника за решаване на нормални уравнения

Един от възможните начини за минимизиране на апроксимационния критерий (2) включва решаването на системата от нормални уравнения (3). Когато линейна функция на желаните параметри е избрана като апроксимираща функция, нормалните уравнения са система от линейни алгебрични уравнения.

Система от n линейни уравнения от общ вид:

(4) може да се запише с помощта на матрична нотация в следната форма: A X=B,

; ; (5)

квадратна матрица A се нарича системна матрица, и съответно векторите X и B колонен вектор на неизвестни системии колонен вектор на неговите безплатни членове .

В матрична форма оригиналната система от n линейни уравнения също може да бъде написана както следва:

Решението на система от линейни уравнения се свежда до намиране на стойностите на елементите на колонния вектор (x i), наречени корени на системата. За да има уникално решение тази система, нейното n уравнение трябва да бъде линейно независимо. Необходимо и достатъчно условие за това е детерминантата на системата да не е равна на нула, т.е. ∆=detA≠0.

Алгоритъмът за решаване на система от линейни уравнения се разделя на директен и итеративен. На практика нито един метод не може да бъде безкраен. За да се получи точно решение, итеративните методи изискват безкраен брой аритметични операции. на практика това число трябва да се приеме като крайно и следователно решението по принцип има известна грешка, дори ако пренебрегнем грешките при закръгляване, които придружават повечето изчисления. Що се отнася до директните методи, те дори и с краен брой операции могат по принцип да дадат точно решение, ако то съществува.

Преките и крайните методи позволяват да се намери решение на система от уравнения в краен брой стъпки. Това решение ще бъде точно, ако всички изчислителни интервали се извършват с ограничена точност.

2.7 Метод за изчисляване на обратната матрица

Един от методите за решаване на системата от линейни уравнения (4), която записваме в матричния вид A·X=B, е свързан с използването на обратната матрица A -1 . В този случай решението на системата от уравнения се получава във формата

където A -1 е матрица, дефинирана по следния начин.

Нека A е n x n квадратна матрица с ненулева детерминанта detA≠0. Тогава има обратна матрица R=A -1, дефинирана от условието A R=E,

където Е е единична матрица, всички елементи на главния диагонал на която са равни на I, а елементите извън този диагонал са -0, Е=, където Е i е колонен вектор. Матрица K е квадратна матрица с размер n x n.

където Rj е колонен вектор.

Разгледайте неговата първа колона R=(r 11 , r 21 ,…, r n 1) T , където T означава транспониране. Лесно се проверява, че произведението A·R е равно на първата колона E 1 =(1, 0, ..., 0) T на единичната матрица E, т.е. векторът R 1 може да се разглежда като решение на системата от линейни уравнения A R 1 =E 1. По същия начин m -тата колона на матрицата R , Rm, 1≤ m ≤ n, е решение на уравнението A Rm =Em, където Em=(0, …, 1, 0) T m е колоната на единичната матрица Е.

Така обратната матрица R е набор от решения на n системи от линейни уравнения

A Rm=Em , 1≤ m ≤ n.

За решаването на тези системи могат да се прилагат всякакви методи, разработени за решаване на алгебрични уравнения. Въпреки това, методът на Гаус позволява да се решат всички тези n системи едновременно, но независимо една от друга. Всъщност всички тези системи от уравнения се различават само в дясната страна и всички трансформации, които се извършват в процеса на директния ход на метода на Гаус, са напълно определени от елементите на матрицата на коефициентите (матрица А). Следователно в схемите на алгоритмите подлежат на промяна само блоковете, свързани с трансформацията на вектора B. В нашия случай едновременно ще бъдат трансформирани n вектора Em, 1 ≤ m ≤ n. Резултатът от решението също ще бъде не един вектор, а n вектора Rm, 1≤ m ≤ n.

3. Ръчна сметка

3.1 Изходни данни

Xi 0,3 0,5 0,7 0,9 1,1
Yi 1,2 0,7 0,3 -0,3 -1,4

3.2 Система от нормални уравнения

3.3 Решаване на системи по метода на обратната матрица

апроксимация квадратна функция линейно уравнение

5 3,5 2,6 0,5 5 3,5 2,6 0,5

3,5 2,85 2,43 -0,89 0 0,4 0,61 -1,24

2,56 2,43 2,44 -1,86 0 0,638 1,109 -2,116

0 0,4 0,61 -1,24

0 0 0,136 -0,138

Резултати от изчислението:

C1 =1.71; С2 = -1.552; С 3 \u003d -1,015;

Функция за приближение:

4 . Програмен текст

маса=масив от реални;

маса1=масив от реални;

маса2=масив от реални;

X, Y, E, y1, делта: маса;

big,r,sum,temp,maxD,Q:real;

i,j,k,l,num: байт;

ProcedureVOD(var E: маса);

За i:=1 до 5 направи

Функция FI(i ,k: цяло число): реално;

ако i=1 тогава FI:=1;

ако i=2 тогава FI:=Sin(x[k]);

if i=3 тогава FI:=Cos(x[k]);

Процедура PEREST(i:integer;var a:mass1;var b:mass2);

за l:= i до 3 do

ако abs(a) > голям тогава

голям:=a; writeln(голям:6:4);

writeln("Пермутиращи уравнения");

ако номер<>аз тогава

за j:=i до 3 направи

a:=a;

writeln("Въведете X стойности");

writeln("__________________");

writeln("‚Въведете Y стойности");

writeln("___________________");

За i:=1 до 3 направете

За j:=1 до 3 направете

За k:=1 до 5 направете

начало A:= A+FI(i,k)*FI(j,k); запис (a:7:5); край;

writeln("__________________________");

writeln("Матрица на коефициентаAi,j");

За i:=1 до 3 направете

За j:=1 до 3 направете

write(A:5:2, " ");

За i:=1 до 3 направете

За j:=1 до 5 направете

B[i]:=B[i]+Y[j]*FI(i,j);

writeln("____________________");

writeln('Матрица на коефициента Bi ");

За i:=1 до 3 направете

write(B[i]:5:2, " ");

за i:=1 до 2 направи

за k:=i+1 до 3 do

Q:=a/a; writeln("g=",Q);

за j:=i+1 до 3 направете

a:=a-Q*a; writeln("a=",a);

b[k]:=b[k]-Q*b[i]; writeln("b=",b[k]);

x1[n]:=b[n]/a;

за i:=2 downto 1 do

за j:=i+1 до 3 направете

сума:=сума-a*x1[j];

x1[i]:=сума/a;

writeln("____________________");

writeln("стойност на коефициентите");

writeln("__________________________");

за i:=1 до 3 направи

writeln("C",i,"=",x1[i]);

за i:=1 до 5 направи

y1[i]:= x1[k]*FI(k,i) + x1*FI(k+1,i) + x1*FI(k+2,i);

делта[i]:=abs(y[i]-y1[i]);

writeln(y1[i]);

за i:=1 до 3 направи

запис(x1[i]:7:3);

за i:=1 до 5 направи

if delta[i]>maxD then maxD:=delta;

writeln("max Delta= ", maxD:5:3);

5 . Резултати от машинното изчисление

C 1 \u003d 1,511; С2 = -1.237; С3 = -1.11;

Заключение

В процеса на завършване на курсовата си работа практически усвоих типичните изчислителни методи на приложната математика, подобрих уменията си в разработването на алгоритми и изграждането на програми на езици от високо ниво. Получени умения, които са в основата на използването на изчислителни методи на приложната математика и техники за програмиране в процеса на изучаване на всички следващи дисциплини в курса и дипломните проекти.

Апроксимацията на експериментални данни е метод, основан на замяната на експериментално получени данни с аналитична функция, която най-близо преминава или съвпада в възловите точки с първоначалните стойности (данни, получени по време на експеримента или експеримента). Понастоящем има два начина за дефиниране на аналитична функция:

Чрез конструиране на интерполационен полином от n степен, който преминава директно през всички точкидаден масив от данни. В този случай апроксимиращата функция се представя като: интерполационен полином във формата на Лагранж или интерполационен полином във формата на Нютон.

Чрез конструиране на апроксимиращ полином от n-степен, който преминава близо до точкиот дадения масив от данни. По този начин апроксимиращата функция изглажда всички произволни шумове (или грешки), които могат да възникнат по време на експеримента: измерените стойности по време на експеримента зависят от случайни фактори, които се колебаят според собствените си случайни закони (измерване или грешки на инструмента, неточност или експериментални грешки). В този случай апроксимиращата функция се определя по метода на най-малките квадрати.

Метод на най-малките квадрати(в англоезичната литература Ordinary Least Squares, OLS) е математически метод, базиран на дефинирането на апроксимираща функция, която се изгражда в най-близка близост до точки от даден масив от експериментални данни. Близостта на началната и апроксимиращата функция F(x) се определя чрез числена мярка, а именно: сумата от квадратите на отклоненията на експерименталните данни от апроксимиращата крива F(x) трябва да бъде най-малка.

Фитингова крива, конструирана по метода на най-малките квадрати

Използва се методът на най-малките квадрати:

За решаване на свръхопределени системи от уравнения, когато броят на уравненията надвишава броя на неизвестните;

Да се ​​търси решение в случай на обикновени (не свръхопределени) нелинейни системи от уравнения;

За приближаване на точкови стойности чрез някаква апроксимираща функция.

Апроксимиращата функция по метода на най-малките квадрати се определя от условието за минималната сума на квадратите на отклоненията на изчислената апроксимираща функция от даден масив от експериментални данни. Този критерий на метода на най-малките квадрати се записва като следния израз:

Стойности на изчислената апроксимираща функция в възлови точки,

Определен масив от експериментални данни в възлови точки.

Квадратният критерий има редица „добри“ свойства, като например диференцируемост, предоставяйки уникално решение на проблема с приближението с полиномни апроксимиращи функции.

В зависимост от условията на задачата, апроксимиращата функция е полином от степен m

Степента на апроксимиращата функция не зависи от броя на възловите точки, но нейният размер винаги трябва да бъде по-малък от размерността (броя точки) на дадения масив от експериментални данни.

∙ Ако степента на апроксимиращата функция е m=1, тогава апроксимираме табличната функция с права линия (линейна регресия).

∙ Ако степента на апроксимиращата функция е m=2, тогава апроксимираме табличната функция с квадратна парабола (квадратично приближение).

∙ Ако степента на апроксимиращата функция е m=3, тогава апроксимираме табличната функция с кубична парабола (кубична апроксимация).

В общия случай, когато се изисква да се построи апроксимиращ полином от степен m за дадени таблични стойности, условието за минималната сума на квадратите на отклонения по всички възлови точки се пренаписва в следната форма:

- неизвестни коефициенти на апроксимиращия полином от степен m;

Броят на зададените стойности на таблицата.

Необходимо условие за съществуването на минимум на функция е равенството на нула на нейните частни производни по отношение на неизвестни променливи . В резултат на това получаваме следната система от уравнения:

Нека трансформираме получената линейна система от уравнения: отворете скобите и преместете свободните членове в дясната страна на израза. В резултат на това получената система от линейни алгебрични изрази ще бъде записана в следната форма:

Тази система от линейни алгебрични изрази може да бъде пренаписана в матрична форма:

В резултат на това се получава система от линейни уравнения с размерност m + 1, която се състои от m + 1 неизвестни. Тази система може да бъде решена с помощта на всеки метод за решаване на линейни алгебрични уравнения (например методът на Гаус). В резултат на решението ще бъдат намерени неизвестни параметри на апроксимиращата функция, които осигуряват минималната сума на квадратите на отклоненията на апроксимиращата функция от оригиналните данни, т.е. най-доброто възможно квадратично приближение. Трябва да се помни, че ако дори една стойност на първоначалните данни се промени, всички коефициенти ще променят своите стойности, тъй като те са напълно определени от първоначалните данни.

Апроксимация на изходни данни чрез линейна зависимост

(линейна регресия)

Като пример, разгледайте метода за определяне на апроксимиращата функция, който е даден като линейна зависимост. В съответствие с метода на най-малките квадрати условието за минималната сума на квадратите на отклоненията се записва, както следва:

Координати на възлови точки на таблицата;

Неизвестни коефициенти на апроксимиращата функция, която е дадена като линейна зависимост.

Необходимо условие за съществуването на минимум на функция е равенството на нула на нейните частни производни по отношение на неизвестни променливи. В резултат на това получаваме следната система от уравнения:

Нека трансформираме получената линейна система от уравнения.

Решаваме получената система от линейни уравнения. Коефициентите на апроксимиращата функция в аналитичната форма се определят, както следва (метод на Крамер):

Тези коефициенти осигуряват изграждането на линейна апроксимираща функция в съответствие с критерия за минимизиране на сумата от квадратите на апроксимиращата функция от дадените таблични стойности (експериментални данни).

Алгоритъм за прилагане на метода на най-малките квадрати

1. Изходни данни:

Даден е масив от експериментални данни с брой измервания N

Дадена е степента на апроксимиращия полином (m).

2. Алгоритъм за изчисление:

2.1. Определят се коефициенти за построяване на система от уравнения с размерност

Коефициенти на системата от уравнения (лявата страна на уравнението)

- индекс на номера на колоната на квадратната матрица на системата от уравнения

Свободни членове на системата от линейни уравнения (дясната страна на уравнението)

- индекс на номера на реда на квадратната матрица на системата от уравнения

2.2. Образуване на система от линейни уравнения с размерност .

2.3. Решение на система от линейни уравнения за определяне на неизвестните коефициенти на апроксимиращия полином от степен m.

2.4 Определяне на сумата от квадратните отклонения на апроксимиращия полином от първоначалните стойности по всички възлови точки

Намерената стойност на сумата от квадратите на отклоненията е минималната възможна.

Апроксимация с други функции

Трябва да се отбележи, че при приближаване на първоначалните данни в съответствие с метода на най-малките квадрати, понякога се използват логаритмична функция, експоненциална функция и степенна функция като апроксимираща функция.

Логично приближение

Разгледайте случая, когато апроксимиращата функция е дадена от логаритмична функция от формата:

Апроксимация (от латински "приблизително" - "приближаване") - приблизително изразяване на всякакви математически обекти (например числа или функции) чрез други по-прости, по-удобни за използване или просто по-известни. В научните изследвания апроксимацията се използва за описване, анализиране, обобщаване и по-нататъшно използване на емпирични резултати.

Както е известно, може да има точна (функционална) връзка между стойностите, когато една конкретна стойност съответства на една стойност на аргумента.

При избора на приближение трябва да се изхожда от конкретната задача на изследването. Обикновено колкото по-просто е уравнението, използвано за апроксимация, толкова по-приближено е полученото описание на зависимостта. Ето защо е важно да се прочете колко значими и какво е причинило отклоненията на конкретни стойности от резултантната тенденция. Когато се описва зависимостта на емпирично определени стойности, може да се постигне много по-голяма точност, като се използва някое по-сложно, многопараметрично уравнение. Въпреки това, няма смисъл да се опитвате да предадете случайни отклонения на стойностите в конкретни серии от емпирични данни с максимална точност. При избора на метод на приближение изследователят винаги прави компромис: той решава доколко в този случай е целесъобразно и уместно да се „пожертват“ детайлите и съответно колко обобщено трябва да се изрази зависимостта на сравняваните променливи. Наред с разкриването на модели на емпирични данни, маскирани от случайни отклонения от общия модел, апроксимацията също така позволява решаването на много други важни проблеми: формализиране на намерената зависимост; намиране на неизвестни стойности на зависимата променлива чрез интерполация или, ако е приложимо, екстраполация.

Целта на тази курсова работа е да се изучат теоретичните основи на апроксимацията на таблична функция чрез метода на най-малките квадрати и, като се използват теоретичните знания, намирането на апроксимиращи полиноми. Намирането на апроксимиращи полиноми в рамките на тази курсова работа следва чрез написване на програма в Pascal, която прилага разработения алгоритъм за намиране на коефициентите на апроксимиращия полином, а също така решава същата задача с помощта на MathCad.

В тази курсова работа програмата Pascal е разработена в PascalABC shell версия 1.0 beta. Решението на проблема в средата на MathCad е извършено в Mathcad версия 14.0.0.163.

Формулиране на проблема

В тази курсова работа трябва да направите следното:

1. Разработете алгоритъм за намиране на коефициентите на три апроксимиращи полинома (полиноми) от формата

за табличната функция y=f(x):

за степента на полиномите n=2, 4, 5.

2. Постройте блокова схема на алгоритъма.

3. Създайте програма на Паскал, която реализира разработения алгоритъм.

5. Построете графики на 3 получени апроксимиращи функции в една координатна система. Графиката трябва да съдържа и началните точки. аз , y i ) .

6. Решете задачата с помощта на MathCAD.

Резултатите от решаването на задачата с помощта на създадената програма на езика Pascal и в средата на MathCAD трябва да бъдат представени под формата на три полинома, конструирани с помощта на намерените коефициенти; таблица, съдържаща стойностите на функцията, получена с помощта на намерените полиноми в точки xi и стандартни отклонения.

Построяване на емпирични формули по метода на най-малките квадрати

Много често, особено при анализиране на емпирични данни, става необходимо изрично да се намери функционалната връзка между стойностите x и y, които се получават в резултат на измерванията.

При аналитично изследване на връзката между две величини x и y се правят поредица от наблюдения и резултатът е таблица със стойности:

х ¼ ¼
г ¼ ¼

Тази таблица обикновено се получава в резултат на някои експерименти, в които

Споделете с приятели или запазете за себе си:

Зареждане...