Намерете матрицата на двойните коефициенти на корелация. Коефициент на корелация на двойки в Excel

Фактори, които са колинеарни...

И колинеарно.

4. В модела множествена регресиядетерминантата на матрицата на сдвоените коефициенти на корелация между факторите и е близо до нула. Това означава, че фактори и ... мултиколинеарност на факторите.

5. За иконометричния модел линейно уравнениемножествена регресия от типа, беше конструирана матрица от сдвоени коефициенти линейна корелация (г- зависима променлива; x (1),x (2), x (3), x (4)- независими променливи):


Колинеарни (тясно свързани) независими (обяснителни) променливи не саx(2)И x (3)

1. Таблица с изходни данни за построяване на иконометрия регресионен модел:

Фиктивни променливи не са

работен опит

производителност на труда

2. При изследване на зависимостта на консумацията на месо от нивото на доходите и пола на потребителя можем да препоръчаме...

използвайте фиктивна променлива – пол на потребителя

разделят населението на две: за потребители жени и потребители мъже

3. Изследваме зависимостта на цената на апартамент ( при) от жилищната й зона ( х) и тип къща. Моделът включва фиктивни променливи, отразяващи видовете разглеждани къщи: монолитни, панелни, тухлени. Получено е регресионното уравнение: ,
Където ,
Конкретните регресионни уравнения за тухла и монолит са ...

за къща тип тухла

за тип къща монолитен

4. При анализиране индустриални предприятияв три региона (Република Марий Ел, Република Чувашия, Република Татарстан) са конструирани три частични регресионни уравнения:

за Република Марий Ел;

за Република Чувашия;

за Република Татарстан.

Посочете вида на фиктивните променливи и уравнението с фиктивни променливи, което обобщава трите частични регресионни уравнения.

5. В иконометрията обикновено се разглежда фиктивна променлива...

променлива, която приема стойности 0 и 1

описване по количествен начин на качествена характеристика

1. За регресионния модел на зависимостта на средния паричен доход на глава от населението (RUB, при) от обема на брутния регионален продукт (хиляди рубли, х 1) и процент на безработица в субекта (%, х 2) се получава уравнението. Стойността на регресионния коефициент за променливата х 2показва, че когато нивото на безработица се промени с 1%, средният паричен доход на глава от населението е ______ рубли при постоянна стойност на брутния регионален продукт.

ще се промени на (-1,67)

2. В уравнението на линейната множествена регресия: , където е цената на дълготрайните активи (хиляда рубли); – брой служители (хиляди души); г– обем на промишленото производство (хиляди рубли) параметър с променлива х 1, равен на 10,8, означава, че с увеличаване на обема на дълготрайните активи с _____, обемът на промишленото производство _____ с постоянен брой служители.


за 1 хиляди рубли. ... ще се увеличи с 10,8 хиляди рубли.

3. Известно е, че делът на остатъчната вариация на зависимата променлива в нейния обща дисперсияравно на 0,2. Тогава стойността на коефициента на детерминация е ... 0,8

4. Конструиран е иконометричен модел за зависимостта на печалбата отпродажби на единица продукция (руб., при) от размера на оборотния капитал на предприятието (хиляди рубли, х 1): . Следователно средната печалба от продажби, която не зависи от обема на оборотния капитал на предприятието, е _____ рубли. 10.75

5. F-статистиката се изчислява като съотношението на ______ дисперсия към ________ дисперсия, изчислено за степен на свобода. факториел...остатък

1. За модел на иконометрично регресионно уравнение, грешката на модела се определя като ______ между действителната стойност на зависимата променлива и нейната прогнозна стойност. Разлика

2. Количеството се нарича...случаен компонент

3. В иконометричния модел на регресионното уравнение отклонението на действителната стойност на зависимата променлива от нейната изчислена стойност характеризира ... грешката на модела

4. Известно е, че делът на обяснената дисперсия в общата дисперсия е 0,2. Тогава стойността на коефициента на детерминация е ... 0,2

5. С метод най-малки квадратипараметри на уравнение на двойка линейна регресия се определят от условието ______ салда.минимизиране на сумата от квадрати

1. За да откриете автокорелация в остатъците, използвайте...

Статистика на Дърбин-Уотсън

2. Известно е, че автокорелационният коефициент на остатъци от първи редравно на –0,3. Също така са дадени критичните стойности на статистиката на Дърбин-Уотсън за даден брой параметри с неизвестен брой наблюдения, . Въз основа на тези характеристики можем да заключим, че...няма автокорелация на остатъците

1. Изчислете матрицата на двойните корелационни коефициенти; анализирайте близостта и посоката на връзката на получената характеристика Yс всеки фактор х; оценка статистическа значимосткоефициенти на корелация r(Y,х i); изберете най-информативния фактор.

2. Конструиране на сдвоен регресионен модел с най-информативен фактор; дават икономическа интерпретация на регресионния коефициент.

3. Оценете качеството на модела, като използвате средната относителна грешка на приближението, коефициента на детерминация и F теста на Fisher (приемете ниво на значимост α=0,05).

4. С доверителна вероятност γ=80% прогнозирайте средната стойност на показателя Y(прогнозните стойности на факторите са дадени в Приложение 6). Представете графично действителните и моделните стойности Y, резултати от прогнози.

5. Използвайки метода на включване, изградете двуфакторни модели, като запазите най-информативния фактор в тях; изградете трифакторен модел с пълен списък от фактори.

6. Изберете най-добрия от конструираните множество модели. Дайте икономическа интерпретация на неговите коефициенти.

7. Проверете значимостта на коефициентите на множествена регресия, като използвате T– Тест на Студент (приема се ниво на значимост α=0,05). Качеството подобри ли се? множествен моделв сравнение с парна баня?

8. Оценете влиянието на факторите върху резултата, като използвате коефициенти на еластичност, бета и делта коефициенти.

Задача 2. Моделиране на едномерен динамичен ред

Приложение 7 показва времеви редове Y(t)социално-икономически показатели за Алтайски крайза периода от 2000 до 2011 г. Необходимо е да се проучи динамиката на показателя, съответстващ на варианта на задачата.

опция Обозначение, наименование, мерна единица на показателя
Y1 Средни потребителски разходи на глава от населението (на месец), rub.
Y2 Емисии на замърсители в атмосферния въздух, хиляди тона
Y3 Средните цени на вторичния пазар на жилища (в края на годината, за квадратен метъробща площ), търкайте
Y4 Обем на платени услуги на глава от населението, rub
Y5 Средногодишен брой на заетите в икономиката, хил. души
Y6 Брой собствени леки автомобили на 1000 души от населението (в края на годината), ед
Y7 Среден паричен доход на глава от населението (на месец), руб.
Y8 Индекс на потребителските цени (декември спрямо декември предходната година), %
Y9 Инвестиции в дълготрайни активи (в действителни цени), милиона рубли
Y10 Оборот на дребнона глава от населението (по действителни цени), rub


Работен ред

1. Конструирайте линеен модел на времеви редове, чиито параметри могат да бъдат оценени чрез най-малки квадрати. Обяснете значението на регресионния коефициент.

2. Оценете адекватността на изградения модел, като използвате свойствата на случайност, независимост и съответствие на остатъчния компонент нормален законразпределения.

3. Оценете точността на модела въз основа на използването на средната относителна грешка на приближението.

4. Прогнозирайте разглеждания индикатор за една година предварително (изчислете прогнозния интервал при вероятност за доверие 70%).

5. Представете графично действителните стойности на показателя, резултатите от моделирането и прогнозирането.

6. Изчислете параметрите на логаритмични, полиномни (полиномни от 2-ра степен), степенни, експоненциални и хиперболични трендове. Базиран графично изображениеи стойностите на индекса на решимостта да изберете най-много подходящ видтенденция.

7. Използвайки най-добрия нелинеен модел, направете точкова прогноза на въпросния индикатор за следващата година. Сравнете получения резултат с доверителния прогнозен интервал, конструиран с помощта на линеен модел.

ПРИМЕР

Екзекуции тестова работа

Проблем 1

Фирмата се занимава с продажба на употребявани автомобили. Имената на индикаторите и изходните данни за иконометрично моделиране са представени в таблицата:

Продажна цена, хил.е. ( Y) Цена на нов автомобил, хил.е. ( X1) Срок на експлоатация, години ( X2) Ляв волан - 1, десен волан - 0, ( X3)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Задължително:

1. Изчислете матрицата на двойните корелационни коефициенти; анализира близостта и посоката на връзката между резултантната характеристика Y и всеки от факторите X; оценка на статистическата значимост на корелационните коефициенти r(Y, X i); изберете най-информативния фактор.

Използваме Excel (данни / анализ на данни / КОРЕЛАЦИЯ):

Получаваме матрица от коефициенти на двойна корелация между всички налични променливи:

U X1 X2 X3
U
X1 0,910987
X2 -0,4156 -0,2603
X3 0,190785 0,221927 -0,30308

Нека анализираме коефициентите на корелация между получената характеристика Yи всеки от факторите х j:

> 0, следователно между променливите YИ х 1 има пряка зависимост: колкото по-висока е цената на нов автомобил, толкова по-висока е продажната цена.

> 0,7 – тази зависимост е близка.

< 0, значит, между переменными YИ х 2 наблюдавани

обратна корелация: продажната цена е по-ниска за автомобилите

мобилни телефони с дълъг живот.

– тази зависимост е умерена, по-близка до слаба.

> 0, което означава между променливи YИ х 3 има пряка зависимост: продажната цена е по-висока за автомобили с ляв волан.

< 0,4 – эта зависимость слабая.

За проверка на значимостта на намерените коефициенти на корелация използваме теста на Стюдънт.

За всеки коефициент на корелация нека изчислим T-статистика по формулата и въведете резултатите от изчислението в допълнителна колона на корелационната таблица:

U X1 X2 X3 t-статистика
U
X1 0,910987 7,651524603
X2 -0,4156 -0,2603 1,582847988
X3 0,190785 0,221927 -0,30308 0,673265587

Според таблицата критични точкиРазпределение на учениците на ниво на значимост и броя на степените на свобода, определяме критичната стойност (Приложение 1 или функцията STUDARSOBR).Y и експлоатационния живот х 2 е надежден.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Yи положение на волана х 3 е надежден.

Така най-тясна и значима връзка се наблюдава между продажната цена Yи цената на нов автомобил х 1 ; фактор х 1 е най-информативен.

Матрица от двойни коефициенти на корелация

Y X1 X2 X3 X4 X5
Y
X1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
X4 0,667343 0,924333 0,70069 0,299583
X5 0,709204 0,940488 0,691809 0,326602 0,992945

Възлите на матрицата съдържат сдвоени корелационни коефициенти, които характеризират тясната връзка между факторните характеристики. Анализирайки тези коефициенти, отбелязваме, че колкото по-голяма е тяхната абсолютна стойност, толкова по-голямо е влиянието на съответната факторна характеристика върху резултатната. Анализът на получената матрица се извършва на два етапа:

1. Ако в първата колона на матрицата има коефициенти на корелация, за които /r /< 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Анализирайки сдвоените коефициенти на корелация на факторните характеристики помежду си, (r XiXj), характеризиращи близостта на тяхната връзка, е необходимо да се оцени тяхната независимост един от друг, тъй като това е необходимо условие за по-нататъшен регресионен анализ. С оглед на факта, че в икономиката няма абсолютно независими характеристики, е необходимо да се подчертаят, ако е възможно, най-независимите. Факторните характеристики, които са тясно свързани помежду си, се наричат ​​мултиколинеарни. Включването на мултиколинеарни характеристики в модела прави невъзможно икономическото тълкуване на регресионния модел, тъй като промяната в един фактор води до промяна в свързаните с него фактори, което може да доведе до „разпадане“ на модела като цяло.

Критерият за многостранно обезпечение на факторите е следният:

/r XiXj / > 0,8

В получената матрица от сдвоени коефициенти на корелация този критерий се изпълнява от два индикатора, разположени в пресечната точка на редовете И . От всяка двойка от тези характеристики една трябва да бъде оставена в модела; тя трябва да има по-голямо влияние върху резултантната характеристика. В резултат на това факторите и се изключват от модела, т.е. темпът на нарастване на себестойността на продадените стоки и темпът на нарастване на обема на продажбите му.

И така, въвеждаме фактори X1 и X2 в регресионния модел.

След това се извършва регресионен анализ (услуга, анализ на данни, регресия). Отново се съставя таблица с първоначални данни с фактори X1 и X2. Регресията като цяло се използва за анализиране на въздействието върху отделна зависима променлива на стойностите на независими променливи (фактори) и позволява корелацията между характеристиките да бъде представена под формата на някаква функционална зависимост, наречена регресионно уравнение или корелационна регресия модел.

В резултат на регресионния анализ получаваме резултатите от изчисляването на многовариантна регресия. Нека анализираме получените резултати.

Всички коефициенти на регресия са значими според t теста на Student. Коефициент множествена корелация R е 0,925, квадратът на тази стойност (коефициент на определяне) означава, че средно 85,5% от вариацията в ефективната характеристика се обяснява с вариацията във факторните характеристики, включени в модела. Коефициентът на детерминизъм характеризира тясната връзка между набора от факторни характеристики и ефективния показател. Колкото по-близо е стойността на R-квадрат до 1, толкова по-силна е връзката. В нашия случай показател, равен на 0,855, показва правилния подбор на факторите и наличието на връзка между факторите и ефективния показател.

Разглежданият модел е адекватен, тъй като изчислената стойност на F-теста на Фишер значително надвишава табличната му стойност (F obs =52,401; F tab =1,53).

Общият резултат от корелационния и регресионен анализ е множествено уравнениерегресия, която изглежда така:

Полученото регресионно уравнение отговаря на целите на корелационно-регресионния анализ и представлява линеен модел на зависимостта на балансовата печалба на предприятието от два фактора: коефициент на растеж на производителността на труда и коефициент на индустриална собственост.

Въз основа на получения модел можем да заключим, че при повишаване на нивото на производителност на труда с 1% спрямо нивото от предходния период, размерът на балансовата печалба ще се увеличи с 0,95 процентни пункта; увеличение на коефициента на индустриална собственост с 1% ще доведе до увеличение показател за ефективностс 27.9 p.p. Следователно доминиращото влияние върху растежа на балансовата печалба се оказва от увеличението на стойността на имуществото за производствени цели (обновяване и растеж на дълготрайните активи на предприятието).

Използвайки модел на множествена регресия, се извършва многофакторна прогноза на ефективната характеристика. Нека се знае, че X1 = 3.0 и X3 = 0.7. Нека заместим стойностите на факторните характеристики в модела, получаваме Control = 0.95*3.0 + 27.9*0.7 – 19.4 = 2.98. По този начин, с увеличаване на производителността на труда и модернизация на дълготрайните активи в предприятието, балансовата печалба през 1-во тримесечие на 2005 г. в сравнение с предходния период (IV тримесечие на 2004 г.) ще се увеличи с 2,98%.

Първоначално в модела привключват всички основни компоненти (изчислените стойности са посочени в скоби T-критерии):

Качеството на модела се характеризира с: многократен коефициент на детерминация r = 0,517, средна относителна грешка на приближението = 10,4%, остатъчна дисперсия s 2= 1,79 и Енаблюдаем = 121. Поради факта, че Е obs > Е kr =2,85 при α = 0,05, v 1 = 6, v 2= 14, уравнението на регресията е значимо и поне един от регресионните коефициенти - β 1, β 2, β 3, β 4 - не е равен на нула.

Ако значимостта на регресионното уравнение (хипотеза H 0:β 1 = β 2 = β 3 = β 4 = 0 беше проверено при α = 0,05, тогава значимостта на регресионните коефициенти, т.е. хипотези H0: β й = 0 (j = 1, 2, 3, 4), трябва да бъдат тествани при ниво на значимост, по-голямо от 0,05, например при α = 0,1. Тогава при α = 0,1, v= 14 магнитуд Tкр = 1,76, а значими, както следва от уравнение (53.41), са регресионните коефициенти β 1, β 2, β 3.

Като се има предвид, че основните компоненти не са свързани помежду си, можем веднага да елиминираме всички незначителни коефициенти от уравнението и уравнението ще приеме формата

(53.42)

Сравнявайки уравнения (53.41) и (53.42), виждаме, че изключвайки незначителните главни компоненти е 4И е 5, не повлия на стойностите на коефициентите на уравнението b 0 = 9,52, b 1 = 0,93, b 2 = 0,66 и съответно t j (й = 0, 1, 2, 3).

Това се дължи на некорелирания характер на основните компоненти. Интересен тук е паралелът на регресионните уравнения за изходните показатели (53.22), (53.23) и главните компоненти (53.41), (53.42).

Уравнение (53.42) е важно, защото Е obs = 194 > Екр = 3.01, намерено при α = 0.05, v 1 = 4, v 2= 16. Коефициентите на уравнението също са значими, тъй като t j > tкр . = 1,746, съответстващо на α = 0,01, v= 16 за й= 0, 1, 2, 3. Коефициент на определяне r= 0,486 показва, че 48,6% от вариацията припоради влиянието на първите три основни компонента.

Уравнение (53.42) се характеризира със средна относителна грешка на приближение = 9,99% и остатъчна дисперсия s 2 = 1,91.

Регресионното уравнение на основните компоненти (53.42) има малко по-добри апроксимиращи свойства в сравнение с регресионния модел (53.23) въз основа на първоначалните показатели: r= 0,486 > r= 0,469; = 9,99% < (х) = 10,5% и s 2 (f) = 1,91 < s 2 (x) = 1,97. Освен това в уравнение (53.42) основните компоненти са линейни функциивсички първоначални индикатори, докато уравнение (53.23) включва само две променливи ( х 1И х 4). В редица случаи е необходимо да се вземе предвид, че моделът (53.42) е труден за тълкуване, тъй като включва трети главен компонент е 3, които не сме интерпретирали и чийто принос в общата дисперсия на изходните показатели ( х 1, ..., x 5)е само 8,6%. Въпреки това, изключение е 3от уравнение (53.42) значително влошава апроксимационните свойства на модела: r= 0,349; = 12,4% и s 2(f) = 2,41. Тогава е препоръчително да изберете уравнение (53.23) като регресионен модел на добива.

Клъстерен анализ

IN статистически изследваниягрупирането на първични данни е основната техника за решение проблеми с класификацията,и следователно основа за цялата по-нататъшна работа със събраната информация.

Традиционно този проблем се решава по следния начин. От многото характеристики, които описват даден обект, се избира една, най-информативната от гледна точка на изследователя, и данните се групират в съответствие със стойностите на тази характеристика. Ако е необходимо да се извърши класификация въз основа на няколко критерия, подредени помежду си по степен на важност, първо класификацията се извършва според първата характеристика, след което всеки от получените класове се разделя на подкласове според втората характеристика. и т.н. Повечето комбинирани статистически групи са изградени по подобен начин.

В случаите, когато не е възможно да се организират класификационни характеристики, се използва най-простият метод за многоизмерно групиране - създаването на интегрален показател (индекс), функционално зависим от първоначалните характеристики, последвано от класификация по този показател.

Развитие на този подход е опция за класификация, базирана на няколко общи показателя (основни компоненти), получени чрез методите на факторен или компонентен анализ.

Ако има няколко характеристики (първоначални или обобщени), проблемът с класификацията може да бъде решен чрез методи за клъстерен анализ, които се различават от другите многомерни методи за класификация по липсата на обучителни проби, т.е. априорна информация за разпределението на населението.

Разликите между схемите за решаване на класификационен проблем до голяма степен се определят от това, което се разбира под понятията „сходство“ и „степен на сходство“.

След като целта на работата е формулирана, естествено е да се опитаме да определим критерии за качество, обективна функция, чиито стойности ще позволят да се сравнят различни класификационни схеми.

В икономическите изследвания целева функция, като правило, трябва да минимизира някакъв параметър, определен за набор от обекти (например, целта на класифицирането на оборудването може да бъде групиране, което минимизира общите разходи за време и пари за ремонтни работи).

В случаите, когато не е възможно да се формализира целта на задачата, критерият за качество на класификацията може да бъде възможността за съдържателна интерпретация на откритите групи.

Нека разгледаме следния проблем. Нека наборът се изучава Побекти, всеки от които се характеризира кизмерени знаци. Необходимо е тази съвкупност да се раздели на групи (класове), които са хомогенни в известен смисъл. В същото време практически няма априорна информация за характера на разпространението к-дименсионален вектор хвътре в класове.

Групите, получени в резултат на разделянето, обикновено се наричат ​​клъстери* (таксони**, изображения), методите за намирането им се наричат ​​клъстерен анализ (съответно числена таксономия или разпознаване на образи със самообучение).

* Клъстер(английски) - група от елементи, характеризиращи се с някакво общо свойство.

**Тахоп(английски) - систематична група от всяка категория.

От самото начало е необходимо ясно да се разбере кой от двата класификационни проблема трябва да бъде решен. Ако обичайният проблем с въвеждането се решава, тогава наборът от наблюдения се разделя на сравнително малък брой области за групиране (например интервал вариационна серияв случай на едномерни наблюдения), така че елементите на един такъв регион да са възможно най-близо един до друг.

Решението на друг проблем е да се определи естествената стратификация на резултатите от наблюденията в ясно дефинирани клъстери, разположени на определено разстояние един от друг.

Ако първият типизиращ проблем винаги има решение, то във втория случай може да се окаже, че наборът от наблюдения не разкрива естествено разслояване на клъстери, т.е. образува един клъстер.

Въпреки че много методи за клъстерен анализ са доста елементарни, по-голямата част от работата, в която са предложени, се отнася последното десетилетие. Това се обяснява с факта, че ефективното решение на проблемите с търсенето на клъстери изисква голямо числоаритметичните и логически операции стават възможни едва с появата и развитието на компютърните технологии.

Обичайната форма за представяне на първоначалните данни в проблемите на клъстерния анализ е матрица

всеки ред от които представлява резултатите от измерването кразглежданите признаци в един от изследваните обекти. В специфични ситуации както групирането на обекти, така и групирането на характеристики може да представлява интерес. В случаите, когато разликата между тези две задачи не е значителна, например, когато описваме някои алгоритми, ще използваме само термина „обект“, включително термина „функция“ в това понятие.

Матрица хне е единственият начин за представяне на данни в проблемите на клъстерния анализ. Понякога първоначалната информация се дава под формата на квадратна матрица

елемент r ijкоето определя степента на близост аз-ти обект на й-му.

Повечето алгоритми за клъстерен анализ са изцяло базирани на матрица от разстояния (или близост) или изискват изчисляване на нейните отделни елементи, така че ако данните са представени във формата Х,тогава първият етап от решаването на проблема с търсенето на клъстери ще бъде изборът на метод за изчисляване на разстояния или близост между обекти или характеристики.

Въпросът за определяне на близостта между характеристиките е малко по-лесен за решаване. Като правило клъстерният анализ на признаците преследва същите цели като факторния анализ: идентифициране на групи от свързани характеристики, които отразяват определен аспект на изследваните обекти. Мярката за близост в този случай са различни статистически коефициенти на връзка.


Свързана информация.


1. КОНСТРУИРАЙТЕ МАТРИЦА ОТ СВЪРЗАНИ КОРЕЛАЦИОННИ КОЕФИЦИЕНТИ.

За да направим това, изчисляваме коефициентите на корелация на двойката, като използваме формулата:

Необходимите изчисления са представени в таблица 9.

-

връзката между приходите на предприятието Y и размера на капиталовите инвестиции X 1 е слаба и пряка;

-

практически няма връзка между приходите на предприятието Y и дълготрайните производствени активи X 2;

-

връзката между обема на капиталните вложения Х 1 и ДМА Х 2 е тясна и пряка;

Таблица 9

Помощна таблица за изчисляване на коефициентите на корелация по двойки

T Y X1 X2

(y-ysr)*
(x1-x1sr)

(y-ysr)*
(x2-x2sr)

(x1-x1sr)*
(x2-x2sr)

1998 3,0 1,1 0,4 0,0196 0,0484 0,0841 0,0308 0,0406 0,0638
1999 2,9 1,1 0,4 0,0576 0,0484 0,0841 0,0528 0,0696 0,0638
2000 3,0 1,2 0,7 0,0196 0,0144 1E-04 0,0168 -0,0014 -0,0012
2001 3,1 1,4 0,9 0,0016 0,0064 0,0441 -0,0032 -0,0084 0,0168
2002 3,2 1,4 0,9 0,0036 0,0064 0,0441 0,0048 0,0126 0,0168
2003 2,8 1,4 0,8 0,1156 0,0064 0,0121 -0,0272 -0,0374 0,0088
2004 2,9 1,3 0,8 0,0576 0,0004 0,0121 0,0048 -0,0264 -0,0022
2005 3,4 1,6 1,1 0,0676 0,0784 0,1681 0,0728 0,1066 0,1148
2006 3,5 1,3 0,4 0,1296 0,0004 0,0841 -0,0072 -0,1044 0,0058
2007 3,6 1,4 0,5 0,2116 0,0064 0,0361 0,0368 -0,0874 -0,0152
Σ 31,4 13,2 6,9 0,684 0,216 0,569 0,182 -0,036 0,272
ср. 3,14 1,32 0,69

Също така, матрицата на коефициентите на двойна корелация може да бъде намерена в Excel средас помощта на добавката АНАЛИЗ НА ДАННИ, инструмента КОРЕЛАЦИЯ.

Матрицата на двойните коефициенти на корелация има формата:

Y X1 X2
Y 1
X1 0,4735 1
X2 -0,0577 0,7759 1

Матрицата на сдвоените коефициенти на корелация показва, че ефективният атрибут y (приход) има слаба връзка с обема на капиталовите инвестиции x 1 и практически няма връзка с размера на общия фонд. Връзката между факторите в модела се оценява като тясна, което показва тяхната линейна зависимост, мултиколинеарност.

2. ИЗГРАДЕТЕ ЛИНЕЕН МНОЖЕСТВЕН РЕГРЕСИОНЕН МОДЕЛ

Ще намерим параметрите на модела с помощта на най-малките квадрати. За да направите това, нека създадем система нормални уравнения.

Изчисленията са представени в таблица 10.

Нека решим системата от уравнения по метода на Крамер:

Таблица 10

Спомагателни изчисления за намиране на параметри на линеен модел на множествена регресия

г
3,0 1,1 0,4 1,21 0,44 0,16 3,3 1,2
2,9 1,1 0,4 1,21 0,44 0,16 3,19 1,16
3,0 1,2 0,7 1,44 0,84 0,49 3,6 2,1
3,1 1,4 0,9 1,96 1,26 0,81 4,34 2,79
3,2 1,4 0,9 1,96 1,26 0,81 4,48 2,88
2,8 1,4 0,8 1,96 1,12 0,64 3,92 2,24
2,9 1,3 0,8 1,69 1,04 0,64 3,77 2,32
3,4 1,6 1,1 2,56 1,76 1,21 5,44 3,74
3,5 1,3 0,4 1,69 0,52 0,16 4,55 1,4
3,6 1,4 0,5 1,96 0,7 0,25 5,04 1,8
31,4 13,2 6,9 17,64 9,38 5,33 41,63 21,63

Моделът на линейната множествена регресия има формата:

Ако обемът на капиталовите инвестиции се увеличи с 1 милион рубли, тогава приходите на компанията ще се увеличат средно с 2,317 милиона рубли. с постоянни размери на осн производствени активи.

Ако дълготрайните производствени активи се увеличат с 1 милион рубли, тогава приходите на предприятието ще намалеят средно с 1,171 милиона рубли. с постоянен размер на капиталовложенията.

3. ИЗЧИСЛЯВАМЕ:

коефициент на детерминация:

67,82% от изменението на приходите на предприятието се дължи на промени в обема на капиталните инвестиции и дълготрайните производствени активи, а 32,18% се дължи на влиянието на фактори, които не са включени в модела.

F – Критерий на Фишер

Нека проверим значението на уравнението

Таблични стойности на F теста при ниво на значимост α = 0,05 и броя на степените на свобода d.f. 1 = k = 2 (брой фактори), брой степени на свобода d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 ще бъде 4,74.

Тъй като F изчислено = 7,375 > раздел F. = 4,74, тогава регресионното уравнение като цяло може да се счита за статистически значимо.

Изчислените показатели могат да бъдат намерени в средата на Excel с помощта на добавката DATA ANALYSIS, инструмента REGRESSION.


Таблица 11

Спомагателни изчисления за намиране на средната относителна грешка на приближението

г А
3,0 1,1 0,4 2,97 0,03 0,010
2,9 1,1 0,4 2,97 -0,07 0,024
3,0 1,2 0,7 2,85 0,15 0,050
3,1 1,4 0,9 3,08 0,02 0,007
3,2 1,4 0,9 3,08 0,12 0,038
2,8 1,4 0,8 3,20 -0,40 0,142
2,9 1,3 0,8 2,96 -0,06 0,022
3,4 1,6 1,1 3,31 0,09 0,027
3,5 1,3 0,4 3,43 0,07 0,019
3,6 1,4 0,5 3,55 0,05 0,014
0,353

средно аритметично относителна грешкаприближения

Средно изчислените стойности се различават от реалните с 3,53%. Грешката е малка, моделът може да се счита за точен.

4. Конструирайте степенен модел на множествена регресия

За да изградим този модел, нека вземем логаритми от двете страни на равенството

log y = log a + β 1 ∙ log x 1 + β 2 ∙ log x 2 .

Нека направим замяната Y = log y, A = log a, X 1 = log x 1, X 2 = log x 2.

Тогава Y = A + β 1 ∙ X 1 + β 2 ∙ X 2 – линеен двуфакторен регресионен модел. Можете да използвате OLS.

Изчисленията са представени в таблица 12.

Таблица 12

Спомагателни изчисления за намиране на параметрите на модел на степенна множествена регресия

г lg y
3,0 1,1 0,4 0,041 -0,398 0,477 0,002 -0,016 0,020 0,158 -0,190
2,9 1,1 0,4 0,041 -0,398 0,462 0,002 -0,016 0,019 0,158 -0,184
3,0 1,2 0,7 0,079 -0,155 0,477 0,006 -0,012 0,038 0,024 -0,074
3,1 1,4 0,9 0,146 -0,046 0,491 0,021 -0,007 0,072 0,002 -0,022
3,2 1,4 0,9 0,146 -0,046 0,505 0,021 -0,007 0,074 0,002 -0,023
2,8 1,4 0,8 0,146 -0,097 0,447 0,021 -0,014 0,065 0,009 -0,043
2,9 1,3 0,8 0,114 -0,097 0,462 0,013 -0,011 0,053 0,009 -0,045
3,4 1,6 1,1 0,204 0,041 0,531 0,042 0,008 0,108 0,002 0,022
3,5 1,3 0,4 0,114 -0,398 0,544 0,013 -0,045 0,062 0,158 -0,217
3,6 1,4 0,5 0,146 -0,301 0,556 0,021 -0,044 0,081 0,091 -0,167
31,4 13,2 6,9 1,178 -1,894 4,955 0,163 -0,165 0,592 0,614 -0,943

Решаваме системата от уравнения по метода на Крамер.

Моделът на степенна множествена регресия има формата:

IN степенна функциякоефициентите на факторите са коефициенти на еластичност. Коефициентът на еластичност показва с какъв процент ще се промени средната стойност на ефективната характеристика y, ако един от факторите се увеличи с 1%, докато стойностите на други фактори остават непроменени.

Ако обемът на капиталовите инвестиции се увеличи с 1%, тогава приходите на предприятието ще се увеличат средно с 0,897% при същия размер на дълготрайните производствени активи.

Ако дълготрайните производствени активи се увеличат с 1%, тогава приходите на компанията ще намалеят с 0,226% при постоянни капиталови инвестиции.

5. НИЕ ИЗЧИСЛЯВАМЕ:

коефициент на множествена корелация:

Връзката между приходите на предприятието и обема на капиталовложенията и дълготрайните производствени активи е тясна.

Таблица 13

Спомагателни изчисления за намиране на коефициент на множествена корелация, коефициент на детерминация, средна относителна грешка на апроксимация на степенния модел на множествена регресия

Y

(Y-Y калк.) 2

А
3,0 1,1 0,4 2,978 0,000 0,020 0,007
2,9 1,1 0,4 2,978 0,006 0,058 0,027
3,0 1,2 0,7 2,838 0,026 0,020 0,054
3,1 1,4 0,9 3,079 0,000 0,002 0,007
3,2 1,4 0,9 3,079 0,015 0,004 0,038
2,8 1,4 0,8 3,162 0,131 0,116 0,129
2,9 1,3 0,8 2,959 0,003 0,058 0,020
3,4 1,6 1,1 3,317 0,007 0,068 0,024
3,5 1,3 0,4 3,460 0,002 0,130 0,012
3,6 1,4 0,5 3,516 0,007 0,212 0,023
31,4 13,2 6,9 0,198 0,684 0,342

коефициент на детерминация:

71,06% от промяната в приходите на предприятието в енергийния модел се дължи на промени в обема на капиталовите инвестиции и дълготрайните производствени активи, а 28,94% се дължи на влиянието на фактори, които не са включени в модела.

F – Критерий на Фишер

Нека проверим значението на уравнението

Таблични стойности на F теста при ниво на значимост α = 0,05 и броя на степените на свобода d.f. 1 = k = 2, брой степени на свобода d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 ще бъде 4,74.

Тъй като F изчислено = 8,592 > раздел F. = 4,74, тогава уравнението на степенна регресия като цяло може да се счита за статистически значимо.

Кацането е невъзможно, в кой от възможните случаи разходът на гориво е по-малък. Получаване на оптимална програма за управление, когато до определен момент t1 няма управление u*=0, а от t=t1 управлението е равно на максималната му стойност u*=umax, което съответства на минималния разход на гориво. 6.) Решете каноничната система от уравнения, като я разгледате за случаите, когато управлението...

Към съставянето на математически модели. Ако математическият модел е диагноза на заболяване, то алгоритъмът е метод за лечение. Могат да се разграничат следните основни етапи на оперативното изследване: наблюдение на явлението и събиране на изходни данни; формулиране на проблема; изграждане на математически модел; изчисляване на модела; тестване на модела и анализ на изходните данни. Ако получените резултати не са задоволителни...

Математически конструкциипо аналогия с, той разкрива в равнинно приближение надлъжна скаларна електромагнитна вълна с електрически (28) и магнитни (29) синфазни компоненти. Математически моделиротационната електродинамика се характеризира със скаларно-векторната структура на своите уравнения. Основните уравнения на иротационната електродинамика са обобщени в таблица 1. Таблица 1, ...

Споделете с приятели или запазете за себе си:

Зареждане...