Значение на регресионното уравнение като цяло. Оценка на значимостта на регресионното уравнение като цяло и неговите параметри


Оценката на статистическата значимост на параметрите и уравнението като цяло е задължителна процедура, която ви позволява да направите принос относно възможността за използване на изграденото уравнение на връзката за вземане на управленски решения и прогнозиране.

Оценката на статистическата значимост на регресионното уравнение се извършва с помощта на F-критерия на Fisher, който е отношението на факторните и остатъчните дисперсии, изчислени за една степен на свобода.

Факторната вариация е обяснената част от вариацията на чертата-резултат, т.е. поради вариацията на онези фактори, които са включени в анализа (в уравнението):

където k е броят на факторите в регресионното уравнение (броят на степените на свобода на факторната дисперсия); - средната стойност на зависимата променлива; - теоретична (изчислена чрез регресионното уравнение) стойност на зависимата променлива за i-тата единица от съвкупността.

Остатъчната вариация е необяснимата част от вариацията в даден резултат, т.е. поради вариация в други фактори, които не са включени в анализа.

= , (71)

където - действителната стойност на зависимата променлива y i - та единица от съвкупността; n-k-1 е броят на степените на свобода на остатъчната дисперсия; n е обемът на населението.

Сумата от факторните и остатъчните дисперсии, както е отбелязано по-горе, е обща дисперсиярезултат-знак.

F-тестът на Фишер се изчислява по следната формула:

F-тестът на Фишер - стойност, която отразява съотношението на обяснените и необяснимите дисперсии, ви позволява да отговорите на въпроса: факторите, включени в анализа, обясняват ли статистически значима част от вариацията на резултата от чертата. F-тестът на Fisher е представен в таблица (входът към таблицата е броят на степените на свобода на фактора и остатъчните дисперсии). Ако , тогава регресионното уравнение се признава за статистически значимо и съответно коефициентът на детерминация е статистически значим. В противен случай уравнението не е статистически значимо, т.е. не обяснява значителна част от вариацията на признака-резултат.

Оценката на статистическата значимост на параметрите на уравнението се извършва на базата на t-статистика, която се изчислява като съотношението на модула на параметрите на регресионното уравнение към техните стандартни грешки ( ):

, където ; (73)

, където . (74)

Във всяка статистическа програма изчисляването на параметрите винаги е придружено от изчисляване на техните стандартни (средни квадратни) грешки и t-статистики. Параметърът се признава за статистически значим, ако действителната стойност на t-статистиката е по-голяма от табличната.

Оценката на параметри, базирана на t-статистика, по същество е проверка на нулевата хипотеза за равенството на общите параметри на нула (H 0: =0; H 0: =0;), тоест за незначимостта на параметрите на регресионното уравнение. Ниво на значимост на приемане на нулеви хипотези = 1-0,95=0,05 (0,95 е нивото на вероятност, като правило, зададено в икономическите изчисления). Ако изчисленото ниво на значимост е по-малко от 0,05, тогава нулевата хипотеза се отхвърля и се приема алтернативната - за статистическата значимост на параметъра.

Чрез оценка на статистическата значимост на регресионното уравнение и неговите параметри можем да получим различна комбинация от резултати.

· Уравнението чрез F-тест е статистически значимо и всички параметри на уравнението чрез t-статистиката също са статистически значими. Това уравнение може да се използва както за вземане на управленски решения (кои фактори трябва да бъдат повлияни, за да се получи желаният резултат), така и за прогнозиране на поведението на резултатния атрибут за определени стойности на факторите.

· Според F-критерия уравнението е статистически значимо, но някои параметри на уравнението са незначими. Уравнението може да се използва за вземане на управленски решения (относно тези фактори, за които е потвърдена статистическата значимост на тяхното влияние), но уравнението не може да се използва за прогнозиране.

· Уравнението на F-теста не е статистически значимо. Уравнението не може да се използва. Трябва да се продължи търсенето на значими признаци-фактори или аналитична форма на връзката между аргументи и отговор.

Ако се потвърди статистическа значимостуравнение и неговите параметри, тогава може да се приложи така наречената точкова прогноза, т.е. вероятната стойност на атрибута-резултат (y) се изчислява за определени стойности на факторите (x). Съвсем очевидно е, че прогнозираната стойност на зависимата променлива няма да съвпадне с нейната действителна стойност. Това е свързано преди всичко със самата същност на корелационната зависимост. В същото време резултатът се влияе от много фактори, от които само част могат да бъдат взети предвид в уравнението на връзката. В допълнение, формата на връзката между резултата и факторите (вида на регресионното уравнение) може да бъде неправилно избрана. Винаги има разлика между действителните стойности на атрибута-резултат и неговите теоретични (прогнозни) стойности ( ). Графично тази ситуация се изразява във факта, че не всички точки от корелационното поле лежат на линията на регресия. Само при функционална връзка регресионната линия ще премине през всички точки на корелационното поле. Разликата между действителните и теоретичните стойности на получения атрибут се нарича отклонения или грешки, или остатъци. Въз основа на тези стойности се изчислява остатъчната дисперсия, която е оценка на средната квадратична грешка на регресионното уравнение. Стойността на стандартната грешка се използва за изчисляване доверителни интервалипрогнозната стойност на атрибута-резултат (Y).

След намиране на уравнението линейна регресия, се оценява значимостта както на уравнението като цяло, така и на неговите отделни параметри.

Оценката на значимостта на регресионното уравнение като цяло се дава с помощта на F-теста на Фишер. В този случай се излага нулевата хипотеза, коефициентът на регресия е нула, т.е. b = 0 и следователно факторът x не влияе на резултата y. Директното изчисляване на F-критерия се предшества от анализ на дисперсията. Централно местоположениеизисква разлагане обща сумаквадратни отклонения на променливата y от средната стойност на y на две части - "обяснени" и "необяснени" (Приложение 2).

Общата сума на квадратните отклонения на отделните стойности на резултантния атрибут y от средната стойност y се дължи на влиянието на много причини. Условно целият набор от причини може да бъде разделен на две групи:

  • изследвания фактор x
  • други фактори

Ако факторът не влияе на резултата, тогава регресионната линия на графиката е успоредна на оста x y = y. Тогава цялата дисперсия на резултантния атрибут се дължи на влиянието на други фактори и общата сума на квадратите на отклоненията съвпада с остатъка. Ако други фактори не влияят на резултата, тогава y е функционално свързано с x и остатъчната сума на квадратите е нула. В този случай сумата от квадратните отклонения, обяснена от регресията, е същата като общата сума от квадратите.

Тъй като не всички точки от корелационното поле лежат на линията на регресия, винаги има разсейване както поради влиянието на фактора x, тоест регресията на y върху x, така и причинено от действието на други величини (необяснима вариация ). Пригодността на регресионната линия за прогнозиране зависи от това каква част от общата вариация на признака y се дължи на обяснената вариация. Очевидно е, че ако сумата на квадратите на отклоненията, дължащи се на регресията, е по-голяма от остатъчната сума на квадратите, тогава уравнението на регресията е статистически значимо и факторът x има значително влияние върху резултата y. Това е еквивалентно на факта, че коефициентът на определяне r 2 xy ще се доближи до единица.

Всяка сума от квадратни отклонения се свързва с броя на степените на свобода (df - степени на свобода), т.е. с броя на свободата на независимо изменение на характеристиката. Броят на степените на свобода е свързан с броя на единиците от съвкупността n и броя на константите, определени от него. Във връзка с разглеждания проблем, броят на степените на свобода трябва да покаже колко независими отклонения от n възможни [(y 1 -y), (y 2 -y), ..., (y n -y)] са необходими за образуване на даден сбор от квадрати. И така, общата сума на квадратите? (y-y) 2 изисква (n-1) независими отклонения.

При изчисляване на обяснената или факторна сума от квадрати? (y x -y) 2 се използват теоретичните (изчислени) стойности на ефективната характеристика y x, намиращи се по линията на регресия: y x ​​\u003d a + b * х.

При линейна регресия сумата от квадратните отклонения, дължащи се на линейна регресия, ще бъде: ?(y x -y) 2 =b 2 *?(x -x) 2 .

Тъй като за даден брой наблюдения в x и y факторната сума от квадрати при линейна регресия зависи само от една константа на регресионния коефициент b, тогава тази сума от квадрати има една степен на свобода. Ще стигнем до същото заключение, ако разгледаме съдържателната страна на изчислената стойност на атрибута y, тоест y x . Стойността на y x се определя от уравнението на линейната регресия: y x ​​​​=a+b*x. Параметърът a може да се дефинира като: a=y-b*x. Замествайки израза за параметъра a в линейния модел, получаваме:

y x \u003d y-b * x + b * x \u003d y-b * (x-x).

Това показва, че за даден набор от променливи y и x, изчислената стойност y x при линейна регресия е функция само на един параметър - коефициента на регресия. Съответно факторната сума на квадратните отклонения има брой степени на свобода, равен на 1.

Съществува равенство между броя на степените на свобода на общите, факторните и остатъчните суми от квадрати. Броят на степените на свобода на остатъчната сума на квадратите при линейна регресия е n-2. Броят на степените на свобода за общата сума на квадратите се определя от броя на единиците и тъй като се използва средната стойност, изчислена от примерните данни, губим една степен на свобода, тоест df total = n-1.

Така че има две равенства:

? (y-y) 2 \u003d? (y x -y) 2 +? (y- y x) 2,

Разделяйки всяка сума от квадрати на броя на съответстващите й степени на свобода, получаваме средния квадрат на отклоненията или, еквивалентно, дисперсията за една степен на свобода D.

D общо \u003d? (y-y) 2 / (n-1);

D факт \u003d? (y x -y) 2/1;

D почивка \u003d? (y- y x) 2 / (n-1).

Определянето на дисперсията за една степен на свобода води дисперсиите до сравнима форма. Сравнявайки факторните и остатъчните дисперсии за една степен на свобода, получаваме стойността на F-отношението (F-критерий):

F= D факт / D почивка, където

F - критерий за проверка на нулевата хипотеза H 0: D факт =D почивка.

Ако нулевата хипотеза е вярна, тогава факториелът и остатъчна дисперсияне се различават един от друг. За H 0 е необходимо опровержение, така че факторната вариация да надвишава остатъчната няколко пъти.

Английският статистик Snedecor разработи таблици на критичните стойности на F-съотношенията за различни нивазначението на нулевата хипотеза и различим брой степени на свобода.

Табличната стойност на F-критерия е максималната стойност на съотношението на дисперсии, което може да възникне, ако те се разминават произволно за дадено нивовероятността да има нулева хипотеза.

Изчислената стойност на F-отношението се признава за надеждна (различна от единица), ако е по-голяма от табличната.

В този случай нулевата хипотеза за липсата на връзка между знаци се отхвърля и се прави заключение за значимостта на тази връзка: F факт> F раздел. H 0 се отхвърля.

Ако стойността е по-малка от табличния F факт

Качеството на модела се оценява чрез коефициента на детерминация. Коефициент на определяне ( Р 2) е квадратът на коефициента на множествена корелация.

Той показва каква част от дисперсията на резултантния атрибут се обяснява с влиянието на независими променливи.

Формулата за изчисляване на коефициента на детерминация:

г аз-- примерни данни и f аз-- съответстващи стойности на модела.

Това също е квадратът на корелацията на Пиърсън между двете променливи. Той изразява количеството дисперсия, споделена между две променливи.

Коефициентът приема стойности от интервала. Колкото по-близо е стойността до 1, толкова по-близо е моделът до емпиричните наблюдения.

В случай на сдвоен линеен регресионен модел, коефициентът на определяне е равен на квадрата на корелационния коефициент, т.е. Р 2 = r 2 .

Понякога показателите за близост на връзката могат да получат качествена оценка (скала на Chaddock) (Приложение 3).

Функционална връзка възниква при стойност, равна на 1, а липсата на връзка е 0. При стойности на показателите за плътност на връзката по-малки от 0,7, стойността на коефициента на определяне винаги ще бъде под 50 %. Това означава, че делът на вариацията във факторните характеристики представлява по-малка част в сравнение с други фактори, които не са взети предвид в модела, които влияят върху промяната на ефективния показател. Конструираните при такива условия регресионни модели са с ниска практическа стойност.

След като регресионното уравнение е конструирано и неговата точност е оценена с помощта на коефициента на детерминация, въпросът остава открит поради какво е постигната тази точност и съответно дали може да се вярва на това уравнение. Факт е, че регресионното уравнение е изградено не върху генералната съвкупност, която е неизвестна, а върху извадка от нея. Точките от генералната съвкупност попадат в извадката на случаен принцип, следователно, в съответствие с теорията на вероятността, наред с други случаи е възможно извадката от „широката“ генерална съвкупност да се окаже „тясна“ (фиг. 15) .

Ориз. 15. Възможен вариант на хит точки в извадката от генералната съвкупност.

В такъв случай:

а) регресионното уравнение, изградено върху извадката, може да се различава значително от регресионното уравнение за генералната съвкупност, което ще доведе до прогнозни грешки;

б) коефициентът на детерминация и други характеристики на точност ще бъдат неоправдано високи и ще подведат относно предсказуемите качества на уравнението.

В ограничаващия случай не е изключен вариантът, когато от генералната съвкупност, която е облак с главна ос, успоредна на хоризонталната ос (няма връзка между променливите), ще се получи извадка поради случаен подбор, чиято главна ос ще бъде наклонена спрямо оста. По този начин опитите да се предскажат следващите стойности на генералната съвкупност въз основа на извадкови данни от нея са изпълнени не само с грешки в оценката на силата и посоката на връзката между зависимите и независимите променливи, но и с опасността от намиране на връзка между променливи, където всъщност няма такава.

При липса на информация за всички точки от генералната съвкупност, единственият начин да се намалят грешките в първия случай е да се използва метод за оценка на коефициентите на регресионното уравнение, който гарантира тяхната безпристрастност и ефективност. И вероятността за възникване на втория случай може да бъде значително намалена поради факта, че едно свойство на генералната съвкупност с две променливи, независими една от друга, е известно a priori - именно тази връзка отсъства в него. Това намаление се постига чрез проверка статистическа значимостполученото регресионно уравнение.

Една от най-често използваните опции за проверка е следната. За полученото регресионно уравнение се определя
-статистика
- характеристика на точността на регресионното уравнение, което е съотношението на тази част от дисперсията на зависимата променлива, която се обяснява от регресионното уравнение към необяснената (остатъчна) част от дисперсията. Уравнение за определяне
- статистиката в случай на многомерна регресия има формата:

където:
- обяснена дисперсия - част от дисперсията на зависимата променлива Y, която се обяснява от регресионното уравнение;

-остатъчна дисперсия- част от дисперсията на зависимата променлива Y, която не се обяснява с уравнението на регресията, нейното присъствие е следствие от действието на случаен компонент;

- брой точки в извадката;

- брой променливи в регресионното уравнение.

Както може да се види от горната формула, дисперсиите се определят като частното от разделянето на съответната сума от квадрати на броя на степените на свобода. Брой степени на свободатова е минималният необходим брой стойности на зависимата променлива, които са достатъчни за получаване на желаната характеристика на пробата и които могат свободно да варират, като се има предвид, че за тази проба всички други количества, използвани за изчисляване на желаната характеристика, са известни.

За да се получи остатъчната дисперсия, са необходими коефициентите на регресионното уравнение. В случай на сдвоена линейна регресия има два коефициента, следователно, в съответствие с формулата (приемайки, че
) броят на степените на свобода е
. Това означава, че за определяне на остатъчната дисперсия е достатъчно да се знаят коефициентите на регресионното уравнение и само
стойности на зависимата променлива от извадката. Останалите две стойности могат да бъдат изчислени от тези данни и следователно не са свободно променливи.

За да се изчисли обяснената дисперсия, стойностите на зависимата променлива изобщо не са необходими, тъй като тя може да бъде изчислена чрез познаване на коефициентите на регресия за независимите променливи и дисперсията на независимата променлива. За да видите това, достатъчно е да си припомните дадения по-рано израз
. Следователно броят на степените на свобода за остатъчната дисперсия е равен на броя на независимите променливи в регресионното уравнение (за сдвоена линейна регресия
).

Като резултат
-критерият за уравнението на сдвоената линейна регресия се определя по формулата:

.

Теорията на вероятностите го доказва
-критерият на регресионното уравнение, получен за извадка от генералната съвкупност, в която няма връзка между зависимата и независимата променлива, има разпределението на Фишер, което е доста добре проучено. Поради това, за всяка стойност
-критерии, можете да изчислите вероятността за възникването му и обратно, да определите стойността
-критерии, които той не може да надхвърли с дадена вероятност.

За да извършим статистическа проверка на значимостта на регресионното уравнение, ние формулираме нулева хипотезаотносно липсата на връзка между променливите (всички коефициенти за променливите са равни на нула) и е избрано ниво на значимост .

Ниво на значимосте приемливата вероятност за извършване въведете една грешка- Отхвърлете правилната нулева хипотеза в резултат на тестване. В този случай да се допусне грешка от тип I означава да се разпознае от извадката наличието на връзка между променливите в генералната съвкупност, когато всъщност тя не съществува.

Нивото на значимост обикновено се приема за 5% или 1%. Колкото по-високо е нивото на значимост (толкова по-малко
), толкова по-висока ниво на надеждносттест равен на
, т.е. толкова по-голям е шансът да се избегне извадковата грешка за съществуването на връзка в съвкупността от променливи, които всъщност не са свързани. Но тъй като нивото на значимост се увеличава, рискът от обвързване грешки тип II– отхвърлете правилната нулева хипотеза, т.е. да не забележите в извадката действителната връзка на променливите в генералната съвкупност. Следователно, в зависимост от това коя грешка има големи негативни последици, се избира едно или друго ниво на значимост.

За избраното ниво на значимост според разпределението на Фишер се определя таблична стойност
вероятността за превишаване на която в извадката по мощност , получена от генералната съвкупност без връзка между променливите, не надвишава нивото на значимост.
в сравнение с действителната стойност на критерия за регресионното уравнение .

Ако условието е изпълнено
, след това грешното откриване на връзка със стойността
-критерии равни или по-големи за извадка от генералната съвкупност с несвързани променливи ще се случи с вероятност, по-малка от нивото на значимост. В съответствие с правилото „не се случват много редки събития“ стигаме до извода, че връзката между променливите, установени от извадката, присъства и в генералната съвкупност, от която е получена.

Ако се окаже
, тогава регресионното уравнение не е статистически значимо. С други думи, съществува реална вероятност в извадката да е установена връзка между променливи, която в действителност не съществува. Уравнение, което не отговаря на теста за статистическа значимост, се третира по същия начин като лекарство с изтекъл срок на годност - такива лекарства не са непременно развалени, но тъй като няма сигурност за тяхното качество, те се предпочитат да не се използват. Това правило не предпазва от всички грешки, но ви позволява да избегнете най-грубите, което също е много важно.

Втората опция за проверка, по-удобна в случай на използване на електронни таблици, е сравнение на вероятността за поява на получената стойност
-критерии с ниво на значимост. Ако тази вероятност е под нивото на значимост
, тогава уравнението е статистически значимо, в противен случай не.

След като се провери статистическата значимост на регресионното уравнение, обикновено е полезно, особено за многовариантни зависимости, да се провери статистическата значимост на получените регресионни коефициенти. Идеологията на проверката е същата като при проверката на уравнението като цяло, но като критерий, -Критерий на ученика, определя се по формулите:

и

където: , - стойности на критерия на Стюдънт за коефициентите и съответно;

- остатъчна дисперсия на регресионното уравнение;

- брой точки в извадката;

- брой променливи в извадката, за сдвоена линейна регресия
.

Получените действителни стойности на критерия на Стюдънт се сравняват с табличните стойности
получени от разпределението на Стюдънт. Ако се окаже че
, тогава съответният коефициент е статистически значим, в противен случай не е. Вторият вариант за проверка на статистическата значимост на коефициентите е да се определи вероятността за поява на критерия на Стюдънт
и сравнете с нивото на значимост
.

Променливи, чиито коефициенти не са статистически значими, е вероятно изобщо да нямат ефект върху зависимата променлива в популацията. Следователно или е необходимо да се увеличи броят на точките в извадката, тогава е възможно коефициентът да стане статистически значим и в същото време да се уточни стойността му, или като независими променливи да се намерят други, които са по-близки свързани със зависимата променлива. В този случай точността на прогнозата ще се увеличи и в двата случая.

Като експресен метод за оценка на значимостта на коефициентите на регресионното уравнение може да се използва следното правило - ако критерият на Стюдънт е по-голям от 3, то такъв коефициент по правило се оказва статистически значим. Като цяло се смята, че за да се получат статистически значими регресионни уравнения, е необходимо условието
.

Стандартна грешка на прогнозиране чрез полученото регресионно уравнение с неизвестна стойност
с известен
оценява се по формулата:

По този начин прогноза с ниво на доверие от 68% може да бъде представена като:

Ако се изисква друго ниво на увереност
, след това за нивото на значимост
необходимо е да се намери критерият на Стюдънт
и доверителен интервалза прогноза с ниво на надеждност
ще бъде равно на
.

Прогноза на многомерни и нелинейни зависимости

Ако прогнозираната стойност зависи от няколко независими променливи, тогава в този случай има многовариантна регресияТип:

където:
- регресионни коефициенти, описващи влиянието на променливите
по предвидената стойност.

Методологията за определяне на коефициентите на регресия не се различава от двойната линейна регресия, особено когато се използва електронна таблица, тъй като същата функция се използва там както за двойна, така и за многовариантна линейна регресия. В този случай е желателно да няма връзки между независимите променливи, т.е. промяната на една променлива не повлия на стойностите на други променливи. Но това изискване не е задължително, важно е да няма функционални линейни зависимости между променливите. Горепосочените процедури за проверка на статистическата значимост на полученото регресионно уравнение и неговите индивидуални коефициенти, оценката на точността на прогнозата остава същата, както в случая на сдвоена линейна регресия. В същото време използването на многовариантни регресии вместо двойна регресия обикновено позволява, с подходящ избор на променливи, значително да подобри точността на описание на поведението на зависимата променлива, а оттам и точността на прогнозата.

В допълнение, уравненията на многомерната линейна регресия позволяват да се опише нелинейната зависимост на прогнозираната стойност от независими променливи. Процедурата за привеждане на нелинейно уравнение до линеен вид се нарича линеаризация. По-специално, ако тази зависимост се описва с полином със степен, различна от 1, тогава чрез замяна на променливи със степени, различни от единица, с нови променливи в първа степен, получаваме многовариантна линейна регресионна задача вместо нелинейна. Така, например, ако влиянието на независимата променлива е описано с парабола на формата

след това замяната
ви позволява да конвертирате нелинеен проблем в многомерен линеен

Нелинейните проблеми също могат лесно да бъдат трансформирани, при които възниква нелинейност поради факта, че прогнозираната стойност зависи от произведението на независими променливи. За да се отчете този ефект, е необходимо да се въведе нова променлива, равна на този продукт.

В случаите, когато нелинейността се описва от по-сложни зависимости, е възможна линеаризация поради координатни трансформации. За това се изчисляват стойностите
и са построени графики на зависимостта на началните точки в различни комбинации на трансформираните променливи. Тази комбинация от трансформирани координати или трансформирани и нетрансформирани координати, при която зависимостта е най-близка до права линия, предполага промяна на променливи, която ще доведе до трансформация на нелинейна зависимост в линейна форма. Например нелинейна зависимост на формата

се превръща в линеен

където:
,
и
.

Получените регресионни коефициенти за трансформираното уравнение остават безпристрастни и ефективни, но уравнението и коефициентите не могат да бъдат тествани за статистическа значимост

Проверка на валидността на прилагането на метода на най-малките квадрати

Прилагането на метода на най-малките квадрати осигурява ефективността и безпристрастните оценки на коефициентите на регресионното уравнение при следните условия (условия Гаус-Маркова):

1.

2.

3. ценности не зависят един от друг

4. ценности не зависят от независими променливи

Най-лесният начин да проверите дали тези условия са изпълнени е да начертаете остатъците
зависи от , след това върху независимите (независимите) променливи. Ако точките на тези графики са разположени в коридор, разположен симетрично на оста x и няма закономерности в разположението на точките, тогава условията на Гаус-Марков са изпълнени и няма възможности за подобряване на точността на регресията уравнение. Ако това не е така, тогава е възможно значително да се подобри точността на уравнението и за това е необходимо да се обърнете към специална литература.

Регресионният анализ е статистически метод за изследване, който ви позволява да покажете зависимостта на параметър от една или повече независими променливи. В предкомпютърната ера използването му е било доста трудно, особено когато става въпрос за големи количества данни. Днес, след като сте се научили как да създавате регресия в Excel, можете да решавате сложни статистически проблеми само за няколко минути. По-долу са конкретни примери от областта на икономиката.

Видове регресия

Самата концепция е въведена в математиката през 1886 г. Регресията се случва:

  • линеен;
  • параболичен;
  • мощност;
  • експоненциален;
  • хиперболичен;
  • демонстративен;
  • логаритмичен.

Пример 1

Разгледайте проблема за определяне на зависимостта на броя на пенсионираните членове на екипа от средната заплата в 6 промишлени предприятия.

Задача. В шест предприятия анализирахме средната месечна заплата и броя на служителите, напуснали по собствено желание. В табличен вид имаме:

Броят на напусналите хора

Заплата

30 000 рубли

35 000 рубли

40 000 рубли

45 000 рубли

50 000 рубли

55 000 рубли

60 000 рубли

За задачата за определяне на зависимостта на броя на пенсионираните работници от средната работна заплата в 6 предприятия, регресионният модел има формата на уравнението Y = a 0 + a 1 x 1 +…+a k x k , където x i са влияещите променливи , a i са регресионните коефициенти, a k е броят на факторите.

За тази задача Y е индикаторът за напуснали служители, а влияещият фактор е заплатата, която означаваме с X.

Използване на възможностите на електронната таблица "Excel"

Регресионният анализ в Excel трябва да бъде предшестван от прилагане на вградени функции към наличните таблични данни. За тези цели обаче е по-добре да използвате много полезната добавка „Analysis Toolkit“. За да го активирате трябва:

  • от раздела "Файл" отидете в секцията "Опции";
  • в прозореца, който се отваря, изберете реда „Добавки“;
  • кликнете върху бутона "Отиди", разположен в долната част, вдясно от реда "Управление";
  • поставете отметка в квадратчето до името „Пакет за анализ“ и потвърдете действията си, като щракнете върху „OK“.

Ако всичко е направено правилно, желаният бутон ще се появи от дясната страна на раздела Данни, разположен над работния лист на Excel.

в Excel

Сега, когато имаме под ръка всички необходими виртуални инструменти за извършване на иконометрични изчисления, можем да започнем да решаваме нашия проблем. За това:

  • кликнете върху бутона "Анализ на данни";
  • в прозореца, който се отваря, кликнете върху бутона "Регресия";
  • в раздела, който се появява, въведете диапазона от стойности за Y (броят служители, които са напуснали) и за X (техните заплати);
  • Потвърждаваме действията си с натискане на бутона "Ok".

В резултат на това програмата автоматично ще попълни нов лист от електронната таблица с данни от регресионен анализ. Забележка! Excel има възможност ръчно да зададе местоположението, което предпочитате за тази цел. Например, това може да е същият лист, където са стойностите Y и X, или дори нова работна книга, специално проектирана да съхранява такива данни.

Анализ на резултатите от регресия за R-квадрат

В Excel данните, получени по време на обработката на данните от разглеждания пример, изглеждат така:

На първо място, трябва да обърнете внимание на стойността на R-квадрата. Това е коефициентът на детерминация. В този пример R-квадрат = 0,755 (75,5%), т.е. изчислените параметри на модела обясняват връзката между разглежданите параметри със 75,5%. Колкото по-висока е стойността на коефициента на детерминация, толкова по-приложим е избраният модел за конкретна задача. Смята се, че той правилно описва реалната ситуация със стойност на R-квадрат над 0,8. Ако R-квадрат<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Анализ на съотношението

Числото 64.1428 показва каква ще бъде стойността на Y, ако всички променливи xi в модела, който разглеждаме, са настроени на нула. С други думи, може да се твърди, че стойността на анализирания параметър се влияе и от други фактори, които не са описани в конкретен модел.

Следващият коефициент -0.16285, разположен в клетка B18, показва тежестта на влиянието на променливата X върху Y. Това означава, че средната месечна заплата на служителите в рамките на разглеждания модел влияе върху броя на напусналите с тежест -0.16285, т.е. степента на неговото влияние изобщо е малка. Знакът "-" показва, че коефициентът е с отрицателна стойност. Това е очевидно, тъй като всеки знае, че колкото по-висока е заплатата в предприятието, толкова по-малко хора изразяват желание да прекратят трудовия договор или да напуснат.

Множествена регресия

Този термин се отнася до уравнение на връзка с няколко независими променливи от формата:

y \u003d f (x 1 + x 2 + ... x m) + ε, където y е ефективната характеристика (зависима променлива), а x 1, x 2, ... x m са факторните фактори (независими променливи).

Оценка на параметъра

За множествената регресия (MR) се използва методът на най-малките квадрати (OLS). За линейни уравнения от формата Y = a + b 1 x 1 +…+b m x m + ε, ние конструираме система от нормални уравнения (вижте по-долу)

За да разберете принципа на метода, разгледайте двуфакторния случай. Тогава имаме ситуация, описана с формулата

От тук получаваме:

където σ е дисперсията на съответния признак, отразен в индекса.

LSM е приложим към уравнението MP в стандартизирана скала. В този случай получаваме уравнението:

където t y , t x 1, … t xm са стандартизирани променливи, за които средните стойности са 0; β i са стандартизираните регресионни коефициенти, а стандартното отклонение е 1.

Моля, имайте предвид, че всички β i в този случай са зададени като нормализирани и централизирани, така че тяхното сравнение помежду си се счита за правилно и допустимо. Освен това е обичайно да се филтрират фактори, като се изхвърлят тези с най-малки стойности на βi.

Проблем с използване на уравнение на линейна регресия

Да предположим, че има таблица с динамиката на цените на определен продукт N през последните 8 месеца. Необходимо е да се вземе решение за целесъобразността на закупуването на неговата партида на цена от 1850 рубли/т.

номер на месеца

име на месеца

цена на артикул Н

1750 рубли на тон

1755 рубли на тон

1767 рубли на тон

1760 рубли на тон

1770 рубли на тон

1790 рубли на тон

1810 рубли на тон

1840 рубли на тон

За да разрешите този проблем в електронната таблица на Excel, трябва да използвате инструмента за анализ на данни, който вече е известен от горния пример. След това изберете секцията "Регресия" и задайте параметрите. Трябва да се помни, че в полето "Интервал на въвеждане Y" трябва да се въведе диапазон от стойности за зависимата променлива (в случая цената на даден продукт в определени месеци от годината), а в полето "Въвеждане интервал X" - за независимата променлива (номер на месец). Потвърдете действието, като щракнете върху „Ok“. На нов лист (ако е посочено така) получаваме данни за регресия.

Въз основа на тях изграждаме линейно уравнение от вида y=ax+b, където параметрите a и b са коефициентите на реда с името на номера на месеца и коефициентите и реда „Y-пресечна“ от лист с резултатите от регресионния анализ. Така уравнението на линейната регресия (LE) за проблем 3 е написано като:

Цена на продукта N = 11.714* номер на месеца + 1727.54.

или в алгебрична нотация

y = 11,714 x + 1727,54

Анализ на резултатите

За да се реши дали полученото уравнение на линейна регресия е адекватно, се използват коефициенти на множествена корелация (MCC) и коефициенти на определяне, както и тест на Fisher и тест на Student. В таблицата на Excel с регресионни резултати те се показват съответно под имената на множество R, R-квадрат, F-статистика и t-статистика.

KMC R дава възможност да се оцени плътността на вероятностната връзка между независимите и зависимите променливи. Високата му стойност показва доста силна връзка между променливите "Номер на месеца" и "Цена на стоки N в рубли за 1 тон". Естеството на тази връзка обаче остава неизвестно.

Квадратът на коефициента на детерминация R 2 (RI) е числена характеристика на дела на общото разсейване и показва разсейването на коя част от експерименталните данни, т.е. стойностите на зависимата променлива съответстват на уравнението на линейната регресия. В разглежданата задача тази стойност е равна на 84,8%, т.е. статистическите данни се описват с висока степен на точност от полученото SD.

F-статистиката, наричана още тест на Фишер, се използва за оценка на значимостта на линейна връзка, опровергавайки или потвърждавайки хипотезата за нейното съществуване.

(Критерий на Стюдънт) помага да се оцени значимостта на коефициента с неизвестен или свободен член на линейна връзка. Ако стойността на t-критерия > t cr, тогава хипотезата за незначимостта на свободния член на линейното уравнение се отхвърля.

В разглежданата задача за свободния член с помощта на инструментите на Excel се получи, че t = 169.20903 и p = 2.89E-12, т.е. имаме нулева вероятност правилната хипотеза за незначимостта на свободния член да бъде отхвърлен. За коефициента при неизвестно t=5,79405 и p=0,001158. С други думи, вероятността правилната хипотеза за незначимостта на коефициента за неизвестното да бъде отхвърлена е 0,12%.

По този начин може да се твърди, че полученото уравнение на линейна регресия е адекватно.

Проблемът за целесъобразността от закупуване на пакет от акции

Множествената регресия в Excel се извършва с помощта на същия инструмент за анализ на данни. Помислете за конкретен приложен проблем.

Ръководството на NNN трябва да вземе решение относно целесъобразността на закупуването на 20% дял в MMM SA. Цената на пакета (JV) е 70 милиона щатски долара. Специалистите на NNN събраха данни за подобни транзакции. Беше решено да се оцени стойността на пакета акции според такива параметри, изразени в милиони щатски долари, като:

  • дължими сметки (VK);
  • годишен оборот (VO);
  • вземания (VD);
  • себестойност на дълготрайните активи (SOF).

Освен това се използва параметърът просрочени задължения на предприятието (V3 P) в хиляди щатски долари.

Решение с помощта на електронна таблица на Excel

На първо място, трябва да създадете таблица с първоначални данни. Изглежда така:

  • извикайте прозореца "Анализ на данни";
  • изберете секцията "Регресия";
  • в полето "Интервал на въвеждане Y" въведете диапазона от стойности на зависимите променливи от колона G;
  • кликнете върху иконата с червена стрелка вдясно от прозореца "Input interval X" и изберете диапазона от всички стойности от колони B, C, D, F на листа.

Изберете „Нов работен лист“ и щракнете върху „Ok“.

Вземете регресионния анализ за дадения проблем.

Разглеждане на резултатите и заключения

„Ние събираме“ от закръглените данни, представени по-горе в електронната таблица на Excel, регресионното уравнение:

SP \u003d 0,103 * SOF + 0,541 * VO - 0,031 * VK + 0,405 * VD + 0,691 * VZP - 265.844.

В по-позната математическа форма може да се запише като:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

Данните за АД "МММ" са представени в таблицата:

Замествайки ги в регресионното уравнение, те получават цифра от 64,72 милиона щатски долара. Това означава, че акциите на АД МММ не трябва да се купуват, тъй като тяхната стойност от 70 милиона щатски долара е доста завишена.

Както можете да видите, използването на електронната таблица на Excel и регресионното уравнение направи възможно вземането на информирано решение относно осъществимостта на много специфична транзакция.

Сега знаете какво е регресия. Обсъдените по-горе примери в Excel ще ви помогнат да решите практически задачи от областта на иконометрията.

Финални тестове по иконометрия

1. Оценката на значимостта на параметрите на регресионното уравнение се извършва въз основа на:

А) t - Критерий на Стюдънт;

б) F-критерий на Фишер - Снедекор;

в) средна квадратична грешка;

г) средна апроксимационна грешка.

2. Коефициентът на регресия в уравнението, характеризиращо връзката между обема на продажбите (милиона рубли) и печалбата на предприятията в автомобилната индустрия за годината (милиона рубли), означава, че с увеличаване на обема на продажбите с 1 милиона рубли печалбата се увеличава с:

г) 0,5 милиона търкайте.;

в) 500 хиляди. търкайте.;

Г) 1,5 милиона рубли

3. Коефициент на корелация (индекс на корелация) измерва степента на близост на връзката между X иY:

а) само с нелинейна форма на зависимост;

Б) с всякаква форма на зависимост;

в) само с линейна връзка.

4. По посока на комуникацията има:

а) умерено;

Б) прав;

в) праволинейна.

5. Въз основа на 17 наблюдения е изградено регресионно уравнение:
.
За да проверим значимостта на уравнението, изчислихменаблюдавана стойностT- статистика: 3.9. Заключение:

A) Уравнението е значимо за a = 0,05;

б) уравнението е незначимо при a = 0,01;

в) Уравнението не е значимо при a = 0,05.

6. Какви са последствията от нарушаване на допускането на OLS „очакването на регресионните остатъци е нула“?

A) Неправилни оценки на регресионните коефициенти;

б) Ефикасни, но непоследователни оценки на регресионните коефициенти;

в) Неефективни оценки на регресионните коефициенти;

г) Непоследователни оценки на регресионните коефициенти.

7. Кое от следните твърдения е вярно в случай на хетероскедастичност на остатъците?

A) Заключенията за t и F-статистиките са ненадеждни;

г) Оценките на параметрите на регресионното уравнение са пристрастни.

8. На какво се основава корелационният тест на Spearman?

А) За използването на t - статистика;

в) При употреба ;

9. На какво се основава тестът на Уайт?

b) Относно използването на F-статистиката;

Б) в употреба ;

г) На графичния анализ на остатъците.

10. Какъв метод може да се използва за премахване на автокорелацията?

11. Как се нарича нарушението на предположението за постоянство на дисперсията на остатъците?

а) Мултиколинеарност;

б) автокорелация;

Б) Хетероскедастичност;

г) Хомоскедастичност.

12. Фиктивните променливи се въвеждат в:

а) само при линейни модели;

б) само при множествена нелинейна регресия;

в) само при нелинейни модели;

Г) линейни и нелинейни модели, редуцирани до линейна форма.

13. Ако в матрицата на сдвоените коефициенти на корелация има
, тогава това показва:

А) За наличието на мултиколинеарност;

б) За липсата на мултиколинеарност;

в) За наличието на автокорелация;

г) Относно липсата на хетероскедастичност.

14. Каква мярка е невъзможно да се отървем от мултиколинеарността?

а) Увеличаване на размера на извадката;

Г) Трансформация на случайния компонент.

15. Ако
и рангът на матрица A е по-малък от (K-1), тогава уравнението:

а) свръхидентифицирани;

Б) не е идентифициран;

в) точно идентифицирани.

16. Регресионното уравнение изглежда така:

НО)
;

б)
;

в)
.

17. Какъв е проблемът с идентифицирането на модела?

А) получаване на еднозначно дефинирани параметри на модела, зададен от системата от едновременни уравнения;

б) избор и внедряване на методи за статистическа оценка на неизвестни параметри на модела по изходни статистически данни;

в) проверка на адекватността на модела.

18. Какъв метод се използва за оценка на параметрите на свръхидентифицирано уравнение?

В) ДМНК, КМНК;

19. Ако една качествена променлива имакалтернативни стойности, тогава симулацията използва:

A) (k-1) фиктивна променлива;

b) kdummy променливи;

в) (k+1) фиктивна променлива.

20. Анализът на близостта и посоката на връзките на два знака се извършва въз основа на:

А) коефициент на двойна корелация;

б) коефициент на детерминация;

в) коефициент на множествена корелация.

21. В линейно уравнение х = а 0 +a 1 x регресионният коефициент показва:

а) близостта на връзката;

б) пропорция на дисперсията "Y" в зависимост от "X";

В) колко ще се промени средно "Y", когато "X" се промени с една единица;

г) грешка на коефициента на корелация.

22. Какъв показател се използва за определяне на частта от вариацията, дължаща се на промяна в стойността на изследвания фактор?

а) коефициент на вариация;

б) коефициент на корелация;

В) коефициент на детерминация;

г) коефициент на еластичност.

23. Коефициентът на еластичност показва:

А) с колко% ще се промени стойността на y, когато x се промени с 1%;

б) с колко мерни единици ще се промени стойността на y, когато x се промени с 1%;

в) с колко % ще се промени стойността на y, когато x се промени с единица. вашето измерване.

24. Какви методи могат да се прилагат за откриване на хетероскедастичност?

А) Тест на Голфелд-Квант;

B) Ранг корелационен тест на Spearman;

в) Тест на Дърбин-Уотсън.

25. Каква е основата на теста Голфелд-Кванд

а) Относно използването на t-статистиката;

Б) За използването на F - статистика;

в) При употреба ;

г) На графичния анализ на остатъците.

26. Какви методи не могат да се използват за елиминиране на автокорелацията на остатъците?

а) Обобщен метод на най-малките квадрати;

Б) Метод на претеглени най-малки квадрати;

В) методът на максималната вероятност;

Г) Двуетапен метод на най-малките квадрати.

27. Как се нарича нарушението на предположението за независимост на остатъците?

а) Мултиколинеарност;

Б) Автокорелация;

в) Хетероскедастичност;

г) Хомоскедастичност.

28. Какъв метод може да се използва за премахване на хетероскедастичността?

А) Обобщен метод на най-малките квадрати;

б) Метод на най-малките претеглени квадрати;

в) Метод на максималната вероятност;

г) Двуетапен метод на най-малките квадрати.

30. Ако отT-критерий, повечето от регресионните коефициенти са статистически значими, а моделът като цялоЕ- критерият е незначителен, тогава това може да означава:

а) Мултиколинеарност;

B) За автокорелацията на остатъците;

в) Относно хетероскедастичността на остатъците;

г) Тази опция не е възможна.

31. Възможно ли е да се отървем от мултиколинеарността чрез трансформиране на променливи?

а) Тази мярка е ефективна само когато размерът на извадката е увеличен;

32. Какъв метод може да се използва за намиране на оценки на параметъра на уравнението на линейната регресия:

А) метод на най-малките квадрати;

б) корелационен и регресионен анализ;

в) дисперсионен анализ.

33. Построено е уравнение на множествена линейна регресия с фиктивни променливи. За да проверим значимостта на отделните коефициенти, използваме разпространение:

а) нормално;

б) Ученик;

в) Пиърсън;

г) Фишер-Снедекор.

34. Ако
и рангът на матрица A е по-голям от (K-1), тогава уравнението:

А) свръхидентифицирани;

б) не е идентифициран;

в) точно идентифицирани.

35. За оценка на параметрите на система от уравнения, която може да бъде точно идентифицирана, се използва следното:

а) ДМНК, КМНК;

б) ДМНК, МНК, КМНК;

36. Критерият на Чоу се основава на прилагането на:

A) F - статистика;

б) t - статистика;

в) критерии на Дърбин-Уотсън.

37. Фиктивните променливи могат да приемат следните стойности:

г) всякакви стойности.

39. Въз основа на 20 наблюдения е изградено регресионно уравнение:
.
За да се провери значимостта на уравнението, се изчислява стойността на статистиката:4.2. Изводи:

а) Уравнението е значимо при a=0,05;

б) Уравнението не е значимо при a=0,05;

в) Уравнението не е значимо при a=0,01.

40. Кое от следните твърдения не е вярно, ако остатъците са хетероскедастични?

а) Заключенията относно t и F статистиките са ненадеждни;

б) Хетероскедастичността се проявява чрез ниската стойност на статистиката на Дърбин-Уотсън;

в) При хетероскедастичност оценките остават ефективни;

г) Оценките са пристрастни.

41. Тестът Chow се основава на сравнение:

А) дисперсии;

б) коефициенти на детерминация;

в) математически очаквания;

г) средна.

42. Ако в теста Чоу
тогава се смята:

А) че разделянето на подинтервали е полезно от гледна точка на подобряване на качеството на модела;

б) моделът е статистически незначим;

в) моделът е статистически значим;

г) че няма смисъл пробата да се разделя на части.

43. Фиктивните променливи са променливи:

качество;

б) случаен;

Б) количествен;

г) логически.

44. Кой от следните методи не може да се използва за откриване на автокорелация?

а) Сериен метод;

б) тест на Дърбин-Уотсън;

в) Тест за рангова корелация на Spearman;

Г) Тест на Уайт.

45. Най-простата структурна форма на модела е:

НО)

б)

в)

G)
.

46. ​​​​Какви мерки могат да се предприемат, за да се отървем от мултиколинеарността?

а) Увеличаване на размера на извадката;

б) Изключване на променливи, силно корелирани с останалите;

в) Промяна на спецификацията на модела;

г) Трансформация на случайния компонент.

47. Ако
и рангът на матрица A е (K-1), тогава уравнението:

а) свръхидентифицирани;

б) не е идентифициран;

Б) точно идентифицирани;

48. Един модел се счита за идентифициран, ако:

а) сред уравненията на модела има поне едно нормално;

Б) всяко уравнение на системата е идентифицируемо;

в) сред уравненията на модела има поне едно неидентифицирано;

г) сред уравненията на модела има поне едно свръхидентифицирано.

49. Какъв метод се използва за оценка на параметрите на неидентифицирано уравнение?

а) ДМНК, КМНК;

б) DMNC, MNC;

В) параметрите на такова уравнение не могат да бъдат оценени.

50. На кръстопътя на кои области на знанието е възникнала иконометрията:

А) икономическа теория; икономическа и математическа статистика;

б) икономическа теория, математическа статистика и теория на вероятностите;

в) икономическа и математическа статистика, теория на вероятностите.

51. В уравнението на множествената линейна регресия се изграждат доверителни интервали за коефициентите на регресия, като се използва разпределението:

а) нормално;

Б) Ученик;

в) Пиърсън;

г) Фишер-Снедекор.

52. Въз основа на 16 наблюдения е съставено уравнение на двойна линейна регресия. Заизчислена проверка на значимостта на регресионния коефициентT за 6л =2.5.

а) Коефициентът е незначим при a=0,05;

б) Коефициентът е значим при a=0,05;

в) Коефициентът е значим при a=0,01.

53. Известно е, че между количестватахиYсъществуваположителна връзка. До каква степене коефициентът на корелация по двойки?

а) от -1 до 0;

б) от 0 до 1;

В) от -1 до 1.

54. Коефициентът на множествена корелация е 0,9. Какъв процентдисперсията на резултатния атрибут се обяснява с влиянието на всичкифакторни черти?

55. Кой от следните методи не може да се използва за откриване на хетероскедастичност?

А) Тест на Голфелд-Квант;

б) Тест за рангова корелация на Спирман;

в) сериен метод.

56. Дадената форма на модела е:

а) система от нелинейни функции на екзогенни променливи от ендогенни;

Б) система от линейни функции на ендогенни променливи от екзогенни;

в) система от линейни функции на екзогенни променливи от ендогенни;

г) система от нормални уравнения.

57. В какви граници се променя частичният корелационен коефициент, изчислен по рекурсивни формули?

а) от - до + ;

б) от 0 до 1;

в) от 0 до + ;

Г) от -1 до +1.

58. В какви граници се променя частичният коефициент на корелация, изчислен чрез коефициента на детерминация?

а) от - до + ;

Б) от 0 до 1;

в) от 0 до + ;

г) от –1 до +1.

59. Екзогенни променливи:

а) зависими променливи;

Б) независими променливи;

61. При добавяне на друг обяснителен фактор към уравнението на регресията, коефициентът на множествена корелация:

а) ще намалее

б) ще се увеличи;

в) запазва стойността си.

62. Построено е уравнение на хиперболична регресия:Y= а+ b/ х. ЗаТестът за значимост на уравнението използва разпределението:

а) нормално;

Б) Ученик;

в) Пиърсън;

г) Фишер-Снедекор.

63. За какви типове системи параметрите на отделните иконометрични уравнения могат да бъдат намерени с помощта на традиционния метод на най-малките квадрати?

а) система от нормални уравнения;

Б) система от независими уравнения;

В) система от рекурсивни уравнения;

Г) система от взаимозависими уравнения.

64. Ендогенни променливи:

А) зависими променливи;

б) независими променливи;

в) датирани от предишни точки във времето.

65. В какви граници се променя коефициентът на детерминация?

а) от 0 до + ;

б) от - до + ;

В) от 0 до +1;

г) от -1 до +1.

66. Построено е уравнение на множествена линейна регресия. За да проверим значимостта на отделните коефициенти, използваме разпространение:

а) нормално;

б) Ученик;

в) Пиърсън;

Г) Фишер-Снедекор.

67. При добавяне на друг обяснителен фактор към уравнението на регресията, коефициентът на детерминация:

а) ще намалее

Б) ще се увеличи;

в) запазва стойността си;

г) няма да намалее.

68. Същността на метода на най-малките квадрати е, че:

A) оценката се определя от условието за минимизиране на сумата от квадратите на отклоненията на извадковите данни от определената оценка;

б) оценката се определя от условието за минимизиране на сумата от отклонения на извадковите данни от определената оценка;

в) оценката се определя от условието за минимизиране на сумата от квадратите на отклоненията на средната стойност на извадката от дисперсията на извадката.

69. Към кой клас нелинейни регресии принадлежи параболата:

73. Към кой клас нелинейни регресии принадлежи експоненциалната крива:

74. Към кой клас нелинейни регресии принадлежи функция от вида ŷ
:

А) регресии, които са нелинейни по отношение на променливите, включени в анализа, но линейни по отношение на оценените параметри;

б) нелинейни регресии на оценените параметри.

78. Към кой клас нелинейни регресии принадлежи функция от вида ŷ
:

а) регресии, които са нелинейни по отношение на променливите, включени в анализа, но линейни по отношение на оценените параметри;

Б) нелинейни регресии върху оценените параметри.

79. В регресионното уравнение под формата на хипербола ŷ
ако стойността
b >0 , тогава:

А) с увеличаване на факторния признак хстойността на резултантния атрибут принамаляват бавно и x→∞средна стойност прище бъде равно на а;

б) стойността на ефективния признак принараства с бавен растеж с увеличаване на факторния признак х, и при x→∞

81. Коефициентът на еластичност се определя по формулата

А) Линейна функция;

б) параболи;

в) Хиперболи;

г) експоненциална крива;

д) Мощност.

82. Коефициентът на еластичност се определя по формулата
за регресионен модел във формата:

а) Линейна функция;

Б) Параболи;

в) Хиперболи;

г) експоненциална крива;

д) Мощност.

86. Уравнение
Наречен:

А) линейна тенденция

б) параболичен тренд;

в) хиперболичен тренд;

г) експоненциален тренд.

89. Уравнение
Наречен:

а) линейна тенденция;

б) параболичен тренд;

в) хиперболичен тренд;

Г) експоненциална тенденция.

90. Системни изгледи Наречен:

А) система от независими уравнения;

б) система от рекурсивни уравнения;

в) система от взаимозависими (едновременни, едновременни) уравнения.

93. Иконометрията може да се дефинира като:

А) това е независима научна дисциплина, която съчетава набор от теоретични резултати, техники, методи и модели, предназначени, на базата на икономическа теория, икономическа статистика и математически и статистически инструменти, да дадат специфичен количествен израз на общи (качествени) модели поради икономическата теория;

Б) науката за икономическите измервания;

В) статистически анализ на икономически данни.

94. Задачите на иконометрията включват:

А) прогноза за икономически и социално-икономически показатели, характеризиращи състоянието и развитието на анализираната система;

Б) симулация на възможни сценарии за социално-икономическото развитие на системата, за да се идентифицира как планираните промени в определени управляеми параметри ще повлияят на изходните характеристики;

в) проверка на хипотези по статистически данни.

95. Връзките се отличават по своето естество:

А) функционални и корелационни;

б) функционални, криволинейни и праволинейни;

в) корелация и обратна връзка;

г) статистически и директни.

96. С пряка връзка с увеличаване на факторна черта:

а) ефективният знак намалява;

б) ефективният атрибут не се променя;

В) показателят за изпълнение се увеличава.

97. Какви методи се използват за идентифициране на наличието, характера и посоката на асоцииране в статистиката?

а) средни стойности;

Б) сравнение на успоредни редове;

В) метод на аналитично групиране;

г) относителни стойности;

Г) графичен метод.

98. Какъв метод се използва за идентифициране на формите на влияние на едни фактори върху други?

а) корелационен анализ;

Б) регресионен анализ;

в) индексен анализ;

г) дисперсионен анализ.

99. Какъв метод се използва за количествено определяне на силата на въздействието на едни фактори върху други:

А) корелационен анализ;

б) регресионен анализ;

в) методът на средните;

г) дисперсионен анализ.

100. Какви показатели по своята величина съществуват в диапазона от минус до плюс едно:

а) коефициент на детерминация;

б) съотношение на корелация;

В) коефициент на линейна корелация.

101. Коефициентът на регресия за еднофакторен модел показва:

А) колко единици се променя функцията, когато аргументът се промени с една единица;

б) колко процента се променя функцията за единица промяна в аргумента.

102. Коефициентът на еластичност показва:

а) с колко процента се променя функцията при промяна на аргумента с една мерна единица;

Б) с колко процента се променя функцията при промяна на аргумента с 1%;

в) с колко мерни единици се променя функцията при промяна на аргумента с 1%.

105. Стойността на индекса на корелация, равна на 0,087, показва:

А) за слабата им зависимост;

б) силна връзка;

в) грешки в изчисленията.

107. Стойността на коефициента на корелация на двойката, равна на 1,12, показва:

а) за слабата им зависимост;

б) силна връзка;

В) за грешки в изчисленията.

109. Кои от дадените числа могат да бъдат стойностите на коефициента на корелация на двойката:

111. Кои от дадените числа могат да бъдат стойностите на коефициента на множествена корелация:

115. Маркирайте правилната форма на уравнението на линейната регресия:

като
;

б) ŷ
;

в) ŷ
;

Г) ŷ
.

Споделете с приятели или запазете за себе си:

Зареждане...