Значимість рівняння регресії загалом. Оцінка значущості рівняння регресії загалом та її параметрів


Оцінка статистичної значущості параметрів та рівняння в цілому – це обов'язкова процедура, яка дозволяє зробити введення про можливість використання побудованого рівняння зв'язку для прийняття управлінських рішень та прогнозування.

Оцінка статистичної значущості рівняння регресії здійснюється з використанням F-критерію Фішера, який є відношенням факторної та залишкових дисперсій, розрахованих на один ступінь свободи.

Факторна дисперсія – пояснена частина варіації ознаки-результату, тобто зумовлена ​​варіацією тих факторів, які включені до аналізу (у рівняння):

де k – число факторів у рівнянні регресії (кількість ступенів свободи факторної дисперсії); - Середнє значення залежної змінної; - теоретичне (розраховане за рівнянням регресії) значення залежної змінної у i – ї одиниці сукупності.

Залишкова дисперсія - непояснена частина варіації ознаки-результату, тобто обумовлена ​​варіацією інших факторів, не включених до аналізу.

= , (71)

де - Фактичне значення залежної змінної у i - ї одиниці сукупності; n-k-1 – число ступенів свободи залишкової дисперсії; n – обсяг сукупності.

Сума факторної та залишкової дисперсій, як зазначалося вище, є загальна дисперсіяознаки-результату.

F-критерія Фішера розраховується за такою формулою:

F-критерій Фішера – величина, що відбиває співвідношення поясненої і непоясненої дисперсій, дозволяє відповісти питанням: чи пояснюють включені у аналіз чинники статистичну значиму частину варіації ознаки-результата. F-критерій Фішера табульований (входом до таблиці є число ступенів свободи факторної та залишкової дисперсій). Якщо , то рівняння регресії визнається статистично значущим і, відповідно, статистично значущим коефіцієнтом детермінації. Інакше, рівняння – статистично значимо, тобто. не пояснює суттєвої частини варіації ознаки-результату.

Оцінка статистичної значущості параметрів рівняння здійснюється на основі t-статистики, яка розраховується як відношення модуля параметрів рівняння регресії до їх стандартних помилок ( ):

, де ; (73)

, де . (74)

У будь-якій статистичній програмі розрахунок параметрів завжди супроводжується розрахунком значень їх стандартних (середньоквадратичних) помилок та t-статистики. Параметр визнаються статистично значущим, якщо фактичне значення t-статистики більше табличного.

Оцінка параметрів на основі t-статистики, по суті, є перевіркою нульової гіпотези про рівність генеральних параметрів нулю (H 0 : = 0; H 0 : = 0;), тобто про не значущість параметрів рівняння регресії. Рівень значимості прийняття нульових гіпотез = 1-0,95 = 0,05 (0,95 - рівень ймовірності, як правило, що встановлюється в економічних розрахунках). Якщо розрахунковий рівень значимості менше 0,05, то нульова гіпотеза відкидається і приймається альтернативна - статистичної значущості параметра.

Проводячи оцінку статистичної значимості рівняння регресії та її параметрів, ми можемо отримати різне поєднання результатів.

· Рівняння за F-критерієм статистично значуще і всі параметри рівняння з t-статистики теж статистично значущі. Це рівняння може бути використане як для прийняття управлінських рішень (на які фактори слід впливати, щоб отримати бажаний результат), так і для прогнозування поведінки ознаки-результату при тих чи інших значеннях факторів.

· За F-критерієм рівняння статистично значуще, але незначні окремі параметри рівняння. Рівняння може бути використане для прийняття управлінських рішень (що стосуються тих факторів, якими отримано підтвердження статистичної значущості їх впливу), але рівняння не може бути використане для прогнозування.

· Рівняння за F-критерієм статистично незначне. Рівняння не можна використовувати. Слід продовжити пошук значимих ознак-факторів чи аналітичної форми зв'язку аргументів та відгуку.

Якщо підтверджено статистична значимістьрівняння та її параметрів, може бути реалізований, про, точковий прогноз, тобто. розраховується ймовірне значення ознаки-результату (y) при тих чи інших значеннях факторів (x). Цілком очевидно, що прогнозне значення залежної змінної не співпадатиме з фактичним її значенням. Це пов'язано, перш за все, із суттю кореляційної залежності. Одночасно результат впливає безліч чинників, у тому числі лише частина може бути врахована у рівнянні зв'язку. Крім того, може бути неправильно обрана форма зв'язку результату та факторів (тип рівняння регресії). Між фактичними значеннями ознаки-результату та його теоретичними (прогнозними) значеннями завжди існує відмінність ( ). Графічно ця ситуація виявляється у тому, що не всі точки поля кореляції лежать на лінії регресії. Лише за функціонального зв'язку лінія регресії пройде через усі точки поля кореляції. Різниця між фактичними та теоретичними значеннями результативної ознаки називають відхиленнями чи помилками, чи залишками. На основі цих величин і розраховується залишкова дисперсія, що є оцінкою середньоквадратичної помилки рівняння регресії. Розмір стандартної помилки використовується для розрахунку довірчих інтервалівпрогнозного значення ознаки-результату (Y).

Після того, як знайдено рівняння лінійної регресії, проводиться оцінка значущості як рівняння загалом, і окремих його параметрів.

Оцінка значущості рівняння регресії загалом дається з допомогою F-критерію Фішера. При цьому висувається нульова гіпотеза, коефіцієнт регресії дорівнює нулю, тобто b = 0, і, отже, фактор х не впливає на результат у. Безпосереднім розрахунком F-критерію передує аналіз дисперсії. Центральне місцеу ньому займає розкладання загальної сумиквадратів відхилень змінної у від середнього значення на дві частини - «пояснену» і «непояснену» (додаток 2).

Загальна сума квадратів відхилень індивідуальних значень результативної ознаки від середнього значення у викликана впливом безлічі причин. Умовно всю сукупність причин можна поділити на дві групи:

  • · Досліджуваний фактор х
  • · Інші фактори

Якщо чинник впливає результат, то лінія регресії на графіці паралельна осі охи у = y. Тоді вся дисперсія результативної ознаки обумовлена ​​впливом інших факторів, і загальна сума квадратів відхилень збігається з залишковою. Якщо ж інші фактори не впливають на результат, то пов'язаний з х функціонально і залишкова сума квадратів дорівнює нулю. І тут сума квадратів відхилень, пояснена регресією, збігається із загальною сумою квадратів.

Оскільки не всі точки поля кореляції лежать на лінії регресії, то має місце їх розкид як обумовлений впливом фактора х, тобто регресією у по х, так і викликаний дією інших величин (непояснена варіація). Придатність лінії регресії для прогнозу залежить від цього, яка частина загальної варіації ознаки припадає на пояснену варіацію. Очевидно, що якщо сума квадратів відхилень, обумовлена ​​регресією, буде більшою від залишкової суми квадратів, то рівняння регресії статистично значуще і фактор х істотно впливає на результат у. Це рівнозначно з того що коефіцієнт детермінації r 2 xy наближатися до одиниці.

Будь-яка сума квадратів відхилень пов'язана з числом ступенів свободи (df - degrees of freedom), тобто з свободою незалежного варіювання ознаки. Число ступенів свободи пов'язане з числом одиниць сукупності n і з числом констант, що визначаються за нею. Стосовно досліджуваної проблеми число ступенів свободи має показати, скільки незалежних відхилень з n можливих [(y 1 -y), (y 2 -y),…,(y n -y)] потрібно для утворення цієї суми квадратів. Так, для загальної суми квадратів?(y-y) 2 потрібні (n-1) незалежні відхилення.

При розрахунку поясненої чи факторної суми квадратів?(y x -y) 2 використовуються теоретичні (розрахункові) значення результативної ознаки y x , знайдені лінією регресії: y x ​​=а+b*x.

У лінійній регресії сума квадратів відхилень, зумовлених лінійною регресією, становитиме: ?(y x -y) 2 = b 2 *?(x -x) 2 .

Оскільки при заданому обсязі спостережень з х і факторна сума квадратів при лінійній регресії залежить тільки від однієї константи коефіцієнта регресії b, то дана сума квадратів має один ступінь свободи. До того ж висновку прийдемо, якщо розглянемо змістовну сторону розрахункового значення ознаки, тобто y x . Величина y x визначається рівнянням лінійної регресії: y x ​​=а+b*x. Параметр а можна визначити як: a = y-b * x. Підставивши вираз параметра в лінійну модель отримаємо:

y x = y-b * x + b * x = y-b * (х-х).

Звідси видно, що з заданому наборі змінних у них розрахункове значення y x у лінійної регресії функцією лише одного параметра - коефіцієнта регресії. Відповідно і факторна сума квадратів відхилень має число ступенів свободи, що дорівнює 1.

Існує рівність між числом ступенів свободи загальної, факторної та залишкової сумами квадратів. Число ступенів свободи залишкової суми квадратів при лінійній регресії становить n-2. Число ступенів свободи для загальної суми квадратів визначається числом одиниць, і оскільки використовується середня обчислена за даними вибірки, втрачаємо один ступінь свободи, тобто df заг = n-1.

Отже, є дві рівності:

?(у-у) 2 =?(y x -у) 2 +?(у- y x) 2 ,

Розділивши кожну суму квадратів на відповідне їй число ступенів свободи, отримаємо середній квадрат відхилень, або, що те саме, дисперсію на один ступінь свободи D.

D заг =? (у-у) 2 / (n-1);

D факт =?(Y x -у) 2/1;

D ост =? (у-y x) 2 / (n-1).

Визначення дисперсії однією ступінь свободи призводить дисперсії до порівняльного виду. Зіставляючи факторну та залишкову дисперсію в розрахунку на один ступінь свободи, отримаємо величину F-відносини (F-критерію):

F = D факт / D зуст, де

F - критерій для перевірки нульової гіпотези Н0: D факт = D зуп.

Якщо нульова гіпотеза справедлива, то факторна і залишкова дисперсіяне відрізняються одна від одної. Для Н 0 необхідно спростування, щоб факторна дисперсія перевищувала залишкову кілька разів.

Англійським статистиком Снедекором розроблено таблиці критичних значень F-відносин при різних рівняхсуттєвості нульової гіпотези та помітному числі ступенів свободи.

Табличне значення F-критерію - це максимальна величина відношення дисперсій, яка може мати місце при випадковому їх розбіжності для даного рівняймовірність наявності нульової гіпотези.

Обчислене значення F-відносини визнається достовірним (відмінним від одиниці), якщо воно більше табличного.

У цьому випадку нульова гіпотеза про відсутність зв'язку ознак відхиляється і робиться висновок про суттєвість зв'язку: F факт >F табл. Н0 відхиляється.

Якщо ж величина виявиться меншою за табличну F факт

Оцінка якості моделі дає коефіцієнт детермінації. Коефіцієнт детермінації ( R 2) - це квадрат множинного коефіцієнта кореляції.

Він показує, яка частка дисперсії результативної ознаки пояснюється впливом незалежних змінних.

Формула для обчислення коефіцієнта детермінації:

y i-- вибіркові дані, а f i- Відповідні їм значення моделі.

Також це квадрат кореляції Пірсона між двома змінними. Він висловлює кількість дисперсії, спільної між двома змінними.

Коефіцієнт приймає значення з інтервалу. Чим ближче значення до 1, тим ближче модель до емпіричних спостережень.

У разі парної лінійної регресійної моделі коефіцієнт детермінації дорівнює квадрату коефіцієнта кореляції, тобто R 2 = r 2 .

Іноді показники тісноти зв'язку можна дати якісну оцінку (шкала Чеддока) (додаток 3).

Функціональний зв'язок виникає при значенні рівному 1, а відсутність зв'язку - 0. При значеннях показників тісноти зв'язку менше 0,7 величина коефіцієнта детермінації завжди буде нижче 50%. Це означає, що частку варіації факторних ознак припадає менша частина проти іншими неврахованими у моделі чинниками, які впливають зміну результативного показника. Побудовані за таких умов регресійні моделі мають низьке практичне значення.

Після того як рівняння регресії побудовано та за допомогою коефіцієнта детермінації оцінено його точність, залишається відкритим питання за рахунок чого досягнуто цієї точності і відповідно чи можна цьому рівнянню довіряти. Справа в тому, що рівняння регресії будувалося не за генеральною сукупністю, яка невідома, а щодо вибірки з неї. Крапки з генеральної сукупності потрапляють у вибірку випадковим чином, тому відповідно до теорії ймовірності серед інших випадків можливий варіант, коли вибірка з “широкої” генеральної сукупності виявиться “вузькою” (рис. 15).

Рис. 15. Можливий варіант влучення точок у вибірку з генеральної сукупності.

В цьому випадку:

а) рівняння регресії, побудоване на вибірку, може значно відрізнятися від рівняння регресії для генеральної сукупності, що призведе до помилок прогнозу;

б) коефіцієнт детермінації та інші характеристики точності виявляться невиправдано високими і вводитимуть в оману про прогнозні якості рівняння.

У граничному випадку не виключений варіант, коли з генеральної сукупності хмара з головною віссю паралельної горизонтальної осі (відсутня зв'язок між змінними) за рахунок випадкового відбору буде отримана вибірка, головна вісь якої виявиться нахиленою до осі. Таким чином, спроби прогнозувати чергові значення генеральної сукупності спираючись на дані вибірки з неї загрожують не тільки помилками в оцінці сили та напряму зв'язку між залежною та незалежною змінними, але й небезпекою знайти зв'язок між змінними там, де насправді її немає.

В умовах відсутності інформації про всі точки генеральної сукупності єдиний спосіб зменшити помилки в першому випадку полягає у використанні при оцінці коефіцієнтів рівняння регресії методу, що забезпечує їх незміщеність та ефективність. А ймовірність настання другого випадку може бути значно знижена завдяки тому, що апріорі відома одна властивість генеральної сукупності з двома незалежними один від одного змінними – в ній відсутня саме цей зв'язок. Досягається це зниження за рахунок перевірки статистичної значимостіотриманого рівняння регресії

Один з варіантів перевірки, що найчастіше використовуються, полягає в наступному. Для отриманого рівняння регресії визначається
-статистика
- характеристика точності рівняння регресії, що є відношенням тієї частини дисперсії залежною змінною яка пояснена рівнянням регресії до непоясненої (залишкової) частини дисперсії. Рівняння для визначення
-статистики у разі багатовимірної регресії має вигляд:

де:
- Пояснена дисперсія - частина дисперсії залежною змінною Yяка пояснена рівнянням регресії;

-залишкова дисперсія- частина дисперсії залежною змінною Y яка не пояснена рівнянням регресії, її наявність є наслідком дії випадкової складової;

- Число точок у вибірці;

- Число змінних у рівнянні регресії.

Як видно з наведеної формули, дисперсії визначаються як окреме від поділу відповідної суми квадратів на число ступенів свободи. Число ступенів свободице мінімально необхідне число значень залежної змінної, яких достатньо для отримання шуканої характеристики вибірки і які можуть вільно змінюватись з урахуванням того, що для цієї вибірки відомі всі інші величини, що використовуються для розрахунку потрібної характеристики.

Для отримання залишкової дисперсії потрібні коефіцієнти рівняння регресії. У разі парної лінійної регресії коефіцієнтів два, тому відповідно до формули (приймаючи
) число ступенів свободи дорівнює
. Мається на увазі, що для визначення залишкової дисперсії достатньо знати коефіцієнти рівняння регресії і лише
значень залежної змінної із вибірки. Два значення, що залишилися, можуть бути обчислені на підставі цих даних, а значить, не є вільно варіюються.

Для обчислення поясненої дисперсії значень залежної змінної взагалі не потрібні, оскільки її можна обчислити, знаючи коефіцієнти регресії при незалежних змінних та дисперсію незалежної змінної. Для того щоб переконатися в цьому, достатньо згадати вираз, що наводився раніше.
. За цим число ступенів свободи для залишкової дисперсії дорівнює числу незалежних змінних у рівнянні регресії (для парної лінійної регресії
).

В результаті
-Критерій для рівняння парної лінійної регресії визначається за формулою:

.

Теоретично ймовірності доведено, що
-Критерій рівняння регресії, отриманого для вибірки з генеральної сукупності, у якої відсутній зв'язок між залежною і незалежною змінною має розподіл Фішера, досить добре вивчений. Завдяки цьому для будь-якого значення
-Критерію можна розрахувати ймовірність його появи і навпаки, визначити те значення
-Критерію яке він не зможе перевищити із заданою ймовірністю.

Для здійснення статистичної перевірки значущості рівняння регресії формулюється нульова гіпотезапро відсутність зв'язку між змінними (всі коефіцієнти при змінних дорівнюють нулю) і вибирається рівень значущості .

Рівень значущості– це припустима можливість зробити помилку першого роду– відкинути внаслідок перевірки правильну нульову гіпотезу. У даному випадку зробити помилку першого роду означає визнати за вибіркою наявність зв'язку між змінними в генеральній сукупності, коли насправді її там немає.

Зазвичай рівень значущості приймається рівним 5% чи 1%. Чим вищий рівень значущості (чим менше
), тим вище рівень надійностітіста, рівний
, тобто. Тим більше шанс уникнути помилки визнання щодо вибірки наявності зв'язку у генеральної сукупності насправді незв'язаних між собою змінних. Але зі зростанням рівня значущості зростає небезпека вчинення помилки другого роду– відкинути правильну нульову гіпотезу, тобто. не помітити за вибіркою наявний насправді зв'язок змінних у генеральній сукупності. Тому залежно від того, яка помилка має великі негативні наслідки, вибирають той чи інший рівень значущості.

Для обраного рівня значущості за розподілом Фішера визначається табличне значення
ймовірність перевищення, якого у вибірці потужністю , отриманої з генеральної сукупності без зв'язку між змінними, вбирається у рівня значимості.
порівнюється з фактичним значенням критерію для регресійного рівняння .

Якщо виконується умова
, то помилкове виявлення зв'язку зі значенням
-критерію рівним або великим за вибіркою з генеральної сукупності з незв'язаними між собою змінними відбуватиметься з ймовірністю меншою за рівень значущості. Відповідно до правила "дуже рідкісних подій не буває", приходимо до висновку, що встановлений за вибіркою зв'язок між змінними є і в генеральній сукупності, з якої вона отримана.

Якщо ж виявляється
, то рівняння регресії статистично значимо. Іншими словами існує реальна ймовірність того, що за вибіркою встановлено не існує в реальності зв'язок між змінними. До рівняння, яке не витримало перевірку на статистичну значущість, відносяться так само, як і до ліків із терміном придатності, що минув – такі ліки не обов'язково зіпсовані, але якщо немає впевненості в їх якості, то їх вважають за краще не використовувати. Це правило не вберігає від усіх помилок, але дозволяє уникнути найбільш грубих, що також досить важливо.

Другий варіант перевірки, більш зручний у разі використання електронних таблиць, це зіставлення ймовірності появи отриманого значення
-Критерія з рівнем значимості. Якщо ця ймовірність виявляється нижче за рівень значущості
, Отже рівняння статистично значуще, інакше немає.

Після того, як виконано перевірку статистичної значущості регресійного рівняння в цілому корисно, особливо для багатовимірних залежностей здійснити перевірку на статистичну значущість отриманих коефіцієнтів регресії. Ідеологія перевірки така ж як і при перевірці рівняння в цілому, але як критерій використовується -критерій Стьюдента, Який визначається за формулами:

і

де: , - значення критерію Стьюдента для коефіцієнтів і відповідно;

- Залишкова дисперсія рівняння регресії;

- Число точок у вибірці;

- кількість змінних у вибірці, для парної лінійної регресії
.

Отримані фактичні значення критерію Стьюдента порівнюються з табличними значеннями
отриманими з розподілу Стьюдента. Якщо виявляється, що
, то відповідний коефіцієнт статистично значимий, інакше немає. Другий варіант перевірки статистичної значущості коефіцієнтів – визначити ймовірність появи критерію Стьюдента
та порівняти з рівнем значущості
.

Для змінних, чиї коефіцієнти виявилися статистично не значущими, велика ймовірність того, що їх вплив на залежну змінну в генеральній сукупності взагалі відсутній. Тому або необхідно збільшити кількість точок у вибірці, тоді можливо коефіцієнт стане статистично значущим і заодно уточниться його значення, або як незалежні змінні знайти інші, більш тісно пов'язані з залежною змінною. Точність прогнозування у разі обох випадках зросте.

Як експресний метод оцінки значущості коефіцієнтів рівняння регресії можна застосовувати таке правило - якщо критерій Стьюдента більше 3, то такий коефіцієнт, як правило, виявляється статистично значущим. А взагалі вважається, що для отримання статистично значущих рівнянь регресії необхідно, щоб виконувалася умова
.

Стандартна помилка прогнозування отриманого рівняння регресії невідомого значення
при відомому
оцінюють за формулою:

Таким чином, прогноз з довірчою ймовірністю 68% може бути представлений у вигляді:

Якщо потрібна інша довірча можливість
, то рівня значимості
необхідно знайти критерій Стьюдента
і довірчий інтервалдля прогнозу з рівнем надійності
дорівнюватиме
.

Прогнозування багатовимірних та нелінійних залежностей

Якщо прогнозована величина залежить від кількох незалежних змінних, то в цьому випадку є багатовимірна регресіявиду:

де:
- Коефіцієнти регресії, що описують вплив змінних
на прогнозовану величину.

Методика визначення коефіцієнтів регресії не відрізняється від парної лінійної регресії, особливо при використанні електронної таблиці, так як там застосовується та сама функція і для парної і для багатовимірної лінійної регресії. У цьому бажано щоб між незалежними змінними були відсутні взаємозв'язки, тобто. зміна однієї змінної не позначалося на значення інших змінних. Але ця вимога не є обов'язковою, важливо щоб між змінними були відсутні функціональні лінійні залежності. Описані вище процедури перевірки статистичної значущості отриманого рівняння регресії та її окремих коефіцієнтів, оцінка точності прогнозування залишається як і для випадку парної лінійної регресії. У той же час застосування багатомірних регресій замість парної зазвичай дозволяє при належному виборі змінних суттєво підвищити точність опису поведінки залежної змінної, а отже, і точність прогнозування.

Крім цього, рівняння багатовимірної лінійної регресії дозволяють описати і нелінійну залежність прогнозованої величини від незалежних змінних. Процедура приведення нелінійного рівняння до лінійного виду називається лінеаризацією. Зокрема, якщо ця залежність описується поліномом ступеня відмінного від 1, то, здійснивши заміну змінних зі ступенями відмінними від одиниці на нові змінні в першому ступені, отримуємо завдання багатовимірної лінійної регресії замість нелінійної. Так, наприклад, якщо вплив незалежної змінної описується параболою виду

то заміна
дозволяє перетворити нелінійне завдання до багатовимірного лінійного вигляду

Так само легко можуть бути перетворені нелінійні завдання, у яких нелінійність виникає внаслідок того, що прогнозована величина залежить від твору незалежних змінних. Для обліку такого впливу необхідно запровадити нову змінну, що дорівнює цьому твору.

У тих випадках, коли нелінійність описується складнішими залежностями, лінеаризація можлива за рахунок перетворення координат. Для цього розраховуються значення
та будуються графіки залежності вихідних точок у різних комбінаціях перетворених змінних. Та комбінація перетворених координат або перетворених і не перетворених координат, в якій залежність найближче до прямої лінії підказує заміну змінних, яка призведе до перетворення нелінійної залежності до лінійного вигляду. Наприклад, нелінійна залежність виду

перетворюється на лінійну вигляду

де:
,
і
.

Отримані коефіцієнти регресії для перетвореного рівняння залишаються незміщеними та ефективними, але перевірка статистичної значущості рівняння та коефіцієнтів неможлива

Перевірка обґрунтованості застосування методу найменших квадратів

Застосування методу найменших квадратів забезпечує ефективність та незміщеність оцінок коефіцієнтів рівняння регресії за дотримання наступних умов (умов Гауса-Маркова):

1.

2.

3. значення не залежать один від одного

4. значення не залежать від незалежних змінних

Найбільш просто можна перевірити дотримання цих умов шляхом побудови графіків залишків
залежно від потім від незалежної (незалежних) змінних. Якщо точки на цих графіках розташовані в коридорі розташованому симетрично осі абсцис і розташування точок не проглядаються закономірності, то умови Гауса-Маркова виконані і можливості підвищити точність рівняння регресії відсутні. Якщо це не так, то існує можливість суттєво підвищити точність рівняння і для цього необхідно звернутись до спеціальної літератури.

Регресійний аналіз - це статистичний метод дослідження, що дозволяє показати залежність того чи іншого параметра від однієї чи кількох незалежних змінних. У докомп'ютерну епоху його застосування було досить складно, особливо якщо йшлося про великі обсяги даних. Сьогодні, дізнавшись, як побудувати регресію в Excel, можна вирішувати складні статистичні завдання буквально за пару хвилин. Нижче представлені конкретні приклади галузі економіки.

Види регресії

Саме це поняття було введено в математику у 1886 році. Регресія буває:

  • лінійної;
  • параболічній;
  • статечною;
  • експоненційною;
  • гіперболічній;
  • показовою;
  • логарифмічні.

Приклад 1

Розглянемо завдання визначення залежності кількості членів колективу, що звільнилися, від середньої зарплати на 6 промислових підприємствах.

Завдання. На шести підприємствах проаналізували середньомісячну заробітну плату та кількість працівників, які звільнилися за власним бажанням. У табличній формі маємо:

Кількість звільнених

Зарплата

30000 рублів

35000 рублів

40000 рублів

45000 рублів

50000 рублів

55000 рублів

60000 рублів

Для завдання визначення залежності кількості працівників, що звільнилися, від середньої зарплати на 6 підприємствах модель регресії має вигляд рівняння Y = а 0 + а 1 x 1 +…+а k x k , де х i — що впливають змінні, a i — коефіцієнти регресії, a k — число факторів.

Для цього завдання Y — це показник співробітників, що звільнилися, а впливаючий фактор — зарплата, яку позначаємо X.

Використання можливостей табличного процесора «Ексель»

Аналізу регресії в Excel має передувати застосування наявних табличних даних вбудованих функцій. Однак для цього краще скористатися дуже корисною надбудовою «Пакет аналізу». Для його активації потрібно:

  • з вкладки "Файл" перейти до розділу "Параметри";
  • у вікні вибрати рядок «Надбудови»;
  • клацнути на кнопці «Перейти», розташованої внизу, праворуч від рядка «Управління»;
  • поставити галочку поруч із назвою «Пакет аналізу» та підтвердити свої дії, натиснувши «Ок».

Якщо все зроблено правильно, у правій частині вкладки "Дані", розташованому над робочим листом "Ексель", з'явиться потрібна кнопка.

в Excel

Тепер, коли під рукою є всі необхідні віртуальні інструменти для здійснення економетричних розрахунків, можемо розпочати вирішення нашого завдання. Для цього:

  • клацаємо по кнопці «Аналіз даних»;
  • у вікні натискаємо на кнопку «Регресія»;
  • в вкладку, що з'явилася, вводимо діапазон значень для Y (кількість звільнених працівників) і для X (їх зарплати);
  • підтверджуємо свої дії, натиснувши кнопку «Ok».

В результаті програма автоматично заповнить новий аркуш табличного процесора даними аналізу регресії. Зверніть увагу! В Excel є можливість самостійно задати місце, якому ви надаєте перевагу для цієї мети. Наприклад, це може бути той самий аркуш, де є значення Y і X, або навіть нова книга, спеціально призначена для зберігання подібних даних.

Аналіз результатів регресії для R-квадрату

В Excel дані отримані в ході обробки даних прикладу, що розглядається, мають вигляд:

Насамперед, слід звернути увагу до значення R-квадрата. Він є коефіцієнтом детермінації. У цьому прикладі R-квадрат = 0,755 (75,5%), тобто розрахункові параметри моделі пояснюють залежність між параметрами, що розглядаються, на 75,5 %. Чим вище значення коефіцієнта детермінації, тим вибрана модель вважається застосовнішою для конкретної задачі. Вважається, що вона коректно визначає реальну ситуацію за значення R-квадрату вище 0,8. Якщо R-квадрату<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Аналіз коефіцієнтів

Число 64,1428 показує, яким буде значення Y, якщо всі змінні xi в моделі, що розглядається, обнуляться. Іншими словами можна стверджувати, що на значення аналізованого параметра впливають інші фактори, не описані в конкретній моделі.

Наступний коефіцієнт -0,16285, розташований у осередку B18, показує вагомість впливу змінної Х на Y. Це означає, що середньомісячна зарплата співробітників у межах аналізованої моделі впливає кількість звільнених з вагою -0,16285, т. е. ступінь її впливу зовсім невелика. Знак «-» свідчить про те, що коефіцієнт має негативне значення. Це очевидно, оскільки всім відомо, що чим більша зарплата на підприємстві, тим менше людей висловлюють бажання розірвати трудовий договір чи звільняється.

Множинна регресія

Під таким терміном розуміється рівняння зв'язку з кількома незалежними змінними видами:

y=f(x 1 +x 2 +…x m) + ε, де y — це результативна ознака (залежна змінна), а x 1 , x 2 , …x m — ознаки-фактори (незалежні змінні).

Оцінка параметрів

Для множинної регресії (МР) її здійснюють, використовуючи метод найменших квадратів (МНК). Для лінійних рівнянь виду Y = a + b 1 x 1 +…+b m x m + ε будуємо систему нормальних рівнянь (див. нижче)

Щоб зрозуміти принцип методу, розглянемо двофакторний випадок. Тоді маємо ситуацію, що описується формулою

Звідси отримуємо:

де σ - це дисперсія відповідної ознаки, відображеної в індексі.

МНК застосуємо до рівняння МР в масштабі, що стандартизується. У такому разі отримуємо рівняння:

в якому t y , t x 1, ... t xm - Змінні, що стандартизуються, для яких середні значення рівні 0; β i – стандартизовані коефіцієнти регресії, а середньоквадратичне відхилення – 1.

Зверніть увагу, що всі β i в даному випадку задані як нормовані та централізовані, тому їх порівняння між собою вважається коректним та допустимим. Крім того, прийнято здійснювати відсівання факторів, відкидаючи ті з них, які мають найменші значення βi.

Завдання з використанням рівняння лінійної регресії

Припустимо, є таблиця динаміки ціни конкретного товару протягом останніх 8 місяців. Необхідно ухвалити рішення про доцільність придбання його партії за ціною 1850 руб./т.

номер місяця

назва місяця

ціна товару N

1750 рублів за тонну

1755 рублів за тонну

1767 рублів за тонну

1760 рублів за тонну

1770 рублів за тонну

1790 рублів за тонну

1810 рублів за тонну

1840 рублів за тонну

Для вирішення цього завдання в табличному процесорі «Ексель» потрібно задіяти вже відомий за наведеним вище прикладом інструмент «Аналіз даних». Далі вибирають розділ «Регресія» та задають параметри. Потрібно пам'ятати, що у полі «Вхідний інтервал Y» має вводитися діапазон значень для залежної змінної (у разі ціни на товар у конкретні місяці року), а «Вхідний інтервал X» — для незалежної (номер місяця). Підтверджуємо дії натисканням OK. На новому аркуші (якщо було зазначено) отримуємо дані для регресії.

Будуємо за ними лінійне рівняння виду y=ax+b, де як параметри a і b виступають коефіцієнти рядка з найменуванням номера місяця та коефіцієнти та рядки «Y-перетин» з аркуша з результатами регресійного аналізу. Таким чином, лінійне рівняння регресії (УР) для задачі 3 записується у вигляді:

Ціна товару N = 11,714* номер місяця + 1727,54.

або в позначеннях алгебри

y = 11,714 x + 1727,54

Аналіз результатів

Щоб вирішити, чи адекватно отримане рівняння лінійної регресії, використовуються коефіцієнти множинної кореляції (КМК) та детермінації, а також критерій Фішера та критерій Стьюдента. У таблиці «Ексель» з результатами регресії вони виступають під назвами множинний R, R-квадрат, F-статистика та t-статистика відповідно.

КМК R дає можливість оцінити тісноту ймовірнісного зв'язку між незалежною та залежною змінними. Її високе значення свідчить про досить сильний зв'язок між змінними «Номер місяця» та «Ціна товару N у рублях за 1 тонну». Проте характер цього зв'язку залишається невідомим.

Квадрат коефіцієнта детермінації R 2 (RI) є числову характеристику частки загального розкиду і показує, розкид якої частини експериментальних даних, тобто. значень залежної змінної відповідає рівнянню лінійної регресії У даній задачі ця величина дорівнює 84,8%, тобто статистичні дані з високим ступенем точності описуються отриманим УР.

F-статистика, яка називається також критерієм Фішера, використовується для оцінки значущості лінійної залежності, спростовуючи або підтверджуючи гіпотезу про її існування.

(Критерій Стьюдента) допомагає оцінювати значущість коефіцієнта при невідомій чи вільного члена лінійної залежності. Якщо значення t-критерію > t кр, гіпотеза про незначущість вільного члена лінійного рівняння відкидається.

У розглянутій задачі для вільного члена за допомогою інструментів «Ексель» було отримано, що t=169,20903, а p=2,89Е-12, тобто маємо нульову ймовірність того, що буде відкинута вірна гіпотеза про незначущість вільного члена. Для коефіцієнта за невідомої t=5,79405, а p=0,001158. Іншими словами ймовірність того, що буде відкинута вірна гіпотеза про незначущість коефіцієнта за невідомої, дорівнює 0,12%.

Отже, можна стверджувати, що отримане рівняння лінійної регресії адекватно.

Завдання про доцільність купівлі пакету акцій

Множинна регресія в Excel виконується з використанням того ж інструменту «Аналіз даних». Розглянемо конкретне прикладне завдання.

Керівництво компанія «NNN» має ухвалити рішення про доцільність купівлі 20% пакету акцій АТ «MMM». Вартість пакету (СП) складає 70 млн. американських доларів. Фахівцями NNN зібрані дані про аналогічні угоди. Було ухвалено рішення оцінювати вартість пакета акцій за такими параметрами, вираженими в мільйонах американських доларів, як:

  • кредиторська заборгованість (VK);
  • обсяг річного обороту (VO);
  • дебіторська заборгованість (VD);
  • вартість основних фондів (СОФ).

Крім того, використовується параметр заборгованості підприємства із зарплати (V3 П) у тисячах американських доларів.

Рішення засобами табличного процесора Excel

Насамперед, необхідно скласти таблицю вихідних даних. Вона має такий вигляд:

  • викликають вікно "Аналіз даних";
  • обирають розділ «Регресія»;
  • у віконце «Вхідний інтервал Y» вводять діапазон значень залежних змінних зі стовпця G;
  • клацають по іконці з червоною стрілкою праворуч від вікна "Вхідний інтервал X" і виділяють на аркуші діапазон всіх значень зі стовпців B, C, D, F.

Позначають пункт «Новий робочий лист» та натискають «Ok».

Отримують аналіз регресії для цього завдання.

Вивчення результатів та висновки

«Збираємо» із заокруглених даних, представлених вище на аркуші табличного процесора Excel, рівняння регресії:

СП = 0,103 * СОФ + 0,541 * VO - 0,031 * VK + 0,405 * VD +0,691 * VZP - 265,844.

У більш звичному математичному вигляді його можна записати як:

y = 0,103 * x1 + 0,541 * x2 - 0,031 * x3 +0,405 * x4 +0,691 * x5 - 265,844

Дані для АТ «MMM» представлені у таблиці:

Підставивши їх у рівняння регресії, одержують цифру в 64,72 млн американських доларів. Це означає, що акції АТ «MMM» не варто купувати, оскільки їхня вартість у 70 млн американських доларів досить завищена.

Як бачимо, використання табличного процесора «Ексель» та рівняння регресії дозволило ухвалити обґрунтоване рішення щодо доцільності цілком конкретної угоди.

Тепер ви знаєте, що таке регресія. Приклади в Excel, розглянуті вище, допоможуть вам вирішити практичні завдання з галузі економетрики.

Підсумкові тести з економетрики

1. Оцінка значущості параметрів рівняння регресії складає основі:

А) t – критерію Стьюдента;

б) F-критерія Фішера - Снедекору;

в) середньої квадратичної помилки;

г) середньої помилки апроксимації.

2. Коефіцієнт регресії у рівнянні , що характеризує зв'язок між обсягом реалізованої продукції (млн. руб.) та прибутком підприємств автомобільної промисловості за рік (млн. руб.) означає, що при збільшенні обсягу реалізованої продукції на 1 млн. руб. прибуток збільшується на:

г) 0,5млн. руб.;

в) 500тис. руб.;

р) 1,5 млн. крб.

3. Кореляційне відношення (індекс кореляції) вимірює ступінь тісноти зв'язку між Х таY:

а) лише за нелінійної форми залежності;

Б) за будь-якої форми залежності;

в) лише за лінійної залежності.

4. У напрямку зв'язку бувають:

а) помірні;

Б) прямі;

в) прямолінійні.

5. За 17 спостереженнями побудовано рівняння регресії:
.
Для перевірки значущості рівняння обчисленоспостережуване значенняt- Статистики: 3.9. Висновок:

А) Рівняння значимо при a = 0,05;

б) Рівняння незначне за a = 0,01;

в) Рівняння незначне за a = 0,05.

6. Які наслідки порушення припущення МНК «математичне очікування регресійних залишків дорівнює нулю»?

А) Зміщені оцінки коефіцієнтів регресії;

б) Ефективні, але неспроможні оцінки коефіцієнтів регресії;

в) неефективні оцінки коефіцієнтів регресії;

г) Неспроможні оцінки коефіцієнтів регресії.

7. Яке з таких тверджень правильне у разі гетероскедастичності залишків?

А) Висновки з t та F-статистиків є ненадійними;

г) Оцінки параметрів рівняння регресії є усунутими.

8. На чому ґрунтується тест рангової кореляції Спірмена?

А) На використанні t – статистики;

в) На використанні ;

9. На чому базується тест Уайта?

б) На використанні F-статистики;

В) На використанні ;

г) На графічному аналізі залишків.

10. Яким способом можна скористатися для усунення автокореляції?

11. Як називається порушення припущення про сталість дисперсії залишків?

а) мультиколінеарність;

б) автокореляція;

В) Гетероскедастичність;

г) Гомоскедастичність.

12. Фіктивні змінні вводяться у:

а) лише у лінійні моделі;

б) лише у множинну нелінійну регресію;

в) лише у нелінійні моделі;

Г) як у лінійні, так і в нелінійні моделі, що приводяться до лінійного вигляду.

13. Якщо у матриці парних коефіцієнтів кореляції зустрічаються
, то це свідчить:

А) Про наявність мультиколінеарності;

б) Про відсутність мультиколлінеарності;

в) Про наявність автокореляції;

г) Про відсутність гетероскедастичності.

14. За допомогою якого заходу неможливо позбутися мультиколінеарності?

а) збільшення обсягу вибірки;

Г) Перетворення випадкової складової.

15. Якщо
і ранг матриці А менший (К-1) то рівняння:

а) надіденцифіковано;

Б) неідентифіковано;

в) точно ідентифіковано.

16.Рівняння регресії має вигляд:

а)
;

б)
;

в)
.

17. У чому полягає проблема ідентифікації моделі?

А) одержання однозначно визначених параметрів моделі, заданої системою одночасних рівнянь;

б) вибір та реалізація методів статистичного оцінювання невідомих параметрів моделі за вихідними статистичними даними;

в) перевірка адекватності моделі.

18. Який метод застосовується для оцінювання параметрів надіденцифікованого рівняння?

В) ДМНК, КМНК;

19. Якщо якісна змінна маєkальтернативних значень, то при моделюванні використовуються:

А) (k-1) фіктивна змінна;

б) kфіктивних змінних;

в) (k+1) фіктивна змінна.

20. Аналіз тісноти та напрями зв'язків двох ознак здійснюється на основі:

а) парного коефіцієнта кореляції;

б) коефіцієнт детермінації;

в) множинного коефіцієнта кореляції.

21. У лінійному рівнянні x = а 0 +a 1 x коефіцієнт регресії показує:

а) тісноту зв'язку;

б) частку дисперсії "Y", залежну від "X";

В) на скільки в середньому зміниться "Y" за зміни "X" на одну одиницю;

г) помилку коефіцієнта кореляції.

22. Який показник використовується для визначення частини варіації, обумовленої зміною величини фактора, що вивчається?

а) коефіцієнт варіації;

б) коефіцієнт кореляції;

В) коефіцієнт детермінації;

г) коефіцієнт еластичності.

23. Коефіцієнт еластичності показує:

А) на скільки % зміниться значення y за зміни x на 1 %;

б) на скільки одиниць свого виміру зміниться значення y при зміні x на 1 %;

в) на скільки % зміниться значення y при зміні x на од. свого виміру.

24. Які методи можна застосувати для виявлення гетероскедастичності?

А) Тест Голфелда-Квандта;

Б) Тест рангової кореляції Спірмена;

в) Тест Дарбіна-Вотсона.

25. На чому ґрунтується тест Голфельда-Квандта

а) На використанні t-статистики;

Б) На використанні F – статистики;

в) На використанні ;

г) На графічному аналізі залишків.

26. За допомогою яких методів не можна усунути автокореляцію залишків?

а) узагальненим методом найменших квадратів;

Б) Виваженим способом найменших квадратів;

В) Методом максимальної правдоподібності;

Г) Двокроковим методом найменших квадратів.

27. Як називається порушення припущення про незалежність залишків?

а) мультиколінеарність;

Б) автокореляція;

в) Гетероскедастичність;

г) Гомоскедастичність.

28. Яким методом можна скористатися для усунення гетероскедастичності?

А) узагальненим методом найменших квадратів;

б) Виваженим шляхом найменших квадратів;

в) методом максимальної правдоподібності;

г) Двокроковим методом найменших квадратів.

30. Якщо поt-критерію більшість коефіцієнтів регресії статистично значущі, а модель загалом поF- критерію незначна то це може свідчити про:

а) мультиколінеарності;

Б) Про автокореляцію залишків;

в) Про гетероскедастичність залишків;

г) Такий варіант неможливий.

31. Чи можливо за допомогою перетворення змінних позбавитися мультиколлінеарності?

а) Цей захід ефективний тільки при збільшенні обсягу вибірки;

32. За допомогою якого методу можна визначити оцінки параметра рівняння лінійної регресії:

А) шляхом найменшого квадрата;

б) кореляційно-регресійного аналізу;

в) дисперсійний аналіз.

33. Побудовано множинне лінійне рівняння регресії з фіктивними змінними. Для перевірки значимості окремих коефіцієнтів використовується розподіл:

а) Нормальне;

б) Стьюдента;

в) Пірсон;

г) Фішера-Снідекору.

34. Якщо
і ранг матриці А більший (К-1) то рівняння:

А) надіденцифіковано;

б) неідентифіковано;

в) точно ідентифіковано.

35. Для оцінювання параметрів точно ідентифікованої системи рівнянь застосовується:

а) ДМНК, КМНК;

б) ДМНК, МНК, КМНК;

36. Критерій Чоу ґрунтується на застосуванні:

А) F – статистики;

б) t – статистики;

в) критерії Дарбіна-Уотсона.

37. Фіктивні змінні можуть набувати значення:

г) будь-які значення.

39. За 20 спостереженнями побудовано рівняння регресії:
.
Для перевірки значущості рівняння обчислено значення статистики:4.2. Висновки:

а) Рівняння значимо при a = 0.05;

б) Рівняння незначне при a = 0.05;

в) Рівняння незначне при a = 0.01.

40. Яке з таких тверджень неправильне у разі гетероскедастичності залишків?

а) Висновки з tіF-статистиків є ненадійними;

б) Гетероскедастичність проявляється через низьке значення статистики Дарбіна-Уотсона;

в) При гетероскедастичності оцінки залишаються ефективними;

г) Оцінки є усунутими.

41. Тест Чоу заснований на порівнянні:

а) дисперсій;

б) коефіцієнтів детермінації;

в) математичних очікувань;

г) середніх.

42. Якщо у тесті Чоу
то вважається:

А) що розбиття на подинтервали доцільно з погляду поліпшення якості моделі;

б) модель є статистично незначущою;

в) модель є статистично значущою;

г) що немає сенсу розбивати вибірку на частини.

43. Фіктивні змінні є змінними:

а) якісними;

б) випадковими;

в) кількісними;

г) логічними.

44. Який із перерахованих методів не може бути застосований для виявлення автокореляції?

а) Метод рядів;

б) критерій Дарбіна-Уотсона;

в) тест рангової кореляції Спірмена;

Г) тест Уайт.

45. Найпростіша структурна форма моделі має вигляд:

а)

б)

в)

г)
.

46. ​​За допомогою яких заходів можна позбутися мультиколлінеарності?

а) збільшення обсягу вибірки;

б) Винятки змінних висококорельованих з іншими;

в) зміна специфікації моделі;

г) Перетворення випадкової складової.

47. Якщо
і ранг матриці А дорівнює (К-1) то рівняння:

а) надіденцифіковано;

б) неідентифіковано;

В) точно ідентифіковано;

48. Модель вважається ідентифікованою, якщо:

а) серед рівнянь моделі є хоча одне нормальне;

Б) кожне рівняння системи ідентифікується;

в) серед рівнянь моделі є хоча б одне неідентифіковане;

г) серед рівнянь моделі є хоча б одне надідентифіковане.

49. Який метод застосовується для оцінювання параметрів неіденцифікованого рівняння?

а) ДМНК, КМНК;

б) ДМНК, МНК;

У) параметри такого рівняння не можна оцінити.

50. На стику яких галузей знань виникла економетрика:

а) економічна теорія; економічна та математична статистика;

б) економічна теорія, математична статистика та теорія ймовірності;

в) економічна та математична статистика, теорія ймовірності.

51. У множинному лінійному рівнянні регресії будуються довірчі інтервали для коефіцієнтів регресії за допомогою розподілу:

а) Нормального;

Б) Стьюдента;

в) Пірсон;

г) Фішера-Снідекору.

52. За 16 спостереженнями збудовано парне лінійне рівняння регресії. Дляперевірки значущості коефіцієнта регресії обчисленоt на6л =2.5.

а) Коефіцієнт незначний при a = 0.05;

б) Коефіцієнт значимий при a = 0.05;

в) Коефіцієнт значимий за a=0.01.

53. Відомо, що між величинамиXіYіснуєпозитивний зв'язок. У яких межахперебуває парний коефіцієнт кореляції?

а) від -1 до 0;

б) від 0 до 1;

У) від –1 до 1.

54. Множинний коефіцієнт кореляції дорівнює 0.9. Який відсотокдисперсії результативної ознаки пояснюється впливом усіхфакторні ознаки?

55. Який із перерахованих методів не може бути застосований для виявлення гетероскедастичності?

А) Тест Голфелда-Квандта;

б) Тест рангової кореляції Спірмена;

в) метод рядів.

56. Наведена форма моделі є:

а) систему нелінійних функцій екзогенних змінних від ендогенних;

Б) систему лінійних функцій ендогенних змінних від екзогенних;

в) систему лінійних функцій екзогенних змінних від ендогенних;

г) систему нормальних рівнянь.

57. У яких межах змінюється приватний коефіцієнт кореляції, обчислений за рекуретними формулами?

а) від - до + ;

б) від 0 до 1;

в) від 0 до + ;

г) від -1 до +1.

58. У яких межах змінюється приватний коефіцієнт кореляції, обчислений через коефіцієнт детермінації?

а) від - до + ;

Б) від 0 до 1;

в) від 0 до + ;

г) від -1 до +1.

59. Екзогенні змінні:

а) залежні змінні;

Б) незалежні змінні;

61. При додаванні до рівняння регресії ще одного пояснюючого фактора множинний коефіцієнт кореляції:

а) зменшиться;

б) зросте;

в) збереже своє значення.

62. Побудовано гіперболічне рівняння регресії:Y= a+ b/ X. ДляДля перевірки значущості рівняння використовується розподіл:

а) Нормальне;

Б) Стьюдента;

в) Пірсон;

г) Фішера-Снідекору.

63. Для яких видів систем параметри окремих економетричних рівнянь можна знайти з допомогою традиційного методу найменших квадратів?

а) система нормальних рівнянь;

Б) система незалежних рівнянь;

В) система рекурсивних рівнянь;

г) система взаємозалежних рівнянь.

64. Ендогенні змінні:

А) залежні змінні;

б) незалежні змінні;

в) датовані попередніми моментами часу.

65. У яких межах змінюється коефіцієнт детермінації?

а) від 0 до + ;

б) від - до + ;

в) від 0 до +1;

г) від -l до +1.

66. Побудовано множинне лінійне рівняння регресії. Для перевірки значимості окремих коефіцієнтів використовується розподіл:

а) Нормальне;

б) Стьюдента;

в) Пірсон;

Г) Фішера-Снідекору.

67. При додаванні до рівняння регресії ще одного пояснюючого фактора коефіцієнт детермінації:

а) зменшиться;

Б) зросте;

в) збереже своє значення;

г) не зменшиться.

68. Суть методу найменших квадратів у тому, что:

А) оцінка визначається за умови мінімізації суми квадратів відхилень вибіркових даних від оцінки, що визначається;

б) оцінка визначається за умови мінімізації суми відхилень вибіркових даних від оцінки, що визначається;

в) оцінка визначається за умови мінімізації суми квадратів відхилень вибіркової середньої від вибіркової дисперсії.

69. До якого класу нелінійних регресій належить парабола:

73. До якого класу нелінійних регресій відноситься експоненційна крива:

74. До якого класу нелінійних регресій належить функція виду ŷ
:

А) регресії, нелінійні щодо включених до аналізу змінних, але лінійних за оцінюваними параметрами;

б) нелінійні регресії за оцінюваними параметрами.

78. До якого класу нелінійних регресій відноситься функція виду ŷ
:

а) регресії, нелінійні щодо включених до аналізу змінних, але лінійних за оцінюваними параметрами;

Б) нелінійні регресії за оцінюваними параметрами.

79. У рівнянні регресії у формі гіперболи ŷ
якщо величина
b >0 , то:

а) зі збільшенням факторного ознаки хзначення результативної ознаки ууповільнено зменшуються, і при х→∞середня величина убуде рівна а;

б) то значення результативної ознаки узростає із уповільненим зростанням зі збільшенням факторного ознаки х, і при х→∞

81. Коефіцієнт еластичності визначається за формулою

а) лінійної функції;

б) Параболи;

в) гіперболи;

г) Показовою кривою;

д) Ступінневої.

82. Коефіцієнт еластичності визначається за формулою
для моделі регресії у формі:

а) лінійної функції;

Б) Параболи;

в) гіперболи;

г) Показовою кривою;

д) Ступінневої.

86. Рівняння
називається:

а) лінійним трендом;

б) параболічним трендом;

в) гіперболічний тренд;

г) експоненційним трендом.

89. Рівняння
називається:

а) лінійним трендом;

б) параболічним трендом;

в) гіперболічний тренд;

г) експоненційним трендом.

90. Система види називається:

а) системою незалежних рівнянь;

б) системою рекурсивних рівнянь;

в) системою взаємозалежних (спільних, одночасних) рівнянь.

93. Економетрику можна визначити як:

А) це самостійна наукова дисципліна, що об'єднує сукупність теоретичних результатів, прийомів, методів та моделей, призначених для того, щоб на базі економічної теорії, економічної статистики та математико-статистичного інструментарію надавати конкретний кількісний вираз загальним (якісним) закономірностям, зумовленим економічною теорією;

Б) наука про економічні виміри;

У) статистичний аналіз економічних даних.

94. До завдань економетрики можна віднести:

А) прогноз економічних та соціально-економічних показників, що характеризують стан та розвиток аналізованої системи;

Б) імітація можливих сценаріїв соціально-економічного розвитку системи для виявлення того, як плановані зміни тих чи інших параметрів, що піддаються управлінню, позначаться на вихідних характеристиках;

в) перевірка гіпотез за статистичними даними.

95. За характером розрізняють зв'язки:

А) функціональні та кореляційні;

б) функціональні, криволінійні та прямолінійні;

в) кореляційні та зворотні;

г) статистичні та прямі.

96. При прямому зв'язку із збільшенням факторної ознаки:

а) результативна ознака зменшується;

б) результативна ознака не змінюється;

В) результативна ознака зростає.

97. Які методи використовуються для виявлення наявності, характеру та напряму зв'язку у статистиці?

а) середніх величин;

Б) порівняння паралельних рядів;

В) метод аналітичного угруповання;

г) відносних величин;

д) графічний метод.

98. Який метод використовується виявлення форми впливу одних чинників інші?

а) кореляційний аналіз;

Б) регресійний аналіз;

в) індексний аналіз;

г) дисперсійний аналіз.

99. Який метод використовується для кількісної оцінки сили впливу одних факторів на інші:

а) кореляційний аналіз;

б) регресійний аналіз;

в) метод середніх величин;

г) дисперсійний аналіз.

100. Які показники за своєю величиною існують у межах від мінус до плюс одиниці:

а) коефіцієнт детермінації;

б) кореляційне ставлення;

У) лінійний коефіцієнт кореляції.

101. Коефіцієнт регресії при однофакторній моделі показує:

а) скільки одиниць змінюється функція при зміні аргументу однією одиницю;

б) скільки відсотків змінюється функція однією одиницю зміни аргументу.

102. Коефіцієнт еластичності показує:

а) на скільки відсотків змінюється функція зі зміною аргументу одну одиницю свого виміру;

Б) на скільки відсотків змінюється функція із зміною аргументу на 1%;

в) скільки одиниць свого виміру змінюється функція зі зміною аргументу на 1%.

105. Розмір індексу кореляції, що дорівнює 0,087, свідчить:

А) про слабку їхню залежність;

б) про сильний взаємозв'язок;

в) про помилки у обчисленнях.

107. Розмір парного коефіцієнта кореляції, що дорівнює 1,12, свідчить:

а) про слабку їхню залежність;

б) про сильний взаємозв'язок;

В) про помилки у обчисленнях.

109. Які із наведених чисел можуть бути значеннями парного коефіцієнта кореляції:

111. Які із наведених чисел можуть бути значеннями множинного коефіцієнта кореляції:

115. Позначте правильну форму лінійного рівняння регресії:

а) ŷ
;

б) ŷ
;

в) ŷ
;

Г) ŷ
.

Поділіться з друзями або збережіть для себе:

Завантаження...