Знаходження коефіцієнтів рівняння парної регресії. Парна лінійна регресія (з демо)

1. Основні визначення та формули

Парна регресія- регресія (зв'язок) між двома змінними та тобто. модель виду:

де – залежна змінна (результативна ознака);

- незалежна пояснювальна змінна (ознака-фактор);

Обурення або стохастична змінна, що включає вплив неврахованих у моделі факторів.

Практично у кожному окремому випадку величина складається з двох доданків:

де – фактичне значення результативної ознаки;

Теоретичне значення результативної ознаки, знайдене з рівняння регресії. Знак «^» означає, що між змінними немає строгої функціональної залежності.

Розрізняють лінійніі нелінійнірегресії.

Лінійна регресіяописується рівнянням прямої

Нелінійні регресіїділяться на два класи:

1) регресії, нелінійні за змінними, що пояснюють, але лінійні за параметрами, що оцінюються., наприклад:

Поліноми різних ступенів

Рівностороння гіпербола

2) регресії, нелінійні за оцінюваними параметрами, наприклад:

Ступінь

Показова

Експонентна

Для побудови парної лінійної регресії обчислюють допоміжні величини (число спостережень).

Вибіркові середні: і

Вибіркова коваріаціяміж і

або

Коваріація- це числова характеристикаспільного розподілу двох випадкових величин

Вибіркова дисперсія для

або

Вибіркова дисперсія для

або

Вибіркова дисперсіяхарактеризує ступінь розкиду значень випадкової величини навколо середнього значення (варіабельність, мінливість).

Тісноту зв'язку явищ, що вивчаються, оцінює вибірковий коефіцієнт кореляціїміж і

Коефіцієнт кореляції змінюється не більше -1 до +1. Чим ближче від модуля до 1, тим ближче статистична залежність між і до лінійної функціональної.

Якщо =0, то лінійний зв'язок між і відсутній;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

Позитивне значення коефіцієнта свідчить у тому, то зв'язок між ознаками пряма (зі зростанням збільшується значення ), негативне значення - зв'язок зворотна (зі зростанням значення зменшується).

Побудова лінійної регресіїзводиться до оцінки її параметрів і Класичний підхід до оцінювання параметрів лінійної регресії заснований на методі найменших квадратів (МНК). МНК дозволяє одержати такі оцінки параметрів, у яких сума квадратів відхилень фактичних значень результативного ознаки від теоретичних мінімальна, тобто.

Для лінійної регресії параметри перебувають із системи нормальних рівнянь:

Вирішуючи систему, знаходимо вна

та параметр

Коефіцієнтпри факторної змінної показує, наскільки зміниться у середньому величина за зміни чинника на одиницю виміру.

Параметр коли Якщо не може дорівнювати 0, то не має економічного сенсу. Інтерпретувати можна лише знак при якщо відносна зміна результату відбувається повільніше, ніж зміна чинника, тобто. варіація результату менша від варіації фактора і навпаки.

Для оцінки якості побудованої моделі регресії можна використовувати коефіцієнт детермінаціїабо середню помилку апроксимації.

Дооефіцієнт детермінації

Або

показує частку дисперсії, що пояснюється регресією, у загальній дисперсії результативної ознаки Відповідно, величина характеризує частку дисперсії показника, викликану впливом неврахованих у моделі факторів та інших причин.

Що ближче до 1, то якісніша регресійна модель, тобто. побудована модель добре апроксимує вихідні дані.

Середня помилка апроксимації- це середнє відносне відхилення теоретичних значень фактичних тобто.

Побудоване рівняння регресії вважається задовільним, якщо значення не перевищує 10-12%.

Для лінійної регресії середній коефіцієнт еластичностізнаходиться за формулою:

Середній коефіцієнт еластичностіпоказує скільки відсотків у середньому за сукупністю зміниться результат своєї величини за зміни чинника на 1% від свого значення.

Оцінка значимостірівняння регресіїв цілому дається за допомогою -критерію Фішера, який полягає у перевірці гіпотези про статистичну незначущість рівняння регресії . Для цього виконується порівняння фактичез когоі критичного(табличного) значень - критерію Фішера .

визначається із співвідношення значень факторної та залишкової дисперсій, розрахованих однією ступінь свободи, тобто.

- максимально можливе значення критерію під впливом випадкових факторів при степенях свободи = 1, = -2 та рівні значущості знаходиться з таблиці - критерію Фішера (таблиця 1 додатка).

Рівень значущості- це можливість відкинути правильну гіпотезу за умови, що вона вірна.

Якщо то гіпотеза про відсутність зв'язку досліджуваного показника з чинником відхиляється і робиться висновок про суттєвість зв'язку з рівнем значущості (тобто. рівняння регресії значимо).

Якщо то гіпотеза приймається та визнається статистична незначимість та ненадійність рівняння регресії.

Для лінійної регресії значимістькоефіцієнтів регресіїоцінюють за допомогою - критерію Стьюдента, за яким висувається гіпотеза про випадкову природу показників, тобто. про незначне їх відмінність від нуля. Далі розраховуються фактичні значення критерію кожного з оцінюваних коефіцієнтів регресії, тобто.

де і - стандартні помилкипараметрів лінійної регресії визначаються за формулами:

- максимально можливе значення критерію Стьюдента під впливом випадкових факторів при даному ступені свободи =-2 та рівні значущості перебуває з таблиці критерію Стьюдента (таблиця 2 додатка).

Якщо то гіпотеза про несуттєвість коефіцієнта регресії відхиляється із рівнем значимості тобто. коефіцієнт (або) не випадково відрізняється від нуля і сформувався під впливом систематично чинного фактора

Якщо то гіпотеза не відхиляється та визнається випадкова природа формування параметра.

Значення лінійного коефіцієнта кореляціїтакож перевіряється за допомогою - критерію Стьюдента, тобто.

Гіпотеза про несуттєвість коефіцієнта кореляції відхиляється з рівнем значущості якщо

Зауваження.Для лінійної парної регресії перевірки гіпотез про значущість коефіцієнта і коефіцієнта кореляції рівносильні перевірці гіпотези про суттєвість рівняння регресії загалом, тобто.

Для розрахунку довірчого інтервалу визначають граничну помилку кожному за показника, тобто.

Довірчі інтервалидля коефіцієнтів лінійної регресії:

Якщо межі довірчого інтервалу потрапляє нуль, тобто. нижня межа негативна, а верхня позитивна, то параметр, що оцінюється, приймається нульовим, т.к. він не може одночасно набувати і позитивного, і негативного значення.

Прогнозне значеннявизначається шляхом підстановки рівняння регресії відповідного прогнозного значення Потім обчислюється середня стандартна помилка прогнозу

де

і будується довірчий інтервалпрогнозу

Інтервал може бути досить широким за рахунок малого обсягу спостережень.

Регресії, нелінійні за включеними змінними , приводяться до лінійного вигляду простою заміною змінних, а подальша оцінка параметрів проводиться за допомогою МНК.

Гіперболтична регресія:

Р егресії , нелінійні е за оцінюваними параметрами , діляться на два типи: внутрішньо нелінійніі т.п. (До лінійного вигляду не наводяться) і внутрішньо лінійні(наводяться до лінійного вигляду за допомогою відповідних перетворень), наприклад:

Експонентна регресія:

Лінеарізуюче перетворення:

Ступенева регресія:

Лінеарізуюче перетворення:

Показникная регресія:

Лінеарізуюче перетворення:

Логарифмічнийя регресія:

Лінеарізуюче перетворення:

2. Вирішення типових завдань

приклад9 .1 . По 15 сільськогосподарським підприємствам (табл. 9.1) відомі: - кількість техніки на одиницю посівної площі (од/га) та - обсяг вирощеної продукції (тис. ден. од.). Необхідно:

1) визначити залежність від

2) побудувати кореляційні поля та графік рівняння лінійної регресії на

3) зробити висновок про якість моделі та розрахувати прогнозне значення при прогнозному значенні, що становить 112% від середнього рівня.

Таблиця 9.1

Рішення:

1) У Excel складемо допоміжну таблицю 9.2.

Таблиця 9.2

Рис.9 .1. Таблиця для розрахунку проміжних значень

Обчислимо кількість вимірів Для цього в комірку В19помістимо = РАХУНОК(A2:A16 ) .

За допомогою функції ∑ (Автосума) на панелі інструментів Стандарт т ная знайдемо суму всіх (осередок В17) і (комірка С17).

Рис. 9.2. Розрахунок суми значень та середніх

Для обчислення середніх значень використовуємо вбудовану функцію MS Excel СРЗНАЧ(), у дужках вказується діапазон значень визначення середньої. Отже, середній обсяг вирощеної продукції з 15 господарствам становить 210,833 тис.ден. од., а середня кількість техніки - 6,248 од/га.

Для заповнення стовпців D, E, Fвведемо формулу обчислення твору: в комірку D2 помістимо = B2*C2, потім на клавіатурі натисніть ENTER. Клацніть лівою кнопкою миші по комірці D2 і, вхопивши за правий нижній кут цього осередку (чорний плюсик), потягнемо вниз до осередку D16 . Відбудеться автоматичне заповнення діапазону D3 - D16 .

Для обчислення в вибірковийой коваріаціїі використовуємо формулу тобто. в комірку B21 помістимо = D18- B18* C18 та отримаємо 418,055 (рис. 9.3).

Рис.9 .3. Обчислення

Вибірковийуюдисперсиюдля знайдемо за формулою для цього в осередок B22 помістимо = E18-B18^2 (^- знак вказуючий зведення у ступінь ) та отримаємо 11,337. Аналогічно визначаємо = 16745,05556 (рис. 9.4)

Рис.9 .4. ОбчисленняVar(x) таVar (y)

Далі використовуючи стандартну функцію MS Excel "КОРРЕЛ" обчислюємо значення лінійного коефіцієнта кореляції для нашого завдання функція матиме вигляд "=КОРРЕЛ(B2:B16;C2:C16)", а значення rxy=0,96. Отримане значення коефіцієнта кореляції вказує на прямий та сильний зв'язок наявності техніки та обсягів вирощеної продукції.

Знаходимо ввибірковий коефіцієнт лінійної регресії =36,87; параметр =-17,78. Отже, рівняння парної лінійної регресії має вигляд =-17,78+36,87

Коефіцієнт показує, що зі збільшенням кількості техніки на 1 од/га обсяг вирощеної продукції середньому збільшиться на 36,875 тис. ден. од. (Рис. 9.5)

Рис.9 .5. Розрахунок параметрів рівняння регресії.

Отже, рівняння регресії матиме вид: .

Підставляємо в отримане рівняння фактичні значення x(кількість техніки) знаходимо теоретичні значення обсягів вирощеної продукції (рис. 9.6).

Рис.9 .6. Розрахунок теоретичних значень обсягів вирощеної продукції

Використовуючи Майстер діаграмбудуємо кореляційні поля (виділяючи стовпці зі значеннями і) і рівняння лінійної регресії (виділяючи стовпці зі значеннями і). Вибираємо тип діаграми - Т очкова В отриманій діаграмі заповнюємо потрібні параметри (назва, підписи до осей, легенда тощо). В результаті отримаємо графік, представлений на рис. 9.7.

Рис.9 .7. Графік залежності обсягу вирощеної продукції від кількості техніки

Для оцінки якості побудованої моделі регресії обчислимо:

. дооефіцієнт детермінації=0,92, що показує, що зміна витрат за випускати продукцію на 92% пояснюється зміною обсягу виробленої продукції а 8% посідає частку неврахованих у моделі чинників, що свідчить про якісність побудованої регресійної моделі;

. зрідкіснийююпомилокуапроксимації. Для цього у стовпці Hобчислимо різницю фактичного та теоретичного значень а в стовпці I- Вираз. Звертаємо Вашу увагу, що для обчислення значення модуля використовується стандартна функція MS Excel «ABS». При множенні середнього значення (комірка I18 ) на 100% отримаємо 18,2%. Отже, у середньому теоретичні значення відхиляються від фактичних на 18,2% (рис. 1.8).

За допомогою -критерію Фішераоцінимо значимостьрівняннярегрезці в цілому: 150,74.

На рівні значимості 0,05 = 4,67 визначаємо за допомогою вбудованої статистичної функції FРОЗПОЧ(Рис. 1.9). При цьому необхідно пам'ятати, що «Степені_свободи1» це знаменник, а «Ступені_свободи2» - чисельник, де - число параметрів у рівнянні регресії (у нас 2), n- Число вихідних пар значень (у нас 15).

Так як то рівняння регресії значимо при =0,05.

Рис.9 .8. Визначення коефіцієнта детермінації тасередньої помилкиапроксимації

Рис. 9 . 9 . Діалогове вікнофункціїFРОЗПОЧ

Далі визначаємо зсередній коефіцієнт еластичностіза формулою. Знайдене показує, що зі зростанням обсягу виробленої продукції на 1% витрати на випуск цієї продукції в середньому за сукупністю зростуть на 1,093%.

Розрахуємо прогнозне значенняшляхом підстановки рівняння регресії =-19,559+36,8746 прогнозного значення чинника =1,12=6,248*1,12=6,9978. Отримаємо = 238,48. Отже, при кількості техніки у кількості 6,9978 од/га обсяг випущеної продукції складе 238,48 тис. ден. од.

Знайдемо залишкову дисперсію, при цьому обчислимо суму квадратів різниці фактичного і теоретичного значень. =39,166 помістивши таку формулу = КОРІНЬ(J17/(B19-2))в комірку H2 1 (Рис. 9.10).

Рис.9 .10. Визначення залишкової дисперсії

Зрідкіснийяястандартная помилкапрогнозу:

На рівні значущості =0,05 за допомогою вбудованої статистичної функції Стьюдрозбірвизначимо =2,1604 і обчислимо граничну помилку прогнозу, яка у 95% випадків не перевищуватиме .

Дперевірливий інтервал прогнозу:

Або .

Виконаний прогноз витрат за випуск продукції виявився надійним (1-0,05=0,95), але неточним, оскільки діапазон верхньої та нижньої меж довірчого інтервалу становить рази. Це сталося за рахунок малого обсягу спостережень.

Необхідно скасувати, що в MS Excel вбудовані статистичні функції, що дозволяють значно знизити кількість проміжних обчислень, наприклад (рис. 9.11):

Для обчислення ввибірковіхсередніхвикористовуємо функцію СРЗНАЧ(число1: числоN) з категорії Статистичні .

Вибіркова коваріаціяміж та знаходиться за допомогою функції КОВАР(масив)X;масивY) з категорії Статистичні .

Вибірковийїдисперсиівизначаються статистичною функцією ДИСПР(число1: числоN) .

Рис.9 .11. Обчислення показателей вбудованими функціямиMSExcel

Параметрылінійної регресії Excel можна визначити декількома способами.

1 спосіб) За допомогою вбудованої функції Лінейн. Порядок дій наступний:

1. Виділити область порожніх осередків 5×2 (5 рядків, 2 стовпці) для виведення результатів регресійної статистики або область 1×2 – для отримання лише коефіцієнтів регресії.

2. За допомогою Майстри функційсеред Статистичних вибрати функцію Лінейнта заповнити її аргументи (рис. 9.12):

Рис. 9 . 12 . Діалогове вікно введення аргументів функціїЛінейн

Відомі_значення_y

Відомі_значення_x

Конст- логічне значення (1 чи 0), що свідчить про наявність чи відсутність вільного члена у рівнянні; ставимо 1;

Статистика- логічне значення (1 або 0), яке вказує, виводити додаткову інформацію щодо регресійного аналізу чи ні; ставимо 1.

3. У лівому верхньому осередку виділеної області з'явиться перше число таблиці. Для розкриття таблиці потрібно натиснути на клавішу < F2> , а потім – на комбінацію клавіш < CTRL> + < SHIFT> + < ENTER> .

Додаткову регресійну статистику буде виведено у вигляді (табл. 9.3):

Таблиця 9.3

значення коефіцієнта	значення коефіцієнта
Середньоквадратичне відхилення	Середньоквадратичне відхилення
Коефіцієнт детермінації	Середньоквадратичне відхилення
Статистика	Число ступенів свободи
Регресійна сума квадратів	Залишкова сума квадратів

Внаслідок застосування функції Лінейнотримаємо:

( 2 спосіб) За допомогою інструмента аналізу даних Регресія можна отримати результати регресійної статистики, дисперсійного аналізу, довірчі інтервали, залишки, графіки підбору ліній регресії, графіки залишків та нормальної ймовірності. Порядок дій наступний:

1. Необхідно перевірити доступ до Пакету аналізу. Для цього у головному меню (через кнопку Microsoft Office отримати доступ до параметрів MS Excel) у діалоговому вікні «Параметри MSExcel» вибрати команду «Надбудови» і праворуч вибрати надбудову Пакет аналіз а далі натиснути кнопку «Перейти» (рис. 9.13). У діалоговому вікні, що відкрилося, поставити галочку навпроти «Пакет аналізу» і натиснути «ОК» (рис. 9.14).

На вкладці "Дані" у групі "Аналіз" з'явиться доступ до встановленої надбудови. (Рис. 9.15).

Рис.9 .13. Увімкнення надбудов уMSExcel

Рис.9 .14. Діалогове вікно «Надбудови»

Рис.9 .15. Надбудова «Аналіз даних» на стрічціMSExcel 2007 .

2. Вибрати на «Дані» у групі «Аналіз» вибираємо команду Аналіз так н них у діалоговому вікні, що відкрилося, вибрати інструмент аналізу «Регресія» і натиснути «ОК» (рис. 9.16):

Рис.9 .16. Діалогове вікно «Аналіз даних»

У діалоговому вікні (рис. 9.17) заповнити поля:

Вхідний інтервалY- Діапазон, що містить дані результативної ознаки Y;

Вхідний інтервалX- діапазон, що містить дані пояснювальної ознаки X;

Мітки- прапорець, який вказує, чи містить перший рядок назви стовпців чи ні;

Константа-нуль- Прапорець, що вказує на наявність або відсутність вільного члена у рівнянні;

Вихідний інтервал- Досить вказати ліву верхню комірку майбутнього діапазону;

Новий робочий лист- можна задати довільне ім'я нового аркуша, який буде виведено результати.

Рис.9 .17. Діалогове вікно «Регресія»

Для отримання інформації про залишки, графіків залишків, підбору та нормальної ймовірності потрібно встановити відповідні прапорці у діалоговому вікні.

Рис. 9 . 18 . Результати застосування інструментуРегресія

У MSExcel лінія трендуможе бути додана в діаграму з областями гістограми або графік. Для цього:

1. Необхідно виділити область побудови діаграми та у стрічці вибрати «Макет» та у групі аналіз вибрати команду «Лінія тренду» (рис. 9.19.). У пункті меню вибрати «Додаткові параметри лінії тренда».

Рис. 1.19.Стрічка

2. У діалоговому вікні, що з'явилося, вибрати фактичні значення, потім відкриється діалогове вікно «Формат лінії тренду» (рис. 9.20.) в якому вибирається вид лінії тренда і встановлюються відповідні параметри.

Рис. 9 . 20 . Діалогове вікно"Формат лінії тренду"

Для поліномінального тренду необхідно задати ступінь апроксимуючого полінома, для лінійної фільтрації – кількість точок усереднення.

Вибираємо Лінійнадля побудови рівняння лінійної регресії

В якості додаткової інформаціїможна, можливо показати рівняння на діаграміі помістити на діаграму величину(Рис.9.21).

Рис. 9 . 21 . Лінійний тренд

Нелінійні моделі регресії ілюструються при обчисленні параметрів рівняння із застосуванням обраної в Excel статистичної функції ЛГРФПРИБЛ. Порядок обчислень аналогічний до застосування функції Лінейн.

Парна лінійна регресія

Попередні розрахунки:

;
;
;
;
;

;
.

Побудова таблиці виду



Середнє значення

Формули для розрахунків параметрів:

,
.

Лінейн

Оцінка тісноти зв'язку:

а) коефіцієнт кореляції
, або
;

При комп'ютерному підборі використовувати вбудовану функцію Корел

б) коефіцієнт еластичності
;

в) коефіцієнт детермінації .

Оцінка значущості рівняння регресії загалом:

Попередні розрахунки із побудовою таблиці виду

а) F -критерій Фішерапри числі ступенів свободи
і
і рівні значимості 0,05 дивитись у таблиці. Розрахункове значення критерію:

Якщо розрахункове значення F-критерію більше табличного, нульова гіпотеза про відсутність значущого зв'язку ознак xі y відхиляється, і робиться висновок про суттєвість зв'язку.

б) Середня помилка апроксимації

Оцінка значущості параметрів регресії:

а) Стандартна помилка параметра a розраховується за формулою

, де
.

б) Стандартна помилка коефіцієнта регресії bрозраховується за формулою

в) Стандартна помилка коефіцієнта кореляції розраховується за формулою

t-Критерій Ст'юдента при числі ступенів свободи
і рівні значимості 0,05 дивитись у таблиці.

Фактичні значення t-статистики:

,
,
.

Якщо фактичне значення по абсолютній величині перевищує табличний, гіпотезу про несуттєвість параметра регресії можна відхилити, параметр визнається значущим.

Зв'язок міжF -критерієм Фішера і t -критерієм Ст'юдентавиражається рівністю

Розрахунок довірчих інтервалів для параметрів регресії:

Довірчий інтервал для параметра a визначається як
;

довірчий інтервал для коефіцієнта регресії визначається як
.

При комп'ютерному аналізі використовувати в Excel Сервіс/Аналіз даних/Регресія.

Інтервальний прогноз на основі лінійного рівняннярегресії:

Нехай – прогнозне значення факторної ознаки;
- Точковий прогноз результативної ознаки. Тоді

а) середня помилка прогнозу :

;

б) довірчий інтервал прогнозу

за допомогою табличного редактораMS Excel

Активізація надбудовиПакет аналізу

Для активізації надбудови Пакет аналізунеобхідно виконати такі дії:

1. Вибрати команду Сервіс/Надбудови.

2. У діалоговому вікні встановити прапорець Пакет аналізу.

Відповідно до варіанта завдання, використовуючи статистичний матеріал, необхідно:

2. Оцінити тісноту зв'язку залежної змінної (результативного фактора) з пояснювальною змінною за допомогою показників кореляції та детермінації.

3. Оцінити за допомогою F-Критер Фішера статистичну надійність моделювання.

4. Оцінити статистичну значущість параметрів регресії та кореляції.

5. Визначити середню помилку апроксимації.

6. Використовуючи коефіцієнт еластичності, виконати кількісну оцінку впливу пояснюючого чинника результат.

7. Виконати точковий та інтервальний прогноз результативної ознаки зі збільшенням пояснювальної ознаки на 25% від її середнього значення (достовірність прогнозу 95%).

8. На одній діаграмі зобразити поле кореляції вихідних даних та пряму регресію.

приклад

Є дані про річну ціну програми «Майстер ділового адміністрування» та кількість слухачів в освітній установі.

I. Вводимо вихідні дані у документ Excel.

ІІ. Викликаємо надбудову Аналіз даниху меню сервіс.

ІІІ. Вибираємо інструмент Регресія.

IV. Заповнюємо відповідні позиції вікна Регресія.

V. Після натискання Ок отримуємо протокол розв'язання задачі.

VI. Аналізуємо отриманий протокол.

1) Коефіцієнт регресії;

Вільний член рівняння регресії
.

Примітка. За потреби результати округляються з необхідною точністю. Вимогу щодо округлення можна провести спочатку, задавши кількість знаків після коми в меню Формат осередку.

Рівняння парної лінійної регресії має вигляд: .

2) Коефіцієнт кореляції
, що свідчить про тісний зв'язок ознак yі x. Коефіцієнт детермінації
. Отримане рівняння регресії пояснює 53% варіації ознаки y, Інші 47% мінливості цієї ознаки обумовлені впливом неврахованих у моделі факторів.

3) Оцінимо статистичну значимість (надійність моделювання) рівняння загалом. Розрахункове значення критерію Фішера зазначено у протоколі,
. Критичне значення цього критерію можна знайти за допомогою статистичної функції FРОЗКЛАДтабличного редактора Еxcel.

Вхідними параметрами цієї функції є:

- Рівень значущості (імовірність), мається на увазі ймовірність помилки відкинути вірну гіпотезу про статистичну незначущість побудованого рівняння регресії. Як правило, вибирають рівень значущості, що дорівнює 0,05 або 0,01;

– число ступенів свободи 1 – збігається з кількістю параметрів при змінній рівнянні регресії, для парної лінійної регресії
це число дорівнює одиниці;

- Число ступенів свободи 2 дорівнює для парної лінійної регресії
, де n- Обсяг вихідних статистичних даних.

Виконуємо дії Вставка/ФункціяВибираємо потрібне.

Оскільки розрахункове значення F-критерію більше табличного, рівного 4,84, нульова гіпотеза про відсутність значимого зв'язку ознак x і y відхиляється і робиться висновок про суттєвість зв'язку.

4) Оцінимо статистичну значимість властивостей aі bу рівнянні регресії за допомогою t- Критерію Ст'юдента.

Розрахункові значення статистики Ст'юдента
,
. Відповідне табличне значення можна визначити через статистичну функцію Стюдрозбірчисло ступенів свободи дорівнює
.

Оскільки фактичні значення абсолютної величини перевищують табличне, рівне 2,2, гіпотезу про несуттєвість параметрів регресії можна відхилити.

5) Визначимо середню помилку апроксимації,
. Потрібно буде виконувати допоміжні розрахунки, оформлені у вигляді таблиці.

Таким чином, середня помилка апроксимації за даним рівнянням регресії становить 12,66%, модель парної лінійної регресії можна визнати задовільною та придатною для прогнозування.

6) Виконаємо кількісну оцінку впливу фактора xна фактор y, використовуючи коефіцієнт еластичності Для парної лінійної регресії його можна знайти за формулою
. Маємо

Отже, зі збільшенням кількості слухачів на 1% річна ціна зменшиться на 0,4%.

7) Виконаємо розрахунок прогнозу yзі збільшенням чинника xна 25% від середнього.

Прогнозне значення.

Точковий прогноз ознаки y: .

Середня помилка прогнозу дорівнює ,

де
- Залишкова дисперсія,
-Дисперсія фактора x.

Чисельне значення суми
у протоколі позначено як залишкове SS.

Тоді
,
.

Найшвидший спосіб отримання допоміжних характеристик - Середнього значення фактора xі - дисперсії, скористатися інструментом Описова статистикау пакеті Аналіз даних.

Протокол виведення результатів має вигляд

Довірчий інтервал прогнозу: , де – відповідне табличне значення критерію Ст'юдента (знайдено раніше за функцією Стюдрозбір,
).

Отже,

тобто. можна бути впевненим на 95%, що ціна річного курсу при 35 слухачах варіюватиметься в зазначених межах (при точковому прогнозі ціни 3,65825 тис. дол.).

8) Для побудови діаграми виконаємо такі дії:

Крок 1 Вставка/Діаграма/Графік

Крок 3Ряд/Додати/Значення/Виділити стовпець регресійних значень фактора - .

Крок 4Підписи осіX/ Виділити стовпець значень x.

Крок 4Кожному з рядів присвоїти ім'я, підписати осі координат та назву діаграми.

Примітка.

Для побудови діаграми значення фактора xмають бути відсортовані за зростанням із збереженням відповідного значення y. Це може бути зроблено так Дані/Сортування/Виділити стовпець, у якому необхідно зробити сортування. Наприклад,

Завдання для самостійної роботи

Варіант 1

Варіант 2

x– енергоозброєність на 10 підприємствах, кВт;

y- продуктивність праці, тис. руб.

Варіант 3

x- Якість землі, бали;

y- Урожайність, ц/га.

Варіант 4

x- Якість землі, бали;

y- Урожайність, ц/га.

Варіант 5

x– товарообіг;

y-Витрати звернення по відношенню до товарообігу.

Варіант 6

x- електроозброєність на одного робітника;

y- Випуск готової продукції на одного робітника.

Варіант 7

x-Рівень доходів сім'ї;

y- Витрати на продукти харчування (в розрахунку на 100 руб. Доходів).

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http:// www. allbest. ru/

Міністерство освіти та науки Російської Федерації

Федеральне державне бюджетне освітня установавищої освіти

«Комсомольський-на-Амурі державний технічний університет»

Факультет економіки та менеджменту

Кафедра «Економіки, фінансів та бухгалтерського обліку»

РОЗРАХУНОВО-ГРАФІЧНЕ ЗАВДАННЯ

з дисципліни «Економетрика»

Студент групи

А.Ю. Зайченко

Викладач

І.І. Антонова

Таблиця 1

Номер регіону	Середньодушовий прожитковий мінімум на день одного працездатного, руб.,	Середньоденна вести, крб.,

Потрібно:

1. Побудувати лінійне рівняння парної регресії.

3. Оцінити статистичну значимість параметрів регресії та кореляції за допомогою -критерію Фішера та -критерію Стьюдента.

4. Виконати прогноз заробітної платипри прогнозному значенні середньодушового прожиткового мінімуму, що становить 107% середнього рівня.

5. Оцінити точність прогнозу, розрахувавши помилку прогнозу та його довірчий інтервал.

6. На одному графіку побудувати вихідні дані та теоретичну пряму.

1. Для розрахунку параметрів рівняння лінійної регресії будуємо розрахункову таблицю 2. лінійний кореляціяапроксимація регресія

Таблиця 2















Середнє значення

Отримано рівняння регресії:

Зі збільшенням середньодушового прожиткового мінімуму на 1 руб. середньоденна вести збільшується загалом на 0,89 крб.

2. Тісноту лінійного зв'язку оцінить коефіцієнт кореляції:

Це означає, що 51% варіації заробітної плати () пояснюється варіацією фактора – середньодушового прожиткового мінімуму.

Якість моделі визначає середня помилка апроксимації:

Якість побудованої моделі оцінюється як хороша, тому що не перевищує 8-10%.

3. Оцінку значущості рівняння регресії загалом проведемо з допомогою - критерію Фішера. Фактичне значення -критерію:

Табличне значення критерію при п'ятивідсотковому рівні значущості та ступенях свободи та становить. Оскільки рівняння регресії визнається статистично значущим.

Оцінку статистичної значимостіпараметрів регресії проведемо за допомогою статистики Стьюдента і шляхом розрахунку довірчого інтервалу кожного з показників.

Табличне значення - критерій для числа ступенів свободи і становитиме.

Визначимо випадкові помилки:

Фактичні значення-статистики перевищують табличне значення:

тому параметри, і випадково відрізняються від нуля, а статистично значущі. Розрахуємо довірчі інтервали для параметрів регресії та. Для цього визначимо граничну помилку для кожного показника:

Довірчі інтервали:

Аналіз верхньої та нижньої меж довірчих інтервалів призводить до висновку у тому, що з ймовірністю параметри і, перебуваючи у зазначених межах, не приймають нульових значень, тобто. є статистично незначущими і істотно відмінні від нуля.

4. Отримані оцінки рівняння регресії дають змогу використовувати його для прогнозу. Якщо прогнозне значення прожиткового мінімуму становитиме:

тоді прогнозне значення заробітної плати становитиме:

Помилка прогнозу складе:

Гранична помилка прогнозу, яка у разі не буде перевищена, становитиме:

Довірчий інтервал прогнозу:

Виконаний прогноз середньомісячної заробітної плати є надійним () та знаходиться в межах від 131,66 руб. до 190,62 руб. На закінчення розв'язання задачі побудуємо на одному графіку вихідні дані та теоретичну пряму (рисунок1)

Малюнок 1

Розміщено на Allbest.ru

Подібні документи

Побудова лінійного рівняння парної регресії, розрахунок лінійного коефіцієнта парної кореляції та середньої помилки апроксимації. Визначення коефіцієнтів кореляції та еластичності, індексу кореляції, суть застосування критерію Фішера в економетриці.

контрольна робота , доданий 05.05.2010

Розрахунок параметрів парної лінійної регресії. Оцінка статистичної значущості рівняння регресії та її параметрів з допомогою критеріїв Фішера і Стьюдента. Побудова матриці парних коефіцієнтів кореляції. Статистичний аналізза допомогою ППП MS EXCEL.

контрольна робота , доданий 14.05.2008

Розрахунок лінійного коефіцієнта парної та приватної кореляції. Статистична значущість параметрів регресії та кореляції. Аналіз кореляційного поля даних. Точність прогнозу, розрахунок помилки та довірчий інтервал. Коефіцієнт множинної детермінації.

контрольна робота , доданий 11.12.2010

Економічна інтерпретація коефіцієнта регресії. Знаходження статичної суми квадратів та оцінка дисперсії залишків. Перевіряє значення параметрів рівняння регресії за допомогою t-критерію Стьюдента. Розрахунок середньої відносної помилкиапроксимації.

контрольна робота , доданий 23.03.2010

Побудова довірчого інтервалу коефіцієнта регресії. Визначення помилки апроксимації, індексу кореляції та F-критерію Фішера. Оцінка еластичності зміни матеріаломісткості продукції. Побудова лінійного рівняння множинної регресії.

контрольна робота , доданий 11.04.2015

Розрахунок параметрів рівняння лінійної регресії, оцінка тісноти зв'язку за допомогою показників кореляції та детермінації. Визначення середньої помилки апроксимації. Статистична надійність моделювання за допомогою F-критерію Фішера та t-критерію Стьюдента.

контрольна робота , доданий 17.10.2009

Визначення кількісної залежності маси хутрового звіра від віку. Побудова рівняння парної регресії, розрахунок його параметрів та перевірка адекватності. Оцінка статистичної значущості параметрів регресії, розрахунок їхнього довірчого інтервалу.

лабораторна робота , доданий 02.06.2014

Побудова гіпотези про форму зв'язку грошових доходів душу населення із споживчими витратами в Уральському і Західно-Сибірському регіонах РФ. Розрахунок параметрів рівнянь парної регресії, оцінка якості за допомогою середньої помилки апроксимації.

контрольна робота , доданий 05.11.2014

Аналіз методу найменших квадратів для парної регресії як методу оцінювання параметрів лінійної регресії. Розгляд лінійного рівняння парної регресії. Дослідження множинної лінійної регресії. Вивчення помилок коефіцієнтів регресії.

контрольна робота , доданий 28.03.2018

Побудова поля кореляції. Розрахунок параметрів рівнянь парної регресії. Залежність середньої очікуваної тривалості життя деяких чинників. Вивчення "критерію Фішера". Оцінка тісноти зв'язку за допомогою показників кореляції та детермінації.

Рівняння парної регресії.

З поля кореляції можна висунути гіпотезу (для генеральної сукупності) у тому, що зв'язок між усіма можливими значеннями X і Y носить лінійний характер.

Лінійне рівняння регресії має вигляд y = bx + a + ε

Система звичайних рівнянь.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

Для наших даних система рівнянь має вигляд

12a + 1042 b = 1709

1042 a + 91556 b = 149367

З першого рівняння виражаємо аі підставимо на друге рівняння:

Отримуємо емпіричні коефіцієнти регресії: b = 0.9, a = 64.21

Рівняння регресії (емпіричне рівняння регресії):

y = 0.9 x + 64.21

Емпіричні коефіцієнти регресії aі bє лише оцінками теоретичних коефіцієнтів β i , а саме рівняння відображає лише загальну тенденцію у поведінці змінних, що розглядаються.

Для розрахунку параметрів лінійної регресії збудуємо розрахункову таблицю (табл. 1)

1. Параметри рівняння регресії.

Вибіркові середні.

Вибіркові дисперсії:

Середньоквадратичне відхилення

1.1. Коефіцієнт кореляції

Коваріація.

Розраховуємо показник тісноти зв'язку. Таким показником є вибірковий лінійний коефіцієнт кореляції, який розраховується за такою формулою:

1.2. Рівняння регресії(Оцінка рівняння регресії).

Лінійне рівняння регресії має вигляд y = 0.9 x + 64.21

1.3. Коефіцієнт еластичності.

Коефіцієнт еластичності знаходиться за формулою:

1.4. Помилка апроксимації.

Помилка апроксимації в межах 5%-7% свідчить про хороший вибір рівняння регресії до вихідних даних.

1.5. Емпіричне кореляційне ставлення.

Емпіричне кореляційне ставлення обчислюється всім форм зв'язку і служить вимір тісноти залежності. Змінюється в межах.

Індекс кореляції.

Для лінійної регресії індекс кореляції дорівнює коефіцієнту кореляції r xy = 0.79.

Для будь-якої форми залежності тіснота зв'язку визначається за допомогою множинного коефіцієнта кореляції:

1.6. Коефіцієнт детермінації.

Найчастіше, даючи інтерпретацію коефіцієнта детермінації, його виражають у відсотках.

R 2 = 0.79 2 = 0.62

Для оцінки якості параметрів лінійної регресії збудуємо розрахункову таблицю (табл. 2)

2. Оцінка параметрів рівняння регресії.

2.1. Значення коефіцієнта кореляції.

Для того, щоб при рівні значущості α перевірити нульову гіпотезу про рівність нулю генерального коефіцієнта кореляції нормальної двовимірної випадкової величини при конкуруючій гіпотезі H 1 ≠ 0, треба обчислити значення критерію, що спостерігається.

та за таблицею критичних точокрозподілу Стьюдента, за заданим рівнем значущості α і числом ступенів свободи k = n - 2 знайти критичну точку t критий двосторонньої критичної області. Якщо t набл< t крит оснований отвергнуть нулевую гипотезу. Если |t набл | >t критий - нульову гіпотезу відкидають.

За таблицею Стьюдента з рівнем значущості α=0.05 та ступенями свободи k=10 знаходимо t крит:

де m = 1 – кількість пояснюючих змінних.

2.2. Інтервальна оцінка коефіцієнта кореляції (довірчий інтервал).

2.3. Аналіз точності визначення оцінок коефіцієнтів регресії.

Незміщеною оцінкою дисперсії збурень є величина:

S 2 y = 53.63 - непояснена дисперсія (захід розкиду залежної змінної навколо лінії регресії).

S y = 7.32 – стандартна помилка оцінки (стандартна помилка регресії).

Sa - стандартне відхиленнядовільної величини a.

S b – стандартне відхилення випадкової величини b.

2.4. Довірчі інтервали для залежної змінної.

(a + bx p ± ε)

Розрахуємо межі інтервалу, в якому буде зосереджено 95% можливих значень Y при необмежено великій кількості спостережень та X p = 107

Індивідуальні довірчі інтервали для Y за даного значення X.

(a + bx i ± ε)

t критий (n-m-1;α/2) = (10;0.025) = 2.228

2.5. Перевірка гіпотез щодо коефіцієнтів лінійного рівняння регресії.

1) t-статистика. Критерій Стьюдента.

t критий (n-m-1;α/2) = (10;0.025) = 2.228

Довірчий інтервал для коефіцієнтів рівняння регресії.

(b - t крит S b; b + t крит S b)

(a - t критий S a ; a + t критий S a)

2) F-статистика. Критерій Фішера.

Табличне значення критерію зі ступенями свободи k 1 =1 і k 2 =10, F табл = 4.96

Призначення сервісу. За допомогою сервісу в онлайн-режимі можна знайти:

параметри рівняння лінійної регресії y=a+bx лінійний коефіцієнткореляції із перевіркою його значимості;
тісноту зв'язку за допомогою показників кореляції та детермінації, МНК-оцінку, статичну надійність регресійного моделювання за допомогою F-критерію Фішера та за допомогою t-критерію Стьюдента, довірчий інтервал прогнозу для рівня значимості α

Рівняння парної регресії відноситься до рівняння регресії першого порядку. Якщо економетрична модель містить лише одну пояснювальну змінну, вона має назву парної регресії. Рівняння регресії другого порядкуі рівняння регресії третього порядкуставляться до нелінійних рівнянь регресії.

Приклад. Здійсніть вибір залежної (пояснюється) і пояснюючої змінної для побудови парної регресійної моделі. Дайте. Визначте теоретичне рівняння парної регресії. Оцініть адекватність збудованої моделі (інтерпретуйте R-квадрат, показники t-статистики, F-статистики).
Рішеннябудемо проводити на основі процесу економетричного моделювання.
1-й етап (постановочний) – визначення кінцевих цілей моделювання, набору чинників і показників, що беруть участь у моделі, їх ролі.
Специфікація моделі - визначення мети дослідження та вибір економічних змінних моделі.
Ситуаційне (практичне) завдання. По 10 підприємствам регіону вивчається залежність вироблення продукції одного працівника y (тис. крб.) від частки робітників високої кваліфікації у кількості робочих x (в %).
2-й етап (апріорний) – передмодельний аналіз економічної сутностідосліджуваного явища, формування та формалізація апріорної інформації та вихідних припущень, зокрема що стосується природи та генези вихідних статистичних даних та випадкових залишкових складових у вигляді низки гіпотез.
Вже на цьому етапі можна говорити про явну залежність рівня кваліфікації робітника та його виробленням, адже чим досвідченіший працівник, тим вища його продуктивність. Але як оцінити цю залежність?
Парна регресіяявляє собою регресію між двома змінними - y і x, тобто модель виду:

Де y – залежна змінна (результативна ознака); x - незалежна, або пояснює, змінна (ознака-фактор). Знак «^» означає, що між змінними x і y немає суворої функціональної залежності, тому практично в кожному окремому випадку величина складається з двох доданків:

Де y – фактичне значення результативної ознаки; y x – теоретичне значення результативної ознаки, знайдене з рівняння регресії; ε – випадкова величина, Що характеризує відхилення реального значення результативної ознаки від теоретичного, знайденого за рівнянням регресії
Графічно покажемо регресійну залежністьміж виробленням продукції одного працівника і частки робітників високої кваліфікації.

3-й етап (параметризація) – власне моделювання, тобто. вибір загального виглядумоделі, у тому числі складу та форми зв'язків, що входять до неї, між змінними. Вибір виду функціональної залежності у рівнянні регресії називається параметризацією моделі. Вибираємо рівняння парної регресії, тобто. на кінцевий результат y впливатиме лише один фактор.
4-й етап (інформаційний) – збирання необхідної статистичної інформації, тобто. реєстрація значень факторів, що беруть участь у моделі, і показників. Вибірка складається із 10 підприємств галузі.
5-й етап (ідентифікація моделі) – оцінювання невідомих параметрів моделі за наявними статистичними даними.
Щоб визначити параметри моделі, використовуємо МНК – метод найменших квадратів. Система нормальних рівнянь виглядатиме так:
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Для розрахунку параметрів регресії збудуємо розрахункову таблицю (табл. 1).

x	y	x 2	y 2	x y
10	6	100	36	60
12	6	144	36	72
15	7	225	49	105
17	7	289	49	119
18	7	324	49	126
19	8	361	64	152
19	8	361	64	152
20	9	400	81	180
20	9	400	81	180
21	10	441	100	210
171	77	3045	609	1356

Дані беремо з таблиці 1 (останній рядок), у результаті маємо:
10a + 171 b = 77
171 a + 3045 b = 1356
Цю СЛАУ вирішуємо методом Крамера або методом зворотної матриці.
Отримуємо емпіричні коефіцієнти регресії: b = 0.3251, a = 2.1414
Емпіричне рівняння регресії має вигляд:
y = 0.3251 x + 2.1414
6-й етап (верифікація моделі) - зіставлення реальних та модельних даних, перевірка адекватності моделі, оцінка точності модельних даних.
Аналіз проводимо за допомогою