Знаходження коефіцієнтів рівняння парної регресії. Лінійна парна регресія

1. Основні визначення та формули

Парна регресія- регресія (зв'язок) між двома змінними та тобто. модель виду:

де – залежна змінна (результативна ознака);

- незалежна пояснювальна змінна (ознака-фактор);

Обурення або стохастична змінна, що включає вплив неврахованих у моделі факторів.

Практично у кожному окремому випадку величина складається з двох доданків:

де – фактичне значення результативної ознаки;

Теоретичне значення результативної ознаки, знайдене з рівняння регресії. Знак «^» означає, що між змінними немає строгої функціональної залежності.

Розрізняють лінійніі нелінійнірегресії.

Лінійна регресіяописується рівнянням прямої

Нелінійні регресіїділяться на два класи:

1) регресії, нелінійні за змінними, що пояснюють, але лінійні за параметрами, що оцінюються., наприклад:

Поліноми різних ступенів

Рівностороння гіпербола

2) регресії, нелінійні за оцінюваними параметрами, наприклад:

Ступінь

Показова

Експонентна

Для побудови парної лінійної регресії обчислюють допоміжні величини (число спостережень).

Вибіркові середні: і

Вибіркова коваріаціяміж і

або

Коваріація- це числова характеристикаспільного розподілу двох випадкових величин

Вибіркова дисперсія для

або

Вибіркова дисперсія для

або

Вибіркова дисперсіяхарактеризує ступінь розкиду значень випадкової величини навколо середнього значення (варіабельність, мінливість).

Тісноту зв'язку явищ, що вивчаються, оцінює вибірковий коефіцієнт кореляціїміж і

Коефіцієнт кореляції змінюється не більше -1 до +1. Чим ближче від модуля до 1, тим ближче статистична залежність між і до лінійної функціональної.

Якщо =0, то лінійний зв'язок між і відсутній;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

Позитивне значення коефіцієнта свідчить у тому, то зв'язок між ознаками пряма (зі зростанням збільшується значення ), негативне значення - зв'язок зворотна (зі зростанням значення зменшується).

Побудова лінійної регресіїзводиться до оцінки її параметрів і Класичний підхід до оцінювання параметрів лінійної регресії заснований на методі найменших квадратів (МНК). МНК дозволяє одержати такі оцінки параметрів, у яких сума квадратів відхилень фактичних значень результативного ознаки від теоретичних мінімальна, тобто.

Для лінійної регресії параметри і з системи нормальних рівнянь:

Вирішуючи систему, знаходимо вна

та параметр

Коефіцієнтпри факторної змінної показує, наскільки зміниться у середньому величина за зміни чинника на одиницю виміру.

Параметр коли Якщо не може дорівнювати 0, то не має економічного сенсу. Інтерпретувати можна тільки знак при якщо відносна зміна результату відбувається повільніше, ніж зміна фактора, тобто. варіація результату менша від варіації фактора і навпаки.

Для оцінки якості побудованої моделі регресії можна використовувати коефіцієнт детермінаціїабо середню помилку апроксимації.

Дооефіцієнт детермінації

Або

показує частку дисперсії, що пояснюється регресією, у загальній дисперсії результативної ознаки Відповідно, величина характеризує частку дисперсії показника, викликану впливом неврахованих у моделі факторів та інших причин.

Що ближче до 1, то якісніша регресійна модель, тобто. побудована модель добре апроксимує вихідні дані.

Середня помилка апроксимації- це середнє відносне відхилення теоретичних значень фактичних тобто.

Побудоване рівняння регресії вважається задовільним, якщо значення не перевищує 10-12%.

Для лінійної регресії середній коефіцієнт еластичностізнаходиться за формулою:

Середній коефіцієнт еластичностіпоказує на скільки відсотків у середньому за сукупністю зміниться результат своєї величини при зміні чинника на 1% від свого значення.

Оцінка значимостірівняння регресіїв цілому дається за допомогою - критерію Фішера, який полягає у перевірці гіпотези про статистичну незначущість рівняння регресії. . Для цього виконується порівняння фактичез когоі критичного(табличного) значень - критерію Фішера .

визначається із співвідношення значень факторної та залишкової дисперсій, розрахованих однією ступінь свободи, тобто.

- максимально можливе значення критерію під впливом випадкових факторів при ступенях свободи = 1, = -2 та рівні значимості знаходиться з таблиці - критерію Фішера (таблиця 1 додатка).

Рівень значущості- це можливість відкинути правильну гіпотезу за умови, що вона вірна.

Якщо то гіпотеза про відсутність зв'язку досліджуваного показника з чинником відхиляється і робиться висновок про суттєвість зв'язку з рівнем значущості (тобто. рівняння регресії значимо).

Якщо то гіпотеза приймається та визнається статистична незначимість та ненадійність рівняння регресії.

Для лінійної регресії значимістькоефіцієнтів регресіїоцінюють за допомогою - критерію Стьюдента, за яким висувається гіпотеза про випадкову природу показників, тобто. про незначне їх відмінність від нуля. Далі розраховуються фактичні значення критерію кожного з оцінюваних коефіцієнтів регресії, тобто.

де і - стандартні помилкипараметрів лінійної регресії визначаються за формулами:

- максимально можливе значення критерію Стьюдента під впливом випадкових факторів при даному ступені свободи =-2 та рівні значущості перебуває з таблиці критерію Стьюдента (таблиця 2 додатка).

Якщо то гіпотеза про несуттєвість коефіцієнта регресії відхиляється із рівнем значимості тобто. коефіцієнт (або) не випадково відрізняється від нуля і сформувався під впливом систематично діючого фактора

Якщо то гіпотеза не відхиляється та визнається випадкова природа формування параметра.

Значимість лінійного коефіцієнтакореляціїтакож перевіряється за допомогою - критерію Стьюдента, тобто.

Гіпотеза про несуттєвість коефіцієнта кореляції відхиляється з рівнем значущості якщо

Зауваження.Для лінійної парної регресії перевірки гіпотез про значущість коефіцієнта і коефіцієнта кореляції рівносильні перевірці гіпотези про суттєвість рівняння регресії загалом, тобто.

Для розрахунку довірчого інтервалувизначають граничну помилку кожному за показника, тобто.

Довірчі інтервалидля коефіцієнтів лінійної регресії:

Якщо межі довірчого інтервалу потрапляє нуль, тобто. нижня межа негативна, а верхня позитивна, то параметр, що оцінюється, приймається нульовим, т.к. він не може одночасно набувати і позитивного, і негативного значення.

Прогнозне значеннявизначається шляхом підстановки рівняння регресії відповідного прогнозного значення Потім обчислюється середня стандартна помилка прогнозу

де

і будується довірчий інтервал прогнозу

Інтервал може бути досить широким за рахунок малого обсягу спостережень.

Регресії, нелінійні за включеними змінними , приводяться до лінійного вигляду простою заміною змінних, а подальша оцінка параметрів проводиться за допомогою МНК.

Гіперболтична регресія:

Р егресії , нелінійні е за оцінюваними параметрами , діляться на два типи: внутрішньо нелінійніі т.п. (До лінійного вигляду не наводяться) і внутрішньо лінійні(наводяться до лінійного вигляду за допомогою відповідних перетворень), наприклад:

Експонентна регресія:

Лінеарізуюче перетворення:

Ступенева регресія:

Лінеарізуюче перетворення:

Показникная регресія:

Лінеарізуюче перетворення:

Логарифмічнийя регресія:

Лінеарізуюче перетворення:

2. Вирішення типових завдань

приклад9 .1 . По 15 сільськогосподарським підприємствам (табл. 9.1) відомі: - кількість техніки на одиницю посівної площі (од/га) та - обсяг вирощеної продукції (тис. ден. од.). Необхідно:

1) визначити залежність від

2) побудувати кореляційні поля та графік рівняння лінійної регресії на

3) зробити висновок про якість моделі та розрахувати прогнозне значення при прогнозному значенні, що становить 112% від середнього рівня.

Таблиця 9.1

Рішення:

1) У Excel складемо допоміжну таблицю 9.2.

Таблиця 9.2

Рис.9 .1. Таблиця для розрахунку проміжних значень

Обчислимо кількість вимірів Для цього в комірку В19помістимо = РАХУНОК(A2:A16 ) .

За допомогою функції ∑ (Автосума) на панелі інструментів Стандарт т ная знайдемо суму всіх (осередок В17) і (комірка С17).

Рис. 9.2. Розрахунок суми значень та середніх

Для обчислення середніх значень використовуємо вбудовану функцію MS Excel СРЗНАЧ(), у дужках вказується діапазон значень визначення середньої. Отже, середній обсяг вирощеної продукції з 15 господарствам становить 210,833 тис.ден. од., а середня кількість техніки - 6,248 од/га.

Для заповнення стовпців D, E, Fвведемо формулу обчислення твору: в комірку D2 помістимо = B2*C2, потім на клавіатурі натисніть ENTER. Клацніть лівою кнопкою миші по комірці D2 і, вхопивши за правий нижній кут цього осередку (чорний плюсик), потягнемо вниз до осередку D16 . Відбудеться автоматичне заповнення діапазону D3 - D16 .

Для обчислення в вибірковийой коваріаціїі використовуємо формулу тобто. в комірку B21 помістимо = D18- B18* C18 та отримаємо 418,055 (рис. 9.3).

Рис.9 .3. Обчислення

Вибірковийуюдисперсиюдля знайдемо за формулою для цього в осередок B22 помістимо = E18-B18^2 (^- знак вказуючий зведення у ступінь ) та отримаємо 11,337. Аналогічно визначаємо = 16745,05556 (рис. 9.4)

Рис.9 .4. ОбчисленняVar(x) таVar (y)

Далі використовуючи стандартну функцію MS Excel "КОРРЕЛ" обчислюємо значення лінійного коефіцієнта кореляції для нашого завдання функція матиме вигляд "=КОРРЕЛ(B2:B16;C2:C16)", а значення rxy=0,96. Отримане значення коефіцієнта кореляції вказує на прямий та сильний зв'язок наявності техніки та обсягів вирощеної продукції.

Знаходимо ввибірковий коефіцієнт лінійної регресії =36,87; параметр =-17,78. Отже, рівняння парної лінійної регресії має вигляд =-17,78+36,87

Коефіцієнт показує, що зі збільшенням кількості техніки на 1 од/га обсяг вирощеної продукції середньому збільшиться на 36,875 тис. ден. од. (Рис. 9.5)

Рис.9 .5. Розрахунок параметрів рівняння регресії.

Отже, рівняння регресії матиме вид: .

Підставляємо в отримане рівняння фактичні значення x(кількість техніки) знаходимо теоретичні значення обсягів вирощеної продукції (рис. 9.6).

Рис.9 .6. Розрахунок теоретичних значень обсягів вирощеної продукції

Використовуючи Майстер діаграмбудуємо кореляційні поля (виділяючи стовпці зі значеннями і) і рівняння лінійної регресії (виділяючи стовпці зі значеннями і). Вибираємо тип діаграми - Т очкова В отриманій діаграмі заповнюємо потрібні параметри (назва, підписи до осей, легенда тощо). В результаті отримаємо графік, представлений на рис. 9.7.

Рис.9 .7. Графік залежності обсягу вирощеної продукції від кількості техніки

Для оцінки якості побудованої моделі регресії обчислимо:

. дооефіцієнт детермінації=0,92, який показує, що зміна витрат за випускати продукцію на 92% пояснюється зміною обсягу виробленої продукції а 8% посідає частку неврахованих у моделі чинників, що свідчить про якісність побудованої регресійної моделі;

. зрідкіснийююпомилокуапроксимації. Для цього у стовпці Hобчислимо різницю фактичного та теоретичного значень а в стовпці I- Вираз. Звертаємо Вашу увагу, що для обчислення значення модуля використовується стандартна функція MS Excel «ABS». При множенні середнього значення (комірка I18 ) на 100% отримаємо 18,2%. Отже, у середньому теоретичні значення відхиляються від фактичних на 18,2% (рис. 1.8).

За допомогою -критерію Фішераоцінимо значимостьрівняннярегрезці в цілому: 150,74.

На рівні значимості 0,05 = 4,67 визначаємо за допомогою вбудованої статистичної функції FРОЗПОЧ(Рис. 1.9). При цьому необхідно пам'ятати, що «Степені_свободи1» це знаменник, а «Ступені_свободи2» - чисельник, де - число параметрів у рівнянні регресії (у нас 2), n- Число вихідних пар значень (у нас 15).

Так як то рівняння регресії значимо при =0,05.

Рис.9 .8. Визначення коефіцієнта детермінації тасередньої помилкиапроксимації

Рис. 9 . 9 . Діалогове вікнофункціїFРОЗПОЧ

Далі визначаємо зсередній коефіцієнт еластичностіза формулою. Знайдене показує, що із зростанням обсягу виробленої продукції на 1% витрати на випуск цієї продукції в середньому за сукупністю зростуть на 1,093%.

Розрахуємо прогнозне значенняшляхом підстановки рівняння регресії =-19,559+36,8746 прогнозного значення чинника =1,12=6,248*1,12=6,9978. Отримаємо = 238,48. Отже, за кількості техніки у кількості 6,9978 од/га обсяг випущеної продукції складе 238,48 тис. ден. од.

Знайдемо залишкову дисперсію, при цьому обчислимо суму квадратів різниці фактичного і теоретичного значень. =39,166 помістивши таку формулу = КОРІНЬ(J17/(B19-2))в осередок H2 1 (Рис. 9.10).

Рис.9 .10. Визначення залишкової дисперсії

Зрідкіснийяястандартная помилкапрогнозу:

На рівні значущості =0,05 за допомогою вбудованої статистичної функції Стьюдрозбірвизначимо =2,1604 і обчислимо граничну помилку прогнозу, яка у 95% випадків не перевищуватиме .

Дперевірливий інтервал прогнозу:

Або .

Виконаний прогноз витрат за випуск продукції виявився надійним (1-0,05=0,95), але неточним, оскільки діапазон верхньої та нижньої меж довірчого інтервалу становить рази. Це сталося за рахунок малого обсягу спостережень.

Необхідно скасувати, що в MS Excel вбудовані статистичні функції, що дозволяють значно знизити кількість проміжних обчислень, наприклад (рис. 9.11):

Для обчислення ввибірковіхсередніхвикористовуємо функцію СРЗНАЧ(число1: числоN) з категорії Статистичні .

Вибіркова коваріаціяміж та знаходиться за допомогою функції КОВАР(масив)X;масивY) з категорії Статистичні .

Вибірковийїдисперсиівизначаються статистичною функцією ДИСПР(число1: числоN) .

Рис.9 .11. Обчислення показателей вбудованими функціямиMSExcel

Параметрылінійної регресії Excel можна визначити декількома способами.

1 спосіб) За допомогою вбудованої функції Лінейн. Порядок дій наступний:

1. Виділити область порожніх осередків 5x2 (5 рядків, 2 стовпці) для виведення результатів регресійної статистикиабо область 1x2 – для отримання лише коефіцієнтів регресії.

2. За допомогою Майстри функційсеред Статистичних вибрати функцію Лінейнта заповнити її аргументи (рис. 9.12):

Рис. 9 . 12 . Діалогове вікно введення аргументів функціїЛінейн

Відомі_значення_y

Відомі_значення_x

Конст- логічне значення (1 чи 0), що свідчить про наявність чи відсутність вільного члена у рівнянні; ставимо 1;

Статистика- логічне значення (1 або 0), яке вказує, виводити додаткову інформацію щодо регресійного аналізу чи ні; ставимо 1.

3. У верхньому лівому осередку виділеної області з'явиться перше число таблиці. Для розкриття таблиці потрібно натиснути на клавішу < F2> , а потім – на комбінацію клавіш < CTRL> + < SHIFT> + < ENTER> .

Додаткову регресійну статистику буде виведено у вигляді (табл. 9.3):

Таблиця 9.3

значення коефіцієнта	значення коефіцієнта
Середньоквадратичне відхилення	Середньоквадратичне відхилення
Коефіцієнт детермінації	Середньоквадратичне відхилення
Статистика	Число ступенів свободи
Регресійна сума квадратів	Залишкова сума квадратів

Внаслідок застосування функції Лінейнотримаємо:

( 2 спосіб) За допомогою інструмента аналізу даних Регресія можна отримати результати регресійної статистики, дисперсійного аналізу, довірчі інтервали, залишки, графіки підбору ліній регресії, графіки залишків та нормальної ймовірності. Порядок дій наступний:

1. Необхідно перевірити доступ до Пакету аналізу. Для цього у головному меню (через кнопку Microsoft Office отримати доступ до параметрів MS Excel) у діалоговому вікні «Параметри MSExcel» вибрати команду «Надбудови» і праворуч вибрати надбудову Пакет аналіз а далі натиснути кнопку «Перейти» (рис. 9.13). У діалоговому вікні, що відкрилося, поставити галочку навпроти «Пакет аналізу» і натиснути «ОК» (рис. 9.14).

На вкладці "Дані" у групі "Аналіз" з'явиться доступ до встановленої надбудови. (Рис. 9.15).

Рис.9 .13. Увімкнення надбудов уMSExcel

Рис.9 .14. Діалогове вікно «Надбудови»

Рис.9 .15. Надбудова «Аналіз даних» на стрічціMSExcel 2007 .

2. Вибрати на «Дані» у групі «Аналіз» вибираємо команду Аналіз так н них у діалоговому вікні, що відкрилося, вибрати інструмент аналізу «Регресія» і натиснути «ОК» (рис. 9.16):

Рис.9 .16. Діалогове вікно «Аналіз даних»

У діалоговому вікні (рис. 9.17) заповнити поля:

Вхідний інтервалY- Діапазон, що містить дані результативної ознаки Y;

Вхідний інтервалX- діапазон, що містить дані пояснювальної ознаки X;

Мітки- прапорець, який вказує, чи містить перший рядок назви стовпців чи ні;

Константа-нуль- Прапорець, що вказує на наявність або відсутність вільного члена в рівнянні;

Вихідний інтервал- Досить вказати ліву верхню комірку майбутнього діапазону;

Новий робочий лист- можна задати довільне ім'я нового аркуша, який буде виведено результати.

Рис.9 .17. Діалогове вікно «Регресія»

Для отримання інформації про залишки, графіків залишків, підбору та нормальної ймовірності потрібно встановити відповідні прапорці у діалоговому вікні.

Рис. 9 . 18 . Результати застосування інструментуРегресія

У MSExcel лінія трендуможе бути додана в діаграму з областями гістограми або графік. Для цього:

1. Необхідно виділити область побудови діаграми та у стрічці вибрати «Макет» та у групі аналіз вибрати команду «Лінія тренду» (рис. 9.19.). У пункті меню вибрати «Додаткові параметри лінії тренда».

Рис. 1.19.Стрічка

2. У діалоговому вікні, що з'явилося, вибрати фактичні значення, потім відкриється діалогове вікно «Формат лінії тренду» (рис. 9.20.) в якому вибирається вид лінії тренда і встановлюються відповідні параметри.

Рис. 9 . 20 . Діалогове вікно"Формат лінії тренду"

Для поліномінального тренду необхідно задати ступінь апроксимуючого полінома, для лінійної фільтрації – кількість точок усереднення.

Вибираємо Лінійнадля побудови рівняння лінійної регресії

В якості додаткової інформаціїможна, можливо показати рівняння на діаграміі помістити на діаграму величину(Рис.9.21).

Рис. 9 . 21 . Лінійний тренд

Нелінійні моделі регресії ілюструються при обчисленні параметрів рівняння із застосуванням обраної в Excel статистичної функції ЛГРФПРИБЛ. Порядок обчислень аналогічний до застосування функції Лінейн.

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http:// www. allbest. ru/

Міністерство освіти та науки Російської Федерації

Федеральне державне бюджетне освітня установавищої освіти

«Комсомольський-на-Амурі державний технічний університет»

Факультет економіки та менеджменту

Кафедра «Економіки, фінансів та бухгалтерського обліку»

РОЗРАХУНОВО-ГРАФІЧНЕ ЗАВДАННЯ

з дисципліни «Економетрика»

Студент групи

А.Ю. Зайченко

Викладач

І.І. Антонова

Таблиця 1

Номер регіону	Середньодушовий прожитковий мінімум на день одного працездатного, руб.,	Середньоденна вести, крб.,

Потрібно:

1. Побудувати лінійне рівняння парної регресії.

3. Оцінити статистичну значимість параметрів регресії та кореляції за допомогою -критерію Фішера та -критерію Стьюдента.

4. Виконати прогноз заробітної платипри прогнозному значенні середньодушового прожиткового мінімуму, що становить 107% середнього рівня.

5. Оцінити точність прогнозу, розрахувавши помилку прогнозу та його довірчий інтервал.

6. На одному графіку побудувати вихідні дані та теоретичну пряму.

1. Для розрахунку параметрів рівняння лінійної регресії будуємо розрахункову таблицю 2. лінійний кореляціяапроксимація регресія

Таблиця 2















Середнє значення

Отримано рівняння регресії:

Зі збільшенням середньодушового прожиткового мінімуму на 1 руб. середньоденна вести збільшується загалом на 0,89 крб.

2. Тісноту лінійного зв'язку оцінить коефіцієнт кореляції:

Це означає, що 51% варіації заробітної плати () пояснюється варіацією фактора – середньодушового прожиткового мінімуму.

Якість моделі визначає середня помилка апроксимації:

Якість побудованої моделі оцінюється як хороша, тому що не перевищує 8-10%.

3. Оцінку значущості рівняння регресії загалом проведемо з допомогою - критерію Фішера. Фактичне значення -критерію:

Табличне значення критерію при п'ятивідсотковому рівні значущості та ступенях свободи та становить. Оскільки рівняння регресії визнається статистично значущим.

Оцінку статистичної значимостіпараметрів регресії проведемо за допомогою статистики Стьюдента і шляхом розрахунку довірчого інтервалу кожного з показників.

Табличне значення - критерій для числа ступенів свободи і становитиме.

Визначимо випадкові помилки:

Фактичні значення-статистики перевищують табличне значення:

тому параметри, і випадково відрізняються від нуля, а статистично значущі. Розрахуємо довірчі інтервали для параметрів регресії та. Для цього визначимо граничну помилку для кожного показника:

Довірчі інтервали:

Аналіз верхньої та нижньої меж довірчих інтервалів призводить до висновку у тому, що з ймовірністю параметри і, перебуваючи у зазначених межах, не приймають нульових значень, тобто. є статистично незначущими і істотно відмінні від нуля.

4. Отримані оцінки рівняння регресії дають змогу використовувати його для прогнозу. Якщо прогнозне значення прожиткового мінімуму становитиме:

тоді прогнозне значення заробітної плати становитиме:

Помилка прогнозу складе:

Гранична помилка прогнозу, яка у разі не буде перевищена, становитиме:

Довірчий інтервал прогнозу:

Виконаний прогноз середньомісячної заробітної плати є надійним () та знаходиться в межах від 131,66 руб. до 190,62 руб. На закінчення розв'язання задачі побудуємо на одному графіку вихідні дані та теоретичну пряму (рисунок1)

Малюнок 1

Розміщено на Allbest.ru

Подібні документи

Побудова лінійного рівнянняпарної регресії, розрахунок лінійного коефіцієнта парної кореляції та середньої помилки апроксимації. Визначення коефіцієнтів кореляції та еластичності, індексу кореляції, суть застосування критерію Фішера в економетриці.

контрольна робота , доданий 05.05.2010

Розрахунок параметрів парної лінійної регресії. Оцінка статистичної значущості рівняння регресії та її параметрів з допомогою критеріїв Фішера і Стьюдента. Побудова матриці парних коефіцієнтів кореляції. Статистичний аналізза допомогою ППП MS EXCEL.

контрольна робота , доданий 14.05.2008

Розрахунок лінійного коефіцієнта парної та приватної кореляції. Статистична значущість параметрів регресії та кореляції. Аналіз кореляційного поля даних. Точність прогнозу, розрахунок помилки та довірчий інтервал. Коефіцієнт множинної детермінації.

контрольна робота , доданий 11.12.2010

Економічна інтерпретація коефіцієнта регресії. Знаходження статичної суми квадратів та оцінка дисперсії залишків. Перевіряє значення параметрів рівняння регресії за допомогою t-критерію Стьюдента. Розрахунок середньої відносної помилкиапроксимації.

контрольна робота , доданий 23.03.2010

Побудова довірчого інтервалу коефіцієнта регресії. Визначення помилки апроксимації, індексу кореляції та F-критерію Фішера. Оцінка еластичності зміни матеріаломісткості продукції. Побудова лінійного рівняння множинної регресії.

контрольна робота , доданий 11.04.2015

Розрахунок параметрів рівняння лінійної регресії, оцінка тісноти зв'язку за допомогою показників кореляції та детермінації. Визначення середньої помилки апроксимації. Статистична надійність моделювання за допомогою F-критерію Фішера та t-критерію Стьюдента.

контрольна робота , доданий 17.10.2009

Визначення кількісної залежності маси хутрового звіра від віку. Побудова рівняння парної регресії, розрахунок його параметрів та перевірка адекватності. Оцінка статистичної значущості параметрів регресії, розрахунок їхнього довірчого інтервалу.

лабораторна робота , доданий 02.06.2014

Побудова гіпотези про форму зв'язку грошових доходів душу населення із споживчими витратами в Уральському і Західно-Сибірському регіонах РФ. Розрахунок параметрів рівнянь парної регресії, оцінка якості за допомогою середньої помилки апроксимації.

контрольна робота , доданий 05.11.2014

Аналіз методу найменших квадратів для парної регресії як методу оцінювання параметрів лінійної регресії. Розгляд лінійного рівняння парної регресії. Дослідження множинної лінійної регресії. Вивчення помилок коефіцієнтів регресії.

контрольна робота , доданий 28.03.2018

Побудова поля кореляції. Розрахунок параметрів рівнянь парної регресії. Залежність середньої очікуваної тривалості життя деяких чинників. Вивчення "критерію Фішера". Оцінка тісноти зв'язку за допомогою показників кореляції та детермінації.

Рівняння парної регресії.

З поля кореляції можна висунути гіпотезу (для генеральної сукупності) у тому, що зв'язок між усіма можливими значеннями X і Y носить лінійний характер.

Лінійне рівняння регресії має вигляд y = bx + a + ε

Система звичайних рівнянь.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

Для наших даних система рівнянь має вигляд

12a + 1042 b = 1709

1042 a + 91556 b = 149367

З першого рівняння виражаємо аі підставимо на друге рівняння:

Отримуємо емпіричні коефіцієнти регресії: b = 0.9, a = 64.21

Рівняння регресії (емпіричне рівняння регресії):

y = 0.9 x + 64.21

Емпіричні коефіцієнти регресії aі bє лише оцінками теоретичних коефіцієнтів β i , а саме рівняння відображає лише загальну тенденцію в поведінці змінних, що розглядаються.

Для розрахунку параметрів лінійної регресії збудуємо розрахункову таблицю (табл. 1)

1. Параметри рівняння регресії.

Вибіркові середні.

Вибіркові дисперсії:

Середньоквадратичне відхилення

1.1. Коефіцієнт кореляції

Коваріація.

Розраховуємо показник тісноти зв'язку. Таким показником є вибірковий лінійний коефіцієнт кореляції, який розраховується за такою формулою:

1.2. Рівняння регресії(Оцінка рівняння регресії).

Лінійне рівняння регресії має вигляд y = 0.9 x + 64.21

1.3. Коефіцієнт еластичності.

Коефіцієнт еластичності знаходиться за формулою:

1.4. Помилка апроксимації.

Помилка апроксимації в межах 5%-7% свідчить про хороший вибір рівняння регресії до вихідних даних.

1.5. Емпіричне кореляційне ставлення.

Емпіричне кореляційне ставлення обчислюється всім форм зв'язку і служить вимір тісноти залежності. Змінюється в межах.

Індекс кореляції.

Для лінійної регресії індекс кореляції дорівнює коефіцієнту кореляції r xy = 0.79.

Для будь-якої форми залежності тіснота зв'язку визначається за допомогою множинного коефіцієнта кореляції:

1.6. Коефіцієнт детермінації.

Найчастіше, даючи інтерпретацію коефіцієнта детермінації, його виражають у відсотках.

R 2 = 0.79 2 = 0.62

Для оцінки якості параметрів лінійної регресії збудуємо розрахункову таблицю (табл. 2)

2. Оцінка параметрів рівняння регресії.

2.1. Значення коефіцієнта кореляції.

Для того щоб при рівні значущості α перевірити нульову гіпотезу про рівність нулю генерального коефіцієнта кореляції нормальної двовимірної випадкової величини при конкуруючій гіпотезі H 1 ≠ 0, треба обчислити значення критерію, що спостерігається.

та за таблицею критичних точокрозподілу Стьюдента, за заданим рівнем значимості α і числом ступенів свободи k = n - 2 знайти критичну точку t критий двосторонньої критичної області. Якщо t набл< t крит оснований отвергнуть нулевую гипотезу. Если |t набл | >t критий - нульову гіпотезу відкидають.

За таблицею Стьюдента з рівнем значущості α=0.05 та ступенями свободи k=10 знаходимо t крит:

де m = 1 – кількість пояснюючих змінних.

2.2. Інтервальна оцінка коефіцієнта кореляції (довірчий інтервал).

2.3. Аналіз точності визначення оцінок коефіцієнтів регресії.

Незміщеною оцінкою дисперсії збурень є величина:

S 2 y = 53.63 - непояснена дисперсія (захід розкиду залежної змінної навколо лінії регресії).

S y = 7.32 – стандартна помилка оцінки (стандартна помилка регресії).

Sa - стандартне відхиленнядовільної величини a.

S b – стандартне відхилення випадкової величини b.

2.4. Довірчі інтервали для залежної змінної.

(a + bx p ± ε)

Розрахуємо межі інтервалу, в якому буде зосереджено 95% можливих значень Y при необмежено великій кількості спостережень та X p = 107

Індивідуальні довірчі інтервали для Y за даного значення X.

(a + bx i ± ε)

t критий (n-m-1;α/2) = (10;0.025) = 2.228

2.5. Перевірка гіпотез щодо коефіцієнтів лінійного рівняння регресії.

1) t-статистика. Критерій Стьюдента.

t критий (n-m-1;α/2) = (10;0.025) = 2.228

Довірчий інтервал для коефіцієнтів рівняння регресії.

(b - t крит S b; b + t крит S b)

(a - t критий S a ; a + t критий S a)

2) F-статистика. Критерій Фішера.

Табличне значення критерію зі ступенями свободи k 1 =1 і k 2 =10, F табл = 4.96

Парна лінійна регресія

ПРАКТИКУМ

Парна лінійна регресія: Практикум. -

Вивчення економетрики передбачає набуття студентами досвіду побудови економетричних моделей, прийняття рішень щодо специфікації та ідентифікації моделі, вибору методу оцінки параметрів моделі, оцінки її якості, інтерпретації результатів, отримання прогнозних оцінок та ін. Практикум допоможе студентам набути практичних навичок у цих питаннях.

Затверджено редакційно-видавничою радою

Упорядник: М.Б. Перова, д.е.н., професор

загальні положення

Економетричне дослідження починається з теорії, яка встановлює зв'язок між явищами. З усього кола чинників, які впливають результативний ознака, виділяються найбільш істотні чинники. Після того, як було виявлено наявність взаємозв'язку між ознаками, визначається точний вид цієї залежності за допомогою регресійного аналізу.

Регресійний аналізполягає у визначенні аналітичного виразу (у визначенні функції), у якому зміна однієї величини (результативної ознаки) обумовлена впливом незалежної величини (факторної ознаки). Кількісно оцінити цей взаємозв'язок можна за допомогою побудови рівняння регресії або регресійної функції.

Базовою регресійною моделлю є модель парної (однофакторної) регресії. Парна регресія- Рівняння зв'язку двох змінних уі х:

де - Залежна змінна (результативний ознака);

-незалежна, що пояснює змінна (факторна ознака).

Залежно від характеру зміни узі зміною хрозрізняють лінійні та нелінійні регресії.

Лінійна регресія

Дана регресійна функція називається поліномом першого ступеня і використовується для опису процесів, що поступово розвиваються в часі.

Наявність випадкового члена (помилки регресії) пов'язано з впливом на залежну зміну інших неврахованих у рівнянні факторів, з можливою нелінійністю моделі, помилками виміру, отже, поява випадкової помилки рівняннярегресії може бути обумовлено наступними об'єктивними причинами:

1) нерепрезентативність вибірки. У модель парної регресії включається фактор, не здатний повністю пояснити варіацію результативної ознаки, який може бути схильний до впливу багатьох інших факторів (пропущених змінних) значно більшою мірою. Наприклад, заробітна плата може залежати, крім кваліфікації, від рівня освіти, стажу роботи, статі та ін.;

2) існує ймовірність того, що змінні, що беруть участь у моделі, можуть бути виміряні з помилкою. Наприклад, дані про витрати сім'ї на харчування складаються на підставі записів учасників опитувань, які, як передбачається, ретельно фіксують свої щоденні витрати. Зрозуміло, у своїй можливі помилки.

На основі вибіркового спостереження оцінюється вибіркове рівняння регресії ( лінія регресії):

де
- Оцінки параметрів рівняння регресії (
).

Аналітична форма залежностіміж досліджуваною парою ознак (регресійна функція) визначається за допомогою наступних методів:

На основі теоретичного та логічного аналізуприроди явищ, що вивчаються, їх соціально-економічної сутності. Наприклад, якщо вивчається залежність між доходами населення та розміром вкладів населення у банки, то очевидно, що зв'язок прямий.

Графічний методколи характер зв'язку оцінюється візуально.

Цю залежність можна наочно побачити, якщо побудувати графік, відклавши на осі абсцис значення ознаки х, але в осі ординат – значення ознаки у. Нанісши на графік точки, що відповідають значенням хі у, отримаємо кореляційне поле:

а) якщо точки безладно розкидані по всьому полю – це говорить про відсутність залежності між цими ознаками;

б) якщо точки концентруються навколо осі, що йде від нижнього лівого кута до верхнього правого – то є пряма залежність між ознаками;

в) якщо точки концентруються навколо осі, що йде від верхнього лівого кута до нижнього правого – то зворотня залежністьміж ознаками.

Якщо кореляційному полі з'єднаємо точки відрізками прямий, то отримаємо ламану лінію з деякою тенденцією до зростання. Це буде емпірична лінія зв'язку або емпірична лінія регресії. За її виглядом можна судити не тільки про наявність, а й про форму залежності між ознаками, що вивчаються.

Побудова рівняння парної регресії

Побудова рівняння регресії зводиться оцінки її параметрів. Ці оцінки параметрів можна знайти різними способами. Одним з них є спосіб найменших квадратів (МНК). Суть методу полягає у наступному. Кожному значенню відповідає емпіричне (спостерігається) значення . Побудувавши рівняння регресії, наприклад, рівняння прямої лінії, кожному значенню відповідатиме теоретичне (розрахункове) значення . Значення, що спостерігаються не лежать точно на лінії регресії, тобто. не збігаються з . Різниця між фактичним та розрахунковим значеннями залежної змінної називається залишком:

МНК дозволяє отримати такі оцінки параметрів, за яких сума квадратів відхилень фактичних значень результативної ознаки увід теоретичних , тобто. сума квадратів залишків, мінімальна:

Для лінійних рівнянь та нелінійних, що наводяться до лінійних, вирішується така система щодо аі b:

де n- Чисельність вибірки.

Розв'язавши систему рівнянь, отримаємо значення аі bщо дозволяє записати рівняння регресії(Регресійне рівняння):

де - Пояснення (незалежна) змінна;

-Пояснюється (залежна) змінна;

Лінія регресії проходить через точку ( ,) та виконуються рівності:

Можна скористатися готовими формулами, які випливають із цієї системи рівнянь:

де - Середнє значення залежної ознаки;

-Середнє значення незалежної ознаки;

-Середнє арифметичне значення твору залежної та незалежної ознак;

-Дисперсія незалежної ознаки;

-Ковариація між залежним і незалежним ознаками.

Вибірковою коваріацієюдвох змінних х, уназивається середня величинатвори відхилень цих змінних від своїх середніх

Параметр bпри хмає велике практичне значення і зветься коефіцієнта регресії. Коефіцієнт регресіїпоказує, наскільки одиниць у середньому змінюється величина у хна 1 одиницю свого виміру.

Знак параметра bу рівнянні парної регресії вказує на напрямок зв'язку:

якщо
, то зв'язок між показниками, що вивчаються пряма, тобто. зі збільшенням факторної ознаки хзбільшується і результативна ознака у, і навпаки;

якщо
, то зв'язок між показниками, що вивчаються зворотний, тобто. зі збільшенням факторної ознаки хрезультативна ознака узменшується, і навпаки.

Значення параметру ау рівнянні парної регресії часом можна трактувати як початкове значення результативного ознаки у. Таке трактування параметра аможлива лише в тому випадку, якщо значення
має сенс.

Після побудови рівняння регресії, значення, що спостерігаються yможна уявити як:

Залишки , як і помилки , є випадковими величинамипроте вони, на відміну від помилок спостерігаються. Залишок є та частина залежної змінної y, яку неможливо пояснити за допомогою рівняння регресії

На підставі рівняння регресії можуть бути обчислені теоретичні значення у хдля будь-яких значень х.

p align="justify"> В економічному аналізі часто використовується поняття еластичності функції. Еластичність функції
розраховується як відносна зміна yдо відносної зміни x. Еластичність показує, на скільки відсотків змінюється функція
за зміни незалежної змінної на 1%.

Оскільки еластичність лінійної функції
не є постійною величиною, а залежить від х, зазвичай розраховується коефіцієнт еластичності як середній показник еластичності.

Коефіцієнт еластичностіпоказує, наскільки відсотків у середньому за сукупністю зміниться величина результативної ознаки упри зміні факторної ознаки хна 1% від свого середнього значення:

де
- Середні значення змінних хі уу вибірці.

Оцінка якості побудованої моделі регресії

Якість моделі регресії- Адекватність побудованої моделі вихідним (спостерігається) даним.

Щоб виміряти тісноту зв'язку, тобто. виміряти, наскільки вона близька до функціональної, потрібно визначити дисперсію, що вимірює відхилення увід у хта характеризує залишкову варіацію, обумовлену іншими факторами. Вони лежать в основі показників, що характеризують якість моделі регресії.

Якість парної регресії визначається за допомогою коефіцієнтів, що характеризують

1) тісноту зв'язку - індексу кореляції, парного лінійного коефіцієнта кореляції;

2) помилку апроксимації;

3) якість рівняння регресії та окремих його параметрів – середні квадратичні помилки рівняння регресії загалом та окремих його параметрів.

Для рівнянь регресії будь-якого виду визначається індекс кореляції, що характеризує лише тісноту кореляційної залежності, тобто. ступінь її наближення до функціонального зв'язку:

де - Факторна (теоретична) дисперсія;

-Загальна дисперсія.

Індекс кореляції набуває значення
, при цьому,

якщо

якщо
- то зв'язок між ознаками хі ує функціональною, Чим ближче до 1, тим більше тісним вважається зв'язок між ознаками, що вивчаються. Якщо
, то зв'язок можна вважати тісним

Дисперсії, необхідні обчислення показників тісноти зв'язку обчислюються:

Загальна дисперсія, що вимірює загальну варіацію за рахунок дії всіх факторів:

Факторна (теоретична) дисперсія,що вимірює варіацію результативної ознаки уза рахунок дії факторної ознаки х:

Залишкова дисперсія, що характеризує варіацію ознаки уза рахунок усіх факторів, крім х(тобто при виключеному х):

Тоді за правилом складання дисперсій:

Якість парної лінійноїрегресії може бути визначено також за допомогою парного лінійного коефіцієнта кореляції:

де
- Коваріація змінних хі у;

-Середньоквадратичне відхилення незалежної ознаки;

-Середньоквадратичне відхилення залежної ознаки.

Лінійний коефіцієнт кореляції характеризує тісноту і напрямок зв'язку між ознаками, що вивчаються. Він вимірюється не більше [-1; +1]:

якщо
- то зв'язок між ознаками прямий;

якщо
- то зв'язок між ознаками зворотний;

якщо
- то зв'язок між ознаками відсутня;

якщо
або
- то зв'язок між ознаками є функціональним, тобто. характеризується повною відповідністю між хі у. Чим ближче до 1, тим більше тісним вважається зв'язок між ознаками, що вивчаються.

Якщо індекс кореляції (парний лінійний коефіцієнт кореляції) звести квадрат, то отримаємо коефіцієнт детермінації.

Коефіцієнт детермінації– являє собою частку факторної дисперсії у загальній та показує, на скільки відсотків варіація результативної ознаки упояснюється варіацією факторної ознаки х:

Він характеризує не всю варіацію увід факторної ознаки х, лише ту її частина, що відповідає лінійному рівнянню регресії, тобто. показує питому вагу варіації результативного ознаки, лінійно що з варіацією факторного ознаки.

Величина
- Частка варіації результативної ознаки, яку модель регресії врахувати не змогла.

Розсіювання точок кореляційного поля може бути дуже велике, і обчислене рівняння регресії може давати велику похибку в оцінці показника, що аналізується.

Середня помилка апроксимаціїпоказує середнє відхилення розрахункових значень від фактичних:

Максимально допустиме значення 12-15%.

Мірою розкиду залежної змінної навколо лінії регресії служить стандартна помилка. Для всієї сукупності значень, що спостерігаються, розраховується стандартна (середньоквадратична) помилка рівняння регресії, яка є середнім квадратичним відхиленням фактичних значень ущодо теоретичних значень, розрахованих за рівнянням регресії у х .

де
- Число ступенів свободи;

m- Число параметрів рівняння регресії (для рівняння прямої m=2).

Оцінити величину середньої квадратичної помилкиможна зіставивши її

а) із середнім значення результативної ознаки у;

б) із середнім квадратичним відхиленням ознаки у:

якщо
то використання даного рівняння регресії є доцільним.

Окремо оцінюються стандартні (Середньоквадратичні) помилки параметрів рівняння та індексу кореляції:

;
;
.

 х- Середнє квадратичне відхилення х.

Перевірка значущості рівняння регресії та показників тісноти зв'язку

Щоб побудовану модель можна було використовуватиме подальших економічних розрахунків, перевірки якості побудованої моделі недостатньо. Необхідно також перевірити значущість (суттєвість) отриманих з допомогою методу найменших квадратів оцінок рівняння регресії та показника тісноти зв'язку, тобто. необхідно перевірити їх у відповідність справжнім параметрам взаємозв'язку.

Це з тим, що обчислені за обмеженою сукупності показники зберігають елемент випадковості, властивий індивідуальним значенням ознаки. Тому є лише оцінками певної статистичної закономірності. Необхідна оцінка ступеня точності та значущості (надійності, суттєвості) параметрів регресії. Під значимістюрозуміють ймовірність того, що значення параметра, що перевіряється, не дорівнює нулю, не включає в себе величини протилежних знаків.

Перевірка значущості– перевірити, що параметри відрізняються від нуля.

Оцінка значущості парного рівняння регресіїзводиться до перевірки гіпотез про значущість рівняння регресії в цілому та окремих його параметрів ( a, b), парного коефіцієнта детермінації чи індексу кореляції.

У цьому випадку можуть бути висунуті наступні основні гіпотезиH 0 :

1)
- Коефіцієнти регресії є незначними і рівняння регресії також є незначним;

2)
– парний коефіцієнт детермінації незначний і рівняння регресії також незначним.

Альтернативною (або зворотною) виступають такі гіпотези:

1)
- Коефіцієнти регресії значно відрізняються від нуля, і побудоване рівняння регресії є значним;

2)
– парний коефіцієнт детермінації істотно від нуля і побудоване рівняння регресії є значним.

Перевірка гіпотези про значущість рівняння парної регресії

Для перевірки гіпотези про статистичну незначущість рівняння регресії в цілому та коефіцієнта детермінації використовується F-Критерій(критерій Фішера):

або

де k 1 = m–1 ; k 2 = n– m - Число ступенів свободи;

n- Число одиниць сукупності;

m- Число параметрів рівняння регресії;

-факторна дисперсія;

-залишкова дисперсія.

Гіпотеза перевіряється так:

1) якщо фактичне (спостерігається) значення F-критерію більше критичного (табличного) значення даного критерію
, то з ймовірністю
основна гіпотеза про незначущість рівняння регресії чи парного коефіцієнта детермінації відкидається, і рівняння регресії визнається значним;

2) якщо фактичне (спостерігається) значення F-критерію менше критичного значення даного критерію
, то з ймовірністю (
) основна гіпотеза про незначущість рівняння регресії чи парного коефіцієнта детермінації приймається, і побудоване рівняння регресії визнається незначним.

Критичне значення F-критерія знаходиться за відповідними таблицями в залежності від рівня значущості та числа ступенів свободи
.

Число ступенів свободи- Показник, який визначається як різниця між обсягом вибірки ( n) та числом оцінюваних параметрів за даною вибіркою ( m). Для моделі парної регресії число ступенів свободи розраховується як
, оскільки за вибіркою оцінюються два параметри (
).

Рівень значущості - Величина, що визначається
,

де - Довірча ймовірність потрапляння оцінюваного параметра довірчий інтервал. Зазвичай приймається 0,95. Таким чином - це ймовірність того, що оцінюваний параметр не потрапить в довірчий інтервал, що дорівнює 0,05 (5%).

Тоді у разі оцінки значущості рівняння парної регресії критичне значення F-критерію обчислюється як
:

Перевірка гіпотези про значущість параметрів рівняння парної регресії та індексу кореляції

При перевірці значущості параметрів рівняння (припущення, що параметри відрізняються від нуля) висувається основна гіпотеза про незначність отриманих оцінок (
. Як альтернативна (зворотна) висувається гіпотеза про значущість параметрів рівняння (
).

Для перевірки висунутих гіпотез використовується t -Критерій (t-статистика) Стьюдента. Спостережуване значення t-критерія порівнюється зі значенням t-Критерію, що визначається за таблицею розподілу Стьюдента (критичним значенням). Критичне значення t-критерія
залежить від двох параметрів: рівня значущості та числа ступенів свободи
.

Висунуті гіпотези перевіряються так:

1) якщо модуль значення, що спостерігається t-критерію більше критичного значення t-Критерію, тобто.
, то з ймовірністю
основну гіпотезу про незначущість властивостей регресії відкидають, тобто. параметри регресії не дорівнюють 0;

2) якщо модуль значення, що спостерігається t-критерія менша або дорівнює критичному значенню t-Критерію, тобто.
, то з ймовірністю
Основна гіпотеза про незначущість властивостей регресії приймається, тобто. параметри регресії майже відрізняються від 0 чи рівні 0.

Оцінка значущості коефіцієнтів регресії за допомогою критерію Стьюдента проводиться шляхом зіставлення їх оцінок із величиною стандартної помилки:

;

Для оцінки статистичної значущості індексу (лінійного коефіцієнта) кореляції застосовується також t-Критерій Стьюдента.

Парна лінійна регресія

Попередні розрахунки:

;
;
;
;
;

;
.

Побудова таблиці виду



Середнє значення

Формули для розрахунків параметрів:

,
.

Лінейн

Оцінка тісноти зв'язку:

а) коефіцієнт кореляції
, або
;

При комп'ютерному підборі використовувати вбудовану функцію Корел

б) коефіцієнт еластичності
;

в) коефіцієнт детермінації .

Оцінка значущості рівняння регресії загалом:

Попередні розрахунки із побудовою таблиці виду

а) F -критерій Фішерапри числі ступенів свободи
і
і рівні значимості 0,05 дивитись у таблиці. Розрахункове значення критерію:

Якщо розрахункове значення F-критерію більше табличного, нульова гіпотеза про відсутність значущого зв'язку ознак xі y відхиляється, і робиться висновок про суттєвість зв'язку.

б) Середня помилка апроксимації

Оцінка значущості параметрів регресії:

а) Стандартна помилка параметра a розраховується за формулою

, де
.

б) Стандартна помилка коефіцієнта регресії bрозраховується за формулою

в) Стандартна помилка коефіцієнта кореляції розраховується за формулою

t-Критерій Ст'юдента при числі ступенів свободи
і рівні значимості 0,05 дивитись у таблиці.

Фактичні значення t-статистики:

,
,
.

Якщо фактичне значення по абсолютній величині перевищує табличний, гіпотезу про несуттєвість параметра регресії можна відхилити, параметр визнається значущим.

Зв'язок міжF -критерієм Фішера і t -критерієм Ст'юдентавиражається рівністю

Розрахунок довірчих інтервалів для параметрів регресії:

Довірчий інтервал для параметра a визначається як
;

довірчий інтервал для коефіцієнта регресії визначається як
.

При комп'ютерному аналізі використовувати в Excel Сервіс/Аналіз даних/Регресія.

Інтервальний прогноз на основі лінійного рівняння регресії:

Нехай – прогнозне значення факторної ознаки;
- Точковий прогноз результативної ознаки. Тоді

а) середня помилка прогнозу :

;

б) довірчий інтервал прогнозу

за допомогою табличного редактораMS Excel

Активізація надбудовиПакет аналізу

Для активізації надбудови Пакет аналізунеобхідно виконати такі дії:

1. Вибрати команду Сервіс/Надбудови.

2. У діалоговому вікні встановити прапорець Пакет аналізу.

Відповідно до варіанта завдання, використовуючи статистичний матеріал, необхідно:

2. Оцінити тісноту зв'язку залежної змінної (результативного фактора) з пояснювальною змінною за допомогою показників кореляції та детермінації.

3. Оцінити за допомогою F-Критер Фішера статистичну надійність моделювання.

4. Оцінити статистичну значущість параметрів регресії та кореляції.

5. Визначити середню помилку апроксимації.

6. Використовуючи коефіцієнт еластичності, виконати кількісну оцінку впливу пояснюючого чинника результат.

7. Виконати точковий та інтервальний прогноз результативної ознаки зі збільшенням пояснювальної ознаки на 25% від її середнього значення (достовірність прогнозу 95%).

8. На одній діаграмі зобразити поле кореляції вихідних даних та пряму регресію.

приклад

Є дані про річну ціну програми «Майстер ділового адміністрування» та кількість слухачів в освітній установі.

I. Вводимо вихідні дані у документ Excel.

ІІ. Викликаємо надбудову Аналіз даниху меню сервіс.

ІІІ. Вибираємо інструмент Регресія.

IV. Заповнюємо відповідні позиції вікна Регресія.

V. Після натискання Ок отримуємо протокол розв'язання задачі.

VI. Аналізуємо отриманий протокол.

1) Коефіцієнт регресії;

Вільний член рівняння регресії
.

Примітка. За потреби результати округляються з необхідною точністю. Вимогу щодо округлення можна провести спочатку, задавши кількість знаків після коми в меню Формат осередку.

Рівняння парної лінійної регресії має вигляд: .

2) Коефіцієнт кореляції
, що свідчить про тісний зв'язок ознак yі x. Коефіцієнт детермінації
. Отримане рівняння регресії пояснює 53% варіації ознаки y, Інші 47% мінливості цієї ознаки обумовлені впливом неврахованих у моделі факторів.

3) Оцінимо статистичну значимість (надійність моделювання) рівняння загалом. Розрахункове значення критерію Фішера зазначено у протоколі,
. Критичне значення цього критерію можна знайти за допомогою статистичної функції FРОЗКЛАДтабличного редактора Еxcel.

Вхідними параметрами цієї функції є:

- Рівень значущості (імовірність), мається на увазі ймовірність помилки відкинути вірну гіпотезу про статистичну незначущість побудованого рівняння регресії. Як правило, вибирають рівень значущості, що дорівнює 0,05 або 0,01;

– число ступенів свободи 1 – збігається з кількістю параметрів при змінній рівнянні регресії, для парної лінійної регресії
це число дорівнює одиниці;

- Число ступенів свободи 2 дорівнює для парної лінійної регресії
, де n- Обсяг вихідних статистичних даних.

Виконуємо дії Вставка/ФункціяВибираємо потрібне.

Оскільки розрахункове значення F-критерію більше табличного, рівного 4,84, нульова гіпотеза про відсутність значимого зв'язку ознак x і y відхиляється і робиться висновок про суттєвість зв'язку.

4) Оцінимо статистичну значимість властивостей aі bу рівнянні регресії за допомогою t- Критерію Ст'юдента.

Розрахункові значення статистики Ст'юдента
,
. Відповідне табличне значення можна визначити через статистичну функцію Стюдрозбірчисло ступенів свободи дорівнює
.

Оскільки фактичні значення абсолютної величини перевищують табличне, рівне 2,2, гіпотезу про несуттєвість параметрів регресії можна відхилити.

5) Визначимо середню помилку апроксимації,
. Потрібно буде виконувати допоміжні розрахунки, оформлені у вигляді таблиці.

Таким чином, середня помилка апроксимації за даним рівнянням регресії становить 12,66%, модель парної лінійної регресії можна визнати задовільною та придатною для прогнозування.

6) Виконаємо кількісну оцінку впливу фактора xна фактор y, використовуючи коефіцієнт еластичності Для парної лінійної регресії його можна знайти за формулою
. Маємо

Отже, зі збільшенням кількості слухачів на 1% річна ціна зменшиться на 0,4%.

7) Виконаємо розрахунок прогнозу yзі збільшенням чинника xна 25% від середнього.

Прогнозне значення.

Точковий прогноз ознаки y: .

Середня помилка прогнозу дорівнює ,

де
- Залишкова дисперсія,
-Дисперсія фактора x.

Чисельне значення суми
у протоколі позначено як залишкове SS.

Тоді
,
.

Найшвидший спосіб отримання допоміжних характеристик - Середнього значення фактора xі - дисперсії, скористатися інструментом Описова статистикау пакеті Аналіз даних.

Протокол виведення результатів має вигляд

Довірчий інтервал прогнозу: , де – відповідне табличне значення критерію Ст'юдента (знайдено раніше за функцією Стюдрозбір,
).

Отже,

тобто. можна бути впевненим на 95%, що ціна річного курсу при 35 слухачах варіюватиметься у зазначених межах (при точковому прогнозі ціни 3,65825 тис. дол.).

8) Для побудови діаграми виконаємо такі дії:

Крок 1 Вставка/Діаграма/Графік

Крок 3Ряд/Додати/Значення/Виділити стовпець регресійних значень фактора - .

Крок 4Підписи осіX/ Виділити стовпець значень x.

Крок 4Кожному з рядів присвоїти ім'я, підписати осі координат та назву діаграми.

Примітка.

Для побудови діаграми значення фактора xповинні бути відсортовані за зростанням із збереженням відповідного значення y. Це може бути зроблено так Дані/Сортування/Виділити стовпець, у якому необхідно зробити сортування. Наприклад,

Завдання для самостійної роботи

Варіант 1

Варіант 2

x– енергоозброєність на 10 підприємствах, кВт;

y- Продуктивність праці, тис. руб.

Варіант 3

x- Якість землі, бали;

y- Урожайність, ц/га.

Варіант 4

x- Якість землі, бали;

y- Урожайність, ц/га.

Варіант 5

x– товарообіг;

y-Витрати звернення по відношенню до товарообігу.

Варіант 6

x- електроозброєність на одного робітника;

y- Випуск готової продукції на одного робітника.

Варіант 7

x-Рівень доходів сім'ї;

y- Витрати на продукти харчування (в розрахунку на 100 руб. Доходів).