Довірчий інтервал у статистиці. Довірчий інтервал

Довірчий інтервал– граничні значення статистичної величини, яка із заданою довірчою ймовірністю γ буде у цьому інтервалі при вибірці більшого обсягу. Позначається як P(θ - ε. На практиці вибирають довірчу ймовірність γ з досить близьких до одиниці значень γ = 0.9, γ = 0.95, γ = 0.99.

Призначення сервісу. За допомогою цього сервісу визначаються:

  • довірчий інтервал для генерального середнього; довірчий інтервал для дисперсії;
  • довірчий інтервал для середнього квадратичного відхилення; довірчий інтервал для генеральної частки;
Отримане рішення зберігається у файлі Word (див. приклад). Нижче наведено відеоінструкцію, як заповнювати вихідні дані.

Приклад №1. У колгоспі із загального стада у 1000 голів овець вибірковій контрольній стрижці зазнали 100 овець. В результаті було встановлено середній настриг вовни 4,2 кг на одну вівцю. Визначити з ймовірністю 0,99 середню квадратичну помилку вибірки щодо середнього настригу вовни однією вівцю і межі, у яких укладена величина настрига, якщо дисперсія дорівнює 2,5 . Вибірка неповторна.
Приклад №2. З партії імпортованої продукції на посаді Московської Північної митниці було взято як випадкову повторної вибірки 20 проб продукту "А". В результаті перевірки встановлено середню вологість продукту «А» у вибірці, яка дорівнювала 6 % при середньому квадратичному відхиленні 1 %.
Визначте з ймовірністю 0,683 межі середньої вологості продукту в усій партії імпортованої продукції.
Приклад №3. Опитування 36 студентів показало, що середня кількість підручників, прочитаних ними за навчальний рік, виявилося рівним 6. Вважаючи, що кількість підручників, прочитаних студентом за семестр, має нормальний законрозподілу із середнім квадратичним відхиленням, рівним 6, знайти: А) з надійністю 0,99 інтервальну оцінку для математичного очікуванняцієї випадкової величини; Б) з якою ймовірністю можна стверджувати, що середня кількість підручників, прочитаних студентом за семестр, обчислена за даною вибіркою, відхилиться від математичного очікування абсолютної величини не більше, ніж на 2.

Класифікація довірчих інтервалів

По виду оцінюваного параметра:

За типом вибірки:

  1. Довірчий інтервал для безкінечної вибірки;
  2. Довірчий інтервал для кінцевої вибірки;
Вибірка називається повторноюякщо відібраний об'єкт перед вибором наступного повертається в генеральну сукупність. Вибірка називається безповторноюякщо відібраний об'єкт у генеральну сукупність не повертається. Насправді зазвичай мають справу з безповторними вибірками.

Розрахунок середньої помилки вибірки при випадковому відборі

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупностіназивається помилкою репрезентативності.
Позначення основних параметрів генеральної та вибіркової сукупності.
Формули середньої помилки вибірки
повторний відбірбезповторний відбір
для середньоїдля часткидля середньоїдля частки
Співвідношення між межею помилки вибірки (Δ), що гарантується з деякою ймовірністю Р(t),та середньою помилкою вибірки має вигляд: або Δ = t·μ, де t- Коефіцієнт довіри, що визначається залежно від рівня ймовірності Р(t) по таблиці інтегральної функції Лапласа.

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

Довірчі інтервали.

Обчислення довірчого інтервалубазується на середній помилці відповідного параметра. Довірчий інтервал показує, в яких межах із ймовірністю (1-a) знаходиться справжнє значення параметра, що оцінюється. Тут a – рівень значущості (1-a) називають також довірчою ймовірністю.

У першому розділі ми показали, що, наприклад, для середнього арифметичного, справжнє середнє за сукупністю приблизно 95% випадків лежить у межах 2 середніх помилок середнього. Таким чином, межі 95% довірчого інтервалу для середнього відстоятиме від вибіркового середнього на подвійну. середню помилкусереднього, тобто. ми множимо середню помилку середнього певний коефіцієнт, залежить від довірчої ймовірності. Для середнього та різниці середніх береться коефіцієнт Стьюдента (критичне значення критерію Стьюдента), для частки та різниці часток критичне значення критерію z. Добуток коефіцієнта на середню помилку можна назвати граничною помилкоюцього параметра, тобто. максимальну, яку ми можемо отримати при оцінці.

Довірчий інтервал для середнього арифметичного : .

Тут – вибіркове середнє;

Середня помилка середньої арифметичної;

s –вибіркове середнє квадратичне відхилення;

n

f = n-1 (Коефіцієнт Стьюдента).

Довірчий інтервал для різниці середніх арифметичних :

Тут – різниця вибіркових середніх;

- середня помилка різниці середніх арифметичних;

s 1 ,s 2 –вибіркові середні квадратичні відхилення;

n 1 ,n 2

Критичне значення критерію Стьюдента при заданому рівні значимості a та числі ступенів свободи f=n 1 +n 2-2 (Коефіцієнт Стьюдента).

Довірчий інтервал для частки :

.

Тут d – вибіркова частка;

- Середня помилка частки;

n- Обсяг вибірки (чисельність групи);

Довірчий інтервал для різниці часток :

Тут - різниця вибіркових часток;

- Середня помилка різниці середніх арифметичних;

n 1 ,n 2- Обсяги вибірок (чисельності груп);

Критичне значення критерію z за заданого рівня значущості a ( , , ).

Обчислюючи довірчі інтервали для різниці показників, ми, по-перше, безпосередньо бачимо можливі значення ефекту, а чи не лише його точкову оцінку. По-друге, можемо зробити висновок про прийняття чи спростування нульової гіпотези і, по-третє, можемо зробити висновок про потужність критерію.

При перевірці гіпотез за допомогою довірчих інтервалів слід дотримуватись наступного правила:

Якщо 100(1-a)-відсотковий довірчий інтервал різниці середніх немає нуля, то відмінності статистично значимі лише на рівні значимості a; навпаки, якщо цей інтервал містить нуль, то відмінності статистично значущі.

Справді, якщо цей інтервал містить нуль, то, отже, порівнюваний показник може бути як і більше, і менше у одній із груп, проти інший, тобто. спостерігаються відмінності випадкові.

За місцем, де знаходиться нуль усередині довірчого інтервалу, можна судити про потужність критерію. Якщо нуль близький до нижньої або верхньої межі інтервалу, то можливо при більшої чисельностіпорівнюваних груп, відмінності досягли б статистичної значимості. Якщо нуль близький до середини інтервалу, то, отже, рівноймовірне збільшення і зменшення показника в експериментальній групі, і, ймовірно, відмінностей дійсно немає.

Приклади:

Порівняти операційну летальність при застосуванні двох різних видів анестезії: із застосуванням першого виду анестезії оперувалося 61 особа, померло 8, із застосуванням другого – 67 осіб, померло 10.

d 1 = 8/61 = 0,131; d 2 = 10/67 = 0,149; d1-d2 = - 0,018.

Різниця летальностей порівнюваних методів перебуватиме в інтервалі (-0,018 - 0,122; -0,018 + 0,122) або (-0,14; 0,104) з ймовірністю 100(1-a) = 95%. Інтервал містить нуль, тобто. гіпотезу про однакову летальність при двох різних видаханестезії відкинути не можна.

Отже, летальність може зменшиться до 14% і збільшитися до 10,4% з ймовірністю 95%, тобто. нуль знаходиться приблизно посередині інтервалу, тому можна стверджувати, що, швидше за все, дійсно не відрізняються за летальністю ці два методи.

У розглянутому прикладі порівнювався середній час натискання при теппинг-тесті в чотирьох групах студентів, що відрізняються за екзаменаційною оцінкою. Обчислимо довірчі інтервали середнього часу натискання для студентів, які склали іспит на 2 та 5 і довірчий інтервал для різниці цих середніх.

Коефіцієнти Стьюдента знаходимо за таблицями розподілу Стьюдента (див. додаток): першої групи: = t(0,05;48) = 2,011; для другої групи: = t(0,05; 61) = 2,000. Таким чином, довірчі інтервали для першої групи: = (162,19-2,011*2,18 ; 162,19+2,011*2,18) = (157,8 ; 166,6) , для другої групи (156,55- 2,000 * 1,88; 156,55 +2,000 * 1,88) = (152,8; 160,3). Отже, для тих, хто склав іспит на 2, середній час натискання лежить в межах від 157,8 мс до 166,6 мс з ймовірністю 95%, для тих, хто склав іспит на 5 - від 152,8 мс до 160,3 мс з ймовірністю 95%.

Перевіряти нульову гіпотезу можна і за довірчими інтервалами для середніх, а не лише для різниці середніх. Наприклад, як і нашому разі, якщо довірчі інтервали для середніх перекриваються, то нульову гіпотезу відкинути не можна. Для того, щоб відкинути гіпотезу на вибраному рівні значущості, відповідні довірчі інтервали не повинні перекриватися.

Знайдемо довірчий інтервал для різниці середнього часу натискання у групах, які склали іспит на 2 і 5. Різниця середніх: 162,19 – 156,55 = 5,64. Коефіцієнт Стьюдента: = t(0,05; 49 +62-2) = t (0,05; 109) = 1,982. Групові середні квадратичні відхилення дорівнюватимуть: ; . Обчислюємо середню помилку різниці середніх: . Довірчий інтервал: = (5,64-1,982 * 2,87; 5,64 +1,982 * 2,87) = (-0,044; 11,33).

Отже, різниця середнього часу натискання в групах, які склали іспит на 2 і 5, буде в інтервалі від -0,044 мс до 11,33 мс. До цього інтервалу входить нуль, тобто. Середній час натискання у добре склали іспит, може збільшитися і зменшиться проти незадовільно склали, тобто. нульову гіпотезу відкинути не можна. Але нуль знаходиться дуже близько до нижньої межі, час натискання набагато швидше все-таки зменшується у добре здали. Таким чином, можна зробити висновок, що відмінності в середньому часу натискання між тими, хто здав на 2 і на 5 все-таки є, просто ми не змогли їх виявити при даній зміні середнього часу, розкид середнього часу та обсягах вибірок.



Потужність критерію – це можливість відкинути неправильну нульову гіпотезу, тобто. знайти відмінності там, де вони є.

Потужність критерію визначається з рівня значимості, величини відмінностей між групами, розкиду значень у групах та обсягу вибірок.

Для критерію Стьюдента та дисперсійного аналізуможна користуватися діаграмами чутливості.

Потужність критерію можна використовувати при попередньому визначенні необхідної кількості груп.

Довірчий інтервал показує, у яких межах з заданою ймовірністюзнаходиться справжнє значення параметра, що оцінюється.

За допомогою довірчих інтервалів можна перевіряти статистичні гіпотези та робити висновки про чутливість критеріїв.

ЛІТЕРАТУРА.

Гланц С. - Розділ 6,7.

Реброва О.Ю. - С.112-114, с.171-173, с.234-238.

Сидоренко Є. В. – с.32-33.

Запитання для самоперевірки студентів.

1. Що таке потужність критерію?

2. У яких випадках слід оцінити потужність критеріїв?

3. Методи розрахунку потужності.

6. Як перевірити статистичну гіпотезуза допомогою довірчого інтервалу?

7. Що можна сказати про потужність критерію при розрахунку довірчого інтервалу?

Завдання.

У попередніх підрозділах ми розглянули питання щодо оцінки невідомого параметра аодним числом. Така оцінка називається "точковою". У ряді завдань потрібно не тільки знайти параметр авідповідне чисельне значення, але й оцінити його точність та надійність. Потрібно знати, до яких помилок може призвести заміна параметра айого точковою оцінкою аі з яким ступенем впевненості можна очікувати, що ці помилки не вийдуть за певні межі?

Такі завдання особливо актуальні при малій кількості спостережень, коли точкова оцінка а взначною мірою випадкова і наближена заміна а на а може призвести до серйозних помилок.

Щоб дати уявлення про точність та надійність оцінки а,

в математичної статистикикористуються так званими довірчими інтервалами та довірчими ймовірностями.

Нехай для параметра аотримана з досвіду незміщена оцінка а.Ми хочемо оцінити можливу при цьому помилку. Призначимо деяку досить велику ймовірність р (наприклад, р = 0,9, 0,95 або 0,99) таку, що подію з ймовірністю р можна вважати практично достовірною, і знайдемо таке значення s, для якого

Тоді діапазон практично можливих значень помилки, що виникає під час заміни ана а, буде ± s; великі по абсолютній величині помилки з'являтимуться лише з малою ймовірністю а = 1 - р. Перепишемо (14.3.1) у вигляді:

Рівність (14.3.2) означає, що з ймовірністю р невідоме значення параметра апотрапляє в інтервал

При цьому слід зазначити одну обставину. Раніше ми неодноразово розглядали можливість потрапляння випадкової величини в заданий невипадковий інтервал. Тут справа інакша: величина ане випадкова, зате випадковий інтервал/р. Випадково його становище на осі абсцис, що визначається його центром а; випадкова взагалі і довжина інтервалу 2s, оскільки величина s обчислюється, як правило, за дослідними даними. Тому в даному випадку краще буде тлумачити величину р не як ймовірність «попадання» точки ав інтервал/р, а як ймовірність того, що випадковий інтервал/р накриє точку а(Рис. 14.3.1).

Рис. 14.3.1

Імовірність р прийнято називати довірчою ймовірністю, а інтервал / р - довірчим інтервалом.Межі інтервалу If. а х = а- s та а 2 = а +а називаються довірчими межами.

Дамо ще одне тлумачення поняттю довірчого інтервалу: його можна як інтервал значень параметра а,сумісних з досвідченими даними і не суперечать їм. Справді, якщо домовитися вважати подію з ймовірністю а = 1-р практично неможливим, то значення параметра а, котрим а - а> s, слід визнати такими, що суперечать досвідченим даним, а ті, для яких |а - а a t na 2 .

Нехай для параметра ає незміщена оцінка а.Якби нам був відомий закон розподілу величини а, Завдання знаходження довірчого інтервалу була б дуже проста: достатньо було б знайти таке значення s, для якого

Труднощі полягає в тому, що закон розподілу оцінки азалежить від закону розподілу величини Xі, отже, від його невідомих параметрів (зокрема, і від параметра а).

Щоб обійти цю скруту, можна застосувати наступний грубо наближений прийом: замінити у виразі s невідомі параметри їх точковими оцінками. При порівняно великому числідослідів п(близько 20...30) цей прийом зазвичай дає задовільні за точністю результати.

Як приклад розглянемо завдання про довірчий інтервал для математичного очікування.

Нехай зроблено п X,характеристики якої - математичне очікування тта дисперсія D- Невідомі. Для цих параметрів отримано оцінки:

Потрібно побудувати довірчий інтервал/р, що відповідає довірчій ймовірності р, для математичного очікування твеличини X.

При вирішенні цього завдання скористаємося тим, що величина тявляє собою суму пнезалежних однаково розподілених випадкових величин X hі відповідно до центральної граничної теореми за досить великого пїї закон розподілу близький до нормального. Насправді навіть за відносно невеликій кількості доданків (близько 10...20) закон розподілу суми можна приблизно вважати нормальним. Виходитимемо з того, що величина трозподілено за нормальним законом. Характеристики цього закону – математичне очікування та дисперсія – рівні відповідно ті

(Див. розділ 13 підрозділ 13.3). Припустимо, що величина Dнам відома і знайдемо таку величину Єр, для якої

Застосовуючи формулу (6.3.5) глави 6, виразимо ймовірність у лівій частині (14.3.5) через нормальну функцію розподілу

де - середнє квадратичне відхилення оцінки т.

З рівняння

знаходимо значення Sp:

де arg Ф * (х) - функція, зворотна Ф * (х),тобто. таке значення аргументу, при якому нормальна функція розподілу дорівнює х.

Дисперсія D,через яку виражена величина а 1П, нам точно не відома; як її орієнтовне значення можна скористатися оцінкою D(14.3.4) та покласти приблизно:

Таким чином, наближено вирішено завдання побудови довірчого інтервалу, який дорівнює:

де gp визначається формулою (14.3.7).

Щоб уникнути при обчисленні s p зворотного інтерполювання у таблицях функції Ф*(л), зручно скласти спеціальну таблицю (табл. 14.3.1), де наводяться значення величини

залежно від нар. Величина (р визначає для нормального закону число середніх квадратичних відхилень, яке потрібно відкласти вправо і вліво від центру розсіювання для того, щоб ймовірність попадання в отриману ділянку дорівнювала р.

Через величину 7 р довірчий інтервал виражається у вигляді:

Таблиця 14.3.1

Приклад 1. Проведено 20 дослідів над величиною X;результати наведено у табл. 14.3.2.

Таблиця 14.3.2

Потрібно знайти оцінку для математичного очікування від величини Xта побудувати довірчий інтервал, що відповідає довірчій ймовірності р = 0,8.

Рішення.Маємо:

Вибравши за початок відліку л: = 10, за третьою формулою (14.2.14) знаходимо незміщену оцінку D :

За табл. 14.3,1 знаходимо

Довірчі кордони:

Довірчий інтервал:

Значення параметра т,що лежать у цьому інтервалі, є сумісними з досвідченими даними, наведеними в табл. 14.3.2.

Аналогічним способом може бути побудований довірчий інтервал для дисперсії.

Нехай зроблено пнезалежних дослідів над випадковою величиною Xз невідомими параметрами від Л і для дисперсії Dотримано незміщену оцінку:

Потрібно приблизно побудувати довірчий інтервал для дисперсії.

З формули (14.3.11) видно, що величина Dявляє собою

суму пвипадкових величин виду. Ці величини не є

незалежними, тому що до кожної з них входить величина т,залежить від решти. Однак, можна показати, що при збільшенні пзакон розподілу їхньої суми теж наближається до нормального. Практично при п= 20...30 він може вважатися нормальним.

Припустимо, що це так, і знайдемо характеристики цього закону: математичне очікування та дисперсію. Оскільки оцінка D- незміщена, то М [D] = D.

Обчислення дисперсії D Dпов'язано з порівняно складними викладками, тому наведемо її вираз без висновку:

де ц 4 - четвертий центральний момент величини X.

Щоб скористатися цим виразом, потрібно підставити значення ц 4 і D(хоча б наближені). Замість Dможна скористатися його оцінкою D.У принципі четвертий центральний момент також можна замінити його оцінкою, наприклад величиною виду:

але така заміна дасть вкрай невисоку точність, тому що взагалі при обмеженій кількості досвідів моменти високого порядкувизначаються з більшими помилками. Однак практично часто буває, що вид закону розподілу величини Xвідомий наперед: невідомі лише його параметри. Тоді можна спробувати виразити ц 4 через D.

Візьмемо випадок, що найбільш часто зустрічається, коли величина Xрозподілено за нормальним законом. Тоді її четвертий центральний момент виражається через дисперсію (див. Розділ 6 підрозділ 6.2);

та формула (14.3.12) дає або

Заміняючи на (14.3.14) невідоме Dйого оцінкою D, отримаємо: звідки

Момент ц 4 можна виразити через Dтакож і в деяких інших випадках, коли розподіл величини Xперестав бути нормальним, але його відомий. Наприклад, для закону рівномірної щільності (див. розділ 5) маємо:

де (а, Р) - інтервал, у якому заданий закон.

Отже,

За формулою (14.3.12) отримаємо: звідки знаходимо приблизно

У випадках, коли вид закону розподілу величини 26 невідомий, при орієнтовній оцінці величини а/) рекомендується все ж таки користуватися формулою (14.3.16), якщо немає спеціальних підстав вважати, що цей закон сильно відрізняється від нормального (має помітний позитивний або негативний ексцес) .

Якщо орієнтовне значення а/) тим чи іншим способом отримано, можна побудувати довірчий інтервал для дисперсії аналогічно тому, як ми будували його для математичного очікування:

де величина в залежності від заданої ймовірності р знаходиться по таблиці. 14.3.1.

Приклад 2. Знайти приблизно 80% довірчий інтервал для дисперсії випадкової величини Xв умовах прикладу 1, якщо відомо, що величина Xрозподілено згідно із законом, близьким до нормального.

Рішення.Розмір залишається тієї ж, що у табл. 14.3.1:

За формулою (14.3.16)

За формулою (14.3.18) знаходимо довірчий інтервал:

Відповідний інтервал значень середнього відхилення квадратичного: (0,21; 0,29).

14.4. Точні методи побудови довірчих інтервалів для параметрів випадкової величини, розподіленої за нормальним законом

У попередньому підрозділі ми розглянули грубо наближені методи побудови довірчих інтервалів для математичного очікування та дисперсії. Тут ми дамо уявлення про точні методи вирішення того ж завдання. Підкреслимо, що для точного знаходження довірчих інтервалів необхідно знати заздалегідь вид закону розподілу величини X,тоді як застосування наближених методів це обов'язково.

Ідея точних методів побудови довірчих інтервалів зводиться до наступного. Будь-який довірчий інтервал знаходиться з умови, що виражає ймовірність виконання деяких нерівностей, в які входить оцінка, що нас цікавить а.Закон розподілу оцінки ав загальному випадкузалежить від невідомих параметрів величини X.Однак іноді вдається перейти в нерівності від випадкової величини адо будь-якої іншої функції спостережених значень Х п Х 2 , ..., X п.закон розподілу якої не залежить від невідомих параметрів, а залежить тільки від кількості дослідів та від виду закону розподілу величини X.Такі випадкові величини грають велику роль математичної статистиці; вони найбільш докладно вивчені для нормального розподілу величини X.

Наприклад, доведено, що за нормального розподілу величини Xвипадкова величина

підкоряється так званому закону розподілу Ст'юдентаз п- 1 ступенями свободи; щільність цього закону має вигляд

де Г(х) - відома гамма-функція:

Доведено також, що випадкова величина

має «розподіл %2» з п- 1 ступенями свободи (див. розділ 7), щільність якого виражається формулою

Не зупиняючись на висновках розподілів (14.4.2) та (14.4.4), покажемо, як їх можна застосувати при побудові довірчих інтервалів для параметрів ти D .

Нехай зроблено пнезалежних дослідів над випадковою величиною X,розподіленої за нормальним законом із невідомими параметрами тіо.Для цих параметрів отримано оцінки

Потрібно побудувати довірчі інтервали для обох параметрів, що відповідають довірчій ймовірності р.

Побудуємо спочатку довірчий інтервал для математичного очікування. Природно, цей інтервал взяти симетричним відносно т; позначимо s p половину довжини інтервалу. Величину s p потрібно вибрати так, щоб виконувалася умова

Спробуємо перейти у лівій частині рівності (14.4.5) від випадкової величини тдо випадкової величини Т,розподіленої згідно із законом Стьюдента. І тому помножимо обидві частини нерівності |m-w?|

на позитивну величину: або, використовуючи позначення (14.4.1),

Знайдемо таке число/р, що Величина/р знайдеться з умови

З формули (14.4.2) видно, що (1) - парна функціятому (14.4.8) дає

Рівність (14.4.9) визначає величину/р залежно від р. Якщо мати у своєму розпорядженні таблицю значень інтегралу

то величину/р можна знайти зворотним інтерполюванням у таблиці. Проте зручніше скласти заздалегідь таблицю значень/р. Така таблиця дається у додатку (табл. 5). У цій таблиці наведено значення залежно від довірчої ймовірності р та числа ступенів свободи п- 1. Визначивши/р за табл. 5 і вважаючи

ми знайдемо половину ширини довірчого інтервалу/р та сам інтервал

Приклад 1. Зроблено 5 незалежних дослідів над випадковою величиною X,розподіленої нормально з невідомими параметрами тта о. Результати дослідів наведено у табл. 14.4.1.

Таблиця 14.4.1

Знайти оцінку тдля математичного очікування і побудувати для нього 90%-й довірчий інтервал/р (тобто інтервал, що відповідає довірчій ймовірності р=0,9).

Рішення.Маємо:

За таблицею 5 додатки для п - 1 = 4 і р = 0,9 знаходимо звідки

Довірчий інтервал буде

Приклад 2 Для умов прикладу 1 підрозділу 14.3, припускаючи величину Xрозподілено нормально, знайти точний довірчий інтервал.

Рішення.За таблицею 5 додатка знаходимо при п - 1 = 19ір =

0,8/р = 1,328; звідси

Порівнюючи з рішенням прикладу 1 підрозділу 14.3 (е р = 0,072), переконуємося, що розбіжність дуже незначна. Якщо зберегти точність до другого знака після коми, то довірчі інтервали, знайдені точним та наближеним методами, збігаються:

Перейдемо до побудови довірчого інтервалу дисперсії. Розглянемо незміщену оцінку дисперсії

і висловимо випадкову величину Dчерез величину V(14.4.3), що має розподіл х 2 (14.4.4):

Знаючи закон розподілу величини V,можна знайти інтервал / (1, в який вона потрапляє із заданою ймовірністю р.).

Закон розподілу k n _ x (v)величини I 7 має вигляд, зображений на рис. 14.4.1.

Рис. 14.4.1

Виникає питання: як вибрати інтервал/р? Якби закон розподілу величини Vбув симетричним (як нормальний закон чи розподіл Стьюдента), природно було взяти інтервал /р симетричним щодо математичного очікування. В даному випадку закон до п х (v)несиметричний. Умовимося вибирати інтервал /р так, щоб ймовірність виходу величини Vза межі інтервалу вправо та вліво (заштриховані площі на рис. 14.4.1) були однакові та рівні

Щоб побудувати інтервал/р з такою властивістю, скористаємось табл. 4 додатки: у ній наведені числа у)такі, що

для величини V,що має х 2 -розподіл з г ступенями свободи. У нашому випадку г = п- 1. Зафіксуємо г = п- 1 і знайдемо у відповідному рядку табл. 4 два значення х 2 -одне, що відповідає ймовірності інше - ймовірності Позначимо ці

значення у 2і xl?Інтервал має у 2 ,своїм лівим, а у ~правим кінцем.

Тепер знайдемо по інтервалу /р шуканий довірчий інтервал /|, для дисперсії з межами D, та D 2 ,який накриває крапку Dз ймовірністю р:

Побудуємо такий інтервал /(, = (?> ь А), який накриває точку Dтоді і лише тоді, коли величина Vпотрапляє в інтервал/р. Покажемо, що інтервал

задовольняє цю умову. Справді, нерівності рівносильні нерівностям

а ці нерівності виконуються з ймовірністю р. Таким чином, довірчий інтервал дисперсії знайдено і виражається формулою (14.4.13).

Приклад 3. Знайти довірчий інтервал дисперсії в умовах прикладу 2 підрозділу 14.3, якщо відомо, що величина Xрозподілено нормально.

Рішення.Маємо . За таблицею 4 додатки

знаходимо при г = п - 1 = 19

За формулою (14.4.13) знаходимо довірчий інтервал для дисперсії

Відповідний інтервал для середнього відхилення квадратичного: (0,21; 0,32). Цей інтервал лише трохи перевищує отриманий у прикладі 2 підрозділу 14.3 наближеним методом інтервал (0,21; 0,29).

  • На малюнку 14.3.1 розглядається довірчий інтервал, симетричний щодо а. Загалом, як ми побачимо далі, це необов'язково.

Часто оцінювачу доводиться аналізувати ринок нерухомості того сегмента, в якому знаходиться об'єкт оцінки. Якщо ринок розвинений, проаналізувати всю сукупність представлених об'єктів буває складно, для аналізу використовується вибірка об'єктів. Не завжди ця вибірка виходить однорідною, іноді потрібно очистити її від екстремумів - надто високих чи надто низьких пропозицій ринку. Для цієї мети застосовується довірчий інтервал. Ціль даного дослідження- Провести порівняльний аналіз двох способів розрахунку довірчого інтервалу і вибрати оптимальний варіант розрахунку при роботі з різними вибірками в системі estimatica.pro.

Довірчий інтервал - обчислений з урахуванням вибірки інтервал значень ознаки, що з певною ймовірністю містить оцінюваний параметр генеральної сукупності.

Сенс обчислення довірчого інтервалу полягає в побудові за даними вибірки такого інтервалу, щоб можна було стверджувати із заданою ймовірністю, що значення параметра, що оцінюється, знаходиться в цьому інтервалі. Іншими словами, довірчий інтервал з певною ймовірністю містить невідоме значення величини, що оцінюється. Чим ширший інтервал, тим вища неточність.

Існують різні способи визначення довірчого інтервалу. У цій статті розглянемо 2 способи:

  • через медіану та середньоквадратичне відхилення;
  • через критичне значення t-статистики (коефіцієнт Стьюдента).

Етапи порівняльного аналізу різних способіврозрахунку ДІ:

1. формуємо вибірку даних;

2. обробляємо її статистичними методами: розраховуємо середнє значення, медіану, дисперсію тощо;

3. розраховуємо довірчий інтервал двома способами;

4. аналізуємо очищені вибірки та отримані довірчі інтервали.

Етап 1. Вибірка даних

Вибірку сформовано за допомогою системи estimatica.pro. У вибірку увійшла 91 пропозиція про продаж 1 кімнатних квартир у 3-му ціновому поясі з типом планування «Хрущовка».

Таблиця 1. Вихідна вибірка

Ціна 1 кв.м., д.е.

Рис.1. Вихідна вибірка



Етап 2. Обробка вихідної вибірки

Обробка вибірки методами статистики потребує обчислення наступних значень:

1. Середнє арифметичне значення

2. Медіана - число, що характеризує вибірку: рівно половина елементів вибірки більше медіани, інша половина менше медіани

(Для вибірки, що має непарне число значень)

3. Розмах - різниця між максимальним та мінімальним значеннями у вибірці

4. Дисперсія – використовується для більш точного оцінювання варіації даних

5. Середньоквадратичне відхилення за вибіркою (далі - СКО) - найпоширеніший показник розсіювання значень коригувань навколо середнього арифметичного значення.

6. Коефіцієнт варіації - відбиває ступінь розкиданості значень коригувань

7. коефіцієнт осциляції - відбиває відносне коливання крайніх значень цін у вибірці навколо середньої

Таблиця 2. Статистичні показники вихідної вибірки

Коефіцієнт варіації, що характеризує однорідність даних, становить 12,29%, проте коефіцієнт осциляції занадто великий. Таким чином ми можемо стверджувати, що вихідна вибірка не є однорідною, тому перейдемо до розрахунку довірчого інтервалу.

Етап 3. Розрахунок довірчого інтервалу

Спосіб 1. Розрахунок через медіану та середньоквадратичне відхилення.

Довірчий інтервал визначається так: мінімальне значення - з медіани віднімається СКО; максимальне значення - до медіани додається СКО.

Таким чином, довірчий інтервал (47179 д.е.; 60689 д.е.)

Рис. 2. Значення, що потрапили в інтервал довіри 1.



Спосіб 2. Побудова довірчого інтервалу через критичне значення t-статистики (коефіцієнт Стьюдента)

С.В. Грибовський у книзі « Математичні методиоцінки вартості майна» визначає спосіб обчислення довірчого інтервалу через коефіцієнт Стьюдента. При розрахунку цим методом оцінювач повинен сам задати рівень значущості ∝, що визначає ймовірність, з якою буде побудовано довірчий інтервал. Зазвичай використовуються рівні значення 0,1; 0,05 та 0,01. Їм відповідають довірчі ймовірності 0,9; 0,95 та 0,99. При такому методі вважають справжні значення математичного очікування та дисперсії практично невідомими (що майже завжди вірно при вирішенні практичних завданьоцінки).

Формула довірчого інтервалу:

n – обсяг вибірки;

Критичне значення t-статистики (розподілу Стьюдента) з рівнем значимості ∝, числом ступенів свободи n-1, яке визначається за спеціальними статистичними таблицями або за допомогою MS Excel (→ "Статистичні" → СТЬЮДРАСПОБР);

∝ – рівень значущості, приймаємо ∝=0,01.

Рис. 2. Значення, що потрапили в інтервал довіри 2.

Етап 4. Аналіз різних способів розрахунку довірчого інтервалу

Два способи розрахунку довірчого інтервалу – через медіану та коефіцієнт Стьюдента – привели до різним значеннямінтервалів. Відповідно, вийшло дві різні очищені вибірки.

Таблиця 3. Статистичні показники за трьома вибірками.

Показник

Вихідна вибірка

1 варіант

2 варіант

Середнє значення

Дисперсія

Коеф. варіації

Коеф. осциляції

Кількість об'єктів, що вибули, шт.

З виконаних розрахунків можна сказати, що отримані різними методами значення довірчих інтервалів перетинаються, тому можна використовувати будь-який із способів розрахунку розсуд оцінювача.

Однак ми вважаємо, що при роботі в системі estimatica.pro доцільно вибирати метод розрахунку довірчого інтервалу в залежності від рівня розвиненості ринку:

  • якщо ринок нерозвинений, застосовувати метод розрахунку через медіану і середньоквадратичне відхилення, оскільки кількість об'єктів, що вибули, у цьому випадку невелика;
  • якщо ринок розвинений, застосовувати розрахунок через критичне значення t-статистики (коефіцієнт Стьюдента), оскільки є можливість сформувати велику вихідну вибірку.

Під час підготовки статті було використано:

1. Грибовський С.В., Сівець С.А., Левикіна І.А. Математичні методи оцінки вартості майна. Москва, 2014 р.

2. Дані системи estimatica.pro

Одним із методів вирішення статистичних завданьє обчислення довірчого інтервалу. Він використовується як краща альтернатива точковій оцінціпри невеликому обсязі вибірки. Слід зазначити, що процес обчислення довірчого інтервалу досить складний. Але інструменти програми Ексель дозволяють дещо спростити його. Давайте дізнаємось, як це виконується на практиці.

Цей метод використовується при інтервальної оцінкирізних статистичних величин. Головне завдання цього розрахунку – позбавиться невизначеностей точкової оцінки.

В Екселі існують два основні варіанти зробити обчислення за допомогою даного методу: коли дисперсія відома, і коли вона невідома У першому випадку для обчислень застосовується функція ДОВІР.НОРМ, а в другому - ДОВЕРИТ.СТЮДЕНТ.

Спосіб 1: функція ДОВЕРИТ.НОРМ

Оператор ДОВІР.НОРМ, що відноситься до статистичної групи функцій, вперше з'явився в Excel 2010. У попередніх версіях цієї програми використовується його аналог ДОВЕРИТЬ. Завданням цього оператора є розрахунок довірчого інтервалу нормальним розподіломдля середньої генеральної сукупності.

Його синтаксис виглядає так:

ДОВІР.НОРМ(альфа;стандартне_вимк.;розмір)

"Альфа"- аргумент, що вказує на рівень значущості, який застосовується для розрахунку довірчого рівня. Довірчий рівень дорівнює наступному виразу:

(1-«Альфа») * 100

"Стандартне відхилення"- Це аргумент, суть якого зрозуміла з найменування. Це стандартне відхилення пропонованої вибірки.

«Розмір»- Аргумент, що визначає величину вибірки.

Усі аргументи цього оператора є обов'язковими.

Функція ДОВЕРИТЬмає такі самі аргументи і можливості, що й попередня. Її синтаксис такий:

ДОВЕРИТ(альфа;стандартное_откл;размер)

Як бачимо, відмінності лише у найменуванні оператора. Зазначена функція з метою сумісності залишена в Excel 2010 і новіших версіях у спеціальній категорії «Сумісність». У версіях Excel 2007 і раніше вона присутня в основній групі статистичних операторів.

Кордон довірчого інтервалу визначається за допомогою формули наступного виду:

X+(-)ДОВЕРИТ.НОРМ

Де X– це середнє вибіркове значення, розташоване посередині обраного діапазону.

Тепер розглянемо, як розрахувати довірчий інтервал на конкретному прикладі. Було проведено 12 випробувань, внаслідок яких було отримано різні результати, занесені до таблиці. Це і є наша сукупність. Стандартне відхилення дорівнює 8. Нам потрібно розрахувати інтервал довіри при рівні довіри 97%.

  1. Виділяємо комірку, куди виводитиметься результат обробки даних. Клацаємо по кнопці "Вставити функцію".
  2. З'являється Майстер функцій. Переходимо до категорії «Статистичні»та виділяємо найменування «ДОВЕРИТ.НОРМ». Після цього клацаємо по кнопці "OK".
  3. Відкривається віконце аргументів. Його поля закономірно відповідають найменуванням аргументів.
    Встановлюємо курсор у перше поле – "Альфа". Тут слід вказати рівень значимості. Як ми пам'ятаємо, рівень довіри в нас дорівнює 97%. Водночас ми говорили, що він розраховується таким шляхом:

    (1-рівень довіри)/100

    Тобто, підставивши значення, отримуємо:

    Шляхом нехитрих розрахунків дізнаємось, що аргумент "Альфа"дорівнює 0,03 . Вводимо це значення в полі.

    Як відомо, за умовою стандартне відхилення одно 8 . Тому в полі "Стандартне відхилення"просто записуємо це число.

    В полі «Розмір»Необхідно запровадити кількість елементів проведених випробувань. Як ми пам'ятаємо, їх 12 . Але щоб автоматизувати формулу і не редагувати її щоразу при проведенні нового випробування, давайте задамо це значення не звичайним числом, а за допомогою оператора РАХУНОК. Отже, встановлюємо курсор у полі «Розмір», а потім клацаємо по трикутнику, який розміщений ліворуч від рядка формул.

    З'являється список функцій, що нещодавно використовуються. Якщо оператор РАХУНОКзастосовувався вами нещодавно, то він має бути в цьому списку. У такому разі потрібно просто клікнути за його найменуванням. В іншому випадку, якщо ви його не виявите, то переходите по пункту «Інші функції…».

  4. З'являється вже знайомий нам Майстер функцій. Знову переміщуємося до групи «Статистичні». Виділяємо там найменування «РАХУНОК». Клацаємо по кнопці "OK".
  5. З'являється вікно аргументів вищезазначеного оператора. Ця функція призначена для того, щоб обчислювати кількість осередків у вказаному діапазоні, що містять числові значення. Синтаксис її наступний:

    РАХУНОК (значення1; значення2; ...)

    Група аргументів «Значення»є посилання на діапазон, в якому потрібно розрахувати кількість заповнених числовими даними осередків. Усього може налічуватися до 255 подібних аргументів, але в нашому випадку знадобиться лише один.

    Встановлюємо курсор у полі «Значення1»і, затиснувши ліву кнопку миші, виділяємо на аркуші діапазон, який містить нашу сукупність. Потім його адреса буде відображено у полі. Клацаємо по кнопці "OK".

  6. Після цього додаток здійснить обчислення і виведе результат у той осередок, де він знаходиться сам. У конкретному випадку формула вийшла такого виду:

    ДОВЕРИТ.НОРМ(0,03;8;РАХУНОК(B2:B13))

    Загальний результат обчислень склав 5,011609 .

  7. Але це ще не все. Як ми пам'ятаємо, межа довірчого інтервалу обчислюється шляхом складання та віднімання від середнього вибіркового значення результату обчислення ДОВІР.НОРМ. У такий спосіб розраховується відповідно права та ліва межа довірчого інтервалу. Саме середнє вибіркове значення можна розрахувати за допомогою оператора Відмінник.

    Цей оператор призначений для розрахунку середнього арифметичного значення вибраного діапазону чисел. Він має наступний досить простий синтаксис:

    СРЗНАЧ(число1; число2; ...)

    Аргумент «Кількість»може бути як окремим числовим значенням, так і посиланням на комірки або навіть цілі діапазони, що їх містять.

    Отже, виділяємо комірку, в яку виводитиметься розрахунок середнього значення, і клацаємо по кнопці "Вставити функцію".

  8. Відкривається Майстер функцій. Знову переходимо до категорії «Статистичні»та вибираємо зі списку найменування «СРЗНАЧ». Як завжди, клацаємо по кнопці "OK".
  9. Запускається вікно аргументів. Встановлюємо курсор у полі «Число1»і із затиснутою лівою кнопкою миші виділяємо весь діапазон значень. Після того, як координати відобразились у полі, клацаємо по кнопці "OK".
  10. Після цього Відмінниквиводить результат розрахунку елемент листа.
  11. Проводимо розрахунок правої межі довірчого інтервалу. Для цього виділяємо окремий осередок, ставимо знак «=» і складаємо вміст елементів аркуша, у яких розташовані результати обчислень функцій Відмінникі ДОВІР.НОРМ. Для того, щоб виконати розрахунок, натискаємо на клавішу Enter. У нашому випадку вийшла така формула:

    Результат обчислення: 6,953276

  12. Таким же чином робимо обчислення лівої межі довірчого інтервалу, тільки цього разу від результату обчислення Відмінникзабираємо результат обчислення оператора ДОВІР.НОРМ. Виходить формула для прикладу наступного типу:

    Результат обчислення: -3,06994

  13. Ми спробували докладно описати всі дії щодо обчислення довірчого інтервалу, тому детально розписали кожну формулу. Але можна всі дії поєднати в одній формулі. Обчислення правого кордону довірчого інтервалу можна записати так:

    СРЗНАЧ(B2:B13)+ДОВЕРИТ.НОРМ(0,03;8;РАХУНОК(B2:B13))

  14. Аналогічне обчислення лівого кордону виглядатиме так:

    СРЗНАЧ(B2:B13)-ДОВЕРИТ.НОРМ(0,03;8;РАХУНОК(B2:B13))

Спосіб 2: функція ДОВЕРИТ.СТЮДЕНТ

Крім того, в Екселі є ще одна функція, яка пов'язана з обчисленням довірчого інтервалу ДОВЕРИТ.СТЮДЕНТ. Вона з'явилася лише починаючи з Excel 2010. Цей оператор виконує обчислення довірчого інтервалу генеральної сукупності з використанням розподілу Стьюдента. Його дуже зручно використовувати у тому випадку, коли дисперсія та, відповідно, стандартне відхилення невідомі. Синтаксис оператора такий:

ДОВЕРИТ.СТЬЮДЕНТ(альфа;стандартне_вимк.;розмір)

Як бачимо, назви операторів і в цьому випадку залишилися незмінними.

Подивимося, як розрахувати межі довірчого інтервалу з невідомим стандартним відхиленням на прикладі тієї самої сукупності, що ми розглядали в попередньому способі. Рівень довіри, як і минулого разу, візьмемо 97%.

  1. Виділяємо комірку, в яку проводитиметься розрахунок. Клацаємо по кнопці "Вставити функцію".
  2. У відкритому Майстри функційпереходимо до категорії «Статистичні». Вибираємо найменування «ДОВЕРИТ.СТЮДЕНТ». Клацаємо по кнопці "OK".
  3. Здійснюється запуск вікна аргументів зазначеного оператора.

    В полі "Альфа", враховуючи, що рівень довіри становить 97%, записуємо число 0,03 . Вдруге на принципах розрахунку даного параметра зупинятись не будемо.

    Після цього встановлюємо курсор у полі "Стандартне відхилення". На цей раз цей показник нам невідомий і його потрібно розрахувати. Робиться це за допомогою спеціальної функції – СТАНДОТКЛОН.. Щоб викликати вікно цього оператора, клацаємо по трикутнику ліворуч від рядка формул. Якщо в списку не знаходимо потрібного найменування, то переходимо по пункту «Інші функції…».

  4. Запускається Майстер функцій. Переміщуємось до категорії «Статистичні»і відзначаємо в ній найменування «СТАНДОТКЛОН.В». Потім клацаємо по кнопці "OK".
  5. Відкриється вікно аргументів. Завданням оператора СТАНДОТКЛОН.є визначення стандартного відхиленняпід час вибірки. Його синтаксис виглядає так:

    СТАНДОТКЛОН.В(число1;число2;…)

    Неважко здогадатися, що аргумент «Кількість»- Це адреса елемента вибірки. Якщо вибірка розміщена єдиним масивом, можна, використавши лише один аргумент, дати посилання даний діапазон.

    Встановлюємо курсор у полі «Число1»і, як завжди, затиснувши ліву кнопку миші, виділяємо сукупність. Після того, як координати потрапили в поле, не поспішаємо натискати на кнопку "OK", оскільки результат вийде некоректним. Насамперед нам потрібно повернутися до вікна аргументів оператора ДОВЕРИТ.СТЮДЕНТ, щоб зробити останній аргумент. Для цього клацаємо за відповідним найменуванням у рядку формул.

  6. Знову відкривається вікно аргументів вже знайомої функції. Встановлюємо курсор у полі «Розмір». Знову тиснемо на вже знайомий нам трикутник для переходу до вибору операторів. Як ви зрозуміли, нам потрібна найменування «РАХУНОК». Тому що ми використовували цю функціюпри обчисленнях у попередньому способі, даному спискувона є, так що просто клацаємо по ній. Якщо ж ви її не виявите, то дійте за алгоритмом, описаним у першому способі.
  7. Потрапивши у вікно аргументів РАХУНОК, ставимо курсор у полі «Число1»і із затиснутою кнопкою миші виділяємо сукупність. Потім клацаємо по кнопці "OK".
  8. Після цього програма здійснює розрахунок і виводить значення довірчого інтервалу.
  9. Для визначення кордонів знову потрібно буде розрахувати середнє значення вибірки. Але, враховуючи те, що алгоритм розрахунку за допомогою формули Відмінниктой самий, що й у попередньому способі, і навіть результат не змінився, не будемо на цьому докладно зупинятись вдруге.
  10. Склавши результати обчислення Відмінникі ДОВЕРИТ.СТЮДЕНТ, отримуємо правий кордон довірчого інтервалу
  11. Відібравши від результатів розрахунку оператора Відмінникрезультат розрахунку ДОВЕРИТ.СТЮДЕНТ, маємо ліву межу довірчого інтервалу
  12. Якщо розрахунок записати однією формулою, то обчислення правого кордону в нашому випадку виглядатиме так:

    СРЗНАЧ(B2:B13)+ДОВЕРИТ.СТЬЮДЕНТ(0,03;СТАНДОТКЛОН.В(B2:B13);РАХУНОК(B2:B13))

  13. Відповідно, формула розрахунку лівої межі виглядатиме так:

    СРЗНАЧ(B2:B13)-ДОВЕРИТ.СТЬЮДЕНТ(0,03;СТАНДОТКЛОН.В(B2:B13);РАХУНОК(B2:B13))

Як бачимо, інструменти програми Excelдозволяють суттєво полегшити обчислення довірчого інтервалу та його меж. Для цього використовуються окремі оператори для вибірок, у яких дисперсія відома і невідома.

Поділіться з друзями або збережіть для себе:

Завантаження...