Довірчий інтервал математичного очікування. Довірчий інтервал для математичного очікування нормального розподілу за відомої дисперсії

Побудуємо в MS EXCEL довірчийінтервал для оцінки середнього значення розподілу у разі відомого значеннядисперсії.

Зрозуміло, вибір рівня довіриповністю залежить від розв'язуваного завдання. Так, ступінь довіри авіапасажира до надійності літака, безсумнівно, має бути вищим за ступінь довіри покупця до надійності електричної лампочки.

Формулювання завдання

Припустимо, що з генеральної сукупності має взята вибіркарозміру n. Передбачається, що стандартне відхилення цього розподілу відомо. Необхідно на підставі цієї вибіркиоцінити невідоме середнє значення розподілу(μ, ) та побудувати відповідний двосторонній довірчий інтервал.

Точкова оцінка

Як відомо з , статистика(позначимо її Х ср) є незміщеною оцінкою середньогоцією генеральної сукупностіта має розподіл N(μ;σ 2 /n).

Примітка: Що робити, якщо потрібно збудувати довірчий інтервалу разі розподілу, який не є нормальним?У цьому випадку на допомогу приходить , яка говорить, що за досить великого розміру вибірки n із розподілу що не є нормальним, вибірковий розподіл статистики Х порбуде приблизновідповідати нормальному розподілуіз параметрами N(μ;σ 2 /n).

Отже, точкова оцінка середнього значення розподілуу нас є – це середнє значення вибірки, тобто. Х ср. Тепер займемося довірчим інтервалом.

Побудова довірчого інтервалу

Зазвичай, знаючи розподіл та його параметри, ми можемо обчислити ймовірність того, що випадкова величина набуде значення заданого нами інтервалу. Зараз зробимо навпаки: знайдемо інтервал, у який випадкова величина потрапить із заданою ймовірністю. Наприклад, із властивостей нормального розподілу відомо, що з ймовірністю 95%, випадкова величина, розподілена по нормальному закону , потрапить в інтервал приблизно +/- 2 від середнього значення(Див. статтю про ). Цей інтервал, послужить нам прототипом для довірчого інтервалу.

Тепер розберемося, чи ми знаємо розподіл , щоб визначити цей інтервал? Для відповіді на запитання ми маємо вказати форму розподілу та його параметри.

Форму розподілу ми знаємо – це нормальний розподіл(нагадаємо, що йдеться про вибірковому розподілі статистики Х ср).

Параметр μ нам невідомий (його якраз потрібно оцінити за допомогою довірчого інтервалу), але у нас є його оцінка Х пор,обчислена на основі вибірки,яку можна використати.

Другий параметр – стандартне відхилення вибіркового середнього будемо вважати відомим, Він дорівнює σ/√n.

Т.к. ми не знаємо μ, то будуватимемо інтервал +/- 2 стандартних відхиленьне від середнього значення, а від відомої його оцінки Х ср. Тобто. при розрахунку довірчого інтервалуми не будемо вважати, що Х српотрапить в інтервал +/- 2 стандартних відхиленьвід μ з ймовірністю 95%, а вважатимемо, що інтервал +/- 2 стандартних відхиленьвід Х срз ймовірністю 95% накриє μ - Середня генеральна сукупність,з якого взято вибірка. Ці два твердження еквівалентні, але друге твердження нам дозволяє побудувати довірчий інтервал.

Крім того, уточнимо інтервал: випадкова величина, розподілена по нормальному закону, з ймовірністю 95% потрапляє в інтервал +/- 1,960 стандартних відхилень,а не+/- 2 стандартних відхилень. Це можна розрахувати за допомогою формули =НОРМ.СТ.ОБР((1+0,95)/2), Див. файл прикладу Лист Інтервал.

Тепер ми можемо сформулювати ймовірнісне твердження, яке послужить нам для формування довірчого інтервалу:
«Ймовірність того, що середня генеральна сукупністьзнаходиться від середньої вибіркив межах 1,960 « стандартних відхилень вибіркового середнього», дорівнює 95%».

Значення ймовірності, згадане у твердженні, має спеціальну назву , який пов'язаний зрівнем значимості α (альфа) простим виразом рівень довіри =1 -α . У нашому випадку рівень значущості α =1-0,95=0,05 .

Тепер на основі цього ймовірнісного твердження запишемо вираз для обчислення довірчого інтервалу:

де Z α/2 – стандартного нормального розподілу(Таке значення випадкової величини z, що P(z>=Z α/2 )=α/2).

Примітка: Верхній α/2-квантильвизначає ширину довірчого інтервалув стандартних відхиленнях вибіркового середнього. Верхній α/2-квантиль стандартного нормального розподілузавжди більше 0, що дуже зручно.

У нашому випадку при α=0,05, верхній α/2-квантиль дорівнює 1,960. Для інших рівнів значення α (10%; 1%) верхній α/2-квантиль Z α/2 можна обчислити за допомогою формули =НОРМ.СТ.ОБР(1-α/2) або, якщо відомий рівень довіри, =НОРМ.СТ.ОБР((1+ур.довіри)/2).

Зазвичай при побудові довірчих інтервалів для оцінки середньоговикористовують тільки верхній α/2-квантильі не використовують нижній α/2-квантиль. Це можливо тому, що стандартне нормальний розподілсиметрично щодо осі х ( щільність його розподілусиметрична щодо середнього, тобто. 0). Тому немає потреби обчислювати нижній α/2-квантиль(його називають просто α /2-квантиль), т.к. він дорівнює верхньому α/2-квантилюзі знаком мінус.

Нагадаємо, що, незважаючи на форму розподілу величини х, відповідна випадкова величина Х сррозподілено приблизно нормально N(μ;σ 2 /n) (див. статтю про ). Отже, в загальному випадку, вищезгадане вираз для довірчого інтервалує лише наближеним. Якщо величина х розподілена по нормальному закону N(μ;σ 2 /n), то вираз для довірчого інтервалує точним.

Розрахунок довірчого інтервалу в MS EXCEL

Розв'яжемо завдання.
Час відгуку електронного компонента на вхідний сигнал є важливою характеристикою пристрою. Інженер хоче побудувати довірчий інтервал для середнього відгуку при рівні довіри 95%. З попереднього досвіду інженер знає, що стандартне відхилення часу відгуку складає 8 мсек. Відомо, що з оцінки часу відгуку інженер зробив 25 вимірів, середнє значення становило 78 мсек.

Рішення: Інженер хоче знати час відгуку електронного пристрою, але він розуміє, що час відгуку є не фіксованим, а випадковою величиноюяка має свій розподіл. Отже, найкраще, на що він може розраховувати, це визначити параметри та форму цього розподілу.

На жаль, з умови завдання форма розподілу часу відгуку нам не відома (вона не обов'язково має бути нормальним). , цього розподілу також невідомо. Відомо лише його стандартне відхиленняσ=8. Тому, поки ми не можемо порахувати ймовірності та побудувати довірчий інтервал.

Однак, незважаючи на те, що ми не знаємо розподілу часу окремого відгуку, ми знаємо, що згідно ЦПТ, вибірковий розподіл середнього часу відгукує приблизно нормальним(вважатимемо, що умови ЦПТвиконуються, т.к. розмір вибіркидосить великий (n=25)) .

Більш того, середняцього розподілу дорівнює середнього значеннярозподілу одиничного відгуку, тобто. μ. А стандартне відхиленняцього розподілу (σ/√n) можна обчислити за формулою =8/КОРІНЬ(25) .

Також відомо, що інженером було отримано точкова оцінкапараметра μ дорівнює 78 мсек (Х пор). Тому, ми можемо обчислювати ймовірності, т.к. нам відома форма розподілу ( нормальне) та його параметри (Х ср і σ/√n).

Інженер хоче знати математичне очікуванняμ розподілу часу відгуку. Як було сказано вище, це μ дорівнює математичному очікуванню вибіркового розподілу середнього часу відгуку. Якщо ми скористаємося нормальним розподілом N(Х ср; σ/√n), то шукане μ перебуватиме в інтервалі +/-2*σ/√n з ймовірністю приблизно 95%.

Рівень значущостідорівнює 1-0,95 = 0,05.

Нарешті, знайдемо лівий та правий кордон довірчого інтервалу.
Ліва межа: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25) = 74,864
Права межа: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25)=81,136

Ліва межа: =НОРМ.ОБР(0,05/2; 78; 8/КОРІНЬ(25))
Права межа: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРІНЬ(25))

Відповідь: довірчий інтервалпри рівні довіри 95% та σ=8мсекдорівнює 78+/-3,136 мсек.

У файл прикладу на аркуші Сигмавідома створена форма для розрахунку та побудови двостороннього довірчого інтервалудля довільних вибірокіз заданим σ та рівнем значимості.

Функція ДОВЕРИТ.НОРМ()

Якщо значення вибіркизнаходяться в діапазоні B20: B79 , а рівень значущостідорівнює 0,05; то формула MS EXCEL:
=СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; РАХУНОК(B20:B79))
поверне лівий кордон довірчого інтервалу.

Цей же кордон можна обчислити за допомогою формули:
=СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРІНЬ(РАХУНОК(B20:B79))

Примітка: Функція ДОВЕРИТ.НОРМ() з'явилася в MS EXCEL 2010. У попередніх версіях MS EXCEL використовувалася функція ДОВЕРИТ() .

Часто оцінювачу доводиться аналізувати ринок нерухомості того сегмента, в якому знаходиться об'єкт оцінки. Якщо ринок розвинений, проаналізувати всю сукупність представлених об'єктів буває складно, для аналізу використовується вибірка об'єктів. Не завжди ця вибірка виходить однорідною, іноді потрібно очистити її від екстремумів - надто високих чи надто низьких пропозицій ринку. Для цієї мети застосовується довірчий інтервал. Ціль даного дослідження- Провести порівняльний аналіз двох способів розрахунку довірчого інтервалу і вибрати оптимальний варіант розрахунку при роботі з різними вибірками в системі estimatica.pro.

Довірчий інтервал - обчислений з урахуванням вибірки інтервал значень ознаки, що з певною ймовірністю містить оцінюваний параметр генеральної сукупності.

Сенс обчислення довірчого інтервалу полягає в побудові за даними вибірки такого інтервалу, щоб можна було стверджувати із заданою ймовірністю, що значення параметра, що оцінюється, знаходиться в цьому інтервалі. Іншими словами, довірчий інтервал з певною ймовірністю містить невідоме значення величини, що оцінюється. Чим ширший інтервал, тим вища неточність.

Існують різні способи визначення довірчого інтервалу. У цій статті розглянемо 2 способи:

через медіану та середньо квадратичне відхилення;
через критичне значення t-статистики (коефіцієнт Стьюдента).

Етапи порівняльного аналізу різних способіврозрахунку ДІ:

1. формуємо вибірку даних;

2. обробляємо її статистичними методами: розраховуємо середнє значення, медіану, дисперсію тощо;

3. розраховуємо довірчий інтервал двома способами;

4. аналізуємо очищені вибірки та отримані довірчі інтервали.

Етап 1. Вибірка даних

Вибірку сформовано за допомогою системи estimatica.pro. У вибірку увійшла 91 пропозиція про продаж 1 кімнатних квартир у 3-му ціновому поясі з типом планування «Хрущовка».

Таблиця 1. Вихідна вибірка

	Ціна 1 кв.м., д.е.

Рис.1. Вихідна вибірка

Етап 2. Обробка вихідної вибірки

Обробка вибірки методами статистики потребує обчислення наступних значень:

1. Середнє арифметичне значення

2. Медіана - число, що характеризує вибірку: рівно половина елементів вибірки більше медіани, інша половина менше медіани

(Для вибірки, що має непарне число значень)

3. Розмах - різниця між максимальним та мінімальним значеннями у вибірці

4. Дисперсія – використовується для більш точного оцінювання варіації даних

5. Середньоквадратичне відхилення за вибіркою (далі - СКО) - найпоширеніший показник розсіювання значень коригування навколо середнього арифметичного значення.

6. Коефіцієнт варіації - відбиває ступінь розкиданості значень коригувань

7. коефіцієнт осциляції - відбиває відносне коливання крайніх значень цін у вибірці навколо середньої

Таблиця 2. Статистичні показники вихідної вибірки

Коефіцієнт варіації, що характеризує однорідність даних, становить 12,29%, проте коефіцієнт осциляції занадто великий. Таким чином ми можемо стверджувати, що вихідна вибірка не є однорідною, тому перейдемо до розрахунку довірчого інтервалу.

Етап 3. Розрахунок довірчого інтервалу

Спосіб 1. Розрахунок через медіану та середньоквадратичне відхилення.

Довірчий інтервал визначається так: мінімальне значення - з медіани віднімається СКО; максимальне значення - до медіани додається СКО.

Таким чином, довірчий інтервал (47179 д.е.; 60689 д.е.)

Рис. 2. Значення, що потрапили в інтервал довіри 1.

Спосіб 2. Побудова довірчого інтервалу через критичне значення t-статистики (коефіцієнт Стьюдента)

С.В. Грибовський у книзі « Математичні методиоцінки вартості майна» визначає спосіб обчислення довірчого інтервалу через коефіцієнт Стьюдента. При розрахунку цим методом оцінювач повинен сам задати рівень значущості ∝, що визначає ймовірність, з якою буде побудовано довірчий інтервал. Зазвичай використовуються рівні значення 0,1; 0,05 та 0,01. Їм відповідають довірчі ймовірності 0,9; 0,95 та 0,99. При такому методі вважають справжні значення математичного очікування та дисперсії практично невідомими (що майже завжди вірно при вирішенні практичних завданьоцінки).

Формула довірчого інтервалу:

n – обсяг вибірки;

Критичне значення t-статистики (розподілу Стьюдента) з рівнем значущості ∝, числом ступенів свободи n-1, яке визначається за спеціальними статистичними таблицями або за допомогою MS Excel (→ "Статистичні" → СТЬЮДРАСПОБР);

∝ – рівень значущості, приймаємо ∝=0,01.

Рис. 2. Значення, що потрапили в інтервал довіри 2.

Етап 4. Аналіз різних способів розрахунку довірчого інтервалу

Два способи розрахунку довірчого інтервалу – через медіану та коефіцієнт Стьюдента – привели до різним значеннямінтервалів. Відповідно, вийшло дві різні очищені вибірки.

Таблиця 3. Статистичні показники за трьома вибірками.

Показник	Вихідна вибірка	1 варіант	2 варіант
Середнє значення


Дисперсія

Коеф. варіації
Коеф. осциляції
Кількість об'єктів, що вибули, шт.

З виконаних розрахунків можна сказати, що отримані різними методами значення довірчих інтервалів перетинаються, тому можна використовувати будь-який із способів розрахунку розсуд оцінювача.

Однак ми вважаємо, що при роботі в системі estimatica.pro доцільно вибирати метод розрахунку довірчого інтервалу в залежності від ступеня розвитку ринку:

якщо ринок нерозвинений, застосовувати метод розрахунку через медіану та середньоквадратичне відхилення, оскільки кількість об'єктів, що вибули, у цьому випадку невелика;
якщо ринок розвинений, застосовувати розрахунок через критичне значення t-статистики (коефіцієнт Стьюдента), оскільки є можливість сформувати велику вихідну вибірку.

Під час підготовки статті було використано:

1. Грибовський С.В., Сівець С.А., Левикіна І.А. Математичні методи оцінки вартості майна. Москва, 2014 р.

2. Дані системи estimatica.pro

Нехай випадкова величина Х генеральної сукупності розподілена нормально, враховуючи, що дисперсія та середнє відхилення квадрати s цього розподілу відомі. Потрібно оцінити невідоме математичне очікування щодо вибіркової середньої. В даному випадку завдання зводиться до знаходження довірчого інтервалу для математичного очікування з надійністю b. Якщо визначити значення довірчої ймовірності (надійності) b, то можна знайти ймовірність попадання в інтервал для невідомого математичного очікування, використовуючи формулу (6.9а):

де Ф(t) – функція Лапласа (5.17а).

В результаті можна сформулювати алгоритм відшукання меж довірчого інтервалу для математичного очікування, якщо відома дисперсія D = s 2:

Задати значення надійності - b.
З (6.14) виразити Ф(t) = 0,5×b. Вибрати значення t із таблиці для функції Лапласа за значенням Ф(t) (див. Додаток 1).
Обчислити відхилення e за формулою (6.10).
Записати довірчий інтервал за такою формулою (6.12), що з ймовірністю b виконується нерівність:

Приклад 5.

Випадкова величина Х має нормальний розподіл. Знайти довірчі інтервали з оцінкою з надійністю b = 0,96 невідомого математичного очікування а, якщо дані:

1) генеральне середнє квадратичне відхилення s = 5;

2) вибіркова середня;

3) обсяг вибірки n = 49.

У формулі (6.15) інтервальної оцінкиматематичного очікування а з надійністю b усі величини, крім t, відомі. Значення t можна знайти за допомогою (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

За таблицею Додатка 1 функції Лапласа Ф(t) = 0,48 знаходять відповідне значення t = 2,06. Отже, . Підставивши у формулу (6.12) обчислене значення e можна отримати довірчий інтервал: 30-1,47< a < 30+1,47.

Шуканий довірчий інтервал оцінки з надійністю b = 0,96 невідомого математичного очікування дорівнює: 28,53< a < 31,47.

Ви можете використовувати цю форму пошуку, щоб знайти потрібне завдання. Введіть слово, фразу із завдання чи її номер, якщо він вам відомий.

Довірчі інтервали: список розв'язків задач

Довірчі інтервали: теорія та завдання

Загальні відомості про довірчі інтервали

Введемо коротко поняття довірчого інтервалу, який
1) оцінює деякий параметр числової вибірки безпосередньо за даними самої вибірки,
2) накриває значення цього параметра із ймовірністю γ.

Довірчим інтерваломдля параметра X(при ймовірності γ) називається інтервал виду , такий що , а значення обчислюються деяким чином на вибірці .

Зазвичай у прикладних задачах довірчу ймовірністьберуть рівною γ = 0,9; 0,95; 0,99.

Розглянемо деяку вибірку обсягу n, зроблену з генеральної сукупності, розподіленої імовірно нормальному закону розподілу. Покажемо, за якими формулами є довірчі інтервали для параметрів розподілу- математичного очікування та дисперсії (середнього квадратичного відхилення).

Довірчий інтервал для математичного очікування

Випадок 1.Дисперсія розподілу відома і дорівнює. Тоді довірчий інтервал для параметра aмає вигляд:
tвизначається з таблиці розподілу Лапласа за співвідношенням

Випадок 2Дисперсія розподілу невідома, за вибіркою обчислено точкову оцінку дисперсії. Тоді довірчий інтервал для параметра aмає вигляд:
де - вибіркове середнє, обчислене за вибіркою, параметр tвизначається з таблиці розподілу Стьюдента

приклад.За даними 7 вимірювань деякої величини знайдені середня результатів вимірювань, що дорівнює 30 і вибіркова дисперсія, що дорівнює 36. Знайдіть межі, в яких з надійністю 0,99 укладено справжнє значення вимірюваної величини.

Рішення.Знайдемо . Тоді довірчі межі для інтервалу, що містить справжнє значення вимірюваної величини, можна знайти за формулою:
, де – вибіркове середнє, – вибіркова дисперсія. Підставляємо всі величини та отримуємо:

Довірчий інтервал для дисперсії

Вважаємо, що взагалі кажучи, математичне очікування невідоме, а відома лише точкова незміщена оцінка дисперсії. Тоді довірчий інтервал має вигляд:
, де - Квантилі розподілу, що визначаються з таблиць.

приклад.За даними 7 випробувань знайдено значення оцінки для середньоквадратичного відхилення s=12. Знайти із ймовірністю 0,9 ширину довірчого інтервалу, побудованого для оцінки дисперсії.

Рішення.Довірчий інтервал для не відомої дисперсіїгенеральної сукупності можна знайти за формулою:

Підставляємо та отримуємо:

Тоді ширина довірчого інтервалу дорівнює 465,589-71,708 = 393,881.

Довірчий інтервал для ймовірності (частки)

Випадок 1.Нехай у задачі відомий обсяг вибірки та вибіркова частка (відносна частота) . Тоді довірчий інтервал для генеральної частки (істинної ймовірності) має вигляд:
, де параметр tвизначається з таблиці розподілу Лапласа за співвідношенням.

Випадок 2Якщо в задачі додатково відомий загальний обсяг сукупності , з якої було зроблено вибірку, довірчий інтервал для генеральної частки (істинної ймовірності) можна знайти за скоригованою формулою:
.

приклад.Відомо, що знайти межі, в яких з ймовірністю укладено генеральну частку.

Рішення.Використовуємо формулу:

Знайдемо параметр із умови , отримаємо Підставляємо у формулу:

Інші приклади завдань з математичної статистикиви знайдете на сторінці