Що означає 95 довірчий інтервал. Довірчий інтервал

Побудуємо в MS EXCEL довірчийінтервал для оцінки середнього значення розподілу у разі відомого значеннядисперсії.

Зрозуміло, вибір рівня довіриповністю залежить від розв'язуваного завдання. Так, ступінь довіри авіапасажира до надійності літака, безсумнівно, має бути вищим за ступінь довіри покупця до надійності електричної лампочки.

Формулювання завдання

Припустимо, що з генеральної сукупності має взята вибіркарозміру n. Передбачається, що стандартне відхиленняцього розподілу відомо. Необхідно на підставі цієї вибіркиоцінити невідоме середнє значення розподілу(μ, ) та побудувати відповідний двосторонній довірчий інтервал.

Точкова оцінка

Як відомо з , статистика(позначимо її Х ср) є незміщеною оцінкою середньогоцією генеральної сукупностіта має розподіл N(μ;σ 2 /n).

Примітка: Що робити, якщо потрібно збудувати довірчий інтервалу разі розподілу, який не є нормальним?У цьому випадку на допомогу приходить , яка говорить, що за досить великого розміру вибірки n із розподілу що не є нормальним, вибірковий розподіл статистики Х порбуде приблизновідповідати нормальному розподілуіз параметрами N(μ;σ 2 /n).

Отже, точкова оцінка середнього значення розподілуу нас є – це середнє значення вибірки, тобто. Х ср. Тепер займемося довірчим інтервалом.

Побудова довірчого інтервалу

Зазвичай, знаючи розподіл та його параметри, ми можемо обчислити ймовірність того, що випадкова величина набуде значення заданого нами інтервалу. Зараз зробимо навпаки: знайдемо інтервал, у який випадкова величина потрапить із заданою ймовірністю. Наприклад, із властивостей нормального розподілувідомо, що з ймовірністю 95%, випадкова величина, розподілена по нормальному закону , потрапить в інтервал приблизно +/- 2 від середнього значення(Див. статтю про ). Цей інтервал, послужить нам прототипом для довірчого інтервалу.

Тепер розберемося, чи ми знаємо розподіл , щоб визначити цей інтервал? Для відповіді на запитання ми маємо вказати форму розподілу та його параметри.

Форму розподілу ми знаємо – це нормальний розподіл (нагадаємо, що йдеться про вибірковому розподілі статистики Х ср).

Параметр μ нам невідомий (його якраз потрібно оцінити за допомогою довірчого інтервалу), але у нас є його оцінка Х пор,обчислена на основі вибірки,яку можна використати.

Другий параметр – стандартне відхилення вибіркового середнього будемо вважати відомим, Він дорівнює σ/√n.

Т.к. ми не знаємо μ, то будуватимемо інтервал +/- 2 стандартних відхиленьне від середнього значення, а від відомої його оцінки Х ср. Тобто. при розрахунку довірчого інтервалуми не будемо вважати, що Х српотрапить в інтервал +/- 2 стандартних відхиленьвід μ з ймовірністю 95%, а вважатимемо, що інтервал +/- 2 стандартних відхиленьвід Х срз ймовірністю 95% накриє μ - Середня генеральна сукупність,з якого взято вибірка. Ці два твердження еквівалентні, але друге твердження нам дозволяє побудувати довірчий інтервал.

Крім того, уточнимо інтервал: випадкова величина, розподілена по нормальному закону, з ймовірністю 95% потрапляє в інтервал +/- 1,960 стандартних відхилень,а не+/- 2 стандартних відхилень. Це можна розрахувати за допомогою формули =НОРМ.СТ.ОБР((1+0,95)/2), Див. файл прикладу Лист Інтервал.

Тепер ми можемо сформулювати ймовірнісне твердження, яке послужить нам для формування довірчого інтервалу:
«Ймовірність того, що середня генеральна сукупністьзнаходиться від середньої вибіркив межах 1,960 « стандартних відхилень вибіркового середнього», дорівнює 95%».

Значення ймовірності, згадане у твердженні, має спеціальну назву , який пов'язаний зрівнем значимості α (альфа) простим виразом рівень довіри =1 . У нашому випадку рівень значущості α =1-0,95=0,05 .

Тепер на основі цього ймовірнісного твердження запишемо вираз для обчислення довірчого інтервалу:

де Z α/2 стандартного нормального розподілу(Таке значення випадкової величини z, що P(z>=Z α/2 )=α/2).

Примітка: Верхній α/2-квантильвизначає ширину довірчого інтервалув стандартних відхиленнях вибіркового середнього. Верхній α/2-квантиль стандартного нормального розподілузавжди більше 0, що дуже зручно.

У нашому випадку при α=0,05, верхній α/2-квантиль дорівнює 1,960. Для інших рівнів значення α (10%; 1%) верхній α/2-квантиль Z α/2 можна обчислити за допомогою формули =НОРМ.СТ.ОБР(1-α/2) або, якщо відомий рівень довіри, =НОРМ.СТ.ОБР((1+ур.довіри)/2).

Зазвичай при побудові довірчих інтервалів для оцінки середньоговикористовують тільки верхній α/2-квантильі не використовують нижній α/2-квантиль. Це можливо тому, що стандартне нормальний розподілсиметрично щодо осі х ( щільність його розподілусиметрична щодо середнього, тобто. 0). Тому немає потреби обчислювати нижній α/2-квантиль(його називають просто α /2-квантиль), т.к. він дорівнює верхньому α/2-квантилюзі знаком мінус.

Нагадаємо, що, незважаючи на форму розподілу величини х, відповідна випадкова величина Х сррозподілено приблизно нормально N(μ;σ 2 /n) (див. статтю про ). Отже, в загальному випадку, вищезгадане вираз для довірчого інтервалує лише наближеним. Якщо величина х розподілена по нормальному закону N(μ;σ 2 /n), то вираз для довірчого інтервалує точним.

Розрахунок довірчого інтервалу в MS EXCEL

Розв'яжемо завдання.
Час відгуку електронного компонента на вхідний сигнал є важливою характеристикою пристрою. Інженер хоче побудувати довірчий інтервал для середнього відгуку при рівні довіри 95%. З попереднього досвіду інженер знає, що стандартне відхилення часу відгуку складає 8 мсек. Відомо, що з оцінки часу відгуку інженер зробив 25 вимірів, середнє значення становило 78 мсек.

Рішення: Інженер хоче знати час відгуку електронного пристрою, але він розуміє, що час відгуку є не фіксованим, а випадковою величиноюяка має свій розподіл. Отже, найкраще, на що він може розраховувати, це визначити параметри та форму цього розподілу.

На жаль, з умови завдання форма розподілу часу відгуку нам не відома (вона не обов'язково має бути нормальним). , цього розподілу також невідомо. Відомо лише його стандартне відхиленняσ=8. Тому, поки ми не можемо порахувати ймовірності та побудувати довірчий інтервал.

Однак, незважаючи на те, що ми не знаємо розподілу часу окремого відгуку, ми знаємо, що згідно ЦПТ, вибірковий розподіл середнього часу відгукує приблизно нормальним(вважатимемо, що умови ЦПТвиконуються, т.к. розмір вибіркидосить великий (n=25)) .

Більш того, середняцього розподілу дорівнює середнього значеннярозподілу одиничного відгуку, тобто. μ. А стандартне відхиленняцього розподілу (σ/√n) можна обчислити за формулою =8/КОРІНЬ(25) .

Також відомо, що інженером було отримано точкова оцінкапараметра μ дорівнює 78 мсек (Х пор). Тому, ми можемо обчислювати ймовірності, т.к. нам відома форма розподілу ( нормальне) та його параметри (Х ср і σ/√n).

Інженер хоче знати математичне очікуванняμ розподілу часу відгуку. Як було сказано вище, це μ дорівнює математичного очікуваннявибіркового розподілу середнього часу відгуку. Якщо ми скористаємося нормальним розподілом N(Х ср; σ/√n), то шукане μ перебуватиме в інтервалі +/-2*σ/√n з ймовірністю приблизно 95%.

Рівень значущостідорівнює 1-0,95 = 0,05.

Нарешті, знайдемо лівий та правий кордон довірчого інтервалу.
Ліва межа: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25) = 74,864
Права межа: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25)=81,136

Ліва межа: =НОРМ.ОБР(0,05/2; 78; 8/КОРІНЬ(25))
Права межа: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРІНЬ(25))

Відповідь: довірчий інтервалпри рівні довіри 95% та σ=8мсекдорівнює 78+/-3,136 мсек.

У файл прикладу на аркуші Сигмавідома створена форма для розрахунку та побудови двостороннього довірчого інтервалудля довільних вибірокіз заданим σ та рівнем значимості.

Функція ДОВЕРИТ.НОРМ()

Якщо значення вибіркизнаходяться в діапазоні B20: B79 , а рівень значущостідорівнює 0,05; то формула MS EXCEL:
=СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; РАХУНОК(B20:B79))
поверне лівий кордон довірчого інтервалу.

Цей же кордон можна обчислити за допомогою формули:
=СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРІНЬ(РАХУНОК(B20:B79))

Примітка: Функція ДОВЕРИТ.НОРМ() з'явилася в MS EXCEL 2010. У попередніх версіях MS EXCEL використовувалася функція ДОВЕРИТ() .

Ціль– навчити студентів алгоритмів обчислення довірчих інтервалів статистичних параметрів.

При статистичній обробці даних обчислені середня арифметична, коефіцієнт варіації, коефіцієнт кореляції, критерії відмінності та інші точкові статистики повинні отримати кількісні межі довіри, які позначають можливі коливання показника меншу і більшу сторону в межах довірчого інтервалу.

Приклад 3.1 . Розподіл кальцію у сироватці крові мавп, як було встановлено раніше, характеризується такими вибірковими показниками: = 11,94 мг%; = 0,127 мг%; n= 100. Потрібно визначити довірчий інтервал для генеральної середньої ( ) при довірчої ймовірностіP = 0,95.

Генеральна середня знаходиться з певною ймовірністю в інтервалі:

, де - Вибіркова середня арифметична; t– критерій Стьюдента; - Помилка середньої арифметичної.

За таблицею «Значення критерію Стьюдента» знаходимо значення при довірчій ймовірності 0,95 та числі ступенів свободи k= 100-1 = 99. Воно дорівнює 1,982. Разом зі значеннями середньої арифметичної та статистичної помилки підставляємо його у формулу:

або 11,69
12,19

Таким чином, з ймовірністю 95%, можна стверджувати, що генеральна середня цього нормального розподілу знаходиться між 11,69 і 12,19 мг%.

Приклад 3.2 . Визначте межі 95% довірчого інтервалу для генеральної дисперсії ( ) розподілу кальцію в крові мавп, якщо відомо, що
= 1,60, при n = 100.

Для вирішення задачі можна скористатися такою формулою:

Де - Статистична помилка дисперсії.

Знаходимо помилку вибіркової дисперсії за формулою:
. Вона дорівнює 0,11. Значення t- критерію при довірчій ймовірності 0,95 та числі ступенів свободи k= 100-1 = 99 відомо з попереднього прикладу.

Скористаємося формулою та отримаємо:

або 1,38
1,82

Більш точно довірчий інтервал генеральної дисперсії можна побудувати із застосуванням (хі-квадрат) – критерію Пірсона. Критичні точки при цьому критерію наводяться у спеціальній таблиці. При використанні критерію для побудови довірчого інтервалу застосовують двосторонній рівень значущості. Для нижньої межі рівень значущості розраховується за формулою
, для верхньої –
. Наприклад, для довірчого рівня = 0,99= 0,010,= 0,990. Відповідно до таблиці розподілу критичних значень , при розрахованих довірчих рівнях та числі ступенів свободи k= 100 - 1 = 99, знайдемо значення
і
. Отримуємо
одно 135,80, а
рівно70,06.

Щоб знайти довірчі межі генеральної дисперсії за допомогою скористаємося формулами: для нижньої межі
для верхнього кордону
. Підставимо ці завдання знайдені значення у формули:
= 1,17;
= 2,26. Таким чином, за довірчої ймовірності P= 0,99 або 99% генеральна дисперсія лежатиме в інтервалі від 1,17 до 2,26 мг% включно.

Приклад 3.3 . Серед 1000 насіння пшениці з партії, що надійшла на елеватор, виявлено 120 насіння заражених ріжків. Необхідно визначити можливі межі генеральної частки зараженого насіння у цій партії пшениці.

Довірчі межі для генеральної частки за всіх можливих її значеннях доцільно визначати за такою формулою:

,

Де n - Число спостережень; m- Абсолютна чисельність однієї з груп; t– нормоване відхилення.

Вибіркова частка зараженого насіння дорівнює
чи 12%. За довірчої ймовірності Р= 95% нормоване відхилення ( t-критерій Стьюдента при k =
)t = 1,960.

Підставляємо наявні дані у формулу:

Звідси межі довірчого інтервалу дорівнюють = 0,122-0,041 = 0,081, або 8,1%; = 0,122 + 0,041 = 0,163, чи 16,3%.

Таким чином, з довірчою ймовірністю 95% можна стверджувати, що генеральна частка зараженого насіння знаходиться між 8,1 та 16,3%.

Приклад 3.4 . Коефіцієнт варіації, що характеризує варіювання кальцію (мг%) у сироватці крові мавп, дорівнював 10,6%. Обсяг вибірки n= 100. Необхідно визначити межі 95% довірчого інтервалу для генерального параметра Cv.

Кордони довірчого інтервалу для генерального коефіцієнта варіації Cv визначаються за такими формулами:

і
, де K проміжна величина, що обчислюється за формулою
.

Знаючи, що за довірчої ймовірності Р= 95% нормоване відхилення (критерій Стьюдента при k =
)t = 1,960, попередньо розрахуємо величину До:

.

або 9,3%

або 12,3%

Таким чином, генеральний коефіцієнт варіації з довірчою ймовірністю 95% лежить в інтервалі від 93 до 123%. При повторних вибірках коефіцієнт варіації не перевищить 12,3% і не виявиться нижчим за 9,3% у 95 випадках зі 100.

Запитання для самоконтролю:

Завдання для самостійного вирішення.

1. Середній відсоток жиру у молоці за лактацію корів холмогорських помісей був таким: 3,4; 3,6; 3,2; 3,1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4,1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3,8. Встановіть довірчі інтервали для середньої середньої при довірчій ймовірності 95% (20 балів).

2. На 400 рослинах гібридного жита перші квітки з'явилися в середньому на 70,5 день після посіву. Середнє відхилення було 6,9 дня. Визначте помилку середньої та довірчі інтервали для генеральної середньої та дисперсії при рівні значущості W= 0,05 та W= 0,01 (25 балів).

3. При вивченні довжини листя 502 екземплярів садової суниці були отримані такі дані: = 7,86 див; σ = 1,32 см, =± 0,06 см. Визначте довірчі інтервали для середньої арифметичної генеральної сукупності з рівнями значущості 0,01; 0,02; 0,05. (25 балів).

4. При обстеженні 150 дорослих чоловіків середній зріст дорівнював 167 см, а σ = 6 см. У яких межах знаходиться генеральна середня та генеральна дисперсія з довірчою ймовірністю 0,99 та 0,95? (25 балів).

5. Розподіл кальцію у сироватці крові мавп характеризується такими вибірковими показниками: = 11,94 мг%, σ = 1,27, n = 100. Побудуйте 95% довірчий інтервал для генеральної середньої цього розподілу. Розрахуйте коефіцієнт варіації (25 балів).

6. Було вивчено загальний вміст азоту в плазмі крові щурів-альбіносів у віці 37 та 180 днів. Результати виражені у грамах на 100 см 3 плазми. У віці 37 днів 9 щурів мали: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. У віці 180 днів 8 щурів мали: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1,12. Встановіть довірчі інтервали для різниці з вірогідністю 0,95 (50 балів).

7. Визначте межі 95% довірчого інтервалу для генеральної дисперсії розподілу кальцію (мг%) у сироватці крові мавп, якщо для цього розподілу обсяг вибірки n = 100, статистична помилка вибіркової дисперсії s σ 2 = 1,60 (40 балів).

8. Визначте межі 95% довірчого інтервалу для генеральної дисперсії розподілу 40 колосків пшениці по довжині (σ 2 = 40, 87 мм 2). (25 балів).

9. Куріння вважають основним фактором, що привертає до обструктивних захворювань легень. Пасивне куріння таким фактором не вважається. Вчені засумнівалися у нешкідливості пасивного куріння та досліджували прохідність дихальних шляхів у курців, що не палять, пасивних та активних. Для характеристики стану дихальних шляхів взяли один із показників функції зовнішнього дихання – максимальну об'ємну швидкість середини видиху. Зменшення цього показника – ознака порушення прохідності дихальних шляхів. Дані обстеження наведені у таблиці.

Число обстежених

Максимальна об'ємна швидкість середини видиху, л/с

Стандартне відхилення

Некурці

працюють у приміщенні, де не курять

працюють у накуреному приміщенні

Курці

викурювальні не велике числоцигарок

викурюють середню кількість сигарет

викурюють велику кількість сигарет

За даними таблиці знайдіть 95% довірчі інтервали для генеральної середньої та генеральної дисперсії для кожної групи. У чому різниця між групами? Результати подайте графічно (25 балів).

10. Визначте межі 95% і 99% довірчого інтервалу для генеральної дисперсії чисельності поросят у 64 опоросах, якщо статистична помилка вибіркової дисперсії s σ 2 = 8, 25 (30 балів).

11. Відомо, що середня маса кролів становить 2,1 кг. Визначте межі 95%-ного та 99%-ного довірчого інтервалу для генеральної середньої та дисперсії при n= 30, σ = 0,56 кг (25 балів).

12. У 100 колосків вимірювали озерненість колосу ( Х), довжину колосу ( Y) та масу зерна в колосі ( Z). Знайти довірчі інтервали для генеральної середньої та дисперсії при P 1 = 0,95, P 2 = 0,99, P 3 = 0,999, якщо = 19, = 6,766 см, = 0,554 м; x 2 = 29, 153, y 2 = 2, 111, z 2 = 0,064. (25 балів).

13. У відібраних випадковим чином 100 колосках пшениці озимої підраховувалося число колосків. Вибіркова сукупність характеризувалася такими показниками: = 15 колосків та σ = 2,28 шт. Визначте, з якою точністю отримано середній результат ( ) та побудуйте довірчий інтервал для генеральної середньої та дисперсії при 95% та 99% рівнях значущості (30 балів).

14. Число ребер на раковинах викопного молюска Orthambonites calligramma:

Відомо що n = 19, σ = 4,25. Визначте межі довірчого інтервалу для генеральної середньої та генеральної дисперсії при рівні значущості W = 0,01 (25 балів).

15. Для визначення надої молока на молочно-товарній фермі щодня визначалася продуктивність 15 корів. За даними протягом року кожна корова давала загалом на добу таку кількість молока (л): 22; 19; 25; 20; 27; 17; 30; 21; 18; 24; 26; 23; 25; 20; 24. Побудуйте довірчі інтервали для генеральної дисперсії та середньої арифметичної. Чи можна очікувати, що середньорічний надій на кожну корову складе 10000 літрів? (50 балів).

16. З метою визначення врожаю пшениці в середньому по агрогосподарству були проведені укоси на пробних ділянках площею 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 та 2 га. Урожайність (ц/га) з ділянок становила 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 відповідно. Побудуйте довірчі інтервали для генеральних дисперсії та середньої арифметичної. Чи можна очікувати, що в середньому в агрогосподарстві врожай складе 42 ц/га? (50 балів).

Нехай у нас є велика кількість предметів з нормальним розподілом деяких характеристик (наприклад, повний склад однотипних овочів, розмір і вага яких варіюється). Ви хочете знати середні характеристики всієї партії товару, але у Вас немає ні часу, ні бажання вимірювати та зважувати кожен овоч. Ви розумієте, що в цьому немає потреби. Але скільки треба було б взяти на вибіркову перевірку?

Перш ніж дати кілька корисних для цієї ситуації формул нагадаємо деякі позначення.

По-перше, якби ми все-таки проміряли весь склад овочів (це безліч елементів називається генеральною сукупністю), то ми дізналися б зі всією доступною нам точністю середнє значення ваги всієї партії. Назвемо це середнє значення Х ср .г він . - Генеральним середнім. Ми вже знаємо, що визначається повністю, якщо відомо його середнє значення та відхилення s . Щоправда, поки що ми ні Х ср.ген., ні s генеральної сукупності не знаємо. Ми можемо тільки взяти деяку вибірку, заміряти потрібні нам значення і порахувати для цієї вибірки як середнє значення Х порівн. виб., так і середнє квадратичне відхилення S виб.

Відомо, що якщо наша вибіркова перевірка містить велику кількість елементів (зазвичай n більше 30) і вони взяті дійсно випадковим чином, то s генеральної сукупності майже не відрізнятиметься від S виб..

Крім того, для нормального розподілу ми можемо користуватися такими формулами:

Імовірно 95%


Імовірно 99%



У загальному вигляді c ймовірністю Р(t)


Зв'язок значення t із значенням ймовірності Р(t), з якою ми хочемо знати довірчий інтервал, можна взяти з наступної таблиці:


Отже, ми визначили, у якому діапазоні перебуває середнє значення для генеральної сукупності (з цією ймовірністю).

Якщо ми не маємо достатньо великої вибірки, ми не можемо стверджувати, що генеральна сукупність має s = S виб. Крім того, у цьому випадку проблематична близькість вибірки до нормального розподілу. У цьому випадку також користуються S виб замість s у формулі:




але значення t для фіксованої ймовірності Р(t) залежатиме від кількості елементів у вибірці n. Чим більше n, тим ближче буде отриманий довірчий інтервал значення, що дається формулою (1). Значення t у разі беруться з іншої таблиці ( t-критерій Стьюдента), яку ми наводимо нижче:

Значення t-критерію Стьюдента для ймовірності 0,95 та 0,99


приклад 3.З працівників фірми випадково відібрано 30 осіб. За вибіркою виявилося, що середня зарплата (на місяць) становить 30 тис. рублів за середнього квадратичному відхиленні 5 тис. рублів. Імовірно 0,99 визначити середню зарплатув фірмі.

Рішення:За умовою маємо n = 30, Х порівн. = 30000, S = 5000, Р = 0,99. Для знаходження довірчого інтервалу скористаємося формулою, яка відповідає критерію Стьюдента. По таблиці для n = 30 і Р = 0,99 знаходимо t = 2,756, отже,


тобто. шуканий довірчийінтервал 27484< Х ср.ген < 32516.

Отже, ймовірністю 0,99 можна стверджувати, що інтервал (27484; 32516) містить у собі середню зарплату у фірмі.

Ми сподіваємося, що Ви користуватиметеся цим методом, при цьому не обов'язково, щоб при Вас щоразу була таблиця. Підрахунки можна проводити в Excel автоматично. Перебуваючи у файлі Excel, натисніть кнопку fx у верхньому меню. Потім, виберіть серед функцій тип "статистичні", та із запропонованого переліку у віконці - СТЬЮДРАСПОБР. Потім, за підказкою, поставивши курсор у полі "імовірність", наберіть значення зворотної ймовірності (тобто в нашому випадку замість ймовірності 0,95 треба набирати ймовірність 0,05). Мабуть, електронна таблиця складена отже результат відповідає питанням, з якою ймовірністю ми можемо помилитися. Аналогічно в полі "ступінь свободи" введіть значення (n-1) для вибірки.

ДОВІРНІ ІНТЕРВАЛИ ДЛЯ ЧАСТОТ І ДОЛІЙ

© 2008 р.

Національний інститут громадського здоров'я, м. Осло, Норвегія

У статті описується та обговорюється розрахунок довірчих інтервалів для частот і часток за методами Вальда, Вілсона, Клоппера – Пірсона, за допомогою кутового перетворення та за методом Вальда з корекцією по Агресті – Коуллу. Викладений матеріал дає загальні відомостіпро способи розрахунку довірчих інтервалів для частот і часток і покликаний викликати інтерес читачів журналу як до використання довірчих інтервалів при поданні результатів власних досліджень, а й до прочитання спеціалізованої літератури перед початком роботи над майбутніми публікаціями.

Ключові слова : довірчий інтервал, частота, частка

В одній із попередніх публікацій коротко згадувалося опис якісних даних та повідомлялося, що їх інтервальна оцінкапереважно точкової для опису частоти зустрічальності досліджуваної характеристики в генеральній сукупності. Дійсно, оскільки дослідження проводяться з використанням вибіркових даних, проекція результатів на генеральну сукупність має містити елемент неточності вибіркової оцінки. Довірчий інтервал є мірою точності параметра, що оцінюється. Цікаво, що у деяких книгах з основ статистики для медиків тема довірчих інтервалів для частот повністю ігнорується. У статті ми розглянемо кілька способів розрахунку довірчих інтервалів для частот, маючи на увазі такі характеристики вибірки, як безповторність і репрезентативність, і навіть незалежність спостережень друг від друга. Під частотою в цій статті розуміється не абсолютне число, Що показує, скільки разів зустрічається в сукупності те чи інше значення, а відносна величина , Яка визначає частку учасників дослідження, у яких зустрічається ознака, що вивчається.

У біомедичних дослідженнях найчастіше використовуються 95% довірчі інтервали. Цей довірчий інтервал є область, у яку потрапляє справжнє значення частки 95 % випадків. Іншими словами, можна з 95% надійністю сказати, що справжнє значення частоти народження ознаки в генеральній сукупності перебуватиме в межах 95% довірчого інтервалу.

У більшості посібників зі статистики для дослідників від медицини повідомляється, що помилка частоти розраховується за допомогою формули

де p – частота народження ознаки у вибірці (величина від 0 до 1). У більшості вітчизняних наукових статейвказується значення частоти народження ознаки у вибірці (р), а також її помилка (s) у вигляді p ± s. Доцільніше, проте, представляти 95% довірчий інтервал для частоти ознак ознаки в генеральній сукупності, який включатиме значення від

до.

У деяких посібниках рекомендується при малих вибірках замінювати значення 1,96 значення t для N – 1 ступенів свободи, де N – кількість спостережень у вибірці. Значення t знаходиться за таблицями для t-розподілу, що є практично у всіх посібниках зі статистики. Використання розподілу t для методу Вальда не дає видимих ​​переваг у порівнянні з іншими методами, розглянутими нижче, і тому деякими авторами не вітається.

Наведений вище метод розрахунку довірчих інтервалів для частот або часток носить ім'я Вальда на честь Авраама Вальда (Abraham Wald, 1902-1950), оскільки широке застосування його почалося після публікації Вальда та Вольфовіца у 1939 році. Однак сам метод був запропонований П'єром Симоном Лапласом (1749-1827) ще 1812 року.

Метод Вальда дуже популярний, проте його застосування пов'язане із суттєвими проблемами. Метод не рекомендується при малих обсягах вибірок, а також у випадках, коли частота народження ознаки прагне до 0 або 1 (0 % або 100 %) і просто неможливо для частот 0 і 1. Крім того, апроксимація нормального розподілу, яка використовується при розрахунку помилки , «не працює» у випадках, коли n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Оскільки нова змінна має нормальний розподіл, нижня та верхня межі 95 % довірчого інтервалу для змінної φ дорівнюватимуть φ-1,96 і φ+1,96left">

Замість 1,96 для малих вибірок рекомендується підставляти значення t для N – 1 ступенів свободи. Цей методне дає негативних значеньі дозволяє точніше оцінити довірчі інтервали для частот, ніж метод Вальда. Крім того, він описаний у багатьох вітчизняних довідниках по медичної статистики, Щоправда, не призвело до його широкого використання в медичних дослідженнях. Розрахунок довірчих інтервалів з використанням кутового перетворення не рекомендується за частот, що наближаються до 0 або 1 .

На цьому опис способів оцінки довірчих інтервалів у більшості книг з основ статистики для дослідників-медиків зазвичай закінчується, причому ця проблема характерна не тільки для вітчизняної, а й для зарубіжної літератури. Обидва методи ґрунтуються на центральній граничній теоремі, яка має на увазі наявність великої вибірки.

Зважаючи на недоліки оцінки довірчих інтервалів за допомогою вищезазначених методів, Клоппер (Clopper) та Пірсон (Pearson) запропонували у 1934 році спосіб розрахунку так званого точного довірчого інтервалу з урахуванням біномного розподілудосліджуваного ознаки. Цей метод доступний у багатьох онлайн-калькуляторах, проте довірчі інтервали, отримані таким чином, здебільшого надто широкі. У той самий час цей метод рекомендується застосовувати у випадках, коли необхідна консервативна оцінка. Ступінь консервативності методу збільшується зі зменшенням обсягу вибірки, особливо при N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

На думку багатьох статистиків, найбільш оптимальну оцінку довірчих інтервалів для частот здійснює метод Вілсона (Wilson), запропонований ще в 1927 році, але практично не використовується у вітчизняних біомедичних дослідженнях. Даний метод не тільки дозволяє оцінити довірчі інтервали як для дуже малих і дуже великих частот, але і застосовується для малого числа спостережень. У загальному вигляді довірчий інтервал за формулою Вілсон має вигляд від



де приймає значення 1,96 при розрахунку 95% довірчого інтервалу, N - кількість спостережень, а р - частота ознаки у вибірці. Цей метод доступний в онлайн-калькуляторах, тому його застосування не є проблематичним. і не рекомендують використовувати цей метод при n · p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Вважається, що крім методу Вілсон метод Вальда з корекцією по Агресті - Коуллу також дає оптимальну оцінку довірчого інтервалу для частот. Корекція по Агрести – Коуллу являє собою заміну у формулі Вальда частоти народження ознаки у вибірці (р) на р`, при розрахунку якої до чисельника додається 2, а до знаменника додається 4, тобто p` = (X + 2) / (N + 4), де Х - кількість учасників дослідження, у яких є ознака, що вивчається, а N - обсяг вибірки . Така модифікація призводить до результатів, дуже схожих на результати застосування формули Вілсона, за винятком випадків, коли частота події наближається до 0% або 100%, а вибірка мала. Крім вищезгаданих способів розрахунку довірчих інтервалів для частот були запропоновані поправки на безперервність як для методу Вальда, так і для методу Вілсона для малих вибірок, проте дослідження показали, що їх застосування є недоцільним.

Розглянемо застосування вищеописаних методів розрахунку довірчих інтервалів на двох прикладах. У першому випадку ми вивчаємо велику вибірку, що складається з 1000 випадково відібраних учасників дослідження, з яких 450 мають ознака, що вивчається (це може бути фактор ризику, результат або будь-яка інша ознака), що становить частоту 0,45, або 45%. У другому випадку дослідження проводиться з використанням малої вибірки, припустимо, всього 20 осіб, причому ознака, що вивчається, є всього у 1 учасника дослідження (5%). Довірчі інтервалиметодом Вальда, методом Вальда з корекцією по Агрести – Коуллу, методом Вилсона розраховувалися з допомогою онлайн-калькулятора, розробленого Jeff Sauro (http://www. /wald. htm). Довірчі інтервали за методом Вілсона з поправкою на безперервність розраховувалися за допомогою калькулятора, запропонованого порталом Wassar Stats: http://faculty.vassar.edu/lowry/prop1.html. Розрахунки за допомогою кутового перетворення Фішера проводилися «вручну» з використанням критичного значення t для 19 та 999 ступенів свободи відповідно. Результати розрахунків представлені у таблиці для обох прикладів.

Довірчі інтервали, розраховані шістьма різними способамидля двох прикладів, описаних у тексті

Спосіб розрахунку довірчого інтервалу

Р=0,0500, чи 5%

95% ДІ для X=450, N=1000, Р=0,4500, або 45%

–0,0455–0,2541

Вальда з корекцією по Агресті – Коуллу

<,0001–0,2541

Вілсона з корекцією на безперервність

«Точний метод» Клоппера – Пірсона

Кутове перетворення

<0,0001–0,1967

Як видно з таблиці, для першого прикладу довірчий інтервал, розрахований за «загальноприйнятим» методом Вальда входить у негативну область, для частот бути неспроможна. На жаль, подібні казуси нерідкі у вітчизняній літературі. Традиційний спосіб представлення даних у вигляді частоти та її помилки частково маскує цю проблему. Наприклад, якщо частота народження ознаки (у відсотках) представлена ​​як 2,1 ± 1,4, то це не настільки «ріже око», як 2,1 % (95 % ДІ: –0,7; 4,9), хоч і означає те саме. Метод Вальда з корекцією по Агресті - Коуллу і розрахунок за допомогою кутового перетворення дають нижню межу, що прагне нуля. Метод Вілсона з поправкою на безперервність і «точний метод» дають ширші довірчі інтервали ніж метод Вілсона. Для другого прикладу всі методи дають приблизно однакові довірчі інтервали (відмінності з'являються тільки в тисячних), що не дивно, так як частота події в цьому прикладі не сильно відрізняється від 50%, а обсяг вибірки досить великий.

Для читачів, що зацікавилися даною проблемою, можна порекомендувати роботи R. G. Newcombe та Brown, Cai та Dasgupta, в яких наводяться плюси та мінуси застосування 7 та 10 різних методів розрахунку довірчих інтервалів відповідно. З вітчизняних посібників рекомендується книга і , в якій, крім докладного опису теорії, представлені методи Вальда, Вілсона, а також спосіб розрахунку довірчих інтервалів з урахуванням біномного розподілу частот. Крім безкоштовних онлайн-калькуляторів (http://www. /wald. htm та http://faculty. vassar. edu/lowry/prop1.html) довірчі інтервали для частот (і не тільки!) можна розраховувати за допомогою програми CIA ( Confidence Intervals Analysis), яку можна завантажити з http://www. medschool. soton. ac. uk/cia/ .

У наступній статті будуть розглянуті одновимірні методи порівняння якісних даних.

Список літератури

Банержі А.Медична статистика зрозумілою мовою: вступний курс / А. Банержі. - М.: Практична медицина, 2007. - 287 с. Медична статистика/. - М.: Медичне інформаційне агентство, 2007. - 475 с. Гланц.Медико-біологічна статистика/С. Гланц. - М.: Практика, 1998. Типи даних, перевірка розподілу та описова статистика // Екологія людини – 2008. – № 1. – С. 52–58. Жіжин К. С. Медична статистика: навчальний посібник / . - Ростов н / Д: Фенікс, 2007. - 160 с. Прикладна медична статистика / . - СПб. : Фоліант, 2003. - 428 с. Лакін Г. Ф. Біометрія/. - М.: Вища школа, 1990. - 350 с. Медик В. А. Математична статистика у медицині / , . - М.: Фінанси та статистика, 2007. - 798 с. Математична статистика у клінічних дослідженнях / , . - М.: ГЕОТАР-МЕД, 2001. - 256 с. Юнкерів В. І. Медико-статистична обробка даних медичних досліджень / . - СПб. : ВмедА, 2002. - 266 с. Agresti A. Approximate is better than exact for interval estimation of binomial proportions / A. Agresti, B. Coull // American statistician. - 1998. - N 52. - С. 119-126. Altman D. Statistics with confidence // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 p. Brown L. D. Interval estimation for binomial proportion / L. D. Brown, T. T. Cai, A. Dasgupta // Statistical science. - 2001. - N 2. - P. 101-133. Clopper CJ.Використання confidence або fiducial limits ілюструється в випадку binomial / C. J. Clopper, E. S. Pearson / / Biometrika. - 1934. - N 26. - P. 404-413. Garcia-Perez M. A. На конфіденційний період для binomial parameter / M. A. Garcia-Perez // Quality and quantity. - 2005. - N 39. - P. 467-481. Motulsky H. Intuitive biostatistics // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. Newcombe R. G.Двоє-сиденних confidence intervals for single proportion: Comparison of Seven Methods / R. G. Newcombe // Statistics in Medicine. - 1998. - N. 17. - P. 857-872. Sauro J.Прийнятий монтаж швидких слів від невеликих випадків, використовуючи індивідуальні confidence intervals: comparisons and recomendations / J. Sauro, J. R. Lewis // Proceedings of human factors and ergonomics social annual meeting. - Orlando, FL, 2005. Wald A.Конфіденційні обмеження для постійного розповсюдження функцій // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - P. 105-118. Wilson E. B. Досвідчена інформація, право визнання, і статистична інформація / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - P. 209-212.

CONFIDENCE INTERVALS FOR PROPORTIONS

A. M. Grjibovski

National Institute of Public Health, Oslo, Norway

article presents several methods for calculations confidence intervals for binomial proportions, namely, Wald, Wilson, arcsine, Agresti-Coull and exact Clopper-Pearson methods. Уроки тільки загальні введення в проблему confidence interval estimation of binomial proportion and its aim is notly to stimulate the readers to used confidence intervals when presenting results of own empirical research, but also to encourage them to consult statistics books prior analysing own data and preparing manuscripts.

Key words: confidence interval, proportion

Контактна інформація:

старший радник Національного інституту громадського здоров'я, м. Осло, Норвегія

З цієї статті ви дізнаєтесь:

    Що таке довірчий інтервал?

    В чому суть правила 3-х сигм?

    Як можна застосувати ці знання практично?

В наш час через надлишок інформації, пов'язаної з великим асортиментом товарів, напрямів продажу, співробітників, напрямів діяльності тощо, буває важко виділити головнеНа що, в першу чергу, варто звернути увагу і докласти зусиль для управління. Визначення довірчого інтервалута аналіз виходу за його межі фактичних значень - методика, яка допоможе вам виділити ситуації, що впливають зміну тенденцій.Ви зможете розвивати позитивні фактори та знизити вплив негативних. Ця технологія застосовується у багатьох відомих світових компаніях.

Існують так звані " оповіщення", які інформують керівниківпро те, що чергове значення у певному напрямку вийшло за довірчий інтервал. Що це означає? Це сигнал, що сталася якась нестандартна подія, яка, можливо, змінить існуючу тенденцію у цьому напрямі. Це сигналдо того, щоб розібратисяу ситуації та зрозуміти, що на неї вплинуло.

Наприклад, розглянемо кілька ситуацій. Ми розрахували прогноз продажу з межами прогнозу за 100 товарними позиціями на 2011 рік за місяцями та у березні фактичні продажі:

  1. По «Соняшниковій олії» пробили верхню межу прогнозу і не потрапили в довірчий інтервал.
  2. За «Сухими дріжджами» вийшли за нижню межу прогнозу.
  3. По «Вівсяним кашам» пробили верхній кордон.

За іншими товарами фактичні продажі опинилися у межах заданих меж прогнозу. Тобто. їх продаж опинився в рамках очікувань. Отже, ми виділили 3 товари, які вийшли за кордони, і почали розбиратися, що вплинуло на вихід за кордони:

  1. По «Соняшниковій олії» ми увійшли до нової торговельної мережі, яка дала нам додатковий обсяг продажів, що призвело до виходу за верхній кордон. Для цього товару варто перерахувати прогноз до кінця року з урахуванням прогнозу продажу цієї мережі.
  2. За «Сухими дріжджами» машина застрягла на митниці, і утворився дефіцит у рамках 5 днів, що вплинуло на зниження продажів та вихід за нижній кордон. Можливо, варто розібратися, що спричинило і постаратися не повторювати цю ситуацію.
  3. За «Вівсяними Кашами» було запущено захід зі стимулювання збуту, який дав значний приріст продажів та призвів до виходу за межі прогнозу.

Ми виділили 3 фактори, які вплинули на вихід за межі прогнозу. У житті їх може бути набагато більше. Для підвищення точності прогнозування та планування фактори, які призводять до того, що фактичні продажі можуть вийти за межі прогнозу, варто виділити та будувати прогнози та плани щодо них окремо. А потім враховувати їхній вплив на основний прогноз продажів. Також можна регулярно оцінювати вплив даних факторів і змінювати ситуацію на краще рахунок зменшення впливу негативних та збільшення впливу позитивних факторів.

За допомогою довірчого інтервалу ми можемо:

  1. Виділити напрямки, куди варто звернути увагу, т.к. у цих напрямках відбулися події, які можуть вплинути на зміна тенденції.
  2. Визначити факториякі реально впливають на зміну ситуації.
  3. Прийняти зважене рішення(Наприклад, про закупівлі, при плануванні і т.д.).

Тепер розглянемо, що таке довірчий інтервал та як його розрахувати в Excel на прикладі.

Що таке довірчий інтервал?

Довірчий інтервал – це межі прогнозу (верхня та нижня), в рамки яких із заданою ймовірністю (сигма)попадуть фактичні значення.

Тобто. ми розраховуємо прогноз - це наш основний орієнтир, але ми розуміємо, що фактичні значення навряд чи на 100% дорівнюватимуть нашому прогнозу. І виникає питання, у які межіможуть потрапити фактичні значення, якщо існуюча тенденція збережеться? І на це запитання нам допоможе відповісти розрахунок довірчого інтервалу, тобто. - верхньої та нижньої межі прогнозу.

Що таке ймовірність сигма?

При розрахункудовірчого інтервалу ми можемо задати ймовірність влученняфактичних значень у задані межі прогнозу. Як це зробити? Для цього ми задаємо значення сигма і, якщо сигма дорівнюватиме:

    3 сигма- то, ймовірність попадання чергового фактичного значення довірчий інтервал складуть 99,7%, або 300 до 1, або існує 0,3% ймовірності виходу за кордон.

    2 сигма- те, ймовірність попадання чергового значення кордону становить ≈ 95,5 %, тобто. шанси приблизно 20 до 1, чи існує 4,5% ймовірності виходу за кордон.

    1 сигма- те, ймовірність - 68,3%, тобто. шанси приблизно 2 до 1 або існує 31,7% ймовірність того, що чергове значення вийде за межі довірчого інтервалу.

Ми сформулювали правило 3 сигм,яке говорить, що ймовірність влученнячергового випадкового значення у довірчий інтерваліз заданим значенням три сигма складає 99.7%.

Великим російським математиком Чебишевим було доведено теорема у тому, що є 10% ймовірність виходу межі прогнозу із заданим значенням три сигма. Тобто. ймовірність попадання в довірчий інтервал 3 сигма складе мінімум 90%, тоді як спроба розрахувати прогноз і його межі «на око» загрожує значно суттєвішими помилками.

Як самостійно розрахувати довірчий інтервал у Excel?

Розрахунок довірчого інтервалу в Excel (тобто верхньої та нижньої межі прогнозу) розглянемо на прикладі. У нас є часовий ряд - продаж за місяцями за 5 років. Див. вкладений файл.

Для розрахунку меж прогнозу розрахуємо:

  1. Прогноз продажів().
  2. Сигма – середньоквадратичне відхиленнямоделі прогнозу від фактичних значень
  3. Три сигми.
  4. Довірчий інтервал.

1. Прогноз продажів.

=(RC[-14] (Дані в часовому ряду)- RC[-1] (Значення моделі))^2(у квадраті)


3. Підсумуємо кожного місяця значення відхилень з 8 етапу Сума((Xi-Ximod)^2), тобто. підсумуємо січневі, люті... для кожного року.

Для цього скористаємося формулою = СУМІСЛИ()

СУМІСЛИ (масив з номерами періодів усередині циклу (для місяців від 1 до 12); посилання на номер періоду в циклі; посилання на масив з квадратами різниці вихідних даних та значень періодів)


4. Розрахуємо середньоквадратичне відхилення для кожного періоду в циклі від 1 до 12 (10 етап у вкладеному файлі).

Для цього із значення розрахованого на 9 етапі ми витягуємо корінь і ділимо на кількість періодів у цьому циклі мінус 1 = КОРІНЬ((Сума(Xi-Ximod)^2/(n-1))

Скористаємося формулами в Excel = КОРІНЬ (R8 (посилання на (Сума(Xi-Ximod)^2)/(ПОЛІЧИЛИ($O$8:$O$67 (Посилання на масив з номерами циклу); O8 (Посилання на конкретний номер циклу, які рахуємо в масиві))-1))

За допомогою формули Excel = РАХУНКИми вважаємо кількість n


Розрахувавши середньоквадратичне відхилення фактичних даних від моделі прогнозу, ми набули значення сигму для кожного місяця - етап 10 у вкладеному файлі .

3. Розрахуємо 3 сигми.

На 11 етапі задаємо кількість сигм – у нашому прикладі «3» (11 етап у вкладеному файлі):

Також зручні для практики значення сигму:

1,64 сигма - 10% ймовірність виходу за межу (1 шанс із 10);

1,96 сигма - 5% ймовірність виходу за межі (1 шанс із 20);

2,6 сигма - 1% ймовірність виходу за межі (1 шанс зі 100).

5) Розраховуємо три сигмиДля цього ми значення «сигма» для кожного місяця множимо на «3».

3.Визначаємо довірчий інтервал.

  1. Верхня межа прогнозу- прогноз продажів з урахуванням зростання та сезонності + (плюс) 3 сигми;
  2. Нижня межа прогнозу- прогноз продажів з урахуванням зростання та сезонності – (мінус) 3 сигми;

Для зручності розрахунку довірчого інтервалу на тривалий період (див. вкладений файл) скористаємося формулою Excel = Y8 + ВПР (W8; $ U $ 8: $ V $ 19; 2; 0), де

Y8- прогноз продажів;

W8- Номер місяця, для якого будемо брати значення 3-х сигма;

Тобто. Верхня межа прогнозу= "прогноз продажів" + "3 сигма" (у прикладі, ВПР(номер місяця; таблиця зі значеннями 3-х сигма; стовпець, з якого витягуємо значення сигма дорівнює номеру місяця у відповідному рядку;0)).

Нижня межа прогнозу= "Прогноз продажів" мінус "3 сигма".

Отже, ми розрахували довірчий інтервал Excel.

Тепер у нас є прогноз та діапазон із межами в межах, якого із заданою ймовірністю сигма потраплять фактичні значення.

У цій статті ми розглянули, що таке сигма і правило трьох сигм, як визначити довірчий інтервал і для чого ви можете використати цю методику на практиці.

Точних вам прогнозів та успіхів!

Чим Forecast4AC PRO може допомогти вампри розрахунку довірчого інтервалу?:

    Forecast4AC PRO автоматично розрахує верхню або нижню межі прогнозу більш ніж 1000 часових рядів одночасно;

    Можливість аналізу меж прогнозу порівняно з прогнозом, трендом та фактичними продажами на графіку одним натисканням клавіші;

У програмі Forcast4AC PRO можна задати значення сигма від 1 до 3.

Приєднуйся до нас!

Завантажуйте безкоштовні програми для прогнозування та бізнес-аналізу:


  • Novo Forecast Lite- автоматичний розрахунок прогнозув Excel.
  • 4analytics - ABC-XYZ-аналізта аналіз викидів у Excel.
  • Qlik Sense Desktop та QlikViewPersonal Edition - BI-системи для аналізу та візуалізації даних.

Тестуйте можливості платних рішень:

  • Novo Forecast PRO- прогнозування Excel для великих масивів даних.
Поділіться з друзями або збережіть для себе:

Завантаження...