Знайти 90 довірчий інтервал. Довірчий інтервал

Побудуємо в MS EXCEL довірчийінтервал для оцінки середнього значення розподілу у разі відомого значеннядисперсії.

Зрозуміло, вибір рівня довіриповністю залежить від розв'язуваного завдання. Так, ступінь довіри авіапасажира до надійності літака, безсумнівно, має бути вищим за ступінь довіри покупця до надійності електричної лампочки.

Формулювання завдання

Припустимо, що з генеральної сукупності має взята вибіркарозміру n. Передбачається, що стандартне відхилення цього розподілу відомо. Необхідно на підставі цієї вибіркиоцінити невідоме середнє значення розподілу(μ, ) та побудувати відповідний двосторонній довірчий інтервал.

Точкова оцінка

Як відомо з , статистика(позначимо її Х ср) є незміщеною оцінкою середньогоцією генеральної сукупностіта має розподіл N(μ;σ 2 /n).

Примітка: Що робити, якщо потрібно збудувати довірчий інтервалу разі розподілу, який не є нормальним?У цьому випадку на допомогу приходить , яка говорить, що за досить великого розміру вибірки n із розподілу що не є нормальним, вибірковий розподіл статистики Х порбуде приблизновідповідати нормальному розподілуіз параметрами N(μ;σ 2 /n).

Отже, точкова оцінка середнього значення розподілуу нас є – це середнє значення вибірки, тобто. Х ср. Тепер займемося довірчим інтервалом.

Побудова довірчого інтервалу

Зазвичай, знаючи розподіл та його параметри, ми можемо обчислити ймовірність того, що випадкова величина набуде значення заданого нами інтервалу. Зараз зробимо навпаки: знайдемо інтервал, до якого випадкова величина потрапить з заданою ймовірністю. Наприклад, із властивостей нормального розподілу відомо, що з ймовірністю 95%, випадкова величина, розподілена по нормальному закону , потрапить в інтервал приблизно +/- 2 від середнього значення(Див. статтю про ). Цей інтервал, послужить нам прототипом для довірчого інтервалу.

Тепер розберемося, чи ми знаємо розподіл , щоб визначити цей інтервал? Для відповіді на запитання ми маємо вказати форму розподілу та його параметри.

Форму розподілу ми знаємо – це нормальний розподіл(нагадаємо, що мова йдепро вибірковому розподілі статистики Х ср).

Параметр μ нам невідомий (його якраз потрібно оцінити за допомогою довірчого інтервалу), але у нас є його оцінка Х пор,обчислена на основі вибірки,яку можна використати.

Другий параметр – стандартне відхилення вибіркового середнього будемо вважати відомим, Він дорівнює σ/√n.

Т.к. ми не знаємо μ, то будуватимемо інтервал +/- 2 стандартних відхиленьне від середнього значення, а від відомої його оцінки Х ср. Тобто. при розрахунку довірчого інтервалуми не будемо вважати, що Х српотрапить в інтервал +/- 2 стандартних відхиленьвід μ з ймовірністю 95%, а вважатимемо, що інтервал +/- 2 стандартних відхиленьвід Х срз ймовірністю 95% накриє μ - Середня генеральна сукупність,з якого взято вибірка. Ці два твердження еквівалентні, але друге твердження нам дозволяє побудувати довірчий інтервал.

Крім того, уточнимо інтервал: випадкова величина, розподілена по нормальному закону, з ймовірністю 95% потрапляє в інтервал +/- 1,960 стандартних відхилень,а не+/- 2 стандартних відхилень. Це можна розрахувати за допомогою формули =НОРМ.СТ.ОБР((1+0,95)/2), Див. файл прикладу Лист Інтервал.

Тепер ми можемо сформулювати ймовірнісне твердження, яке послужить нам для формування довірчого інтервалу:
«Ймовірність того, що середня генеральна сукупністьзнаходиться від середньої вибіркив межах 1,960 « стандартних відхилень вибіркового середнього», дорівнює 95%».

Значення ймовірності, згадане у твердженні, має спеціальну назву , який пов'язаний зрівнем значимості α (альфа) простим виразом рівень довіри =1 . У нашому випадку рівень значущості α =1-0,95=0,05 .

Тепер на основі цього ймовірнісного твердження запишемо вираз для обчислення довірчого інтервалу:

де Z α/2 стандартного нормального розподілу(Таке значення випадкової величини z, що P(z>=Z α/2 )=α/2).

Примітка: Верхній α/2-квантильвизначає ширину довірчого інтервалув стандартних відхиленнях вибіркового середнього. Верхній α/2-квантиль стандартного нормального розподілузавжди більше 0, що дуже зручно.

У нашому випадку при α=0,05, верхній α/2-квантиль дорівнює 1,960. Для інших рівнів значення α (10%; 1%) верхній α/2-квантиль Z α/2 можна обчислити за допомогою формули =НОРМ.СТ.ОБР(1-α/2) або, якщо відомий рівень довіри, =НОРМ.СТ.ОБР((1+ур.довіри)/2).

Зазвичай при побудові довірчих інтервалів для оцінки середньоговикористовують тільки верхній α/2-квантильі не використовують нижній α/2-квантиль. Це можливо тому, що стандартне нормальний розподілсиметрично щодо осі х ( щільність його розподілусиметрична щодо середнього, тобто. 0). Тому немає потреби обчислювати нижній α/2-квантиль(його називають просто α /2-квантиль), т.к. він дорівнює верхньому α/2-квантилюзі знаком мінус.

Нагадаємо, що, незважаючи на форму розподілу величини х, відповідна випадкова величина Х сррозподілено приблизно нормально N(μ;σ 2 /n) (див. статтю про ). Отже, в загальному випадку, вищезгадане вираз для довірчого інтервалує лише наближеним. Якщо величина х розподілена по нормальному закону N(μ;σ 2 /n), то вираз для довірчого інтервалує точним.

Розрахунок довірчого інтервалу в MS EXCEL

Розв'яжемо завдання.
Час відгуку електронного компонента на вхідний сигнал є важливою характеристикою пристрою. Інженер хоче побудувати довірчий інтервал для середнього відгуку при рівні довіри 95%. З попереднього досвіду інженер знає, що стандартне відхилення часу відгуку складає 8 мсек. Відомо, що з оцінки часу відгуку інженер зробив 25 вимірів, середнє значення становило 78 мсек.

Рішення: Інженер хоче знати час відгуку електронного пристрою, але він розуміє, що час відгуку є не фіксованою, а випадковою величиною, яка має свій розподіл. Отже, найкраще, на що він може розраховувати, це визначити параметри та форму цього розподілу.

На жаль, з умови завдання форма розподілу часу відгуку нам не відома (вона не обов'язково має бути нормальним). , цього розподілу також невідомо. Відомо лише його стандартне відхиленняσ=8. Тому, поки ми не можемо порахувати ймовірності та побудувати довірчий інтервал.

Однак, незважаючи на те, що ми не знаємо розподілу часу окремого відгуку, ми знаємо, що згідно ЦПТ, вибірковий розподіл середнього часу відгукує приблизно нормальним(вважатимемо, що умови ЦПТвиконуються, т.к. розмір вибіркидосить великий (n=25)) .

Більш того, середняцього розподілу дорівнює середнього значеннярозподілу одиничного відгуку, тобто. μ. А стандартне відхиленняцього розподілу (σ/√n) можна обчислити за формулою =8/КОРІНЬ(25) .

Також відомо, що інженером було отримано точкова оцінкапараметра μ дорівнює 78 мсек (Х пор). Тому, ми можемо обчислювати ймовірності, т.к. нам відома форма розподілу ( нормальне) та його параметри (Х ср і σ/√n).

Інженер хоче знати математичне очікуванняμ розподілу часу відгуку. Як було сказано вище, це μ дорівнює математичному очікуванню вибіркового розподілу середнього часу відгуку. Якщо ми скористаємося нормальним розподілом N(Х ср; σ/√n), то шукане μ перебуватиме в інтервалі +/-2*σ/√n з ймовірністю приблизно 95%.

Рівень значущостідорівнює 1-0,95 = 0,05.

Нарешті, знайдемо лівий та правий кордон довірчого інтервалу.
Ліва межа: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25) = 74,864
Права межа: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25)=81,136

Ліва межа: =НОРМ.ОБР(0,05/2; 78; 8/КОРІНЬ(25))
Права межа: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРІНЬ(25))

Відповідь: довірчий інтервалпри рівні довіри 95% та σ=8мсекдорівнює 78+/-3,136 мсек.

У файл прикладу на аркуші Сигмавідома створена форма для розрахунку та побудови двостороннього довірчого інтервалудля довільних вибірокіз заданим σ та рівнем значимості.

Функція ДОВЕРИТ.НОРМ()

Якщо значення вибіркизнаходяться в діапазоні B20: B79 , а рівень значущостідорівнює 0,05; то формула MS EXCEL:
=СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; РАХУНОК(B20:B79))
поверне лівий кордон довірчого інтервалу.

Цей же кордон можна обчислити за допомогою формули:
=СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРІНЬ(РАХУНОК(B20:B79))

Примітка: Функція ДОВЕРИТ.НОРМ() з'явилася в MS EXCEL 2010. У попередніх версіях MS EXCEL використовувалася функція ДОВЕРИТ() .

Довірчі інтервали.

Обчислення довірчого інтервалу виходить з середньої помилці відповідного параметра. Довірчий інтервал показує, в яких межах із ймовірністю (1-a) знаходиться справжнє значення параметра, що оцінюється. Тут a – рівень значущості (1-a) називають також довірчою ймовірністю.

У першому розділі ми показали, що, наприклад, для середнього арифметичного, справжнє середнє за сукупністю приблизно 95% випадків лежить у межах 2 середніх помилок середнього. Таким чином, межі 95% довірчого інтервалу для середнього відстоятиме від вибіркового середнього на подвійну. середню помилкусереднього, тобто. ми множимо середню помилку середнього певний коефіцієнт, залежить від довірчої ймовірності. Для середнього та різниці середніх береться коефіцієнт Стьюдента (критичне значення критерію Стьюдента), для частки та різниці часток критичне значення критерію z. Добуток коефіцієнта на середню помилку можна назвати граничною помилкоюцього параметра, тобто. максимальну, яку ми можемо отримати при оцінці.

Довірчий інтервал для середнього арифметичного : .

Тут – вибіркове середнє;

Середня помилка середньої арифметичної;

s –вибіркове середнє квадратичне відхилення;

n

f = n-1 (Коефіцієнт Стьюдента).

Довірчий інтервал для різниці середніх арифметичних :

Тут – різниця вибіркових середніх;

- середня помилка різниці середніх арифметичних;

s 1 ,s 2 –вибіркові середні квадратичні відхилення;

n 1 ,n 2

Критичне значення критерію Стьюдента при заданому рівні значимості a та числі ступенів свободи f=n 1 +n 2-2 (Коефіцієнт Стьюдента).

Довірчий інтервал для частки :

.

Тут d – вибіркова частка;

- Середня помилка частки;

n- Обсяг вибірки (чисельність групи);

Довірчий інтервал для різниці часток :

Тут - різниця вибіркових часток;

- Середня помилка різниці середніх арифметичних;

n 1 ,n 2- Обсяги вибірок (чисельності груп);

Критичне значення критерію z за заданого рівня значущості a ( , , ).

Обчислюючи довірчі інтервали для різниці показників, ми, по-перше, безпосередньо бачимо можливі значення ефекту, а не лише його точкову оцінку. По-друге, можемо зробити висновок про прийняття чи спростування нульової гіпотези і, по-третє, можемо зробити висновок про потужність критерію.

При перевірці гіпотез за допомогою довірчих інтервалів слід дотримуватись наступного правила:

Якщо 100(1-a)-відсотковий довірчий інтервал різниці середніх немає нуля, то відмінності статистично значимі лише на рівні значимості a; навпаки, якщо цей інтервал містить нуль, то відмінності статистично значущі.

Справді, якщо цей інтервал містить нуль, то, отже, порівнюваний показник може бути як і більше, і менше у одній із груп, проти інший, тобто. спостерігаються відмінності випадкові.

За місцем, де знаходиться нуль усередині довірчого інтервалу, можна судити про потужність критерію. Якщо нуль близький до нижньої або верхньої межі інтервалу, то можливо при більшої чисельностіпорівнюваних груп, відмінності досягли б статистичної значимості. Якщо нуль близький до середини інтервалу, то, отже, рівноймовірне збільшення і зменшення показника в експериментальній групі, і, ймовірно, відмінностей дійсно немає.

Приклади:

Порівняти операційну летальність при застосуванні двох різних видів анестезії: із застосуванням першого виду анестезії оперувалося 61 особа, померло 8, із застосуванням другого – 67 осіб, померло 10.

d 1 = 8/61 = 0,131; d 2 = 10/67 = 0,149; d1-d2 = - 0,018.

Різниця летальностей порівнюваних методів перебуватиме в інтервалі (-0,018 - 0,122; -0,018 + 0,122) або (-0,14; 0,104) з ймовірністю 100(1-a) = 95%. Інтервал містить нуль, тобто. гіпотезу про однакову летальність при двох різних видаханестезії відкинути не можна.

Отже, летальність може зменшиться до 14% і збільшитися до 10,4% з ймовірністю 95%, тобто. нуль знаходиться приблизно посередині інтервалу, тому можна стверджувати, що, швидше за все, дійсно не відрізняються за летальністю ці два методи.

У розглянутому прикладі порівнювався середній час натискання при теппинг-тесті в чотирьох групах студентів, що відрізняються за екзаменаційною оцінкою. Обчислимо довірчі інтервали середнього часу натискання для студентів, які склали іспит на 2 та 5 і довірчий інтервал для різниці цих середніх.

Коефіцієнти Стьюдента знаходимо за таблицями розподілу Стьюдента (див. додаток): першої групи: = t(0,05;48) = 2,011; для другої групи: = t(0,05; 61) = 2,000. Таким чином, довірчі інтервали для першої групи: = (162,19-2,011*2,18 ; 162,19+2,011*2,18) = (157,8 ; 166,6) , для другої групи (156,55- 2,000 * 1,88; 156,55 +2,000 * 1,88) = (152,8; 160,3). Отже, для тих, хто склав іспит на 2, середній час натискання лежить в межах від 157,8 мс до 166,6 мс з ймовірністю 95%, для тих, хто склав іспит на 5 - від 152,8 мс до 160,3 мс з ймовірністю 95%.

Перевіряти нульову гіпотезу можна і за довірчими інтервалами для середніх, а не лише для різниці середніх. Наприклад, як і нашому разі, якщо довірчі інтервали для середніх перекриваються, то нульову гіпотезу відкинути не можна. Для того, щоб відкинути гіпотезу на вибраному рівні значущості, відповідні довірчі інтервали не повинні перекриватися.

Знайдемо довірчий інтервал для різниці середнього часу натискання у групах, які склали іспит на 2 і 5. Різниця середніх: 162,19 – 156,55 = 5,64. Коефіцієнт Стьюдента: = t(0,05; 49 +62-2) = t (0,05; 109) = 1,982. Групові середні квадратичні відхилення дорівнюватимуть: ; . Обчислюємо середню помилку різниці середніх: . Довірчий інтервал: = (5,64-1,982 * 2,87; 5,64 +1,982 * 2,87) = (-0,044; 11,33).

Отже, різниця середнього часу натискання в групах, які склали іспит на 2 і 5, буде в інтервалі від -0,044 мс до 11,33 мс. До цього інтервалу входить нуль, тобто. Середній час натискання у добре склали іспит, може збільшитися і зменшиться проти незадовільно склали, тобто. нульову гіпотезу відкинути не можна. Але нуль знаходиться дуже близько до нижньої межі, час натискання набагато швидше все-таки зменшується у добре здали. Таким чином, можна зробити висновок, що відмінності в середньому часу натискання між тими, хто здав на 2 і на 5 все-таки є, просто ми не змогли їх виявити при даній зміні середнього часу, розкид середнього часу та обсягах вибірок.



Потужність критерію – це можливість відкинути неправильну нульову гіпотезу, тобто. знайти відмінності там, де вони є.

Потужність критерію визначається з рівня значимості, величини відмінностей між групами, розкиду значень у групах та обсягу вибірок.

Для критерію Стьюдента та дисперсійного аналізуможна користуватися діаграмами чутливості.

Потужність критерію можна використовувати при попередньому визначенні необхідної кількості груп.

Довірчий інтервал показує, в яких межах із заданою ймовірністю знаходиться справжнє значення параметра, що оцінюється.

За допомогою довірчих інтервалів можна перевіряти статистичні гіпотези та робити висновки про чутливість критеріїв.

ЛІТЕРАТУРА.

Гланц С. - Розділ 6,7.

Реброва О.Ю. - С.112-114, с.171-173, с.234-238.

Сидоренко Є. В. – с.32-33.

Запитання для самоперевірки студентів.

1. Що таке потужність критерію?

2. У яких випадках слід оцінити потужність критеріїв?

3. Методи розрахунку потужності.

6. Як перевірити статистичну гіпотезу за допомогою довірчого інтервалу?

7. Що можна сказати про потужність критерію при розрахунку довірчого інтервалу?

Завдання.

та інших. Усі є оцінками своїх теоретичних аналогів, які можна було б отримати, якби у розпорядженні була вибірка, а генеральна сукупність. Але на жаль, генеральна сукупність - це дуже дорого і часто недоступне.

Поняття про інтервальне оцінювання

Будь-яка вибіркова оцінка має деякий розкид, т.к. є випадковою величиною, що залежить від значень у конкретній вибірці. Отже, для надійніших статистичних висновків слід знати не лише точкову оцінку, а й інтервал, який з високою ймовірністю γ (гама) накриває оцінюваний показник θ (Тета).

Формально це два таких значення (статистики) T 1 (X)і T 2 (X), що T 1< T 2 для яких при заданому рівні ймовірності γ виконується умова:

Коротше, з ймовірністю γ або більше істинний показник знаходиться між точками T 1 (X)і T 2 (X), які називаються нижнім та верхнім кордоном довірчого інтервалу.

Однією з умов побудови довірчих інтервалів його максимальна вузькість, тобто. він має бути наскільки це можливо коротким. Бажання цілком природно, т.к. дослідник намагається точніше локалізувати знаходження шуканого параметра.

Звідси випливає, що інтервал довіри повинен накривати максимальні ймовірності розподілу. а сама оцінка бути у центрі.

Тобто ймовірність відхилення (справжнього показника від оцінки) у більшу сторону дорівнює ймовірності відхилення у менший бік. Слід зазначити, що з несиметричних розподілів інтервал справа не дорівнює інтервалу зліва.

На малюнку вище чітко видно, що чим більша довірча ймовірність, тим ширший інтервал – пряма залежність.

Це була невелика вступна частина в теорію інтервального оцінювання невідомих параметрів. Перейдемо до знаходження довірчих кордонів для математичного очікування.

Довірчий інтервал для математичного очікування

Якщо вихідні дані розподілені по , то середнє буде нормальною величиною. Це випливає з того правила, що лінійна комбінація нормальних величин також має нормальний розподіл. Отже, для розрахунку можливостей ми могли б використовувати математичний апарат нормального закону розподілу.

Однак для цього потрібно знати два параметри – матожидання та дисперсію, які зазвичай не відомі. Можна, звичайно, замість параметрів використовувати оцінки (середню арифметичну і ), але тоді розподіл середньої буде не зовсім нормальним, він буде трохи приплюснутий донизу. Цей факт спритно помітив громадянин Вільям Госсет з Ірландії, опублікувавши своє відкриття у березневому випуску журналу Biometrica за 1908 рік. З метою конспірації Держсет підписався Стьюдентом. Так виник t-розподіл Стьюдента.

Однак нормальний розподіл даних, що використовувався К. Гауссом при аналізі помилок астрономічних спостережень, у земному житті зустрічається вкрай рідко і встановити досить складно (для високої точності необхідно близько 2 тисяч спостережень). Тому припущення про нормальність найкраще відкинути та використовувати методи, які не залежать від розподілу вихідних даних.

Виникає питання: який же розподіл середньої арифметичної, якщо він розрахований за даними невідомого розподілу? Відповідь дає відома у теорії ймовірностей Центральна гранична теорема(ЦПТ). У математиці існує кілька її варіантів (протягом довгих років формулювання уточнювалися), але всі вони, грубо кажучи, зводяться до твердження, що сума великої кількості випадкових незалежних величин підпорядковується нормальному закону розподілу.

При розрахунку середньої арифметичної використовується сума випадкових величин. Звідси виходить, що середнє арифметичне має нормальний розподіл, у якого матожидання – це маточування вихідних даних, а дисперсія – .

Розумні людивміють доводити ЦПТ, але ми переконаємося з допомогою експерименту, проведеного в Excel. Змоделюємо вибірку із 50-ти рівномірно розподілених випадкових величин (за допомогою функції ExcelВИПАДМІЖ). Потім зробимо 1000 таких вибірок і кожної розрахуємо середню арифметичну. Подивимося з їхньої розподіл.

Видно, що розподіл середньої близько до нормального закону. Якщо обсяг вибірок та їх кількість зробити ще більше, то подібність буде ще кращою.

Тепер, коли ми переконалися в справедливості ЦПТ, можна, використовуючи , розрахувати довірчі інтервали для середньої арифметичної, які із заданою ймовірністю накривають справжнє середнє чи математичне очікування.

Для встановлення верхньої та нижньої межі потрібно знати параметри нормального розподілу. Як правило, їх немає, тому використовують оцінки: середню арифметичнуі вибіркову дисперсію. Повторюся, такий спосіб дає гарне наближення лише за великих вибірках. Коли вибірки малі, часто рекомендують використовувати розподіл Стьюдента. Не вірте! Розподіл Стьюдента для середньої буває лише тоді, коли вихідні дані мають нормальний розподіл, тобто майже ніколи. Тому краще відразу поставити мінімальну планку за кількістю необхідних даних та використовувати асимптотично коректні методи. Говорять, достатньо 30 спостережень. Беріть 50 – не помилитеся.

T 1,2– нижня та верхня межа довірчого інтервалу

– вибіркове середнє арифметичне

s 0- Середнє квадратичне відхилення за вибіркою (незміщене)

n - Розмір вибірки

γ - Довірча ймовірність (зазвичай дорівнює 0,9, 0,95 або 0,99)

c γ =Φ -1 ((1+γ)/2)- Зворотне значення функції стандартного нормального розподілу. Простіше кажучи, це кількість стандартних помилок від середньої арифметичної до нижньої або верхньої межі (вказаним трьома ймовірностями відповідають значення 1,64, 1,96 і 2,58).

Суть формули в тому, що береться середнє арифметичне і далі від неї відкладається кілька ( з γ) стандартних помилок ( s 0 /√n). Все відомо, бери і рахуй.

До масового використання ПЕОМ для отримання значень функції нормального розподілу та зворотної їй використовували. Їх і зараз використовують, але ефективніше звернутися до готових формулам Excel. Всі елементи формули вище ( , і ) можна легко розрахувати в Excel. Але є і готова формула для розрахунку довірчого інтервалу ДОВІР.НОРМ. Її синтаксис наступний.

ДОВІР.НОРМ(альфа;стандартне_вимк.;розмір)

альфа– рівень значущості чи довірчий рівень, що у прийнятих вище позначеннях дорівнює 1- γ, тобто. ймовірність того, що математичнеочікування опиниться поза довірчого інтервалу. За довірчої ймовірності 0,95, альфа дорівнює 0,05 і т.д.

стандартне_відкл- Середнє квадратичне відхилення вибіркових даних. Стандартну помилку не треба розраховувати, Excel сам розділить на корінь з n.

розмір- Розмір вибірки (n).

Результат функції ДОВЕРИТ.НОРМ – це другий доданок з формули розрахунку довірчого інтервалу, тобто. напівінтервал. Відповідно, нижня та верхня точка – це середнє ± отримане значення.

Отже, можна побудувати універсальний алгоритм розрахунку довірчих інтервалів для середньої арифметичної, який залежить від розподілу вихідних даних. Платою за універсальність є його асимптотичність, тобто. необхідність використання щодо великих вибірок. Однак у вік сучасних технологійзібрати необхідну кількість даних зазвичай не становить труднощів.

Перевірка статистичних гіпотез за допомогою довірчого інтервалу

(Module 111)

Однією з основних завдань, вирішуваних у статистиці, є . Її суть коротко така. Висувається припущення, наприклад, що матожидання генеральної сукупності дорівнює якомусь значенню. Потім будується розподіл вибіркових середніх, які можуть спостерігатися при даному матожиданні. Далі дивляться, де цього умовного розподілу перебуває справжня середня. Якщо вона виходить за допустимі межі, то поява такого середнього дуже малоймовірна, а при одноразовому повторенні експерименту майже неможливо, що суперечить висунутій гіпотезі, яка успішно відхиляється. Якщо ж середнє не виходить за критичний рівень, то гіпотеза не відхиляється (але й доводиться!).

Так ось за допомогою довірчих інтервалів, у нашому випадку для матожидання, також можна перевіряти деякі гіпотези. Це дуже просто зробити. Припустимо, середня арифметична за деякою вибіркою дорівнює 100. Перевіряється гіпотеза про те, що матожидання одно, припустимо, 90. Тобто, якщо поставити питання примітивно, то він звучить так: чи може таке бути, щоб при істинному значенні середньої рівної 90, спостерігається середня виявилася дорівнює 100?

Для відповіді на це питання додатково знадобиться інформація про середнє квадратичне відхилення та розмір вибірки. Допустимо середньоквадратичне відхилення дорівнює 30, а кількість спостережень 64 (щоб легко витягти корінь). Тоді стандартна помилка середньої дорівнює 30/8 чи 3,75. Для розрахунку 95% довірчого інтервалу потрібно відкласти в обидві сторони від середньої по дві стандартні помилки (точніше, 1,96). Довірчий інтервал вийде приблизно 100±7,5 або 92,5 до 107,5.

Далі міркування такі. Якщо перевірене значення потрапляє у довірчий інтервал, воно не суперечить гіпотезі, т.к. укладається у межі випадкових коливань (з ймовірністю 95%). Якщо точка, що перевіряється, виходить за межі довірчого інтервалу, то ймовірність такої події дуже маленька, принаймні нижче допустимого рівня. Отже, гіпотезу відхиляють, як таку, що суперечить спостережуваним даним. У нашому випадку гіпотеза про маточування знаходиться за межами довірчого інтервалу (перевірене значення 90 не входить до інтервалу 100±7,5), тому її слід відхилити. Відповідаючи на примітивне питання вище, слід сказати: ні не може, принаймні таке трапляється вкрай рідко. Часто при цьому вказують конкретну ймовірність помилкового відхилення гіпотези (p-level), а не заданий рівень, яким будувався довірчий інтервал, але про це в інший раз.

Як бачимо, побудувати довірчий інтервал для середнього (або математичного очікування) нескладно. Головне, вловити суть, а далі йтиметься. На практиці в більшості випадків використовуються 95% довірчий інтервал, який має завширшки приблизно дві стандартні помилки по обидва боки від середньої.

На цьому поки що все. Всіх благ!

У статистиці існує два види оцінок: точкові та інтервальні. Точкова оцінкає окремою вибірковою статистикою, яка використовується для оцінки параметра генеральної сукупності. Наприклад, вибіркове середнє - це точкова оцінка математичного очікування генеральної сукупності, а вибіркова дисперсія S 2- точкова оцінка дисперсії генеральної сукупності σ 2. було показано, що середнє вибіркове є незміщеною оцінкою математичного очікування генеральної сукупності. Вибіркове середнє називається незміщеним, оскільки середнє значення всіх вибіркових середніх (при тому самому обсязі вибірки n) дорівнює математичному очікуванню генеральної сукупності.

Для того щоб вибіркова дисперсія S 2стала незміщеною оцінкою дисперсії генеральної сукупності σ 2, знаменник вибіркової дисперсії слід покласти рівним n – 1 , а не n. Інакше висловлюючись, дисперсія генеральної сукупності є середнім значенням різноманітних вибіркових дисперсій.

Оцінюючи параметрів генеральної сукупності слід пам'ятати, що вибіркові статистики, такі як , залежить від конкретних вибірок. Щоб врахувати цей факт, для отримання інтервальної оцінкиматематичного очікування генеральної сукупності аналізують розподіл вибіркових середніх (докладніше див.). Побудований інтервал характеризується певним довірчим рівнем, який є ймовірністю того, що справжній параметр генеральної сукупності оцінений правильно. Аналогічні довірчі інтервали можна застосовувати для оцінки частки ознаки рта основної розподіленої маси генеральної сукупності.

Завантажити нотатку у форматі або , приклади у форматі

Побудова довірчого інтервалу для математичного очікування генеральної сукупності за відомого стандартного відхилення

Побудова довірчого інтервалу для частки ознаки у генеральній сукупності

У цьому розділі поняття довірчого інтервалу поширюється на дані категорій. Це дозволяє оцінити частку ознаки у генеральній сукупності рза допомогою вибіркової частки рS= Х/n. Як вказувалося, якщо величини nрі n(1 – р)перевищують число 5, біномний розподілможна апроксимувати нормальним. Отже, для оцінки частки ознаки у генеральній сукупності рможна побудувати інтервал, довірчий рівень якого дорівнює (1 – α)х100%.


де pS- вибіркова частка ознаки, рівна Х/n, тобто. кількості успіхів, поділеному на обсяг вибірки, р- частка ознаки у генеральній сукупності, Z- критичне значення стандартизованого нормального розподілу, n- Обсяг вибірки.

приклад 3.Припустимо, що з інформаційної системивилучено вибірку, що складається зі 100 накладних, заповнених протягом останнього місяця. Припустимо, що 10 із цих накладних складено з помилками. Таким чином, р= 10/100 = 0,1. Довірчого рівня 95% відповідає критичне значення Z = 1,96.

Таким чином, ймовірність того, що від 4,12% до 15,88% накладних містять помилки, дорівнює 95%.

Для заданого обсягу вибірки довірчий інтервал, що містить частку ознаки в генеральній сукупності, здається ширшим, ніж безперервної випадкової величини. Це тим, що вимірювання безперервної випадкової величини містять більше інформації, ніж вимірювання категорійних даних. Інакше висловлюючись, категорійні дані, які набувають лише два значення, містять недостатньо інформації з метою оцінки параметрів їх розподілу.

Уобчислення оцінок, вилучених із кінцевої генеральної сукупності

Оцінка математичного очікування.Поправочний коефіцієнт кінцевої генеральної сукупності ( fpc) використовувався зменшення стандартної помилки в раз. При обчисленні довірчих інтервалів для оцінок параметрів генеральної сукупності поправний коефіцієнт застосовується у ситуаціях, коли вибірки отримують без повернення. Таким чином, довірчий інтервал для математичного очікування, що має довірчий рівень, рівний (1 – α)х100%, обчислюється за такою формулою:

приклад 4.Щоб проілюструвати застосування поправочного коефіцієнта для кінцевої генеральної сукупності, повернемося до завдання про обчислення довірчого інтервалу для середньої суми накладних, розглянутої вище в прикладі 3. Припустимо, що за місяць у компанії виписуються 5000 накладних, причому = 110,27 дол., S= 28,95 дол., N = 5000, n = 100, α = 0,05, t 99 = 1,9842. За формулою (6) отримуємо:

Оцінка частки ознаки.При виборі без повернення довірчий інтервал для частки ознаки, що має довірчий рівень, рівний (1 – α)х100%, обчислюється за такою формулою:

Довірчі інтервали та етичні проблеми

При вибірковому дослідженні генеральної сукупності та формулюванні статистичних висновків часто виникають етичні проблеми. Основна з них – як узгоджуються довірчі інтервали та точкові оцінки вибіркових статистик. Публікація точкових оцінок без вказівки відповідних довірчих інтервалів (як правило, що мають 95% довірчий рівень) та обсягу вибірки, на основі яких вони отримані, може породити непорозуміння. Це може створити в користувача враження, що точкова оцінка - саме те, що йому необхідно, щоб передбачити властивості всієї генеральної сукупності. Таким чином, необхідно розуміти, що в будь-яких дослідженнях в основу повинні бути поставлені не точкові, а інтервальні оцінки. Крім того, особливу увагу слід приділяти правильному виборуобсягів вибірки

Найчастіше об'єктами статистичних маніпуляцій стають результати соціологічних опитувань населення з тих чи інших політичних проблем. При цьому результати опитування виносять на перші сторінки газет, а помилку вибіркового дослідження та методологію статистичного аналізудрукують десь у середині. Щоб довести обґрунтованість одержаних точкових оцінок, необхідно вказувати обсяг вибірки, на основі якої вони отримані, межі довірчого інтервалу та його рівень значущості.

Наступна замітка

Використовуються матеріали книги Левін та ін. Статистика менеджерів. - М.: Вільямс, 2004. - с. 448–462

Центральна гранична теоремастверджує, що з досить великому обсязі вибірок вибірковий розподіл середніх можна апроксимувати нормальним розподілом. Це властивість залежить від виду розподілу генеральної сукупності.

Розум полягає не лише у знанні, а й у вмінні докладати знання на ділі. (Арістотель)

Довірчі інтервали

Загальний огляд

Взявши вибірку з популяції, ми отримаємо точкову оцінку параметра, що цікавить нас, і обчислимо стандартну помилку для того, щоб вказати точність оцінки.

Однак, для більшості випадків стандартна помилка як така не є прийнятною. Набагато корисніше об'єднати цей захід точності з інтервальною оцінкоюпараметр популяції.

Це можна зробити, використовуючи знання про теоретичний розподіл ймовірності вибіркової статистики(параметра) для того, щоб обчислити довірчий інтервал (CI - Confidence Interval, ДІ - Довірчий інтервал) для параметра.

Взагалі, довірчий інтервал розширює оцінки обидві сторони деякою величиною, кратною стандартної помилки (даного параметра); два значення (довірчі межі), що визначають інтервал, зазвичай відокремлюють комою і укладають у дужки.

Довірчий інтервал для середнього

Використання нормального розподілу

Вибірковий середній має нормальний розподіл, якщо обсяг вибірки великий, тому можна застосувати знання про нормальний розподіл під час розгляду вибіркового середнього.

Зокрема, 95% розподілу вибіркових середніх перебуває у межах 1,96 стандартних відхилень (SD) середньої популяції.

Коли ми маємо лише одну вибірку, ми називаємо це стандартною помилкою середнього (SEM) і обчислюємо 95% довірчого інтервалу для середнього таким чином:

Якщо повторити цей експеримент кілька разів, то інтервал міститиме справжнє середнє популяції в 95% випадків.

Зазвичай це довірчий інтервал як, наприклад, інтервал значень, у якого з довірчою ймовірністю 95% перебуває справжнє середнє популяції (генеральне середнє).

Хоча це не цілком строго (середнє у популяції є фіксоване значення і тому не може мати ймовірність, віднесену до нього) таким чином інтерпретувати довірчий інтервал, але концептуально зручніше для розуміння.

Використання t-розподілу

Можна використовувати нормальний розподіл, якщо знати значення дисперсії у популяції. Крім того, коли обсяг вибірки невеликий, вибіркове середнє відповідає нормальному розподілу, якщо дані, що лежать в основі популяції, нормально розподілені.

Якщо дані, що лежать в основі популяції, розподілені ненормально та/або невідома генеральна дисперсія (дисперсія в популяції), середнє вибіркове підпорядковується t-розподілу Стьюдента.

Обчислюємо 95% довірчий інтервал для генерального середнього у популяції наступним чином:

Де - процентна точка (процентиль) t-розподіл Стьюдента з (n-1) ступенями свободи, яка дає двосторонню ймовірність 0,05.

Взагалі вона забезпечує ширший інтервал, ніж при використанні нормального розподілу, оскільки враховує додаткову невизначеність, яку вводять, оцінюючи стандартне відхилення популяції та/або через невеликий обсяг вибірки.

Коли обсяг вибірки великий (близько 100 і більше), різниця між двома розподілами ( t-Стьюдентата нормальним) незначна. Проте завжди використовують t-розподіл при обчисленні довірчих інтервалів, навіть якщо об'єм вибірки великий.

Зазвичай вказують 95% ДІ. Можна обчислити інші довірчі інтервали, наприклад, 99% ДІ для середнього.

Замість добутку стандартної помилки та табличного значення t-розподілу, який відповідає двосторонній ймовірності 0,05, множать її (стандартну помилку) на значення, яке відповідає двосторонній ймовірності 0,01. Це ширший довірчий інтервал, ніж у випадку 95%, оскільки він відображає збільшену довіру до того, що інтервал дійсно включає середню популяцію.

Довірчий інтервал для пропорції

Вибірковий розподіл пропорцій має біномний розподіл. Однак якщо обсяг вибірки nрозумно великий, тоді вибірковий розподіл пропорції приблизно нормально із середнім.

Оцінюємо вибірковим ставленням p=r/n(де r- кількість індивідуумів у вибірці з цікавими для нас характерними особливостями), і стандартна помилка оцінюється:

95% довірчий інтервал для пропорції оцінюється:

Якщо обсяг вибірки невеликий (зазвичай коли npабо n(1-p)менше 5 ), тоді необхідно використовувати біномне розподіл для того, щоб обчислити точні довірчі інтервали.

Зауважте, що якщо pвиражається у відсотках, то (1-p)замінюють на (100-p).

Інтерпретація довірчих інтервалів

При інтерпретації довірчого інтервалу нас цікавлять такі питання:

Наскільки широкий довірчий інтервал?

Широкий довірчий інтервал свідчить про те, що оцінка неточна; тонкий вказує на точну оцінку.

Ширина довірчого інтервалу залежить від розміру стандартної помилки, яка, своєю чергою, залежить від обсягу вибірки і під час розгляду числової змінної від мінливості даних дають ширші довірчі інтервали, ніж дослідження численного набору даних небагатьох змінних.

Чи включає ДІ якісь значення, що становлять особливий інтерес?

Можна перевірити, чи можливе значення для параметра популяції в межі довірчого інтервалу. Якщо так, то результати узгоджуються з цим можливим значенням. Якщо ні, то малоймовірно (для 95% довірчого інтервалу шанс майже 5%), що параметр має це значення.

Поділіться з друзями або збережіть для себе:

Завантаження...