Довірчий інтервал дисперсії нормального розподілу. Довірчий інтервал для оцінки дисперсії у MS EXCEL

Побудова довірчого інтервалу для дисперсії нормально розподіленої генеральної сукупностіґрунтується на тому, що випадкова величина:

має c 2 -розподіл Пірсона c n = n-1 ступенями свободи. Задамо довірчу ймовірність g і визначимо числа та умови

Числа та , які задовольняють цій умові, можна вибрати незліченним числом способів. Один із способів полягає в наступному

і .

Значення чисел визначаються з таблиць для розподілу Пірсона. Після цього утворимо нерівність

В результаті отримуємо наступну інтервальну оцінку дисперсії генеральної сукупності:

. (3.25)

Іноді цей вираз записують у вигляді

, (3.26)

, (3.27)

де для коефіцієнтів і складають спеціальні таблиці.

Приклад 3.10.На фабриці працює автоматична лінія фасування розчинної кави в бляшані 100-грамові банки. Якщо середня маса банок, що наповнюються, відрізняється від точної, то лінії налагоджується для припасування середньої маси в робочому режимі. Якщо дисперсія маси перевищує задане значення, лінія повинна бути зупинена на ремонт і переналагодження. Іноді проводиться відбір банок з кавою для перевірки середньої маси та її коливання. Припустимо, що з лінії у випадковому порядку проводиться відбір банок з кавою та оцінка дисперсії s 2 = 18,540. Побудуйте 95% довірчий інтервал для генеральної дисперсії s 2 .

Рішення.Припускаючи, що генеральна сукупність має нормальне розподілення, скористаємося формулою (3.26). За умовою завдання рівень значущості a=0,05 та a/2=0,025. По таблицях для c 2 -розподіл Пірсона з n = n-1 = 29 ступенями свободи знаходимо

і .

Тоді довірчий інтервал для s2 можна записати у вигляді

,

.

Для середньо квадратичного відхилення відповідь матиме вигляд

. â

Перевірка статистичних гіпотез

Основні поняття

Більшість економетричних моделей потребує багаторазового покращення та уточнення. Для цього необхідно проведення відповідних розрахунків, пов'язаних із встановленням здійсненності чи нездійсненності тих чи інших передумов, аналізом якості знайдених оцінок, достовірністю отриманих висновків. Тому знання основних засад перевірки гіпотез є обов'язковим в економетриці.



У багатьох випадках потрібно знати закон розподілу генеральної сукупності. Якщо закон розподілу невідомий, але є підстави припустити, що він має певний вигляд, висувають гіпотезу: генеральна сукупність розподілена за цим законом. Наприклад, можна висунути припущення, що дохід населення, щоденна кількість покупців у магазині, розмір деталей, що випускаються, мають нормальний закон розподілу.

Можливий випадок, коли закон розподілу відомий, яке параметри немає. Якщо є підстави припустити, що невідомий параметр q дорівнює очікуваному числу q 0 то висувають гіпотезу: q=q 0 . Наприклад, можна висунути припущення про величину середнього доходу населення, очікуваного середнього доходу по акціях, про розкид у доходах і т.д.

Під статистичною гіпотезою Hрозуміють будь-яке припущення про генеральну сукупність (випадкову величину), що перевіряється за вибіркою. Це може бути припущення про вид розподілу генеральної сукупності, про рівність двох вибіркових дисперсій, незалежність вибірок, однорідність вибірок, тобто. що закон розподілу не змінюється від вибірки до вибірки та інших.

Гіпотеза називається простийякщо вона однозначно визначає будь-який розподіл або який-небудь параметр; в іншому випадку гіпотеза називається складною. Наприклад, простою гіпотезою є припущення, що випадкова величина Xрозподілена за стандартним нормальному закону N(0; 1); якщо ж висловлюється припущення, що випадкова величина Xмає нормальний розподіл N(m;1), де a£ m£ b, Це складна гіпотеза.

Перевірена гіпотеза називається Основнийабо нульовою гіпотезоюі позначається символом H 0 . Поряд з основною гіпотезою розглядають і гіпотезу, що суперечить їй, яку зазвичай називають конкуруючоїабо альтернативною гіпотезоюта позначають символом H 1 . Якщо основна гіпотеза буде відкинута, має місце альтернативна гіпотеза. Наприклад, якщо перевіряється гіпотеза рівності параметра q деякому заданому значенню q 0 , тобто. H 0:q=q 0 , то альтернативної гіпотези можна розглянути одну з наступних гіпотез: H 1:q>q 0 , H 2:q H 3:q¹q 0 , H 4: q = q 1 . Вибір альтернативної гіпотези визначається конкретним формулюванням завдання.

Висунута гіпотеза може бути правильною чи неправильною, тому виникає необхідність її перевірки. Оскільки перевірка здійснюється статистичними методами, то у зв'язку з цим із певною часткою ймовірності може бути ухвалено неправильне рішення. Тут можуть бути допущені помилки двох видів. Помилка першого роду полягає в тому, що буде відкинуто правильну гіпотезу. Імовірність помилки першого роду позначають літерою a, тобто.

Помилка другого родуполягає в тому, що буде прийнято неправильну гіпотезу. Можливість помилки другого роду позначають буквою b, тобто.

Наслідки вказаних помилок є нерівнозначними. Перша призводить до обережнішого, консервативного рішення, друга – до невиправданого ризику. Що краще чи гірше – залежить від конкретної постановки завдання та змісту нульової гіпотези. Наприклад, якщо H 0 полягає у визнанні продукції підприємства якісною та припущена помилка першого роду, то буде забракована придатна продукція. Припустившись помилки другого роду, ми відправимо споживачеві шлюб. Очевидно, наслідки цієї помилки серйозніші з погляду іміджу фірми та її довгострокових перспектив.

Виключити помилки першого та другого роду неможливо через обмеженість вибірки. Тому прагнуть мінімізувати втрати від цих помилок. Зауважимо, що одночасне зменшення ймовірностей даних помилок неможливе, т.к. Завдання їх зменшення є конкуруючими. І зниження ймовірності допустити одну з них спричиняє збільшення ймовірності допустити іншу. Найчастіше єдиний спосіб зменшення обох ймовірностей полягає у збільшенні обсягу вибірки.

Правило, відповідно до якого приймається або відхиляється основна гіпотеза, називається статистичним критерієм . Для цього підбирається така випадкова величина K, розподіл якої точно або наближено, відомо і яка є мірою розбіжності між дослідними та гіпотетичними значеннями.

Для перевірки гіпотези за даними вибірки обчислюють вибіркове(або спостерігається) значення критерію K набл. Потім, відповідно до розподілу обраного критерію, будується критична область K крит. Це така сукупність значень критерію, у яких нульову гіпотезу відкидають. Решту можливих значень називають областю прийняття гіпотези. Якщо орієнтуватися на критичну область, можна зробити помилку
1-го роду, ймовірність якої задана заздалегідь і дорівнює a називається рівнем значимостігіпотези. Звідси випливає така вимога до критичної області K крит:

.



Рівень значущості a визначає "розмір" критичної області K крит. Однак її становище на безлічі значень критерію залежить від виду альтернативної гіпотези. Наприклад, якщо перевіряється нульова гіпотеза H 0:q=q 0 а альтернативна гіпотеза має вигляд H 1:q>q 0 то критична область складатиметься з інтервалу (K 2 , +¥), де точка K 2 визначається з умови P(K>K 2)=a ( правостороння критична область H 2:q P(K лівостороння критична область). Якщо альтернативна гіпотеза має вигляд H 3:q¹q 0 , то критична область складатиметься з двох інтервалів (–¥;K 1) і (K 2 , +¥), де точки K 1 і K 2 визначаються з умов: P(K>K 2)=a/2 та P(K двостороння критична область).

Основний принцип перевірки статистичних гіпотез можна сформулювати в такий спосіб. Якщо K наблпотрапляє у критичну область, то гіпотеза H 0 відкидається і приймається гіпотеза H 1 . Однак надходячи таким чином, слід розуміти, що тут можна припуститися помилки 1-го роду з ймовірністю a. Якщо K наблпотрапляє в область прийняття гіпотези - то немає підстав, щоб відкидати нульову гіпотезу H 0 . Але це зовсім не означає, що H 0 є єдино придатною гіпотезою: просто розбіжності між вибірковими даними та гіпотезою H 0 невелика; однак такою ж властивістю можуть мати й інші гіпотези.

Потужністю критеріюназивається ймовірність того, що нульова гіпотеза буде відкинута, якщо вірна альтернативна гіпотеза; тобто. потужність критерію дорівнює 1-b, де b - ймовірність зробити помилку 2-го роду. Нехай для перевірки гіпотези прийнято певний рівень значущості a і вибірка має фіксований обсяг. Оскільки у виборі критичної області є певне свавілля, то її доцільно будувати так, щоб потужність критерію була максимальною або ймовірність помилки 2-го роду була мінімальною.

Критерії, що використовуються для перевірки гіпотез про параметри розподілу, називаються критеріями значимості. Зокрема, побудова критичної галузі аналогічна до побудови довірчого інтервалу. Критерії, що використовуються для перевірки згоди між вибірковим розподілом та гіпотетичним теоретичним розподілом, називаються критеріями згоди.

Ви можете використовувати цю форму пошуку, щоб знайти потрібне завдання. Введіть слово, фразу із завдання чи її номер, якщо він вам відомий.


Шукати тільки у цьому розділі


Довірчі інтервали: список розв'язків задач

Довірчі інтервали: теорія та завдання

Загальні відомості про довірчі інтервали

Введемо коротко поняття довірчого інтервалу, який
1) оцінює деякий параметр числової вибірки безпосередньо за даними самої вибірки,
2) накриває значення цього параметра із ймовірністю γ.

Довірчим інтерваломдля параметра X(при ймовірності γ) називається інтервал виду , такий що , а значення обчислюються деяким чином на вибірці .

Зазвичай у прикладних задачах довірчу ймовірність беруть рівною γ = 0,9; 0,95; 0,99.

Розглянемо деяку вибірку обсягу n, зроблену з генеральної сукупності, розподіленої, імовірно, за нормальним законом розподілу. Покажемо, за якими формулами є довірчі інтервали для параметрів розподілу- математичного очікування та дисперсії (середнього квадратичного відхилення).

Довірчий інтервал для математичного очікування

Випадок 1.Дисперсія розподілу відома і дорівнює. Тоді довірчий інтервал для параметра aмає вигляд:
tвизначається з таблиці розподілу Лапласа за співвідношенням

Випадок 2Дисперсія розподілу невідома, за вибіркою обчислено точкову оцінку дисперсії. Тоді довірчий інтервал для параметра aмає вигляд:
де - вибіркове середнє, обчислене за вибіркою, параметр tвизначається з таблиці розподілу Стьюдента

приклад.За даними 7 вимірювань деякої величини знайдені середня результатів вимірювань, що дорівнює 30 і вибіркова дисперсія, що дорівнює 36. Знайдіть межі, в яких з надійністю 0,99 укладено справжнє значення вимірюваної величини.

Рішення.Знайдемо . Тоді довірчі межі для інтервалу, що містить справжнє значення вимірюваної величини, можна знайти за формулою:
, де – вибіркове середнє, – вибіркова дисперсія. Підставляємо всі величини та отримуємо:

Довірчий інтервал для дисперсії

Вважаємо, що взагалі кажучи, математичне очікування невідоме, а відома лише точкова незміщена оцінка дисперсії. Тоді довірчий інтервал має вигляд:
, де - Квантилі розподілу, що визначаються з таблиць.

приклад.За даними 7 випробувань знайдено значення оцінки для середньоквадратичного відхилення s=12. Знайти із ймовірністю 0,9 ширину довірчого інтервалу, побудованого для оцінки дисперсії.

Рішення. Довірчий інтервалдля невідомої дисперсії генеральної сукупності можна знайти за такою формулою:

Підставляємо та отримуємо:


Тоді ширина довірчого інтервалу дорівнює 465,589-71,708 = 393,881.

Довірчий інтервал для ймовірності (частки)

Випадок 1.Нехай у задачі відомий обсяг вибірки та вибіркова частка (відносна частота) . Тоді довірчий інтервал для генеральної частки (істинної ймовірності) має вигляд:
, де параметр tвизначається з таблиці розподілу Лапласа за співвідношенням.

Випадок 2Якщо в задачі додатково відомий загальний обсяг сукупності , з якої було зроблено вибірку, довірчий інтервал для генеральної частки (істинної ймовірності) можна знайти за скоригованою формулою:
.

приклад.Відомо, що знайти межі, в яких з ймовірністю укладено генеральну частку.

Рішення.Використовуємо формулу:

Знайдемо параметр із умови , отримаємо Підставляємо у формулу:


Інші приклади завдань математичної статистики ви знайдете на сторінці

У статистиці існує два види оцінок: точкові та інтервальні. Точкова оцінкає окремою вибірковою статистикою, яка використовується для оцінки параметра генеральної сукупності. Наприклад, вибіркове середнє - це точкова оцінка математичного очікування генеральної сукупності, а вибіркова дисперсія S 2- точкова оцінка дисперсії генеральної сукупності σ 2. було показано, що середнє вибіркове є незміщеною оцінкою математичного очікування генеральної сукупності. Вибіркове середнє називається незміщеним, оскільки середнє значення всіх вибіркових середніх (при тому самому обсязі вибірки n) дорівнює математичному очікуванню генеральної сукупності.

Для того щоб вибіркова дисперсія S 2стала незміщеною оцінкою дисперсії генеральної сукупності σ 2, знаменник вибіркової дисперсії слід покласти рівним n – 1 , а не n. Інакше висловлюючись, дисперсія генеральної сукупності є середнім значенням різноманітних вибіркових дисперсій.

Оцінюючи параметрів генеральної сукупності слід пам'ятати, що вибіркові статистики, такі як , залежить від конкретних вибірок. Щоб врахувати цей факт, для отримання інтервальної оцінкиматематичного очікування генеральної сукупності аналізують розподіл вибіркових середніх (докладніше див.). Побудований інтервал характеризується певним довірчим рівнем, який є ймовірністю того, що справжній параметр генеральної сукупності оцінений правильно. Аналогічні довірчі інтервали можна застосовувати для оцінки частки ознаки рта основної розподіленої маси генеральної сукупності.

Завантажити нотатку у форматі або , приклади у форматі

Побудова довірчого інтервалу для математичного очікування генеральної сукупності за відомого стандартного відхилення

Побудова довірчого інтервалу для частки ознаки у генеральній сукупності

У цьому розділі поняття довірчого інтервалу поширюється на дані категорій. Це дозволяє оцінити частку ознаки у генеральній сукупності рза допомогою вибіркової частки рS= Х/n. Як вказувалося, якщо величини nрі n(1 – р)перевищують число 5, біноміальний розподіл можна апроксимувати нормальним. Отже, для оцінки частки ознаки у генеральній сукупності рможна побудувати інтервал, довірчий рівень якого дорівнює (1 – α)х100%.


де pS- вибіркова частка ознаки, рівна Х/n, тобто. кількості успіхів, поділеному на обсяг вибірки, р- частка ознаки у генеральній сукупності, Z- критичне значення стандартизованого нормального розподілу, n- Обсяг вибірки.

приклад 3.Припустимо, що з інформаційної системи вилучено вибірку, що складається зі 100 накладних, заповнених протягом останнього місяця. Припустимо, що 10 із цих накладних складено з помилками. Таким чином, р= 10/100 = 0,1. Довірчого рівня 95% відповідає критичне значення Z = 1,96.

Таким чином, ймовірність того, що від 4,12% до 15,88% накладних містять помилки, дорівнює 95%.

Для заданого обсягу вибірки довірчий інтервал, що містить частку ознаки в генеральній сукупності, здається ширшим, ніж для безперервної випадкової величини. Це тим, що вимірювання безперервної випадкової величини містять більше інформації, ніж вимірювання категорійних даних. Інакше висловлюючись, категорійні дані, які набувають лише два значення, містять недостатньо інформації з метою оцінки параметрів їх розподілу.

Уобчислення оцінок, вилучених із кінцевої генеральної сукупності

Оцінка математичного очікування.Поправочний коефіцієнт кінцевої генеральної сукупності ( fpc) використовувався зменшення стандартної помилки в раз. При обчисленні довірчих інтервалів для оцінок параметрів генеральної сукупності поправний коефіцієнт застосовується у ситуаціях, коли вибірки отримують без повернення. Таким чином, довірчий інтервал для математичного очікування, що має довірчий рівень, рівний (1 – α)х100%, обчислюється за такою формулою:

приклад 4.Щоб проілюструвати застосування поправочного коефіцієнта для кінцевої генеральної сукупності, повернемося до завдання про обчислення довірчого інтервалу для середньої суми накладних, розглянутої вище в прикладі 3. Припустимо, що за місяць у компанії виписуються 5000 накладних, причому = 110,27 дол., S= 28,95 дол., N = 5000, n = 100, α = 0,05, t 99 = 1,9842. За формулою (6) отримуємо:

Оцінка частки ознаки.При виборі без повернення довірчий інтервал для частки ознаки, що має довірчий рівень, рівний (1 – α)х100%, обчислюється за такою формулою:

Довірчі інтервали та етичні проблеми

При вибірковому дослідженні генеральної сукупності та формулюванні статистичних висновків часто виникають етичні проблеми. Основна з них – як узгоджуються довірчі інтервали та точкові оцінки вибіркових статистик. Публікація точкових оцінок без вказівки відповідних довірчих інтервалів (як правило, що мають 95% довірчий рівень) та обсягу вибірки, на основі яких вони отримані, може породити непорозуміння. Це може створити в користувача враження, що точкова оцінка - саме те, що йому необхідно, щоб передбачити властивості всієї генеральної сукупності. Таким чином, необхідно розуміти, що в будь-яких дослідженнях в основу повинні бути поставлені не точкові, а інтервальні оцінки. З іншого боку, особливу увагу слід приділяти правильному вибору обсягів вибірки.

Найчастіше об'єктами статистичних маніпуляцій стають результати соціологічних опитувань населення з тих чи інших політичних проблем. При цьому результати опитування виносять на перші сторінки газет, а помилку вибіркового дослідження та методологію статистичного аналізу друкують десь у середині. Щоб довести обґрунтованість одержаних точкових оцінок, необхідно вказувати обсяг вибірки, на основі якої вони отримані, межі довірчого інтервалу та його рівень значущості.

Наступна замітка

Використовуються матеріали книги Левін та ін. Статистика менеджерів. - М.: Вільямс, 2004. - с. 448–462

Центральна гранична теоремастверджує, що з досить великому обсязі вибірок вибірковий розподіл середніх можна апроксимувати нормальним розподілом. Це властивість залежить від виду розподілу генеральної сукупності.

Тут середнє вважається відомим фіксованим числом, а дисперсія виступає у ролі невідомого параметра. Покладемо

Так як --, має стандартний нормальний розподіл. Тим самим, функція має-розподіл ступенями свободи, аж ніяк не залежить від невідомого параметра. Позначаючи через квантили цього розподілу і фіксуючи деякі такі, що , приходимо до нерівності

яке виконано з ймовірністю. Звідки отримуємо-довірчий інтервал для:

Довірчий інтервал для дисперсії при невідомому середньому

Зауважимо, що функція визначена в такий спосіб, що з заданої вибірці її значення залежить лише від параметра. Щодо розподілу випадкової величини , то по теоремі Фішера (див.8.3) воно є розподілом ступенями свободи і, отже, не залежить від невідомих параметрів. Фіксуючи, такі, що , і міркуючи як (47), приходимо до наступного -довірчого інтервалу для:

який, використовуючи позначення (30), можна переписати так

Довірчий інтервал для середнього при невідомій дисперсії

Як і в попередньому пункті, обидва параметри вважаються невідомими, при цьому є параметром, що заважає. За теоремою Фішера

і

незалежні і мають розподіл і-розподіл ступенем свободи відповідно. Отже, відношення

має розподіл Стьюдента зі ступенем свободи. Виберемо функцію рівної правої частини (48):

де - Вибіркова дисперсія, визначена формулою (30). Функція не залежить явно від параметра, що заважає. Позначаючи через квантиль розподілу Стьюдента ступенем свободи, отримаємо, що нерівність

виконано з ймовірністю. Звідси отримуємо-довірчий інтервал для:

Оскільки розподіл Стьюдента симетричний, то за Пропозицією 3.3

Тому довірчий інтервал можна записати у вигляді

Таким чином, середнє вибіркове є серединою цього інтервалу.

Приклад 8.2

Звернемося до прикладу 6.4. Припустимо, що кожна з вибірок квитка з нормальногорозподілу з невідомимипараметрами -відповідно. (Про те, на підставі чого можна зробити таке припущення, ми поговоримо пізніше о 9.5.)

Наша мета - знайти довірчі інтервали для та, теоретичних значень вмісту вуглецю та міцності на розрив сталі GS50. Нагадаємо, що обсяг кожної із вибірок. Зафіксуємо довірчу ймовірність, близьку до одиниці, скажімо. По таблиці розподілу Стьюдента на стр. визначимо приблизно, що. Згадуючи значення, знайдені в Прикладі6.5на стор., обчислюємо

і, користуючись формулою (49), отримуємо -довірчий інтервал для процентного вмісту вуглецю

і -довірчий інтервал для значення міцності на розрив

Лабораторна робота №12 Основи теорії оцінювання

Статистик має справу з даними, схильними до випадкової мінливості. Їхня поведінка характеризується деяким законом розподілу ймовірностей. Такий закон, як правило, містить невідомі величини, які вважають параметрами закону. У силу випадкової мінливості даних, що спостерігаються, не можна, ґрунтуючись на них, вказати абсолютно точне значення параметрів. Доводиться задовольнятися лише наближеними значеннями. Отже, математичний статистик працює з такими величинами: - випадковою величиною, яку він ніколи не спостерігає, але яку вважає "душою" даних, що вивчаються ним, причиною, що їх породила. Ця величина визначається деякими параметрами; - Досліджуваними даними, які отримані, як реалізація випадкової величини. Наприклад, випадковою величиною є точний час. Її реалізаціями - показання годинника, доступного для статистика. Завдання статистика - за показаннями n годин t 1,...,t n максимально точно встановити час. З іншого боку він має охарактеризувати точність встановленого значення. Він виконує оцінювання шуканої величини у вигляді t = t 0 + ξ(a,σ), де t 0 - дійсний час у момент дослідження, ξ(a,σ) - випадкова величина, що характеризує відхилення від істинного значення, t 0 , a, σ - параметри, величина ξ характеризується законом розподілу, імовірностями того, що вона набуває різних значень. Оцінюванням у статистиці називають правило обчислення наближеного значення параметра на основі даних, що спостерігаються. Оцінка - це наближене значення параметра, знайдене за даними, що спостерігаються. При побудові оцінок для практичного застосування, до оцінок висуваються три основні вимоги:

    точність, тобто близькість до істинного значення параметра, у прикладі ξ(a,σ) має бути мало;

    несмещенность, тобто вимога, щоб математичне очікування оцінки дорівнювало істинному значенню параметра, у прикладі ξ(a,σ) має бути в середньому дорівнює нулю;

    спроможність, тобто вимога, щоб зі збільшенням числа спостережень оцінка сходилася ймовірно до справжнього значення параметра. У прикладі при великому числі годинника n значення ξ(a,σ) має прагнути нуля з ймовірністю, що прагне одиниці.

Найкращих в усіх відношеннях оцінок немає. Наприклад, середнє арифметичне, поширена оцінка середнього значення випадкової величини, має властивість оптимальності для нормально розподілених даних. Однак воно призводить до помилок, якщо серед даних є викиди, тобто значення, що різко виділяються. Такі викиди в економіці породжені грубими помилками у вимірах або друкарськими помилками, при яких може зникнути точка між рублями і копійками і зарплата зросте в сотню разів. Розглянемо випадковий процес, пов'язаний з історією нанесення на карту Великої Британії уточнених меж її володінь, розкиданих по всіх частинах світу. Відомо, що кожна точка Землі характеризується двома координатами - широтою і довготою. Сьогодні будь-який школяр чув про супутникові прилади, що задають будь-яку точку на Землі з точністю до метра. Однак у ті часи навіть подібний прилад не допоміг би морякам, оскільки він не виявив би на небі жодного "опорного" супутника. Широта визначалася безпосередньо за висотою світил над горизонтом за допомогою приладу "секстан", аналогічного сучасному теодоліту (підзорна труба плюс вимірювач кута). Довгота є кутом повороту земної кулі, при якому поєднуються місцевий меридіан і обраний за умовний нуль грінвічський. Земля робить оборот в 360 ° майже за добу, тобто за годину вона повертається на 15 °, за 4 хвилини - на 1 °. Для визначення довготи треба точно знати місцевий та грінвічський час. Якщо штурман каже капітанові: "Місцевий полудень, Сер", а капітан знає час у цей момент у Грінвічі, то різниця часу, поділена на 4 хвилини, і визначає довготу місцевості в градусах. Сьогодні все було б просто - зателефонувати до Грінвіча і дізнатися про їхній час. Але тоді радіо ще не вигадали. Якби на кораблі був кварцовий годинник, який йде на частку хвилини за рік, проблеми теж би не було, але найкращі хронометри, що тоді існували, не забезпечували необхідної для вимірювання довготи точності. Вони за кілька місяців плавання уникали точного часу на десятки хвилин. І коли в 1831 в кругосвітнє плавання для складання карт вирушав корабель "Бігль", капітан корабля Фіц Рой, людина освічений і вчений, взяв з собою 24 (!) морських хронометра. Кожен хронометр показував свій "грінвічський час". У цьому дослідженні випадкова величина - момент, коли штурман визначав точний місцевий час по якомусь небесному світилу. "Душа" вимірюваної випадкової величини - справжній час у Грінвічі в цей момент. Таку величину позначимо ξ. Значення цієї величини ніколи не відоме. Значення випадкової величини, що спостерігаються, це показання (різні) хронометрів. Кожен із них дещо помилявся, але загалом вони йшли за загальною "душею", накладаючи на неї свою випадкову похибку. Оцінка випадкової величини - це той грінвічський час, який передбачав за даними капітан. Нехай випадкові величини x i , i = 1,...,n, є реалізаціями однієї випадкової величини ξ, тобто мають однаковий розподіл (одну "душу"), причому для будь-якого i середнє значення показань дорівнює одному й тому ж числу: Е( x i) = Е(ξ). Сенс цього твердження такий: весь годинник не може дружно відставати чи поспішати через конструктивні неполадки. У середньому рівноймовірно, що вони поспішають або відстають. Крім того, хай вони незалежні. Іншими словами, у них немає чогось спільного у групах. Так, матрос, що записує показання годинника, міг його реєструвати в одній послідовності. Тоді останні свідчення реєструвалися б на хвилину пізніше за перші. Або кілька годин могли висіти у теплому місці та від нагріву дружно поспішати. Припущення, що такого явища немає, відповідає умові незалежності показань у різних випробуваннях. Найпростіше завдання оцінювання - це визначення ймовірності деякої події, наприклад, те, що реальна (не обов'язково правильна) монета випаде гербом нагору. Визначити ймовірність події майже ніколи не можна безпосередньо. Універсального методу, який дозволяв би для довільної події вказати його ймовірність, немає. Можна оцінити ймовірність події А, якщо допустимо проводити незалежні повторні випробування, у ході яких ця подія настає з постійною ймовірністю. Нехай у кожному з випробувань ймовірність р = Р(А) події А залишається незмінною і результат кожного випробування незалежний від інших. Позначимо через m випадкове число тих випробувань із загальної кількості n, у яких сталася подія А. Кажуть, що m - число "успіхів" у n випробуваннях Бернуллі. Згідно зі статистичним визначенням ймовірності, при великому n відносна частота m/n події А приблизно дорівнює ймовірності події настання події А, тобто m/n ~ р, де р = Р(А). Доведемо, що це випливає з аксіоматики Колмогорова. У математичному аналізі використовується суворе поняття межі послідовності: при досить великому номері члена послідовності, його значення може бути зроблено як завгодно близьким до граничного значення. Таке визначення не відповідає реальному життю, де вкрай рідко відбуваються неймовірні події. Наприклад, з первинного хаотичного бульйону виникає бактерія, здатна відтворювати себе. Або риба створює щось, яке спочатку мільйони років їй не треба (але розвивається), а потім стає крилом. Або затоплюється ціле місто (чи країна). Теоретично ймовірностей поняття межі тлумачиться у сенсі, відмінному від цього, що вкладається у нього математичному аналізі. Визначення теорії ймовірностей ближче до життя. Воно не забороняє того, що в якийсь момент у послідовності буде число, що різко відрізняється від інших. Послідовність випадкових величин u n сходиться за ймовірністю р, якщо для будь-якого числа ε > 0 ймовірність того, що модуль різниці | u n - р | при n → ∞ менше, ніж ε, прагне одиниці:

Теоретично ймовірностей ніяка подія перестав бути достовірним, але подія: |u n - р| ≤ ε практично достовірно за досить великих n. Доведемо нерівність Чебишева. Нехай ξ - випадкова величина, що має математичне очікування Е(ξ) = а дисперсію D(ξ) = σ², ε - позитивне число. Тоді ймовірність події, що полягає в тому, що центрована (Е(ξ) - а) і нормована випадкова величина перевищує меншу, ніж ε -2:

Справді, σ² = Е(ξ - а)². При обчисленні середнього у правій частині виділимо дві області значень ξ. Для ξ, у яких |ξ - а|< εσ, сумма (или интеграл) соответствующих произведений неотрицателен. Для тех ξ, у которых |ξ - а| >εσ, сума (або інтеграл):

Цікавий окремий випадок: σ = 0. У цьому ясно, що |ξ - а| = 0, тобто ξ = а. Доведемо теорему Чебишева. Нехай х 1,...,х n - незалежні однаково розподілені випадкові величини, що мають математичне очікування та дисперсію. Тобто кожен x i є реалізація випадкової величини ξ, причому Е(ξ) = Е(x i) = а, D(ξ) = D(x i) = σ². Тоді для будь-якого ε > 0:

Доведення. Дисперсія середнього арифметичного:

Розглянемо випадкову величину n , що являє собою середнє арифметичне n спостережень. Її середня та дисперсія . Спостережуваними реалізаціями n є . Відповідно до нерівністю Чебишева для випадкової величини n , ймовірність її відхилення від середнього значення на величину, більшу ніж прагне до нуля:

Ймовірність протилежної події прагне за великих n до 1: P(|η n - a|) → 1. Отже, послідовність випадкових величин n сходить за ймовірністю до a. Повернемося до виміру часу на "Біглі". Показ кожного хронометра x i , i = 1,...,n - це вимір, незалежне від інших приладів. Мається на увазі, що конструкція хронометра така, що його відсутня систематична помилка. Це означає, що одні екземпляри хронометрів можуть йти вперед, інші відставати, але ці помилки випадкові, пов'язані з виготовленням даного зразка. Математично це означає, що середній час – справжній. Якість конструкції та технології виготовлення хронометрів характеризується тим, наскільки однорідна за точністю ходу вся продукція в цілому. Математично виражається розкидом показань окремих приладів, тобто. дисперсією випадкових величин x i. Дисперсія середнього n = 24 разів менше, ніж дисперсія окремого хронометра. Тому "середній час", визначений за 24 хронометрами в середньому ближче до справжнього часу майже в 5 разів, ніж час будь-якого окремого хронометра.

Поділіться з друзями або збережіть для себе:

Завантаження...