Оцінка математичного очікування та дисперсії за вибіркою. Точкові оцінки математичного очікування

Нехай є випадкова величина Хз математичним очікуванням mта дисперсією D, при цьому обидва ці параметри невідомі. Над величиною Хзроблено Nнезалежних експериментів, в результаті яких було отримано сукупність Nчисельних результатів x 1 , x 2 , …, x N. Як оцінка математичного очікуванняприродно запропонувати середнє арифметичне значень, що спостерігаються

(1)

Тут як x iрозглядаються конкретні значення (числа), отримані в результаті Nекспериментів. Якщо взяти інші (незалежні від попередніх) Nекспериментів, то, очевидно, ми отримаємо інше значення. Якщо взяти ще Nекспериментів, ми отримаємо ще одне нове значення . Позначимо через X iвипадкову величину, що є результатом i-го експерименту, тоді реалізаціями X iбудуть числа, одержані в результаті цих експериментів. Очевидно, що випадкова величина X iматиме таку ж щільність розподілу ймовірності, як і вихідна випадкова величина Х. Також вважаємо, що випадкові величини X iі X jє незалежними при i, не рівному j(Різні незалежні один щодо одного експерименти). Тому формулу (1) перепишемо в іншому (статистичному) вигляді:

(2)

Покажемо, що оцінка є незміщеною:

Таким чином, математичне очікування вибіркового середнього дорівнює справжньому математичному очікуванню випадкової величини m. Це досить передбачуваний та зрозумілий факт. Отже, за оцінку математичного очікування випадкової величини можна прийняти середнє вибіркове (2). Тепер виникає питання: що відбувається з дисперсією оцінки математичного очікування зі збільшенням кількості експериментів? Аналітичні обчислення показують, що

де - дисперсія оцінки математичного очікування (2), а D- Справжня дисперсія випадкової величини X.

Зі сказаного вище, що зі зростанням N(кількості експериментів) дисперсія оцінки зменшується, тобто. що більше ми підсумовуємо незалежні реалізації, то ближче до математичного очікування ми отримаємо оцінку.


Оцінки математичної дисперсії

На перший погляд найбільш природною оцінкою є

(3)

де обчислюється за такою формулою (2). Перевіримо, чи є оцінка незміщеною. Формула (3) може бути записана наступним чином:

Підставимо у цю формулу вираз (2):

Знайдемо математичне очікування оцінки дисперсії:

(4)

Оскільки дисперсія випадкової величини залежить від цього, яке математичне очікування у випадкової величини, приймемо математичне очікування рівним 0, тобто. m = 0.

(5)
при .(6)

Нехай є випадкова величина X, та її параметри математичне очікування ата дисперсія невідомі. Над величиною X вироблено незалежних дослідів, що дали результати x 1, x 2, x n .

Не зменшуючи спільності міркувань, вважатимемо ці значення випадкової величини різними. Розглянемо значення x 1, x 2, x n як незалежні, однаково розподілені випадкові величини X 1, X 2, X n .

Найпростіший методстатистичного оцінювання - метод підстановки та аналогії - полягає в тому, що як оцінка тієї чи іншої числової характеристики (середнього, дисперсії та ін.) генеральної сукупностіберуть відповідну характеристику розподілу вибірки – вибіркову характеристику.

За методом підстановки як оцінка математичного очікування атреба взяти математичне очікування розподілу вибірки – вибіркове середнє. Таким чином, отримуємо

Щоб перевірити незміщеність та спроможність вибіркового середнього як оцінки аРозглянемо цю статистику як функцію вибраного вектора (X 1, X 2, X n). Взявши до уваги, що кожна з величин X 1, X 2, X n має той же закон розподілу, що і величина X, укладаємо, що числові характеристики цих величин і величини X однакові: M(X i) = M(X) = a, D(X i) = D(X) = , i = 1, 2, n , причому X i - незалежні разом випадкові величини.

Отже,

Звідси за визначенням отримуємо, що – незміщена оцінка а, і оскільки D()®0 при n®¥, то через теорему попереднього параграфа є заможною оцінкою математичного очікування агенеральної сукупності.

Ефективність або неефективність оцінки залежить від виду закону розподілу випадкової величини X. Можна довести, що якщо величина X розподілена за нормальним законом, то оцінка є ефективною. Для інших законів розподілу це може бути негаразд.

Незміщеною оцінкою генеральної дисперсіїслужить виправлена ​​вибіркова дисперсія

,

Так як , де – генеральна дисперсія. Справді,

Оцінка s - 2 для генеральної дисперсії є також і заможною, але не є ефективною. Однак у разі нормального розподілу вона є «асимптотично ефективною», тобто зі збільшенням n відношення її дисперсії до мінімально можливої ​​необмежено наближається до одиниці.

Отже, якщо дана вибірка із розподілу F( x) випадкової величини X з невідомим математичним очікуванням ата дисперсією, то для обчислення значень цих параметрів ми маємо право користуватися такими наближеними формулами:

a ,

.

Тут x-i - - варіанти вибірки, n- i - - частота варіанти x i , - - Обсяг вибірки.
Для обчислення виправленої вибіркової дисперсії зручніша формула


.

Для спрощення розрахунку доцільно перейти до умовних варіантів (як вигідно брати первісний варіант, розташовану в середині інтервального варіаційного ряду). Тоді

, .

Інтервальне оцінювання

Вище ми розглянули питання оцінки невідомого параметра аодним числом. Такі оцінки ми назвали точковими. Вони мають той недолік, що при малому обсязі вибірки можуть значно відрізнятися від параметрів, що оцінюються. Тому, щоб отримати уявлення про близькість між параметром та його оцінкою, математичної статистикивводяться, звані, інтервальні оцінки.

Нехай у вибірці для параметра q виявлено точкову оцінку q * . Зазвичай дослідники заздалегідь задаються деякою досить великою ймовірністю g (наприклад, 0,95; 0,99 або 0,999) такою, що подію з ймовірністю g можна вважати практично достовірною, і порушують питання про відшукання такого значення e > 0, для якого

.

Видозмінивши цю рівність, отримаємо:

і будемо у разі говорити, що інтервал ]q * - e; q * + e [ покриває оцінюваний параметр q з ймовірністю g.

Інтервал] q * -e; q * +e [ називається довірчим інтервалом .

Імовірність g називається надійністю (довірчою ймовірністю) інтервальної оцінки.

Кінці довірчого інтервалу, тобто. точки q*-e та q*+e називаються довірчими кордонами .

Число e називається точністю оцінки .

Як приклад завдання визначення довірчих кордонів, розглянемо питання оцінці математичного очікування випадкової величини Х, має нормальний закон розподілу з параметрами ата s, тобто. Х = N ( a, s). Математичне очікування в цьому випадку одно а. За спостереженнями Х 1 Х 2 Х n обчислимо середнє та оцінку дисперсії s 2 .

Виявляється, що за даними вибірки можна побудувати випадкову величину

яка має розподіл Стьюдента (або t-розподіл) з n = n -1 ступенями свободи.

Скористаємося таблицею П.1.3 і знайдемо для заданих ймовірності g та числа n число t g таке, при якому ймовірність

P(|t(n)|< t g) = g,

.

Зробивши очевидні перетворення отримаємо,

Порядок застосування F-критерію наступний:

1. Приймається припущення щодо нормальності розподілу генеральних сукупностей. При заданому рівні значущості a формулюється нульова гіпотеза Н 0: s х 2 = s y 2 про рівність генеральних дисперсій нормальних сукупностей за конкуруючої гіпотези Н 1: s х 2 > s y 2 .

2. Отримують дві незалежні вибірки із сукупностей Х та Y обсягом n x і n y відповідно.

3. Розраховують значення виправлених вибіркових дисперсій s х 2 і s y 2 (методи розрахунку розглянуті у §13.4). Велику дисперсій (s х 2 або s y 2) позначають s 1 2 , меншу - s 2 2 .

4. Обчислюється значення F-критерію за формулою F набл = s12/s22.

5. За таблицею критичних точок розподілу Фішера - Снедекору, за заданим рівнем значимості a і числом ступенів свободи n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 - число ступенів свободи більшої виправленої дисперсії), знаходиться критична точка F кр (a, n 1, n 2).

Зазначимо, що у таблиці П.1.7 наведено критичні значення одностороннього F-критерію. Тому, якщо застосовується двосторонній критерій (Н 1: s х 2 ¹ s y 2), то правосторонню критичну точку F кр (a/2, n 1 , n 2) шукають за рівнем значущості a/2 (удвічі менше за задане) і числам ступенів свободи n 1 і n 2 (n 1 - число ступенів свободи більшої дисперсії). Лівосторонню критичну точку можна і шукати.

6. Робиться висновок: якщо обчислене значення F-критерію більше або дорівнює критичному (F набл ³ F кр), то дисперсії різняться значуще на заданому рівні значущості. В іншому випадку (F набл< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Завдання 15.1. Витрата сировини на одиницю продукції за старою технологією склав:

За новою технологією:

Припустивши, що відповідні генеральні сукупності X та Y мають нормальні розподіли, перевірити, що з варіативності витрати сировини за новою і старою технологіями не відрізняються, якщо прийняти рівень значущості a = 0,1.

Рішення. Діємо у порядку, зазначеному вище.

1. Судитимемо про варіативність витрати сировини за новою та старою технологіями за величинами дисперсій. Таким чином, нульова гіпотеза має вигляд Н0: sх2=sy2. Як конкуруючу приймемо гіпотезу Н 1 : s х 2 ¹ s y 2 , оскільки заздалегідь не впевнені в тому, що якась із генеральних дисперсій більша за іншу.

2-3. Знайдемо вибіркові дисперсії. Для спрощення обчислень перейдемо до умовних варіантів:

u i = x i - 307, v i = y i - 304.

Усі обчислення оформимо у вигляді наступних таблиць:

u i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (vi +1) 2
-3 -3 -1 -2
å -
å -

Контроль: m i u i 2 + 2 m i u i + m i = Контроль: n i v i 2 + 2 n i v i + ni = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Знайдемо виправлені вибіркові дисперсії:

4. Порівняємо дисперсії. Знайдемо відношення більшої виправленої дисперсії до меншої:

.

5. За умовою конкуруюча гіпотеза має вигляд s х 2 ¹ s y 2 , тому критична область двостороння і за знайденні критичної точки слід брати рівні значимості, удвічі менше заданого.

За таблицею П.1.7 за рівнем значущості a/2 = 0,1/2 = 0,05 та числам ступенів свободи n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8 знаходимо критичну точку F кр ( 0,05;12;8) = 3,28.

6. Оскільки F набл.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новій технологіїприймаємо.

Вище під час перевірки гіпотез передбачалося нормальність розподілу досліджуваних випадкових величин. Однак спеціальні дослідження показали, що запропоновані алгоритми дуже стійкі (особливо при великих обсягах вибірок) стосовно відхилення від нормального розподілу.

МЕТА ЛЕКЦІЇ: запровадити поняття оцінки невідомого параметра розподілу та дати класифікацію таких оцінок; отримати точкові та інтервальні оцінки математичного очікування та дисперсії.

Насправді у більшості випадків закон розподілу випадкової величини невідомий, і за результатами спостережень
необхідно оцінити числові характеристики (наприклад, математичне очікування, дисперсію чи інші моменти) або невідомий параметр , Який визначає закон розподілу (щільність розподілу)
досліджуваної випадкової величини. Так, для показового розподілу чи розподілу Пуассона достатньо оцінити один параметр, а для нормального розподілу підлягають оцінці вже два параметри – математичне очікування та дисперсія.

Види оцінок

Випадкова величина
має щільність ймовірності
, де - Невідомий параметр розподілу. В результаті експерименту отримано значення цієї випадкової величини:
. Зробити оцінку по суті означає, що вибірковим значенням випадкової величини необхідно поставити у відповідність деяке значення параметра , тобто створити деяку функцію результатів спостережень
значення якої приймається за оцінку параметра . Індекс вказує на кількість проведених дослідів.

Будь-яка функція, яка залежить від результатів спостережень, називається статистикою. Оскільки результати спостережень є випадковими величинами, то статистика теж буде випадковою величиною. Отже, оцінку
невідомого параметра слід розглядати як випадкову величину, а її значення, обчислене за експериментальними даними обсягом , - Як одне з можливих значень цієї випадкової величини.

Оцінки параметрів розподілів (числових характеристик випадкової величини) поділяються на точкові та інтервальні. Точкова оцінкапараметра визначається одним числом , та її точність характеризується дисперсією оцінки. Інтервальною оцінкоюназивають оцінку, яка визначається двома числами, і - кінцями інтервалу, що накриває оцінюваний параметр із заданою довірчою ймовірністю.

Класифікація точкових оцінок

Щоб точкова оцінка невідомого параметра
була найкращою з точки зору точності, необхідно, щоб вона була заможною, незміщеною та ефективною.

Заможноюназивається оцінка
параметра , якщо вона сходиться ймовірно до оцінюваного параметра, тобто.

. (8.8)

На підставі нерівності Чебишева можна показати, що достатньою умовоювиконання співвідношення (8.8) є рівність

.

Заможність є асимптотичною характеристикою оцінки при
.

Незміщеноюназивається оцінка
(Оцінка без систематичної помилки), математичне очікування якої дорівнює параметру, що оцінюється, тобто.

. (8.9)

Якщо рівність (8.9) не виконується, оцінка називається зміщеною. Різниця
називається усуненням або систематичною помилкою оцінки. Якщо ж рівність (8.9) виконується лише за
, то відповідна оцінка називається асимптотично незміщеною.

Слід зазначити, що й спроможність – практично обов'язкова умова всіх використовуваних практично оцінок (неспроможні оцінки використовуються вкрай рідко), то властивість несмещенности є лише бажаним. Багато часто застосовуваних оцінок властивістю незміщеності не мають.

Загалом точність оцінки деякого параметра , отримана на підставі дослідних даних
, характеризується середнім квадратом помилки

,

який можна привести до вигляду

,

де-дисперсія,
- Квадрат зміщення оцінки.

Якщо оцінка незміщена, то

При кінцевих оцінки можуть відрізнятися середнім квадратом помилки . Звичайно, чим менше ця помилка, тим вже групуються значення оцінки у оцінюваного параметра. Тому завжди бажано, щоб помилка оцінки була по можливості найменшою, тобто виконувалася умова

. (8.10)

Оцінку , яка задовольняє умову (8.10), називають оцінкою з мінімальним квадратом помилки.

Ефективноюназивається оцінка
, для якої середній квадрат помилки не більший за середній квадрат помилки будь-якої іншої оцінки, тобто.

де – будь-яка інша оцінка параметра .

Відомо, що дисперсія будь-якої незміщеної оцінки одного параметра задовольняє нерівності Крамера – Рао

,

де
- Умовна щільність розподілу ймовірностей отриманих значень випадкової величини при істинному значенні параметра .

Таким чином, незміщена оцінка
, для якої нерівність Крамера – Рао звертається до рівності, буде ефективною, тобто така оцінка має мінімальну дисперсію.

Точкові оцінки математичного очікування та дисперсії

Якщо розглядається випадкова величина
, що має математичне очікування та дисперсію , то обидва ці параметри вважаються невідомими. Тому над випадковою величиною
Виготовляється незалежних дослідів, що дають результати:
. Необхідно знайти заможні та незміщені оцінки невідомих параметрів і .

Як оцінки і зазвичай вибираються відповідно статистичне (вибіркове) середнє значення та статистична (вибіркова) дисперсія:

; (8.11)

. (8.12)

Оцінка математичного очікування (8.11) є заможною згідно із законом великих чисел(Теорема Чебишева):

.

Математичне очікування випадкової величини

.

Отже, оцінка є незміщеною.

Дисперсія оцінки математичного очікування:

Якщо випадкова величина
розподілено за нормальним законом, то оцінка є також ефективною.

Математичне очікування оцінки дисперсії

В той же час

.

Так як
, а
, то отримуємо

. (8.13)

Таким чином,
- Зміщена оцінка, хоча є заможною та ефективною.

З формули (8.13) випливає, що для отримання незміщеної оцінки
слід видозмінити вибіркову дисперсію (8.12) таким чином:

яка вважається "найкращою" порівняно з оцінкою (8.12), хоча за великих ці оцінки практично рівні одна одній.

Методи отримання оцінок параметрів розподілу

Часто на практиці на підставі аналізу фізичного механізму, що породжує випадкову величину
, можна дійти невтішного висновку про закон розподілу цієї випадкової величини. Однак параметри цього розподілу невідомі, і їх необхідно оцінити за результатами експерименту, які зазвичай представлені у вигляді кінцевої вибірки
. Для вирішення такого завдання найчастіше застосовуються два методи: метод моментів та метод максимальної правдоподібності.

Метод моментів. Метод полягає у прирівнюванні теоретичних моментів відповідним емпіричним моментам того самого порядку.

Емпіричні початкові моменти -го порядку визначаються формулами:

,

а відповідні їм теоретичні початкові моменти -го порядку - формулами:

для дискретних випадкових величин,

для безперервних випадкових величин,

де - Оцінюється параметр розподілу.

Для отримання оцінок параметрів розподілу, що містить два невідомі параметри і складається система з двох рівнянь

де і – теоретичний та емпіричний центральні моменти другого порядку.

Рішенням системи рівнянь є оцінки і невідомих параметрів розподілу і .

Прирівнявши теоретичний емпіричний початкові моменти першого порядку, отримуємо, що оцінкою математичного очікування випадкової величини
, Що має довільний розподіл, буде вибіркове середнє, тобто.
. Потім, прирівнявши теоретичний та емпіричний центральні моменти другого порядку, отримаємо, що оцінка дисперсії випадкової величини
, що має довільний розподіл, визначається формулою

.

Так само можна знайти оцінки теоретичних моментів будь-якого порядку.

Метод моментів відрізняється простотою і вимагає складних обчислень, але отримані цим методом оцінки часто є неефективними.

Метод максимальної правдоподібності. Метод максимальної правдоподібності точкової оцінки невідомих параметрів розподілу зводиться до пошуку максимуму функції одного або декількох параметрів, що оцінюються.

Нехай
- Безперервна випадкова величина, яка в результаті випробувань набула значення
. Для отримання оцінки невідомого параметра необхідно знайти таке значення , у якому ймовірність реалізації отриманої вибірки було б максимальною. Так як
є взаємно незалежними величинами з однаковою щільністю ймовірності
, то функцією правдоподібностіназивають функцію аргументу :

Оцінка максимальної правдоподібності параметра називається таке значення , при якому функція правдоподібності досягає максимуму, тобто є рішенням рівняння

,

яке явно залежить від результатів випробувань
.

Оскільки функції
і
досягають максимуму при одних і тих же значеннях
, то часто для спрощення розрахунків використовують логарифмічну функцію правдоподібності та шукають корінь відповідного рівняння

,

яке називається рівнянням правдоподібності.

Якщо потрібно оцінити кілька параметрів
розподілу
, то функція правдоподібності буде залежати від цих параметрів. Для знаходження оцінок
параметрів розподілу необхідно вирішити систему рівнянь правдоподібності

.

Метод максимальної правдоподібності дає заможні та асимптотично ефективні оцінки. Однак оцінювані методом максимальної правдоподібності оцінки бувають зміщеними, і, крім того, знаходження оцінок часто доводиться вирішувати досить складні системи рівнянь.

Інтервальні оцінки параметрів

Точність точкових оцінок характеризується їхньою дисперсією. При цьому відсутні відомості про те, як близькі отримані оцінки істинним значенням параметрів. У ряді завдань потрібно не тільки знайти параметр відповідне чисельне значення, але й оцінити його точність та надійність. Необхідно дізнатися, до яких помилок може призвести заміна параметра його точковою оцінкою і з яким ступенем упевненості слід очікувати, що ці помилки не вийдуть за певні межі.

Такі завдання особливо актуальні за малої кількості досвідів , коли точкова оцінка значною мірою випадкова та наближена заміна на може призвести до значних помилок.

Більш повний та надійний спосібоцінювання параметрів розподілів полягає у визначенні не єдиного точкового значення, а інтервалу, який із заданою ймовірністю накриває справжнє значення параметра, що оцінюється.

Нехай за результатами дослідів отримано незміщену оцінку
параметра . Необхідно оцінити можливу помилку. Вибирається деяка досить велика ймовірність
(наприклад), така, що подію з цією ймовірністю можна вважати практично достовірною подією, і знаходиться таке значення , для котрого

. (8.15)

У цьому випадку діапазон практично можливих значень помилки, що виникає під час заміни на , буде
, а великі за абсолютною величиною помилки з'являтимуться лише з малою ймовірністю .

Вираз (8.15) означає, що з ймовірністю
невідоме значення параметра потрапить до інтервалу

. (8.16)

Ймовірність
називається довірчою ймовірністю, а інтервал , що накриває з ймовірністю справжнє значення параметра називається довірчим інтервалом. Зауважимо, що неправильно говорити, що значення параметра лежить усередині довірчого інтервалу з ймовірністю . Використовуване формулювання (накриває) означає, що хоча параметр, що оцінюється, і невідомий, але він має постійне значення і, отже, не має розкиду, оскільки це не випадкова величина.

Оцінки математичного очікування та дисперсії.

З поняттям параметрів розподілу ми познайомилися теоретично ймовірностей. Наприклад, в нормальному законірозподілу, що задається функцією щільності ймовірності

параметрами служать а– математичне очікування та а- Середнє квадратичне відхилення. У розподілі Пуассона параметром є число а = ін.

Визначення. Статистичною оцінкою невідомого параметра теоретичного розподілу називають його наближене значення, що залежить від даних вибірки(х 1, х 2, х 3,..., х k; п 1 , п 2 , п 3..., п k), Т. е. деяку функцію цих величин.

Тут х 1, х 2, х 3,..., х k- Значення ознаки, п 1 , п 2 , п 3..., п k-Відповідні частоти. Статистична оцінка є випадковою величиною.

Позначимо через θ – оцінюваний параметр, а через θ * – його статистичну оцінку. Величину | θ *–θ | називають точністю оцінки.Що менше | θ *–θ |, краще, точніше визначено невідомий параметр.

Щоб оцінка θ * мала практичне значення, вона повинна містити систематичної помилки і водночас мати можливо меншу дисперсію. Крім того, при збільшенні обсягу вибірки ймовірність скільки завгодно малих відхилень | θ *–θ | має бути близька до 1.

Сформулюємо такі визначення.

1. Оцінка параметра називається незміщеною, якщо її математичне очікування М(θ *) рівно оцінюваного параметра θ, тобто.

М(θ *) = θ, (1)

та зміщеною, якщо

М(θ *) ≠ θ, (2)

2. Оцінка θ* називається заможною, якщо за будь-якого δ > 0

(3)

Рівність (3) читається так: оцінка θ * сходиться по ймовірності до θ .

3. Оцінка θ* називається ефективною, якщо за заданого п вона має найменшу дисперсію.

Теорема 1.Вибіркова середня Х В є незміщеною та заможною оцінкою математичного очікування.

Доведення. Нехай вибірка репрезентативна, тобто всі елементи генеральної сукупності мають однакову можливість потрапити у вибірку. Значення ознаки х 1, х 2, х 3, ..., х nможна прийняти за незалежні випадкові величини Х 1, Х 2, Х 3, ..., Х nз однаковими розподілами та числовими характеристиками, у тому числі з рівними математичними очікуваннями, рівними а,

Оскільки кожна з величин Х 1, Х 2, Х 3, …, Х пмає розподіл, що збігається з розподілом генеральної сукупності, то М(Х)= а.Тому

звідки слідує, що – заможна оцінка М(Х).

Використовуючи правило дослідження на екстремум, можна довести, що є ефективною оцінкою М(Х).

Основні властивості точкових оцінок

Для того щоб оцінка мала практичну цінність, вона повинна мати такі властивості.

1. Оцінка параметра називається несмещенной, якщо її математичне очікування дорівнює параметру, що оцінюється, тобто.

Якщо рівність (22.1) не виконується, оцінка може або завищувати значення (М>), або занижувати його (М<) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.

2. Оцінка параметра називається заможною, якщо підпорядковується закону великих чисел, тобто. збігається по ймовірності до оцінюваного параметра при необмеженому зростанні числа дослідів (спостережень) і, отже, виконується така рівність:

де > 0 скільки завгодно мале число.

Для виконання (22.2) достатньо, щоб дисперсія оцінки прагнула нуля при, тобто.

і крім того, щоб оцінка була незміщеною. Від формули (22.3) легко перейти до (22.2), якщо скористатися нерівністю Чебишева.

Отже, спроможність оцінки означає, що при досить великій кількості дослідів і з скільки завгодно великою достовірністю відхилення оцінки від істинного значення параметра менше за будь-яку задану величину. Цим виправдано збільшення обсягу вибірки.

Оскільки - випадкова величина, значення якої змінюється від вибірки до вибірці, міру її розсіювання біля математичного очікування характеризуватимемо дисперсією D. Нехай і - дві незміщені оцінки параметра, тобто. M = і M = відповідно D і D і, якщо D< D , то в качестве оценки принимают.

3. Незміщена оцінка, яка має найменшу дисперсію серед усіх можливих незміщених оцінок параметра, обчислених за вибірками того самого обсягу, називається ефективною оцінкою.

Насправді при оцінці параметрів який завжди вдається задовольнити одночасно вимогам 1, 2, 3. Однак вибору оцінки завжди має передувати її критичне розгляд з усіх точок зору. Під час вибірки практичних методів обробки дослідних даних необхідно керуватися сформульованими властивостями оцінок.

Оцінка математичного очікування та дисперсії за вибіркою

Найбільш важливими характеристиками випадкової величини є математичне очікування та дисперсія. Розглянемо питання, які вибіркові характеристики найкраще оцінюють математичне очікування і дисперсію у сенсі несмещенности, ефективності та спроможності.

Теорема 23.1. Арифметична середня, обчислена за n незалежними спостереженнями над випадковою величиною, яка має математичне очікування M = є незміщеною оцінкою цього параметра.

Доведення.

Нехай – n незалежних спостережень над випадковою величиною. За умовою M = , т.к. є випадковими величинами і мають той самий закон розподілу, тоді. За визначенням середня арифметична

Розглянемо математичне очікування середньої арифметичної. Використовуючи властивість математичного очікування, маємо:

тобто. . З огляду на (22.1) є незміщеною оцінкою. ?

Теорема 23.2 . Арифметична середня, обчислена за n незалежними спостереженнями над випадковою величиною, яка має M = і, є заможною оцінкою цього параметра.

Доведення.

Нехай – n незалежних спостережень над випадковою величиною. Тоді з теореми 23.1 маємо M = .

Для середньої арифметичної запишемо нерівність Чебишева:

Використовуючи властивості дисперсії 4,5 та (23.1), маємо:

т.к. за умовою теореми.

Отже,

Отже, дисперсія середньої арифметичної в n разів менша від дисперсії випадкової величини. Тоді

а це означає, що є заможною оцінкою.

Зауваження : 1 . Приймемо без доказу важливий для практики результат. Якщо N(a,), то незміщена оцінка математичного очікування aмає мінімальну дисперсію, рівну тому є ефективною оцінкою параметра а. ?

Перейдемо до оцінки дисперсії і перевіримо її на спроможність і несмещенность.

Теорема 23.3 . Якщо випадкова вибірка складається з n незалежних спостережень над випадковою величиною з

M = і D = , то вибіркова дисперсія

не є незміщеною оцінкою D – генеральної дисперсії.

Доведення.

Нехай – n незалежних спостережень над випадковою величиною. За умовою та для всіх. Перетворимо формулу (23.3) вибіркової дисперсії:


Спростимо вираз

Беручи до уваги (23.1), звідки

Поділіться з друзями або збережіть для себе:

Завантаження...