Оценка на математическото очакване и дисперсията за извадката. Точкови оценки на математическото очакване

Нека има случайна променлива хс математическо очакване ми дисперсия д, докато и двата параметъра са неизвестни. Над големина хпроизведени ннезависими експерименти, които доведоха до набор от нчислени резултати x 1, x 2, …, x N. Като оценка математическо очакванеестествено е да се предложи средноаритметичното на наблюдаваните стойности

(1)

Тук като x iспецифични стойности (числа), получени в резултат на нексперименти. Ако вземем други (независими от предишните) нексперименти, тогава очевидно ще получим различна стойност. Ако приемете повече нексперименти, ще получим още една нова стойност. Означаваме с X iслучайна променлива в резултат на азексперимента, след това реализациите X iще бъдат числата, получени в резултат на тези експерименти. Очевидно е, че случайната променлива X iще има същата плътност на разпределение на вероятността като оригиналната случайна променлива х. Ние също така приемаме, че случайните променливи X iи Xjса независими при аз, не е равно й(различни независими един спрямо друг експерименти). Следователно пренаписваме формула (1) в различна (статистическа) форма:

(2)

Нека покажем, че оценката е безпристрастна:

По този начин математическото очакване на средната стойност на извадката е равно на истинското математическо очакване на случайната променлива м. Това е доста предвидим и разбираем факт. Следователно средната стойност на извадката (2) може да се приеме като оценка на математическото очакване на случайна променлива. Сега възниква въпросът: какво се случва с дисперсията на оценката на очакването, когато броят на експериментите се увеличава? Това показват аналитичните изчисления

където е дисперсията на оценката на математическото очакване (2), и д- истинска дисперсия на случайната променлива х.

От горното следва, че с увеличаване н(брой експерименти) дисперсията на оценката намалява, т.е. колкото повече обобщаваме независимите реализации, толкова по-близо до очакваната стойност получаваме оценката.


Математически оценки на дисперсията

На пръв поглед най-естествената оценка изглежда

(3)

където се изчислява по формула (2). Нека проверим дали оценката е безпристрастна. Формула (3) може да бъде записана по следния начин:

Заместваме израз (2) в тази формула:

Нека намерим математическото очакване на оценката на дисперсията:

(4)

Тъй като дисперсията на случайна променлива не зависи от това какво е математическото очакване на случайната променлива, ще приемем математическото очакване равно на 0, т.е. м = 0.

(5)
при .(6)

Нека има случайна променлива X и нейните параметри са математическото очакване аи дисперсията са неизвестни. Над стойността на X бяха проведени независими експерименти, които дадоха резултати x 1, x 2, x n.

Без да намаляваме общността на разсъжденията, ще считаме тези стойности на случайната променлива за различни. Ще разгледаме стойностите x 1, x 2, x n като независими, еднакво разпределени случайни променливи X 1, X 2, X n.

Най-простият методстатистическата оценка - методът на заместване и аналогия - се състои в това, че като оценка на определена числена характеристика (средна стойност, дисперсия и т.н.) населениевземете съответната характеристика на разпределението на извадката - извадкова характеристика.

По метода на заместването като оценка на математическото очакване анеобходимо е да се вземе математическото очакване на разпределението на извадката - извадковата средна. Така получаваме

За да се тества безпристрастността и последователността на средните стойности на извадката като оценки а, разгледайте тази статистика като функция на избрания вектор (X 1, X 2, X n). Като се има предвид, че всяка от величините X 1, X 2, X n има същия закон на разпределение като величината X, заключаваме, че числените характеристики на тези величини и величината X са еднакви: M(X аз) = M(X) = а, D(X аз) = D(X) = , аз = 1, 2, н , където X i са колективно независими случайни променливи.

Следователно,

Следователно по дефиниция получаваме, че това е безпристрастната оценка а, и тъй като D()®0 като n®¥, тогава по силата на теоремата от предходния параграф е последователна оценка на очакванията аобщото население.

Ефективността или неефективността на оценката зависи от формата на закона за разпределение на случайната променлива X. Може да се докаже, че ако стойността X е разпределена по нормалния закон, тогава оценката е ефективна. За други закони за разпределение това може да не е така.

Безпристрастна оценка на общата дисперсияе коригираната дисперсия на извадката

,

защото , където е общата дисперсия. Наистина ли,

Оценката s -- 2 за общата дисперсия също е последователна, но не е ефективна. Въпреки това, в случай на нормално разпределение, то е „асимптотично ефективно“, т.е., когато n нараства, съотношението на неговата дисперсия към минимално възможното се приближава неограничено.

И така, дадена извадка от разпределението F( х) случайна променлива X с неизвестно математическо очакване аи дисперсия , тогава за изчисляване на стойностите на тези параметри имаме право да използваме следните приблизителни формули:

а ,

.

Тук х-и- - опции за вземане на проби, n- i - - опции за честота x i, - - размер на извадката.
За изчисляване на коригираната дисперсия на извадката формулата е по-удобна


.

За да опростите изчислението, препоръчително е да преминете към условни опции (тъй като с това е изгодно да се вземе оригинална версия, разположен в средата на интервала вариационна серия). Тогава

, .

интервална оценка

По-горе разгледахме въпроса за оценката на неизвестен параметър аедно число. Нарекохме такива оценки точкови оценки. Те имат недостатъка, че при малък размер на извадката могат да се различават значително от оценените параметри. Следователно, за да получите представа за близостта между параметър и неговата оценка, в математическа статистикавъвеждат се така наречените интервални оценки.

Нека точкова оценка q * бъде намерена в извадката за параметъра q. Обикновено на изследователите е дадена предварително някаква достатъчно голяма вероятност g (например 0,95; 0,99 или 0,999), така че събитие с вероятност g да може да се счита за практически сигурно, и те повдигат въпроса за намирането на такава стойност e > 0 за който

.

Променяйки това равенство, получаваме:

и в този случай ще кажем, че интервалът ]q * - e; q * + e[ покрива оценения параметър q с вероятност g.

Интервал ]q * -e; q * +e [ се извиква доверителен интервал .

Вероятността g се нарича надеждност (доверителна вероятност) оценка на интервала.

завършва доверителен интервал, т.е. се наричат ​​точки q * -e и q * +e граници на доверие .

Числото e се нарича точност на оценката .

Като пример за проблема за определяне на границите на доверие, разгледайте въпроса за оценка на математическото очакване на случайна променлива X, която има нормален закон на разпределение с параметри аи s, т.е. X = N( а, с). Математическото очакване в този случай е равно на а. Според наблюденията X 1 , X 2 , X n изчислете средната стойност и оценка дисперсия s 2 .

Оказва се, че според примерните данни е възможно да се конструира случайна променлива

което има разпределение на Стюдънт (или t-разпределение) с n = n -1 степени на свобода.

Нека използваме таблица A.1.3 и намерим за дадената вероятност g и числото n числото t g, така че вероятността

P(|t(n)|< t g) = g,

.

След като направихме очевидни трансформации, получаваме

Процедурата за прилагане на F-критерия е следната:

1. Прави се предположение за нормалното разпределение на популациите. При дадено ниво на значимост a се формулира нулевата хипотеза H 0: s x 2 = s y 2 относно равенството на общите дисперсии на нормалните съвкупности при конкурентната хипотеза H 1: s x 2 > s y 2 .

2. Получават се две независими проби от популациите X и Y съответно на n x и n y.

3. Изчислете стойностите на коригираните дисперсии на извадката s x 2 и s y 2 (методите за изчисление са разгледани в §13.4). По-голямата от дисперсиите (s x 2 или s y 2) се обозначава с 1 2, по-малката - s 2 2.

4. Стойността на F-критерия се изчислява по формулата F obs = s 1 2 / s 2 2 .

5. Съгласно таблицата на критичните точки на разпределението на Fisher - Snedecor, за дадено ниво на значимост a и броя на степените на свобода n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 е броят на степените на свобода на по-голяма коригирана дисперсия), се намира критичната точка F cr (a, n 1, n 2).

Имайте предвид, че таблица A.1.7 показва критичните стойности на едностранния F-критерий. Следователно, ако се приложи двустранен критерий (H 1: s x 2 ¹ s y 2), тогава дясностранният критична точка F cr (a/2, n 1 , n 2) търсят нивото на значимост a/2 (половината от определеното) и броя на степените на свобода n 1 и n 2 (n 1 - броят на степените на свобода с по-голяма дисперсия). Лявата критична точка може да не бъде намерена.

6. Заключението е, че ако изчислената стойност на F-критерия е по-голяма или равна на критичната (F obs ³ F cr), тогава дисперсиите се различават значително при дадено ниво на значимост. В противен случай (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Задача 15.1. Разходът на суровини за единица продукция по старата технология беше:

Нова технология:

Ако приемем, че съответните популации X и Y имат нормални разпределенияпроверете дали потреблението на суровини за нови и стари технологии не се различава по променливост, ако вземем нивото на значимост a = 0,1.

Решение. Действаме по посочения по-горе ред.

1. Ще преценим променливостта на потреблението на суровини за нови и стари технологии по отношение на стойностите на дисперсията. Така нулевата хипотеза има формата H 0: s x 2 = s y 2 . Като конкурентна хипотеза приемаме хипотезата H 1: s x 2 ¹ s y 2, тъй като не сме сигурни предварително, че някоя от общите вариации е по-голяма от другата.

2-3. Намерете примерните отклонения. За да опростим изчисленията, нека да преминем към условни опции:

u i = x i - 307, v i = y i - 304.

Ще организираме всички изчисления под формата на следните таблици:

u i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Контрол: å m i u i 2 + 2å m i u i + m i = Контрол: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Намерете коригираните дисперсии на примера:

4. Сравнете разликите. Намерете отношението на по-голямата коригирана дисперсия към по-малката:

.

5. По условие конкурентната хипотеза има формата s x 2 ¹ s y 2 , следователно критичната област е двустранна и при намиране на критичната точка трябва да се вземат нива на значимост, които са половината от дадената.

Съгласно таблица A.1.7, чрез нивото на значимост a/2 = 0,1/2 = 0,05 и броя на степените на свобода n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, намираме критична точка F cr (0,05; 12; 8) = 3,28.

6. Тъй като F обл.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и нови технологииприемам.

По-горе, когато се тестват хипотези, се приема, че разпределението на изследваните случайни променливи е нормално. Специални проучвания обаче показват, че предложените алгоритми са много стабилни (особено при големи размери на извадката) по отношение на отклонението от нормалното разпределение.

ЦЕЛ НА ЛЕКЦИЯТА: да се въведе концепцията за оценка на неизвестен параметър на разпределение и да се даде класификация на такива оценители; получавате точкови и интервални оценки на математическото очакване и дисперсията.

На практика в повечето случаи законът за разпределение на случайна величина е неизвестен и според резултатите от наблюденията
необходимо е да се оценят числени характеристики (например математическо очакване, дисперсия или други моменти) или неизвестен параметър , който определя закона за разпределение (плътност на разпределение)
изследвана случайна променлива. Така че за експоненциално или Поасоново разпределение е достатъчно да се оцени един параметър, а за нормално разпределение вече трябва да се оценят два параметъра - математическото очакване и дисперсията.

Видове оценки

Случайна стойност
има плътност на вероятността
, където е неизвестен параметър на разпределение. В резултат на експеримента бяха получени стойностите на тази случайна променлива:
. Да се ​​направи оценка по същество означава, че примерните стойности на случайна променлива трябва да бъдат свързани с определена стойност на параметъра , т.е. създайте някаква функция от резултатите от наблюденията
, чиято стойност се приема като приблизителна параметър . Индекс показва броя на извършените експерименти.

Всяка функция, която зависи от резултатите от наблюденията, се нарича статистика. Тъй като резултатите от наблюденията са случайни променливи, тогава и статистиката ще бъде такава случайна величина. Следователно оценката
неизвестен параметър трябва да се разглежда като случайна променлива и нейната стойност да се изчисли от експерименталните данни по обем , – като една от възможните стойности на тази случайна променлива.

Оценките на параметрите на разпределението (числовите характеристики на случайна променлива) са разделени на точки и интервали. Точкова оценкапараметър определени от едно число , а неговата точност се характеризира с дисперсията на оценката. интервална оценканаречена оценка, която се определя от две числа, и – до краищата на интервала, покриващ оценявания параметър с дадено ниво на увереност.

Класификация на точковите оценки

За да направите точкова оценка на неизвестен параметър
е най-добрият по отношение на точността, той трябва да бъде последователен, безпристрастен и ефективен.

Богатнаречен резултат
параметър , ако се сближава по вероятност с оценения параметър, т.е.

. (8.8)

Въз основа на неравенството на Чебишев може да се покаже, че достатъчно условиерелацията (8.8) е равенството

.

Съгласуваността е асимптотична характеристика на оценката за
.

безпристрастеннаречен резултат
(оценка без систематична грешка), чието математическо очакване е равно на оценявания параметър, т.е.

. (8.9)

Ако равенството (8.9) не е изпълнено, тогава оценката се нарича предубедена. Разлика
наречено отклонение или отклонение на оценката. Ако равенството (8.9) е изпълнено само за
, тогава съответната оценка се нарича асимптотично безпристрастна.

Трябва да се отбележи, че ако последователността е почти задължително условие за всички оценки, използвани в практиката (непоследователните оценки се използват изключително рядко), тогава свойството на безпристрастност е само желателно. Много често използвани оценители нямат свойството безпристрастност.

В общия случай, точността на оценката на определен параметър получени въз основа на експериментални данни
, се характеризира със средната квадратична грешка

,

които могат да бъдат доведени до формата

,

къде е дисперсията,
е квадратът на отклонението на оценката.

Ако оценката е безпристрастна, тогава

На финала оценките може да се различават от средния квадрат на грешката . Естествено, колкото по-малка е тази грешка, толкова по-тясно са групирани стойностите на оценката около оценения параметър. Следователно винаги е желателно грешката в оценката да бъде възможно най-малка, т.е. условието

. (8.10)

Оценка удовлетворяващо условие (8.10) се нарича оценка с минимална квадратна грешка.

ефикасеннаречен резултат
, за които средната квадратна грешка не е по-голяма от средната квадратна грешка на всяка друга оценка, т.е.

където – всяка друга оценка на параметъра .

Известно е, че дисперсията на всяка безпристрастна оценка на един параметър удовлетворява неравенството на Крамър-Рао

,

където
– условна плътност на разпределение на вероятностите на получените стойности на случайна променлива с истинската стойност на параметъра .

И така, безпристрастният оценител
, за които неравенството на Крамър-Рао се превръща в равенство, ще бъде ефективно, т.е. такава оценка има минимална дисперсия.

Точкови оценки на математическото очакване и дисперсията

Ако разгледаме случайна променлива
, което има математическо очакване и дисперсия , и двата параметъра се приемат за неизвестни. Следователно, над случайна променлива
произведени независими експерименти, които дават резултати:
. Необходимо е да се намерят последователни и безпристрастни оценки на неизвестни параметри и .

Като оценки и обикновено се избират съответно статистическата (извадкова) средна и статистическа (извадкова) дисперсия:

; (8.11)

. (8.12)

Очакваната оценка (8.11) е последователна според закона големи числа(теорема на Чебишев):

.

Математическо очакване на случайна променлива

.

Следователно оценката е безпристрастен.

Дисперсията на оценката на математическото очакване:

Ако случайната променлива
разпределени по нормалния закон, след това оценката също е ефективен.

Математическо очакване на оценката на дисперсията

В същото време

.

защото
, а
, тогава получаваме

. (8.13)

По този начин,
е пристрастна оценка, въпреки че е последователна и ефективна.

От формула (8.13) следва, че за да се получи безпристрастна оценка
дисперсията на извадката (8.12) трябва да се модифицира, както следва:

което се счита за "по-добро" от оценката (8.12), макар и за големи тези оценки са почти равни една на друга.

Методи за получаване на оценки на параметрите на разпределението

Често на практика, въз основа на анализа на физическия механизъм, който генерира случайна променлива
, можем да заключим за закона на разпределение на тази случайна променлива. Параметрите на това разпределение обаче са неизвестни и трябва да бъдат оценени от резултатите от експеримента, обикновено представени като крайна извадка.
. За решаване на такъв проблем най-често се използват два метода: методът на моментите и методът на максималната вероятност.

Метод на моментите. Методът се състои в приравняване на теоретичните моменти със съответните емпирични моменти от същия порядък.

Емпирични начални моменти ред се определят по формулите:

,

и съответните теоретични начални моменти ти ред - формули:

за дискретни случайни променливи,

за непрекъснати случайни променливи,

където е оцененият параметър на разпределение.

Да се ​​получат оценки на параметрите на разпределение, съдържащо два неизвестни параметъра и , системата е съставена от две уравнения

където и са теоретичните и емпиричните централни моменти от втори ред.

Решението на системата от уравнения са оценките и неизвестни параметри на разпространение и .

Приравнявайки теоретичните емпирични начални моменти от първи ред, получаваме, че чрез оценяване на математическото очакване на случайна променлива
, която има произволно разпределение, ще бъде извадковата средна стойност, т.е.
. Тогава, приравнявайки теоретичните и емпиричните централни моменти от втория ред, получаваме, че оценката на дисперсията на случайната променлива
, която има произволно разпределение, се определя по формулата

.

По подобен начин могат да се намерят оценки на теоретични моменти от всякакъв порядък.

Методът на моментите е прост и не изисква сложни изчисления, но оценките, получени по този метод, често са неефективни.

Метод на максимална вероятност. Методът на максимална вероятност за точкова оценка на неизвестни параметри на разпределение се свежда до намиране на максималната функция на един или повече оценени параметри.

Позволявам
е непрекъсната случайна променлива, която като резултат тестовете взеха стойностите
. За да получите оценка на неизвестен параметър трябва да се намери стойността , при което вероятността за реализация на получената извадка би била максимална. защото
са взаимно независими величини с еднаква вероятностна плътност
, тогава функция на вероятносттаизвикване на аргументната функция :

Оценката на максималната вероятност на параметъра тази стойност се нарича , при което функцията на вероятността достига своя максимум, т.е. е решение на уравнението

,

което очевидно зависи от резултатите от теста
.

Тъй като функциите
и
достигат максимум при същите стойности
, тогава често, за да опростят изчисленията, те използват логаритмичната функция на вероятността и търсят корена на съответното уравнение

,

което се нарича уравнение на вероятността.

Ако трябва да оцените няколко параметъра
разпространение
, тогава функцията на вероятността ще зависи от тези параметри. За да намерите оценки
параметри на разпределение, е необходимо да се реши системата уравнения на вероятността

.

Методът на максималната вероятност дава последователни и асимптотично ефективни оценки. Въпреки това, оценките, получени чрез метода на максималната вероятност, понякога са пристрастни и освен това, за да се намерят оценките, често трябва да се решат доста сложни системи от уравнения.

Интервални оценки на параметрите

Точността на точковите оценки се характеризира с тяхната дисперсия. В същото време няма информация колко близки са получените оценки до истинските стойности на параметрите. В редица задачи се изисква не само намиране на параметъра подходяща числена стойност, но също така да оцени нейната точност и надеждност. Необходимо е да разберете до какви грешки може да доведе подмяната на параметъра. неговата точкова оценка и с каква степен на увереност можем да очакваме, че тези грешки няма да надхвърлят познатите граници.

Такива проблеми са особено важни за малък брой експерименти. когато точковата оценка до голяма степен произволно и приблизително заместване на може да доведе до значителни грешки.

по-пълна и надежден начинОценката на параметрите на разпределението се състои в определяне не на една точкова стойност, а на интервал, който с дадена вероятност покрива истинската стойност на оценявания параметър.

Нека резултатите експерименти, се получава безпристрастна оценка
параметър . Необходимо е да се оцени възможната грешка. Избира се някаква достатъчно голяма вероятност
(например), така че събитие с тази вероятност може да се счита за практически сигурно събитие и се намира такава стойност , за което

. (8.15)

В този случай диапазонът от практически възможни стойности на грешката, която възниква при подмяната на , ще бъде
, а големите абсолютни грешки ще се появят само с малка вероятност .

Израз (8.15) означава, че с вероятност
неизвестна стойност на параметъра попада в интервала

. (8.16)

Вероятност
Наречен ниво на увереност, и интервалът покриване с вероятност извиква се истинската стойност на параметъра доверителен интервал. Обърнете внимание, че е неправилно да се каже, че стойността на параметъра е в рамките на доверителния интервал с вероятността . Използваната формулировка (обхваща) означава, че въпреки че прогнозният параметър е неизвестен, той има постоянна стойност и следователно няма спред, тъй като не е случайна променлива.

Оценки на математическото очакване и дисперсията.

Запознахме се с понятието параметри на разпределението в теорията на вероятностите. Например в нормален законразпределение, дадено от функцията за плътност на вероятността

параметрите са а– математическо очакване и а- средно аритметично стандартно отклонение. В разпределението на Поасон параметърът е числото а = пр.

Определение. Статистическа оценка на неизвестен параметър на теоретично разпределение е неговата приблизителна стойност, която зависи от извадковите данни(x 1, x 2, x 3,..., x k ; p 1, p 2, p 3,..., p k), т.е. някаква функция на тези количества.

Тук x 1, x 2, x 3,..., x k– стойности на характеристиките, p 1, p 2, p 3,..., p kса съответните честоти. Статистическата оценка е случайна променлива.

Означаваме с θ е оцененият параметър и през θ * - неговият статистическа оценка. Стойност | θ *–θ | Наречен точност на оценката.Колкото по-малко | θ *–θ |, толкова по-добре, неизвестният параметър е по-точно дефиниран.

Да отбележи θ * е от практическо значение, не трябва да съдържа систематична грешка и в същото време да има възможно най-малката вариация. В допълнение, с увеличаване на размера на извадката, вероятността от произволно малки отклонения | θ *–θ | трябва да е близо до 1.

Нека формулираме следните определения.

1. Оценката на параметъра се нарича безпристрастна, ако нейното математическо очакване е M(θ *) равен на оценения параметър θ, т.е.

М(θ *) = θ, (1)

и компенсира ако

М(θ *) ≠ θ, (2)

2. Оценка θ* се нарича последователна, ако за всяко δ > 0

(3)

Равенство (3) гласи следното: оценка θ * се сближава по вероятност към θ .

3. Оценка θ* се нарича ефективна, ако за дадено n има най-малката дисперсия.

Теорема 1.Средната стойност на извадката Х В е безпристрастна и последователна оценка на математическото очакване.

Доказателство. Нека извадката е представителна, т.е. всички елементи от генералната съвкупност имат еднаква възможност да бъдат включени в извадката. Стойности на характеристиките x 1, x 2, x 3,..., x nмогат да се приемат като независими случайни променливи X 1, X 2, X 3, ..., X nсъс същите разпределения и числови характеристики, включително тези с равни математически очаквания, равни на а,

Тъй като всяко от количествата X 1, X 2, X 3, ..., X pима разпределение, съвпадащо с разпределението на генералната съвкупност, тогава М(х)= а.Ето защо

откъдето следва, че е последователна оценка М(х).

Използвайки екстремното изследователско правило, можем да докажем, че това също е ефективна оценка М(х).

Основни свойства на точковите оценки

За да има една оценка практическа стойност, тя трябва да притежава следните свойства.

1. Оценката на параметъра се нарича безпристрастна, ако нейното математическо очакване е равно на оценения параметър, т.е.

Ако равенството (22.1) не е изпълнено, тогава оценката може или да надценява стойността (M>), или да я подценява (M<) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.

2. Оценка на параметър се нарича последователна, ако се подчинява на закона за големите числа, т.е. се сближава по вероятност с оценения параметър с неограничено увеличение на броя на експериментите (наблюденията) и следователно е изпълнено следното равенство:

където > 0 е произволно малко число.

За да се изпълни (22.2), е достатъчно дисперсията на оценката да клони към нула, т.е.

и още повече, че оценителят е безпристрастен. Лесно се преминава от формула (22.3) към (22.2), ако използваме неравенството на Чебишев.

И така, последователността на оценката означава, че при достатъчно голям брой експерименти и с произволно висока сигурност, отклонението на оценката от истинската стойност на параметъра е по-малко от всяка предварително определена стойност. Това оправдава увеличаването на размера на извадката.

Тъй като е случайна променлива, чиято стойност се променя от извадка на извадка, тогава мярката на нейната дисперсия около математическото очакване ще се характеризира с дисперсията D. Нека и са две безпристрастни оценки на параметъра, т.е. M = и M = , съответно D и D и, ако D< D , то в качестве оценки принимают.

3. Безпристрастна оценка, която има най-малката дисперсия сред всички възможни безпристрастни оценки на параметри, изчислени от извадки от същия размер, се нарича ефективна оценка.

На практика, когато се оценяват параметрите, не винаги е възможно едновременно да се удовлетворят изисквания 1, 2, 3. Въпреки това, изборът на оценка винаги трябва да бъде предшестван от нейното критично разглеждане от всички гледни точки. При избора на практически методи за обработка на експериментални данни е необходимо да се ръководите от формулираните свойства на оценките.

Оценка на математическото очакване и дисперсията за извадката

Най-важните характеристики на случайната променлива са математическото очакване и дисперсията. Обмислете въпроса кои характеристики на извадката оценяват най-добре математическото очакване и дисперсията по отношение на безпристрастност, ефективност и последователност.

Теорема 23.1. Средната аритметична стойност, изчислена от n независими наблюдения върху случайна променлива, която има математическото очакване M = , е безпристрастна оценка на този параметър.

Доказателство.

Нека - n независими наблюдения върху случайна променлива. По условие M = , и тъй като са случайни променливи и имат същия закон на разпределение, тогава. По дефиниция средно аритметично

Помислете за математическото очакване на средното аритметично. Използвайки свойството на математическото очакване, имаме:

тези. . По силата на (22.1) е безпристрастна оценка. ?

Теорема 23.2 . Средната аритметична стойност, изчислена от n независими наблюдения върху случайна променлива, която има M = u, е последователна оценка на този параметър.

Доказателство.

Нека - n независими наблюдения върху случайна променлива. Тогава, по силата на теорема 23.1, имаме M = .

За средното аритметично записваме неравенството на Чебишев:

Използвайки дисперсионните свойства 4.5 и (23.1), имаме:

защото според теоремата.

Следователно,

И така, дисперсията на средноаритметичната стойност е n пъти по-малка от дисперсията на случайната променлива. Тогава

което означава, че това е последователна оценка.

Коментирайте : 1 . Приемаме без доказване резултат, който е много важен за практиката. Ако N (a,), тогава безпристрастната оценка на математическото очакване аима минимална дисперсия, равна на, следователно е ефективна оценка на параметъра a. ?

Нека да преминем към оценката за дисперсията и да я проверим за последователност и безпристрастност.

Теорема 23.3 . Ако една случайна извадка се състои от n независими наблюдения върху случайна променлива с

M = и D = , след това дисперсията на извадката

не е безпристрастна оценка на D - общата дисперсия.

Доказателство.

Нека - n независими наблюдения върху случайна променлива. Условно и за всички. Преобразуваме формулата (23.3) на дисперсията на извадката:


Нека опростим израза

Като се има предвид (23.1), откъдето

Споделете с приятели или запазете за себе си:

Зареждане...