Формула за дисперсия на екзогенни променливи. Изчисляване на групова, междугрупова и обща дисперсия (според правилото за добавяне на дисперсии)

Според извадковото проучване вложителите са групирани според размера на депозита в Сбербанк на града:

Определете:

1) диапазон на вариация;

2) среден размер на депозита;

3) средно линейно отклонение;

4) дисперсия;

5) средно стандартно отклонение;

6) коефициент на вариация на вноските.

Решение:

Тази серия на разпределение съдържа отворени интервали. В такива серии стойността на интервала от първата група условно се приема за равна на стойността на интервала от следващата, а стойността на интервала последна групаравен на интервала на предишния.

Стойността на интервала на втората група е 200, следователно стойността на първата група също е 200. Стойността на интервала на предпоследната група е 200, което означава, че последният интервал също ще има стойност, равна на 200.

1) Дефинирайте диапазона на вариация като разликата между най-голямата и най-малката стойност на атрибута:

Диапазонът на вариация на размера на вноската е 1000 рубли.

2) Средният размер на вноската се определя по формулата на средноаритметично претеглената стойност.

Да дефинираме предварително дискретно количествофункция във всеки интервал. За да направим това, използвайки простата формула за средна аритметична стойност, намираме средните точки на интервалите.

Средната стойност на първия интервал ще бъде равна на:

второто - 500 и т.н.

Нека поставим резултатите от изчисленията в таблицата:

Сума на депозита, разтривайте.Брой сътрудници, fСредата на интервала, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Обща сума 400 - 312000

Средният депозит в Сбербанк на града ще бъде 780 рубли:

3) Средното линейно отклонение е средноаритметичното на абсолютни отклоненияиндивидуални стойности на атрибута от общата средна стойност:

Процедурата за изчисляване на средното линейно отклонение в серията на интервално разпределение е следната:

1. Средната аритметична претеглена стойност се изчислява, както е показано в параграф 2).

2. Определят се абсолютните отклонения на варианта от средната стойност:

3. Получените отклонения се умножават по честотите:

4. Сумата от претеглените отклонения се намира, без да се взема предвид знакът:

5. Сумата от претеглените отклонения се дели на сумата от честотите:

Удобно е да използвате таблицата с изчислени данни:

Сума на депозита, разтривайте.Брой сътрудници, fСредата на интервала, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Обща сума 400 - - - 81280

Средното линейно отклонение на размера на депозита на клиентите на Сбербанк е 203,2 рубли.

4) Дисперсията е средноаритметичната стойност на квадратите на отклоненията на всяка стойност на характеристиката от средната аритметична стойност.

Изчисляването на дисперсията в серията на интервалното разпределение се извършва по формулата:

Процедурата за изчисляване на дисперсията в този случай е следната:

1. Определете среднопретеглената аритметична стойност, както е показано в параграф 2).

2. Намерете отклонения от средната стойност:

3. Поставяне на квадрат на отклонението на всяка опция от средната стойност:

4. Умножете отклоненията на квадрат по тегла (честоти):

5. Обобщете получените произведения:

6. Получената сума се разделя на сумата от теглата (честотите):

Нека поставим изчисленията в таблица:

Сума на депозита, разтривайте.Брой сътрудници, fСредата на интервала, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Обща сума 400 - - - 23040000

.

Обратно, ако е неотрицателна а.е. функция, такава че , тогава има абсолютно непрекъсната вероятностна мярка за такава, която е нейната плътност.

    Промяна на мярката в интеграла на Лебег:

,

където е всяка функция на Борел, интегрируема по отношение на вероятностната мярка.

Дисперсия, видове и свойства на дисперсията Понятието дисперсия

Дисперсия в статистикатасе намира като стандартно отклонение на индивидуалните стойности на признака на квадрат от средното аритметично. В зависимост от първоначалните данни, тя се определя по формулите за проста и претеглена дисперсия:

1. проста вариация(за негрупирани данни) се изчислява по формулата:

2. Претеглена дисперсия (за серия от варианти):

където n - честота (фактор на повторяемост X)

Пример за намиране на дисперсията

Тази страница описва стандартен пример за намиране на дисперсията, можете също да разгледате други задачи за намирането й

Пример 1. Определяне на групова, средна за група, междугрупова и обща дисперсия

Пример 2. Намиране на дисперсията и коефициента на вариация в групираща таблица

Пример 3. Намиране на дисперсията в дискретна серия

Пример 4. Имаме следните данни за група от 20 задочни студенти. Необходимо е да се изгради интервална серия на разпределението на признака, да се изчисли средната стойност на признака и да се изследва неговата дисперсия

Нека изградим интервално групиране. Нека определим диапазона на интервала по формулата:

където X max е максималната стойност на групиращия признак; X min е минималната стойност на групиращия признак; n е броят на интервалите:

Приемаме n=5. Стъпката е: h \u003d (192 - 159) / 5 \u003d 6,6

Нека направим интервално групиране

За по-нататъшни изчисления ще изградим спомагателна таблица:

X "i - средата на интервала. (например средата на интервала 159 - 165,6 \u003d 162,3)

Средният растеж на учениците се определя по формулата на среднопретеглената аритметична стойност:

Определяме дисперсията по формулата:

Формулата може да се преобразува по следния начин:

От тази формула следва, че дисперсията е разликата между средната стойност на квадратите на опциите и квадрата и средната стойност.

Дисперсия във вариационни сериис равни интервали по метода на моментите може да се изчисли по следния начин, като се използва второто свойство на дисперсия (разделяне на всички опции на стойността на интервала). Дефиниция на дисперсия, изчислено по метода на моментите, по следната формула отнема по-малко време:

където i е стойността на интервала; A - условна нула, която е удобна за използване в средата на интервала с най-висока честота; m1 е квадратът на момента от първи ред; m2 - момент от втори ред

Дисперсия на характеристиките (ако в статистическата популация атрибутът се променя по такъв начин, че има само две взаимно изключващи се опции, тогава такава променливост се нарича алтернативна) може да се изчисли по формулата:

Замествайки в тази дисперсионна формула q = 1- p, получаваме:

Видове дисперсия

Обща дисперсияизмерва вариацията на даден признак в цялата популация като цяло под влиянието на всички фактори, които причиняват тази вариация. Тя е равна на средния квадрат на отклоненията на отделните стойности на атрибута x от общата средна стойност x и може да се определи като проста дисперсия или претеглена дисперсия.

Вътрешногрупова дисперсия характеризира случайна вариация, т.е. част от вариацията, която се дължи на влиянието на неотчетени фактори и не зависи от знака-фактор, лежащ в основата на групирането. Такава дисперсия е равна на средния квадрат на отклоненията на отделните стойности на характеристика в групата X от средната аритметична стойност на групата и може да се изчисли като проста дисперсия или като претеглена дисперсия.

По този начин, мерки за дисперсия в рамките на групатавариация на признак в група и се определя по формулата:

където xi - средна група; ni е броят на единиците в групата.

Например, вътрешногруповите отклонения, които трябва да бъдат определени в задачата за изследване на влиянието на квалификацията на работниците върху нивото на производителността на труда в цеха, показват отклонения в производството във всяка група, причинени от всички възможни фактори (техническо състояние на оборудването, наличие на инструменти и материали, възраст на работниците, интензивност на труда и др.), с изключение на разликите в квалификационната категория (в рамките на групата всички работници имат една и съща квалификация).

Средно отвътре групови отклоненияотразява случайната вариация, т.е. онази част от вариацията, която е възникнала под въздействието на всички други фактори, с изключение на групиращия фактор. Изчислява се по формулата:

Междугрупова дисперсияхарактеризира систематичната вариация на резултантния признак, която се дължи на влиянието на фактора на признака, лежащ в основата на групирането. Тя е равна на средния квадрат на отклоненията на груповите средни стойности от общата средна стойност. Междугруповата дисперсия се изчислява по формулата:

Диапазон на вариация (или диапазон на вариация) -е разликата между максималните и минималните стойности на функцията:

В нашия пример диапазонът на изменение на сменната продукция на работниците е: в първа бригада R=105-95=10 деца, във втора бригада R=125-75=50 деца. (5 пъти повече). Това предполага, че продукцията на 1-ва бригада е по-„стабилна“, но втората бригада има повече резерви за растеж на продукцията, т.к. ако всички работници достигнат максималната производителност за тази бригада, тя може да произведе 3 * 125 = 375 части, а в 1-ва бригада само 105 * 3 = 315 части.
Ако екстремните стойности на атрибута не са типични за популацията, тогава се използват квартилни или децилни диапазони. Квартилният диапазон RQ= Q3-Q1 обхваща 50% от населението, първият децилен диапазон RD1 = D9-D1 покрива 80% от данните, вторият децилен диапазон RD2= D8-D2 покрива 60%.
Недостатъкът на индикатора диапазон на вариацияе, но стойността му не отразява всички колебания на атрибута.
Най-простият обобщаващ показател, който отразява всички колебания на даден признак, е средно линейно отклонение, което е средноаритметичното на абсолютните отклонения на отделните опции от средната им стойност:

,
за групирани данни
,
където хi е стойността на атрибута в дискретна серия или средата на интервала в интервалното разпределение.
В горните формули разликите в числителя се вземат по модул, в противен случай, според свойството на средната аритметична стойност, числителят винаги ще бъде равен на нула. Следователно средното линейно отклонение в статистическата практика се използва рядко, само в случаите, когато сумирането на показатели без отчитане на знака има икономически смисъл. С негова помощ се анализират например съставът на служителите, рентабилността на производството, външнотърговският оборот.
Дисперсия на характеристикитее средният квадрат на отклоненията на варианта от средната им стойност:
проста вариация
,
претеглена дисперсия
.
Формулата за изчисляване на дисперсията може да бъде опростена:

По този начин дисперсията е равна на разликата между средната стойност на квадратите на варианта и квадрата на средната стойност на варианта на съвкупността:
.
Въпреки това, поради сумирането на квадратните отклонения, дисперсията дава изкривена представа за отклоненията, така че средната стойност се изчислява от нея. стандартно отклонение, което показва колко средно се отклоняват конкретните варианти на признака от средната им стойност. Изчислено чрез вземане на корен квадратен от дисперсията:
за негрупирани данни
,
за вариационна серия

как по-малка стойностдисперсия и стандартно отклонение, колкото по-хомогенна е популацията, толкова по-надеждна (типична) ще бъде средна стойност.
Средното линейно и средно квадратично отклонение са наименувани числа, т.е. изразени са в мерни единици на признака, идентични са по съдържание и близки по стойност.
броя абсолютни показателипрепоръчват се вариации с помощта на таблици.
Таблица 3 - Изчисляване на характеристиките на вариацията (на примера на периода на данните за смяната на продукцията на работните екипи)


Брой работници

Средата на интервала

Прогнозни стойности

Обща сума:

Средна производителност на смени на работниците:

Средно линейно отклонение:

Изходна дисперсия:

Стандартното отклонение на продукцията на отделните работници от средната продукция:
.

1 Изчисляване на дисперсията по метода на моментите

Изчисляването на отклоненията е свързано с тромави изчисления (особено ако се изрази средната стойност Голям бройс няколко знака след десетичната запетая). Изчисленията могат да бъдат опростени чрез използване на опростена формула и дисперсионни свойства.
Дисперсията има следните свойства:

  1. ако всички стойности на атрибута са намалени или увеличени с една и съща стойност A, тогава дисперсията няма да намалее от това:

,

, тогава или
Използвайки свойствата на дисперсията и първо намалявайки всички варианти на съвкупността със стойността A и след това разделяйки на стойността на интервала h, получаваме формула за изчисляване на дисперсията във вариационни серии с равни интервали начин на моменти:
,
където е дисперсията, изчислена по метода на моментите;
h е стойността на интервала на вариационната серия;
– нови (трансформирани) вариантни стойности;
A е постоянна стойност, която се използва като среда на интервала с най-висока честота; или вариантът с най-висока честота;
е квадратът на момента от първи ред;
е момент от втори ред.
Нека изчислим дисперсията по метода на моментите въз основа на данните за сменната продукция на работния екип.
Таблица 4 - Изчисляване на дисперсията по метода на моментите


Групи производствени работници, бр.

Брой работници

Средата на интервала

Прогнозни стойности

Процедура за изчисление:


  1. изчислете дисперсията:

2 Изчисляване на дисперсията на алтернативен признак

Сред знаците, изследвани от статистиката, има такива, които имат само две взаимно изключващи се значения. Това са алтернативни знаци. Дадени са им две количествени стойности, съответно: опции 1 и 0. Честотата на опции 1, която е означена с p, е делът на единиците, които имат тази характеристика. Разликата 1-p=q е честотата на опциите 0. Така,


xi

Средно аритметично на алтернативен признак
, тъй като p+q=1.

Дисперсия на характеристиките
, защото 1-p=q
По този начин дисперсията на алтернативен атрибут е равна на произведението от дела на единиците, които имат този атрибут, и дела на единиците, които нямат този атрибут.
Ако стойностите 1 и 0 са еднакво често срещани, т.е. p=q, дисперсията достига своя максимум pq=0,25.
Вариантната променлива се използва в извадкови проучвания, например качество на продукта.

3 Междугрупова дисперсия. Правило за добавяне на дисперсии

Дисперсията, за разлика от други характеристики на вариацията, е добавъчна величина. Тоест в съвкупността, която е разделена на групи според факторния критерий х , резултатна дисперсия гможе да се разложи на дисперсия във всяка група (вътре в групата) и дисперсия между групите (между групата). Тогава, наред с изследването на вариацията на признака в цялата популация като цяло, става възможно да се изследва вариацията във всяка група, както и между тези групи.

Обща дисперсияизмерва вариацията на черта привърху цялата съвкупност под влиянието на всички фактори, предизвикали тази вариация (отклонения). Тя е равна на средния квадрат на отклоненията на отделните стойности на признака приот общата средна стойност и може да се изчисли като проста или претеглена дисперсия.
Междугрупова дисперсияхарактеризира вариацията на ефективния признак при, породени от влиянието на знак-фактора хв основата на групирането. Той характеризира вариацията на груповите средни стойности и е равен на средния квадрат на отклоненията на груповите средни от общата средна стойност:
,
където е средноаритметичната стойност на i-та група;
– брой единици в i-та група (честота на i-та група);
- общ средно население.
Вътрешногрупова дисперсияотразява случайната вариация, т.е. тази част от вариацията, която е причинена от влиянието на неотчетени фактори и не зависи от фактора-атрибут, лежащ в основата на групирането. Характеризира вариацията на индивидуалните стойности спрямо груповите средни стойности, равна е на средния квадрат на отклоненията на индивидуалните стойности на чертата прив рамките на група от средната аритметична стойност на тази група (средна група) и се изчислява като проста или претеглена дисперсия за всяка група:
или ,
където е броят на единиците в групата.
Въз основа на вътрешногруповите дисперсии за всяка група е възможно да се определи общата средна стойност на дисперсиите в рамките на групата:
.
Връзката между трите дисперсии се нарича правила за добавяне на дисперсии, според която общата дисперсия е равна на сумата от междугруповата дисперсия и средната от вътрешногруповите дисперсии:

Пример. При изследване на влиянието на тарифната категория (квалификация) на работниците върху нивото на производителност на труда им бяха получени следните данни.
Таблица 5 - Разпределение на работниците по средночасова продукция.



п/п

Работници 4-та категория

Работници от 5-та категория

Тренирам
работник, бр.

Тренирам
работник, бр.

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

В този пример работниците са разделени на две групи според фактора х- квалификации, които се характеризират с техния ранг. Ефективният признак - производство - варира както под негово влияние (междугрупова вариация), така и поради други случайни фактори (вътрешногрупова вариация). Предизвикателството е да се измерят тези вариации, като се използват три вариации: обща, междугрупова и вътрегрупова. Емпиричният коефициент на детерминация показва съотношението на вариацията на получената характеристика припод влияние на факторен знак х. Останалата част от общата вариация припричинени от промени в други фактори.
В примера емпиричният коефициент на детерминация е:
или 66,7%,
Това означава, че 66,7% от изменението на производителността на труда на работниците се дължи на различията в квалификацията, а 33,3% се дължи на влиянието на други фактори.
Емпирична корелационна връзкапоказва плътността на връзката между групирането и ефективните характеристики. Изчислява се като корен квадратен от емпиричния коефициент на детерминация:

Емпиричното съотношение на корелация, както и , могат да приемат стойности от 0 до 1.
Ако няма връзка, тогава =0. В този случай =0, т.е. груповите средни са равни едно на друго и няма междугрупова вариация. Това означава, че групиращият признак - факторът не влияе върху формирането на общата вариация.
Ако връзката е функционална, тогава =1. В този случай дисперсията на груповите средни стойности е равна на общата дисперсия (), т.е. няма вътрешногрупова вариация. Това означава, че функцията за групиране напълно определя вариацията на получената характеристика, която се изследва.
Колкото по-близо е стойността корелационна връзкадо единство, толкова по-близо, по-близо до функционалната зависимост на връзката между признаците.
За качествена оценка на близостта на връзката между знаците се използват отношенията на Чадок.

В примера , което показва тясна връзка между производителността на работниците и тяхната квалификация.

Само тази характеристика обаче не е достатъчна за изследване случайна величина. Представете си двама стрелци, които стрелят по мишена. Единият стреля точно и улучва близо до центъра, а другият ... просто се забавлява и дори не се прицелва. Но смешното е, че средно аритметичнорезултатът ще бъде абсолютно същият като при първия стрелец! Тази ситуация условно се илюстрира със следните случайни променливи:

"Снайперското" математическо очакване е равно на , но за "интересния човек": - също е нула!

Следователно е необходимо да се определи количествено докъде разпръснатикуршуми (произволни стойности) спрямо центъра на целта ( математическо очакване). добре и разсейванепреведено от латински само като дисперсия .

Нека да видим как се дефинира това. числена характеристикана един от примерите от 1-ва част на урока:

Там открихме разочароващо математическо очакване на тази игра и сега трябва да изчислим нейната дисперсия, която означенопрез .

Нека да разберем колко далеч са "разпръснати" печалбите/загубите спрямо средната стойност. Очевидно за това трябва да изчислим различиямежду стойности на случайна променливаи тя математическо очакване:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Сега изглежда е необходимо да се обобщят резултатите, но този начин не е добър - поради причината, че трептенията вляво ще се компенсират взаимно с трептенията вдясно. Така например "аматьорският" стрелец (пример по-горе)разликите ще са , и когато се добавят, те ще дадат нула, така че няма да получим никаква оценка за разсейването на неговата стрелба.

За да избегнете това раздразнение, помислете модулиразлики, но по технически причини подходът се е утвърдил, когато те са повдигнати на квадрат. По-удобно е решението да се подреди в таблица:

И тук е необходимо да се изчисли среднопретеглена стойностстойността на квадратните отклонения. Какво е? Тяхно е очаквана стойност, което е мярката за разсейване:

определениедисперсия. Веднага става ясно от определението, че дисперсията не може да бъде отрицателна- вземете бележка за практика!

Нека си припомним как да намерим очакването. Умножете разликите на квадрат по съответните вероятности (Продължение на таблицата):
- образно казано, това е "теглителна сила",
и обобщете резултатите:

Не мислите ли, че на фона на печалбите резултатът се оказа твърде голям? Точно така - поставяхме на квадрат и за да се върнем към измерението на нашата игра, трябва да извлечем Корен квадратен. Тази стойност се нарича стандартно отклонение и означено гръцка буква"сигма":

Понякога това значение се нарича стандартно отклонение .

Какво е значението му? Ако се отклоним от математическото очакване наляво и надясно със стандартното отклонение:

– тогава най-вероятните стойности на случайната променлива ще бъдат „концентрирани“ в този интервал. Какво всъщност виждаме:

Но така се случи, че при анализа на разсейването почти винаги се работи с концепцията за дисперсия. Нека да видим какво означава това във връзка с игрите. Ако при стрелците говорим за "точност" на попаденията спрямо центъра на мишената, то тук дисперсията характеризира две неща:

Първо, очевидно е, че с увеличаването на ставките дисперсията също се увеличава. Така например, ако увеличим 10 пъти, тогава математическото очакване ще се увеличи 10 пъти, а дисперсията ще се увеличи 100 пъти (щом е квадратична стойност). Но имайте предвид, че правилата на играта не са се променили! Само ставките се промениха, грубо казано, преди залагахме 10 рубли, сега 100.

Вторият, по-интересен момент е, че дисперсията характеризира стила на игра. Мислено фиксирайте ставките на играта на някакво определено нивои вижте какво има тук:

Игра с ниска вариация е предпазлива игра. Играчът е склонен да избира най-надеждните схеми, при които не губи/печели твърде много наведнъж. Например системата червено/черно в рулетката (вижте Пример 4 от статията случайни променливи) .

Игра с висока вариация. Тя често се нарича дисперсияигра. Това е приключенски или агресивен стил на игра, при който играчът избира "адреналинови" схеми. Да си спомним поне "Мартингейл", в която заложените суми са с порядъци по-големи от „тихата“ игра от предходния параграф.

Ситуацията в покера е показателна: има т.нар стегнатииграчи, които са склонни да бъдат предпазливи и да "разклащат" средствата си за игра (банкрол). Не е изненадващо, че банкролът им не се колебае много (ниска вариация). Обратно, ако даден играч има висока вариация, тогава той е агресорът. Той често поема рискове, прави големи залози и може както да разбие огромна банка, така и да се разпадне.

Същото се случва във Форекс и т.н. - има много примери.

Освен това във всички случаи няма значение дали играта е за стотинка или за хиляди долари. Всяко ниво има играчи с ниска и висока вариация. Е, за средната победа, както си спомняме, "отговорен" очаквана стойност.

Вероятно сте забелязали, че намирането на дисперсията е дълъг и труден процес. Но математиката е щедра:

Формула за намиране на дисперсията

Тази формула се извлича директно от определението за дисперсия и ние веднага я пускаме в обращение. Ще копирам табелата с нашата игра отгоре:

и намереното очакване .

Изчисляваме дисперсията по втория начин. Първо, нека намерим математическото очакване - квадратът на случайната променлива. от дефиниция на математическото очакване:

В такъв случай:

Така, според формулата:

Както се казва, усетете разликата. И на практика, разбира се, е по-добре да се прилага формулата (освен ако условието не изисква друго).

Ние владеем техниката на решаване и проектиране:

Пример 6

Намерете неговото математическо очакване, дисперсия и стандартно отклонение.

Тази задача се среща навсякъде и като правило остава без смислен смисъл.
Можете да си представите няколко крушки с цифри, които светят в лудница с определени вероятности :)

Решение: Удобно е основните изчисления да се обобщят в таблица. Първо записваме първоначалните данни в горните два реда. След това изчисляваме продуктите, след това и накрая сумите в дясната колона:

Всъщност почти всичко е готово. В третия ред беше начертано готово математическо очакване: .

Дисперсията се изчислява по формулата:

И накрая, стандартното отклонение:
- лично аз обикновено закръглявам до 2 знака след десетичната запетая.

Всички изчисления могат да се извършват на калкулатор, а още по-добре - в Excel:

Тук е трудно да сбъркаш :)

Отговор:

Тези, които желаят, могат да опростят живота си още повече и да се възползват от моите калкулатор (демонстрация), който не само моментално решава този проблем, но и изгражда тематична графика (Ела скоро). Програмата може изтеглете в библиотеката– ако сте изтеглили поне един учебен материалили да получите друг начин. Благодаря за подкрепата на проекта!

Няколко задачи за самостоятелно решение:

Пример 7

Изчислете дисперсията на случайната променлива от предишния пример по дефиниция.

И подобен пример:

Пример 8

Дискретна случайна променлива се дава от собствен закон за разпределение:

Да, стойностите на случайната променлива могат да бъдат доста големи (пример от реална работа), а тук по възможност използвайте Excel. Както, между другото, в пример 7 - той е по-бърз, по-надежден и по-приятен.

Решения и отговори в долната част на страницата.

В заключение на втората част на урока ще анализираме още една типична задача, дори може да се каже малък ребус:

Пример 9

Дискретна случайна променлива може да приема само две стойности: и , и . Известни са вероятността, математическото очакване и дисперсията.

Решение: Да започнем с неизвестна вероятност. Тъй като една случайна променлива може да приеме само две стойности, тогава сумата от вероятностите на съответните събития:

и тъй като , тогава .

Остава да намерим ..., лесно да се каже :) Но добре, започна се. По дефиниция на математическото очакване:
- заменете известните стойности:

- и нищо повече не може да се изтръгне от това уравнение, освен че можете да го пренапишете в обичайната посока:

или:

За по-нататъшните действия, мисля, че можете да се досетите. Нека създадем и решим системата:

Десетични знаци- това, разбира се, е пълно безобразие; умножете двете уравнения по 10:

и разделете на 2:

Така е много по-добре. От първото уравнение изразяваме:
(това е по-лесният начин)- заместител във второто уравнение:


Ние строим на квадрати направете опростявания:

Умножаваме по:

Като резултат, квадратно уравнение, намерете неговия дискриминант:
- перфектно!

и получаваме две решения:

1) ако , тогава ;

2) ако , тогава .

Първата двойка стойности удовлетворява условието. С голяма вероятност всичко е правилно, но въпреки това записваме закона за разпределение:

и извършете проверка, а именно намерете очакването:

Теорията на вероятностите е специален клон на математиката, който се изучава само от студенти от висши учебни заведения. Обичате ли изчисления и формули? Не се ли страхувате от перспективите за запознаване с нормалното разпределение, ентропията на ансамбъла, математическото очакване и дисперсията на дискретна случайна променлива? Тогава тази тема ще бъде от голям интерес за вас. Нека се запознаем с някои от най-важните основни понятия на този раздел от науката.

Нека си припомним основите

Дори ако си спомняте най-простите концепции на теорията на вероятностите, не пренебрегвайте първите параграфи на статията. Факт е, че без ясно разбиране на основите, няма да можете да работите с формулите, разгледани по-долу.

И така, има някакво случайно събитие, някакъв експеримент. В резултат на извършените действия можем да получим няколко резултата – някои от тях са по-чести, други по-рядко срещани. Вероятността за събитие е съотношението на броя на действително получените резултати от един тип към общ бройвъзможен. Само знаейки класическо определениена тази концепция можете да започнете да изучавате математическото очакване и дисперсията на непрекъснати случайни променливи.

Средно аритметично

Още в училище, в часовете по математика, сте започнали да работите със средно аритметично. Тази концепция се използва широко в теорията на вероятностите и следователно не може да бъде пренебрегната. Основното за нас в момента е, че ще го срещнем във формулите за математическото очакване и дисперсията на случайна величина.

Имаме поредица от числа и искаме да намерим средното аритметично. Всичко, което се изисква от нас, е да сумираме всичко налично и да разделим на броя на елементите в редицата. Нека имаме числа от 1 до 9. Сумата на елементите ще бъде 45 и ще разделим тази стойност на 9. Отговор: - 5.

дисперсия

От научна гледна точка дисперсията е средният квадрат на отклоненията на получените стойности на характеристиките от средната аритметична стойност. Единият се обозначава с главна латинска буква D. Какво е необходимо за изчисляването му? За всеки елемент от редицата изчисляваме разликата между наличното число и средното аритметично и го повдигаме на квадрат. Ще има точно толкова стойности, колкото могат да бъдат резултатите за събитието, което обмисляме. След това обобщаваме всичко получено и разделяме на броя на елементите в последователността. Ако имаме пет възможни резултата, тогава разделете на пет.

Дисперсията също има свойства, които трябва да запомните, за да я приложите при решаване на задачи. Например, ако случайната променлива се увеличи с X пъти, дисперсията се увеличава с X пъти квадрата (т.е. X*X). Той никога не е по-малък от нула и не зависи от изместване на стойности с еднаква стойност нагоре или надолу. Освен това за независими тестоведисперсията на сумата е равна на сумата от дисперсиите.

Сега определено трябва да разгледаме примери за дисперсията на дискретна случайна променлива и математическото очакване.

Да кажем, че провеждаме 21 експеримента и получаваме 7 различни резултата. Наблюдавахме всеки от тях съответно 1,2,2,3,4,4 и 5 пъти. Каква ще бъде дисперсията?

Първо изчисляваме средното аритметично: сборът на елементите, разбира се, е 21. Разделяме го на 7, получавайки 3. Сега изваждаме 3 от всяко число в оригиналната последователност, поставяме на квадрат всяка стойност и събираме резултатите заедно . Оказва се 12. Сега остава да разделим числото на броя на елементите и, изглежда, това е всичко. Но има една уловка! Нека го обсъдим.

Зависимост от броя на експериментите

Оказва се, че при изчисляване на дисперсията знаменателят може да бъде едно от две числа: N или N-1. Тук N е броят на извършените експерименти или броят на елементите в последователността (което по същество е едно и също нещо). От какво зависи?

Ако броят на тестовете се измерва в стотици, тогава в знаменателя трябва да поставим N. Ако в единици, тогава N-1. Учените решиха да начертаят границата съвсем символично: днес тя минава по числото 30. Ако сме провели по-малко от 30 експеримента, тогава ще разделим количеството на N-1, а ако е повече, тогава на N.

Задача

Нека се върнем към нашия пример за решаване на проблема с дисперсията и очакването. Имаме междинно число 12, което трябваше да бъде разделено на N или N-1. Тъй като проведохме 21 експеримента, което е по-малко от 30, ще изберем втория вариант. Така че отговорът е: дисперсията е 12/2 = 2.

Очаквана стойност

Нека да преминем към втората концепция, която трябва да разгледаме в тази статия. Математическото очакване е резултат от събиране на всички възможни резултати, умножени по съответните вероятности. Важно е да се разбере, че получената стойност, както и резултатът от изчисляването на дисперсията, се получават само веднъж за цялата задача, без значение колко резултата разглежда.

Формулата за математическо очакване е доста проста: вземаме резултата, умножаваме го по неговата вероятност, добавяме същото за втория, третия резултат и т.н. Всичко, свързано с тази концепция, е лесно за изчисляване. Например сумата от математическите очаквания е равна на математическото очакване на сумата. Същото важи и за работата. Не всяка величина в теорията на вероятностите позволява извършването на такива прости операции. Нека вземем една задача и изчислим стойността на две понятия, които сме изучавали едновременно. Освен това бяхме разсеяни от теория - време е за практика.

Още един пример

Проведохме 50 опита и получихме 10 вида резултати - числа от 0 до 9 - появяващи се в различни проценти. Това са съответно: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Припомнете си, че за да получите вероятностите, трябва да разделите процентните стойности на 100. Така получаваме 0,02; 0,1 и т.н. Нека представим пример за решаване на задачата за дисперсията на случайна променлива и математическото очакване.

Изчисляваме средното аритметично по формулата, която помним от началното училище: 50/10 = 5.

Сега нека преведем вероятностите в броя на резултатите "на парчета", за да направим по-удобно броенето. Получаваме 1, 5, 2, 7, 1, 9, 3, 8, 5 и 9. От всяка получена стойност изваждаме средноаритметичното, след което всеки от получените резултати повдигаме на квадрат. Вижте как да направите това с първия елемент като пример: 1 - 5 = (-4). Освен това: (-4) * (-4) = 16. За други стойности направете тези операции сами. Ако сте направили всичко правилно, след като добавите всичко, получавате 90.

Нека продължим да изчисляваме дисперсията и средната стойност, като разделим 90 на N. Защо избираме N, а не N-1? Точно така, защото броят на извършените експерименти надхвърля 30. И така: 90/10 = 9. Получихме дисперсията. Ако получите различен номер, не се отчайвайте. Най-вероятно сте направили банална грешка в изчисленията. Проверете отново какво сте написали и със сигурност всичко ще си дойде на мястото.

И накрая, нека си припомним формулата за математическо очакване. Няма да даваме всички изчисления, а само ще напишем отговора, с който можете да проверите, след като изпълните всички необходими процедури. Очакваната стойност ще бъде 5,48. Припомняме само как да извършваме операции, като използваме примера на първите елементи: 0 * 0,02 + 1 * 0,1 ... и така нататък. Както можете да видите, ние просто умножаваме стойността на резултата по неговата вероятност.

отклонение

Друга концепция, тясно свързана с дисперсията и математическото очакване, е стандартното отклонение. Отбелязва се или с латински букви sd или гръцка малка буква "сигма". Тази концепция показва как средно стойностите се отклоняват от централната характеристика. За да намерите стойността му, трябва да изчислите корен квадратен от дисперсията.

Ако направите графика нормална дистрибуцияи искате да видите квадратното отклонение директно върху него, това може да стане в няколко стъпки. Вземете половината от изображението отляво или отдясно на режима (централна стойност), начертайте перпендикуляр на хоризонталната ос, така че площите на получените фигури да са равни. Стойността на сегмента между средата на разпределението и получената проекция върху хоризонталната ос ще бъде стандартното отклонение.

Софтуер

Както се вижда от описанията на формулите и представените примери, изчисляването на дисперсията и математическото очакване не е най-лесната процедура от аритметична гледна точка. За да не губите време, има смисъл да използвате програмата, използвана в по-високите образователни институции- нарича се "R". Той има функции, които ви позволяват да изчислявате стойности за много понятия от статистиката и теорията на вероятностите.

Например дефинирате вектор от стойности. Това става по следния начин: вектор<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Накрая

Дисперсията и математическото очакване са тези, без които е трудно да се изчисли нещо в бъдещето. В основния курс на лекциите в университетите те се разглеждат още в първите месеци на изучаване на предмета. Именно поради неразбирането на тези прости понятия и невъзможността да ги изчислят, много студенти веднага започват да изостават в програмата и по-късно получават слаби оценки в сесията, което ги лишава от стипендии.

Практикувайте поне една седмица по половин час на ден, като решавате задачи, подобни на представените в тази статия. След това, на всеки тест по теория на вероятностите, ще се справите с примери без странични съвети и измамни листове.

Споделете с приятели или запазете за себе си:

Зареждане...