Биномиално разпределение. Биномиално разпределение: определение, формула, примери


Разбира се, когато изчислявате функцията на кумулативното разпределение, трябва да използвате споменатата връзка между биномното и бета разпределението. Този метод очевидно е по-добър от директното сумиране, когато n > 10.

В класическите учебници по статистика, за да се получат стойностите на биномното разпределение, често се препоръчва използването на формули, базирани на гранични теореми (като формулата на Moivre-Laplace). трябва да бъде отбелязано че от чисто изчислителна гледна точкастойността на тези теореми е близка до нула, особено сега, когато почти всяко бюро има мощен компютър. Основният недостатък на горните приближения е тяхната напълно недостатъчна точност за стойности на n, характерни за повечето приложения. Не по-малък недостатък е липсата на ясни препоръки относно приложимостта на това или онова приближение (стандартните текстове предоставят само асимптотични формулировки; те не са придружени от оценки на точността и следователно са малко полезни). Бих казал, че и двете формули са подходящи само за n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Тук не разглеждам проблема с намирането на квантили: за дискретни разпределения той е тривиален, а в тези проблеми, при които възникват такива разпределения, той по правило не е уместен. Ако все още са необходими квантили, препоръчвам да преформулирате проблема по такъв начин, че да работите с p-стойности (наблюдавани значимости). Ето един пример: когато прилагате някои груби алгоритми, на всяка стъпка трябва да проверявате статистическа хипотезаза биномна случайна променлива. Според класическия подход на всяка стъпка е необходимо да се изчисли критериалната статистика и да се сравни нейната стойност с границата на критичното множество. Тъй като обаче алгоритъмът е изчерпателен, е необходимо всеки път да се определя границата на критичния набор (в края на краищата размерът на извадката се променя от стъпка на стъпка), което непродуктивно увеличава разходите за време. Съвременният подход препоръчва изчисляване на наблюдаваната значимост и сравняването й с вероятност за доверие, спестявайки търсенето на квантили.

Следователно в кодовете по-долу няма изчисление на обратната функция; вместо това е дадена функцията rev_binomialDF, която изчислява вероятността p за успех в отделно изпитание при дадения брой n изпитания, броя m на успехите в тях и стойността y на вероятността за постигане на тези m успеха. Това използва гореспоменатата връзка между биномното и бета разпределението.

Всъщност тази функция ви позволява да получите границите на доверителните интервали. Наистина, да предположим, че в n биномни опити имаме m успеха. Както е известно, лявата граница е двустранна доверителен интервалза параметър p с ниво на достоверност е равно на 0, ако m = 0, и за е решение на уравнението . По същия начин, дясната граница е 1, ако m = n, и за е решение на уравнението . От това следва, че за да намерим лявата граница, трябва да решим относителното уравнение , а да намерим правилното – уравнението . Те се решават във функциите binom_leftCI и binom_rightCI, които връщат съответно горната и долната граница на двустранния доверителен интервал.

Бих искал да отбележа, че ако не се нуждаете от абсолютно невероятна точност, тогава за достатъчно голямо n можете да използвате следното приближение [B.L. Ван дер Ваерден, Математическа статистика. M: IL, 1960, гл. 2, раздел 7]: , където g – квантил нормална дистрибуция. Стойността на това приближение е, че има много прости приближения, които ви позволяват да изчислите квантили на нормално разпределение (вижте текста за изчисляване на нормалното разпределение и съответния раздел на този справочник). В моята практика (основно с n > 100) това приближение даде приблизително 3-4 цифри, което като правило е напълно достатъчно.

За да изчислите с помощта на следните кодове, ще ви трябват файловете betaDF.h, betaDF.cpp (вижте раздела за бета разпространение), както и logGamma.h, logGamma.cpp (вижте Приложение A). Можете също така да видите пример за използване на функциите.

Файл binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" двоен биномDF(двойни опити, двойни успехи, двойно p); /* * Нека има "изпитания" на независими наблюдения * с вероятност "p" за успех във всяко. * Изчислете вероятността B(successes|trials,p), че броят на * успехите е между 0 и "successes" (включително). */ double rev_binomialDF(двойни опити, двойни успехи, двойно y); /* * Нека е известна вероятността y за най-малко m успеха * в опити, тестващи схемата на Бернули. Функцията намира вероятността p* за успех в индивидуален опит. * * При изчисленията се използва следната връзка * * 1 - p = rev_Beta(проби-успехи| успехи+1, y). */ double binom_leftCI(двойни опити, двойни успехи, двойно ниво); /* Нека има "изпитания" на независими наблюдения * с вероятност "p" за успех във всяко * и броя на успехите, равен на "успехите". * Лявата граница на двустранния доверителен интервал се изчислява * с нивото на значимост. */ double binom_rightCI(double n, двойни успехи, двойно ниво); /* Нека има "изпитания" на независими наблюдения * с вероятност "p" за успех във всяко * и броя на успехите, равен на "успехите". * Дясната граница на двустранния доверителен интервал се изчислява * с нивото на значимост. */ #endif /* Завършва #ifndef __BINOMIAL_H__ */

Файл binomialDF.cpp

/***********************************************************/ /* Биномиално разпределение*/ /************************************************ ******* ************/ #включи #включи #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * Нека има "n" независими наблюдения * с вероятност "p" за успех във всяко. * Вероятността B(m|n,p) се изчислява, че броят на успехите е * между 0 и „m“ (включително), т.е. * сума от биномни вероятности от 0 до m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Изчисленията не предполагат грубо сумиране - * използва се следната връзка с централното бета разпределение: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Аргументите трябва да са положителни, с 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) връщане 1; иначе връща BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Нека вероятността y за най-малко m успеха се случи * в n опита на схемата на Бернули. Функцията намира вероятността p* за успех в индивидуален опит. * * При изчисленията се използва следната връзка * * 1 - p = rev_Beta(y|n-m,m+1). */ ( assert((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Вероятностни разпределения на дискретни случайни променливи. Биномиално разпределение. Поасоново разпределение. Геометрично разпределение. Генерираща функция.

6. Вероятностни разпределения на дискретни случайни променливи

6.1. Биномиално разпределение

Нека се произвежда ннезависими изпитания, във всяко от които събитието АМоже да се появи или да не се появи. Вероятност стрнастъпване на събитие Авъв всички тестове е постоянен и не се променя от тест на тест. Разгледайте като случайна променлива X броя на случванията на събитието Ав тези тестове. Формула за намиране на вероятността за възникване на събитие Агладка кведнъж на всеки нтестовете, както е известно, са описани Формула на Бернули

Вероятностното разпределение, определено от формулата на Бернули, се нарича бином .

Този закон се нарича "бином", защото дясната страна може да се разглежда като общ термин в разширяването на бинома на Нютон

Нека напишем биномния закон под формата на таблица

стр н

н.п. н –1 р

р н

Нека намерим числените характеристики на това разпределение.

А-приори математическо очакванеза DSV имаме

.

Нека запишем равенството, което е двоичен код на Нютон

.

и го разграничете по отношение на p. В резултат на това получаваме

.

Умножете лявата и дясната страна по стр:

.

Като се има предвид това стр+ р=1, имаме

(6.2)

Така, математическо очакване на броя на събитията вн независими тестоверавно на произведението на броя опитинна вероятносттастрнастъпване на събитие във всеки опит.

Нека изчислим дисперсията с помощта на формулата

.

За това ще намерим

.

Нека първо диференцираме биномната формула на Нютон два пъти по отношение на стр:

и умножете двете страни на равенството по стр 2:

следователно

И така, дисперсията на биномното разпределение е

. (6.3)

Тези резултати могат да бъдат получени и чрез чисто качествено разсъждение. Общият брой X на появявания на събитие A във всички опити е сумата от броя на появявания на събитието в отделни опити. Следователно, ако X 1 е броят на случванията на събитието в първия опит, X 2 – във втория и т.н., тогава общ бройслучаите на събитие A във всички опити е равно на X=X 1 +X 2 +…+X н. Според свойството на математическото очакване:

Всеки от членовете от дясната страна на равенството е математическото очакване на броя на събитията в едно изпитание, което е равно на вероятността на събитието. По този начин,

Според свойството на дисперсия:

Тъй като , и математическото очакване на случайна променлива , което може да приема само две стойности, а именно 1 2 с вероятност стри 0 2 с вероятност р, Че
. По този начин,
В резултат на това получаваме

Използвайки концепцията за начален и централен момент, можем да получим формули за асиметрия и ексцес:

. (6.4)

Ориз. 6.1

Многоъгълникът на биномното разпределение има следната форма (виж фиг. 6.1). ВероятностP н (к) първо нараства с увеличаване к, достига най-висока стойности след това започва да намалява. Биномиалното разпределение е изкривено с изключение на случая стр=0,5. Имайте предвид, че когато голямо числотестове нБиномното разпределение е много близко до нормалното. (Обосновката за това предложение е свързана с локалната теорема на Moivre-Laplace.)

Номерм 0 настъпването на събитие се наричанай-вероятно , ако вероятността дадено събитие да се случи определен брой пъти в тази поредица от тестове е най-голяма (максимум в полигона на разпределение). За биномно разпределение

Коментирайте. Това неравенство може да се докаже с помощта на рекурентната формула за биномни вероятности:

(6.6)

Пример 6.1.Делът на първокласните продукти в това предприятие е 31%. Какви са математическото очакване и дисперсията, както и най-вероятният брой премиум продукти в произволно избрана партида от 75 продукта?

Решение. Тъй като стр=0,31, р=0,69, н=75, тогава

М[ х] = н.п.= 750,31 = 23,25; Д[ х] = npq = 750,310,69 = 16,04.

За да намерите най-вероятното число м 0, нека създадем двойно неравенство

Следва, че м 0 = 23.

Глава 7.

Специфични закони на разпределение на случайни величини

Видове закони на разпределение на дискретни случайни величини

Нека дискретно произволна стойностможе да приема стойности х 1 , х 2 , …, x n,…. Вероятностите на тези стойности могат да бъдат изчислени с помощта на различни формули, например с помощта на основните теореми на теорията на вероятностите, формулата на Бернули или някои други формули. За някои от тези формули законът за разпределение има собствено име.

Най-често срещаните закони за разпределение на дискретна случайна променлива са биномиален, геометричен, хипергеометричен и закон на разпределение на Поасон.

Биномен закон на разпределение

Нека се произвежда ннезависими изпитания, във всяко от които събитието може да се появи или да не се появи А. Вероятността това събитие да се случи във всеки отделен опит е постоянна, не зависи от номера на опита и е равна на Р=Р(А). Оттук и вероятността събитието да не се случи Авъв всеки тест също е постоянен и равен р=1–Р. Помислете за случайната променлива хравен на броя повторения на събитието А V нтестове. Очевидно стойностите на това количество са равни

х 1 =0 – събитие А V нтестове не се появиха;

х 2 =1 – събитие А V няви се веднъж в опити;

х 3 =2 – събитие А V нтестове се появиха два пъти;

…………………………………………………………..

x n +1 = н- събитие А V нвсичко се появи по време на тестовете нведнъж.

Вероятностите на тези стойности могат да бъдат изчислени с помощта на формулата на Бернули (4.1):

Където Да се=0, 1, 2, …,н .

Биномен закон на разпределение х, равен на броя на успехите в нТестове на Бернули, с вероятност за успех Р.

И така, дискретна случайна променлива има биномиално разпределение (или се разпределя според биномиалния закон), ако нейните възможни стойности са 0, 1, 2, ..., н, а съответните вероятности се изчисляват с помощта на формула (7.1).

Биномното разпределение зависи от две параметри РИ н.

Серията на разпределение на случайна променлива, разпределена според биномиалния закон, има формата:

х к н
Р

Пример 7.1 . Произвеждат се три независими изстрела по целта. Вероятността за уцелване на всеки удар е 0,4. Случайна стойност х– брой попадения в целта. Конструирайте неговите разпределителни серии.

Решение. Възможни стойности на случайна променлива хса х 1 =0; х 2 =1; х 3 =2; х 4 =3. Нека намерим съответните вероятности, използвайки формулата на Бернули. Не е трудно да се покаже, че използването на тази формула тук е напълно оправдано. Имайте предвид, че вероятността да не уцелите целта с един изстрел ще бъде равна на 1-0,4=0,6. Получаваме

Серията на разпространение има следната форма:

х
Р 0,216 0,432 0,288 0,064

Лесно е да се провери, че сумата от всички вероятности е равна на 1. Самата случайна променлива хразпределени по биномния закон. ■

Нека намерим математическото очакване и дисперсията на случайна променлива, разпределена според биномния закон.

При решаването на пример 6.5 беше показано, че математическото очакване на броя на случванията на събитието А V ннезависими изпитвания, ако вероятността от възникване Авъв всеки тест е постоянен и равен Р, равно на н· Р

Този пример използва случайна променлива, разпределена според биномния закон. Следователно решението на Пример 6.5 по същество е доказателство на следната теорема.

Теорема 7.1.Математическото очакване на дискретна случайна променлива, разпределена според биномния закон, е равно на произведението от броя опити и вероятността за „успех“, т.е. М(х)=н· Р.

Теорема 7.2.Дисперсията на дискретна случайна променлива, разпределена според биномиалния закон, е равна на произведението на броя опити с вероятността за „успех“ и вероятността за „неуспех“, т.е. д(х)=nрq.

Асиметрията и ексцесът на случайна променлива, разпределена по биномния закон, се определят от формулите

Тези формули могат да бъдат получени с помощта на концепцията за начален и централен момент.

Законът за биномно разпределение е в основата на много ситуации от реалния живот. За големи стойности нБиномиалното разпределение може да бъде приблизително изчислено с помощта на други разпределения, по-специално разпределението на Поасон.

Поасоново разпределение

Нека има нТестове на Бернули, с броя на тестовете ндостатъчно голям. По-рано беше показано, че в този случай (ако освен това вероятността Рсъбития Амного малка), за да намерите вероятността събитието Ада се появи TВеднъж в тестовете можете да използвате формулата на Поасон (4.9). Ако случайната променлива хозначава броя на повторенията на събитието А V нТестове на Бернули, тогава вероятността, че хще вземе стойността кможе да се изчисли с помощта на формулата

, (7.2)

Където λ = нр.

Закон за разпределение на Поасонсе нарича разпределение на дискретна случайна променлива х, за които възможните стойности са неотрицателни цели числа, и вероятностите r tтези стойности се намират с помощта на формула (7.2).

величина λ = нрНаречен параметърПоасонови разпределения.

Случайна променлива, разпределена според закона на Поасон, може да приеме безкраен брой стойности. Тъй като за това разпределение вероятността РПоявата на събитие във всеки опит е малка, тогава това разпределение понякога се нарича закон на редките събития.

Серията на разпределение на случайна променлива, разпределена според закона на Поасон, има формата

х T
Р

Лесно е да се провери, че сумата от вероятностите на втория ред е равна на 1. За да направите това, трябва да запомните, че функцията може да бъде разширена в серия на Maclaurin, която се сближава за всеки х. В този случай имаме

. (7.3)

Както беше отбелязано, законът на Поасон замества биномния закон в някои ограничаващи случаи. Пример за това е случайната променлива х, чиито стойности са равни на броя на повреди за определен период от време при многократно използване на техническо средство. Предполага се, че това е високо надеждно устройство, т.е. Вероятността за неуспех в едно приложение е много малка.

В допълнение към такива ограничаващи случаи, на практика има случайни променливи, разпределени съгласно закона на Поасон, които не са свързани с биномното разпределение. Например, разпределението на Поасон често се използва, когато се работи с броя на събитията, настъпили за период от време (броя на обажданията, получени на телефонна централа за един час, броя на колите, пристигащи на автомивка за един ден, брой спирания на машината на седмица и т.н.). Всички тези събития трябва да образуват така наречения поток от събития, който е едно от основните понятия на теорията опашка. Параметър λ характеризира средната интензивност на потока от събития.

В тази и следващите няколко публикации ще разгледаме математически модели на случайни събития. Математически модел- Това математически израз, представляваща случайна променлива. За дискретни случайни променливи този математически израз е известен като функция на разпределение.

Ако проблемът ви позволява изрично да напишете математически израз, представляващ случайна променлива, можете да изчислите точната вероятност за всяка от нейните стойности. В този случай можете да изчислите и изброите всички стойности на функцията на разпределение. Различни разпределения на случайни променливи се срещат в бизнес, социологически и медицински приложения. Едно от най-полезните разпределения е биномното.

Биномиално разпределениеизползвани за симулиране на ситуации, характеризиращи се със следните характеристики.

  • Пробата се състои от фиксиран брой елементи н, представящи резултатите от определен тест.
  • Всеки примерен елемент принадлежи към една от двете взаимно изключващи се категории, които изчерпват цялото пространство на примера. Обикновено тези две категории се наричат ​​успех и провал.
  • Вероятност за успех Ре постоянен. Следователно вероятността от провал е 1 – стр.
  • Резултатът (т.е. успех или неуспех) на който и да е опит не зависи от резултата на друг опит. За да се осигури независимост на резултатите, елементите на извадката обикновено се получават с помощта на два различни метода. Всеки примерен елемент се изтегля на случаен принцип от безкрайност населениебез връщане или от ограничена популация с връщане.

Изтеглете бележката в или формат, примери във формат

Биномното разпределение се използва за оценка на броя на успехите в извадка, състояща се от ннаблюдения. Да вземем за пример поръчването. За да направят поръчка, клиентите на Saxon Company могат да използват интерактивния електронен формуляр и да го изпратят на компанията. След това информационната система проверява за грешки, непълна или невярна информация в поръчките. Всяка въпросна поръчка се маркира и се включва в ежедневния отчет за изключения. Данните, събрани от компанията, показват, че вероятността за грешки в поръчките е 0,1. Една компания би искала да знае каква е вероятността да открие определен брой грешни поръчки в дадена извадка. Да предположим например, че клиентите са завършили четири електронни форми. Каква е вероятността всички поръчки да бъдат без грешки? Как да изчислим тази вероятност? Под успех ще разбираме грешка при попълване на формуляра, а всички останали резултати ще се считат за неуспешни. Спомнете си, че се интересуваме от броя на грешните поръчки в дадена извадка.

Какви резултати можем да видим? Ако извадката се състои от четири поръчки, една, две, три или и четирите може да са неправилни и всичките може да са правилни. Може ли произволна променлива, описваща броя на неправилно попълнените формуляри, да приеме друга стойност? Това не е възможно, тъй като броят на неправилните формуляри не може да надвишава размера на извадката нили да бъде отрицателен. По този начин случайна променлива, която се подчинява на закона за биномно разпределение, приема стойности от 0 до н.

Да приемем, че в извадка от четири поръчки се наблюдават следните резултати:

Каква е вероятността да се намерят три грешни поръчки в извадка от четири поръчки в посочения ред? Тъй като предварителните изследвания показват, че вероятността за грешка при попълване на формуляра е 0,10, вероятностите за горните резултати се изчисляват, както следва:

Тъй като резултатите не зависят един от друг, вероятността за определената последователност от резултати е равна на: p*p*(1–p)*p = 0,1*0,1*0,9*0,1 = 0,0009. Ако трябва да изчислите броя на изборите х нелементи, трябва да използвате формулата за комбиниране (1):

където n! = n * (n –1) * (n – 2) * … * 2 * 1 - факториел на число н, и 0! = 1 и 1! = 1 по дефиниция.

Този израз често се нарича . Така, ако n = 4 и X = 3, броят на последователностите, състоящи се от три елемента, извлечени от размер на извадката 4, се определя по следната формула:

Следователно вероятността за откриване на три грешни поръчки се изчислява, както следва:

(Брой възможни последователности) *
(вероятност за определена последователност) = 4 * 0,0009 = 0,0036

По същия начин можете да изчислите вероятността сред четири поръчки да има една или две грешни, както и вероятността всички поръчки да са грешни или всички да са правилни. Въпреки това, с увеличаване на размера на извадката нопределянето на вероятността за определена последователност от резултати става по-трудно. В този случай подходящо математически модел, описващ биномиалното разпределение на броя на изборите хобекти от селекция, съдържаща нелементи.

Биномиално разпределение

Където P(X)- вероятност хуспех за даден размер на извадката ни вероятност за успех Р, х = 0, 1, … н.

Моля, обърнете внимание, че формула (2) е формализиране на интуитивни заключения. Случайна стойност х, което се подчинява на биномното разпределение, може да приеме произволно цяло число в диапазона от 0 до н. работа Рх(1 – p)нхпредставлява вероятността определена последователност да се състои от хуспех в размер на извадката, равен на н. Стойността определя броя на възможните комбинации, състоящи се от хуспех в нтестове. Следователно, за даден брой тестове ни вероятност за успех Рвероятност за последователност, състояща се от хуспех, равен

P(X) = (брой възможни последователности) * (вероятност за определена последователност) =

Нека разгледаме примери, илюстриращи приложението на формула (2).

1. Да приемем, че вероятността за неправилно попълване на формуляра е 0,1. Каква е вероятността от четири попълнени формуляра три да са неправилни? Използвайки формула (2), намираме, че вероятността за откриване на три грешни поръчки в извадка, състояща се от четири поръчки, е равна на

2. Да приемем, че вероятността за неправилно попълване на формуляра е 0,1. Каква е вероятността от четири попълнени формуляра поне три да са неправилни? Както е показано в предишния пример, вероятността от четири попълнени формуляра три да са неправилни е 0,0036. За да изчислите вероятността измежду четири попълнени формуляра поне три да са неправилни, трябва да добавите вероятността измежду четири попълнени формуляра три да са неправилни и вероятността измежду четири попълнени формуляра всички да са неправилни. Вероятността за второто събитие е

По този начин вероятността от четири попълнени формуляра поне три да са неправилни е равна на

P(X > 3) = P(X = 3) + P(X = 4) = 0,0036 + 0,0001 = 0,0037

3. Да приемем, че вероятността да попълните формуляра неправилно е 0,1. Каква е вероятността от четири попълнени формуляра по-малко от три да са неправилни? Вероятност за това събитие

P(X< 3) = P(X = 0) + P(X = 1) + P(X = 2)

Използвайки формула (2), изчисляваме всяка от тези вероятности:

Следователно, P(X< 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

Вероятност P(X< 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х>3. Тогава P(X< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

Тъй като размерът на извадката се увеличава низчисленията, подобни на тези, извършени в пример 3, стават трудни. За да се избегнат тези усложнения, много биномни вероятности са таблицирани предварително. Някои от тези вероятности са показани на фиг. 1. Например, за да получите вероятността, че х= 2 at н= 4 и стр= 0,1, трябва да извлечете от таблицата числото в пресечната точка на линията х= 2 и колони Р = 0,1.

Ориз. 1. Биномна вероятност при н = 4, х= 2 и Р = 0,1

Биномиалното разпределение може да се изчисли с помощта на Функции на Excel=BINOM.DIST() (фиг. 2), който има 4 параметъра: брой успехи – х, брой тестове (или размер на извадката) – н, вероятност за успех – Р, параметър интегрална, което приема стойност TRUE (в този случай се изчислява вероятността не по-малко хсъбития) или FALSE (в този случай се изчислява вероятността точно хсъбития).

Ориз. 2. Параметри на функцията =BINOM.DIST()

За горните три примера изчисленията са показани на фиг. 3 (вижте също Excel файл). Всяка колона съдържа една формула. Числата показват отговорите на примерите на съответното число).

Ориз. 3. Изчисляване на биномно разпределение в Excel за н= 4 и стр = 0,1

Свойства на биномното разпределение

Биномиалното разпределение зависи от параметрите нИ Р. Биномното разпределение може да бъде симетрично или асиметрично. Ако p = 0,05, биномиалното разпределение е симетрично независимо от стойността на параметъра н. Въпреки това, ако p ≠ 0,05, разпределението става изкривено. Колкото по-близо е стойността на параметъра Рдо 0,05 и колкото по-голям е размерът на извадката н, толкова по-слабо изразена е асиметрията на разпределението. По този начин разпределението на броя на неправилно попълнените формуляри е изкривено надясно, защото стр= 0,1 (фиг. 4).

Ориз. 4. Хистограма на биномно разпределение при н= 4 и стр = 0,1

Очакване на биномно разпределениеравна на произведението от размера на извадката нвърху вероятността за успех Р:

(3) M = E(X) =н.п.

Средно, при достатъчно дълга поредица от тестове в извадка, състояща се от четири поръчки, може да има p = E(X) = 4 x 0,1 = 0,4 неправилно попълнени форми.

Стандартно отклонение на биномното разпределение

Например стандартното отклонение на броя неправилно попълнени формуляри в счетоводството информационна системаравно на:

Използвани са материали от книгата Левин и др.Статистика за мениджъри. – М.: Уилямс, 2004. – стр. 307–313

Нека разгледаме биномното разпределение, изчислим математическото му очакване, дисперсията и модата. Използвайки функцията на MS EXCEL BINOM.DIST(), ще начертаем графики на функцията на разпределение и плътността на вероятността. Нека оценим параметъра на разпределението p, математическото очакване на разпределението и стандартно отклонение. Нека разгледаме и разпределението на Бернули.

Определение. Нека се състоят низпитания, във всяко от които могат да възникнат само 2 събития: събитието „успех” с вероятността стр или събитие „провал“ с вероятност р =1-p (т.нар схема на Бернули,Бернулиизпитания).

Вероятността да получите точно х успех в тези н тестове е равно на:

Брой успехи в извадката х е случайна променлива, която има Биномиално разпределение(Английски) Биномразпространение) стрИ нса параметрите на това разпределение.

Моля, не забравяйте, че да използвате Схеми на Бернулии съответно Биномно разпределение,трябва да бъдат изпълнени следните условия:

  • Всеки тест трябва да има точно два резултата, условно наречени „успех“ и „неуспех“.
  • резултатът от всеки тест не трябва да зависи от резултатите от предишни тестове (независимост на теста).
  • вероятност за успех стр трябва да бъде постоянно за всички тестове.

Биномиално разпределение в MS EXCEL

В MS EXCEL, като се започне от версия 2010, за Биномиално разпределениеима функция BINOM.DIST(), английско име- BINOM.DIST(), което ви позволява да изчислите вероятността извадката да съдържа точно х"успех" (т.е. функция на плътността на вероятността p(x), вижте формулата по-горе), и кумулативна функция на разпределение(вероятност пробата да има хили по-малко "успехи", включително 0).

Преди MS EXCEL 2010, EXCEL имаше функция BINOMDIST(), която също ви позволява да изчислявате разпределителна функцияИ плътност на вероятността p(x). BINOMIST() е оставен в MS EXCEL 2010 за съвместимост.

Примерният файл съдържа графики разпределение на плътността на вероятносттаИ .

Биномиално разпределениеима обозначението б(н; стр) .

Забележка: За застрояване кумулативна функция на разпределениеперфектна типова диаграма График, За плътност на разпространениеХистограма с групиране. За повече информация относно създаването на диаграми прочетете статията Основни типове диаграми.

Забележка: За удобство при писане на формули в примерния файл са създадени имена за параметри Биномиално разпределение: n и p.

Примерният файл показва различни вероятностни изчисления с помощта на функции на MS EXCEL:

Както можете да видите на снимката по-горе, се предполага, че:

  • Безкрайната популация, от която е взета пробата, съдържа 10% (или 0,1) валидни елемента (параметър стр, трети аргумент на функцията = BINOM.DIST() )
  • За да се изчисли вероятността в извадка от 10 елемента (параметър н, вторият аргумент на функцията) ще има точно 5 валидни елемента (първият аргумент), трябва да напишете формулата: =BINOM.DIST(5; 10; 0,1; FALSE)
  • Последният, четвърти елемент е зададен = FALSE, т.е. стойността на функцията се връща плътност на разпространение.

Ако стойността на четвъртия аргумент е TRUE, тогава функцията BINOM.DIST() връща стойността кумулативна функция на разпределениеили просто Разпределителна функция. В този случай можете да изчислите вероятността броят на добрите елементи в извадката да бъде от определен диапазон, например 2 или по-малко (включително 0).

За да направите това, трябва да напишете формулата:
= BINOM.DIST(2; 10; 0,1; TRUE)

Забележка: За стойност на x, която не е цяло число, . Например следните формули ще върнат същата стойност:
=BINOM.DIST( 2 ; 10; 0,1; ВЯРНО)
=BINOM.DIST( 2,9 ; 10; 0,1; ВЯРНО)

Забележка: В примерния файл плътност на вероятносттаИ разпределителна функциясъщо се изчислява с помощта на дефиницията и функцията NUMBERCOMB().

Показатели за разпространение

IN примерен файл на работен лист ПримерИма формули за изчисляване на някои показатели за разпределение:

  • =n*p;
  • (стандартно отклонение на квадрат) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Нека изведем формулата математическо очакване Биномиално разпределениеизползвайки Верига на Бернули.

По дефиниция случайната променлива X в Схема на Бернули(случайна променлива на Бернули) има разпределителна функция:

Това разпределение се нарича Разпределение на Бернули.

Забележка: Разпределение на Бернули- специален случай Биномиално разпределениес параметър n=1.

Нека генерираме 3 масива от по 100 числа всеки с различна вероятност за успех: 0.1; 0,5 и 0,9. За да направите това в прозореца Поколение произволни числа Нека зададем следните параметри за всяка вероятност p:

Забележка: Ако зададете опцията Случайно разпръскване (Случайно семе), тогава можете да изберете конкретен произволен набор от генерирани числа. Например, като зададете тази опция =25, можете да генерирате едни и същи набори от произволни числа на различни компютри (ако, разбира се, другите параметри на разпределение са еднакви). Стойността на опцията може да приема цели числа от 1 до 32 767. Име на опцията Случайно разпръскванеможе да е объркващо. Би било по-добре да го преведете като Наберете номер с произволни числа.

В резултат на това ще имаме 3 колони от 100 числа, въз основа на които можем например да оценим вероятността за успех стрпо формулата: Брой успехи/100(см. примерен файлов лист GenerationBernoulli).

Забележка: За Разпределения на Бернулис p=0,5 можете да използвате формулата =RANDBETWEEN(0;1), която съответства на .

Генериране на случайни числа. Биномиално разпределение

Да приемем, че в извадката има 7 дефектни продукта. Това означава, че е „много вероятно“ делът на дефектните продукти да се е променил стр, което е характерно за нашия производствен процес. Въпреки че такава ситуация е „много вероятна“, има възможност (алфа риск, грешка тип 1, „фалшива аларма“), че стростава непроменена, а увеличеният брой дефектни продукти се дължи на случайна извадка.

Както може да се види на фигурата по-долу, 7 е броят на дефектните продукти, който е приемлив за процес с p=0,21 при същата стойност Алфа. Това илюстрира, че когато праговата стойност на дефектните артикули в пробата е надвишена, стр„най-вероятно“ се е увеличил. Фразата „най-вероятно“ означава, че има само 10% вероятност (100%-90%), че отклонението на процента дефектни продукти над прага се дължи само на случайни причини.

По този начин превишаването на праговия брой дефектни продукти в пробата може да служи като сигнал, че процесът е нарушен и е започнал да произвежда използвани продукти. Опо-висок процент на дефектни продукти.

Забележка: Преди MS EXCEL 2010, EXCEL имаше функция CRITBINOM(), която е еквивалентна на BINOM.INV(). CRITBINOM() е оставен в MS EXCEL 2010 и по-нова версия за съвместимост.

Връзка на биномиалното разпределение с други разпределения

Ако параметърът н Биномиално разпределениеклони към безкрайност и стрклони към 0, тогава в този случай Биномиално разпределениеможе да бъде приблизително.
Можем да формулираме условия, когато приближението Поасоново разпределениеработи добре:

  • стр<0,1 (по-малкото стри още н, толкова по-точно е приближението);
  • стр>0,9 (като се има предвид това р=1- стр, изчисленията в този случай трябва да се направят чрез рхтрябва да се замени с н- х). Следователно, толкова по-малко ри още н, толкова по-точно е приближението).

На 0,1<=p<=0,9 и n*p>10 Биномиално разпределениеможе да бъде приблизително.

на свой ред Биномиално разпределениеможе да служи като добро приближение, когато размерът на популацията е N Хипергеометрично разпределениемного по-голям от размера на извадката n (т.е. N>>n или n/N<<1).

Повече подробности за връзката между горните разпределения можете да намерите в статията. Има и примери за приближение и са обяснени условията кога е възможно и с каква точност.

СЪВЕТ: Можете да прочетете за други дистрибуции на MS EXCEL в статията.

Споделете с приятели или запазете за себе си:

Зареждане...