Геометрично разпределение. Дискретни разпределения в MS EXCEL

Нека целта бъде стреляна преди първото попадение, с вероятността стрпопадението в целта при всеки изстрел е едно и също и не зависи от резултатите от предишни изстрели. С други думи, в разглеждания експеримент е реализирана схемата на Бернули. Като случайна променлива X ще считаме броя на изстрелите. Очевидно възможните стойности на случайната променлива X са естествени числа: х 1 =1, х 2 = 2, ... тогава вероятността, че кизстрелите ще бъдат равни на

Поставяйки тази формула к=1,2, ... получаваме геометрична прогресия с първия член стри множител р:

Поради тази причина се нарича разпределението, определено с формула (6.11). геометричен .

Използвайки формулата за сумата на безкрайно намаляваща геометрична прогресия, е лесно да се провери, че

.

Да намерим числови характеристикигеометрично разпределение.

По дефиницията на математическото очакване за DSW имаме

.

Изчисляваме дисперсията по формулата

.

За това намираме

.

Следователно,

.

Така, очаквана стойноста дисперсията на геометричното разпределение е

. (6.12)

6.4.* Генерираща функция

При решаване на проблеми, свързани с DSW, често се използват комбинаторни методи. Един от най-разработените теоретични методи на комбинаторния анализ е методът на генериране на функции, който е един от най-мощните методи в приложенията. Нека го опознаем накратко.

Ако случайната променлива  приема само неотрицателни цели числа, т.е.

,

тогава генерираща функция вероятностното разпределение на случайна променлива  се нарича функция

, (6.13)

където zе реална или комплексна променлива. Забележи, че между набора от генериращи функции  ( х)и много дистрибуции(P(= к)} има кореспонденция едно към едно.

Нека случайната променлива  има биномно разпределение

.

След това, използвайки биномната формула на Нютон, получаваме

,

тези. генерираща функция на биномното разпределение има формата

. (6.14)

Допълнение. Генерираща функция на разпределението на Поасон

има формата

. (6.15)

Произвеждаща функция на геометричното разпределение

има формата

. (6.16)

С помощта на генериращи функции е удобно да се намерят основните числени характеристики на DSW. Например, първият и вторият начален момент са свързани с генериращата функция със следните равенства:

, (6.17)

. (6.18)

Методът за генериране на функции често е удобен, защото в някои случаи функцията CWR дистрибуциимного трудно за определяне, докато генериращата функция понякога е лесна за намиране. Например, разгледайте схемата на последователни независими опити на Бернули, но направете една промяна в нея. Нека вероятността на събитието Аварира от тест до тест. Това означава, че формулата на Бернули за такава схема става неприложима. Задачата за намиране на функцията на разпределение в този случай представлява значителни трудности. Въпреки това, за дадена верига, генериращата функция се намира лесно и, следователно, съответните числени характеристики също се намират лесно.

Широкото използване на генериращи функции се основава на факта, че изследването на суми от случайни променливи може да бъде заменено с изследване на продуктите на съответните генериращи функции. Така че, ако  1 ,  2 , …,  ннезависим, тогава

Позволявам стр к =П к (А) е вероятността за "успех" в к-ти тест в схемата на Бернули (съответно, р к =1–стр к- вероятността от "провал" в кти тест). Тогава, в съответствие с формула (6.19), генериращата функция ще има формата

. (6.20)

Използвайки тази генерираща функция, можем да пишем

.

Тук се има предвид, че стр к + р к=1. Сега, използвайки формула (6.1), намираме втория начален момент. За да направим това, първо изчисляваме

и
.

В конкретен случай стр 1 =стр 2 =…=стр н =стр(т.е. в случай на биномиално разпределение) от получените формули следва, че M= np, D= npq.

Можем да разграничим най-често срещаните закони на разпределение на дискретни случайни променливи:

  • Биномен закон на разпределение
  • Закон за разпределение на Поасон
  • Геометричен закон на разпределение
  • Хипергеометричен закон на разпределение

За дадени разпределения на дискретни случайни променливи изчисляването на вероятностите на техните стойности, както и числените характеристики (математическо очакване, дисперсия и др.) се извършва по определени "формули". Ето защо е много важно да се познават тези видове разпределения и техните основни свойства.


1. Биномен закон на разпределение.

Дискретната случайна променлива $X$ е обект на биномен законразпределение на вероятностите, ако приема стойностите $0,\ 1,\ 2,\ \dots ,\ n$ с вероятности $P\left(X=k\right)=C^k_n\cdot p^k\cdot (\ ляво( 1-p\дясно))^(n-k)$. Всъщност случайната променлива $X$ е броят на появяванията на събитието $A$ в $n$ независими опити. Закон за разпределение на вероятностите за случайната променлива $X$:

$\begin(масив)(|c|c|)
\hline
X_i & 0 & 1 & \точки & n \\
\hline
p_i & P_n\left(0\right) & P_n\left(1\right) & \dots & P_n\left(n\right) \\
\hline
\край (масив)$

За такава случайна променлива очакването е $M\left(X\right)=np$, дисперсията е $D\left(X\right)=np\left(1-p\right)$.

Пример . В семейството има две деца. Приемайки, че вероятностите за раждане на момче и момиче са равни на $0,5$, намерете закона за разпределение на случайната променлива $\xi $ - броят на момчетата в семейството.

Нека случайната променлива $\xi $ е броят на момчетата в семейството. Стойностите, които $\xi:\ 0,\ ​​​​1,\ 2$ могат да приемат. Вероятностите за тези стойности могат да бъдат намерени по формулата $P\left(\xi =k\right)=C^k_n\cdot p^k\cdot (\left(1-p\right))^(n-k )$, където $n =2$ - брой независими опити, $p=0.5$ - вероятност за настъпване на събитие в поредица от $n$ опита. Получаваме:

$P\left(\xi =0\right)=C^0_2\cdot (0,5)^0\cdot (\left(1-0,5\right))^(2-0)=(0, 5)^2 =0,25;$

$P\left(\xi =1\right)=C^1_2\cdot 0.5\cdot (\left(1-0.5\right))^(2-1)=2\cdot 0.5\cdot 0.5=0.5;$

$P\left(\xi =2\right)=C^2_2\cdot (0,5)^2\cdot (\left(1-0,5\right))^(2-2)=(0, 5)^2=0,25.$

Тогава законът за разпределение на случайната променлива $\xi $ е съответствието между стойностите $0,\ 1,\ 2$ и техните вероятности, т.е.:

$\begin(масив)(|c|c|)
\hline
\xi & 0 & 1 & 2 \\
\hline
P(\xi) & 0,25 & 0,5 & 0,25 \\
\hline
\край (масив)$

Сумата от вероятностите в закона за разпределение трябва да бъде равна на $1$, т.е. $\sum _(i=1)^(n)P(\xi _((\rm i)))=0,25+0,5+0, 25 = $1.

Очакване $M\left(\xi \right)=np=2\cdot 0,5=1$, дисперсия $D\left(\xi \right)=np\left(1-p\right)=2\cdot 0,5\ cdot 0,5=0,5$, средно стандартно отклонение$\sigma \left(\xi \right)=\sqrt(D\left(\xi \right))=\sqrt(0,5)\приблизително 0,707$.

2. Закон за разпределение на Поасон.

Ако дискретна случайна променлива $X$ може да приема само неотрицателни цели числа $0,\ 1,\ 2,\ \dots ,\ n$ с вероятности $P\left(X=k\right)=((( \lambda )^k )\над (k}\cdot e^{-\lambda }$, то говорят, что она подчинена закону распределения Пуассона с параметром $\lambda $. Для такой случайной величины математическое ожидание и дисперсия равны между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda $.!}

Коментирайте. Особеността на това разпределение е, че въз основа на експериментални данни намираме оценките $M\left(X\right),\ D\left(X\right)$, ако получените оценки са близки една до друга, тогава ние имат основание да твърдят, че случайната променлива се подчинява на закона за разпределение на Поасон.

Пример . Примери за случайни променливи, подчинени на закона за разпределение на Поасон, могат да бъдат: броят на автомобилите, които ще бъдат обслужени утре от бензиностанция; броят на дефектните елементи в произведения продукт.

Пример . Заводът изпрати до базата продукти за $500$. Вероятността за повреда на продукта при транспортиране е $0,002$. Намерете закона за разпределение на случайната величина $X$, равна на броя на повредените продукти; което е равно на $M\left(X\right),\ D\left(X\right)$.

Нека дискретна случайна променлива $X$ е броят на повредените продукти. Такава случайна променлива се подчинява на закона за разпределение на Поасон с параметър $\lambda =np=500\cdot 0,002=1$. Вероятностите на стойностите са $P\left(X=k\right)=(((\lambda )^k)\over (k}\cdot e^{-\lambda }$. Очевидно, что все вероятности всех значений $X=0,\ 1,\ \dots ,\ 500$ перечислить невозможно, поэтому мы ограничимся лишь первыми несколькими значениями.!}

$P\left(X=0\right)=((1^0)\over (0}\cdot e^{-1}=0,368;$!}

$P\left(X=1\right)=((1^1)\over (1}\cdot e^{-1}=0,368;$!}

$P\left(X=2\right)=((1^2)\over (2}\cdot e^{-1}=0,184;$!}

$P\left(X=3\right)=((1^3)\over (3}\cdot e^{-1}=0,061;$!}

$P\left(X=4\right)=((1^4)\over (4}\cdot e^{-1}=0,015;$!}

$P\left(X=5\right)=((1^5)\over (5}\cdot e^{-1}=0,003;$!}

$P\наляво(X=6\надясно)=((1^6)\над (6}\cdot e^{-1}=0,001;$!}

$P\left(X=k\right)=(((\lambda )^k)\over (k}\cdot e^{-\lambda }$!}

Законът за разпределение на случайната променлива $X$:

$\begin(масив)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 & 4 & 5 & 6 & ... & k \\
\hline
P_i & 0,368; & 0,368 & 0,184 & 0,061 & 0,015 & 0,003 & 0,001 & ... & (((\lambda )^k)\над (k}\cdot e^{-\lambda } \\!}
\hline
\край (масив)$

За такава случайна променлива математическото очакване и дисперсията са равни едно на друго и са равни на параметъра $\lambda $, т.е. $M\left(X\right)=D\left(X\right)=\lambda =1 $.

3. Геометричен закон на разпределение.

Ако дискретна случайна променлива $X$ може да приема само естествени стойности $1,\ 2,\ \dots ,\ n$ с вероятности $P\left(X=k\right)=p(\left(1-p\ вдясно)) ^(k-1),\ k=1,\ 2,\ 3,\ \dots $, тогава казваме, че такава случайна променлива $X$ се подчинява на геометричния закон за разпределение на вероятностите. Всъщност геометричното разпределение изглежда като изпитания на Бернули към първия успех.

Пример . Примери за случайни променливи, които имат геометрично разпределение, могат да бъдат: броят на изстрелите преди първото попадение в целта; брой тестове на устройството преди първата повреда; броя на хвърлянията на монети преди първия хедс-ъп и т.н.

Математическото очакване и дисперсията на случайна променлива, предмет на геометрично разпределение, са съответно $M\left(X\right)=1/p$, $D\left(X\right)=\left(1-p\right) /p^ 2$.

Пример . По пътя на движението на рибата до мястото за хвърляне на хайвера има $4$ ключалка. Вероятността риба да премине през всеки шлюз е $p=3/5$. Изградете серия на разпределение на случайната променлива $X$ - броят ключалки, преминали от рибата преди първото спиране на ключалата. Намерете $M\left(X\right),\ D\left(X\right),\ \sigma \left(X\right)$.

Нека случайната променлива $X$ е броят на шлюзовете, преминали от рибата преди първото спиране на шлюза. Такава случайна променлива се подчинява на геометричния закон за разпределение на вероятностите. Стойностите, които може да приеме случайната променлива $X са: 1, 2, 3, 4. Вероятностите за тези стойности се изчисляват по формулата: $P\left(X=k\right)=pq^( k-1)$, където: $ p=2/5$ - вероятност рибата да бъде уловена през шлюза, $q=1-p=3/5$ - вероятността рибата да премине през шлюза, $k=1, \ 2, \ 3, \ 4 $.

$P\left(X=1\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^0=((2)\ над(5))=0,4;$

$P\left(X=2\right)=((2)\over (5))\cdot ((3)\over (5))=((6)\over (25))=0,24; $

$P\left(X=3\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^2=((2)\ над (5))\cdot ((9)\над (25))=((18)\над (125))=0,144;$

$P\left(X=4\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^3+(\left(( (3)\над (5))\надясно))^4=((27)\над (125))=0,216.$

$\begin(масив)(|c|c|)
\hline
X_i & 1 & 2 & 3 & 4 \\
\hline
P\left(X_i\right) & 0,4 & 0,24 & 0,144 & 0,216 \\
\hline
\край (масив)$

Очаквана стойност:

$M\left(X\right)=\sum^n_(i=1)(x_ip_i)=1\cdot 0,4+2\cdot 0,24+3\cdot 0,144+4\cdot 0,216=2,176.$

дисперсия:

$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2=)0,4\cdot (\ ляво(1-2,176\вдясно))^2+0,24\cdot (\вляво(2-2,176\вдясно))^2+0,144\cdot (\вляво(3-2,176\вдясно))^2+$

$+\ 0,216\cdot (\left(4-2,176\right))^2\приблизително 1,377.$

Стандартно отклонение:

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(1377)\приблизително 1173.$

4. Хипергеометричен закон на разпределение.

Ако има $N$ обекти, сред които $m$ обекти имат даденото свойство. На случаен принцип, без заместване, се извличат $n$ обекта, сред които има $k$ обекта, които имат дадено свойство. Хипергеометричното разпределение дава възможност да се оцени вероятността точно $k$ обекта в извадка да имат дадено свойство. Нека случайната променлива $X$ е броят на обектите в извадката, които имат дадено свойство. Тогава вероятностите на стойностите на случайната променлива $X$:

$P\наляво(X=k\надясно)=((C^k_mC^(n-k)_(N-m))\над (C^n_N))$

Коментирайте. Статистическата функция HYPERGEOMET на съветника за функции $f_x$ на Excel ви позволява да определите вероятността определен брой опити да бъдат успешни.

$f_x\до $ статистически$\към$ ХИПЕРГЕОМЕТ$\към$ Добре. Ще се появи диалогов прозорец, който трябва да попълните. В графиката Брой_успехи_в_извадкатапосочете стойността на $k$. образец_размере равно на $n$. В графиката Брой_на_успехите_в_популациятапосочете стойността на $m$. Размер на населениетое равно на $N$.

Математическото очакване и дисперсията на дискретна случайна променлива $X$, предмет на геометричен закон за разпределение, са $M\left(X\right)=nm/N$, $D\left(X\right)=((nm\left (1 -((m)\над (N))\надясно)\наляво(1-((n)\над (N))\надясно))\над (N-1))$.

Пример . В кредитния отдел на банката работят 5 специалисти с висше финансово образование и 3 специалисти с висше юридическо образование. Ръководството на банката реши да изпрати 3 специалисти за повишаване на квалификацията, като ги подбра на случаен принцип.

а) Направете разпределителна серия на броя на специалистите с висше финансово образование, които могат да бъдат насочени към повишаване на квалификацията;

б) Намерете числените характеристики на това разпределение.

Нека случайната променлива $X$ е броят на специалистите с висше финансово образование сред тримата избрани. Стойности, които $X:0,\ 1,\ 2,\ 3$ могат да приемат. Тази случайна променлива $X$ се разпределя според хипергеометричното разпределение със следните параметри: $N=8$ - размер на популацията, $m=5$ - брой успехи в популацията, $n=3$ - размер на извадката, $ k=0,\ 1, \ 2,\ 3$ - брой успехи в извадката. Тогава вероятностите $P\left(X=k\right)$ могат да бъдат изчислени по формулата: $P(X=k)=(C_(m)^(k) \cdot C_(N-m)^(n-k) \ върху C_( N)^(n) ) $. Ние имаме:

$P\left(X=0\right)=((C^0_5\cdot C^3_3)\over (C^3_8))=((1)\over (56))\приблизително 0,018;$

$P\left(X=1\right)=((C^1_5\cdot C^2_3)\over (C^3_8))=((15)\over (56))\приблизително 0,268;$

$P\left(X=2\right)=((C^2_5\cdot C^1_3)\over (C^3_8))=((15)\over (28))\приблизително 0,536;$

$P\left(X=3\right)=((C^3_5\cdot C^0_3)\over (C^3_8))=((5)\over (28))\приблизително 0,179.$

Тогава серията на разпределение на случайната променлива $X$:

$\begin(масив)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 \\
\hline
p_i & 0,018 & 0,268 & 0,536 & 0,179 \\
\hline
\край (масив)$

Нека изчислим числените характеристики на случайната променлива $X$, използвайки общите формули на хипергеометричното разпределение.

$M\left(X\right)=((nm)\over (N))=((3\cdot 5)\over (8))=((15)\over (8))=1875.$

$D\left(X\right)=((nm\left(1-((m)\over (N))\right)\left(1-((n)\over (N))\right)) \over (N-1))=((3\cdot 5\cdot \left(1-((5)\over (8))\right)\cdot \left(1-((3)\over (8) ))\надясно))\над (8-1))=((225)\над (448))\приблизително 0,502.$

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(0,502)\приблизително 0,7085.$

Статистиката идва на помощ при решаването на много проблеми, например: когато не е възможно да се изгради детерминистичен модел, когато има твърде много фактори или когато трябва да оценим вероятността на конструирания модел, като вземем предвид наличните данни. Отношението към статистиката е двусмислено. Смята се, че има три вида лъжи: лъжи, нагла лъжаи статистика. От друга страна, много „потребители“ на статистиката вярват твърде много, без да разбират напълно как работи: прилагайки например тест към каквито и да е данни, без да проверяват неговата нормалност. Подобна небрежност може да генерира сериозни грешки и да превърне „феновете” на теста в мразещи статистиката. Нека се опитаме да поставим токове над i и да разберем кои модели на случайни променливи трябва да се използват за описание на определени явления и какъв вид генетична връзка съществува между тях.

На първо място, този материал ще представлява интерес за студентите, изучаващи теория на вероятностите и статистика, въпреки че "зрелите" специалисти ще могат да го използват като справка. В една от следващите работи ще покажа пример за използване на статистика за изграждане на тест за оценка на значимостта на индикаторите на стратегиите за борсова търговия.

Работата ще разгледа:


В края на статията ще бъде дадена за размисъл. Ще споделя мислите си по този въпрос в следващата си статия.

Някои от дадените непрекъснати разпределения са частни случаи.

Дискретни разпределения

Дискретните разпределения се използват за описание на събития с недиференцируеми характеристики, определени в изолирани точки. Казано по-просто, за събития, чийто резултат може да бъде приписан на някаква отделна категория: успех или неуспех, цяло число (например игра на рулетка, зарове), глави или опашки и т.н.

Дискретното разпределение се описва от вероятността за възникване на всеки от възможните резултати от дадено събитие. Както при всяко разпределение (включително непрекъснато), концепциите за очакване и дисперсия са определени за дискретни събития. Трябва обаче да се разбере, че очакването за дискретно случайно събитие е стойност в общ случайнереализируем като резултат от едно случайно събитие, а по-скоро като стойност, към която средноаритметичната стойност на резултатите от събитията ще се стреми да нараства с увеличаване на техния брой.

При моделирането на дискретни случайни събития комбинаториката играе важна роля, тъй като вероятността за резултат от събитие може да се определи като съотношението на броя комбинации, които дават желания резултат, към общия брой комбинации. Например: в кошницата има 3 бели топки и 7 черни. Когато изберем 1 топка от кошницата, можем да я направим 10-та различни начини(общ брой комбинации), но само 3 опции, в които ще бъдат избрани бяла топка(3 комбинации, които дават желания резултат). По този начин вероятността да изберете бяла топка е: ().

Също така е необходимо да се прави разлика между проби със замяна и без замяна. Например, за да се опише вероятността да се изберат две бели топки, е важно да се определи дали първата топка ще бъде върната в кошницата. Ако не, тогава имаме работа с проба без замяна () и вероятността ще бъде както следва: - вероятността да се избере бяла топка от първоначалната проба, умножена по вероятността да се избере отново бяла топка от останалите в кошницата . Ако първата топка бъде върната в кошницата, тогава това е връщане (). В този случай вероятността да изберете две бели топки е .

Ако леко формализираме примера с кошницата, както следва: нека резултатът от дадено събитие приеме една от двете стойности 0 или 1 с вероятности и съответно, тогава разпределението на вероятността за получаване на всеки от предложените резултати ще се нарича разпределение на Бернули :

Традиционно резултат със стойност 1 се нарича "успех", а резултат със стойност 0 се нарича "провал". Очевидно е, че получаването на резултата "успех или неуспех" се случва с вероятност.

Очакване и дисперсия на разпределението на Бернули:


Броят на успехите в изпитанията, чийто резултат се разпределя с вероятността за успех (пример с връщане на топките в коша), се описва с биномното разпределение:


По друг начин можем да кажем, че биномното разпределение описва сумата от независими случайни променливи, които могат да бъдат разпределени с вероятността за успех.
Очакване и дисперсия:



Биномиалното разпределение е валидно само за повторна извадка, т.е. когато вероятността за успех остава постоянна за цялата поредица от опити.

Ако количествата и имат биномно разпределение с параметри и съответно, тогава тяхната сума също ще бъде разпределена биномно с параметри .

Представете си ситуация, в която теглим топки от коша и ги връщаме обратно, докато не бъде изтеглена бяла топка. Броят на тези операции се описва с геометрично разпределение. С други думи: геометричното разпределение описва броя опити до първия успех, като се има предвид вероятността за успех във всеки опит. Ако се подразбира номерът на опита, в който е постигнат успех, тогава геометричното разпределение ще бъде описано със следната формула:


Очакване и дисперсия на геометричното разпределение:

Геометричното разпределение е генетично свързано с разпределението, което описва непрекъсната случайна променлива: времето преди събитието, с постоянна интензивност на събитията. Геометричното разпределение също е частен случай.

Разпределението на Паскал е обобщение на разпределението: то описва разпределението на броя на грешките в независими тестове, чийто резултат се разпределя с вероятността за успех преди началото на успеха в сумата. За , получаваме разпределение за количеството .


където е броят на комбинациите от до .

Очакване и дисперсия на отрицателното биномно разпределение:



Сумата от независими случайни променливи, разпределени според Паскал, също е разпределена според Паскал: нека има разпределение , и - . Нека също са независими, тогава сумата им ще има разпределение

Досега разгледахме примери за проби за повторно влизане, т.е. вероятността за резултат не се променя от изпитване на изпитване.

Сега разгледайте ситуацията без заместване и опишете вероятността за броя на успешните проби от популацията с предварително определен брой успехи и неуспехи (предварително определен брой бели и черни топки в кошницата, козове в тестето, дефектни части в игра и др.).

Нека общата колекция съдържа обекти, от които са обозначени като "1" и като "0". Изборът на обект с етикет "1" ще считаме за успешен, а с етикет "0" като неуспешен. Нека проведем n теста и избраните обекти повече няма да участват в по-нататъшни тестове. Вероятността за успех ще следва хипергеометрично разпределение:


където е броят на комбинациите от до .

Очакване и дисперсия:


Поасоново разпределение


(взето от тук)

Разпределението на Поасон се различава значително от разпределенията, разгледани по-горе, в своята „предметна“ област: сега не се разглежда вероятността за конкретен резултат от теста, а интензивността на събитията, тоест средният брой събития за единица време.

Разпределението на Поасон описва вероятността за възникване на независими събития във времето със среден интензитет на събитията:


Очакването и дисперсията на разпределението на Поасон:

Дисперсията и средната стойност на разпределението на Поасон са идентично равни.

Разпределението на Поасон в комбинация с , което описва интервалите от време между началото на независими събития, формират математическата основа на теорията за надеждността.

Плътността на вероятността на произведението на случайни променливи x и y () с разпределения и може да се изчисли, както следва:

Някои от разпределенията по-долу са специални случаи на разпределението на Пиърсън, което от своя страна е решение на уравнението:


където и са параметрите на разпределението. Има 12 вида разпределение на Pearson в зависимост от стойностите на параметрите.

Разпределенията, които ще бъдат обсъдени в този раздел, имат тясна връзка помежду си. Тези връзки се изразяват в това, че някои разпределения са частни случаи на други разпределения или описват трансформации на случайни променливи с други разпределения.

Диаграмата по-долу показва връзките между някои от непрекъснатите разпределения, които ще бъдат обсъдени в тази статия. На диаграмата плътните стрелки показват трансформацията на случайни променливи (началото на стрелката показва първоначалното разпределение, краят на стрелката - полученото), а пунктираните стрелки показват връзката на обобщение (началото на стрелката показва разпределението, което е специален случай на това, посочено в края на стрелката). За специални случаи на разпределението на Пиърсън над пунктираните стрелки е посочен съответният тип разпределение на Пиърсън.


Обзорът на предлаганите по-долу разпределения обхваща много случаи, които се срещат при анализ на данни и моделиране на процеси, въпреки че, разбира се, не съдържа абсолютно всички разпределения, известни на науката.

Нормално разпределение (разпределение на Гаус)


(взето от тук)

Плътността на вероятността на нормално разпределение с параметри и се описва от функцията на Гаус:

Ако и , тогава такова разпределение се нарича стандартно.

Очакване и дисперсия на нормалното разпределение:



Областта на дефиниране на нормалното разпределение е множеството от реални числа.

Нормалното разпределение е разпределение от тип VI.

Сумата от квадратите на независимите нормални стойности има , а съотношението на независимите гаусови стойности е разпределено върху .

Нормалното разпределение е безкрайно делимо: сумата от нормално разпределени количества и с параметри и съответно също има нормална дистрибуцияс параметри , където и .

Нормалното разпределение моделира добре описващите количества природен феномен, шумове от термодинамичен характер и грешки при измерване.

Освен това, съгласно централната гранична теорема, сумата от голям брой независими членове от един и същи ред се сближава към нормално разпределение, независимо от разпределенията на членовете. Благодарение на това свойство нормалното разпределение е популярно в Статистически анализ, много статистически тестове са предназначени за нормално разпределени данни.

Z-тестът се основава на безкрайната делимост на нормалното разпределение. Този тест се използва за проверка дали очакването на извадка от нормално разпределени променливи е равно на някаква стойност. Стойността на дисперсията трябва да бъде известен. Ако стойността на дисперсията е неизвестна и се изчислява въз основа на анализираната проба, тогава t-тест, базиран на .

Да предположим, че имаме извадка от n независими нормално разпределени количества от населениеко стандартно отклонениеНека предположим това. Тогава стойността ще има стандартно нормално разпределение. Чрез сравняване на получената z стойност с квантилите на стандартното разпределение можете да приемете или отхвърлите хипотезата с необходимото ниво на значимост.

Поради преобладаването на разпределението на Гаус, много изследователи, които не познават статистиката много добре, забравят да проверят данните за нормалност или оценяват графиката на плътността на разпределението „на око“, сляпо вярвайки, че имат работа с данни от Гаус. Съответно, смело прилагане на тестове, предназначени за нормално разпределение и получаване на напълно неверни резултати. Вероятно оттам е тръгнал слухът за статистиката като най-ужасната лъжа.

Помислете за пример: трябва да измерим съпротивлението на набор от резистори с определена стойност. Съпротивлението има физическа природа, логично е да се предположи, че разпределението на отклоненията на съпротивлението от номиналната стойност ще бъде нормално. Измерваме, получаваме камбанообразна функция на плътност на вероятността за измерените стойности с режим в близост до номиналната стойност на резистора. Това нормално разпределение ли е? Ако да, тогава ще търсим дефектни резистори, като използваме или z-тест, ако знаем дисперсията на разпределението предварително. Мисля, че мнозина ще направят точно това.

Но нека разгледаме по-отблизо технологията за измерване на съпротивлението: съпротивлението се дефинира като съотношението на приложеното напрежение към протичащия ток. Измерихме тока и напрежението с уреди, които от своя страна имат нормално разпределени грешки. Тоест измерените стойности на тока и напрежението са нормално разпределени случайни променливис математически очаквания, съответстващи на истинските стойности на измерените величини. И това означава, че получените стойности на съпротивлението се разпределят по протежение, а не според Гаус.

Разпределението описва сумата от квадратите на случайни променливи, всяка от които е разпределена според стандарта нормален закон :

Къде е броят на степените на свобода, .

Очакването и дисперсията на разпределението:



Домейнът на дефиниция е множеството от неотрицателни естествени числа. е безкрайно делимо разпределение. Ако и - са разпределени съответно върху и имат и степени на свобода, тогава тяхната сума също ще бъде разпределена върху и имат степени на свобода.

Това е частен случай (и следователно разпределение от тип III) и обобщение. Съотношението на количествата, разпределени към разпределени върху .

Тестът за съответствие на Pearson се основава на разпределението. използвайки този критерий, е възможно да се провери дали извадка от случайна променлива принадлежи към определено теоретично разпределение.

Да предположим, че имаме извадка от някаква случайна променлива. Въз основа на тази извадка изчисляваме вероятностите стойностите да попаднат в интервалите (). Нека има и предположение за аналитичния израз на разпределението, според което вероятностите за попадане в избраните интервали трябва да бъдат . Тогава количествата ще се разпределят по нормалния закон.

Привеждаме към стандартното нормално разпределение: ,
където и .

Получените величини имат нормално разпределение с параметри (0, 1), поради което сумата от техните квадрати се разпределя със степен на свобода. Намаляването на степента на свобода е свързано с допълнително ограничение на сумата от вероятностите на стойностите, попадащи в интервали: тя трябва да бъде равна на 1.

Чрез сравняване на стойността с квантилите на разпределението може да се приеме или отхвърли хипотезата за теоретичното разпределение на данните с необходимото ниво на значимост.

Разпределението на Стюдънт се използва за провеждане на t-тест: тест за равенство на очакваната стойност на извадка от разпределени случайни променливи на определена стойност или равенство на очакваните стойности на две извадки с еднаква дисперсия ( трябва да се провери равенството на дисперсиите). t-разпределението на Стюдънт описва съотношението на разпределена случайна променлива към стойност, разпределена върху .

Нека и са независими случайни променливи със степени на свобода и съответно. Тогава количеството ще има разпределение на Фишер със степени на свобода, а количеството ще има разпределение на Фишер със степени на свобода.
Разпределението на Фишер е дефинирано за реални неотрицателни аргументи и има плътност на вероятността:


Очакване и дисперсия на разпределението на Фишер:



Очакването е дефинирано за и дисперсията е дефинирана за .

Редица статистически тестове се основават на разпределението на Фишер, като оценката на значимостта на регресионните параметри, тестът за хетероскедастичност и тестът за равенство на дисперсиите на извадката (f-тест, който трябва да се разграничава от точентест на Фишер).

F-тест: нека има две независими проби и разпределени обеми от данни и съответно. Нека изложим хипотеза за равенството на дисперсиите на извадката и да я проверим статистически.

Нека изчислим стойността. Ще има разпределение на Фишер със степени на свобода.

Чрез сравняване на стойността с квантилите на съответното разпределение на Фишър можем да приемем или отхвърлим хипотезата, че дисперсиите на извадката са равни на изискваното ниво на значимост.

Експоненциално (експоненциално) разпределение и разпределение на Лаплас (двойно експоненциално, двойно експоненциално)


(взето от тук)

Експоненциалното разпределение описва интервалите от време между независими събития, които се случват със среден интензитет. Броят на случванията на такова събитие за определен период от време се описва с дискретно . Експоненциалното разпределение заедно с формират математическата основа на теорията за надеждността.

В допълнение към теорията за надеждността, експоненциалното разпределение се използва при описанието на социалните явления, в икономиката, в теорията опашка, в транспортната логистика - навсякъде, където е необходимо да се моделира потокът от събития.

Експоненциалното разпределение е специален случай (за n=2) и следователно . Тъй като експоненциално разпределеното количество е количество хи-квадрат с 2 степени на свобода, то може да се тълкува като сбор от квадратите на две независими нормално разпределени количества.

Освен това експоненциалното разпределение е честен случай

Разгледайте геометричното разпределение, изчислете неговото математическо очакване и дисперсия. Използвайки функцията на MS EXCEL OTRBINOM.DIST(), ще начертаем графиките на функцията на разпределението и плътността на вероятността.

Геометрично разпределение(Английски) Геометрично разпределение) е специален случай (за r=1).

Нека се проведат тестове, във всеки от които с вероятност може да се случи само събитието "успех". стр или събитието "провал" с вероятност р =1-p().

Да дефинираме х като номер на процеса, в който е регистриран първият успех. В този случай случайната променлива х ще има Геометрично разпределение:

Геометрично разпределение в MS EXCEL

В MS EXCEL, като се започне от версия 2010, за Отрицателна Биномиално разпределение има функция OTRBINOM.DIST() , Английско заглавие NEGBINOM.DIST(), който ви позволява да изчислите вероятността за възникване брой неуспехидокато не бъде получен определеният брой успехи дадена вероятностуспех.

За геометрично разпределениевторият аргумент на тази функция трябва да бъде 1, защото интересуваме се само от първия успех.

Това определение е малко по-различно от горното, което изчислява вероятността първият успех да се случи след това хтестове. Разликата се свежда до диапазона на промяна на диапазона х: ако вероятността се определя от гледна точка на броя опити, тогава хможе да приема стойности, започващи от 1, а ако през броя на повреди, след това започвайки от 0. Следователно следната формула е валидна: p(x_ неуспехи)=p(x_ тестове-един). См. примерен файлов лист Пример, където са дадени 2 метода на изчисление.

Подходът, възприет във функцията MS EXCEL, се използва по-долу: чрез броя на грешките.

Да изчисля функция на плътността на вероятността p(x), вижте формулата по-горе, трябва да зададете четвъртия аргумент във функцията INTBINOM.DIST() на FALSE. Да изчисля , трябва да зададете четвъртия аргумент на TRUE.

Забележка : Преди MS EXCEL 2010, EXCEL имаше функция INTERBINOMDIST(), която ви позволява да изчислявате само плътност на вероятността. Примерният файл съдържа формула, базирана на функцията INTBINOMDIST() за изчисляване интегрална функция на разпределение. Има и формула за изчисляване на вероятността чрез дефиницията.

Примерният файл съдържа графики плътност на разпределение на вероятноститеи интегрална функция на разпределение.

Забележка: За удобство при писане на формули за параметъра p, a .

Забележка: Във функция DISTBINOM.DIST( ) с нецелочислена стойност х, . Например следните формули ще върнат същата стойност:
DISTBINOM.DIST( 2 ; един; 0,4; ВЯРНО)=
DISTBINOM.DIST( 2,9 ; един; 0,4; ВЯРНО)

Задачи

Дадени са решения на проблемите примерен файл на лист Пример.

Задача 1. Петролна компания прави сондажи за добив на нефт. Вероятността да се намери нефт в кладенец е 20%.
Каква е вероятността първото масло да се получи от третия опит?
Каква е вероятността да са необходими три опита, за да се намери първото масло?
Решение1:
=INTERBINOM.DIST(3-1, 1, 0,2, FALSE)
=INTERBINOM.DIST(3-1, 1, 0,2, TRUE)

Задача 2. Рейтинговата агенция прави анкета сред случайни минувачи в града за любимата им марка автомобил. Нека се знае, че 1% от гражданите имат любима кола ЛадаГранта. Каква е вероятността да срещнете първия почитател на тази марка автомобил след проучване сред 10 души?
Решение 2: \u003d OTRBINOM.DIST (10-1, 1, 0,01; ВЯРНО)=9,56%

Споделете с приятели или запазете за себе си:

Зареждане...