Геометричний розподіл. Дискретні розподіли у MS EXCEL

Нехай проводиться стрілянина по заданій мішені до першого влучення, при цьому ймовірність pвлучення в ціль у кожному пострілі одна і та ж і не залежить від результатів попередніх пострілів. Інакше кажучи, у аналізованому досвіді здійснюється схема Бернуллі. Як випадкова величина X будемо розглядати число зроблених пострілів. Очевидно, що можливими значеннями випадкової величини X є натуральні числа: x 1 =1, x 2 =2, … тоді ймовірність того, що знадобиться kпострілів дорівнюватиме

Вважаючи в цій формулі k=1,2, … отримаємо геометричну прогресію з першим членом pта множником q:

З цієї причини розподіл, який визначається формулою (6.11) називається геометричним .

Використовуючи формулу суми нескінченно спадної геометричної прогресії, легко переконається, що

.

Знайдемо числові характеристикигеометричного розподілу.

За визначенням математичного очікування для ДСВ маємо

.

Дисперсію обчислимо за формулою

.

Для цього знайдемо

.

Отже,

.

Отже, математичне очікуваннята дисперсія геометричного розподілу дорівнює

. (6.12)

6.4.* Виробнича функція

При вирішенні завдань, пов'язаних із ДСВ, часто використовуються методи комбінаторики. Одним з найбільш розвинених теоретичних методів комбінаторного аналізу є метод функцій, що виробляють, який є одним з найсильніших методів і в застосуваннях. Стисло познайомимося з ним.

Якщо випадкова величина  набуває лише цілі невід'ємні значення, тобто.

,

то функцією, що виробляє розподілу ймовірностей випадкової величини  називається функція

, (6.13)

де z– дійсна чи комплексна змінна. Відмітимо, що між безліччю виробляючих функцій  ( x)і безліччю розподілів(P(= k)} існує взаємно однозначна відповідність.

Нехай випадкова величина  має біномний розподіл

.

Тоді, використовуючи формулу бінома Ньютона, отримаємо

,

тобто. функція біномного розподілу має вигляд

. (6.14)

Додавання. Функціонування розподілу Пуассона

має вигляд

. (6.15)

Функціонування геометричного розподілу

має вигляд

. (6.16)

За допомогою функцій зручно знаходити основні числові характеристики ДСВ. Наприклад, перший і другий початковий моменти пов'язані з функцією, що виробляє наступними рівностями:

, (6.17)

. (6.18)

Метод функцій, що виробляють часто буває зручний тим, що в деяких випадках функцію розподілу ДСВдуже важко визначити, тоді як функцію, що виробляє, часом легко знайти. Наприклад, розглянемо схему послідовних незалежних випробувань Бернуллі, але внесемо до неї одну зміну. Нехай ймовірність здійснення події Aвід випробування до випробування змінюється. Це означає, що формула Бернуллі для такої схеми стає непридатною. Завдання знаходження функції розподілу у разі становить значні труднощі. Однак для даної схеми легко знаходиться функція, а, отже, легко знаходяться і відповідні числові характеристики.

Широке застосування функцій засноване на тому, що вивчення сум випадкових величин можна замінити вивченням творів відповідних функцій. Так, якщо  1 ,  2 , …,  nнезалежні, то

Нехай p k =P k (A) – ймовірність "успіху" в k-м випробуванні у схемі Бернуллі (відповідно, q k =1–p k- Імовірність "неуспіху" в k-м випробуванні). Тоді, відповідно до формули (6.19), функція, що виробляє, матиме вигляд

. (6.20)

Користуючись цією функцією, можемо написати

.

Тут враховано, що p k + q k=1. Тепер за формулою (6.1) знайдемо другий початковий момент. Для цього попередньо обчислимо

і
.

В окремому випадку p 1 =p 2 =…=p n =p(тобто у разі біномного розподілу) з отриманих формул випливає, що M= np, D= npq.

Можна виділити закони розподілу дискретних випадкових величин, що найчастіше зустрічаються:

  • Біноміальний закон розподілу
  • Пуасонівський закон розподілу
  • Геометричний закон розподілу
  • Гіпергеометричний закон розподілу

Для даних розподілів дискретних випадкових величин розрахунок ймовірностей їх значень, а також числових характеристик (математичне очікування, дисперсія тощо) здійснюється за певними формулами. Тому дуже важливо знати ці типи розподілів та їх основні властивості.


1. Біноміальний закон розподілу.

Дискретна випадкова величина $X$ підпорядкована біноміальному законурозподілу ймовірностей, якщо вона приймає значення $0,\ 1,\ 2,\ \dots ,\ n$ з ймовірностями $P\left(X=k\right)=C^k_n\cdot p^k\cdot (\left( 1-p\right))^(n-k)$. Фактично, випадкова величина $X$ - це кількість появи події $A$ у $n$ незалежних випробувань. Закон розподілу ймовірностей випадкової величини $X$:

$\begin(array)(|c|c|)
\hline
X_i & 0 & 1 & \dots & n \\
\hline
p_i & P_n\left(0\right) & P_n\left(1\right) & \dots & P_n\left(n\right) \\
\hline
\end(array)$

Для такої випадкової величини математичне очікування $ M \ left (X \ right) = np $, дисперсія $ D \ left (X \ right) = np \ left (1-p \ right) $.

приклад . У сім'ї двоє дітей. Вважаючи ймовірність народження хлопчика і дівчинки рівними $0,5$, знайти закон розподілу випадкової величини $xi $ - числа хлопчиків у сім'ї.

Нехай випадкова величина $ xi $ - число хлопчиків у сім'ї. Значення, які може приймати $ xi: 0, 1, 2 $. Імовірності цих значень можна знайти за формулою $P\left(\xi =k\right) = C^k_n\cdot p^k\cdot (\left(1-p\right))^(n-k)$, де $n =2$ - кількість незалежних випробувань, $p=0,5$ - ймовірність появи події у серії з $n$ випробувань. Отримуємо:

$P\left(\xi =0\right)=C^0_2\cdot (0,5)^0\cdot (\left(1-0,5\right))^(2-0)=(0, 5) ^ 2 = 0,25;

$P\left(\xi =1\right)=C^1_2\cdot 0,5\cdot (\left(1-0,5\right))^(2-1)=2\cdot 0,5\ cdot 0,5 = 0,5;

$P\left(\xi =2\right)=C^2_2\cdot (0,5)^2\cdot (\left(1-0,5\right))^(2-2)=(0, 5) ^ 2 = 0,25.

Тоді закон розподілу випадкової величини $\xi$ є відповідністю між значеннями $0,\1,\2$ та їх ймовірностями, тобто:

$\begin(array)(|c|c|)
\hline
\xi & 0 & 1 & 2 \\
\hline
P(\xi) & 0,25 & 0,5 & 0,25 \\
\hline
\end(array)$

Сума ймовірностей у законі розподілу має дорівнювати $1$, тобто $\sum _(i=1)^(n)P(\xi _((rm i)))=0,25+0,5+0, 25 = 1 $.

Математичне очікування $M\left(\xi \right)=np=2\cdot 0,5=1$, дисперсія $D\left(\xi \right)=np\left(1-p\right)=2\ cdot 0,5 \ cdot 0,5 = 0,5 $, середнє квадратичне відхилення$\sigma \left(\xi \right)=\sqrt(D\left(\xi \right))=\sqrt(0,5)\approx 0,707 $.

2. Закон розподілу Пуассона.

Якщо дискретна випадкова величина $X$ може набувати лише цілі невід'ємні значення $0,\ 1,\ 2,\ \dots ,\ n$ з ймовірностями $P\left(X=k\right)=(((\lambda )^k )\over (k}\cdot e^{-\lambda }$, то говорят, что она подчинена закону распределения Пуассона с параметром $\lambda $. Для такой случайной величины математическое ожидание и дисперсия равны между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda $.!}

Зауваження. Особливість цього розподілу полягає в тому, що ми на підставі досвідчених даних знаходимо оцінки $M\left(X\right),\ D\left(X\right)$, якщо отримані оцінки близькі між собою, то у нас є підстава стверджувати, що випадкова величина підпорядкована закону розподілу Пуассона.

приклад . Прикладами випадкових величин, підпорядкованих закону розподілу Пуассона, може бути: кількість автомашин, які будуть обслужені завтра автозаправною станцією; число бракованих виробів у виробленій продукції.

приклад . Завод відправив на базу $500 $ виробів. Імовірність пошкодження виробу на шляху дорівнює $0,002$. Знайти закон розподілу випадкової величини $X$, що дорівнює кількості пошкоджених виробів; чому дорівнює $ M \ left (X \ right), \ D \ left (X \ right) $.

Нехай дискретна випадкова величина $X$ – кількість пошкоджених виробів. Така випадкова величина підпорядкована закону розподілу Пуассона з параметром $ lambda = np = 500 cdot 0,002 = 1 $. Імовірності значень дорівнюють $P\left(X=k\right)=(((\lambda )^k)\over (k}\cdot e^{-\lambda }$. Очевидно, что все вероятности всех значений $X=0,\ 1,\ \dots ,\ 500$ перечислить невозможно, поэтому мы ограничимся лишь первыми несколькими значениями.!}

$P\left(X=0\right)=((1^0)\over (0}\cdot e^{-1}=0,368;$!}

$P\left(X=1\right)=((1^1)\over (1}\cdot e^{-1}=0,368;$!}

$P\left(X=2\right)=((1^2)\over (2}\cdot e^{-1}=0,184;$!}

$P\left(X=3\right)=((1^3)\over (3}\cdot e^{-1}=0,061;$!}

$P\left(X=4\right)=((1^4)\over (4}\cdot e^{-1}=0,015;$!}

$P\left(X=5\right)=((1^5)\over (5}\cdot e^{-1}=0,003;$!}

$P\left(X=6\right)=((1^6)\over (6}\cdot e^{-1}=0,001;$!}

$P\left(X=k\right)=(((\lambda )^k)\over (k}\cdot e^{-\lambda }$!}

Закон розподілу випадкової величини $X$:

$\begin(array)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 & 4 & 5 & 6 & ... & k \\
\hline
P_i & 0,368; & 0,368 & 0,184 & 0,061 & 0,015 & 0,003 & 0,001 & ... & (((\lambda )^k)\over (k}\cdot e^{-\lambda } \\!}
\hline
\end(array)$

Для такої випадкової величини математичне очікування і дисперсія рівним між собою і рівні параметру $ lambda $, тобто $ M left (X right) = D left (X right) = lambda = 1 $.

3. Геометричний закон розподілу.

Якщо дискретна випадкова величина $X$ може приймати тільки натуральні значення $1,\2,\dots,\n$ з ймовірностями $P\left(X=k\right)=p(\left(1-p\right)) ^ (k-1), k = 1, 2, 3, dots $, то кажуть, що така випадкова величина $ X $ підпорядкована геометричному закону розподілу ймовірностей. Фактично, геометричне розподілу є випробування Бернуллі до першого успіху.

приклад . Прикладами випадкових величин, що мають геометричний розподіл, можуть бути: число пострілів до першого влучення в ціль; кількість випробувань приладу до першої відмови; число кидань монети до першого випадання орла тощо.

Математичне очікування і дисперсія випадкової величини, підпорядкованої геометричному розподілу, відповідно дорівнюють $M\left(X\right)=1/p$, $D\left(X\right)=\left(1-p\right)/p^ 2 $.

приклад . На шляху руху риби до місця нересту знаходиться $4$ шлюзу. Можливість проходу риби через кожен шлюз $p=3/5$. Побудувати низку розподілу випадкової величини $X$ - число шлюзів, пройдених рибою до першого затримання біля шлюзу. Знайти $ M \ left (X \ right), \ D \ left (X \ right), \ \ sigma \ left (X \ right) $.

Нехай випадкова величина $X$ - кількість шлюзів, пройдених рибою до першого затримання біля шлюзу. Така випадкова величина підпорядкована геометричному закону розподілу ймовірностей. Значення, які може набувати випадкова величина $X:$ 1, 2, 3, 4. Імовірності цих значень обчислюються за формулою: $P\left(X=k\right)=pq^(k-1)$, де: $ p=2/5$ - можливість затримання риби через шлюз, $q=1-p=3/5$ - можливість проходу риби через шлюз, $k=1,\ 2,\ 3,\ 4$.

$P\left(X=1\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^0=((2)\ over (5)) = 0,4;

$ P \ left (X = 2 \ right) = ((2) \ over (5)) \ cdot ((3) \ over (5)) = ((6) \ over (25)) = 0,24; $

$P\left(X=3\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^2=((2)\ over (5)) \ cdot ((9) \ over (25)) = ((18) \ over (125)) = 0,144;

$P\left(X=4\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^3+(\left(( (3) \ over (5)) \ right)) ^ 4 = ((27) \ over (125)) = 0,216.

$\begin(array)(|c|c|)
\hline
X_i & 1 & 2 & 3 & 4 \\
\hline
P\left(X_i\right) & 0,4 & 0,24 & 0,144 & 0,216 \\
\hline
\end(array)$

Математичне очікування:

$M\left(Xright)=sum^n_(i=1)(x_ip_i)=1cdot 0,4+2cdot 0,24+3cdot 0,144+4cdot 0,216=2,176.$

Дисперсія:

$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2=)0,4\cdot (\ left(1-2,176\right))^2+0,24\cdot (\left(2-2,176\right))^2+0,144\cdot (\left(3-2,176\right))^2+$

$ + \ 0,216 \ cdot ( \ left (4-2,176 \ right)) ^ 2 \ approx 1,377. $

Середнє квадратичне відхилення:

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(1,377)\approx 1,173.$

4. Гіпергеометричний закон розподілу.

Якщо $N$ об'єктів, серед яких $m$ об'єктів мають задану властивість. Випадковим чином без повернення витягують $n$ об'єктів, серед яких виявилося $k$ об'єктів, що мають задану властивість. Гіпергеометричний розподіл дає можливість оцінити ймовірність того, що рівно $k$ об'єктів у вибірці мають задану властивість. Нехай випадкова величина $X$ - кількість об'єктів у вибірці, що мають задану властивість. Тоді ймовірність значень випадкової величини $X$:

$P\left(X=k\right)=((C^k_mC^(n-k)_(N-m))\over (C^n_N))$

Зауваження. Статистична функція Гіпергеомет майстра функцій $f_x$ пакета Excel дає можливість визначити ймовірність того, що певна кількість випробувань буде успішною.

$f_x\to $ статистичні$\to $ ГІПЕРГЕОМЕТ$\to $ ОК. Відобразиться діалогове вікно, яке потрібно заповнити. В графі Число_успіхів_у_вибірцівказуємо значення $k$. Розмір_вибіркидорівнює $n$. В графі Число_успіхів_в_сукупностівказуємо значення $m$. Розмір_сукупностідорівнює $N$.

Математичне очікування і дисперсія дискретної випадкової величини $X$, підпорядкованої геометричному закону розподілу, відповідно дорівнюють $M\left(X\right)=nm/N$, $D\left(X\right)=((nm\left(1) -((m)\over (N))\right)\left(1-((n)\over (N))\right))\over (N-1))$.

приклад . У кредитному відділі банку працюють 5 спеціалістів з вищою фінансовою освітою та 3 спеціалісти з вищою юридичною освітою. Керівництво банку вирішило направити трьох фахівців Для підвищення кваліфікації, відбираючи їх у випадковому порядку.

а) Складіть ряд розподілу числа фахівців із вищою фінансовою освітою, які можуть бути спрямовані на підвищення кваліфікації;

б) Знайдіть числові показники цього розподілу.

Нехай випадкова величина $X$ - кількість фахівців із вищою фінансовою освітою серед трьох відібраних. Значення, які може набувати $X:0,\ 1,\ 2,\ 3$. Дана випадкова величина $X$ розподілена за гіпергеометричним розподілом з параметрами: $N=8$ - розмір сукупності, $m=5$ - кількість успіхів у сукупності, $n=3$ - розмір вибірки, $k=0,\ 1, \ 2, \ 3 $ - кількість успіхів у вибірці. Тоді ймовірності $P\left(X=k\right)$ можна розрахувати за формулою: $P(X=k)=(C_(m)^(k) \cdot C_(N-m)^(n-k) \over C_( N) ^ (n)) $. Маємо:

$P\left(X=0\right)=((C^0_5\cdot C^3_3)\over (C^3_8))=((1)\over (56))\approx 0,018;$

$P\left(X=1\right)=((C^1_5\cdot C^2_3)\over (C^3_8))=((15)\over (56))\approx 0,268;$

$P\left(X=2\right)=((C^2_5\cdot C^1_3)\over (C^3_8))=((15)\over (28))\approx 0,536;$

$P\left(X=3\right)=((C^3_5\cdot C^0_3)\over (C^3_8))=((5)\over (28))\approx 0,179.$

Тоді ряд розподілу випадкової величини $X$:

$\begin(array)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 \\
\hline
p_i & 0,018 & 0,268 & 0,536 & 0,179 \\
\hline
\end(array)$

Розрахуємо числові характеристики випадкової величини $X$ за загальними формулами гіпергеометричного розподілу.

$M\left(Xright)=((nm)\over (N))=((3\cdot 5)\over (8))=((15)\over (8))=1,875.$

$D\left(X\right)=((nm\left(1-((m)\over (N))\right)\left(1-((n)\over (N))\right)) \over (N-1))=((3\cdot 5\cdot \left(1-((5)\over (8))\right)\cdot \left(1-((3)\over (8) ))\right))\over (8-1))=((225)\over (448))\approx 0,502.$

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(0,502)\approx 0,7085.$

Статистика приходить до нас на допомогу при вирішенні багатьох завдань, наприклад: коли немає можливості побудувати детерміновану модель, коли занадто багато факторів або коли нам необхідно оцінити правдоподібність побудованої моделі з урахуванням наявних даних. Ставлення до статистики неоднозначне. Є думка, що існує три види брехні: брехня, Нагла брехнята статистика. З іншого боку, багато «користувачів» статистики надто їй вірять, не розуміючи до кінця, як вона працює: застосовуючи, наприклад, тест до будь-яких даних без перевірки їхньої нормальності. Така недбалість здатна породжувати серйозні помилки і перетворювати «шанувальників» тесту на ненависників статистики. Спробуємо поставити струми над і розібратися, які моделі випадкових величин повинні використовуватися для опису тих чи інших явищ і яка між ними існує генетичний зв'язок.

Насамперед, цей матеріал буде цікавий студентам, які вивчають теорію ймовірностей та статистику, хоча й «зрілі» фахівці зможуть його використовувати як довідник. В одній із наступних робіт я покажу приклад використання статистики для побудови тесту оцінки значущості показників біржових торгових стратегій.

У роботі будуть розглянуті:


Наприкінці статті буде поставлено для роздумів. Свої роздуми щодо цього я викладу в наступній статті.

Деякі з наведених безперервних розподілів є окремими випадками.

Дискретні розподіли

Дискретні розподіли використовуються для опису подій з характеристиками, що не диференціюються, визначеними в ізольованих точках. Простіше кажучи, для подій, результат яких може бути віднесений до деякої дискретної категорії: успіх або невдача, ціле число (наприклад, гра в рулетку, кістки), орел або решка і т.д.

Описується дискретний розподіл ймовірністю настання кожного з можливих наслідків події. Як і будь-якого розподілу (зокрема безперервного) для дискретних подій визначено поняття матожидания і дисперсії. Однак, слід розуміти, що матожидання для дискретної випадкової події - величина в загальному випадкунереалізована як результат одиночної випадкової події, а скоріше як величина, якої буде прагнути середнє арифметичне результатів подій зі збільшенням їх кількості.

У моделюванні дискретних випадкових подій важливу роль відіграє комбінаторика, тому що ймовірність результату події можна визначити як відношення кількості комбінацій, що дають необхідний результат загальної кількості комбінацій. Наприклад: у кошику лежать 3 білих м'ячі та 7 чорних. Коли ми вибираємо з кошика 1 м'яч, ми можемо зробити це 10-м різними способами(загальна кількість комбінацій), але лише 3 варіанти, за яких буде обрано білий м'яч(3 комбінації, що дають необхідний результат). Таким чином, можливість вибрати білий м'яч: ().

Слід також відрізняти вибірки з поверненням та без повернення. Наприклад, для опису ймовірності вибору двох білих м'ячів важливо визначити, чи перший м'яч буде повернуто до кошика. Якщо ні, то ми маємо справу з вибіркою без повернення () і ймовірність буде така: - ймовірність вибрати білий м'яч з початкової вибірки помножена на ймовірність знову вибрати білий м'яч із решти кошика. Якщо перший м'яч повертається у кошик, це вибірка з поверненням (). І тут ймовірність вибору двох білих м'ячів складе .

Якщо кілька формалізувати приклад з кошиком наступним чином: нехай результат події може приймати одне з двох значень 0 або 1 з ймовірностями і відповідно, тоді розподіл ймовірності отримання кожного із запропонованих результатів буде називатися розподіл Бернуллі:

За традицією, що склалася, результат зі значенням 1 називається «успіх», а результат зі значенням 0 - «невдача». Очевидно, що отримання результату «успіх чи невдача» настає з ймовірністю.

Матерікування та дисперсія розподілу Бернуллі:


Кількість успіхів у випробуваннях, результат яких розподілений з ймовірністю успіху (приклад з поверненням м'ячів у кошик), описується біномним розподілом:


Інакше можна сказати, що биномиальное розподіл визначає суму з незалежних випадкових величин, які вміють розподіл із ймовірністю успіху .
Мотовидання та дисперсія:



Біноміальний розподіл справедливий тільки для вибірки з поверненням, тобто коли ймовірність успіху залишається постійною для всієї серії випробувань.

Якщо величини і мають біномні розподіли з параметрами і відповідно, їх сума також буде розподілена біномно з параметрами .

Уявимо ситуацію, що ми витягуємо м'ячі з кошика і повертаємо назад доти, доки не буде витягнута біла куля. Кількість таких операцій описується геометричним розподілом. Іншими словами: геометричний розподіл визначає кількість випробувань до першого успіху при ймовірності настання успіху в кожному випробуванні. Якщо мається на увазі номер випробування, в якому настав успіх, то геометричний розподіл описуватиметься такою формулою:


Маточування та дисперсія геометричного розподілу:

Геометричний розподіл генетично пов'язаний з розподілом, який описує безперервну випадкову величину: час до настання події, за постійної інтенсивності подій. Геометричний розподіл також є окремим випадком.

Розподіл Паскаля є узагальненням розподілу: описує розподіл кількості невдач у незалежних випробуваннях, Результат яких розподілений з ймовірністю успіху до настання успіхів у сумі. При, ми отримаємо розподіл для величини.


де - Число поєднань з .

Маточування та дисперсія негативного біномного розподілу:



Сума незалежних випадкових величин, розподілених за Паскалем, також розподілена за Паскалем: нехай має розподіл , а - . Нехай також і незалежні, тоді їхня сума матиме розподіл

Досі ми розглядали приклади вибірок із поверненням, тобто, ймовірність результату не змінювалася від випробування до випробування.

Тепер розглянемо ситуацію без повернення та опишемо ймовірність кількості успішних вибірок із сукупності із заздалегідь відомою кількістю успіхів та невдач (заздалегідь відома кількість білих та чорних м'ячів у кошику, козирних карт у колоді, бракованих деталей у партії тощо).

Нехай загальна сукупність містить об'єктів, їх позначені як «1», бо як «0». Вважатимемо вибір об'єкта з міткою «1», як успіх, а з міткою «0» як невдачу. Проведемо n випробувань, причому обрані об'єкти більше не братимуть участь у подальших випробуваннях. Імовірність настання успіхів підпорядковуватиметься гіпергеометричному розподілу:


де - Число поєднань з .

Мотовидання та дисперсія:


Розподіл Пуассона


(взято звідси)

Розподіл Пуассона значно відрізняється від розглянутих вище розподілів своєю «предметною» областю: тепер розглядається не ймовірність настання того чи іншого результату випробування, а інтенсивність подій, тобто середня кількість подій за одиницю часу.

Розподіл Пуассона описує ймовірність настання незалежних подій за час при середній інтенсивності подій:


Маточування та дисперсія розподілу Пуассона:

Дисперсія та маточіння розподілу Пуассона тотожно рівні.

Розподіл Пуассона у поєднанні з , що описує інтервали часу між настаннями незалежних подій, становлять математичну основу теорії надійності.

Щільність ймовірності добутку випадкових величин x і y () з розподілами і може бути обчислена наступним чином:

Деякі з наведених нижче розподілів є окремими випадками розподілу Пірсона, який, у свою чергу, є рішенням рівняння:


де - параметри розподілу. Відомі 12 типів розподілу Пірсона залежно від значень параметрів.

Розподіли, які будуть розглянуті у цьому розділі, мають тісні взаємозв'язки між собою. Ці зв'язки виражаються в тому, що деякі розподіли є окремими випадками інших розподілів, або описують перетворення випадкових величин, що мають інші розподіли.

На наведеній нижче схемі відбито взаємозв'язки між деякими з безперервних розподілів, які будуть розглянуті в цій роботі. На схемі суцільними стрілками показано перетворення випадкових величин (початок стрілки вказує на початковий розподіл, кінець стрілки - на результуюче), а пунктирними - відношення узагальнення (початок стрілки вказує на розподіл, що є окремим випадком того, на яке вказує кінець стрілки). Для окремих випадків розподілу Пірсона над пунктирними стрілками вказано відповідний тип розподілу Пірсона.


Запропонований нижче огляд розподілів охоплює багато випадків, які трапляються в аналізі даних та моделюванні процесів, хоча, звичайно, і не містить абсолютно всі відомі науці розподілу.

Нормальний розподіл (розподіл Гауса)


(взято звідси)

Щільність ймовірності нормального розподілу з параметрами та описується функцією Гауса:

Якщо і , то такий розподіл називається стандартним.

Маточування та дисперсія нормального розподілу:



Область визначення нормального розподілу – безліч дійсних чисел.

Нормальним розподілом є розподіл типу VI.

Сума квадратів незалежних нормальних величин має, а відношення незалежних гаусових величин розподілено по.

Нормальний розподіл є нескінченно ділимим: сума нормально розподілених величин і з параметрами і відповідно також має нормальний розподілз параметрами , де та .

Нормальний розподіл добре моделює величини, що описують природні явища, шуми термодинамічної природи та похибки вимірювань

Крім того, згідно з центральною граничною теоремою, сума великої кількості незалежних доданків одного порядку сходить до нормального розподілу, незалежно від розподілів доданків. Завдяки цій властивості, нормальний розподіл популярний у статистичному аналізі, багато статистичних тестів розраховані на нормально розподілені дані.

На нескінченній ділимості нормального розподілу заснований z-тест. Цей тест використовується для перевірки рівності маточіння вибірки нормально розподілених величин деякого значення. Значення дисперсії має бути відомо. Якщо значення дисперсії невідоме і розраховується на підставі аналізованої вибірки, застосовується t-тест, заснований на .

Нехай у нас є вибірка обсягом n незалежних нормально розподілених величин з генеральної сукупностізі стандартним відхиленнямвисунемо гіпотезу, що . Тоді величина матиме стандартний нормальний розподіл. Порівнюючи отримане значення z з квантилами стандартного розподілу, можна приймати або відхиляти гіпотезу з необхідним рівнем значущості.

Завдяки широкій поширеності розподілу Гаусса, багато дослідників, які не дуже добре знають статистику, забувають перевіряти дані на нормальність, або оцінюють графік щільності розподілу «на вічко», сліпо вважаючи, що мають справу з Гаусовими даними. Відповідно, сміливо застосовуючи тести, призначені для нормального розподілу та отримуючи зовсім некоректні результати. Напевно, звідси й пішла чутка про статистику як найстрашніший вид брехні.

Розглянемо приклад: нам треба виміряти опір набору резистрів певного номіналу. Опір має фізичну природу, логічно припустити, що розподіл відхилень опору від номіналу буде нормальним. Вимірюємо, отримуємо дзвонову функцію щільності ймовірності для виміряних значень з модою в околиці номіналу резистрів. Це нормальний розподіл? Якщо так, то шукатимемо браковані резистри використовуючи , або z-тест, якщо нам заздалегідь відома дисперсія розподілу. Думаю, що багато хто саме так і вчинить.

Але давайте уважніше подивимося на технологію вимірювання опору: опір визначається як відношення прикладеної напруги до струму, що протікає. Струм і напруга ми вимірювали приладами, які, своєю чергою, мають нормально розподілені похибки. Тобто, виміряні значення струму та напруги - це нормально розподілені випадкові величиниз маточуваннями, що відповідають істинним значенням вимірюваних величин. І це означає, що отримані значення опору розподілені по , а чи не по Гауссу.

Розподіл описує суму квадратів випадкових величин, кожна з яких розподілена за стандартним нормальному закону :

Де - Число ступенів свободи, .

Маточування та дисперсія розподілу:



Область визначення - безліч невід'ємних натуральних чисел. є нескінченно поділеним розподілом. Якщо і - розподілені за і мають і ступенів свободи відповідно, то їх сума також буде розподілена і мати ступенів свободи.

Є окремим випадком (а отже, розподілом типу III) та узагальненням. Відношення величин, розподілених за розподілено по .

На розподілі засновано критерій згоди Пірсона. з допомогою цього критерію можна перевіряти достовірність приналежності вибірки випадкової величини деякому теоретичному розподілу.

Припустимо, що ми маємо вибірка деякої випадкової величини . На підставі цієї вибірки розрахуємо ймовірність потрапляння значень до інтервалів (). Нехай також є припущення про аналітичний вираз розподілу, відповідно до якого, ймовірності попадання у вибрані інтервали повинні становити . Тоді величини будуть розподілені за нормальним законом.

Наведемо до стандартного нормального розподілу: ,
де і .

Отримані величини мають нормальний розподіл з параметрами (0, 1), а отже, сума їх квадратів розподілена за ступенем свободи. Зниження ступеня свободи пов'язане з додатковим обмеженням на суму ймовірностей потрапляння значень в інтервали: вона повинна дорівнювати 1.

Порівнюючи значення з квантилями розподілу, можна прийняти або відхилити гіпотезу про теоретичний розподіл даних з необхідним рівнем значущості.

Розподіл Стьюдента використовується для проведення t-тесту: тесту на рівність маточіння вибірки розподілених випадкових величин деякому значенню, або рівності маточінь двох вибірок з однаковою дисперсією (рівність дисперсій необхідно перевіряти). Розподіл Стьюдента описує відношення розподіленої випадкової величини до величини, розподіленої на .

Нехай і незалежні випадкові величини, що мають ступеня свободи і відповідно. Тоді величина матиме розподіл Фішера зі ступенями свободи, а величина - розподіл Фішера зі ступенями свободи.
Розподіл Фішера визначений для дійсних невід'ємних аргументів і має щільність ймовірності:


Маточування та дисперсія розподілу Фішера:



Маточкування визначено для , а диспересія - для .

На розподілі Фішера засновано ряд статистичних тестів, таких як оцінка значущості параметрів регресії, тест на гетероскедастичність та тест на рівність дисперсій вибірок (f-тест слід відрізняти від точноготіста Фішера).

F-тест: нехай є дві незалежні вибірки та розподілені дані обсягами і відповідно. Висунемо гіпотезу про рівність дисперсій вибірок та перевіримо її статистично.

Розрахуємо величину. Вона матиме розподіл Фішера зі ступенями свободи.

Порівнюючи значення з квантилями відповідного розподілу Фішера, ми можемо прийняти або відхилити гіпотезу про рівність дисперсій вибірок із потрібним рівнем значущості.

Експоненційний (показовий) розподіл та розподіл Лапласу (подвійний експоненціальний, подвійний показовий)


(взято звідси)

Експонентний розподіл описує інтервали часу між незалежними подіями, що відбуваються із середньою інтенсивністю. Кількість настання такої події за деякий відрізок часу описується дискретним. Експоненційний розподіл разом з складають математичну основу теорії надійності.

Крім теорії надійності, експоненціальний розподіл застосовується в описі соціальних явищ, в економіці, теорії масового обслуговування, у транспортній логістиці – скрізь, де необхідно моделювати потік подій.

Експоненційний розподіл є окремим випадком (для n=2), а отже, і . Так як експоненційно розподілена величина є величиною хі-квадрат з 2-ма ступенями свободи, то вона може бути інтерпретована як сума квадратів двох незалежних нормально розподілених величин.

Крім того, експоненційний розподіл є чесним випадком

Розглянемо геометричний розподіл, обчислимо його математичне очікування та дисперсію. За допомогою функції MS EXCEL ОТРБІНОМ.РАСП() побудуємо графіки функції розподілу та щільності ймовірності.

Геометричний розподіл(англ. Geometric distribution) є окремим випадком (при r=1).

Нехай проводяться випробування, у кожному з яких може відбутися лише подія «успіх» з ймовірністю p або подія «невдача» з ймовірністю q =1-p().

Визначимо x як номер випробування, в якому було зареєстровано перший успіх. У цьому випадку випадкова величина x буде мати Геометричний розподіл:

Геометричний розподіл у MS EXCEL

У MS EXCEL, починаючи з версії 2010, для Негативного Біноміального розподілу є функція ОТРБІНОМ.РАСП() , англійська назва NEGBINOM.DIST(), яка дозволяє обчислити ймовірність виникнення кількості невдачдо отримання заданого числа успіху при заданої ймовірностіуспіху.

Для Геометричного розподілудругий аргумент цієї функції має бути 1, т.к. нас цікавить лише перший успіх.

Це визначення дещо відрізняється від формулювання наведеного вище, де обчислюється ймовірність, що перший успіх відбудеться після xвипробувань. Відмінність зводиться до діапазону зміни діапазону x: якщо ймовірність визначена через кількість випробувань, то хможе набувати значень починаючи з 1, а якщо через кількість невдач, то – починаючи з 0. Тому справедлива формула: p(x_ невдач) = p (x_ випробувань-1). Див. файл приклад лист Приклад, де наведено 2 способи розрахунку.

Нижче використовується підхід, прийнятий функції MS EXCEL: через кількість невдач.

Щоб обчислити функцію щільності ймовірності p(x), див. формулу вище, необхідно встановити четвертий аргумент функції ОТРБИНОМ.РАСП() рівним БРЕХНЯ. Для обчислення , необхідно встановити четвертий аргумент рівним ІСТИНА.

Примітка : До MS EXCEL 2010 у EXCEL була функція ОТРБІНОМРАСП() , яка дозволяє обчислити тільки щільність імовірності. У файлі прикладу наведено формулу на основі функції ОТРБІНОМРАСП() для обчислення інтегральної функції розподілу. Там же наведено формулу для обчислення ймовірності через визначення.

У файлі прикладу наведено графіки густини розподілу ймовірностіі інтегральної функції розподілу.

Примітка: Для зручності написання формул для параметра p у прикладному файлі створено .

Примітка: У функції ОТРБІНОМ.РАСП( ) при нецілому значенні х, . Наприклад, такі формули повернуть одне й теж значення:
ОТРБІНОМ.РАСП( 2 ; 1; 0,4; ІСТИНА) =
ОТРБІНОМ.РАСП( 2,9 ; 1; 0,4; ІСТИНА)

Завдання

Розв'язання задач наведено в файл прикладу на аркуші Приклад.

Завдання1. Нафтова компанія бурить свердловини для видобутку нафти. Імовірність виявити нафту в свердловині дорівнює 20%.
Яка ймовірність, що першу нафту буде отримано саме у третю спробу?
Яка ймовірність, що для виявлення першої нафти потрібно три спроби?
Рішення1:
= ОТРБІНОМ.РАСП(3-1; 1; 0,2; БРЕХНЯ)
=ОТРБІНОМ.РАСП(3-1; 1; 0,2; ІСТИНА)

Задача2. Рейтингове агентство робить опитування випадкових перехожих у місті про улюблену марку автомобіля. Нехай відомо, що у 1% городян улюбленим автомобілем є LadaGranta. Яка ймовірність, що зустріти першого шанувальника цієї марки автомобіля після опитування 10 людей?
Рішення2: =ОТРБІНОМ.РАСП(10-1; 1; 0,01; ІСТИНА)=9,56%

Поділіться з друзями або збережіть для себе:

Завантаження...