Дисперсія екзогенних змінних формул. Розрахунок групової, міжгрупової та загальної дисперсії (за правилом складання дисперсій)

За даними вибіркового обстеження проведено угруповання вкладників за розміром вкладу в Ощадбанку міста:

Визначте:

1) розмах варіації;

2) середній розмір вкладу;

3) середнє лінійне відхилення;

4) дисперсію;

5) середнє квадратичне відхилення;

6) коефіцієнт варіації вкладів.

Рішення:

Цей ряд розподілу містить відкриті інтервали. У таких рядах умовно приймається величина інтервалу першої групи дорівнює величині інтервалу наступної, а величина інтервалу останньої групидорівнює величині інтервалу попередньої.

Величина інтервалу другої групи дорівнює 200, отже, і величина першої групи також дорівнює 200. Величина інтервалу передостанньої групи дорівнює 200, отже останній інтервал матиме величину, рівну 200.

1) Визначимо розмах варіації як різницю між найбільшим та найменшим значенням ознаки:

Розмах варіації обсягу вкладу дорівнює 1000 рублів.

2) Середній розмір вкладу визначимо за формулою середньої арифметичної зваженої.

Попередньо визначимо дискретну величинуознаки у кожному інтервалі. Для цього за формулою середньої арифметичної простий знайдемо середини інтервалів.

Середнє значення першого інтервалу дорівнюватиме:

другого - 500 і т.д.

Занесемо результати обчислень до таблиці:

Розмір внеску, руб.Число вкладників, fСередина інтервалу, хxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Разом 400 - 312000

Середній розмір вкладу в Ощадбанку міста дорівнюватиме 780 рублів:

3) Середнє лінійне відхилення є середня арифметична абсолютних відхиленьокремих значень ознаки від загальної середньої:

Порядок розрахунку середнього лінійного відхилення в інтервальному ряду розподілу наступний:

1. Обчислюється середня арифметична зважена, як показано у п. 2).

2. Визначаються абсолютні відхилення варіантів від середньої:

3. Отримані відхилення множаться на частоти:

4. Знаходиться сума зважених відхилень без урахування знака:

5. Сума зважених відхилень ділиться на суму частот:

Зручно користуватися таблицею розрахункових даних:

Розмір внеску, руб.Число вкладників, fСередина інтервалу, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Разом 400 - - - 81280

Середнє лінійне відхилення обсягу вкладу клієнтів Ощадбанку становить 203,2 рубля.

4) Дисперсія – це середня арифметична квадратів відхилень кожного значення ознаки від середньої арифметичної.

Розрахунок дисперсії в інтервальних рядах розподілу провадиться за формулою:

Порядок розрахунку дисперсії у разі наступний:

1. Визначають середню арифметичну зважену, як показано у п. 2).

2. Знаходять відхилення варіант від середньої:

3. Зводять у квадрат відхилення кожної варіанти від середньої:

4. Помножують квадрати відхилень на ваги (частоти):

5. Підсумовують отримані твори:

6. Отримана сума поділяється на суму ваг (частот):

Розрахунки оформимо до таблиці:

Розмір внеску, руб.Число вкладників, fСередина інтервалу, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Разом 400 - - - 23040000

.

Назад, якщо - невід'ємна п.в. функція, така що , то є абсолютно безперервна ймовірнісна міра на така, що є її щільністю.

    Заміна заходу в інтегралі Лебега:

,

де будь-яка борелівська функція, що інтегрується щодо ймовірнісної міри .

Дисперсія, види та властивості дисперсії Поняття дисперсії

Дисперсія у статистицізнаходиться як середнє квадратичне відхилення індивідуальних значень ознаки у квадраті від середньої арифметичної. Залежно від вихідних даних вона визначається за формулами простої та зваженої дисперсій:

1. Проста дисперсія(Для несгрупованих даних) обчислюється за формулою:

2. Зважена дисперсія (для варіаційного ряду):

де n – частота (повторюваність фактора Х)

Приклад знаходження дисперсії

На цій сторінці описано стандартний приклад знаходження дисперсії, також Ви можете переглянути інші завдання на її знаходження

Приклад 1. Визначення групової, середньої з групової, міжгрупової та загальної дисперсії

Приклад 2. Знаходження дисперсії та коефіцієнта варіації у групувальній таблиці

Приклад 3. Знаходження дисперсії у дискретному ряду

Приклад 4. Є такі дані щодо групи з 20 студентів заочного відділення. Потрібно побудувати інтервальний ряд розподілу ознаки, розрахувати середнє значення ознаки та вивчити його дисперсію

Побудуємо інтервальне угруповання. Визначимо розмах інтервалу за формулою:

де X max - максимальне значення групувального ознаки; X min-мінімальне значення групувальної ознаки; n – кількість інтервалів:

Приймаємо n=5. Крок дорівнює: h = (192 - 159) / 5 = 6,6

Складемо інтервальне угруповання

Для подальших розрахунків збудуємо допоміжну таблицю:

X"i - середина інтервалу. (наприклад середина інтервалу 159 - 165,6 = 162,3)

Середню величину зростання студентів визначимо за формулою середньої арифметичної зваженої:

Визначимо дисперсію за такою формулою:

Формулу можна перетворити так:

З цієї формули випливає, що дисперсія дорівнює різниці середньої з квадратів варіантів і квадрата та середньої.

Дисперсія у варіаційних рядахз рівними інтервалами за способом моментів може бути розрахована наступним способом при використанні другої властивості дисперсії (розділивши всі варіанти на величину інтервалу). Визначення дисперсії, обчисленої за способом моментів, за такою формулою менш трудомісткий:

де i – величина інтервалу; А - умовний нуль, як який зручно використовувати середину інтервалу, що володіє найбільшою частотою; m1 – квадрат моменту першого порядку; m2 – момент другого порядку

Дисперсія альтернативної ознаки (якщо в статистичній сукупності ознака змінюється так, що є тільки два варіанти, що взаємно виключають один одного, то така мінливість називається альтернативною) може бути обчислена за формулою:

Підставляючи до цієї формули дисперсії q =1- р, отримуємо:

Види дисперсії

Загальна дисперсіявимірює варіацію ознаки у всій сукупності загалом під впливом всіх чинників, що зумовлюють цю варіацію. Вона дорівнює середньому квадрату відхилень окремих значень ознаки х від загального середнього значення х може бути визначена як проста дисперсія або зважена дисперсія.

Внутрішньогрупова дисперсія характеризує випадкову варіацію, тобто. частина варіації, яка обумовлена ​​впливом неврахованих факторів і не залежить від ознаки-фактора, покладеної в основу угруповання. Така дисперсія дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи X від середньої арифметичної групи і може бути обчислена як проста дисперсія або зважена дисперсія.

Таким чином, внутрішньогрупова дисперсія вимірюєваріацію ознаки всередині групи та визначається за формулою:

де хі - групова середня; ni – число одиниць у групі.

Наприклад, внутрішньогрупові дисперсії, які треба визначити в задачі вивчення впливу кваліфікації робітників на рівень продуктивності праці в цеху показують варіації виробітку в кожній групі, викликані всіма можливими факторами (технічний стан обладнання, забезпеченість інструментами та матеріалами, вік робітників, інтенсивність праці тощо) .), крім відмінностей у кваліфікаційному розряді (всередині групи всі робітники мають одну й ту саму кваліфікацію).

Середня з усередині групових дисперсійвідбиває випадкову варіацію, т. е. ту частину варіації, що відбувалася під впливом всіх інших чинників, крім чинника угруповання. Вона розраховується за такою формулою:

Міжгрупова дисперсіяхарактеризує систематичну варіацію результативної ознаки, яка обумовлена ​​впливом ознаки-фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень групових середніх від загальної середньої. Міжгрупова дисперсія розраховується за такою формулою:

Варіаційний розмах (або розмах варіації)це різниця між максимальним та мінімальним значеннями ознаки:

У прикладі розмах варіації змінної вироблення робочих становить: у першій бригаді R=105-95=10 дет., у другій бригаді R=125-75=50 дет. (У 5 разів більше). Це свідчить, що вироблення 1-ї бригади більш «стійка», але резервів зростання вироблення більше в другій бригади, т.к. у разі досягнення всіма робітниками максимальної для цієї бригади виробітку, нею може бути виготовлено 3*125=375 деталей, а в 1-й бригаді лише 105*3=315 деталей.
Якщо крайні значення ознаки не типові для сукупності, використовують квартильний або децильний розмахи. Квартильний розмах RQ = Q3-Q1 охоплює 50% обсягу сукупності, децильний розмах перший RD1 = D9-D1охоплює 80% даних, другий децильний розмах RD2 = D8-D2 - 60%.
Недоліком показника варіаційного розмахує, але його величина не відбиває всі коливання ознаки.
Найпростішим узагальнюючим показником, що відображає всі коливання ознаки, є середнє лінійне відхилення, що являє собою середню арифметичну абсолютних відхилень окремих варіантів від їх середньої величини:

,
для згрупованих даних
,
де хi - значення ознаки в дискретному ряду або середина інтервалу в інтервальному розподілі.
У вищенаведених формулах різниці в чисельнику взяті за модулем, інакше, згідно з властивістю середньої арифметичної, чисельник завжди дорівнюватиме нулю. Тому середнє лінійне відхилення у статистичній практиці застосовують рідко, лише у випадках, коли підсумовування показників без урахування знака має економічний сенс. З його допомогою, наприклад, аналізується склад працюючих, рентабельність виробництва, оборот зовнішньої торгівлі.
Дисперсія ознаки- Це середній квадрат відхилень варіант від їх середньої величини:
проста дисперсія
,
зважена дисперсія
.
Формулу для розрахунку дисперсії можна спростити:

Таким чином, дисперсія дорівнює різниці середньої з квадратів варіант і квадрата середньої з варіант сукупності:
.
Однак, внаслідок підсумовування квадратів відхилень дисперсія дає спотворене уявлення про відхилення, тому її на основі розраховують середнє квадратичне відхиленнящо показує, наскільки в середньому відхиляються конкретні варіанти ознаки від їхнього середнього значення. Обчислюється шляхом вилучення квадратного кореня з дисперсії:
для несгрупованих даних
,
для варіаційного ряду

Чим менше значеннядисперсії та середнього квадратичного відхилення, тим однорідніша сукупність, тим більш надійною (типовою) буде середня величина.
Середнє лінійне та середнє квадратичне відхилення - іменовані числа, тобто виражаються в одиницях виміру ознаки, ідентичні за змістом та близькі за значенням.
Розраховувати абсолютні показникиваріації рекомендується з допомогою таблиць.
Таблиця 3 - Розрахунок показників варіації (на прикладі терміну даних про змінну вироблення робочих бригади)


Число робітників,

Середина інтервалу,

Розрахункові значення

Разом:

Середнє зміна вироблення робітників:

Середнє лінійне відхилення:

Дисперсія виробітку:

Середнє квадратичне відхилення виробітку окремих робітників від середнього виробітку:
.

1 Розрахунок дисперсії способом моментів

Обчислення дисперсій пов'язане з громіздкими розрахунками (особливо якщо середня величина виражена більшим числомз кількома десятковими знаками). Розрахунки можна спростити, якщо використовувати спрощену формулу та властивості дисперсії.
Дисперсія має такі властивості:

  1. якщо всі значення ознаки зменшити або збільшити на ту саму величину А, то дисперсія від цього не зменшиться:

,

, то чи
Використовуючи властивості дисперсії і спочатку зменшивши всі варіанти сукупності на величину А, а потім розділивши величину інтервалу h, отримаємо формулу обчислення дисперсії в варіаційних рядах з рівними інтервалами способом моментів:
,
де - Дисперсія, обчислена за способом моментів;
h – величина інтервалу варіаційного ряду;
- Нові (перетворені) значення варіант;
А - постійна величина, в якості якої використовують середину інтервалу, що має найбільшу частоту; або варіант, що має максимальну частоту;
- Квадрат моменту першого порядку;
- Момент другого порядку.
Виконаємо розрахунок дисперсії способом моментів на основі даних про змінне вироблення робітників бригади.
Таблиця 4 - Розрахунок дисперсії за способом моментів


Групи робітників з вироблення, шт.

Число робітників,

Середина інтервалу,

Розрахункові значення

Порядок розрахунку:


  1. розраховуємо дисперсію:

2 Розрахунок дисперсії альтернативної ознаки

Серед ознак, що вивчаються статистикою, є такі, яким властиві лише два взаємно виключають значення. Це альтернативні ознаки. Їм надається відповідно два кількісні значення: варіанти 1 і 0. Частиною варіанти 1, яка позначається p, є частка одиниць, що мають дану ознаку. Різниця 1-р=q є частотою варіанти 0. Таким чином,


хі

Середня арифметична альтернативна ознака
, Оскільки p+q=1.

Дисперсія альтернативної ознаки
, т.к. 1-р = q
Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що володіють даною ознакою, і частки одиниць, що не мають цієї ознаки.
Якщо значення 1 і 0 зустрічаються однаково часто, тобто p = q, дисперсія досягає свого максимуму pq = 0,25.
Дисперсія альтернативної ознаки використовується у вибіркових обстеженнях, наприклад, якості продукції.

3 Міжгрупова дисперсія. Правило складання дисперсій

Дисперсія, на відміну інших характеристик варіації, є адитивної величиною. Тобто в сукупності, яка поділена на групи за факторною ознакою х , дисперсія результативної ознаки yможе бути розкладена на дисперсію у кожній групі (внутрішньогрупову) та дисперсію між групами (міжгрупову). Тоді, поряд із вивченням варіації ознаки по всій сукупності загалом, стає можливим вивчення варіації у кожній групі, а також між цими групами.

Загальна дисперсіявимірює варіацію ознаки упо всій сукупності під впливом всіх факторів, що спричинили цю варіацію (відхилення). Вона дорівнює середньому квадрату відхилень окремих значень ознаки увід загальної середньої та може бути обчислена як проста або зважена дисперсія.
Міжгрупова дисперсіяхарактеризує варіацію результативної ознаки у, спричинену впливом ознаки-фактора х, покладеного в основу угруповання. Вона характеризує варіацію групових середніх і дорівнює середньому квадрату відхилень групових середніх від загальної середньої.
,
де – середня арифметична i-та група;
– чисельність одиниць у i-тій групі (частота i-тої групи);
– загальна середня сукупності.
Внутрішньогрупова дисперсіявідбиває випадкову варіацію, т. е. ту частину варіації, що викликана впливом неврахованих чинників і залежить від ознаки-фактора, покладеного основою угруповання. Вона характеризує варіацію індивідуальних значень щодо групових середніх, дорівнює середньому квадрату відхилень окремих значень ознаки увсередині групи від середньої арифметичної цієї групи (групової середньої) та обчислюється як проста або зважена дисперсія для кожної групи:
або ,
де – число одиниць групи.
На підставі внутрішньогрупових дисперсій з кожної групи можна визначити загальну середню із внутрішньогрупових дисперсій:
.
Взаємозв'язок між трьома дисперсіями отримав назву правила складання дисперсій, згідно з яким загальна дисперсія дорівнює сумі міжгрупової дисперсії та середньої з внутрішньогрупових дисперсій:

приклад. При вивченні впливу тарифного розряду (кваліфікації) робітників на рівень продуктивності їхньої праці отримані такі дані.
Таблиця 5 - Розподіл робітників по середньогодинному виробітку.



п/п

Робочі 4-го розряду

Робочі 5-го розряду

Вироблення
робітника, шт.,

Вироблення
робітника, шт.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

У цьому прикладі робітники розділені на дві групи за факторною ознакою х- кваліфікації, що характеризується їх розрядом. Результативна ознака – вироблення – варіюється як під його впливом (міжгрупова варіація), так і за рахунок інших випадкових факторів (внутрішньогрупова варіація). Завдання полягає у вимірі цих варіацій за допомогою трьох дисперсій: загальної, міжгрупової та внутрішньогрупової. Емпіричний коефіцієнт детермінації показує частку варіації результативної ознаки упід впливом факторної ознаки х. Решта загальної варіації увикликана зміною інших чинників.
У прикладі емпіричний коефіцієнт детермінації дорівнює:
або 66,7%,
Це означає, що у 66,7% варіація продуктивність праці робочих зумовлена ​​відмінностями у кваліфікації, але в 33,3% – впливом інших чинників.
Емпіричне кореляційне ставленняпоказує тісноту зв'язку між групувальною та результативними ознаками. Розраховується як квадратний корінь з емпіричного коефіцієнта детермінації:

Емпіричне кореляційне відношення, як і може приймати значення від 0 до 1.
Якщо зв'язок немає, то =0. І тут =0, тобто групові середні рівні між собою міжгрупової варіації немає. Значить групувальний ознака – чинник впливає освіту загальної варіації.
Якщо зв'язок функціональний, то =1. І тут дисперсія групових середніх дорівнює загальної дисперсії (), тобто внутригрупповой варіації немає. Це означає, що групувальна ознака повністю визначає варіацію результативної ознаки, що вивчається.
Чим ближче значення кореляційного відношеннядо одиниці, тим більше, ближче до функціональної залежності зв'язок між ознаками.
Для якісної оцінки тісноти зв'язок між ознаками користуються співвідношеннями Чеддока.

У прикладі , що свідчить про тісний зв'язок між продуктивністю праці робітників та його кваліфікацією.

Однак цієї характеристики ще мало для дослідження випадкової величини. Уявимо двох стрільців, які стріляють по мішені. Один стріляє влучно і потрапляє близько до центру, а інший просто розважається і навіть не цілиться. Але що кумедно, його середнійрезультат буде таким самим, як і в першого стрілка! Цю ситуацію умовно ілюструють такі випадкові величини:

«Снайперське» математичне очікування рівне, проте й у «цікавої особистості»: воно теж нульове!

Таким чином, виникає потреба кількісно оцінити, наскільки далеко розпорошенікулі (значення випадкової величини) щодо центру мішені ( математичного очікування). Ну а розсіюванняз латині перекладається не інакше, як дисперсія .

Подивимося, як визначається ця числова характеристикаодному з прикладів 1-ї частини уроку:

Там ми знайшли невтішне математичне очікування цієї гри, і зараз ми маємо обчислити її дисперсію, яка позначаєтьсячерез.

З'ясуємо, наскільки далеко розкидані виграші/програші щодо середнього значення. Очевидно, що для цього потрібно вирахувати різниціміж значеннями випадкової величиниі її математичним очікуванням:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Тепер начебто потрібно підсумувати результати, але цей шлях не годиться – тому, що коливання вліво взаємознижуватимуться з коливаннями вправо. Так, наприклад, у стрільця-«любителя» (Приклад вище)різниці складуть , і при додаванні дадуть нуль, тому ніякої оцінки розсіювання його стрілянини ми не отримаємо.

Щоб обійти цю неприємність, можна розглянути модулірізниць, але з технічних причин прижився підхід, коли їх зводять у квадрат. Рішення зручніше оформити таблицею:

І тут напрошується вирахувати середньозваженезначення квадратів відхилень. А це що таке? Це їх математичне очікування, яке і є мірилом розсіювання:

визначеннядисперсії. З визначення одразу зрозуміло, що дисперсія не може бути негативною- Візьміть на замітку для практики!

Згадуємо, як знаходити матожидання. Розмножуємо квадрати різниць на відповідні ймовірності (продовження таблиці):
– образно кажучи, це «сила тяги»,
та підсумовуємо результати:

Чи не здається вам, що на тлі виграшів результат вийшов завеликим? Все вірно – ми зводили у квадрат, і щоб повернутися до розмірності нашої гри, потрібно витягти квадратний корінь. Ця величина називається середнім квадратичним відхиленням і позначається грецькою літерою"сигма":

Іноді це значення називають стандартним відхиленням .

У чому його зміст? Якщо ми відхилимося від математичного очікування вліво та вправо на середнє квадратичне відхилення:

– то цьому інтервалі будуть «сконцентровані» найімовірніші значення випадкової величини. Що ми, власне, і спостерігаємо:

Проте так склалося, що з аналізі розсіювання майже завжди оперують поняттям дисперсії. Давайте розберемося, що вона означає стосовно ігор. Якщо у випадку зі стрілками йдеться про «купність» попадань щодо центру мішені, то дисперсія характеризує дві речі:

По-перше, очевидно, що зі збільшенням ставок, дисперсія теж зростає. Так, наприклад, якщо ми збільшимо у 10 разів, то математичне очікування збільшиться у 10 разів, а дисперсія – у 100 разів (якщо це квадратична величина). Але, зауважте, що самі правила гри не змінилися! Змінилися лише ставки, грубо кажучи, раніше ми ставили 10 карбованців, тепер 100.

Другий, цікавіший момент полягає в тому, що дисперсія характеризує стиль гри. Подумки зафіксуємо ігрові ставки на якомусь певному рівні, і подивимося, що тут до чого:

Гра з низькою дисперсією – це обережна гра. Гравець схильний вибирати найнадійніші схеми, де за 1 раз він не програє/виграє занадто багато. Наприклад, система «червоне/чорне» в рулетці (див. Приклад 4 статті Випадкові величини) .

Гра із високою дисперсією. Її часто називають дисперсійноїгрою. Це авантюрний чи агресивний стиль гри, де гравець обирає "адреналінові" схеми. Згадаймо хоча б «Мартінгейл», в якому на кону виявляються суми, що на порядки перевершують «тиху» гру попереднього пункту.

Показовою є ситуація в покері: тут є так звані тайтовігравці, які схильні обережно і «труситися» над своїми ігровими засобами (Банкролом). Не дивно, що їхній банкрол не піддається значним коливанням (низька дисперсія). Навпаки, якщо у гравця висока дисперсія, це агресор. Він часто ризикує, робить великі ставки і може, як зірвати величезний банк, так і програтися вщент.

Те саме відбувається на Форексі, і так далі – прикладів маса.

Причому, у всіх випадках не важливо – чи на копійки йде гра, чи на тисячі доларів. На будь-якому рівні є свої низько- та високодисперсійні гравці. Ну, а за середній виграш, як ми пам'ятаємо, «відповідає» математичне очікування.

Напевно, ви помітили, що знаходження дисперсії – процес тривалий і копіткий. Але математика щедра:

Формула для знаходження дисперсії

Ця формула виводиться безпосередньо з визначення дисперсії, і ми негайно пускаємо їх у оборот. Скопіюю зверху табличку з нашою грою:

і знайдене маточування.

Обчислимо дисперсію другим способом. Спочатку знайдемо математичне очікування – квадрата випадкової величини. за визначення математичного очікування:

В даному випадку:

Таким чином, за формулою:

Як кажуть, відчуйте різницю. І на практиці, звичайно, краще застосовувати формулу (якщо іншого не потребує умова).

Освоюємо техніку рішення та оформлення:

Приклад 6

Знайти її математичне очікування, дисперсію та середнє квадратичне відхилення.

Це завдання зустрічається повсюдно, і, зазвичай, йде без змістовного сенсу.
Можете уявляти кілька лампочок з числами, які загоряються в дурдомі з певними ймовірностями:)

Рішення: Основні обчислення зручно звести до таблиці Спочатку у верхні два рядки записуємо вихідні дані. Потім розраховуємо твори, потім і, нарешті, суми у правому стовпці:

Власне, майже все готове. У третьому рядку намалювалося готове математичне очікування: .

Дисперсію обчислимо за такою формулою:

І, нарешті, середнє квадратичне відхилення:
- особисто я зазвичай округляю до 2 знаків після коми.

Усі обчислення можна провести на калькуляторі, а ще краще – в Екселі:

ось тут вже важко помилитися:)

Відповідь:

Бажаючі можуть ще більше спростити своє життя та скористатися моїм калькулятором (Демо), який не тільки миттєво вирішить це завдання, а й побудує тематичні графіки (скоро дійдемо). Програму можна скачати в бібліотеці- якщо ви завантажили хоча б один навчальний матеріал, або отримати іншим способом. Дякуємо за підтримку проекту!

Пара завдань для самостійного вирішення:

Приклад 7

Обчислити дисперсію випадкової величини попереднього прикладу визначення.

І аналогічний приклад:

Приклад 8

Дискретна випадкова величина задана своїм законом розподілу:

Так, значення випадкової величини бувають досить великими (Приклад із реальної роботи), і тут, по можливості, використовуйте Ексель. Як, до речі, і в Прімері 7 – це швидше, надійніше та приємніше.

Рішення та відповіді внизу сторінки.

На закінчення 2-ї частини уроку розберемо ще одне типове завдання, можна сказати, невеликий ребус:

Приклад 9

Дискретна випадкова величина може набувати лише два значення: і , причому . Відома ймовірність, математичне очікування та дисперсія.

Рішення: почнемо з невідомої ймовірності Так як випадкова величина може прийняти лише два значення, то сума ймовірностей відповідних подій:

і оскільки, то.

Залишилося знайти …, легко сказати:) Але так гаразд, понеслося. За визначенням математичного очікування:
- Підставляємо відомі величини:

- І більше з цього рівняння нічого не вичавити, хіба що можна переписати його у звичному напрямку:

або:

Про подальші дії, гадаю, ви здогадуєтеся. Складемо і вирішимо систему:

Десяткові дроби- це, звичайно, повне неподобство; множимо обидва рівняння на 10:

і ділимо на 2:

Ось так то краще. З 1-го рівняння виражаємо:
(Це більш простий шлях)- Підставляємо в 2-е рівняння:


Зводимо у квадратта проводимо спрощення:

Помножуємо на:

В результаті отримано квадратне рівняння, знаходимо його дискримінант:
- Чудово!

і у нас виходить два рішення:

1) якщо , то ;

2) якщо , то.

Умові задовольняє перша пара значень. З високою ймовірністю все правильно, проте запишемо закон розподілу:

і виконаємо перевірку, а саме, знайдемо матожидання:

Теорія ймовірності – особливий розділ математики, який вивчають лише студенти вищих навчальних закладів. Ви любите розрахунки та формули? Вас не лякають перспективи знайомства з нормальним розподілом, ентропією ансамблю, математичним очікуванням та дисперсією дискретної випадкової величини? Тоді цей предмет вам буде дуже цікавим. Познайомимося з кількома найважливішими базовими поняттями цього розділу науки.

Згадаймо основи

Навіть якщо ви пам'ятаєте найпростіші поняття теорії ймовірності, не зневажайте перших абзаців статті. Справа в тому, що без чіткого розуміння основ ви не зможете працювати з формулами, що розглядаються далі.

Отже, відбувається деяка випадкова подія, якийсь експеримент. Через війну вироблених дій ми можемо отримати кілька результатів - одні зустрічаються частіше, інші - рідше. Імовірність події - це відношення кількості реально отриманих наслідків одного типу до загальному числуможливих. Тільки знаючи класичне визначенняданого поняття, ви зможете приступити до вивчення математичного очікування та дисперсії безперервних випадкових величин.

Середнє арифметичне

Ще в школі на уроках математики ви починали працювати із середнім арифметичним. Це поняття широко використовується в теорії ймовірності, і тому його не можна обминути. Головним для нас зараз є те, що ми зіткнемося з ним у формулах математичного очікування та дисперсії випадкової величини.

Ми маємо послідовність чисел і хочемо знайти середнє арифметичне. Все, що від нас вимагається - підсумувати все існуюче та розділити на кількість елементів у послідовності. Нехай ми маємо числа від 1 до 9. Сума елементів дорівнюватиме 45, і це значення ми розділимо на 9. Відповідь: - 5.

Дисперсія

Говорячи науковою мовою, дисперсія – це середній квадрат відхилень отриманих значень ознаки від середньої арифметичної. Позначається одна заголовною латинською літерою D. Що потрібно, щоб її розрахувати? Для кожного елемента послідовності порахуємо різницю між наявним числом та середнім арифметичним і зведемо у квадрат. Значень вийде рівно стільки, скільки може бути результатів у події, що ми розглядаємо. Далі ми підсумовуємо все отримане та ділимо на кількість елементів у послідовності. Якщо у нас можливі п'ять наслідків, то ділимо на п'ять.

У дисперсії є й властивості, які потрібно запам'ятати, щоб застосовувати під час вирішення завдань. Наприклад, зі збільшенням випадкової величини у X разів, дисперсія збільшується у X у квадраті разів (т. е. X*X). Вона ніколи не буває менше нуля і не залежить від зсуву значень на рівне значення у більшу чи меншу сторону. Крім того, для незалежних випробуваньдисперсія суми дорівнює сумі дисперсій.

Тепер нам обов'язково слід розглянути приклади дисперсії дискретної випадкової величини та математичного очікування.

Припустимо, що ми провели 21 експеримент та отримали 7 різних результатів. Кожен із них ми спостерігали, відповідно, 1,2,2,3,4,4 та 5 разів. Чому дорівнюватиме дисперсія?

Спочатку порахуємо середнє арифметичне: сума елементів, зрозуміло, дорівнює 21. Ділимо її на 7, отримуючи 3. Тепер із кожного числа вихідної послідовності віднімемо 3, кожне значення зведемо в квадрат, а результати складемо разом. Вийде 12. Тепер нам залишається розділити число на кількість елементів, і, начебто, все. Але є проблема! Давайте її обговоримо.

Залежність кількості експериментів

Виявляється, при розрахунку дисперсії у знаменнику може стояти одне з двох чисел: або N або N-1. Тут N - це число проведених експериментів або число елементів у послідовності (що, по суті, те саме). Від чого це залежить?

Якщо кількість випробувань вимірюється сотнями, ми повинні ставити в знаменник N. Якщо одиницями, то N-1. Кордон вчені вирішили провести досить символічно: на сьогоднішній день вона проходить за цифрою 30. Якщо експериментів ми провели менше 30, то ділити суму будемо на N-1, а якщо більше – то на N.

Завдання

Давайте повернемося до нашого прикладу розв'язання задачі на дисперсію та математичне очікування. Ми отримали проміжне число 12, яке потрібно було поділити на N або N-1. Оскільки експериментів ми провели 21, що менше 30 виберемо другий варіант. Отже, відповідь: дисперсія дорівнює 12/2 = 2.

Математичне очікування

Перейдемо до другого поняття, яке ми обов'язково маємо розглянути цій статті. Математичне очікування - це результат складання всіх можливих наслідків, помножених на відповідні ймовірності. Важливо розуміти, що отримане значення, як і результат розрахунку дисперсії, виходить лише один раз для цілого завдання, скільки результатів у ній не розглядалося.

Формула математичного очікування досить проста: беремо результат, множимо з його ймовірність, додаємо те саме для другого, третього результату тощо. буд. Усе, що з цим поняттям, розраховується нескладно. Наприклад, сума матожиданий дорівнює маточку суми. Для твору актуально те саме. Такі прості операції дозволяє із собою виконувати далеко не кожна величина теорії ймовірності. Давайте візьмемо завдання і порахуємо значення одразу двох вивчених понять. Крім того, ми відволікалися на теорію - настав час попрактикуватися.

Ще один приклад

Ми провели 50 випробувань і отримали 10 видів результатів – цифри від 0 до 9 – які з'являються у різному відсотковому відношенні. Це відповідно: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Нагадаємо, що для отримання ймовірностей потрібно розділити значення у відсотках на 100. Таким чином отримаємо 0,02; 0,1 і т.д. Представимо для дисперсії випадкової величини та математичного очікування приклад розв'язання задачі.

Середнє арифметичне розрахуємо за такою формулою, яку пам'ятаємо з молодшої школи: 50/10 = 5.

Тепер переведемо ймовірність у кількість наслідків «в штуках», щоб було зручніше рахувати. Отримаємо 1, 5, 2, 7, 1, 9, 3, 8, 5 і 9. З кожного отриманого значення віднімемо середнє арифметичне, після чого кожен із отриманих результатів зведемо в квадрат. Подивіться, як це зробити, з прикладу першого елемента: 1 - 5 = (-4). Далі: (-4) * (-4) = 16. Для решти значень проробіть ці операції самостійно. Якщо ви все зробили правильно, то після додавання всіх ви отримаєте 90.

Продовжимо розрахунок дисперсії та математичного очікування, розділивши 90 на N. Чому ми вибираємо N, а не N-1? Правильно тому, що кількість проведених експериментів перевищує 30. Отже: 90/10 = 9. Дисперсію ми отримали. Якщо у вас вийшло інше число, не засмучуйтесь. Швидше за все, ви припустилися банальної помилки при розрахунках. Перевірте ще раз написане, і напевно все встане на свої місця.

Зрештою, згадаємо формулу математичного очікування. Не будемо наводити всіх розрахунків, напишемо лише відповідь, з якою ви зможете звіритися, закінчивши всі необхідні процедури. Матоожидання дорівнюватиме 5,48. Нагадаємо лише, як здійснювати операції, з прикладу перших елементів: 0*0,02 + 1*0,1… тощо. Як бачите, ми просто множимо значення результату з його ймовірність.

Відхилення

Ще одне поняття, тісно пов'язане з дисперсією та математичним очікуванням – середнє квадратичне відхилення. Позначається воно або латинськими літерами sd, або грецькою малої «сигмою». Це поняття показує, наскільки у середньому відхиляються значення від центральної ознаки. Щоб знайти її значення, потрібно розрахувати квадратне коріння з дисперсії.

Якщо ви збудуєте графік нормального розподілуі захочете побачити безпосередньо на ньому квадратичного відхилення, це можна зробити за кілька етапів. Візьміть половину зображення зліва або праворуч від моди (центрального значення), проведіть перпендикуляр до горизонтальної осі так, щоб площі фігур були рівні. Величина відрізка між серединою розподілу і проекцією, що вийшла, на горизонтальну вісь і буде середнім квадратичним відхиленням.

Програмне забезпечення

Як видно з описів формул і наведених прикладів, розрахунки дисперсії та математичного очікування - не найпростіша процедура з арифметичної точки зору. Щоб не витрачати час, є сенс скористатися програмою, яка використовується у вищих навчальних закладах- вона називається "R". У ній є функції, що дозволяють розраховувати значення для багатьох понять із статистики та теорії ймовірності.

Наприклад, ви задаєте вектор значень. Робиться це так: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

На закінчення

Дисперсія та математичне очікування - це без яких складно надалі щось розрахувати. В основному курсі лекцій у вишах вони розглядаються вже у перші місяці вивчення предмета. Саме через нерозуміння цих найпростіших понять та невміння їх розрахувати багато студентів відразу починають відставати за програмою і пізніше отримують погані позначки за результатами сесії, що позбавляє їх стипендії.

Потренуйтесь хоча б один тиждень по півгодини на день, вирішуючи завдання, схожі на представлені в цій статті. Тоді на будь-якій контрольній теорії ймовірності ви впораєтеся з прикладами без сторонніх підказок і шпаргалок.

Поділіться з друзями або збережіть для себе:

Завантаження...