Дисперсія часового ряду обчислюється за такою формулою. Дисперсія дискретної випадкової величини

Основними узагальнюючими показниками варіації у статистиці є дисперсії та середнє квадратичне відхилення.

Дисперсія це середня арифметична квадратів відхилень кожного значення ознаки від загальної середньої. Дисперсія називається середнім квадратом відхилень і позначається  2 . Залежно від вихідних даних дисперсія може обчислюватися за середньою арифметичною простою або зваженою:

 дисперсія незважена (проста);

 дисперсія зважена.

Середнє квадратичне відхилення це узагальнююча характеристика абсолютних розмірів варіації ознаки у сукупності. Виражається воно у тих самих одиницях виміру, як і ознака (в метрах, тоннах, відсотках, гектарах тощо. буд.).

Середнє квадратичне відхилення являє собою квадратний корінь з дисперсії і позначається :

 середнє квадратичне відхилення незважене;

 середнє квадратичне відхилення зважене.

Середнє квадратичне відхилення є мірилом середньої надійності. Чим менше середнє квадратичне відхилення, тим краще середня арифметична відбиває всю сукупність, що представляється.

Обчислення середнього квадратичного відхилення передує розрахунок дисперсії.

Порядок розрахунку дисперсії зваженої наступний:

1) визначають середню арифметичну зважену:

2) розраховують відхилення варіантів від середньої:

3) зводять у квадрат відхилення кожного варіанта від середньої:

4) множать квадрати відхилень на ваги (частоти):

5) підсумовують отримані твори:

6) отриману суму ділять на суму ваг:

Приклад 2.1

Обчислимо середню арифметичну зважену:

Значення відхилень від середньої та його квадратів представлені у таблиці. Визначимо дисперсію:

Середнє квадратичне відхилення дорівнюватиме:

Якщо вихідні дані представлені у вигляді інтервального ряду розподілу , спочатку потрібно визначити дискретне значення ознаки, а потім застосувати викладений метод.

Приклад 2.2

Покажемо розрахунок дисперсії для інтервального ряду даних про розподіл посівної площі колгоспу за врожайністю пшениці.

Середня арифметична дорівнює:

Обчислимо дисперсію:

6.3. Розрахунок дисперсії за формулою за індивідуальними даними

Техніка обчислення дисперсії складна, а при великих значеннях варіантів та частот може бути громіздкою. Розрахунки можна спростити, використовуючи властивості дисперсії.

Дисперсія має такі властивості.

1. Зменшення або збільшення ваг (частот) варіюючої ознаки в кілька разів дисперсію не змінює.

2. Зменшення або збільшення кожного значення ознаки на ту саму постійну величину Адисперсію не змінює.

3. Зменшення або збільшення кожного значення ознаки в якесь число разів kвідповідно зменшує або збільшує дисперсію в k 2 рази середнє квадратичне відхилення  в kразів.

4. Дисперсія ознаки щодо довільної величини завжди більше дисперсії щодо середньої арифметичної на квадрат різниці між середньою та довільною величинами:

Якщо А 0, то приходимо до наступної рівності:

тобто дисперсія ознаки дорівнює різниці між середнім квадратом значень ознаки та квадратом середньої.

Кожна властивість при розрахунку дисперсії може бути застосована самостійно або у поєднанні з іншими.

Порядок розрахунку дисперсії простий:

1) визначають середню арифметичну :

2) зводять у квадрат середню арифметичну:

3) зводять у квадрат відхилення кожного варіанта ряду:

х i 2 .

4) знаходять суму квадратів варіантів:

5) ділять суму квадратів варіантів з їхньої число, т. е. визначають середній квадрат:

6) визначають різницю між середнім квадратом ознаки та квадратом середньої:

Приклад 3.1Є такі дані про продуктивність праці робочих:

Зробимо такі розрахунки:

Види дисперсій:

Загальна дисперсіяхарактеризує варіацію ознаки всієї сукупності під впливом всіх чинників, які зумовили цю варіацію. Ця величина визначається за формулою

де - загальна середня арифметична всієї досліджуваної сукупності.

Середня внутрішньогрупова дисперсіясвідчить про випадкову варіацію, яка може виникнути під впливом будь-яких неврахованих факторів і яка не залежить від ознаки-фактора, покладеного в основу угруповання. Дана дисперсія розраховується наступним чином: спочатку розраховуються дисперсії за окремими групами (), потім розраховується середня внутрішньогрупова дисперсія:

де n i - Число одиниць у групі

Міжгрупова дисперсія(Дисперсія групових середніх) характеризує систематичну варіацію, тобто. відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки-фактора, який покладено в основу угруповання.

де – середня величина за окремою групою.

Усі три види дисперсії пов'язані між собою: загальна дисперсіядорівнює сумі середньої внутрішньогрупової дисперсії та міжгрупової дисперсії:

Властивості:

25 Відносні показники варіації

Коефіцієнт осциляції

Відносне лінійне відхилення

Коефіцієнт варіації

Коеф. Осц. провитрачає відносну коливання крайніх значень ознаки навколо середньої. Отн. лін. відкл. характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини. Коеф. Варіації є найпоширенішим показником коливання, використовуваним з метою оцінки типовості середніх величин.

У статистиці сукупності, що мають коефіцієнт варіації більше 30-35%, прийнято вважати неоднорідними.

    Закономірність рядів розподілу. Моменти розподілу. Показники форми розподілу

У варіаційних рядах існує зв'язок між частотами і значеннями ознаки, що варіює: зі збільшенням ознаки величина частоти спочатку зростає до певної межі, а потім зменшується. Такі зміни називаються закономірностями розподілу.

Форму розподілу вивчають за допомогою показників асиметрії та ексцесу. Під час обчислення зазначених показників використовують моменти розподілу.

Моментом k-го порядку називають середній із k-х ступенів відхилень варіантів значень ознаки від деякої постійної величини. Порядок моменту визначається за величиною k. Під час аналізу варіаційних рядів обмежуються розрахунком моментів перших чотирьох порядків. При обчисленні моментів як ваги можуть бути використані частоти або частоти. Залежно від вибору постійної величини розрізняють початкові, умовні та центральні моменти.

Показники форми розподілу:

Асиметрія(As) показник, що характеризує ступінь асиметричності розподілу .

Отже, при (лівосторонній) негативній асиметрії . При (правосторонній) позитивній асиметрії .

Для розрахунку асиметрії можна використати центральні моменти. Тоді:

,

де μ 3 - Центральний момент третього порядку.

- ексцес (Е до ) характеризує крутість графіка функції в порівнянні з нормальним розподіломпри тій самій силі варіації:

,

де μ4 - центральний момент 4-го порядку.

    Закон нормального розподілу

Для нормального розподілу (розподілу Гауса) функція розподілу має такий вигляд:

Мотоожидання- стандартне відхилення

Нормальний розподіл симетрично і йому характерно таке співвідношення: Хср=Ме=Мо

Ексцес нормального розподілу дорівнює 3 а коефіцієнт асиметрії 0.

Крива нормального розподілу являє собою полігон (симетрична колокообразная пряма)

    Види дисперсії. Правило складання дисперсій. Сутність емпіричного коефіцієнта детермінації.

Якщо вихідна сукупність поділена на групи за якоюсь суттєвою ознакою, то обчислюють такі види дисперсій:

    Загальна дисперсія вихідної сукупності:

де - загальна середня величина вихідної сукупності; f - частоти вихідної сукупності. Загальна дисперсія характеризує відхилення індивідуальних значень ознаки загальної середньої величини вихідної сукупності.

    Внутрішньогрупові дисперсії:

де j- номер групи; - середня величина в кожній j-ій групі; - частоти j-ої групи. Внутрішньогрупові дисперсії характеризують відхилення індивідуального значення ознаки у кожній групі від групової середньої величини. З усіх внутрішньогрупових дисперсій обчислюють середню за формулою: де- чисельність одиниць у кожній j-ій групі.

    Міжгрупова дисперсія:

Міжгрупова дисперсія характеризує відхилення групових середніх величин загальної середньої величини вихідної сукупності.

Правило складання дисперсійполягає в тому, що загальна дисперсія вихідної сукупності повинна дорівнювати сумі міжгрупової та середньої з внутрішньогрупових дисперсій:

Емпіричний коефіцієнт детермінаціїпоказує частку варіації досліджуваної ознаки, обумовлену варіацією групувальної ознаки, і розраховується за такою формулою:

    Спосіб відліку від умовного нуля (спосіб моментів) для розрахунку середньої величини та дисперсії

Розрахунок дисперсії способом моментів заснований на використанні формули та 3 і 4 властивостей дисперсії.

(3. Якщо всі значення ознаки (варіанти) збільшити (зменшити) якесь постійне число А, то дисперсія нової сукупності не зміниться.

4.Якщо всі значення ознаки (варіанти) збільшити (помножити) до К разів, де К – постійне число, то дисперсія нової сукупності збільшиться (зменшиться) до К 2 разів.)

Отримаємо формулу обчислення дисперсії у варіаційних рядах з рівними інтервалами способом моментів:

А- умовний нуль, рівний варіанті з максимальною частотою (середина інтервалу з максимальною частотою)

Розрахунок середньої величини способом моментів також ґрунтується на використанні властивостей середньої.

    Поняття про вибірковому спостереженні. Етапи дослідження економічних явищ вибірковим методом

Вибірковим називають спостереження, у якому обстеженню та вивченню піддаються в повному обсязі одиниці вихідної сукупності, лише частина одиниць, у своїй результат обстеження частини сукупності поширюється протягом усього вихідну сукупність. Сукупність, з якої проводиться відбір одиниць для подальшого обстеження та вивчення називається генеральноїі всі показники, що характеризують цю сукупність, називаються генеральними.

Можливі межі відхилень вибіркової середньої величини від генеральної середньої величини називають помилкою вибірки.

Сукупність відібраних одиниць називається вибірковоюі всі показники, що характеризують цю сукупність, називаються вибірковими.

Вибіркове дослідження включає такі етапи:

Характеристика об'єкта дослідження (масові економічні явища). Якщо генеральна сукупність невелика, вибірку проводити не рекомендується, необхідно суцільне дослідження;

Розрахунок обсягу вибірки. Важливо визначити оптимальний обсяг, який дозволить за найменших витрат отримати помилку вибірки в межах допустимої;

Проведення відбору одиниць спостереження з огляду на вимоги випадковості, пропорційності.

Доказ репрезентативності, що ґрунтується на оцінці помилки вибірки. Для випадкової вибірки помилка розраховується із застосуванням формул. Для цільової вибірки репрезентативність оцінюється за допомогою якісних методів (порівняння, експерименту);

Аналіз вибіркової сукупності. Якщо сформована вибірка відповідає вимогам репрезентативності, то проводиться її аналіз із використанням аналітичних показників (середніх, відносних та ін.)

Математичне очікування та дисперсія - найчастіше застосовувані числові характеристики випадкової величини. Вони характеризують самі важливі рисирозподілу: його становище та ступінь розкиданості. Багато завдань практики повна, вичерпна характеристика випадкової величини - закон розподілу - або взагалі може бути отримана, або взагалі не потрібна. У таких випадках обмежуються приблизним описом випадкової величини з допомогою числових характеристик.

Математичне очікування часто називають просто середнім значенням випадкової величини. Дисперсія випадкової величини - характеристика розсіювання, розкиданості випадкової величини у її математичного очікування.

Математичне очікування дискретної випадкової величини

Підійдемо до поняття математичного очікування спочатку виходячи з механічної інтерпретації розподілу дискретної випадкової величини. Нехай одинична маса розподілена між точками осі абсцис x1 , x 2 , ..., x n, причому кожна матеріальна точка має відповідну їй масу p1 , p 2 , ..., p n. Потрібно вибрати одну точку на осі абсцис, що характеризує становище всієї системи матеріальних точок, з урахуванням їх мас. Природно як така точка взяти центр маси системи матеріальних точок. Це середнє зважене значення випадкової величини X, в яке абсциса кожної точки xiвходить з "вагою", що дорівнює відповідній ймовірності. Отримане в такий спосіб середнє значення випадкової величини Xназивається її математичним очікуванням.

Математичним очікуванням дискретної випадкової величини називається сума творів всіх можливих її значень на ймовірності цих значень:

приклад 1.Організована безпрограшна лотерея. Є 1000 виграшів, їх 400 по 10 крб. 300 – по 20 руб. 200 – по 100 руб. і 100 – по 200 руб. Який середній розмір виграшу для того, хто купив один квиток?

Рішення. Середній виграш ми знайдемо, якщо загальну сумувиграшів, яка дорівнює 10 * 400 + 20 * 300 + 100 * 200 + 200 * 100 = 50000 руб, розділимо на 1000 (загальна сума виграшів). Тоді отримаємо 50 000/1000 = 50 руб. Але вираз для підрахунку середнього виграшу можна уявити й у такому вигляді:

З іншого боку, в умовах розмір виграшу є випадковою величиною, яка може приймати значення 10, 20, 100 і 200 руб. із ймовірностями, рівними відповідно 0,4; 0,3; 0,2; 0,1. Отже, очікуваний середній виграш дорівнює сумітворів розмірів виграшів на ймовірності їх отримання.

приклад 2.Видавець вирішив видати нову книгу. Продавати книгу він збирається за 280 руб., З яких 200 отримає він сам, 50 - книгарня і 30 - автор. У таблиці наведено інформацію про витрати на видання книги та ймовірність продажу певного числаекземплярів книги.

Знайти очікуваний прибуток видавця.

Рішення. Випадкова величина "прибуток" дорівнює різниці доходів від продажу та вартості витрат. Наприклад, якщо буде продано 500 екземплярів книги, то доходи від продажу дорівнюють 200 * 500 = 100000, а витрати на видання 225 000 руб. Таким чином, видавцеві загрожує збиток розміром 125000 руб. У наступній таблиці узагальнено очікувані значення випадкової величини - прибутку:

ЧислоПрибуток xi Ймовірність pi xi p i
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Всього: 1,00 25000

Таким чином, отримуємо математичне очікування прибутку видавця:

.

приклад 3.Імовірність влучення при одному пострілі p= 0,2. Визначити витрату снарядів, які забезпечують математичне очікування числа влучень, що дорівнює 5.

Рішення. З тієї ж формули математичного очікування, яку ми використовували досі, висловлюємо x- Витрата снарядів:

.

приклад 4.Визначити математичне очікування випадкової величини xчисла попадань при трьох пострілах, якщо ймовірність попадання при кожному пострілі p = 0,4 .

Підказка: ймовірність значень випадкової величини знайти за формулі Бернуллі .

Властивості математичного очікування

Розглянемо властивості математичного очікування.

Властивість 1.Математичне очікування постійної величини дорівнює цій постійній:

Властивість 2.Постійний множник можна виносити за знак математичного очікування:

Властивість 3.Математичне очікування суми (різниці) випадкових величин дорівнює сумі (різниці) їх математичних очікувань:

Властивість 4.Математичне очікування добутку випадкових величин дорівнює добутку їх математичних очікувань:

Властивість 5.Якщо всі значення випадкової величини Xзменшити (збільшити) на одне й те саме число З, то її математичне очікування зменшиться (збільшиться) на те число:

Коли не можна обмежуватися лише математичним очікуванням

Найчастіше лише математичне очікування неспроможна достатньою мірою характеризувати випадкову величину.

Нехай випадкові величини Xі Yзадані такими законами розподілу:

Значення X Ймовірність
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Значення Y Ймовірність
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Математичні очікування цих величин однакові - дорівнюють нулю:

Проте характер розподілу їх різний. Випадкова величина Xможе приймати тільки значення, що мало відрізняються від математичного очікування, а випадкова величина Yможе приймати значення, які значно відхиляються від математичного очікування. Аналогічний приклад: середня заробітна плата не дає можливості судити про питому вагу високо-і низькооплачуваних робітників. Іншими словами, з математичного очікування не можна судити про те, які відхилення від нього, хоч би в середньому, можливі. Для цього необхідно знайти дисперсію випадкової величини.

Дисперсія дискретної випадкової величини

Дисперсієюдискретної випадкової величини Xназивається математичне очікування квадрата відхилення її від математичного очікування:

Середнім квадратичним відхиленням випадкової величини Xназивається арифметичне значенняквадратного кореня її дисперсії:

.

Приклад 5.Обчислити дисперсії та середні квадратичні відхилення випадкових величин Xі Y, закони розподілу яких наведені у таблицях вище.

Рішення. Математичні очікування випадкових величин Xі YЯк було знайдено вище, дорівнюють нулю. Згідно з формулою дисперсії при Е(х)=Е(y)=0 отримуємо:

Тоді середні квадратичні відхилення випадкових величин Xі Yскладають

.

Таким чином, при однакових математичних очікуваннях дисперсія випадкової величини Xдуже мала, а випадкової величини Y- Значна. Це наслідок розбіжності у тому розподілі.

Приклад 6.У інвестора є 4 альтернативні проекти інвестицій. У таблиці узагальнено дані про очікуваний прибуток у цих проектах з відповідною ймовірністю.

Проект 1Проект 2Проект 3Проект 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Знайти для кожної альтернативи математичне очікування, дисперсію та середнє квадратичне відхилення.

Рішення. Покажемо, як обчислюються ці величини для 3 альтернативи:

У таблиці узагальнено знайдені величини всім альтернатив.

У всіх альтернатив однакові математичні очікування. Це означає, що у довгостроковому періоді в усіх - однакові доходи. Стандартне відхилення можна інтерпретувати як одиницю виміру ризику - що більше, тим більше ризик інвестицій. Інвестор, який бажає великого ризику, вибере проект 1, оскільки він має найменше стандартне відхилення (0). Якщо ж інвестор віддає перевагу ризику та більшим доходам у короткий період, він вибере проект найбільшим стандартним відхиленням - проект 4.

Властивості дисперсії

Наведемо властивості дисперсії.

Властивість 1.Дисперсія постійної величини дорівнює нулю:

Властивість 2.Постійний множник можна виносити за знак дисперсії, зводячи його у квадрат:

.

Властивість 3.Дисперсія випадкової величини дорівнює математичному очікуванню квадрата цієї величини, з якого віднімається квадрат математичного очікування самої величини:

,

де .

Властивість 4.Дисперсія суми (різниці) випадкових величин дорівнює сумі (різниці) їх дисперсій:

Приклад 7.Відомо, що дискретна випадкова величина Xприймає лише два значення: −3 та 7. Крім того, відоме математичне очікування: E(X) = 4 . Знайти дисперсію дискретної випадкової величини.

Рішення. Позначимо через pймовірність, з якою випадкова величина набуває значення x1 = −3 . Тоді ймовірністю значення x2 = 7 буде 1 − p. Виведемо рівняння для математичного очікування:

E(X) = x 1 p + x 2 (1 − p) = −3p + 7(1 − p) = 4 ,

звідки отримуємо ймовірність: p= 0,3 та 1 − p = 0,7 .

Закон розподілу випадкової величини:

X −3 7
p 0,3 0,7

Дисперсію даної випадкової величини обчислимо за формулою з якості дисперсії 3:

D(X) = 2,7 + 34,3 − 16 = 21 .

Знайти математичне очікування випадкової величини самостійно, а потім переглянути рішення

Приклад 8.Дискретна випадкова величина Xнабуває лише два значення. Більше значень 3 вона приймає з ймовірністю 0,4. Крім того, відома дисперсія випадкової величини D(X) = 6 . Знайти математичне очікування випадкової величини.

Приклад 9.В урні 6 білих і 4 чорні кулі. З урни виймають 3 кулі. Число білих куль серед вийнятих куль є дискретною випадковою величиною X. Знайти математичне очікування та дисперсію цієї випадкової величини.

Рішення. Випадкова величина Xможе приймати значення 0, 1, 2, 3. Відповідні їм ймовірності можна обчислити за правилу множення ймовірностей. Закон розподілу випадкової величини:

X 0 1 2 3
p 1/30 3/10 1/2 1/6

Звідси математичне очікування цієї випадкової величини:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

Дисперсія даної випадкової величини:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Математичне очікування та дисперсія безперервної випадкової величини

Для безперервної випадкової величини механічна інтерпретація математичного очікування збереже той самий зміст: центр маси для одиничної маси, розподіленої безперервно на осі абсцис із щільністю f(x). На відміну від дискретної випадкової величини, яка має аргумент функції xiзмінюється стрибкоподібно, у безперервної випадкової величини аргумент змінюється безперервно. Але математичне очікування безперервної випадкової величини пов'язане з її середнім значенням.

Щоб знаходити математичне очікування та дисперсію безперервної випадкової величини, потрібно знаходити певні інтеграли . Якщо дана функція щільності безперервної випадкової величини, вона безпосередньо входить у подынтегральное вираз. Якщо дана функція розподілу ймовірностей, то, диференціюючи її, необхідно визначити функцію щільності.

Арифметичне середнє всіх можливих значень безперервної випадкової величини називається її математичним очікуванням, що позначається або .

Обчислимо вMSEXCELдисперсію та стандартне відхилення вибірки. Також обчислимо дисперсію випадкової величини, якщо відомий її розподіл.

Спочатку розглянемо дисперсію, потім стандартне відхилення.

Дисперсія вибірки

Дисперсія вибірки (вибіркова дисперсія,samplevariance) характеризує розкид значень у масиві щодо .

Усі 3 формули математично еквівалентні.

З першої формули видно, що дисперсія вибіркице сума квадратів відхилень кожного значення в масиві від середнього, Поділена на розмір вибірки мінус 1.

дисперсії вибіркивикористовується функція ДИСП(), англ. назва VAR, тобто. VARiance. З версії MS EXCEL 2010 рекомендується використовувати аналог ДИСП.В() , англ. назва VARS, тобто. Sample VARiance. Крім того, починаючи з версії MS EXCEL 2010 є функція ДИСП.Г(), англ. назва VARP, тобто. Population VARiance, яка обчислює дисперсіюдля генеральної сукупності . Вся відмінність зводиться до знаменника: замість n-1 як у ДИСП.В(), у ДИСП.Г() у знаменнику просто n. До MS EXCEL 2010 для обчислення дисперсії генеральної сукупності використовувалась функція ДИСПР().

Дисперсію вибірки
=КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1)
=(СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/ (РАХУНОК(Вибірка)-1)- Звичайна формула
= СУМ((Вибірка-СРЗНАЧ(Вибірка))^2)/ (РАХУНОК(Вибірка)-1) –

Дисперсія вибіркидорівнює 0, тільки в тому випадку, якщо всі значення рівні між собою і відповідно рівні середнього значення. Зазвичай, ніж більша величина дисперсіїтим більше розкид значень у масиві.

Дисперсія вибіркиє точковою оцінкою дисперсіїрозподілу випадкової величини, з якої було зроблено вибірка. Про побудову довірчих інтервалів при оцінці дисперсіїможна прочитати у статті.

Дисперсія випадкової величини

Щоб обчислити дисперсіювипадкової величини необхідно знати її .

Для дисперсіївипадкової величини Х часто використовують позначення Var(Х). Дисперсіядорівнює квадрату відхилення від середнього E(X): Var(Х)=E[(X-E(X)) 2 ]

дисперсіяобчислюється за такою формулою:

де x i - значення, яке може набувати випадкова величина, а μ - середнє значення (), р (x) - ймовірність, що випадкова величина прийме значення х.

Якщо випадкова величина має, то дисперсіяобчислюється за такою формулою:

Розмірність дисперсіївідповідає квадрату одиниці виміру вихідних значень. Наприклад, якщо значення у вибірці є вимірювання ваги деталі (в кг), то розмірність дисперсії буде кг 2 . Це буває складно інтерпретувати, тому для характеристики розкиду значень частіше використовують величину рівну квадратному кореню. дисперсіїстандартне відхилення.

Деякі властивості дисперсії:

Var(Х + a) = Var (Х), де Х - випадкова величина, а - константа.

Var(aХ)=a 2 Var(X)

Var(Х)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ця властивість дисперсії використовується в статті про лінійну регресію.

Var(Х+Y)=Var(Х) + Var(Y) + 2*Cov(Х;Y), де Х та Y - випадкові величини, Cov(Х;Y) - коваріація цих випадкових величин.

Якщо випадкові величини незалежні (independent), їх коваріаціядорівнює 0, отже, Var(Х+Y)=Var(Х)+Var(Y). Ця властивість дисперсії використовується при виведенні.

Покажемо, що з незалежних величин Var(Х-Y)=Var(Х+Y). Справді, Var(Х-Y)=Var(Х-Y)=Var(Х+(-Y))=Var(Х)+Var(-Y)=Var(Х)+Var(-Y)=Var( Х)+(-1) 2 Var(Y)=Var(Х)+Var(Y)=Var(Х+Y). Ця властивість дисперсії використовується для побудови.

Стандартне відхилення вибірки

Стандартне відхилення вибірки- це міра того, наскільки широко розкидані значення у вибірці щодо них.

За визначенням, стандартне відхиленняодно квадратному кореню з дисперсії:

Стандартне відхиленняне враховує величину значень у вибірці, а тільки ступінь розсіювання значень навколо них середнього. Щоб проілюструвати це наведемо приклад.

Обчислимо стандартне відхилення для 2-х вибірок: (1; 5; 9) та (1001; 1005; 1009). В обох випадках s=4. Очевидно, що відношення величини стандартного відхилення до значень масиву вибірок істотно відрізняється. Для таких випадків використовується Коефіцієнт варіації(Coefficient of Variation, CV) - ставлення Стандартне відхиленнядо середнього арифметичному, Вираженого у відсотках.

У MS EXCEL 2007 та більш ранніх версіях для обчислення Стандартне відхилення вибіркивикористовується функція = СТАНДОТКЛОН (), англ. назва STDEV, тобто. STandard DEViation. З версії MS EXCEL 2010 рекомендується використовувати її аналог = СТАНДОТКЛОН.В(), англ. назва STDEV.S, тобто. Sample STandard DEViation.

Крім того, починаючи з версії MS EXCEL 2010 є функція СТАНДОТКЛОН.Г() , англ. назва STDEV.P, тобто. Population STandard DEViation, яка обчислює стандартне відхиленнядля генеральної сукупності. Вся відмінність зводиться до знаменника: замість n-1 як у СТАНДОТКЛОН.В() , у СТАНДОТКЛОН.Г() у знаменнику просто n.

Стандартне відхиленняможна також обчислити безпосередньо за нижченаведеними формулами (див. файл прикладу)
=КОРІНЬ(КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1))
=КОРІНЬ((СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/(РАХУНОК(Вибірка)-1))

Інші заходи розкиду

Функція КВАДРОТКЛ() обчислює з умму квадратів відхилень значень від них середнього. Ця функція поверне той самий результат, як і формула =ДИСП.Г( Вибірка)*РАХУНОК( Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки (). Обчислення функції КВАДРОТКЛ() проводяться за формулою:

Функція СРОТКЛ() є мірою розкиду безлічі даних. Функція СРОТКЛ() обчислює середнє абсолютних значень відхилень значень від середнього. Ця функція поверне той самий результат, що й формула =СУМПРОВИЗВ(ABS(Вибірка-СРЗНАЧ(Вибірка)))/РАХУНОК(Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки.

Обчислення функції СРОТКЛ () проводяться за формулою:

Однак цієї характеристики ще мало для дослідження випадкової величини. Уявимо двох стрільців, які стріляють по мішені. Один стріляє влучно і потрапляє близько до центру, а інший просто розважається і навіть не цілиться. Але що кумедно, його середнійрезультат буде таким самим, як і в першого стрілка! Цю ситуацію умовно ілюструють такі випадкові величини:

«Снайперське» математичне очікування рівне, проте й у «цікавої особистості»: воно теж нульове!

Таким чином, виникає потреба кількісно оцінити, наскільки далеко розпорошенікулі (значення випадкової величини) щодо центру мішені (математичного очікування). Ну а розсіюванняз латині перекладається не інакше, як дисперсія .

Подивимося, як визначається ця числова характеристикаодному з прикладів 1-ї частини уроку:

Там ми знайшли невтішне математичне очікування цієї гри, і зараз ми маємо обчислити її дисперсію, яка позначаєтьсячерез.

З'ясуємо, наскільки далеко розкидані виграші/програші щодо середнього значення. Очевидно, що для цього потрібно вирахувати різниціміж значеннями випадкової величиниі її математичним очікуванням:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Тепер начебто треба підсумувати результати, але цей шлях не годиться – з тієї причини, що коливання вліво взаємознижуватимуться з коливаннями вправо. Так, наприклад, у стрільця-«любителя» (Приклад вище)різниці складуть , і при додаванні дадуть нуль, тому ніякої оцінки розсіювання його стрілянини ми не отримаємо.

Щоб обійти цю неприємність, можна розглянути модулірізниць, але з технічних причин прижився підхід, коли їх зводять у квадрат. Рішення зручніше оформити таблицею:

І тут напрошується вирахувати середньозваженезначення квадратів відхилень. А це що таке? Це їх математичне очікування, яке і є мірилом розсіювання:

визначеннядисперсії. З визначення одразу зрозуміло, що дисперсія не може бути негативною- Візьміть на замітку для практики!

Згадуємо, як знаходити матожидання. Розмножуємо квадрати різниць на відповідні ймовірності (продовження таблиці):
– образно кажучи, це «сила тяги»,
та підсумовуємо результати:

Чи не здається вам, що на тлі виграшів результат вийшов завеликим? Все вірно – ми зводили у квадрат, і щоб повернутися до розмірності нашої гри, потрібно витягти квадратний корінь. Ця величина називається середнім квадратичним відхиленням і позначається грецькою літерою"сигма":

Іноді це значення називають стандартним відхиленням .

У чому його зміст? Якщо ми відхилимося від математичного очікування вліво та вправо на середнє квадратичне відхилення:

– то цьому інтервалі будуть «сконцентровані» найімовірніші значення випадкової величини. Що ми, власне, і спостерігаємо:

Проте так склалося, що з аналізі розсіювання майже завжди оперують поняттям дисперсії. Давайте розберемося, що вона означає стосовно ігор. Якщо у випадку зі стрілками йдеться про «купність» попадань щодо центру мішені, то дисперсія характеризує дві речі:

По-перше, очевидно, що зі збільшенням ставок, дисперсія теж зростає. Так, наприклад, якщо ми збільшимо у 10 разів, то математичне очікування збільшиться у 10 разів, а дисперсія – у 100 разів (якщо це квадратична величина). Але, зауважте, що самі правила гри не змінилися! Змінилися лише ставки, грубо кажучи, раніше ми ставили 10 карбованців, тепер 100.

Другий, цікавіший момент полягає в тому, що дисперсія характеризує стиль гри. Подумки зафіксуємо ігрові ставки на якомусь певному рівні, і подивимося, що тут до чого:

Гра з низькою дисперсією – це обережна гра. Гравець схильний вибирати найнадійніші схеми, де за 1 раз він не програє/виграє занадто багато. Наприклад, система «червоне/чорне» в рулетці (див. Приклад 4 статті Випадкові величини) .

Гра із високою дисперсією. Її часто називають дисперсійноїгрою. Це авантюрний чи агресивний стиль гри, де гравець обирає "адреналінові" схеми. Згадаймо хоча б «Мартінгейл», в якому на кону виявляються суми, що на порядки перевершують «тиху» гру попереднього пункту.

Показовою є ситуація в покері: тут є так звані тайтовігравці, які схильні обережно і «труситися» над своїми ігровими засобами (Банкролом). Не дивно, що їхній банкрол не піддається значним коливанням (низька дисперсія). Навпаки, якщо у гравця висока дисперсія, це агресор. Він часто ризикує, робить великі ставки і може, як зірвати величезний банк, так і програтися вщент.

Те саме відбувається на Форексі, і так далі – прикладів маса.

Причому, у всіх випадках не важливо – чи на копійки йде гра, чи на тисячі доларів. На будь-якому рівні є свої низько- та високодисперсійні гравці. Ну, а за середній виграш, як ми пам'ятаємо, «відповідає» математичне очікування.

Напевно, ви помітили, що знаходження дисперсії – процес тривалий і копіткий. Але математика щедра:

Формула для знаходження дисперсії

Ця формула виводиться безпосередньо з визначення дисперсії, і ми негайно пускаємо їх у оборот. Скопіюю зверху табличку з нашою грою:

і знайдене маточування.

Обчислимо дисперсію другим способом. Спочатку знайдемо математичне очікування – квадрата випадкової величини. за визначення математичного очікування:

В даному випадку:

Таким чином, за формулою:

Як кажуть, відчуйте різницю. І на практиці, звичайно, краще застосовувати формулу (якщо іншого не потребує умова).

Освоюємо техніку рішення та оформлення:

Приклад 6

Знайти її математичне очікування, дисперсію та середнє квадратичне відхилення.

Це завдання зустрічається повсюдно, і, зазвичай, йде без змістовного сенсу.
Можете уявляти кілька лампочок з числами, які загоряються в дурдомі з певними ймовірностями:)

Рішення: Основні обчислення зручно звести до таблиці Спочатку у верхні два рядки записуємо вихідні дані. Потім розраховуємо твори, потім і, нарешті, суми у правому стовпці:

Власне, майже все готове. У третьому рядку намалювалося готове математичне очікування: .

Дисперсію обчислимо за такою формулою:

І, нарешті, середнє квадратичне відхилення:
- особисто я зазвичай округляю до 2 знаків після коми.

Усі обчислення можна провести на калькуляторі, а ще краще – в Екселі:

ось тут вже важко помилитися:)

Відповідь:

Бажаючі можуть ще більше спростити своє життя та скористатися моїм калькулятором (Демо), який не тільки миттєво вирішить це завдання, а й побудує тематичні графіки (скоро дійдемо). Програму можна скачати в бібліотеці- якщо ви завантажили хоча б один навчальний матеріал, або отримати іншим способом. Дякуємо за підтримку проекту!

Пара завдань для самостійного вирішення:

Приклад 7

Обчислити дисперсію випадкової величини попереднього прикладу визначення.

І аналогічний приклад:

Приклад 8

Дискретна випадкова величина задана своїм законом розподілу:

Так, значення випадкової величини бувають досить великими (Приклад із реальної роботи), і тут, по можливості, використовуйте Ексель. Як, до речі, і в Прімері 7 – це швидше, надійніше та приємніше.

Рішення та відповіді внизу сторінки.

На закінчення 2-ї частини уроку розберемо ще одне типове завдання, можна сказати, невеликий ребус:

Приклад 9

Дискретна випадкова величина може набувати лише два значення: і , причому . Відома ймовірність, математичне очікування та дисперсія.

Рішення: почнемо з невідомої ймовірності Так як випадкова величина може прийняти лише два значення, то сума ймовірностей відповідних подій:

і оскільки, то.

Залишилося знайти …, легко сказати:) Але так гаразд, понеслося. За визначенням математичного очікування:
- Підставляємо відомі величини:

- І більше з цього рівняння нічого не вичавити, хіба що можна переписати його у звичному напрямку:

або:

Про подальші дії, гадаю, ви здогадуєтеся. Складемо і вирішимо систему:

Десяткові дроби- це, звичайно, повне неподобство; множимо обидва рівняння на 10:

і ділимо на 2:

Ось так то краще. З 1-го рівняння виражаємо:
(Це більш простий шлях)- Підставляємо в 2-е рівняння:


Зводимо у квадратта проводимо спрощення:

Помножуємо на:

В результаті отримано квадратне рівняння, знаходимо його дискримінант:
- Чудово!

і у нас виходить два рішення:

1) якщо , то ;

2) якщо , то.

Умові задовольняє перша пара значень. З високою ймовірністю все правильно, проте запишемо закон розподілу:

і виконаємо перевірку, а саме, знайдемо матожидання:

Поділіться з друзями або збережіть для себе:

Завантаження...