Дисперсія якості. Дисперсія дискретної випадкової величини

Обчислимо вMSEXCELдисперсію та стандартне відхиленнявибірки. Також обчислимо дисперсію випадкової величини, якщо відомий її розподіл.

Спочатку розглянемо дисперсію, потім стандартне відхилення.

Дисперсія вибірки

Дисперсія вибірки (вибіркова дисперсія,samplevariance) характеризує розкид значень у масиві щодо .

Усі 3 формули математично еквівалентні.

З першої формули видно, що дисперсія вибіркице сума квадратів відхилень кожного значення в масиві від середнього, Поділена на розмір вибірки мінус 1.

дисперсії вибіркивикористовується функція ДИСП(), англ. назва VAR, тобто. VARiance. З версії MS EXCEL 2010 рекомендується використовувати аналог ДИСП.В() , англ. назва VARS, тобто. Sample VARiance. Крім того, починаючи з версії MS EXCEL 2010 є функція ДИСП.Г(), англ. назва VARP, тобто. Population VARiance, яка обчислює дисперсіюдля генеральної сукупності . Вся відмінність зводиться до знаменника: замість n-1 як у ДИСП.В(), у ДИСП.Г() у знаменнику просто n. До MS EXCEL 2010 для обчислення дисперсії генеральної сукупності використовувалась функція ДИСПР().

Дисперсію вибірки
=КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1)
=(СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/ (РАХУНОК(Вибірка)-1)- Звичайна формула
= СУМ((Вибірка-СРЗНАЧ(Вибірка))^2)/ (РАХУНОК(Вибірка)-1) –

Дисперсія вибіркидорівнює 0, тільки в тому випадку, якщо всі значення рівні між собою і відповідно рівні середнього значення. Зазвичай, ніж більша величина дисперсіїтим більше розкид значень у масиві.

Дисперсія вибіркиє точковою оцінкою дисперсіїрозподілу випадкової величини, з якої було зроблено вибірка. Про побудову довірчих інтервалів при оцінці дисперсіїможна прочитати у статті.

Дисперсія випадкової величини

Щоб обчислити дисперсіювипадкової величини необхідно знати її .

Для дисперсіївипадкової величини Х часто використовують позначення Var(Х). Дисперсіядорівнює квадрату відхилення від середнього E(X): Var(Х)=E[(X-E(X)) 2 ]

дисперсіяобчислюється за такою формулою:

де x i – значення, яке може набувати випадкова величина, а μ – середнє значення (), р(x) – ймовірність, що випадкова величина прийме значення х.

Якщо випадкова величина має, то дисперсіяобчислюється за такою формулою:

Розмірність дисперсіївідповідає квадрату одиниці виміру вихідних значень. Наприклад, якщо значення у вибірці є вимірювання ваги деталі (в кг), то розмірність дисперсії буде кг 2 . Це буває складно інтерпретувати, тому для характеристики розкиду значень частіше використовують величину рівну квадратному кореню. дисперсіїстандартне відхилення.

Деякі властивості дисперсії:

Var(Х + a) = Var (Х), де Х - випадкова величина, а - константа.

Var(aХ)=a 2 Var(X)

Var(Х)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ця властивість дисперсії використовується в статті про лінійну регресію.

Var(Х+Y)=Var(Х) + Var(Y) + 2*Cov(Х;Y), де Х та Y - випадкові величини, Cov(Х;Y) - коваріація цих випадкових величин.

Якщо випадкові величини незалежні (independent), їх коваріаціядорівнює 0, отже, Var(Х+Y)=Var(Х)+Var(Y). Ця властивість дисперсії використовується при виведенні.

Покажемо, що з незалежних величин Var(Х-Y)=Var(Х+Y). Справді, Var(Х-Y)=Var(Х-Y)=Var(Х+(-Y))=Var(Х)+Var(-Y)=Var(Х)+Var(-Y)=Var( Х)+(-1) 2 Var(Y)=Var(Х)+Var(Y)=Var(Х+Y). Ця властивість дисперсії використовується для побудови.

Стандартне відхилення вибірки

Стандартне відхилення вибірки- це міра того, наскільки широко розкидані значення у вибірці щодо них.

За визначенням, стандартне відхиленняодно квадратному кореню з дисперсії:

Стандартне відхиленняне враховує величину значень у вибірці, а тільки ступінь розсіювання значень навколо них середнього. Щоб проілюструвати це наведемо приклад.

Обчислимо стандартне відхилення для 2-х вибірок: (1; 5; 9) та (1001; 1005; 1009). В обох випадках s=4. Очевидно, що відношення величини стандартного відхилення до значень масиву вибірок істотно відрізняється. Для таких випадків використовується Коефіцієнт варіації(Coefficient of Variation, CV) - ставлення Стандартне відхиленнядо середнього арифметичному, Вираженого у відсотках.

У MS EXCEL 2007 та більш ранніх версіях для обчислення Стандартне відхилення вибіркивикористовується функція = СТАНДОТКЛОН (), англ. назва STDEV, тобто. STandard DEViation. З версії MS EXCEL 2010 рекомендується використовувати її аналог = СТАНДОТКЛОН.В(), англ. назва STDEV.S, тобто. Sample STandard DEViation.

Крім того, починаючи з версії MS EXCEL 2010 є функція СТАНДОТКЛОН.Г() , англ. назва STDEV.P, тобто. Population STandard DEViation, яка обчислює стандартне відхиленнядля генеральної сукупності. Вся відмінність зводиться до знаменника: замість n-1 як у СТАНДОТКЛОН.В() , у СТАНДОТКЛОН.Г() у знаменнику просто n.

Стандартне відхиленняможна також обчислити безпосередньо за нижченаведеними формулами (див. файл прикладу)
=КОРІНЬ(КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1))
=КОРІНЬ((СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/(РАХУНОК(Вибірка)-1))

Інші заходи розкиду

Функція КВАДРОТКЛ() обчислює з умму квадратів відхилень значень від них середнього. Ця функція поверне той самий результат, як і формула =ДИСП.Г( Вибірка)*РАХУНОК( Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки (). Обчислення функції КВАДРОТКЛ() проводяться за формулою:

Функція СРОТКЛ() є мірою розкиду безлічі даних. Функція СРОТКЛ() обчислює середнє абсолютних значень відхилень значень від середнього. Ця функція поверне той самий результат, що й формула =СУМПРОВИЗВ(ABS(Вибірка-СРЗНАЧ(Вибірка)))/РАХУНОК(Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки.

Обчислення функції СРОТКЛ () проводяться за формулою:

Варіаційний розмах (або розмах варіації)це різниця між максимальним та мінімальним значеннями ознаки:

У прикладі розмах варіації змінної вироблення робочих становить: у першій бригаді R=105-95=10 дет., у другій бригаді R=125-75=50 дет. (У 5 разів більше). Це свідчить, що вироблення 1-ї бригади більш «стійка», але резервів зростання вироблення більше в другій бригади, т.к. у разі досягнення всіма робітниками максимальної для цієї бригади виробітку, нею може бути виготовлено 3*125=375 деталей, а в 1-й бригаді лише 105*3=315 деталей.
Якщо крайні значення ознаки не типові для сукупності, використовують квартильний або децильний розмахи. Квартильний розмах RQ = Q3-Q1 охоплює 50% обсягу сукупності, децильний розмах перший RD1 = D9-D1охоплює 80% даних, другий децильний розмах RD2 = D8-D2 - 60%.
Недоліком показника варіаційного розмахує, але його величина не відбиває всі коливання ознаки.
Найпростішим узагальнюючим показником, що відображає всі коливання ознаки, є середнє лінійне відхилення, що являє собою середню арифметичну абсолютних відхилень окремих варіантів від їх середньої величини:

,
для згрупованих даних
,
де хi - значення ознаки в дискретному рядуабо середина інтервалу в інтервальному розподілі.
У вищенаведених формулах різниці в чисельнику взяті за модулем, інакше, згідно з властивістю середньої арифметичної, чисельник завжди дорівнюватиме нулю. Тому середнє лінійне відхилення у статистичній практиці застосовують рідко, лише у випадках, коли підсумовування показників без урахування знака має економічний сенс. З його допомогою, наприклад, аналізується склад працюючих, рентабельність виробництва, оборот зовнішньої торгівлі.
Дисперсія ознаки- Це середній квадрат відхилень варіант від їх середньої величини:
проста дисперсія
,
зважена дисперсія
.
Формулу для розрахунку дисперсії можна спростити:

Таким чином, дисперсія дорівнює різниці середньої з квадратів варіант і квадрата середньої з варіант сукупності:
.
Однак, внаслідок підсумовування квадратів відхилень дисперсія дає спотворене уявлення про відхилення, тому її на основі розраховують середнє квадратичне відхиленнящо показує, наскільки в середньому відхиляються конкретні варіанти ознаки від їхнього середнього значення. Обчислюється шляхом вилучення квадратного кореня з дисперсії:
для несгрупованих даних
,
для варіаційного ряду

Чим менше значеннядисперсії та середнього квадратичного відхилення, тим однорідніша сукупність, тим більш надійною (типовою) буде середня величина.
Середнє лінійне та середнє квадратичне відхилення - іменовані числа, тобто виражаються в одиницях виміру ознаки, ідентичні за змістом та близькі за значенням.
Розраховувати абсолютні показникиваріації рекомендується з допомогою таблиць.
Таблиця 3 - Розрахунок показників варіації (на прикладі терміну даних про змінну вироблення робочих бригади)


Число робітників,

Середина інтервалу,

Розрахункові значення

Разом:

Середнє зміна вироблення робітників:

Середнє лінійне відхилення:

Дисперсія виробітку:

Середнє квадратичне відхилення виробітку окремих робітників від середнього виробітку:
.

1 Розрахунок дисперсії способом моментів

Обчислення дисперсій пов'язане з громіздкими розрахунками (особливо якщо середня величина виражена більшим числомз кількома десятковими знаками). Розрахунки можна спростити, якщо використовувати спрощену формулу та властивості дисперсії.
Дисперсія має такі властивості:

  1. якщо всі значення ознаки зменшити або збільшити на ту саму величину А, то дисперсія від цього не зменшиться:

,

, то чи
Використовуючи властивості дисперсії і спочатку зменшивши всі варіанти сукупності на величину А, а потім розділивши величину інтервалу h, отримаємо формулу обчислення дисперсії в варіаційних рядах з рівними інтервалами способом моментів:
,
де - Дисперсія, обчислена за способом моментів;
h – величина інтервалу варіаційного ряду;
- Нові (перетворені) значення варіант;
А - постійна величина, в якості якої використовують середину інтервалу, що має найбільшу частоту; або варіант, що має максимальну частоту;
- Квадрат моменту першого порядку;
- Момент другого порядку.
Виконаємо розрахунок дисперсії способом моментів на основі даних про змінне вироблення робітників бригади.
Таблиця 4 - Розрахунок дисперсії за способом моментів


Групи робітників з вироблення, шт.

Число робітників,

Середина інтервалу,

Розрахункові значення

Порядок розрахунку:


  1. розраховуємо дисперсію:

2 Розрахунок дисперсії альтернативної ознаки

Серед ознак, що вивчаються статистикою, є такі, яким властиві лише два взаємно виключають значення. Це альтернативні ознаки. Їм надається відповідно два кількісні значення: варіанти 1 і 0. Частиною варіанти 1, яка позначається p, є частка одиниць, що мають дану ознаку. Різниця 1-р=q є частотою варіанти 0. Таким чином,


хі

Середня арифметична альтернативна ознака
, Оскільки p+q=1.

Дисперсія альтернативної ознаки
, т.к. 1-р = q
Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що володіють даною ознакою, і частки одиниць, що не мають цієї ознаки.
Якщо значення 1 і 0 зустрічаються однаково часто, тобто p = q, дисперсія досягає свого максимуму pq = 0,25.
Дисперсія альтернативної ознаки використовується у вибіркових обстеженнях, наприклад, якості продукції.

3 Міжгрупова дисперсія. Правило складання дисперсій

Дисперсія, на відміну інших характеристик варіації, є адитивної величиною. Тобто в сукупності, яка поділена на групи за факторною ознакою х , дисперсія результативної ознаки yможе бути розкладена на дисперсію у кожній групі (внутрішньогрупову) та дисперсію між групами (міжгрупову). Тоді, поряд із вивченням варіації ознаки по всій сукупності загалом, стає можливим вивчення варіації у кожній групі, а також між цими групами.

Загальна дисперсіявимірює варіацію ознаки упо всій сукупності під впливом всіх факторів, що спричинили цю варіацію (відхилення). Вона дорівнює середньому квадрату відхилень окремих значень ознаки увід загальної середньої та може бути обчислена як проста або зважена дисперсія.
Міжгрупова дисперсіяхарактеризує варіацію результативної ознаки у, спричинену впливом ознаки-фактора х, покладеного в основу угруповання. Вона характеризує варіацію групових середніх і дорівнює середньому квадрату відхилень групових середніх від загальної середньої.
,
де – середня арифметична i-та група;
– чисельність одиниць у i-тій групі (частота i-тої групи);
– загальна середня сукупності.
Внутрішньогрупова дисперсіявідбиває випадкову варіацію, т. е. ту частину варіації, що викликана впливом неврахованих чинників і залежить від ознаки-фактора, покладеного основою угруповання. Вона характеризує варіацію індивідуальних значень щодо групових середніх, дорівнює середньому квадрату відхилень окремих значень ознаки увсередині групи від середньої арифметичної цієї групи (групової середньої) та обчислюється як проста або зважена дисперсія для кожної групи:
або ,
де – число одиниць групи.
На підставі внутрішньогрупових дисперсій з кожної групи можна визначити загальну середню із внутрішньогрупових дисперсій:
.
Взаємозв'язок між трьома дисперсіями отримав назву правила складання дисперсій, згідно з яким загальна дисперсія дорівнює сумі міжгрупової дисперсіїта середньої із внутрішньогрупових дисперсій:

приклад. При вивченні впливу тарифного розряду (кваліфікації) робітників на рівень продуктивності їхньої праці отримані такі дані.
Таблиця 5 - Розподіл робітників по середньогодинному виробітку.



п/п

Робочі 4-го розряду

Робочі 5-го розряду

Вироблення
робітника, шт.,

Вироблення
робітника, шт.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

У цьому прикладі робітники розділені на дві групи за факторною ознакою х- кваліфікації, що характеризується їх розрядом. Результативна ознака – вироблення – варіюється як під його впливом (міжгрупова варіація), так і за рахунок інших випадкових факторів (внутрішньогрупова варіація). Завдання полягає у вимірі цих варіацій за допомогою трьох дисперсій: загальної, міжгрупової та внутрішньогрупової. Емпіричний коефіцієнт детермінації показує частку варіації результативної ознаки упід впливом факторної ознаки х. Решта загальної варіації увикликана зміною інших чинників.
У прикладі емпіричний коефіцієнт детермінації дорівнює:
або 66,7%,
Це означає, що у 66,7% варіація продуктивність праці робочих зумовлена ​​відмінностями у кваліфікації, але в 33,3% – впливом інших чинників.
Емпіричне кореляційне ставленняпоказує тісноту зв'язку між групувальною та результативними ознаками. Розраховується як квадратний корінь з емпіричного коефіцієнта детермінації:

Емпіричне кореляційне відношення, як і може приймати значення від 0 до 1.
Якщо зв'язок немає, то =0. І тут =0, тобто групові середні рівні між собою міжгрупової варіації немає. Значить групувальний ознака – чинник впливає освіту загальної варіації.
Якщо зв'язок функціональний, то =1. У цьому випадку дисперсія групових середніх дорівнює загальної дисперсії(), Тобто внутрішньогрупової варіації немає. Це означає, що групувальна ознака повністю визначає варіацію результативної ознаки, що вивчається.
Чим ближче значення кореляційного відношеннядо одиниці, тим більше, ближче до функціональної залежності зв'язок між ознаками.
Для якісної оцінки тісноти зв'язок між ознаками користуються співвідношеннями Чеддока.

У прикладі , що свідчить про тісний зв'язок між продуктивністю праці робітників та його кваліфікацією.

Теорія ймовірності – особливий розділ математики, який вивчають лише студенти вищих навчальних закладів. Ви любите розрахунки та формули? Вас не лякають перспективи знайомства з нормальним розподілом, ентропією ансамблю, математичним очікуванням та дисперсією дискретної випадкової величини? Тоді цей предмет вам буде дуже цікавим. Познайомимося з кількома найважливішими базовими поняттями цього розділу науки.

Згадаймо основи

Навіть якщо ви пам'ятаєте найпростіші поняття теорії ймовірності, не зневажайте перших абзаців статті. Справа в тому, що без чіткого розуміння основ ви не зможете працювати з формулами, що розглядаються далі.

Отже, відбувається деяка випадкова подія, якийсь експеримент. Через війну вироблених дій ми можемо отримати кілька результатів - одні зустрічаються частіше, інші - рідше. Імовірність події - це відношення кількості реально отриманих наслідків одного типу до загальному числуможливих. Тільки знаючи класичне визначенняданого поняття, ви зможете приступити до вивчення математичного очікуваннята дисперсії безперервних випадкових величин.

Середнє арифметичне

Ще в школі на уроках математики ви починали працювати із середнім арифметичним. Це поняття широко використовується в теорії ймовірності, і тому його не можна обминути. Головним для нас зараз є те, що ми зіткнемося з ним у формулах математичного очікування та дисперсії випадкової величини.

Ми маємо послідовність чисел і хочемо знайти середнє арифметичне. Все, що від нас вимагається - підсумувати все існуюче та розділити на кількість елементів у послідовності. Нехай ми маємо числа від 1 до 9. Сума елементів дорівнюватиме 45, і це значення ми розділимо на 9. Відповідь: - 5.

Дисперсія

Говорячи науковою мовою, дисперсія – це середній квадрат відхилень отриманих значень ознаки від середньої арифметичної. Позначається одна заголовною латинською літерою D. Що потрібно, щоб її розрахувати? Для кожного елемента послідовності порахуємо різницю між наявним числом та середнім арифметичним і зведемо у квадрат. Значень вийде рівно стільки, скільки може бути результатів у події, що ми розглядаємо. Далі ми підсумовуємо все отримане та ділимо на кількість елементів у послідовності. Якщо у нас можливі п'ять наслідків, то ділимо на п'ять.

У дисперсії є й властивості, які потрібно запам'ятати, щоб застосовувати під час вирішення завдань. Наприклад, зі збільшенням випадкової величини у X разів, дисперсія збільшується у X у квадраті разів (т. е. X*X). Вона ніколи не буває менше нуля і не залежить від зсуву значень на рівне значення у більшу чи меншу сторону. Крім того, для незалежних випробуваньдисперсія суми дорівнює сумі дисперсій.

Тепер нам обов'язково слід розглянути приклади дисперсії дискретної випадкової величини та математичного очікування.

Припустимо, що ми провели 21 експеримент та отримали 7 різних результатів. Кожен із них ми спостерігали, відповідно, 1,2,2,3,4,4 та 5 разів. Чому дорівнюватиме дисперсія?

Спочатку порахуємо середнє арифметичне: сума елементів, зрозуміло, дорівнює 21. Ділимо її на 7, отримуючи 3. Тепер із кожного числа вихідної послідовності віднімемо 3, кожне значення зведемо в квадрат, а результати складемо разом. Вийде 12. Тепер нам залишається розділити число на кількість елементів, і, начебто, все. Але є проблема! Давайте її обговоримо.

Залежність кількості експериментів

Виявляється, при розрахунку дисперсії у знаменнику може стояти одне з двох чисел: або N або N-1. Тут N - це число проведених експериментів або число елементів у послідовності (що, по суті, те саме). Від чого це залежить?

Якщо кількість випробувань вимірюється сотнями, ми повинні ставити в знаменник N. Якщо одиницями, то N-1. Кордон вчені вирішили провести досить символічно: на сьогоднішній день вона проходить за цифрою 30. Якщо експериментів ми провели менше 30, то ділити суму будемо на N-1, а якщо більше – то на N.

Завдання

Давайте повернемося до нашого прикладу розв'язання задачі на дисперсію та математичне очікування. Ми отримали проміжне число 12, яке потрібно було поділити на N або N-1. Оскільки експериментів ми провели 21, що менше 30 виберемо другий варіант. Отже, відповідь: дисперсія дорівнює 12/2 = 2.

Математичне очікування

Перейдемо до другого поняття, яке ми обов'язково маємо розглянути цій статті. Математичне очікування - це результат складання всіх можливих наслідків, помножених на відповідні ймовірності. Важливо розуміти, що отримане значення, як і результат розрахунку дисперсії, виходить лише один раз для цілого завдання, скільки результатів у ній не розглядалося.

Формула математичного очікування досить проста: беремо результат, множимо з його ймовірність, додаємо те саме для другого, третього результату тощо. буд. Усе, що з цим поняттям, розраховується нескладно. Наприклад, сума матожиданий дорівнює маточку суми. Для твору актуально те саме. Такі прості операції дозволяє із собою виконувати далеко не кожна величина теорії ймовірності. Давайте візьмемо завдання і порахуємо значення одразу двох вивчених понять. Крім того, ми відволікалися на теорію - настав час попрактикуватися.

Ще один приклад

Ми провели 50 випробувань і отримали 10 видів результатів – цифри від 0 до 9 – які з'являються у різному відсотковому відношенні. Це відповідно: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Нагадаємо, що для отримання ймовірностей потрібно розділити значення у відсотках на 100. Таким чином отримаємо 0,02; 0,1 і т.д. Представимо для дисперсії випадкової величини та математичного очікування приклад розв'язання задачі.

Середнє арифметичне розрахуємо за такою формулою, яку пам'ятаємо з молодшої школи: 50/10 = 5.

Тепер переведемо ймовірність у кількість наслідків «в штуках», щоб було зручніше рахувати. Отримаємо 1, 5, 2, 7, 1, 9, 3, 8, 5 і 9. З кожного отриманого значення віднімемо середнє арифметичне, після чого кожен із отриманих результатів зведемо в квадрат. Подивіться, як це зробити, з прикладу першого елемента: 1 - 5 = (-4). Далі: (-4) * (-4) = 16. Для решти значень проробіть ці операції самостійно. Якщо ви все зробили правильно, то після додавання всіх ви отримаєте 90.

Продовжимо розрахунок дисперсії та математичного очікування, розділивши 90 на N. Чому ми вибираємо N, а не N-1? Правильно тому, що кількість проведених експериментів перевищує 30. Отже: 90/10 = 9. Дисперсію ми отримали. Якщо у вас вийшло інше число, не засмучуйтесь. Швидше за все, ви припустилися банальної помилки при розрахунках. Перевірте ще раз написане, і напевно все встане на свої місця.

Зрештою, згадаємо формулу математичного очікування. Не будемо наводити всіх розрахунків, напишемо лише відповідь, з якою ви зможете звіритися, закінчивши всі необхідні процедури. Матоожидання дорівнюватиме 5,48. Нагадаємо лише, як здійснювати операції, з прикладу перших елементів: 0*0,02 + 1*0,1… тощо. Як бачите, ми просто множимо значення результату з його ймовірність.

Відхилення

Ще одне поняття, тісно пов'язане з дисперсією та математичним очікуванням – середнє квадратичне відхилення. Позначається воно або латинськими літерами sd, або грецькою малої «сигмою». Це поняття показує, наскільки у середньому відхиляються значення від центральної ознаки. Щоб знайти її значення, потрібно розрахувати квадратний коріньіз дисперсії.

Якщо ви збудуєте графік нормального розподілуі захочете побачити безпосередньо на ньому квадратичного відхилення, це можна зробити за кілька етапів. Візьміть половину зображення зліва або праворуч від моди (центрального значення), проведіть перпендикуляр до горизонтальної осі так, щоб площі фігур були рівні. Величина відрізка між серединою розподілу і проекцією, що вийшла, на горизонтальну вісь і буде середнім квадратичним відхиленням.

Програмне забезпечення

Як видно з описів формул і наведених прикладів, розрахунки дисперсії та математичного очікування - не найпростіша процедура з арифметичної точки зору. Щоб не витрачати час, є сенс скористатися програмою, яка використовується у вищих навчальних закладах- вона називається "R". У ній є функції, що дозволяють розраховувати значення для багатьох понять із статистики та теорії ймовірності.

Наприклад, ви задаєте вектор значень. Робиться це так: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

На закінчення

Дисперсія та математичне очікування - це без яких складно надалі щось розрахувати. В основному курсі лекцій у вишах вони розглядаються вже у перші місяці вивчення предмета. Саме через нерозуміння цих найпростіших понять та невміння їх розрахувати багато студентів відразу починають відставати за програмою і пізніше отримують погані позначки за результатами сесії, що позбавляє їх стипендії.

Потренуйтесь хоча б один тиждень по півгодини на день, вирішуючи завдання, схожі на представлені в цій статті. Тоді на будь-якій контрольній теорії ймовірності ви впораєтеся з прикладами без сторонніх підказок і шпаргалок.

Часто у статистиці під час аналізу будь-якого явища чи процесу необхідно враховувати як інформацію про середні рівні досліджуваних показників, а й розкид чи варіацію значень окремих одиниць яка є важливою характеристикою досліджуваної сукупності.

Найбільшою мірою варіації піддаються курси акцій, обсяги попиту та пропозиції, відсоткові ставки у різні періоди часу та у різних місцях.

Основними показниками, що характеризують варіацію , є розмах, дисперсія, середнє квадратичне відхилення та коефіцієнт варіації.

Розмах варіації являє собою різницю максимального та мінімального значень ознаки: R = Xmax - Xmin. Недоліком цього показника є те, що він оцінює лише межі варіювання ознаки і не відображає його коливання усередині цих кордонів.

Дисперсія позбавлена ​​цього недоліку. Вона розраховується як середній квадрат відхилень значень ознаки від їхньої середньої величини:

Спрощений спосіб розрахунку дисперсії здійснюється за допомогою наступних формул (простий та зваженої):

Приклади застосування даних формул представлені задачах 1 і 2.

Широко поширеним на практиці показником є середнє квадратичне відхилення :

Середнє квадратичне відхилення визначається як квадратний корінь з дисперсії і має ту ж розміреність, що і ознака, що вивчається.

Розглянуті показники дають змогу отримати абсолютне значення варіації, тобто. оцінюють її в одиницях виміру досліджуваної ознаки. На відміну від них, коефіцієнт варіації вимірює коливання у відносному вираженні - щодо середнього рівня, що у багатьох випадках є кращим.

Формула до розрахунку коефіцієнта варіації.

Приклади розв'язання задач на тему «Показники варіації у статистиці»

Завдання 1 . При вивченні впливу реклами на розмір середньомісячного вкладу у банках району обстежено 2 банки. Отримано такі результати:

Визначити:
1) кожному за банку: а) середній розмір вкладу протягом місяця; б) дисперсію вкладу;
2) середній розмір вкладу за місяць для двох банків разом;
3) Дисперсію вкладу для 2-х банків, що залежить від реклами;
4) Дисперсію вкладу для 2-х банків, що залежить від усіх факторів, крім реклами;
5) Загальну дисперсію використовуючи правило додавання;
6) Коефіцієнт детермінації;
7) Кореляційне ставлення.

Рішення

1) Складемо розрахункову таблицю для банку з рекламою . Для визначення середнього розміру вкладу протягом місяця знайдемо середини інтервалів. При цьому величина відкритого інтервалу (першого) умовно дорівнює величині інтервалу, що примикає до нього (другого).

Середній розмір вкладу знайдемо за формулою середньої арифметичної виваженої:

29000/50 = 580 руб.

Дисперсію вкладу знайдемо за формулою:

23 400/50 = 468

Аналогічні дії зробимо для банку без реклами :

2) Знайдемо середній розмір вкладу двох банків разом. Хср = (580 × 50 +542,8 × 50) / 100 = 561,4 руб.

3) Дисперсію вкладу для двох банків, що залежить від реклами знайдемо за формулою: σ 2 =pq (формула дисперсії альтернативної ознаки). Тут р = 0,5 - частка факторів, що залежать від реклами; q=1-0,5, тоді 2 =0,5*0,5=0,25.

4) Оскільки частка інших чинників дорівнює 0,5, то дисперсія вкладу двох банків, залежить від усіх чинників крім реклами теж 0,25.

5) Визначимо загальну дисперсію, використовуючи правило додавання.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04

6) Коефіцієнт детермінації η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% – розмір вкладу на 39% залежить від реклами.

7) Емпіричне кореляційне відношення η = √η 2 = √0,39 = 0,62 – зв'язок досить тісний.

Завдання 2 . Є угруповання підприємств за величиною товарної продукції:

Визначити: 1) дисперсію величини товарної продукції; 2) середнє квадратичне відхилення; 3) коефіцієнт варіації.

Рішення

1) За умовою подано інтервальний ряд розподілу. Його необхідно висловити дискретно, тобто знайти середину інтервалу (х"). У групах закритих інтервалів середину знайдемо за простою середньою арифметичною. -200): 2 = 100).

У групах із нижнім кордоном – сумою цього нижнього кордону та половини розміру попереднього інтервалу (800+(800-600):2=900).

Розрахунок середньої величини товарної продукції робимо за такою формулою:

Хср = k×((Σ((х"-a):k)×f):Σf) + a. Тут а = 500 - розмір варіанта при найбільшій частоті, k = 600-400 = 200 - розмір інтервалу при найбільшій частоті Результат помістимо в таблицю:

Отже, середня величина товарної продукції за період, що вивчається в цілому дорівнює Хср = (-5:37) × 200 +500 = 472,97 тис. руб.

2) Дисперсію знайдемо за такою формулою:

σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) середнє квадратичне відхилення: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тис. руб.

4) коефіцієнт варіації: V = (σ / Хср) * 100 = (186,94 / 472,97) * 100 = 39,52%

Види дисперсій:

Загальна дисперсіяхарактеризує варіацію ознаки всієї сукупності під впливом всіх чинників, які зумовили цю варіацію. Ця величина визначається за формулою

де - загальна середня арифметична всієї досліджуваної сукупності.

Середня внутрішньогрупова дисперсіясвідчить про випадкову варіацію, яка може виникнути під впливом будь-яких неврахованих факторів і яка не залежить від ознаки-фактора, покладеного в основу угруповання. Дана дисперсія розраховується наступним чином: спочатку розраховуються дисперсії за окремими групами (), потім розраховується середня внутрішньогрупова дисперсія:

де n i - Число одиниць у групі

Міжгрупова дисперсія(Дисперсія групових середніх) характеризує систематичну варіацію, тобто. відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки-фактора, який покладено в основу угруповання.

де – середня величина за окремою групою.

Всі три види дисперсії пов'язані між собою: загальна дисперсія дорівнює сумі середньої внутрішньогрупової дисперсії та міжгрупової дисперсії:

Властивості:

25 Відносні показники варіації

Коефіцієнт осциляції

Відносне лінійне відхилення

Коефіцієнт варіації

Коеф. Осц. провитрачає відносну коливання крайніх значень ознаки навколо середньої. Отн. лін. вимкнути. характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини. Коеф. Варіації є найпоширенішим показником коливання, використовуваним з метою оцінки типовості середніх величин.

У статистиці сукупності, що мають коефіцієнт варіації більше 30-35%, прийнято вважати неоднорідними.

    Закономірність рядів розподілу. Моменти розподілу. Показники форми розподілу

У варіаційних рядах існує зв'язок між частотами і значеннями ознаки, що варіює: зі збільшенням ознаки величина частоти спочатку зростає до певної межі, а потім зменшується. Такі зміни називаються закономірностями розподілу.

Форму розподілу вивчають за допомогою показників асиметрії та ексцесу. Під час обчислення зазначених показників використовують моменти розподілу.

Моментом k-го порядку називають середній із k-х ступенів відхилень варіантів значень ознаки від деякої постійної величини. Порядок моменту визначається за величиною k. Під час аналізу варіаційних рядів обмежуються розрахунком моментів перших чотирьох порядків. При обчисленні моментів як ваги можуть бути використані частоти або частоти. Залежно від вибору постійної величини розрізняють початкові, умовні та центральні моменти.

Показники форми розподілу:

Асиметрія(As) показник, що характеризує ступінь асиметричності розподілу .

Отже, при (лівосторонній) негативній асиметрії . При (правосторонній) позитивній асиметрії .

Для розрахунку асиметрії можна використати центральні моменти. Тоді:

,

де μ 3 - Центральний момент третього порядку.

- ексцес (Е до ) характеризує крутість графіка функції в порівнянні з нормальним розподілом при тій же силі варіації:

,

де μ4 - центральний момент 4-го порядку.

    Закон нормального розподілу

Для нормального розподілу (розподілу Гауса) функція розподілу має такий вигляд:

Мотовидання-стандартне відхилення

Нормальний розподіл симетрично і йому характерно таке співвідношення: Хср=Ме=Мо

Ексцес нормального розподілу дорівнює 3 а коефіцієнт асиметрії 0.

Крива нормального розподілу являє собою полігон (симетрична колокообразная пряма)

    Види дисперсії. Правило складання дисперсій. Сутність емпіричного коефіцієнта детермінації.

Якщо вихідна сукупність поділена на групи за якоюсь суттєвою ознакою, то обчислюють такі види дисперсій:

    Загальна дисперсія вихідної сукупності:

де - загальна середня величина вихідної сукупності; f - частоти вихідної сукупності. Загальна дисперсія характеризує відхилення індивідуальних значень ознаки загальної середньої величини вихідної сукупності.

    Внутрішньогрупові дисперсії:

де j- номер групи; - середня величина в кожній j-ій групі; - частоти j-ої групи. Внутрішньогрупові дисперсії характеризують відхилення індивідуального значення ознаки у кожній групі від групової середньої величини. З усіх внутрішньогрупових дисперсій обчислюють середню за формулою: де- чисельність одиниць у кожній j-ій групі.

    Міжгрупова дисперсія:

Міжгрупова дисперсія характеризує відхилення групових середніх величин загальної середньої величини вихідної сукупності.

Правило складання дисперсійполягає в тому, що загальна дисперсія вихідної сукупності повинна дорівнювати сумі міжгрупової та середньої з внутрішньогрупових дисперсій:

Емпіричний коефіцієнт детермінаціїпоказує частку варіації досліджуваної ознаки, обумовлену варіацією групувальної ознаки, і розраховується за такою формулою:

    Спосіб відліку від умовного нуля (спосіб моментів) для розрахунку середньої величини та дисперсії

Розрахунок дисперсії способом моментів заснований на використанні формули та 3 і 4 властивостей дисперсії.

(3. Якщо всі значення ознаки (варіанти) збільшити (зменшити) якесь постійне число А, то дисперсія нової сукупності не зміниться.

4.Якщо всі значення ознаки (варіанти) збільшити (помножити) до К разів, де К – постійне число, то дисперсія нової сукупності збільшиться (зменшиться) до К 2 разів.)

Отримаємо формулу обчислення дисперсії у варіаційних рядах з рівними інтервалами способом моментів:

А- умовний нуль, рівний варіанті з максимальною частотою (середина інтервалу з максимальною частотою)

Розрахунок середньої величини способом моментів також ґрунтується на використанні властивостей середньої.

    Поняття про вибіркове спостереження. Етапи дослідження економічних явищ вибірковим методом

Вибірковим називають спостереження, у якому обстеженню та вивченню піддаються в повному обсязі одиниці вихідної сукупності, лише частина одиниць, у своїй результат обстеження частини сукупності поширюється протягом усього вихідну сукупність. Сукупність, з якої проводиться відбір одиниць для подальшого обстеження та вивчення називається генеральноїі всі показники, що характеризують цю сукупність, називаються генеральними.

Можливі межі відхилень вибіркової середньої величини від генеральної середньої величини називають помилкою вибірки.

Сукупність відібраних одиниць називається вибірковоюі всі показники, що характеризують цю сукупність, називаються вибірковими.

Вибіркове дослідження включає такі етапи:

Характеристика об'єкта дослідження (масові економічні явища). Якщо генеральна сукупність невелика, вибірку проводити не рекомендується, необхідно суцільне дослідження;

Розрахунок обсягу вибірки. Важливо визначити оптимальний обсяг, який дозволить за найменших витрат отримати помилку вибірки в межах допустимої;

Проведення відбору одиниць спостереження з огляду на вимоги випадковості, пропорційності.

Доказ репрезентативності, що ґрунтується на оцінці помилки вибірки. Для випадкової вибірки помилка розраховується із застосуванням формул. Для цільової вибірки репрезентативність оцінюється за допомогою якісних методів (порівняння, експерименту);

Аналіз вибіркової сукупності. Якщо сформована вибірка відповідає вимогам репрезентативності, проводиться її аналіз з використанням аналітичних показників (середніх, відносних та ін.)

Поділіться з друзями або збережіть для себе:

Завантаження...