Що таке медіана розподілу? Структурні характеристики варіаційного ряду розподілу

Медіана (Me)- Значення ознаки, що припадає на середину ранжованого ряду, тобто. ділить ряд розподілу на дві рівні частини.

а) для ряду одиночних значень:

Якщо непарнеу варіант, то серединне значення ранжированном ряду

Якщо парне, то сред.арифмет. з 2х суміжних серединних значень у ранжирів. ряду

б) У дискретному ряді розподілувизначається номер медіани за формулою:

Номер медіани показує значення показника, яке і є медіаною.

в) В інтервальному ряді розподілумедіана розраховується за такою формулою:

x – нижня межа медіанного інтервалу;

i – величина інтервалу;

f – чисельність медіанного інтервалу;

S – сума накопичених частот інтервалів, що передують медіанному.

31. Мода та її практичне значення

Мода (Mo)– величина ознаки, найчастіше що у сукупності, тобто. має найбільшу чисельність у ряді розподілу.

а) У дискретному ряді розподілумода визначається візуально.

б) В інтервальному ряду розподілувізуально можна визначити лише інтервал, в якому укладена мода, який називається модальним інтервалом (той, що має найбільшу частоту).

Мода дорівнюватиме:

x – нижня межа модального інтервалу;

i – величина інтервалу;

f – чисельність модального інтервалу;

Якщо всі значення варіаційного рядумають однакову частоту, то кажуть, що цей варіаційний ряд немає моди. Якщо дві не сусідні варіанти мають однакову домінуючу частоту, то такий варіаційний ряд називають бімодальним; якщо таких варіантів більше двох, то ряд – полімодальний.

32. Показники варіації та способи їх розрахунку

Варіації- коливання, різноманіття, змінність величини ознаки в одиниць сукупності.

Показники варіації поділяються на абсолютні та відносні.

До абсолютним показникамналежать розмах варіації, середнє лінійне відхилення, дисперсія, середнє квадратичне відхилення. До відносним- Коефіцієнти осциляції, коефіцієнти варіації та відносне лінійне відхилення.

Розмах варіації– найпростіший показник, різниця між максимальним та мінімальним значеннями ознаки.

Недоліком є ​​те, що він оцінює лише межі варіювання ознаки і не відображає його коливання усередині цих кордонів.

Середнє лінійне відхиленнявідбиває всі коливання варіюючого ознаки і є середню арифметичну з абсолютних значень відхилень варіант від середньої величини, т.к. сума відхилень значень ознаки від середньої дорівнює 0, всі відхилення беруться по модулю.

Проста
Зважена

Дисперсія- Середній квадрат відхилень значень ознаки від їх середньої величини.

Проста:
Зважена:

З реднє квадратичне відхилення. Воно визначається як квадратний корінь з дисперсії і має ту ж розмірність, що і ознака, що вивчається.

Проста:
Зважена:
.

Відносні показники

Медіаною Меназивають таке значення ознаки, яке припадає на середину ранжованого ряду і поділяє його на дві рівні за кількістю одиниць частини. Таким чином, у ранжированому ряду розподілу одна половина ряду має значення ознаки, що перевищують медіану, інша – менше за медіану.

Медіану використовують замість середньої арифметичної, коли крайні варіанти ранжованого ряду (найменша та найбільша) порівняно з іншими виявляються надмірно більшими або надмірно малими.

У дискретномуваріаційному ряду, що містить непарне число одиниць, медіана дорівнює варіанті ознаки, що має номер:
,
де N - Число одиниць сукупності.
У дискретному ряду, що складається з парного числа одиниць сукупності, медіана визначається як середня варіант, що мають номери і :
.
У розподілі робітників за стажем роботи медіана дорівнює середній варіант, що мають у ранжованому ряду номери 10: 2 = 5 і 10: 2 + 1 = 6. Варіанти п'ятої та шостої ознаки дорівнюють 4 рокам, таким чином
року
При обчисленні медіани в інтервальномуряду спочатку знаходять медіанний інтервал, (Тобто містить медіану), для чого використовують накопичені частоти або частоти. Медіанним є інтервал, накопичена частота якого дорівнює або перевищує половину всього обсягу сукупності. Потім значення медіани розраховується за такою формулою:
,
де – нижня межа медіанного інтервалу;
- Ширина медіанного інтервалу;
– накопичена частота інтервалу, що передує медіанному;
- Частота медіанного інтервалу.
Розрахуємо медіану низки розподілу робітників за розміром зарплати (див. лекцію «Зведення та угруповання статистичних даних»).
Медіанним є інтервал заробітної плати 800-900 грн, оскільки його кумулятивна частота дорівнює 17, що перевищує половину суми всіх частот (). Тоді
Ме=800+100грн.
Отримане значення свідчить, половина робітників мають заробітну платунижче 875 грн., але це вище за середній її розмір.
Для визначення медіани можна замість кумулятивних частот використовувати кумулятивні частоти.
Медіана, як і мода, не залежить від крайніх значень варіанта, тому також застосовується для характеристики центру в рядах розподілу з невизначеними межами.
Властивість медіани :Сума абсолютних величин відхилень варіант від медіани менше, ніж від будь-якої іншої величини (у тому числі і від середньої арифметичної):

Ця властивість медіани використовується на транспорті при проектуванні розташування трамвайних та тролейбусних зупинок, бензоколонок, складальних пунктів тощо.
приклад.На шосе завдовжки 100 км. розташовано 10 гаражів. Для проектування будівництва бензоколонки були зібрані дані про кількість їздок на заправку по кожному гаражу.
Таблиця 2 - Дані про кількість їздок на заправку по кожному гаражі.

Потрібно поставити бензоколонку так, щоб загальний пробіг автомашин на заправку був найменшим.
Варіант 1.Якщо бензоколонку поставити в середині шосе, тобто на 50-му кілометрі (центр діапазону зміни ознаки), то пробіги з урахуванням числа їздок становитимуть:
а) в одному напрямку:
;
б) у протилежному:
;
в) загальний пробіг в обидва напрями: .

Варіант 2.Якщо бензоколонку поставити на середній ділянці шосе, визначеному за формулою середньої арифметичної з урахуванням числа їздок:

Медіану можна визначити графічно, за кумулятом (див. лекцію «Зведення та угруповання статистичних даних»). Для цього останню ординату, рівну сумівсіх частот чи частот, ділять навпіл. З отриманої точки відновлюють перпендикуляр до перетину з кумулятою. Абсцис точки перетину і дає значення медіани.

4. Мода. Медіана. Генеральна та вибіркова середня

Мода на екрані, медіана у трикутнику, а середні – це температура по лікарні та в палаті. Продовжуємо наш практичний курс цікавої статистики (Заняття 1)вивченням центральних характеристик статистичної сукупності, назви яких ви бачите у заголовку. І почнемо ми з його кінця, оскільки про середніх величинмова зайшла практично з перших абзаців теми. Для підготовлених читачів зміст:

  • Генеральна та вибіркова середня– обчислення за первинними даними та для сформованого дискретного варіаційного ряду;
  • Мода- Визначення та знаходження для дискретного випадку;
  • Медіаназагальне визначення, як знайти медіану;
  • Середня, мода та медіана інтервального варіаційного ряду- Обчислення за первинними даними та за готовим рядом. Формули моди та медіани,
  • Квартили, децилі, перцентілі - коротко про головне.

ну а "чайникам" краще ознайомитися з матеріалом по порядку:

Отже, нехай досліджується деяка Генеральна сукупністьобсягу, а саме її числова характеристика, неважливо, дискретнаабо безперервна (Заняття 2, 3).

Генеральної середньої називається середнє арифметичневсіх значень цієї сукупності:

Якщо серед чисел є однакові (що характерно для дискретного ряду) формулу можна записати в більш компактному вигляді:
, де
варіантиповторюється раз;
варіанти – раз;
варіанти – раз;

варіанти – раз.

Живий приклад обчислення генеральної середньоїзустрівся в Приклад 2, але щоб не занудити, я навіть не нагадуватиму його зміст.

Далі. Як ми пам'ятаємо, обробка всієї генеральної сукупностічасто утруднена чи неможлива, і тому з неї організують представницькувибірку обсягу, і на підставі дослідження цієї вибірки роблять висновок про всю сукупність.

Вибіркової середньої називається середнє арифметичневсіх значень вибірки:

і за наявності однакових варіантів формула запишеться компактніше:
– як сума творів варіант на відповідні частоти .

Вибіркова середня дозволяє досить точно оцінити справжнє значення, чого цілком достатньо багатьох досліджень. При цьому чим більше вибірка, тим точніше буде ця оцінка.

Практику почнемо, а точніше продовжимо, з дискретного варіаційного рядута знайомої умови:

Приклад 8

За результатами вибіркового дослідження робочих цеху було встановлено їх кваліфікаційні розряди: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3.

Як вирішуватизавдання? Якщо нам дані первинні дані(вихідні необроблені значення), їх можна тупо підсумувати і розділити результат обсяг вибірки:
- Середньостатистичний кваліфікаційний розряд робочих цеху.

Але у багатьох завданнях потрібно скласти варіаційний ряд (Див. Приклад 4) :

- або цей ряд запропонований спочатку (що буває частіше). І тоді ми, звичайно, використовуємо «цивілізовану» формулу:

Мода . Мода дискретного варіаційного ряду – це варіантиіз максимальною частотою. В даному випадку . Моду легко знайти по таблиці, і ще легше на полігоні частот- Це абсциса найвищої точки:


Іноді таких значень кілька (з однаковою максимальною частотою), і тоді модою вважають кожне їх.

Якщо все чи майже все варіантирізні (що характерно для інтервального ряду), то модальне значення визначається дещо іншим способом, про який у 2-й частині уроку.

Медіана . Медіана варіаційного ряду * - Це значення, яка ділить його на дві рівні частини (за кількістю варіант).

Але тепер нам потрібно знайти середню, моду та медіану.

Рішення: щоб знайти середнюза первинними даними, найкраще підсумувати всі варіанти та розділити отриманий результат на обсяг сукупності:
ден. од.

Ці підрахунки, до речі, займуть не так багато часу і при використанні калькулятора оффлайн. Але якщо є Ексель, то, звісно, забиваємо в будь-який вільний осередок = СУМ (, виділяємо мишкою всі числа, закриваємо дужку ) , ставимо знак поділу / , вводимо число 30 і тиснемо Enter. Готово.

Що стосується моди, то її оцінка за вихідними даними стає непридатною. Хоч ми й бачимо серед чисел однакові, але серед них запросто може бути п'ять так шість-сім варіант з однаковою максимальною частотою, наприклад, частотою 2. Крім того, ціни можуть бути округленими. Тому модальне значення розраховується за сформованим інтервальним рядом (Про що трохи пізніше).

Чого не скажеш про медіана: забиваємо в Ексель =МЕДІАНА(, виділяємо мишею всі числа, закриваємо дужку ) і тиснемо Enter: . Причому тут навіть нічого не потрібно сортувати.

Але в Приклад 6було проведено сортування за зростанням (згадуємо та сортуємо – посилання вище), і це відмінна можливість повторити формальний алгоритм пошуку медіани. Ділимо обсяг вибірки навпіл:

І оскільки вона складається з парної кількості варіант, то медіана дорівнює середньому арифметичному 15-й та 16-й варіанти упорядкованого(!) Варіаційного ряду:

ден. од.

Ситуація друга. Коли дано готовий інтервальний ряд (типове навчальне завдання).

Продовжуємо аналізувати той самий приклад із черевиками, де за вихідними даними був складений ІВР. Для обчислення середньоїзнадобляться середини інтервалів:

– щоб скористатися знайомою формулою дискретного випадку:

- відмінний результат! Розбіжність із більш точним значенням (), обчисленим за первинними даними, становить лише 0,04.

По суті, тут ми наблизили інтервальний ряд дискретним, і це наближення виявилося дуже ефективним. Втім, особливої ​​вигоди немає, т.к. при сучасному програмному забезпеченні не важко вирахувати точне значеннянавіть у дуже великому масиву первинних даних. Але це за умови, що вони нам відомі:)

З іншими центральними показниками все цікавіше.

Щоб знайти моду, потрібно знайти модальний інтервал (з максимальною частотою)- У цьому завдання це інтервал з частотою 11, і користуватися наступною страшною формулою:
, де:

- нижня межа модального інтервалу;
- Довжина модального інтервалу;
- Частота модального інтервалу;
- Частота попереднього інтервалу;
- Частота наступного інтервалу.

Таким чином:
ден. од. - Як бачите, «модна» ціна на черевики помітно відрізняється від середньої арифметичної.

Не вдаючись у геометрію формули, просто наведу гістограму відносних частоті відзначу:


звідки добре видно, що мода зміщена щодо центру модального інтервалу у бік лівого інтервалу з більшою частотою. Логічно.

Довідково розберу поодинокі випадки:

- Якщо модальний інтервал останній, то або ;

– якщо виявляться 2 модальні інтервали, які знаходяться поруч, наприклад, і , то розглядаємо модальний інтервал, при цьому довколишні інтервали (ліворуч і праворуч) по можливості теж укрупнюємо в 2 рази.

– якщо між модальними інтервалами є відстань, то застосовуємо формулу до кожного інтервалу, отримуючи цим 2 або більша кількістьмод.

Ось такий депеш мод:)

І медіана. Якщо дано готовий інтервальний ряд, то медіана розраховується трохи менш страшною формулою, але спочатку нудно (описка по Фрейду:)) знайти медіанний інтервал - Це інтервал, що містить варіанту (або 2 варіанти), яка ділить варіаційний ряд на дві рівні частини.

Вище я розповів, як визначити медіану, орієнтуючись на відносні накопичені частоти, тут же зручніше розрахувати «звичайні» накопичені частоти. Обчислювальний алгоритм такий самий – перше значення зносимо зліва (червона стрілка), і кожне наступне виходить як сума попереднього з поточною частотою з лівого стовпця (зелені позначення як приклад):

Усім зрозуміле значення чисел у правому стовпці? - це кількість варіантів, які встигли "накопичитися" на всіх "пройдених" інтервалах, включаючи поточний.

Бо у нас парна кількістьваріант (30 штук), то медіанним буде той інтервал, який містить 30/2 = 15 і 16 варіанта. І орієнтуючись на накопичені частоти, легко дійти висновку, що ці варіанти містяться в інтервалі .

Формула медіани:
, де:
- Обсяг статистичної сукупності;
– нижня межа медіанного інтервалу;
- Довжина медіанного інтервалу;
частотамедіанного інтервалу;
накопичена частота попередньогоінтервалу.

Таким чином:
ден. од. - Зауважимо, що медіанне значення, навпаки, виявилося зміщене правіше, т.к. праворуч знаходиться значна кількість варіантів:


І довідково особливі випадки.

Зарплат в різних галузях економіки, температуру і рівень опадів на одній і тій же території за порівняні періоди часу, врожайність культур, що вирощуються в різних географічних регіонах і т. д. Втім, середня є аж ніяк не єдиним узагальнюючим показником - у ряді випадків для більш точної оцінки підходить така величина як медіана. У статистиці вона широко застосовується як допоміжна описова характеристика розподілу будь-якої ознаки в окремо взятій сукупності. Давайте розберемося, чим вона відрізняється від середньої, і чим викликана необхідність її використання.

Медіана у статистиці: визначення та властивості

Уявіть собі таку ситуацію: на фірмі разом із директором працюють 10 осіб. Прості працівники отримують по 1000 грн., а їхній керівник, який, до того ж, є власником, – 10000 грн. Якщо обчислити середнє арифметичне, то вийде, що у середньому зарплата цьому підприємстві дорівнює 1900 грн. Чи буде справедливим це твердження? Або візьмемо такий приклад, в одній і тій же лікарняній палаті знаходиться дев'ять осіб з температурою 36,6 °С, і одна людина, яка має 41 °С. Арифметичне середнє у разі одно: (36,6*9+41)/10 = 37,04 °С. Але це зовсім не означає, що кожен із присутніх хворий. Все це наштовхує на думку, що однієї середньої часто буває недостатньо, і саме тому на додаток до неї використовується медіана. У статистиці цим показником називають варіант, розташований рівно посередині упорядкованого варіаційного ряду. Якщо порахувати її для наших прикладів, то вийде відповідно 1000 грн. та 36,6 °С. Іншими словами, медіаною в статистиці називається значення, яке ділить ряд навпіл таким чином, що по обидва боки від неї (вниз або вгору) розташована однакова кількість одиниць цієї сукупності. Через цю властивість цей показник має ще кілька назв: 50-й перцентиль або квантиль 0,5.

Як знайти медіану у статистиці

Спосіб розрахунку цієї величини багато в чому залежить від того, який тип варіаційного ряду ми маємо: дискретний чи інтервальний. У першому випадку медіана в статистиці знаходиться досить просто. Все, що потрібно зробити, це знайти суму частот, розділити її на 2 і потім додати результату ½. Найкраще пояснити принцип розрахунку на наступному прикладі. Припустимо, у нас є згруповані дані народжуваності, і потрібно з'ясувати, чому дорівнює медіана.

Номер групи сімей за кількістю дітей

Кількість сімей

Провівши нехитрі підрахунки, отримаємо, що показник, що шукається, дорівнює: 195/2 + ½ = варіанти. Для того, щоб з'ясувати, що це означає, слід послідовно накопичувати частоти, починаючи з найменшої варіанти. Отже, сума перших двох рядків дає нам 30. Зрозуміло, що тут 98 варіантів немає. Але якщо додати до результату частоту третьої варіанти (70), то вийде сума, що дорівнює 100. У ній якраз і знаходиться 98 варіанта, а значить медіаною буде сім'я, у якої є двоє дітей.

Щодо інтервального ряду, то тут зазвичай використовують таку формулу:

М е = Х Ме + i Ме * (∑f/2 - S Me-1)/f Ме, в якій:

  • Х Ме – перше значення медіанного інтервалу;
  • ∑f – чисельність ряду (сума його частот);
  • i Ме – величина медіанного діапазону;
  • f Ме – частота медіанного діапазону;
  • S Ме-1 – сума кумулятивних частот у діапазонах, що передують медіанному.

Знову ж таки, без прикладу тут розібратися досить складно. Припустимо, є дані за величиною

Зарплата, тис. руб.

Накопичені частоти

Щоб скористатися наведеною вище формулою, спочатку нам потрібно визначити медіанний інтервал. Як такий діапазон вибирають той, накопичена частота якого перевищує половину всієї суми частот або дорівнює їй. Отже, розділивши 510 на 2, отримуємо, що цьому критерію відповідає інтервал зі значенням зарплати від 250 000 руб. до 300 000 руб. Тепер можна підставляти всі дані у формулу:

М е = Х Ме + i Ме * (∑f/2 - S Ме-1) / f Ме = 250 + 50 * (510/2 - 170) / 115 = 286,96 тис. руб.

Сподіваємося, наша стаття виявилася корисною, і тепер ви маєте чітке уявлення про те, що таке медіана у статистиці та як її слід розраховувати.

Медіана- це таке значення ознаки, яке поділяє ранжований ряд розподілу на дві рівні частини - зі значеннями ознаки менше медіани та зі значеннями ознаки більше медіани. Для знаходження медіани, необхідно знайти значення ознаки, що знаходиться на середині впорядкованого ряду.

Подивитися рішення задачі на знаходження моди та медіаниВи можете

У ранжованих рядах несгруповані дані для знаходження медіанизводяться до пошуку порядкового номера медіани. Медіана може бути обчислена за такою формулою:

де Хm – нижня межа медіанного інтервалу;
im - медіанний інтервал;
Sme - сума спостережень, яка була накопичена до початку медіанного інтервалу;
fme – число спостережень у медіанному інтервалі.

Властивості медіани

  1. Медіана не залежить від тих значень ознаки, які розташовані по обидва боки від неї.
  2. Аналітичні операції з медіаною дуже обмежені, тому при поєднанні двох розподілів із відомими медіанами неможливо заздалегідь передбачити величину медіани нового розподілу.
  3. Медіана маєвластивістю мінімальності. Його суть полягає в тому, що сума абсолютних відхиленьзначень х від медіани являє собою мінімальну величину в порівнянні з відхиленням X від будь-якої іншої величини

Графічне визначення медіани

Для визначення медіани графічним методом використовують накопичені частоти, якими будується кумулятивна крива. Вершини ординат, що відповідають накопиченим частотам, з'єднують відрізками прямої. Розділивши поп олам останню ординату, яка відповідає загальну сумучастот і провівши до неї перпендикуляр перетину з кумулятивною кривою, знаходять ординату шуканого значення медіани.

Визначення моди у статистиці

Мода – значення ознаки, що має найбільшу частоту в статистичному рядурозподілу.

Визначення модиВиготовляється різними способами, і це залежить від того, чи представлений ознака, що варіює, у вигляді дискретного або інтервального ряду.

Знаходження модита медіани відбувається шляхом звичайного перегляду стовпця частот. У цьому стовпці знаходять найбільша кількість, Що характеризує найбільшу частоту Їй відповідає певне значення ознаки, яке є модою. В інтервальному варіаційному ряді модою вважають центральний варіант інтервалу з найбільшою частотою. У такій низці розподілу мода обчислюється за формулою:

де ХМо – нижня межа модального інтервалу;
imo – модальний інтервал;
fм0, fм0-1, fм0+1 - частоти в модальному, попередньому та наступному за модальним інтервалах.

Модальний інтервал визначається найбільшою частотою.

Мода широко використовується у статистичній практиці при аналізі купівельного попиту, реєстрації цін тощо.

Співвідношення між середньою арифметичною, медіаною та модою

Для одномодального симетричного ряду розподілу медіана і мода збігаються. Для асиметричних розподілів де вони збігаються.

К. Пірсон на основі вирівнювання різних типів кривих визначив, що для помірно асиметричних розподілів справедливі такі наближені співвідношення між середньою арифметичною, медіаною та модою:

Поділіться з друзями або збережіть для себе:

Завантаження...