Поняття про варіаційні ряди. Ранжований ряд

Ранжування– процедура впорядкування будь-яких об'єктів за зростанням або зменшенням деякої їхньої властивості за умови, що вони цією властивістю мають.

Можна ранжувати:

Держава за рівнем життя, народжуваності, безробіття;

Професії з престижності;

Товари за перевагою споживачів;

Респондентів з політичної активності, матеріального стану;

Об'єктами ранжирування є об'єкти, які безпосередньо упорядковуються. Підстава ранжування(Ранжируючий ознака) – то властивість, яким об'єкти впорядковуються. В результаті ранжування отримуємо ранжований ряд, у якому кожному об'єкту приписується свій індивідуальний ранг– місце об'єкта у ранжированому ряду. Число місць і, відповідно, кількість рангів у ранжированому ряду дорівнює кількості об'єктів.

Види ранжованих рядів:

1) кожен об'єкт має значення ознаки, відмінне від значень ознаки інших об'єктів, тоді кожному об'єкту ранжованого ряду присвоюється свій, відмінний від іншого об'єкта, ранг;

2) кілька об'єктів мають однакове значення ознаки, тоді цим об'єктам у ранжированому ряду надається однакові ранги, розраховані за певною формулою. І тут ранжированный ряд називається ранжированным поруч із пов'язаними рангами. При вирішенні завдань перший ранг присвоюватимемо найбільшого значенняознаки. Пов'язаний ранг розраховується як середнє значення місць, які займають об'єкти, що мають однакове значення ознаки. Встановлення статистичного зв'язку для 2-х та більш ранжованих рядів здійснюється за допомогою рангових коефіцієнтівзв'язку– такі коефіцієнти, які дозволяють обчислювати ступінь узгодженості у ранжируванні тих самих об'єктів з двох різних підстав (ознакам). Найбільш поширеним коефіцієнтом рангового зв'язку ( рангової кореляції) є коефіцієнт ρ-Спірмена.

Припустимо, що н об'єктів упорядковані за ознакою х та за ознакою у. Нехай

Міра розбіжностей рангів i-того об'єкта: d i = R x i - R y i

Властивості:

Змінюється в інтервалі від -1 до 1;

Ро = 1, якщо спостерігається повна узгодженість ранжованих рядів; ранги однієї й тієї ж об'єкта за двома ознаками збігаються.

Ро = -1, якщо повна неузгодженість ранжованих рядів; така ситуація виникає, якщо рангові ряди мають зворотний напрямок: R x i – 1 2 3 4 5; R y i - 5 4 3 2 1.

Зауваження: може розраховуватися двох видів рівних (якщо кожен об'єкт свій ранг і якщо є пов'язані ранги).

Перевірка гіпотези про статистичної значимостікоефіцієнта Спірмена.

H 0: ρ гс = 0

H 1: ρ гс ≠ 0

Нульова гіпотеза завжди стверджує, що ρ дорівнює 0. Альтернативна – що значення ρ від 0.

Рівень значимості як і таблицях спряженості.

Держава А Б У Г Д Е Ж З І
Якість життя 6,8 7,0 6,5 5,9 4,6 5,7 4,5 5,8 4,0
Безробіття 20,3 18,0 19,8 23,4 21,6 20,8
Ранг x
Ранг y
|d i |
d 2 i
Σ d 2 i

τ-Кендала- Різниця між ймовірностями правильного і неправильного порядку для двох спостережень, вилучених із сукупності випадково за умови, що пов'язані ранги відсутні. Властивості:

Змінюється від -1 до 1;

Якщо ознаки х та у статистично незалежні, то коефіцієнт τ звертається до 0; якщо τ дорівнює 0, ще означає, що ознаки статистично незалежні;

Якщо дорівнює 1, це означає, що між ознаками є повний прямий статистичний зв'язок або ранжовані ряди повністю узгоджені; якщо τ дорівнює -1, це означає, що є повний зворотний статистичний зв'язок, або ранжовані ряди є неузгодженими.

S – загальна кількість пар об'єктів з узгодженим правильним порядком з обох об'єктів. D – загальна кількість пар об'єктів з неузгодженим неправильним порядком з обох об'єктів.

Перевірка гіпотези щодо статистичної значущості коефіцієнта τ:

H 0: τ гс = 0

H 1: τ гс ≠ 0

Коефіцієнт є статистично значущим, якщо його значення для ГС відмінно від 0.

|Z H | > Z кр => H 1

Якщо ранжований ряд збудуємо для малої кількості об'єктів, то підтвердження нульової гіпотези нам говорить про те, що потрібно вивчити більша кількістьоб'єктів.

Якщо вивчено достатню кількість об'єктів, підтвердження нульової гіпотези свідчить, що зв'язок між ознаками відсутня.

Множинний коефіцієнтрангового зв'язку

Застосовується в тих випадках, коли необхідно виміряти зв'язок між більш ніж 2 ранжованими рядами (наприклад, коли ми хочемо оцінити узгодженість думок експертів (більше 2) в оцінці 1 і тих самих об'єктів).

S - сума квадратичних відхилень значень рангів по рядку від середнього рангу для всієї сукупності. k 2 - Число змінних (кількість експертів). n – число об'єктів, що ранжуються.

Першим етапом статистичного вивчення варіації є побудова варіаційного ряду - упорядкованого розподілу одиниць сукупності за зростаючим (частіше) чи з спадним (рідше) значенням ознаки і підрахунок числа одиниць із тим чи іншим значенням ознаки.

Існують три форми варіаційного ряду: ранжований, дискретний, інтервальний. Варіаційний ряд часто називають поряд розподілу. Цей термін вживається щодо варіації як кількісних, і некількісних ознак. Ряд розподілу є структурне угруповання (гл. 6).

Ранжированный ряд - це перелік окремих одиниць сукупності порядку зростання (зменшення) досліджуваного ознаки.

Нижче наведено відомості про великих банкахСанкт-Петербурга, ранжованих за розмірами власного капіталу 01.10.1999 р.

Назва банку Власний капітал, млн. руб. Балтонексім банк 169

Банк «Санкт-Петербург» 237

Петровський 268

Балтійський 290

Промбудбанк 1007

Якщо чисельність одиниць сукупності досить велика, ранжований ряд стає громіздким, яке побудова, навіть з допомогою комп'ютера, займає тривалий час. У разі варіаційний ряд будується з допомогою групування одиниць сукупності за значенням досліджуваного ознаки.


Визначення числа груп

Число груп у дискретному варіаційному ряду визначається числом реально існуючих значень ознаки, що варіює. Якщо ознака набуває дискретних значень, але їх кількість дуже велика (наприклад, поголів'я худоби на 1 січня року в різних сільськогосподарських підприємствах може становити від нуля до десятків тисяч голів), то будується інтервальний варіаційний ряд. Інтервальний варіаційний ряд будується і для вивчення ознак, які можуть приймати будь-які, як цілі, так і дробові значення

сфери свого існування. Такі, наприклад, рентабельність реалізованої продукції, собівартість одиниці продукції, дохід на одного жителя міста, частка осіб з вищою освітоюсеред населення різних територій та взагалі всі вторинні ознаки, значення яких розраховуються шляхом розподілу величини однієї первинної ознаки на величину іншої (див. гл. 3).

Інтервальний варіаційний ряд є таблицею, що складається з двох граф (або рядків) - інтервалів ознаки, варіація якого вивчається, та числа одиниць сукупності, що потрапляють у даний інтервал (частот), або часткою цього числа від загальної чисельності сукупності (частин).

Найчастіше використовуються два види інтервальних варіаційних рядів: рівноінтервальний та рівночастотний. Рівноінтервальний ряд застосовується, якщо варіація ознаки дуже сильна, тобто. для однорідної сукупності, розподіл якої за даною ознакою близький до нормальному закону. (Такий ряд представлений у табл. 5.6). Рівночастотний ряд застосовується, якщо варіація ознаки дуже сильна, проте розподіл не є нормальним, а, наприклад, гіперболічним (табл. 5.5).

При побудові одно інтервального рядучисло груп вибирається те щоб достатньою мірою відбилися різноманітність значень ознаки у сукупності й те водночас закономірність розподілу, його форма не спотворювалася випадковими коливаннями частот. Якщо груп буде замало, не виявиться закономірність варіації; якщо груп буде надмірно багато, випадкові стрибки частот спотворять форму розподілу.



Межі інтервалів можуть вказуватись по-різному: верхня межа попереднього інтервалу повторює нижню межу наступного, як показано в табл. 5.5 або не повторює.

У разі другий інтервал буде позначений як 15,1-20, третій - як 20,1-25 тощо., тобто. передбачається, що це значення врожайності обов'язково округлені до однієї десятої. Крім того, виникає небажане ускладнення з серединою інтервалу 15,1-20, яка, строго кажучи, вже дорівнюватиме не 17,5, а 17,55; відповідно при заміні заокругленого інтервалу 40-60 на 40,1-60 замість заокругленого значення його середини 50 отримаємо 50,5. Тому краще залишити інтервали з округленим кордоном, що повторюється, і домовитися, що одиниці сукупності, що мають значення ознаки, рівне межі інтервалу, включаються в той інтервал, де це точне значеннявперше вказується. Так, господарство, що має врожайність, що дорівнює 15 ц/га, включається до першої групи, значення 20 ц/га

По-друге і т.д.

Рівночастотний варіаційний ряд необхідний за дуже сильної варіації ознаки тому, що при рівноінтервальному розподілі більшість одиниць сукупності ока-


Таблиця 5.5

Розподіл 100 банків Росії з балансової оцінки активів на 01.01.2000 р.


Межі інтервалів при рівночастотному розподілі - це фактичні величини активів першого, десятого, одинадцятого, двадцятого тощо банків.

Графічне зображення варіаційного ряду

Істотну допомогу в аналізі варіаційного ряду та його властивостей надає графічне зображення. Інтервальний ряд зображується стовпчиковою діаграмою, в якій підстави стовпчиків, розташовані на осі абсцис, - це інтервали значень ознаки, що варіює, а висота стовпчиків - частоти, що відповідають масштабу по осі ординат. Графічне зображення розподілу господарств області з урожайності зернових культур наведено на рис.

5.1. Діаграма цього роду часто називається гістограмою (гр. histos – тканина).

Дані таблиці. 5.6 та рис. 5.1 показують характерну для багатьох ознак форму розподілу: частіше зустрічаються значення середніх інтервалів ознаки, рідше – крайні, малі та великі значення ознаки. Форма цього розподілу близька до аналізованого в курсі математичної статистикизакону нормального розподілу. Великий російський математик А. М. Ляпунов (1857-1918) довів, що нор-

Таблиця 5.6 Розподіл господарств області з урожайності зернових культур


мальний розподіл утворюється, якщо на змінну, що варіює, впливає велике числофакторів, жоден із яких не має переважаючого впливу. Випадкове поєднання безлічі приблизно рівних факторів, що впливають на варіації врожайності зернових культур, як природних, так і агротехнічних, економічних, створює близьке до нормального закону розподілу господарств області за врожайністю.


Рис. 5.2. Кумулята та огива розподілу господарств по

врожайності

Такий ряд називається кумулятивним. Можна побудувати кумулятивний розподіл «не менше, ніж», а можна

"більше ніж". У першому випадку графік кумулятивного розподілу називається кумулятою, у другому – огивою (рис. 5.2).

Щільність розподілу

Якщо доводиться мати справу з варіаційним рядомз нерівними інтервалами, то для сумісності потрібно частоти, чи частоти, призвести до одиниці інтервалу. Отримане відношення називається щільністю розподілу:


Щільність розподілу використовується як для розрахунку узагальнюючих показників, так і графічного зображенняваріаційних рядів із нерівними інтервалами.

Сторінка 2

Побудуємо інтервальний варіаційний ряд розподілу районів за

співвідношенню середнього розміру нарахованої протягом місяця пенсії пенсіонерам, які стоять обліку в органах соцзахисту та середньомісячної номінально нарахованої зарплатню працівникам економіки.

Кількість груп необхідне побудови угруповання, обчислимо за формулою Стержесса.

N=1+3,32*ln n (1.1)

де, N – число груп;

n - Кількість елементів у сукупності

N=1+3,32*ln 24= 1+3,32*1,38=5,5816=6

Розділимо всю сукупність районів на 6 груп і знайдемо величину інтервалу за формулою:

H = (Xmax - Xmin) / n (1.2)

де, Xmax=65,9-максимальне значення ознаки в ранжированном ряду, що вивчається (район №24);

Xmin=28,1 – мінімальне значення (район №1).

Розмір інтервалу складе:

H = (65,9-28,1) / 6 = 6,3

Побудуємо ряд розподілу районів, за цієї величини інтервалу, значення Xmin=28,1, тоді верхня межа першої групи складе:

28,1 +6,3 = 34,4 і т.п.

Розподілимо організації за встановленими групами та підрахуємо їх число у кожній групі (табл.1.2).

Таблиця 1.2

Інтервальний ряд розподілу районів.

№ групи

Групи районів за величиною співвідношення пор. розміру нарахованої за міс. пенсії до порівн. номінально нарахованої з/п, руб.

Число районів

Для наочності зобразимо інтервальний ряд як гістограми (рис.1.2).


Інші матеріали:

Циклічні концепції у суспільному розвиткові
Соціальні зміни - це перехід суспільства з іншого стану до іншого. Зміна, під час якої відбувається незворотне ускладнення суспільної структури, Називають соціальним розвитком. Розрізняють еволюційний і революційний шлях розвитку.

Соціальні функції та соціальний статус
Визначення соціальних функційособистості досить повно розкривається теоретично соціальних ролей. Кожна людина, яка живе в суспільстві, включена в безліч різних соціальних груп(сім'я, навчальна група, дружня компаніяі т.д.). Наприклад...

Методологія та методи соціологічного дослідження
Сутність соціологічного дослідження. Суспільне життяпостійно ставить перед людиною безліч питань, відповісти на які можна лише за допомогою наукового дослідження, зокрема соціологічного. Однак не всяке дослідження з...

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

гарну роботуна сайт">

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http:// www. allbest. ru/

Завдання №1

На підставі даних статистичного спостереження, наведених у таблиці побудувати ранжований, інтервальний та кумулятивний ряди розподілу сільськогосподарських підприємств за факторною ознакою, зобразити їх графічно.

Провести зведення даних. За допомогою методу угруповань визначте залежність результативної ознаки у сільськогосподарських підприємствах від факторної. Побудувати таблиці та графіки залежності. Висновок.

угруповання ряд розподіл факторний

Якість ґрунту, бали (х)

(у)

Рішення:

Побудоваранжованогорядурозподілу передбачає розташування всіх варіантів низки порядку зростання досліджуваного ознаки (якості грунту). Проведення сортування проводилося у програмі ТП Excel із використанням функції "Сортування".

Якість ґрунту

Врожайність овочів відкритого ґрунту

Графічне зображення ранжованого ряду розподілу

Лінія на рис.1 зветься огів Гальтона. Ця огива має тенденцію плавного зростання з невеликими стрибками в деяких точках. Для перетворення ранжованого ряду на інтервальний краще виконати розбивку на групи вручну.

Побудоваінтервальногорядурозподілу підприємств за ознакою, що вивчається, передбачає визначення числа груп (інтервалів).

Для розрахунку числа груп скористаємося формулою:

n=2 , де N-загальне числоодиниць досліджуваної сукупності.

n = 2 Ig30 = 2,95424251?3.

Розмір рівного інтервалу обчислюється за такою формулою:

i = = = 16,33333

Кумулятивнийряд- це ряд, у якому підраховуються накопичені частоти. Він показує скільки одиниць сукупності мають значення ознаки не більше, ніж дане значення, і обчислюється шляхом послідовного додавання до частоти першого інтервалу частот наступних інтервалів.

Інтервальний та кумулятивний ряди

частота- Число підприємств у групі;

Питома вага підприємств в групі- знаходиться за формулою:

(числопідприємстввгрупі * 100%)/m, де m-число експериментальних даних;

Накопичена частота- знаходиться за формулою: числопідприємстввпопередньоюгрупі+частотаданоїгрупи.

Гістограма частот

Кумулята розподілу якості ґрунту

Зведені показники

№ групи

Число підприємств у групі

Врожайність овочів відкритого ґрунту (всього за групами)

Якість ґрунту (всього за групами)

II 61,33333-77,33333

III 77,33333-94,1

Середні характеристики груп

№ Групи

Врожайність овочів відкритого ґрунту

Якість ґрунту

II 61,33333-77,33333

III 77,33333-94,1

У середньому за сукупністю

де, стовпець "врожайність овочів" знаходиться за формулою: УУiгрупі) / числопідприємстввгрупі;

стовпець "Якість грунту" знаходиться за формулою: УХiгрупі)/числопідприємстввгрупі.

Залежність урожайності овочів відкритого ґрунту від якості ґрунту.

У прикладі можна зробити висновок: зі зростанням якості ґрунту збільшується врожайність овочів відкритого ґрунту, отже можна припустити наявність прямого зв'язку між аналізованими параметрами.

Розміщено на Allbest.ru

Подібні документи

    Аналітичне угруповання за факторною ознакою. Побудова варіаційного частотного та кумулятивних рядіврозподілу на основі дорівнює інтервальному структурному угрупованню результативної ознаки - дивідендів, нарахованих за результатами діяльності.

    контрольна робота , доданий 07.05.2009

    Основні показники чисельності населення та його розміщення по Калузька область. Побудова ранжованого та інтервального рядів розподілу за однією групувальною факторною ознакою. Аналіз типових груп за показниками в середньому за сукупністю.

    курсова робота , доданий 11.10.2010

    Побудова за допомогою формули Стержесу. Побудова рядів розподілу із довільними інтервалами. Побудова рядів розподілу за допомогою середнього квадратичного відхилення. Класифікація рядів розподілу. Розрахунок основних показників варіації.

    курсова робота , доданий 22.11.2013

    Аналіз, розрахунок та побудова вихідних динамічних рядів ознаки-функції та ознаки-фактора. Розрахунок показників варіації динамічних рядів. Кількісний вимір тісноти зв'язку ознаки-функції та ознак-факторів методом парної кореляції.

    курсова робота , доданий 24.09.2014

    Оцінка сукупності щодо її однорідності. Побудова ранжованого та інтервального рядів розподілу. Аналіз рядів динаміки методами укрупнення інтервалів та ковзної середньої, аналітичне вирівнювання за рівнянням прямої та параболи.

    курсова робота , доданий 10.09.2014

    Розрахунок середнього балу успішності за даними результатів сесії, визначення показника варіацій рівня знань та структури чисельності студентів за успішністю. Побудова інтервального ряду розподілу підприємств. Оцінка коефіцієнтів кореляції.

    контрольна робота , доданий 21.08.2009

    Поняття та види статистичного угруповання, що виробляється з метою встановлення статистичних зв'язків та закономірностей, виявлення структури досліджуваної сукупності. Побудова інтервального ряду розподілу підприємств за ознакою "торговельна площа".

    дипломна робота , доданий 14.02.2016

    Основні категорії статистики. Угруповання – основа наукової обробки даних статистики. Зміст зведення та статистична сукупність. Побудова варіаційного, ранжованого та дискретного рядів розподілу. Угруповання підприємств за кількістю робітників.

    контрольна робота , доданий 17.03.2015

    Проведення розрахунку абсолютних, відносних, середніх величин, коефіцієнтів регресії та еластичності, показників варіації, дисперсії, побудова та аналіз рядів розподілу. Характеристика аналітичного вирівнюванняланцюгових та базисних рядів динаміки.

    курсова робота , доданий 20.05.2010

    Проведення експериментального статистичного дослідження соціально-економічних явищ та процесів Смоленської областіна основі заданих показників. Побудова статистичних графіків, рядів розподілу, варіаційних рядів, їх узагальнення та оцінка.

Поняття зведення, угруповання, класифікації

Зведення- Систематизація та підбиття підсумків: метеозведення, зведення з полів. Зведення не дозволяє детально проаналізувати інформацію. Будь-яке зведення має спиратися на угруповання даних, тобто. спочатку угруповання, та був зведення даних.

Угруповання- Поділ сукупностей на ряд груп за найбільш суттєвими ознаками.

Розрізняють якісне та кількісне угруповання. Якісна- атрибутивна, кількісна- Варіаційна. У свою чергу варіаційна ділиться на структурну та аналітичну. . Структурнаугруповання передбачає розрахунок частки кожної групи. Приклад: для підприємства 80% - робітники, 20% - службовці, їх 5% - керівники, 3% - службовці,12% - фахівці. Ціль аналітичноїугруповання – виявити взаємозв'язок між ознаками: стажем роботи та середнім заробітком, стажем та виробленням та іншими.

Під час проведення угруповання необхідно:

Проведення всебічного аналізу природи явища, що вивчається;

Виявлення групувального ознаки (одного чи кількох);

Встановити межі груп таким чином, щоб групи суттєво відрізнялися один від одного, і в кожній групі об'єднувалися однорідні елементи.

За ступенем складності угруповання можуть бути прості та комбінаційні (за ознаками).

За вихідною інформацією розрізняють первинну та вторинне угруповання, первинназдійснюється на основі вихідних даних спостереження, вториннавикористовує дані первинного угруповання.

Кількість груп визначається за формулою Стерджеса:

де n- кількість груп, N- Генеральна сукупність.

Якщо використовуються рівні інтервали, то величина інтервалудорівнює .

Інтервалиможуть бути рівні та нерівні. Останні, у свою чергу, поділяються на арифметичні, що змінюються за законом або геометричній прогресії. Перші та останні інтервали можуть бути відкриті або закриті. Закриті інтервали включають або не включають межі інтервалу.

Якщо інтервали закриті, і нічого не сказано про включення верхніх меж, то вважаємо, що верхні межі включені.

Якщо інтервали відкриті, то орієнтуємося на останній інтервал.

Ознака цих інтервалах може вимірюватися дискретно і безперервно (тобто. дробитися). При безперервній ознакі кордону стуляються 1 - 10, 10 - 20, 20 - 30; якщо ознака змінюється дискретно, можна використовувати наступний запис: 1 – 10, 11 – 20, 21 – 30.

Якщо інтервали відкриті, то величина останнього інтервалу дорівнює попередньому, а першого - другого.

Класифікація- Угруповання за якісною ознакою. Вона щодо стійка, стандартизована та затверджується органами державної статистики.


3.2. Ряди розподілу: види та основні характеристики

Під поряд розподілурозуміється ряд даних, що характеризують якесь соціально-економічне явище за однією ознакою. Це найпростіший виглядугруповання за двома ознаками.

Ряди розподілу поділяються на якісні та кількісні, на ранжировані та не ранжовані, на згруповані та не згруповані, з дискретним та безперервним розподіломознаки.

Прикладом не згрупованого, не ранжованого ряду із заробітної плати є відомість заробітної плати. У той же час, список працівників може бути ранжований за алфавітом або за табельними номерами. Приклад ранжованого ряду є список команд, рейтинг тенісистів.

Ранжований рядрозподілу - ряд даних, розташованих у порядку зменшення або зростання ознаки.

Для згрупованих ранжованих рядів виділяють такі характеристики: варіант, частоту або частоту, кумуляту і щільність розподілу.

Варіанту ()- Середнє інтервальне значення ознаки. Т.к. при створенні угруповання має виконуватися принцип рівномірного розподілуознаки в кожному інтервалі, то варіант можна розраховувати як півсуму меж інтервалів.

Частота() Показує скільки разів зустрічається дане значення ознаки. Відносне вираз частоти є Частота(.) , тобто. частку, питома вага від суми частот.

Кумулята() - Накопичена частота або частота, розрахунок наростаючим підсумком. Кумулятивно підраховуються обсяг, витрати, прибутки, тобто. результати діяльності.

Таблиця 1

Угруповання кредитних організацій, що діють
за величиною зареєстрованого статутного капіталу

2008 року в РФ

Поділіться з друзями або збережіть для себе:

Завантаження...