Основи кримінологічного виміру. Тест: Безкоштовний тест зі статистики

Предмет статистичної науки та завдання статистики на сучасному етапі

Статистика походить від лат «ststus»-стан або становище. Статистика- це сукупність цифр; це вид діяльності зі збору та аналізу даних; це наука, що сформувалася в 18в і спочатку називав «політична арифметика». Предмет статист- кількісна сторона масових соц-экон явл в нерозривної зв'язку зі своїми якісної стороною у конкретний умов місця і часу. Об'єкт– суспільство які у ньому процеси, тобто. сукупність соц-економічних явищ . Основний метод статистики- Закон великих чисел. Найважливіші завдання стат-ки- Організація стат спостережень; обробка даних та отримання системи узагальнення показників для аналізу; наданий державним управлінням інформації для своєчасного прийняття управління рішень; публікація інформації для інформування-я по соц-екон процесів. Стат. дослідження проходять слід етапи: 1. статистичок спостереження (форми і види збору інформ); 2. стасистическое зведення та угруповання (систематизація); вибіркового спостереження, Показники рядів динаміки, індекси).

Статистична сукупність, її види. Одиниці сукупності та класифікація їх ознак.

Статистична сукупність- Сукупність однорідних за якою-небудь ознакою предметів, обмежених простором і часом. Сукупність називається однорідний,якщо один або кілька істотних ознак, що вивчаються, її об'єктів є спільними для всіх одиниць. Сукупність, до якої входять явища різного типу, вважається різнорідний. Приклад СС- безліч студентів деякого вишу, які навчаються на 2-му курсі денного відділення. Це безліч є якісно однорідним, оскільки об'єднує молодих людей, які навчаються в тому самому вузі на 2-му курсі денного відділення. У той самий час елементи даної множини - студенти відрізняються друг від друга успішністю, здібностями, станом здоров'я тощо. Одиниця сукупності (елемент)- окремий випадок прояву досліджуваної закономірності; це первинний елемент статистичної сукупності, що є носієм ознак, що підлягають реєстрації та основою ведеться під час обстеження рахунку . Ознака- це властивість, характеристика одиниці статистичної сукупності. Наприклад, одиниця статистичної сукупності - «студент» має такі ознаки: прізвище, ім'я, по батькові, вік, оцінки з предметів, відвідуваність занять і т.д. Чим однорідніша сукупність, тим більше загальних ознакмають її одиниці та менше варіюють їх значення.


1. Середні величини: сутність, значення, види

Важливий внесок в обґрунтування та розвиток теорії середніх величин зробив великий учений XIX століття Адольф Кетле (1796-1874), член Бельгійської академії наук, член-кореспондент Петербурзької академії наук.

Середня величина- Узагальнююча характеристика досліджуваної ознаки в досліджуваній сукупності. Вона визначає його типовий рівень у розрахунку на одиницю сукупності у конкретних умовах місця та часу.

Середня величиназавжди іменована, має таку ж розмірність (одиницю виміру), як і ознака в окремих одиниць сукупності.

Основним умовою наукового використання середньої величини є якісна однорідність сукупності, якою обчислена середня.

    статечні (середня арифметична, середня гармонійна, середня геометрична, Середня квадратична, середня кубічна);

    структурні (мода, медіана).

Ступінна середня – корінь ступеня kіз середньої всіх варіантів, взятих у k-й ступеня, має наступний вигляд:

де - ознака, за якою знаходиться середня, називається ознакою, що осредняється,

х i або ( х 1 , х 2 …х n) – величина осредняемого ознаки в кожної одиниці сукупності,

f i- Повторюваність індивідуального значення ознаки.

Залежно від ступеня kвиходять різні видистепеневих середніх, формули розрахунку яких показані нижче в таблиці 1.

Таблиця 1 - Види статечних середніх

Значення k

Найменування середньої

Формули середньої

зважена

Середня гармонійна

, w i = x i · f i

Середня геометрична

Середня арифметична

=

=

Середня квадратична

=

=

f i частота повторення індивідуального значення ознаки (його вага)

Вагам може бути частотність, тобто. відношення частоти повторення індивідуального значення ознаки до суми частот:

Вибір виду середньої величини:

Середня арифметична простазастосовується у разі, якщо індивідуальне значення ознаки в одиниць сукупності не повторюється чи зустрічається один раз чи однакове число разів, тобто. коли середня розраховується за несгрупованими даними.

Коли окреме значення досліджуваної ознаки зустрічається кілька разів у одиниць сукупності, що вивчається, тоді частота повторення індивідуальних значень ознаки (вага) присутня в розрахункових формулах статечних середніх. У цьому випадку вони називаються формулами зважених середніх.

Якщо за умовою завдання необхідно, щоб незмінною залишалася за умови опосередкування суми величин, обернених, індивідуальним значенням ознаки, то середня величина є гармонійної середньої.

Якщо за заміні індивідуальних величин ознаки на середню величину необхідно зберегти незмінним добуток індивідуальних величин, слід застосувати середню геометричну. Середня геометрична використовується для розрахунку середніх темпів зростання в аналізі рядів динаміки.

Якщо при заміні індивідуальних величин ознаки на середню величину необхідно зберегти незмінною суму квадратів вихідних величин, то середня буде квадратичною середньою величиною. Середня квадратична використовується для розрахунку середнього відхилення при аналізі варіації ознаки в рядах розподілу.

Ступінні середні різних видів, обчислені за однією і тією ж сукупністю, мають різні кількісні і чим більший показник ступеня k, тим більше і величина відповідної середньої, якщо всі вихідні значення ознаки рівні, то і всі середні рівні цієї постійної:

Гарм. ≤ геом. ≤ арифм. ≤ кв. ≤ куб.

Це властивість статечних середніхзростати з підвищенням показника ступеня визначальної функції називається мажорантністю середніх.

Структурні середні застосовують у тому випадку, коли розрахунок статечних середніх неможливий або недоцільний.

До структурних середніх відносять: модуі медіану.

Мода - Це найбільш часто зустрічається значення ознаки одиниць даної сукупності. За наявності варіантів і частот у ряді розподілу величина моди відповідає значенню ознаки у наї більшого числаодиниць (найбільшій частоті), тобто. для дискретного варіаційного ряду мода перебуває за визначенням.

Медіана – значення ознаки в одиниці сукупності в середині ранжованого ряду розподілу, коли всі індивідуальні значення ознаки одиниць, що вивчаються, розташовані в порядку їх зростання або спадання.

Що стосується непарного числа спостережень медіана перебуває за визначенням, тобто. різновид (де n- Число спостережень). При парному числі спостережень медіана визначається за такою формулою:

Для інтервального ряду розподілу величина моди та медіани розраховуються за такими формулами:
;
,

де: - нижня межа модального чи медіанного інтервалу;

Розмір інтервалу;

і
- частоти, що передують і наступні за модальним інтервалом;

- частота модального чи медіанного інтервалу;

- Сума накопичених частот в інтервалах, що передують медіанному.

Розрахунок медіани за несгрупованими даними проводиться так:

1. Індивідуальні значення ознаки розташовуються у порядку, що зростає. 2. Визначається порядковий номер медіани № Ме = (n+1) / 2

    Показники варіації, суть, значення, види. Закони варіації

Для вимірювання варіації ознаки застосовуються різні абсолютні та відносні показники.

До абсолютних показників (заходу) варіації відносяться: розмах коливань, середнє абсолютне відхилення, дисперсія, середнє квадратичне відхилення.

Розмах варіації – це різниця між максимальним та мінімальним значеннями ознаки:
.

Розмах варіації показує, у яких коливається розмір ознаки, що утворює ряд розподілу

Середнє абсолютне відхилення (САТ) - середня з абсолютних значень відхилень окремих варіантів від середньої.

(Проста),
(зважена)

Дисперсія- середня з квадратів відхилень варіантів значень ознаки від середньої величини:

(Проста),
(зважена)

Дисперсія може бути розкладена на складові елементи, що дозволяють оцінити вплив різних факторів, що зумовлюють варіацію ознаки

тобто. дисперсія дорівнює різниці між середнім квадратом значень ознаки та квадратом середньої.

Властивості дисперсії,що дозволяють спростити спосіб її обчислення:

    Дисперсія постійної величини дорівнює 0.

    Якщо всі варіанти значень ознаки зменшити на те саме число разів, то дисперсія не зменшиться.

    Якщо всі варіанти значень ознаки зменшити в те саме число разів ( kраз), то дисперсія зменшиться в k 2 разів.

Середнє квадратичне відхилення (СКО) являє собою квадратний корінь з дисперсії, показує наскільки в середньому коливається величина ознаки у одиниць досліджуваної сукупності: =

СКО є мірилом надійності. Чим менше СКО, тим краще середня арифметична відбиває всю уявну сукупність.

Розмах варіації, САО, СКО є іменованими величинами, тобто. мають самі одиниці виміру, як і індивідуальні значення ознаки.

Існують 4 види дисперсії: загальна, міжгрупова, внутрішньогрупова, групова.

Дисперсію, що обчислюється для всієї сукупності загалом називають загальною дисперсією.Вона вимірює коливання залежного ознаки (результатного), викликану дією нею всіх без винятку чинників.

Загальна дисперсія дорівнює сумі середньої із внутрішньогрупової та міжгрупової дисперсії:

Якщо сукупність розбита на групи, то кожної групи може бути визначена своя дисперсія, що характеризує варіацію всередині групи. Групова дисперсія– середні квадратичні відхилення від групової середньої, тобто. від середньої величини ознаки у цій групі.

деj- порядковий номер xі f у межах групи.

Групова дисперсія характеризує варіацію ознаки в межах групи за рахунок усіх інших факторів, крім покладеного на підставі угруповання.

Вимірювання варіації за сукупністю в цілому, обчислюємо як середню із внутрішньогрупових дисперсій:

де – групові дисперсії,

n j- Число одиниць у групах.

Групові середні відрізняються одна від одної та від загальної середньої, тобто. варіюють. Їхню варіацію називають міжгруповою варіацією. Для її характеристики обчислюють середній квадрат відхилень групових середніх від загальної середньої:

де j групові середні, - загальна середня, n j- Число одиниць у групі.

Міжгрупова дисперсія(дисперсія групових середніх) вимірює варіацію результатної ознаки за рахунок факторної ознаки, покладеної на підставі угруповання.

При порівнянні коливання різних ознак в одній і тій же сукупності або при порівнянні коливання однієї і тієї ж ознаки в декількох сукупностях з різною величиною середньої арифметичної користуються відносними показниками варіації.

Ці показники обчислюються як відношення абсолютних показників варіації до середньої арифметичної (або медіани)

Коефіцієнт варіації

Відносне лінійне відхилення

Коефіцієнт осциляції

Найчастіше застосовуваний показник відносної коливання – коефіцієнт варіаціїщо показує середнє відхилення від середнього значення ознаки у відсотках.

Його використовують для: порівняльної оцінки варіації; Показники однорідності сукупності. Сукупність вважається однорідною, якщо коефіцієнт варіації вбирається у 33%, тобто. менше 33%.

З акони варіації.

Закон варіації індивідуальних значень ознаки чи «правило трьох сигм».Бельгійський статистик А.Кетле виявив, що варіації деяких масових явищ підпорядковуються закону розподілу помилок, відкритому К.Гауссом та П.Лапласом майже одночасно. Крива, що відображає цей розподіл, має вигляд дзвону (рис.2).

за нормальному закону (термін запропонований англійським статистиком К.Пірсоном) розподілу коливання індивідуальних значень ознаки знаходиться в межах
(Правило трьох сигм).

Нормальному закону розподілу підпорядковуються природні властивості людини (зростання, вага, фізична сила), характеристики промислових виробів (розмір, вага, електричний опір, пружність тощо). У сфері швидкозмінних суспільних явищ дія цього закону проявляється порівняно рідко. Однак, у ряді випадків, використання правила трьох сигмпрактично можливо.

Закон варіації середніх величин. Варіація середніх величин менша від варіації індивідуальних значень ознаки. Середні значення ознаки змінюються у межах:
, де n- Число одиниць.

Інформатика та математика - Теоретичні матеріали для першого колоквіуму

1. Предмет математичної статистики, її основні розділи Поняття про статистичному розподілі. Нормальний розподіл. У яких умовах випадкову величину розподілено нормально?

Статистика - наука, що вивчає сукупність. мас. явл-я з виявлення закономерн. та вивч-я їх за допомогою узагальнених показників.

Усі методи математичної статистики можна віднести до двох основних її розділів: теорії статистичного оцінювання параметріві теорії перевірки статистичних гіпотез.

Розділи:

1. дескриптивна статистика

2. вибірковий метод, довірчі інтервали

3. кореляційний аналіз

4. регресійний аналіз

5. аналіз якісних ознак

6. багатовимірний статистичний аналіз:

а) кластерний

б) факторний

7. аналіз часових рядів

8. диференціальні рівняння

9. математичне моделювання історичних процесів

Розподіл:

Теоретичне (нескінченно багато об'єктів і вони поводяться ідеально)

Емпіричне (реальні дані, які можна побудувати в гістограму)

Нормальний розподіл - коли характер розподілу впливають багато факторів, і жоден з них не є визначальним. Особливо часто використовується практично.


2. Нормальний розподіл можна зобразити графічно у вигляді симетричної одновершинної кривої, що нагадує формою дзвін. Висота (ордината) кожної точки цієї кривої показує, як часто трапляється відповідне значення. Дескриптивна статистика. Середні значення – середнє арифметичне, медіана, мода. У яких ситуаціях ці три заходи дають близькі значення, а яких вони сильно різняться?

Дескриптивна статистика – Це описова статистика.

середня арифметична, медіана, мода – заходи середнього – коеф-ти, які можуть охарактеризувати сукупність об'єктів

· середнє (арифметичне) значення - сума всіх значень, віднесена до загальному числуспостережень (прийняті позначення: Mean або), тобто. середнім арифметичним значенням ознаки називається величина

де - значення ознаки у i-го об'єкту, n- Число об'єктів в сукупності.

· мода – найбільш часто зустрічається значення змінної (M)

· медіана - середнє по порядку значення (прийняті позначення: Median, m). Медіана - це "серединне" значення ознаки в тому сенсі, що у половини об'єктів сукупності значення цієї ознаки менше, а в іншої половини - більше за медіану. Наближено обчислити медіану можна, упорядкувавши всі значення ознаки зростання (зменшення) і знайшовши число у цьому варіаційному ряду, яке або має номер ( n+1)/2 - у разі непарного nабо знаходиться посередині між числами з номерами n/2 і ( n+1)/2 - у разі парного n.

Не всі з перерахованих характеристикможна обчислювати для якісних ознак. Якщо ознака якісна і номінальна, то для неї можна знайти тільки моду (її значенням буде назва найчастішої категорії номінальної ознаки). Якщо ознака рангова, то крім моди для неї можна знайти ще й медіану. Середнє арифметичне значення можна обчислювати лише кількісних ознак.

Що стосується кількісних даних всі показники середнього рівня вимірюються у тих самих одиницях, як і вихідний ознака.

Значення коэф-тов збігаються, якщо графік розподілу симетричний.


3. Показники неоднорідності - Дисперсія, середнє квадратичне (стандартне) відхилення, коефіцієнт варіації. У яких одиницях вони вимірюються? Навіщо вводиться поняття коефіцієнта варіації?

· середнє квадратичне або стандартне відхилення - міра розкиду значень ознаки близько середнього арифметичного значення (прийняті позначення: Std.Dev. standard deviation), s або s). Розмір цього відхилення обчислюється за такою формулою

.

· дисперсія ознаки ( s 2 або s 2 )

· коефіцієнт варіації - відношення стандартного відхилення до середнього арифметичного, виражене у відсотках (позначається у статистиці буквою V). Коефіцієнт обчислюється за такою формулою: .

всіці заходи можна обчислювати лише кількісних ознак. Всі вони показують, наскільки сильно варіюють значення ознаки (а точніше – їх відхилення від середнього) у цій сукупності. Чим менше значенняміри розкиду, тим ближчі значення ознаки в усіх об'єктів до свого середнього значення, отже, і друг до друга. Якщо величина міри розкиду дорівнює нулю, значення ознаки в усіх об'єктів однакові.

Найчастіше використовується середнє квадратичне (або стандартне) відхилення s. Воно вимірюється, як і середнє арифметичне, у тих самих одиницях, як і вихідний ознака. При зміні всіх значень ознаки в кілька разів, так само зміниться і стандартне відхилення, проте якщо всі значення ознаки збільшити (зменшити) на деяку величину, його стандартне відхилення не зміниться. Поряд із стандартним відхиленням часто користуються дисперсією (=його квадрату), проте на практиці вона є менш зручною мірою, т.к. одиниці виміру дисперсії не відповідають одиницям виміру.

Сенс коефіцієнта варіації у тому, що він, на відміну s, вимірює не абсолютну, а відносну міру розкиду значень ознаки у статистичної сукупності.

Чим більше V тим сукупність менш однорідна.

Однорідна Перехідна Неоднорідна

V = 0 - 30% V = 30 - 50% V = 50 - 100%

Можливо »100% (надто неоднорідна сукупність).


4. Поняття провибірковий метод. Репрезентативна вибірка, її методи формування Два види помилок вибірки. Довірча ймовірність.

Вибірка:

Репрезентативна

Випадкова

Механічна вибірка – подібна до випадкової вибірки (кожний 10й, 20й тощо).

Природна (те, що залишилося від ГС з часом) вибірки.

Репрезентативна вибірка – точно відбиває властивості генеральної сукупності.

Щоб вибірка правильно відображала основні властивості, властиві генеральній сукупності, вона має бути випадковою, тобто. всі об'єкти генеральної сукупності повинні мати рівні шанси потрапити у вибірку

Вибірки формуються з допомогою спец. методик. Найбільш простим є випадковий відбір, наприклад, за допомогою звичайного жеребкування (для невеликих сукупностей) або з використанням таблиць випадкових чисел. Для більших, але досить однорідних сукупностей використовується механічний відбір (що застосовувався ще земської статистики). Для неоднорідних сукупностей з певною структурою найчастіше застосовується типовий добір. Існують й інші методи, у тому числі – комбінації різних способіввідбору кількох етапах побудови вибіркової сукупності.

У вибіркових результатах завжди є помилки. Ці помилки можна поділити на два класи: випадкові та систематичні. До перших відносяться випадкові відхилення вибіркових характеристик від генеральних, зумовлені самою природою вибіркового методу. Розмір випадкової помилки піддається обчисленню (оцінці). Систематичні помилки, навпаки, не мають випадкового характеру; вони пов'язані з відхиленням структури вибірки від реальної структури генеральної сукупності. Систематичні помилки з'являються тоді, коли порушується основне правило випадкового відбору - забезпечення для всіх об'єктів рівних шансів поапсть у вибірку. Помилки цього статистика не вміє оцінювати.

Основними джерелами систематичних помилок є: а) неадекватність сформованої вибірки завданням дослідження; б) незнання характеру розподілу у генеральній сукупності і, як наслідок, порушення у вибірці структури генеральної сукупності; в) свідомий відбір найбільш зручних та виграшних елементів генеральної сукупності.

Довірча ймовірність –


5. Довірча ймовірність. Середня (стандартна) та гранична помилка вибірки. Довірчий інтервалдля оцінки середнього значення в генеральної сукупності. Перевірка гіпотези про статистичної значущості відмінності двох вибіркових середніх.

Довірчий інтервал - Той значень обчислюваного коэф-та, в к-й, ми вважаємо,має потрапити це значення для ген. Сукуп-ти.

Довірча ймовірність – ймовірність того, що значення коеф-ту, що розраховується, для ген. Сукупності потрапить у довірчий інтервал. Чиї більше ДВ, тим більше ДІ.

Неминучий розкид вибіркових середніх навколо генеральної середньої (тобто стандартне відхилення вибіркових середніх) називається стандартною помилкою вибірки mяка виражається формулою (s- Середнє квадратичне відхилення, n- Обсяг вибірки). стандартна помилка вибірки тим менше, чим менше величинаs(яка характеризує розкид значень ознаки) і що більший обсяг вибірки n.

Якщо вибірковий метод використовується для роботи з некількісними даними, роль середнього арифметичного значення в сукупності грає частка або частота qознаки. Частка обчислюється як ставлення числа об'єктів, які мають даною ознакою (), до об'єктів у всій сукупності: . Роль міри розкиду грає величина.

У цьому випадку стандартна помилка вибіркиmобчислюється за такою формулою:

Точність та надійність оцінки параметрів генеральної сукупності за вибіркою перебувають у зворотної залежності: чим більша точність (тобто чим менше гранична помилкаі що вже довірчий інтервал), то менше надійність такий оцінки (ступінь впевненості). І навпаки - що нижча точність оцінки, то вища її надійність. Часто довірчий інтервал будують для надійності 95%, відповідно гранична помилка вибірки зазвичай дорівнює подвійній середній помилціm..

Довірчий інтервал для оцінки середнього значення у генеральній сукупності:

X(м.с.) =x(Виб.) +-Δ =x(виб.) +- = X(виб.) + - σ(м.с.)/√n

Критерій для різниці середніх значень

Часто виникає завдання порівняння двох вибіркових середніх з метою перевірки гіпотези про те, що ці вибірки отримані з однієї і тієї ж генеральної сукупності, а реальні розбіжності у значеннях середніх вибіркових пояснюються випадковостями вибірок.

Випробувану гіпотезу можна сформулювати в такий спосіб: різницю між вибірковими середніми випадково, тобто. генеральні середні у обох випадках рівні. Як статистична характеристика знову використовується величина t, що є різницею вибіркових середніх, поділену на усереднену стандартну помилку середнього по обох вибірках.

Фактичне значення статистичної характеристики порівнюється з критичним значенням, що відповідає обраному рівню значущості. Якщо фактичне значення більше, ніж критичне, випробувана гіпотеза відхиляється, тобто. Відмінність між середніми вважається значним (істотним).


7. Кореляційний зв'язок. Лінійний коефіцієнт кореляції, його формула, межі його значень. Коефіцієнт детермінації, його змістовний зміст. Поняття про статистичної значущості коефіцієнта кореляції.

Коефіцієнт кореляції показує, наскільки тісно дві змінні пов'язані між собою .

Коефіцієнт кореляції r набуває значення в діапазоні від -1 до +1. Якщо r= 1, між двома змінними існує функціональна позитивна лінійна зв'язок, тобто. на діаграмі розсіювання відповідні точки лежать на одній прямій із позитивним нахилом. Якщо r = -1, то між двома змінними існує функціональна негативна залежність. Якщо r = 0, то аналізовані змінні лінійно незалежні, тобто. на діаграмі розсіювання хмара точок "витягнута по горизонталі".

Рівняння регресії і коефіцієнт кореляції доцільно обчислювати лише тому випадку, коли залежність між змінними може хоча б приблизно вважатися лінійною. В іншому випадку результати можуть бути абсолютно невірними, зокрема коефіцієнт кореляції може бути близьким до нуля за наявності сильного взаємозв'язку. Особливо це притаманно випадків, коли залежність має явно нелінійний характер (наприклад, залежність між змінними приблизно описується синусоїдою чи параболою). У багатьох випадках цю проблему можна обійти, перетворивши вихідні змінні. Проте, щоб здогадатися необхідність такого перетворення, тобто. щоб дізнатися, що можуть містити складні форми залежності, їх бажано “побачити”. Саме тому дослідження взаємозв'язків між кількісними змінними зазвичай має містити перегляд діаграм розсіювання.

Коефіцієнти кореляції можна обчислювати без попереднього побудови лінії регресії. І тут питання інтерпретації ознак як результативних і факторних, тобто. залежних та незалежних, не ставиться, а кореляції розуміється як узгодженість чи синхронність одночасної зміни значень ознак при переході від об'єкта до об'єкта.

Якщо об'єкти характеризуються цілим набором кількісних ознак, можна одразу побудувати т.зв. матрицю кореляції, тобто. квадратну таблицю, число рядків і шпальт якої дорівнює числу ознак, але в перетині кожних рядки і шпальти стоїть коефіцієнт кореляції відповідної пари ознак.

Коефіцієнт кореляції немає змістовної інтерпретації. Однак його квадрат, званий коефіцієнтом детермінації(R 2), має.

коефіцієнтом детермінації (R 2) – це показник того, наскільки зміни залежної ознакипояснюються змінами незалежного. Точніше, це частка дисперсії незалежної ознаки, яка пояснюється впливом залежного .

Якщо дві змінні функціонально лінійно залежні (точки на діаграмі розсіювання лежать на одній прямій), то можна сказати, що зміна змінної yповністю пояснюється зміною змінної x,а це якраз той випадок, коли коефіцієнт детермінації дорівнює одиниці (при цьому коефіцієнт кореляції може дорівнювати як 1, так і -1). Якщо дві змінні лінійно незалежні (метод найменших квадратівдає горизонтальну пряму), то змінна yсвоїми варіаціями жодним чином "не зобов'язана" змінною x- У цьому випадку коефіцієнт детермінації дорівнює нулю. У проміжних випадках коефіцієнт детермінації вказує, яка частина змін змінної yпояснюється зміною змінної x(Іноді зручно представляти цю величину у відсотках).


8. Парна тамножина лінійна регресія. Коефіцієнт множинної кореляції. Змістовний зміст коефіцієнта регресії, його значущість, поняття про t-Статистиці. Змістовний зміст коефіцієнта детермінації R2.

Регресійний аналіз - Статистичний метод, що дозволяє будувати моделі, що пояснюють, на основі взаємодії ознак.

Найпростішим випадком взаємозв'язку є парний взаємозв'язок, тобто. зв'язок між двома ознаками. У цьому передбачається, взаємозв'язок двох змінних носить, зазвичай, причинний характер тобто. одна з них залежить від іншої. Перша (залежна) називається в регресійний аналіз результуючою,друга (незалежна) - факторної. Слід зазначити, що не можна однозначно визначити, яка з двох змінних є незалежною, а яка - залежною. Часто зв'язок може розглядатися як двоспрямований.

Рівняння парної регресії : y = kx + b.

Найчастіше на залежну змінну діють відразу кілька факторів, серед яких важко виділити єдиний чи головний. Так, наприклад, дохід підприємства залежить одночасновід двох факторів виробництва – числа робітників та енергоозброєності. Причому обидва ці фактори самі не є незалежними один від одного.

Рівняння множинної регресії : y = k 1 · x 1 + k 2 · x 2 + … + b,

де x 1 , x 2, . . . - незалежні змінні, від яких тією чи іншою мірою залежить досліджувана (результуюча) змінна y;

k 1 , k 2. . . - Коефіцієнти при відповідних змінних ( коефіцієнти регресії), що показують, наскільки зміниться значення результуючої змінної при зміні окремої незалежної змінної на одиницю.

Рівняння множинної регресії задає регресійну модель, Що пояснює поведінку залежної змінної Ніяка регресійна модель не може вказати, яка змінна є залежною (наслідком), а які – незалежними (причинами).

R - Множинний коеф. кореляції, що вимірює сукупність впливу незалежних ознак, тісноту зв'язку результуючого ознаки з усією сукупністю незалежних ознак, виражених у %.

Показує яка частка врахованих ознак у відділенні результату, тобто. скільки % варіація ознаки у пояснюється варіаціями врахованих ознак Х1, Х2, Х3.

T-статистикапоказує рівень стат. значимості кожн. ккоеф-та регресії, тобто. його стійкість по відношенню до вибірки.

T = b/ Δb

Статистично значимими явл-ся t >2. Чим більше коеф-т, тим краще.

через R ² ми робимо висновок про те, наскільки % враховані ознаки пояснюють результат.


9.Методи багатовимірного статистичного аналізу. Кластер-аналіз. Поняття про ієрархічному методі та прометод К-середніх. Багатовимірна класифікація з використанням нечітких множин.

МСА:

Кластерний аналіз

Факторний аналіз

Багатомірне шкалювання

Кластерний аналіз - Об'єднання об'єктів у групу з єдиною метою (ознак багато).

Способи кластерного аналізу:

1. ієрархічний(дерево ієрархічного аналізу):

основна ідея ієрархічного методу полягає в послідовному об'єднанні об'єктів, що групуються - спочатку найближчих, а потім все більш віддалених один від одного. Процедура побудови класифікації складається з послідовних кроків, кожному з яких виробляється об'єднання двох найближчих груп об'єктів (кластерів).

2. метод К-середніх.

Потребує заздалегідь заданих класів (кластерів). Наголошує на внутрішньокласовій дисперсії. заснований на гіпотезі про найбільш ймовірну кількість класів. Завданням методу є побудова заданого числа кластерів, які мають максимально відрізнятись один від одного.

Процедура класифікації починається з побудови заданої кількості кластерів, отриманих шляхом випадкового угруповання об'єктів. Кожен кластер повинен складатися з максимально схожих об'єктів, причому самі кластери повинні бути максимально схожими один на одного.

Результати цього методу дозволяють отримати центри всіх класів (а також інші параметри дескриптивної статистики) за кожною з вихідних ознак, а також побачити графічне уявлення про те, наскільки і за якими різняться отримані класи.

Якщо рез-ти класифікацій, отримані різними способами збігаються, це підтверджує реальний. Сущ-е груп (надійність, достовірність).


10. Методи багатовимірного статистичного аналізу. Факторний аналіз, цілі його використання. Поняття про факторні ваги, межі їх значень; частка сумарної дисперсії, яка пояснюється факторами.

Багатовимірний статистичний аналіз. Його мета: побудова спрощеного укрупненого ряду об'єктів.

МСА:

Кластерний аналіз

Факторний аналіз

Багатомірне шкалювання

В основі факторного аналізулежить ідея у тому, що з складними взаємозв'язками явно заданих ознак стоїть щодо простіша структура, що відбиває найбільш істотні риси досліджуваного явища, а " зовнішні " ознаки є функціями прихованих загальних чинників, визначальних цю структуру.

Мета: перехід від більшої кількості ознак до невеликого числа факторів.

в факторному аналізівсі величини, які входять у факторну модель, стандартизовані, тобто. є безрозмірними величинами із середнім арифметичним значенням 0 та середнім квадратичним відхиленням 1.

Коефіцієнт взаємозв'язку між деякою ознакою та загальним фактором, що виражає міру впливу фактора на ознаку, називається факторним навантаженнямданої ознаки за цим загальним фактором . Це в інтервалі від -1 до 1. Чим далі від 0, тим більше сильний зв'язок. Значення факторного навантаження по деякому фактору, близьке до нуля, говорить про те, що цей фактор практично на цю ознаку не впливає.

Значення (захід прояву) фактора в окремого об'єкта називається факторною вагоюоб'єкта за цим фактором. Факторні ваги дозволяють ранжувати, упорядкувати об'єкти за кожним фактором. Чим більший факторний вага деякого об'єкта, то більше в ньому проявляється той бік явища чи та закономірність, яка відбивається даним фактором. Чинники є стандартизованими величинами, що не можуть бути = нулю. Факторні ваги, близькі до нуля, говорять про середній ступінь прояву фактора, позитивні – про те, що цей ступінь вищий за середній, негативні – про те. що вона нижча за середню.

Таблиця факторних ваг має nрядків за кількістю об'єктів та kстовпців за кількістю загальних чинників. Положення об'єктів на осі кожного фактора показує, з одного боку, той порядок, в якому вони ранжовані за цим фактором, а з іншого боку, рівномірність або ж нерівномірність у їхньому розташуванні, наявність скупчень точок, що зображують об'єкти, що дає можливість візуально виділяти більше менш однорідні групи.


11. Види якісних ознак. Номінальні ознаки, приклади з історичних джерел. Таблиця сполученості. Коефіцієнт зв'язку номінальних ознак, межі його значень.

Номінальні дані представлені категоріями, котрим порядок абсолютно важливий. Для них не визначено жодного іншого способу порівняння, крім буквального збігу/несупаду.

Приклади номінальних змінних:

· Національність: англієць, білорус, німець, російський, японець та ін.

· Рід занять: службовець, лікар, військовий, учитель і т.д.

· Профіль освіти: гуманітарна, технічна, медична, юридична і т.д.

Якщо у випадку з рівнем освіти ми ще могли порівнювати людей у ​​термінах "краще-гірше" або "вище-нижче", то тепер ми позбавлені навіть цієї можливості; єдиний коректний спосіб порівняння - це говорити, що дані персоналії "все є істориками", або "все не є юристами".

Таблиці сполученості

Таблицею сполученості називається прямокутна таблиця, рядками якої вказуються категорії однієї ознаки (наприклад, різні соціальні групи), а, по стовпцям - категорії іншого (наприклад, партійна приналежність). Кожен об'єкт сукупності потрапляє в якусь із клітин цієї таблиці відповідно до того, в яку категорію він потрапляє за кожною з двох ознак. Таким чином, у клітинах таблиці стоять числа, що являють собою частоти спільної зустрічальності категорій двох ознак (кількість людей, що належать конкретній соціальній групі і входять до певної партії). Залежно від характеру розподілу цих частот усередині таблиці можна будувати висновки про тому, чи існує зв'язок між ознаками. Що означає зв'язок між соціальним статусом та партійною приналежністю? В даному випадку про наявність зв'язку свідчило б про наявність певних політичних уподобань у членів різних соціальних груп. Формально кажучи, цей зв'язок розуміється як частіша (або навпаки, рідкісна) спільна зустрічальність окремих комбінацій категорій порівняно з очікуваною зустрічальністю - ситуацією суто випадкового потрапляння об'єктів туди (наприклад, більш висока частка селян у партії трудовиків, а дворян - у партії кадетів, чим частки цих соціальних груп у всій сукупності депутатів Думи).


12. Види якісних ознак. Рангові ознаки, приклади з історичних джерел У яких межах знаходяться значення коефіцієнта рангової кореляції? Які коефіцієнти слід використовувати для оцінки зв'язку рангового та номінальних ознак?

якісні (або категоріальні) дані поділяються на два типи: рангові та номінальні.

Рангові даніпредставлені категоріями, котрим можна вказати порядок, тобто. категорії можна порівняти за принципом "більше-менше" або "краще-гірше".

Приклади рангових змінних:

· Оцінки на іспитах мають явно виражену рангову природу та виражаються категоріями типу: "відмінно", "добре", "задовільно" тощо.

· Рівень освіти може бути представлений як набір категорій: "вища", "середня" тощо.

Безперечно, ми можемо запровадити рангову шкалу і за її допомогою впорядкувати всіх людей, для яких ми знаємо їхній рівень освіти або бал на іспиті. Однак, чи правда, що оцінка "добре" на стільки ж гірша, ніж "відмінно", наскільки оцінка "задовільно" гірша, ніж "добре"? Незважаючи на те, що формально, у разі оцінок, можна отримати різницю в балах, навряд чи коректно вимірювати відстань від "відмінника" до "хорошиста" користуючись тими ж правилами, що для відстані від Москви до Петербурга. У випадку з рівнем освіти особливо чітко видно, що прості обчислення неможливі, оскільки не існує єдиного правила віднімання "середнього" рівня освіти з "вищого", навіть якщо ми надамо вищої освітикод "3", а в середньому - код "2".

Своєрідність якісних даних не означає, що їх не можна аналізувати за допомогою математичних та статистичних методів.

Ряд об'єктів, упорядкованих відповідно до ступеня прояву деякої властивості, називають ранжованим, кожному числу такого ряду надається ранг.

Заходи взаємозв'язку між парою ознак, кожна з яких ранжирує сукупність об'єктів, що вивчається, називаються в статистиці коефіцієнтами рангової кореляції .

Ці коефіцієнти будуються на основі наступних трьох властивостей:

· якщо ранжовані ряди за обома ознаками повністю збігаються (тобто кожен об'єкт займає одне й те саме місце в обох рядах), то коефіцієнт рангової кореляції повинен дорівнювати +1, що означає повну позитивну кореляцію:

· якщо об'єкти в одному ряду розташовані у зворотному порядку порівняно з другим, коефіцієнт дорівнює -1, що означає повну негативну кореляцію;

· в інших ситуаціях значення коефіцієнта укладено в інтервалі [-1, +1]; Зростання модуля коефіцієнта від 0 до 1 характеризує збільшення відповідності між двома ранжованими рядами.

Зазначеними властивостями мають коефіцієнти рангової кореляції Спірмена r і Кедалла t .

Коефіцієнт Кедалла дає більш обережну оцінку кореляції, ніж коефіцієнт Спірмена (числове значенняtзавжди менше, ніжr).

Коефіцієнти взаємозв'язку якісних ознак

Для оцінки зв'язку якісних ознак необхідний коефіцієнт, який мав би певний максимум у разі максимального зв'язку і дозволяв би порівнювати між собою різні таблиці за силою зв'язку між ознаками. В даному випадку нам підходить коефіцієнт Крамера V .

Базуючись на значенні критерію хі-квадрат, коефіцієнт Крамера дозволяє вимірювати силу зв'язку між двома категоризованими змінними - виміряти її числом, що набуває значення від 0 до 1, тобто. від повної відсутності зв'язку до максимального сильного зв'язку. Коефіцієнт дозволяє порівняти залежності різних ознак, аби виявити більш-менш сильні зв'язки.


13. Математичне моделювання історичних процесів таявищ. Визначення поняття «модель». Три типи моделей, приклади їхвикористання в історичних дослідженнях

14. Диференційне рівнянняяк основний інструмент побудови математичних моделейтеоретичного типу. Їх особливості у порівнянні з моделями імітаційного та статистичного типу. Приклад такої моделі.

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

гарну роботуна сайт">

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru/

Завдання 1

У певному регіоні цього року було скоєно 12 390 злочинів, а попереднього року - 11 800 злочинів. Обчисліть (у %) темпи зростання і темпи приросту кількості злочинів, зареєстрованих цього року стосовно попередньому. Розрахуйте також коефіцієнти злочинності за кожен рік, якщо чисельність населення регіону наприкінці попереднього року становила 1475000, а наприкінці поточного року - 1770000 чол. Зробіть висновки про динаміку злочинності у регіоні.

Рішення:Для отримання точної картини злочинності велике значення має такий показник злочинності, як динаміка, тобто зміна часу. Динаміка злочинності характеризується поняттями абсолютне зростання (або зниження) та темпи зростання та приросту злочинності, для визначення яких проводиться обчислення цих характеристик згідно з певними формулами.

Темпи зростання злочинності розраховуються на основі базисних показників динаміки, що передбачає зіставлення даних за ряд років (а іноді десятиліть, якщо необхідне широке охоплення матеріалу) з постійним базисом, під яким розуміється рівень злочинності в початковому для аналізу періоді. Такий розрахунок дозволяє кримінологам значною мірою гарантувати сумісність. відносних показників, що обчислюються у відсотках, які показують, яким чином співвідноситься злочинність наступних періодів з попереднім.

У розрахунку за 100% приймаються дані вихідного року; показники, отримані за наступні роки, відображають лише відсоток приросту, що робить розрахунок точним, а картину об'єктивнішою; при оперуванні відносними даними вдається виключити впливом геть зниження чи зростання злочинності збільшення чи зниження чисельності жителів, досягли віку кримінальної відповідальності.

Темп приросту злочинності обчислюється у відсотках. Темп приросту злочинності показує, наскільки збільшився чи зменшився наступний рівень злочинності проти попереднім періодом. Прийнято умовне позначеннявектор темпу приросту: якщо відсоткове співвідношення зростає, ставиться знак "плюс", якщо знижується - ставиться знак "мінус".

Стосовно умов нашого завдання слід застосувати відповідні формули та обчислити зростання та приріст злочинності.

1) Темп зростання злочинності обчислюється за формулою ^

Тр = U / U2 * 100%,

де U – показник рівня злочинності, а U2 – показник рівня злочинності попереднього періоду. Так темпи зростання злочинності за умовами завдання становитиме - 12390/11800*100 %=1,05 %.

2) Темп приросту злочинності розраховується за такою формулою:

Тпр = Тр-100%.

Так темп приросту за умов завдання складе 1,05% -100% = 98,95%.

p align="justify"> Коефіцієнт злочинності - це конкретний узагальнюючий показник загальної кількості врахованих злочинів, співвіднесеного з чисельністю населення. Він розшифровується як кількість злочинів на 100 тис., 10 тис. або 1 тис. населення і є об'єктивним вимірником злочинності, що дозволяє зіставляти її рівні у різних регіонах та у різні роки.

p align="justify"> Коефіцієнт злочинності допомагає більш адекватно оцінити і динаміку рівня злочинності, розрахованого на душу населення.

Коефіцієнт злочинності розраховується за такою формулою:

КП = (П х 100000): Н,

де П - абсолютне числоврахованих злочинів; а Н – абсолютна чисельність всього населення.

Обидва показники беруться в тому самому територіальному та тимчасовому обсязі. Число злочинів зазвичай розраховується на 100 тис. населення. Але за малих числах злочинів і населення (у місті, районі, для підприємства) коефіцієнт злочинності може розраховуватися на 10 тис. чи 1 тис. жителів. у кожному разі ці числа означають розмірність аналізованого коефіцієнта, яка обов'язково вказується: кількість злочинів на 100 тис. чи 10 тис. населення.

Розрахуємо коефіцієнт злочинності стосовно умов нашого завдання:

1) КП = (12390 * 100000): 1770000 чол. = 700 (цього року).

2) КП = (11800 * 100000): 1475000 = 800 (у попередньому році).

Злочинність у регіоні знижується, оскільки, аналізуючи коефіцієнт злочинності, можна дійти невтішного висновку, що з збільшенні населення регіоні (на 16,6 %), і незначному збільшенні кількості злочинів на 1,05 %, загалом приріст злочинності знижується (-98,95 %).

Завдання 2

Вік 11 молодих фахівців установи, прийнятих на службу, у поточному році становив відповідно 19,25,21,23,23,23,25,20,18,20,21 років. Зробіть зведення та групування даних у вигляді статистичної таблиці частот. Для наочності збудуйте полігон частот, а також знайдіть модальне, медіанне та середнє значення віку прийнятих співробітників.

Рішення: Угруповання- це розбиття сукупності на групи, однорідні за якоюсь ознакою. З погляду окремих одиниць сукупності угруповання - це поєднання окремих одиниць сукупності у групи, однорідні за будь-якими ознаками.

Метод угруповання ґрунтується на наступних категоріях - це групувальна ознака, інтервал угруповання та кількість груп.

Групувальна ознака- це ознака, яким відбувається об'єднання окремих одиниць сукупності в однорідні групи.

Інтервал окреслює кількісні межі груп. Як правило, він є проміжком між максимальними і мінімальними значеннями ознаки в групі.

Визначення числа груп.

Число груп приблизно визначається за формулою Стерджесса:

n = 1 + 3,2 log n = 1 + 3,2 log (11) = 4.

Ширина інтервалу складе:

Xmax – максимальне значення групувального ознаки в сукупності. Xmin - мінімальне значення групувального ознаки. Визначимо межі групи.

Номер групи

Нижня границя

Верхня межа

Одне і значення ознаки служить верхньої і нижньої межами двох суміжних (попередньої і наступної) груп.

Для кожного значення ряду підрахуємо, скільки разів воно потрапляє в той чи інший інтервал. Для цього сортуємо ряд за зростанням.

№ сукупності

Частота fi

Полігон частоти - це графік щільності та ймовірності випадкової величини, являє собою ламану сполучну точки, відповідні серединним значенням інтервалів групування частот цих інтервалів.

Середнє значення:

Модальне значення. Мода - найбільш поширене значення ознаки в одиниць цієї сукупності.

де x 0 – початок модального інтервалу; h – величина інтервалу; f 2 - частота, що відповідає модальному інтервалу; f 1 - передмодальна частота; f 3 – післямодальна частота.

Вибираємо як початок інтервалу 19.75, тому що саме на цей інтервал припадає найбільша кількість.

Найчастіше зустрічається значення ряду - 20.92.

Медіана. Медіана ділить вибірку на дві частини: половина варіант менше медіани, половина – більше.

У інтервальному рядурозподілу одразу можна вказати лише інтервал, у якому перебуватиме мода чи медіана. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду. Медіанним є інтервал 1975-215, т.к. у цьому інтервалі накопичена частота S, більша за медіанний номер (медіанним називається перший інтервал, накопичена частота S якого перевищує половину загальної сумичастот).

Таким чином, 50% одиниць сукупності будуть меншими за величиною 21.28.

Завдання 3

Визначте необхідний обсяг вибірки на дослідження середнього віку атестованих співробітників ФСВП Росії за умови, що середнє квадратичне відхилення становить 10 років, а максимально припустима помилка вибірки має перевищувати 5 %.

Рішення шукаємо за формулою визначення чисельності вибірки для повторного відбору.

Ф(t) = г/2 = 0.95/2 = 0.475 і цього значення за таблицею Лапласа відповідає t=1.96.

Оцінка середньоквадратичного відхилення s = 10; помилка вибірки е = 5.

Завдання 4

У наступній таблиці надано офіційні відомчі статистичні відомості про розподіл засуджених за термінами ув'язнення (покарання) за 2002-2011 роки, розміщені на офіційному сайті ФСВП Росії: www.fsin.su. Знайдіть розмах та коефіцієнт варіації кількості засуджених за кожен календарний рік і зробіть висновки про однорідність структури цієї статистичної ознаки.

Основним показником, що характеризує однорідність даних, є коефіцієнт варіації. У статистиці прийнято вважати, що, якщо значення коефіцієнта менше 33%, то сукупність даних є однорідною, якщо понад 33%, то неоднорідною.

Коефіцієнт варіації

Оскільки v? 30%, то сукупність однорідна, а варіація слабка. Отриманим результатам можна довіряти.

Термін покарання

Від 1 до 3 років

Від 3 до 5 років

Від 5 до 10 років

Від 10 до 15 років

Понад 15 років

Максимальне значення (функція МАКС)

Мінімальне значення (функція МІН)

Розмах варіації

Середнє значення (функція СРЗНАЧ)

Середнє квадратичне відхилення (функція СТАНДАР ЛОНУ)

Коефіцієнт варіації

Проста середня:

Модальне значення

Медіана

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 70580. Отже, медіана Me = 70580.

Показники варіації. .

R = X max - X min.

R = 295916-2250 = 293666.

Середнє лінійне відхилення

Кожне значення ряду відрізняється від іншого в середньому 90895.71.

Дисперсія

(середня помилкавибірки).

Кожне значення ряду відрізняється від середнього значення 103008 у середньому на 107169.83.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>

або

Коефіцієнт осциляції

Проста середня:

Мода

Мода відсутня (всі значення ряду індивідуальні).

Медіана. Медіана - значення ознаки, що поділяє одиниці ранжованого ряду на дві частини. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду.

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 76186. Отже, медіана Me = 76186.

Показники варіації. Абсолютні показникиваріації.

Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.

R = X max - X min

R = 291112-3101 = 288011.

Середнє лінійне відхилення- обчислюють у тому, щоб врахувати відмінності всіх одиниць досліджуваної сукупності.

Кожне значення ряду відрізняється від іншого в середньому 83422.69.

Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).

Середнє квадратичне відхилення(Середня помилка вибірки).

Кожне значення ряду відрізняється від середнього значення 97334.29 у середньому 100750.25.

Відносні показники варіації. До відносних показників варіації відносять: коефіцієнт осциляції, лінійний коефіцієнтваріації, відносне лінійне відхилення.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>70%, то сукупність наближається до межі неоднорідності, а варіація сильна.

У такому разі при практичних дослідженнях різними статистичними прийомамиприводять сукупність до однорідного вигляду.

Лінійний коефіцієнт варіаціїабо Відносне лінійне відхилення- характеризує частку усередненого значення ознаки абсолютних відхиленьвід середнього розміру.

Коефіцієнт осциляції- відбиває відносну коливання крайніх значень ознаки навколо середньої.

Проста середня:

Модальне значення. Мода - найбільш поширене значення ознаки в одиниць цієї сукупності.

Мода відсутня (всі значення ряду індивідуальні).

Медіана. Медіана - значення ознаки, що поділяє одиниці ранжованого ряду на дві частини. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду.

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 71093. Отже, медіана Me = 71093.

Показники варіації. Абсолютні показники варіації.

Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.

R = X max - X min

R = 243852-3856 = 239996.

Середнє лінійне відхилення- обчислюють у тому, щоб врахувати відмінності всіх одиниць досліджуваної сукупності.

Кожне значення ряду відрізняється від іншого в середньому 68998.08.

Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).

Середнє квадратичне відхилення(Середня помилка вибірки).

Кожне значення ряду відрізняється від середнього значення 85765.57 у середньому на 82541.55.

Відносні показники варіації. До відносних показників варіації відносять коефіцієнт осциляції, лінійний коефіцієнт варіації, відносне лінійне відхилення.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>70%, то сукупність наближається до межі неоднорідності, а варіація сильна.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова. У разі при практичних дослідженнях різними статистичними прийомами приводять сукупність до однорідного виду.

Лінійний коефіцієнт варіаціїабо Відносне лінійне відхилення- характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини.

Коефіцієнт осциляції- відбиває відносну коливання крайніх значень ознаки навколо середньої.

:

Мода. Мода - найбільш поширене значення ознаки в одиниць цієї сукупності.

Мода відсутня (всі значення ряду індивідуальні).

Медіана. Медіана - значення ознаки, що поділяє одиниці ранжованого ряду на дві частини. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду.

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 74588. Отже, медіана Me = 74588.

Показники варіації. Абсолютні показники варіації.

Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.

R = X max - X min,

R = 242984-5304 = 237680.

Середнє лінійне відхилення- обчислюють у тому, щоб врахувати відмінності всіх одиниць досліджуваної сукупності.

Кожне значення ряду відрізняється від іншого в середньому 73148.73.

Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).

Середнє квадратичне відхилення(Середня помилка вибірки).

Кожне значення ряду відрізняється від середнього значення 92104.14 у середньому 82873.1.

Відносні показники варіації. До відносних показників варіації відносять коефіцієнт осциляції, лінійний коефіцієнт варіації, відносне лінійне відхилення.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>70%, то сукупність наближається до межі неоднорідності, а варіація сильна.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова. У разі при практичних дослідженнях різними статистичними прийомами приводять сукупність до однорідного виду.

Лінійний коефіцієнт варіаціїабо Відносне лінійне відхилення- характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини.

Коефіцієнт осциляції- відбиває відносну коливання крайніх значень ознаки навколо середньої.

Проста середня арифметична:

Мода. Мода - найбільш поширене значення ознаки в одиниць цієї сукупності.

Мода відсутня (всі значення ряду індивідуальні).

Медіана. Медіана - значення ознаки, що поділяє одиниці ранжованого ряду на дві частини. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду.

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 76678. Отже, медіана Me = 76678

Показники варіації. Абсолютні показники варіації.

Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.

R = X max - X min.

R = 249346-6536 = 242810.

Середнє лінійне відхилення- обчислюють у тому, щоб врахувати відмінності всіх одиниць досліджуваної сукупності.

Кожне значення ряду відрізняється від іншого в середньому 79680.53.

Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).

Середнє квадратичне відхилення(Середня помилка вибірки).

Кожне значення ряду відрізняється від середнього значення 99551.71 у середньому 87389.04.

Відносні показники варіації. До відносних показників варіації відносять коефіцієнт осциляції, лінійний коефіцієнт варіації, відносне лінійне відхилення.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>70%, то сукупність наближається до межі неоднорідності, а варіація сильна.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова. У разі при практичних дослідженнях різними статистичними прийомами приводять сукупність до однорідного виду.

Лінійний коефіцієнт варіаціїабо Відносне лінійне відхилення- характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини.

Коефіцієнт осциляції- відбиває відносну коливання крайніх значень ознаки навколо середньої.

Проста середня арифметична:

Мода. Мода - найбільш поширене значення ознаки в одиниць цієї сукупності.

Мода відсутня (всі значення ряду індивідуальні).

Медіана. Медіана - значення ознаки, що поділяє одиниці ранжованого ряду на дві частини. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду.

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 76461. Отже, медіана Me = 76461.

Показники варіації. Абсолютні показники варіації.

Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.

R = X max - X min.

R = 254722-6704 = 248018.

Середнє лінійне відхилення- обчислюють у тому, щоб врахувати відмінності всіх одиниць досліджуваної сукупності.

Кожне значення ряду відрізняється від іншого в середньому 82302.82.

Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).

Середнє квадратичне відхилення(Середня помилка вибірки).

Кожне значення ряду відрізняється від середнього значення 102346.71 у середньому 89787.88.

Відносні показники варіації. До відносних показників варіації відносять коефіцієнт осциляції, лінійний коефіцієнт варіації, відносне лінійне відхилення.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>70%, то сукупність наближається до межі неоднорідності, а варіація сильна.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова. У разі при практичних дослідженнях різними статистичними прийомами приводять сукупність до однорідного виду.

Лінійний коефіцієнт варіаціїабо Відносне лінійне відхилення- характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини.

Коефіцієнт осциляції- відбиває відносну коливання крайніх значень ознаки навколо середньої.

Проста середня арифметична:

Мода. Мода - найбільш поширене значення ознаки в одиниць цієї сукупності.

Мода відсутня (всі значення ряду індивідуальні).

Медіана. Медіана - значення ознаки, що поділяє одиниці ранжованого ряду на дві частини. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду.

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 78 959. Отже, медіана Me = 78 959.

Показники варіації. Абсолютні показники варіації.

Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.

R = X max - X min.

R = 261334-7635 = 253699.

Середнє лінійне відхилення- обчислюють у тому, щоб врахувати відмінності всіх одиниць досліджуваної сукупності.

Кожне значення ряду відрізняється від іншого в середньому 83791.55.

Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).

Середнє квадратичне відхилення(Середня помилка вибірки).

Кожне значення ряду відрізняється від середнього значення 104898.86 у середньому 91616.15.

Відносні показники варіації. До відносних показників варіації відносять коефіцієнт осциляції, лінійний коефіцієнт варіації, відносне лінійне відхилення.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>70%, то сукупність наближається до межі неоднорідності, а варіація сильна.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова. У разі при практичних дослідженнях різними статистичними прийомами приводять сукупність до однорідного виду.

Лінійний коефіцієнт варіаціїабо Відносне лінійне відхилення- характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини.

Коефіцієнт осциляції- відбиває відносну коливання крайніх значень ознаки навколо середньої.

Проста середня арифметична:

Мода. Мода - найбільш поширене значення ознаки в одиниць цієї сукупності.

Мода відсутня (всі значення ряду індивідуальні).

Медіана. Медіана - значення ознаки, що поділяє одиниці ранжованого ряду на дві частини. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду.

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 75916. Отже, медіана Me = 75916.

Показники варіації. Абсолютні показники варіації.

Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.

R = X max - X min.

R = 263863-8145 = 255718.

Середнє лінійне відхилення- обчислюють у тому, щоб врахувати відмінності всіх одиниць досліджуваної сукупності.

Кожне значення ряду відрізняється від іншого в середньому 82767.96.

Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).

Середнє квадратичне відхилення(Середня помилка вибірки).

Кожне значення ряду відрізняється від середнього значення 103440.71 у середньому 91207.92.

Відносні показники варіації. До відносних показників варіації відносять коефіцієнт осциляції, лінійний коефіцієнт варіації, відносне лінійне відхилення.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>70%, то сукупність наближається до межі неоднорідності, а варіація сильна.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова. У разі при практичних дослідженнях різними статистичними прийомами приводять сукупність до однорідного виду.

Лінійний коефіцієнт варіаціїабо Відносне лінійне відхилення- характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини.

Коефіцієнт осциляції- відбиває відносну коливання крайніх значень ознаки навколо середньої.

Проста середня арифметична:

Мода. Мода - найбільш поширене значення ознаки в одиниць цієї сукупності.

Мода відсутня (всі значення ряду індивідуальні).

Медіана. Медіана - значення ознаки, що поділяє одиниці ранжованого ряду на дві частини. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду.

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 78019. Отже, медіана Me = 78019.

Показники варіації. Абсолютні показники варіації.

Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.

R = X max - X min

R = 260094-7798 = 252296.

Середнє лінійне відхилення- обчислюють у тому, щоб врахувати відмінності всіх одиниць досліджуваної сукупності.

Кожне значення ряду відрізняється від іншого в середньому 77827.76.

Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).

Середнє квадратичне відхилення(Середня помилка вибірки).

Кожне значення ряду відрізняється від середнього значення 99212.29 у середньому 88081.39.

Відносні показники варіації. До відносних показників варіації відносять коефіцієнт осциляції, лінійний коефіцієнт варіації, відносне лінійне відхилення.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>70%, то сукупність наближається до межі неоднорідності, а варіація сильна.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова. У разі при практичних дослідженнях різними статистичними прийомами приводять сукупність до однорідного виду.

Лінійний коефіцієнт варіаціїабо Відносне лінійне відхилення- характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини.

Коефіцієнт осциляції- відбиває відносну коливання крайніх значень ознаки навколо середньої.

Проста середня арифметична:

Мода. Мода - найбільш поширене значення ознаки в одиниць цієї сукупності.

Мода відсутня (всі значення ряду індивідуальні).

Медіана. Медіана - значення ознаки, що поділяє одиниці ранжованого ряду на дві частини. Медіана відповідає варіанту, що стоїть у середині ранжованого ряду.

Знаходимо середину ранжованого ряду: h = (n+1) / 2 = (7+1) / 2 = 4. Цьому номеру відповідає значення ряду 72248. Отже, медіана Me = 72248.

Показники варіації. Абсолютні показники варіації.

Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.

R = X max - X min.

R = 242137-7173 = 234964.

Середнє лінійне відхилення- обчислюють у тому, щоб врахувати відмінності всіх одиниць досліджуваної сукупності.

Кожне значення ряду відрізняється від іншого в середньому 70459.02.

Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).

Середнє квадратичне відхилення(Середня помилка вибірки).

Кожне значення ряду відрізняється від середнього значення 91375.14 у середньому 80674.43.

Відносні показники варіації. До відносних показників варіації відносять коефіцієнт осциляції, лінійний коефіцієнт варіації, відносне лінійне відхилення.

Коефіцієнт варіації- міра відносного розкиду значень сукупності: показує, яку частку середнього значення цієї величини становить її середній розкид.

Оскільки v>70%, то сукупність наближається до межі неоднорідності, а варіація сильна.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова. У разі при практичних дослідженнях різними статистичними прийомами приводять сукупність до однорідного виду.

Лінійний коефіцієнт варіаціїабо Відносне лінійне відхилення- характеризує частку усередненого значення ознаки абсолютних відхилень від середньої величини.

Коефіцієнт осциляції- відбиває відносну коливання крайніх значень ознаки навколо середньої.

Завдання 5

В умовах попереднього завдання здійсніть перегрупування заданих інтервалів термінів покарання з метою покращення відносних показників варіації ознаки у 2010 році. Побудуйте гістограми розподілу засуджених за термінами ув'язнення (покарання) за 2010 рік до та після угруповання даних і зробіть висновки про однорідність структури досліджуваного статистичного ознаки.

Рішення:

Оскільки v>30%, але v<70 %, то вариация умеренная.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова.

Зробимо перегрупування даних наступним чином:

До групи 1) входить групи: до року, року, від 1-3 років відповідно 156978.

У групу 2) входить від групи понад 3 до 5 років повністю та 1\5 від групи понад 5 до 10 років отримуємо 1\5*260094+168651=220669,8.

У групу 3) входить 35 групи від 5 до 10 тобто. 3 5 * 260094 = 156056,4.

Група 4) (1 \ 5 * 260094) + (1 \ 5 * 78019) = 67622,6.

Група 5) 3 \ 5 * 78019 = 46811,4.

Група 6 30744 + (1 \ 5 * 78019) = 46347,8.

Гістограма. Для отримання висновку про однорідність досліджуваного статистичного ознаки Обчислимо коефіцієнт варіації:

Оскільки v>30%, але v<70 %, то вариация умеренная.

Коефіцієнт варіації значно більше 33%. Отже, розглянута сукупність неоднорідна і середня для неї недостатня типова.

Завдання 6

Викласти в короткій формі (тезово, на 1-2 сторінках) зміст та результати недавнього офіційного статистичного дослідження в соціально-правовій сфері (тематика – на Ваш вибір, посилання на Інтернет-ресурси – обов'язкові), зробити висновки та висунути відповідні статистичні гіпотези на короткострокову перспективу.

Як офіційне статистичне дослідження було взято дослідження про прострочену заборгованість із заробітної плати на 1 грудня 2015 року.

Станом на 1 грудня 2015 р., за даними організацій (що не належать до суб'єктів малого підприємництва), сумарна заборгованістьіз заробітної плати по колу видів економічної діяльності, що спостерігаються, склала 3900 млн. руб.їйта порівняно з 1 листопада 2015 р. збільшилася на 395 млн. рублів (на 11,3 %).

Прострочена заборгованість із заробітної плати через відсутність у організацій власні коштина 1 грудня 2015р. склала 3818 млн. руб.їй, або 97,9% від загальної суми простроченої заборгованості. Порівняно з 1 листопада 2015р. вона збільшилася на 389 млн. рублів (на 11,3%). Заборгованість через несвоєчасне отримання коштів з бюджетів усіх рівнівсклала 82 млн. руб.їйта збільшилася порівняно з 1 листопада 2015р. на 6 млн. рублів (на 7,7%), у тому числі заборгованість з федерального бюджетустановила 62 млн. рублів і знизилася порівняно з 1 листопада 2015р. на 6 млн. рублів (на 8,6%), бюджетів суб'єктів Російської Федераціїстановила 1,1 млн. рублів (збільшення на 0,2 млн. рублів або на 20,7%), місцевих бюджетів - 19 млн. рублів (збільшення на 12 млн. рублів, чи 2,5 разу).

У видобутку корисних копалин, обробних виробництвах, охороні здоров'я та надання соціальних послуг, рибальстві та рибництві 100% простроченої заборгованості із заробітної плати утворено через брак організацій власних коштів.

У загальному обсязі простроченої заборгованості із заробітної плати 37 % припадає на обробні виробництва, 29 % - на будівництво, 9 % - на виробництво та розподілення електроенергії, газу та води, 7 % - на транспорт, 6 % - на видобуток корисних копалин, 5 % - на сільське господарство, полювання та надання послуг у цих галузях, лісозаготівлі.

Обсяг простроченої заборгованості із заробітної плати на 1 грудня 2015р. становив менше 1% місячного фонду заробітної плати працівників видів економічної діяльності.

Заборгованість із заробітної плати за останній місяць, за який проводилися нарахування, у загальному обсязі простроченої заборгованості становила в середньому 29 %: виробництві та розподілі електроенергії, газу та води – 75 %, діяльності в галузі освіти – 37 %, охорони здоров'я та надання соціальних послуг – 35 %, наукових досліджень та розробок - 32%, будівництва - 29%, транспорту - 23%, обробних виробництвах - 22%.

Із загальної суми невиплаченої заробітної плати на борги, що утворилися у 2014р., припадає 457 млн. рублів (11,7%), у 2013р. і раніше - 657 млн. рублів (16,8%).

Загалом спостерігаючи картину заборгованості із заробітної плати в динаміці (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif), можна зробити висновок, що значний спад припаде на січень , лютий 2016 року.

Основний відсоток заборгованості посідає обробні виробництва - 37 %, 29 % - на будівництво швидше за все це відбувається у зв'язку зі зниженням споживчого попиту продукцію, відповідно зменшується прибуток.

Висунемо гіпотезу. З січня 2016 року відсоток заборгованості скорочуватиметься, у зв'язку з розподілом річного бюджету на наступний рік з урахуванням часткового погашення заборгованості із заробітної плати, і становитиме 2700 млн. динаміка злочинність варіація медіане

Для перевірки гіпотези (За основу беремо даний таблиці).

Побудуємо дискретний варіаційний ряд. Для цього відсортуємо ряд за зростанням та підрахуємо кількість повторень для кожного елемента ряду.

Обчислимо середню:

Обчислимо дисперсію. Дисперсія - характеризує міру розкиду у її середнього значення (захід розсіювання, тобто відхилення від середнього).

Використовуючи односторонній критерій з б = 0,05, перевірити цю гіпотезу, якщо у вибірці з n = 24 місяці середній показник дорівнював 2741,25, а дисперсія відома і дорівнює у = 193469,27

Рішення. Середньоквадратичне відхилення:

Висувається нульова гіпотеза H 0 у тому, що значення математичного очікування генеральної сукупності дорівнює числу м 0: = 2700.

Альтернативна гіпотеза:

H 1: м? 2700, критична область – двостороння.

Для перевірки нульової гіпотези використовується випадкова величина:

де x – вибіркове середнє; S – середньоквадратичне відхилення генеральної сукупності.

Якщо нульова гіпотеза правильна, випадкова величина T має стандартний нормальний розподіл. Критичне значення статистики T визначається виходячи з виду альтернативної гіпотези:

P(|T|

Знайдемо експериментальне значення статистики T:

Оскільки обсяг вибірки досить великий (n>30), замість справжнього значення середньоквадратичного відхилення можна використовувати його оцінку S=439.851.

Ф(t кр) = (1-б) / 2 = (1-0.05) / 2 = 0.475.

По таблиці функції Лапласа знайдемо, у якому t kp значення Ф(t kp) = 0.475.

Експериментальне значення критерію T не потрапило в критичну область T? t kp тому нульову гіпотезу слід прийняти. Значення математичного очікування генеральної сукупності можна прийняти 2700

Список використаної літератури

1. Казанцев С.Я. Правова статистика: Підручник/За ред. С.Я. Казанцева, С.Я. Лебедєва – М.: ЮНІТІ-ДАНА: Закон і право, 2009 р.

2. Курис?в К.М. Основи правової статистики: навч. посібник/К.Н. Курис?в; ВЮІ ФСІН Росії. – Володимир, 2005. – 44 с.

3. Макарова Н.В. Статистика в Exсel: навч. посібник/Н.В. Макарова, В.Я. Трохимець. - М.: Фінанси та статистика.

4. Кондратюк Л.В., Овчинський В.С. Кримінологічний вимір / за ред. К.К. Горяїнова. - М: Норма, 2008.

5. Яковлєв В.Б. Статистика. Розрахунки в Microsoft Excel: навч. Посібник для вузів/В.Б. Яковлєв. - М.: Колос, 2005. - 352 c.

Розміщено на Allbest.ru

...

Подібні документи

    Дослідження злочинності неповнолітніх із позицій об'єкта кримінологічного дослідження. Взаємозв'язок підліткового алкоголізму, токсикоманії, наркоманії та злочинності. Причини та умови та шляхи профілактики злочинності неповнолітніх.

    курсова робота , доданий 08.04.2011

    Методика конкретного кримінологічного дослідження. Кримінологічна характеристика насильницької злочинності та її попередження. Громадська небезпека і тяжкість наслідків насильницьких злочинів. Статистика злочинності.

    контрольна робота , доданий 15.01.2011

    Формула розрахунку коефіцієнта злочинності. Розрахунок середньорічного навантаження одного суддю, середнього терміну розслідування кримінальних справ, середньорічних темпів зростання злочинності. Розрахунок показників моди, медіани, варіації та середньоквадратичного відхилення.

    контрольна робота , доданий 20.04.2011

    Вивчення основ корисливої ​​злочинності: поняття, елементи, об'єкти та суб'єктивні сторони. Опис соціального та спеціально-кримінологічного попередження злочинності з корисливих спонукань. Розробка комплексу заходів щодо запобігання злочинам.

    дипломна робота , доданий 09.11.2012

    Поняття та предмет кримінологічного прогнозування. Встановлення можливих змін у стані, рівні, структурі та динаміці злочинності в майбутньому. Оцінка розвитку злочинності у перспективі. Планування боротьби зі злочинністю, її запобігання.

    курсова робота , доданий 29.05.2015

    Дослідження видів кримінологічного прогнозування та проектування у сфері злочинності. Особливості прогнозування злочинності неповнолітніх Республіка Казахстан. Розробка програм боротьби зі злочинністю на загальнодержавному рівні.

    дипломна робота , доданий 25.10.2015

    Злочинність неповнолітніх як об'єкт кримінологічного дослідження. Основні, кримінологічні показники злочинності неповнолітніх. Стан злочинності. Особливості особистісної характеристики неповнолітніх.

    реферат, доданий 01.04.2003

    Тенденції кримінальної поведінки сучасних жінок: зростання та стійка питома вага тяжких та рецидивних злочинів, омолодження злочинниць та збільшення кількості жінок похилого віку серед засуджених. Загальні заходи запобігання жіночій злочинності.

    реферат, доданий 01.03.2014

    Розрахунок відносних показників структури та координації категорій засуджених за ступенем тяжкості скоєних злочинів. Коефіцієнти злочинності та судимості по федеральних округах та в цілому по Росії. Розрахунок показників динаміки з допомогою MS Excel.

    контрольна робота , доданий 31.07.2011

    Поняття, види, значення, детермінанти латентної злочинності, причини її виникнення, запобігання та способи скорочення. Визначення рівня та аналіз структури злочинності. Системний підхід до вивчення латентної злочинності як соціального явища.

Описовий характер медіани проявляється в тому, що вона характеризує кількісну межу значень варіюючої ознаки, якими має половина одиниць сукупності.

При визначенні медіани в інтервальних варіаційних лавах спочатку визначається інтервал, у якому вона знаходиться (медіанний інтервал). Цей інтервал характерний тим, що його накопичена сума частот дорівнює або перевищує напівсуму всіх частот. Розрахунок медіани інтервального варіаційного ряду провадиться за формулою:

де х 0 – нижня межа інтервалу;

h – величина інтервалу;

f m- Частота інтервалу;

f - Число членів ряду;

?m- 1 - сума накопичених членів низки, що передують цьому.

    Поняття варіації та її значення. Основні показники варіації, їх переваги та значення.

Варіація- коливання, змінність величини ознаки в одиниць сукупності. Окремі числові значення ознаки, що зустрічаються в сукупності, що вивчається, називають варіантами значень. Недостатність середньої величини для повної характеристики сукупності змушує доповнювати середні величини показниками, що дозволяють оцінити типовість цих середніх шляхом вимірювання коливання (варіації) ознаки, що вивчається. Наявність варіації обумовлено впливом значної частини чинників формування рівня ознаки. Ці чинники діють з різною силою й у різних напрямах. Для опису міри мінливості ознак використовують показники варіації. Завдання статистичного вивчення варіації: 1) вивчення характеру та ступеня варіації ознак в окремих одиниць сукупності; 2) визначення ролі окремих чинників чи його груп у варіації тих чи інших ознак сукупності. У статистиці застосовуються спеціальні методи дослідження варіації, що ґрунтуються на використанні системи показників, за допомогою яких вимірюється варіація. Дослідження варіацій має важливе значення. Вимірювання варіацій необхідне під час проведення вибіркового спостереження, кореляційному і дисперсійному аналізі тощо. буд. За рівнем варіації можна будувати висновки про однорідності сукупності, про стійкість окремих значень ознак і типовості середньої. На основі розробляються показники тісноти зв'язку між ознаками, показники оцінки точності вибіркового спостереження. Розрізняють варіацію у просторі та варіацію у часі. Під варіацією у просторі розуміють коливання значень ознаки в одиниць сукупності, що представляють окремі території. Під варіацією у часі мають на увазі зміну значень ознаки у різні періоди часу. Для вивчення варіації у лавах розподілу проводять розташування всіх варіантів значень ознаки у зростаючому чи спадному порядку. Цей процес називають ранжуванням низки. Найпростішими ознаками варіації є мінімум та максимум- Найменше та найбільше значення ознаки в сукупності. Число повторень окремих варіантів значень ознак називають частотою повторення (fi). Частоти зручно замінювати на частості – wi. Частина- відносний показник частоти, що може бути виражений у частках одиниці чи відсотках і дозволяє зіставляти варіаційні ряди з різним числом спостережень. Виражається формулою: Для вимірювання варіації ознаки застосовуються різні абсолютні та відносні показники. До абсолютних показників варіації відносяться розмах варіації, середнє лінійне відхилення, дисперсія, середнє відхилення квадратичне. До відносних показників коливання відносять коефіцієнт осциляції, відносне лінійне відхилення, коефіцієнт варіації.

    Види дисперсій та правило їх складання. Коефіцієнт детермінації та емпіричне кореляційне ставлення: економічне значення та їхній розрахунок.

Показники варіації

Одних лише середніх недостатньо для оцінки тих чи інших явищ, оскільки середні зрівнюють, згладжують індивідуальні особливості окремих одиниць сукупності, показують типовий для цих умов рівень змін, що варіюють, і тим самим можуть загасати різні тенденції в розвитку. У цьому випадку обчислюють показники варіації,характеризують середні відхилення кожної одиниці сукупності від середнього значення ознаки загалом.

Варіація має об'єктивний характері і допомагає пізнати сутність явища, що вивчається.

Для вимірювання варіації у статистиці застосовують кілька способів, описова характеристика яких представлена ​​у табл. 5.6.

Дисперсія має низку математичних властивостей, які спрощують техніку її розрахунку.

1. Якщо з усіх варіант відібрати якесь постійне число А, то дисперсія від цього не зміниться.

2. Якщо всі значення варіант розділити на якесь постійне число h, то дисперсія зменшиться від цього в h 2 раз, а середнє квадратичне відхилення – у hразів.

Таблиця 5.6.

Показники варіації

Назва показника

Позначення та методика розрахунку

Сутнісна характеристика

за несгрупованими даними

за згрупованими даними

Розмах варіації

Уловлює лише крайні відхилення значень ознаки, але з відбиває відхилень від середньої всіх варіант у ряду. Чим більший розмах варіації, тим менш однорідна досліджувана сукупність

Середнє лінійне відхилення

Являє собою середнє арифметичне значення абсолютних відхилень ознаки з його середнього рівня. Чим менше середнє лінійне відхилення, тим більш однорідні значення ознаки явища, що вивчається.

Дисперсія

Є середнім квадратом відхилень значень ознаки від його середнього рівня

Середнє квадратичне відхилення

Є абсолютним заходом варіації і залежить тільки від ступеня варіації ознаки, а й від абсолютних рівнів варіант і середньої, що дозволяє безпосередньо порівнювати середні квадратичні відхилення варіаційних рядів з різними рівнями. Воно виражається у тих іменованих числах, у яких виражені варіанти та середня

Коефіцієнт варіації

Є відносною мірою варіації. Чим більший його величина, тим більше розкид значень ознаки навколо середньої, тим менша однорідна сукупність за своїм складом і тим менш представницька (типова) середня

Методику розрахунку показника дисперсії спрощеними способами показано на рис. 5.4. Відмітимо, що спосіб моментів застосуємоу тому випадку, якщо заданий інтервальний ряд із рівними інтервалами, а спосіб різниці застосовується у будь-яких рядах розподілу: дискретних та інтервальних з рівними та нерівними інтервалами.

Варіація ознаки визначається різними факторами, внаслідок чого розрізняють загальну дисперсію, міжгрупову дисперсію та внутрішньогрупову дисперсію.

Загальна дисперсія (σ 2 ) вимірює варіацію ознаки у всій сукупності під впливом всіх факторів, що зумовили цю варіацію. Разом з тим, завдяки методу угруповань можна виділити та виміряти варіацію, зумовлену групувальною ознакою, та варіацію, що виникає під впливом неврахованих факторів.

Міжгрупова дисперсія (σ 2 м.гр) характеризує систематичну варіацію, тобто відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки - фактора, покладеного в основу угруповання.

Рис.5.4. Спрощені способи розрахунку дисперсії

,

де k- Кількість груп, на які розбита вся сукупність;

m j– кількість об'єктів, спостережень, включених до групи j;

-Середнє значення ознаки по групі j;

-загальне середнє значення ознаки.

Внутрішньогрупова дисперсія (σ 2 j,вн.гр) відбиває випадкову варіацію, тобто. частина варіації, що виникає під впливом неврахованих факторів і незалежну від ознаки фактора, покладеного в основу угруповання.

, або, на основі методу різниць ,

де x ij– значення i-ой варіанти у групі j.

Якщо сформованих групах окремі дані зустрічаються неодноразово, то розрахунку внутрішньогрупової дисперсії використовується формула середньої арифметичної зваженої.

Середнє значення внутрішньогрупових дисперсійрозраховується за формулою:

.

Існує закон згідно з яким, загальна дисперсія, що виникає під впливом всіх факторів, дорівнює сумі дисперсії, що виникає за рахунок групувального ознаки та дисперсії, що з'являється під впливом всіх інших факторів. Цей закон пов'язує три види дисперсії.

Правило складання дисперсій: .

Правило складання дисперсіїшироко застосовується при обчисленні тісноти зв'язків між ознаками(факторним та результативним). Для цього визначають емпіричний коефіцієнт детермінації та емпіричне кореляційне відношення.

Емпіричний коефіцієнт детермінації (η 2) показує, яка частка всієї варіації ознаки обумовлена ​​ознакою, покладеною в основу угруповання. (η - Грецька літера «ця»).

Емпіричне кореляційне відношення (η ) показує тісноту зв'язку між ознаками- групувальним та результативним.

Воно змінюється не більше від 0 до 1. Якщо η = 0, то групувальна ознака не впливає на результативну, якщо η =1,то результативний ознака змінюється лише залежно від ознаки, покладеного основою угруповання, а вплив інших чинників дорівнює нулю. Характеристика зв'язку між ознаками при відповідних значеннях емпіричного кореляційного відношення наведено у табл. 5.7.

Таблиця 5.7

Якісна оцінка зв'язку між ознаками

  1. Поняття та класифікація рядів динаміки. Сумісність рівнів та змикання рядів динаміки.

Динаміка - процес розвитку руху соц. явищ у часі. Для її відображення будують лави динаміки. Ряд динаміки представл. Собою ряд розміщених у хронологічній послідовності знач. Стат. Показників, характер. розвиток явища Аналіз рядів динаміки дозволяє виявити тенденції та закономірності соц.ек розвитку. Ряд динаміки складається з двох елементів: 1)показники часу (t) - або певні дати, або окремі періоди (роки, квартали і т.д.) 2)Рівні ряду (y) - вони відображають кількісну оцінку розвитку в часі явища, що вивчається. Види рядів динаміки: 1. За часом відбивається в динаміч. Поряд вони діляться на: - миттєвівідображають стан досліджуваних явищ на опр дати (моменти часу) За допомогою моментних рядів вивчають: чисельність населення, вартість осн коштів, товар запаси. Рівні мом. Рядів динаміки підсумовувати немає сенсу, т.к. мож. Виникнути повторний рахунок - інтервальні - Відображають підсумки розвитку досліджуваного явища за окремі періоди (інтервали часу) : ряди динаміки произ-ва прод-ції, інвестицій, витрачених коштів. Рівні інтервального ряду динаміки є абсолютними. Величин мож сумувати, т.к. їх можна як результат за більш тривалий період. 2. Залежно від способу вираження рівнів ряду динаміки розрізняють ряди: абсолютних величин, відносних, середніх величин. 3. Залежно від відстані між рівнями різн. ряди динаміки з рівними і не рівними рівнями в часі. Основ умовою отримання правильних висновків під час аналізу низки динаміки явл-ся сумісність його рівнів. Умови сумісності рівнів. Ряди динаміки. 1) Повинен. Бути забезпечено однакову повноту охоплення різних частин явища. Рівні динамічного ряду за окремі періоди часу повинні харка-вать розмір явища по тому самому колу, що входить до його складу елементів. 2) При визначенні порівнюваних рівнів низки динаміки необх. Використовувати єдину методологію їхнього розрахунку. 3)Рівність періодів, за які наводяться дані. 4) Необхідно використовувати однакові одиниці виміру. При характеристики вартісних показників у часі долж. б. усунено вплив змін цін необх. оцінка досліджуваного показ-ля в цінах одного періоду (у порівнянних цінах) 5) Виходячи з мети дослідження дані по тер-ріях, межі які змінилися долж. б. перераховані у старих межах. Для приведення рівнів ряду дин-ки до порівняного виду использ. Прийом, який наз-ся Змикання рядів динаміки. Змикання-об'єднання в один ряд двох або декількох рядів динам., рівні яких обчислені за різною методикою або різними територіальними межами. Щоб зробити змикання рядів необхідно, щоб для одного з періодів (перехідного) були дані, розраховані за різною методикою або в різних межах.

    Показники інтенсивності зміни рівня низки динаміки. Ланцюговий і базовий методи розрахунку.

Для якісної оцінки динаміки явищ, що вивчаються, застосовується ряд стат. показників одержуваних у результаті порівняння рівнів між собою. При цьому порівнюваний рівень. Наз-ся звітний, а уров., з яким відбувається. Порівняння базисним. До основ. показниками динаміки відносяться абсолют. Приріст, темпи зростання, темпи приросту, абсолют. Значення одного% приросту. Залежно від застосовуваного способу зіставлення показники динаміки могли. обчислюватися з постійною та змінною базою порівняння y 1← y 2← y 3← y 4← y 5 Абсолютний приріст характ. Обсяг збільшення чи зменшення рівня низки динаміки за певний період часу і определ-ся як різницю між двома рівнями ряду. ∆y ц = y i - y i - 1 ∆ y б = y i - y 0 м / у ланцюговим і базисними абсолютними приростами існує взаємозв'язок: сума цінних абсолютних приростів дорівнює базисному абсолютному приросту останнього періоду ряду динаміки. ∑∆y ц = ∆ y бп Темп зростання характеризує інтенсивність зміни рівняння ряду та показує у скільки разів рівень. поточного періоду більше або менше рівня попереднього (базисного) періоду або скільки % він становить по відношенню до попереднього періоду Трц = y i /y i-1 * 100% взаємозв'язок: добуток послідовних ланцюгових коефіцієнтів зростання дорівнює базисному коефіцієнту зростання останнього періоду низки динаміки. П Крц = Крб Темп приросту вказує на скільки % - ів рівнів. даного періоду більше або менше рівня прийнятого за базу порівняння: Він може бути розрахований 2 способами: а) як відношення абсол.-го приросту до рівня, прийнятого за базу порівняння Тпрц = ∆ y i / y i-1 * 100% Тпрб = ∆ y i / y 0 * 100% б) як різницю між темпом зростання і 100%-ми Тпр = Тр - 100% Абсолютне значення 1% присрот показує яка абсло-я величина міститься у відносному показнику - одному % приросту. Це ставлення абсло-ого приросту до темпу приросту, вираженому в %-ах. Даний показник розраховується за ланцюговими даними А % = ∆ y i / Тпр % = ∆ y i / (∆ y i / y i-1) * 100 = y i-1 / 100 Для отримання узагальнюючих показників динаміки соц.ек. явищ визначають середні величини: ср рівень низки, середовищ абсол-ий приріст, слід темпи зростання, середовищ темп приросту. Середній рівень низки динаміки дає загальну характ-ку рівня явлений. За весь період. Методи його розрахунку залежить від виду низки динаміки. а) для моментних рядів для рівно розрахованих середовищ. рівнів. ряду осущ-ся формами. середньої хронологічної. y` = (½ y 1 + y 2 + y 3 + ….½ y n)/n-1 n – число рівнів ряду. б) для моментних рядів з нерівними рівнями попередньо знаходяться значення рівнів у серединах інтервалів y`1 = y1 + y2/2; y 2 = y 2 + y 3 /2,……..,y` n = y n-1 + y n /2 Потім визначається загальне середовище рівня. ряду за формулою середньої арифм-ой зваженої: y` = ∑y` i * t i / ∑t i y` I – серед рівнів в інтервалах між датами, ti – тривалість інтервалу часу між рівнями. в) Для інтервальних рядів з рівнозначними рівнями в часі, середовищ рівнів розсити-ся за формулою середньої арифм-кою простий y` = ∑ y i / n Середній абсолютгий приріст показує на скільки в середньому за одиницю часу збільшується (зменшується) рівень ряду. ∆ y i = ∑ y iц / n-1 або ∆ y i = y n – y 1 /n-1

y1 – початковий рівень низки динаміки yn – кінцевий рівень низки динаміки. Середній темпи зростання показує у скільки разів у середньому за одиницю часу змінився рівень низки динамік. Він опред-ся формами. середньої геометричної з ланцюгових коефіцієнтів зростання. Т`р = n – 1 √К ц р 1 * До ц р 2 *……*К ц р n – 1 = n – 1 √ ПКр ц = n -1 √Крб = n – 1 √ y n /y 1 * x 100%

Середній темп приросту показує на скільки % в середньому за одиницю часу збільшився (зменшився) рівень ряду Т`пр = Т` - 100%.

    Середні показники низки динаміки, їхній розрахунок.

Кожен ряд динаміки можна розглядати як сукупність nмінливих у часі показників, які можна узагальнювати як середніх величин. Такі узагальнені (середні) показники особливо необхідні у порівнянні змін того чи іншого показника у різні періоди, у різних країнах тощо.

Узагальненою характеристикою низки динаміки може бути перш за все середній рівень ряду. Спосіб розрахунку середнього рівня залежить від того, чи моментний ряд або інтервальний (періодний).

В разі інтервальногоряду його середній рівень визначається за формулою простий середньої арифметичної величиниз рівнів низки, тобто.

Якщо мається моментнийряд, що містить nрівнів ( y1, y2, …, yn) з рівнимипроміжками між датами (моментами часу), такий ряд легко перетворити на ряд середніх величин. При цьому показник (рівень) початку кожного періоду одночасно є показником на кінець попереднього періоду. Тоді середня величина показника для кожного періоду (проміжок між датами) може бути розрахована як напівсума значень упочатку і поклала край періоду, тобто. як . Кількість таких середніх буде. Як зазначалося раніше, для рядів середніх величин середній рівень розраховується за середньою арифметичною. Отже, можна записати. Після перетворення чисельника отримуємо ,

де Y1і Yn- перший та останній рівні ряду; Yi- Проміжні рівні.

Ця середня відома у статистиці як середня хронологічнадля моментних лав. Таку назву вона отримала від слова «cronos» (час, лат.), оскільки розраховується з показників, що змінюються в часі.

В разі нерівнихпроміжків між датами середню хронологічну для моментного ряду можна розрахувати як середню арифметичну із середніх значень рівнів на кожну пару моментів, зважених за величиною відстаней (відрізків часу) між датами, тобто. . В даному випадку передбачається, що в проміжках між датами рівні набирали різні значення, і ми з двох відомих ( yiі yi+1) визначаємо середні, з яких потім вже розраховуємо загальну середню для всього періоду, що аналізується. Якщо ж передбачається, що кожне значення yiзалишається незмінним до наступного (i+ 1)- го моменту, тобто. відома точна дата зміни рівнів, то розрахунок можна здійснювати за формулою середньої арифметичної зваженої: ,

де - час, протягом якого рівень залишався незмінним.

Крім середнього рівня у лавах динаміки розраховуються й інші середні показники – середня зміна рівнів ряду(базисним та ланцюговим способами), середній темп зміни.

Базова середня абсолютна змінаявляє собою приватне від поділу останньої базової абсолютної зміни на кількість змін. Тобто

Ланцюгова середня абсолютна змінарівнів ряду є часткою від поділу суми всіх ланцюгових абсолютних змін на кількість змін, тобто

По знаку середніх абсолютних змін судять про характер зміни явища у середньому: зростання, спад чи стабільність.

З правила контролю базисних та ланцюгових абсолютних змінслід, що базисна і ланцюгова середня зміна мають бути рівними.

Поряд із середніми абсолютними змінами розраховується і середнє відноснетеж базовим і ланцюговим методами.

Базисна середня відносна змінавизначається за формулою

Ланцюгова середня відносна змінавизначається за формулою

Природно, базисне і ланцюгове середнє відносне зміни мають бути однаковими і порівнянням їх із критеріальним значенням 1 робиться висновок про характер зміни явища в середньому: зростання, спад чи стабільність. Відніманням 1 з базисної або ланцюгової середньої відносної зміни утворюється відповідний середній темп зміни, за знаком якого можна судити про характер зміни досліджуваного явища, відбитого даним рядом динаміки.

    Методи аналізу основної тенденції у лавах динаміки.

Змініть рівнів ряду динаміки обумовлюється на явище, що вивчає визначальний вплив і формують у рядах динаміки основну тенденцію розвитку (тренд). Вплив факторів діючих періодично викликає повторювані в часі коливання рівнів ряду динаміки. Дія разових факторів відображається випадковими (короткочасними) змінами рівнів ряду дин-ки. Т.т ряд дин-ки вкл слід основ. компоненти: 1) основ тенденція (тренд) 2) циклічні (періодичні коливання) 3) Випадкові коливання Основною тенденцією розвитку (трендом) наз-ся плавне і стійке зміни рівня явищ у часі вільне від случ. Колебний. Виявлення основ тенденції зміни рівнів низки передбачає її кількісне вираження певною мірою вільне від випадкових впливів. Для виявлення тренду вико-ся різні способи згладжування (вирівнювання ряду) : 1)Метод зміцнення інтервалів – заключ-ся в тому що початковий ряд динаміки перетворюється на ряд більш тривалих періодів (Напр. ряд, що містить дані в місячному випуску продукції перетворюється на ряд квартальних даних) 2) Метод ковзної середньої. Складається в тому сто вихідні рівні ряду замінюються середніми величинами, які отримують з даного рівня і декількох симетрично його оточуючих. Число рівнів, поск-им розраховуються середовищ. значення наз-ся інтервалом згладжування, він мож. парним та непарним. Розрахунок середніх ведеться методом ковзання, тобто. поступовим винятком їхнього прийнятого періоду ковзання. 1-го рівня та включенням наступного. Знаходження ковзної середньої по парному числу рівнів ускладнюється тим, що середня може бути віднесена толь. до середини укрупненого інтер-ла. Поет. визначення згладжених рівнів проводиться центрування, тобто. знаходження середньої із двох суміжних ковзних середніх для віднесення отриманого рівня до певної дати. 3) Аналітичне вирівнювання. Суть методу полягає у підборі матем. Функції, яка найкраще характеризує вихідні рівні низки динаміки. Емпіричні (фактичні) рівні ряду динаміки замінюють на теоретичні рівні, що плавно змінюються, розраховані за якою-небудь функцією. Залежно відхилення вихідних рівнів ряду від рівнів, відповідних загальної тенденції пояснюється дією випадкових або періодичних факторів. Для вирівнювання використовують слід. матем. Функції: а) лінійна yt=a0+a1t

Поділіться з друзями або збережіть для себе:

Завантаження...