Коефіцієнт рангової кореляції спірмена онлайн-калькулятор. Застосування кореляції Спірмена та Пірсона

Коефіцієнт кореляції Пірсона

Коефіцієнт r-Пірсона застосовується вивчення взаємозв'язку двох метричних змінних, виміряних однією і тієї ж вибірці. Існує безліч ситуацій, у яких доречне його застосування. Чи впливає інтелект на успішність старших курсів університету? Чи пов'язаний розмір заробітної плати працівника із його доброзичливістю до колег? Чи впливає настрій школяра на успішність розв'язання складного арифметичного завдання? Для відповіді на такі питання дослідник повинен виміряти два показники, що його цікавлять, у кожного члена вибірки.

На величину коефіцієнта кореляції впливає те, у яких одиницях виміру представлені ознаки. Отже, будь-які лінійні перетворення ознак (множення на константу, додавання константи) не змінюють значення коефіцієнта кореляції. Винятком є ​​множення однієї з ознак негативну константу: коефіцієнт кореляції змінює свій знак на протилежний.

Застосування кореляції Спірмена та Пірсона.

Кореляція Пірсона є мірою лінійного зв'язку між двома змінними. Вона дозволяє визначити, наскільки пропорційна мінливість двох змінних. Якщо змінні пропорційні один одному, то графічно зв'язок між ними можна подати у вигляді прямої лінії з позитивним (пряма пропорція) або негативним (зворотна пропорція) нахилом.

На практиці зв'язок між двома змінними, якщо він є, є імовірнісним і графічно виглядає як хмара розсіювання еліпсоїдної форми. Цей еліпсоїд, однак, можна представити (апроксимувати) у вигляді прямої лінії, або лінії регресії. Лінія регресії – це пряма, побудована методом найменших квадратів: сума квадратів відстаней (обчислених по осі Y) від кожної точки графіка розсіювання до прямої є мінімальною.

Особливого значення для оцінки точності передбачення має дисперсія оцінок залежної змінної. По суті, дисперсія оцінок залежної змінної Y - це та частина її повної дисперсії, яка обумовлена ​​впливом незалежної змінної X. Інакше кажучи, відношення дисперсії оцінок залежної змінної до її істинної дисперсії дорівнює квадрату коефіцієнта кореляції.

Квадрат коефіцієнта кореляції залежної та незалежної змінних представляє частку дисперсії залежної змінної, обумовленої впливом незалежної змінної, і називається коефіцієнтом детермінації. Коефіцієнт детермінації, таким чином, показує, якою мірою мінливість однієї змінної обумовлена ​​(детермінована) впливом іншої змінної.

Коефіцієнт детермінації має важливу перевагу порівняно з коефіцієнтом кореляції. Кореляція не є лінійною функцією зв'язку між двома змінними. Тому, середнє арифметичне коефіцієнтів кореляції для кількох вибірок не збігається з кореляцією, обчисленою відразу всім випробовуваних із цих вибірок (тобто. коефіцієнт кореляції не аддитивний). Навпаки, коефіцієнт детермінації відбиває зв'язок лінійно і тому аддитивним: допускається його усереднення кількох вибірок.

Додаткову інформаціюпро силу зв'язку дає значення коефіцієнта кореляції у квадраті – коефіцієнт детермінації: це частина дисперсії однієї змінної, яка може бути пояснена впливом іншої змінної. На відміну від коефіцієнта кореляції, коефіцієнт детермінації лінійно зростає зі збільшенням сили зв'язку.

Коефіцієнти кореляції Спірмена та τ - Кендалла (рангові кореляції )

Якщо обидві змінні, між якими вивчається зв'язок, представлені у порядковій шкалі, або одна з них – у порядковій, а інша – у метричній, то застосовуються рангові коефіцієнтикореляції: Спірмена або τ - Кенделл. І той, і інший коефіцієнт вимагає для застосування попереднього ранжування обох змінних.

p align="justify"> Коефіцієнт рангової кореляції Спірмена - це непараметричний метод, який використовується з метою статистичного вивчення зв'язку між явищами. У цьому випадку визначається фактичний ступінь паралелізму між двома кількісними рядамиознак, що вивчаються, і дається оцінка тісноти встановленого зв'язку за допомогою кількісно вираженого коефіцієнта.

Якщо члени групи чисельністю були ранжировані спочатку змінною x, потім - змінною y, то кореляцію між змінними x і y можна отримати, просто обчисливши коефіцієнт Пірсона для двох рядів рангів. За умови відсутності зв'язків у рангах (тобто відсутності повторюваних рангів) по тій і іншій змінній, формула для Пірсона може бути спрощена в обчислювальному відношенні і перетворена на формулу, відому як Спірмена.

Потужність коефіцієнта рангової кореляції Спірмена дещо поступається потужністю параметричного коефіцієнта кореляції.

Коефіцієнт рангової кореляції доцільно застосовувати за наявності невеликої кількості спостережень. Даний метод може бути використаний не тільки для кількісно виражених даних, але також і у випадках, коли значення, що реєструються, визначаються описовими ознаками різної інтенсивності.

Коефіцієнт рангової кореляції Спірмена при великій кількості однакових рангів по одній або обох змінним, що зіставляється, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються.

Альтернативу кореляції Спірмена для рангів є кореляція τ - Кендалл. В основі кореляції, запропонованої М.Кендаллом, лежить ідея про те, що про напрям зв'язку можна судити, попарно порівнюючи між собою випробуваних: якщо у пари випробуваних зміна x збігається у напрямку зі зміною y, то це свідчить про позитивний зв'язок, якщо не збігається - то про негативний зв'язок.

Коефіцієнти кореляції були спеціально розроблені для чисельного визначення сили та напрями зв'язку між двома властивостями, виміряними у числових шкалах (метричних чи рангових). Як уже згадувалося, максимальній силі зв'язку відповідають значення кореляції +1 (суворий прямий або прямо пропорційний зв'язок) і -1 (суворий зворотний або обернено пропорційний зв'язок), відсутності зв'язку відповідає кореляція, що дорівнює нулю. Додаткову інформацію про силу зв'язку дає значення коефіцієнта детермінації: це частина дисперсії однієї змінної, яка може бути пояснена впливом іншої змінної.

9. Параметричні методипорівняння даних

Параметричні методи порівняння застосовуються у тому випадку, якщо ваші змінні були виміряні у метричній шкалі.

Порівняння дисперсій 2- х вибірок за критерієм Фішера .


Даний метод дозволяє перевірити гіпотезу про те, що дисперсії 2-х генеральних сукупностей, з яких вилучені порівнювані вибірки, відрізняються один від одного. Обмеження методу - розподілу ознаки обох вибірках нічого не винні відрізнятися від нормального.

Альтернативою порівняння дисперсій є критерій Лівена, для якого немає потреби у перевірці на нормальність розподілу. Даний метод може застосовуватися для перевірки припущення про рівність (гомогенність) дисперсій перед перевіркою достовірності відмінності середніх за критерієм Стьюдента для незалежних вибірок різної чисельності.

За наявності двох рядів значень, що піддаються ранжируванню, раціонально розраховувати рангову кореляцію Спірмена.

Такі ряди можуть бути:

  • парою ознак, що визначаються в одній і тій же групі об'єктів, що досліджуються;
  • парою індивідуальних супідрядних ознак, що визначаються у 2 досліджуваних об'єктів за однаковим набором ознак;
  • парою групових підпорядкованих ознак;
  • індивідуальною та груповою супідрядністю ознак.

Метод передбачає проведення ранжування показників окремо кожному за ознак.

Найменше значення має найменший ранг.

Цей метод відноситься до непараметричного статистичного методу, призначеному для встановлення існування зв'язку явищ, що вивчаються:

  • визначення фактичного ступеня паралелізму між двома рядами кількісних даних;
  • оцінка тісноти виявленого зв'язку, що виражається кількісно.

Кореляційний аналіз

Статистичний метод, призначений виявлення існування залежності між 2 і більше випадковими величинами(змінними), а також її сили, отримав назву кореляційного аналізу.

Отримав назву від correlatio (лат.) – співвідношення.

За його використання можливі варіанти розвитку подій:

  • наявність кореляції (позитивна чи негативна);
  • відсутність кореляції (нульова).

У разі встановлення залежності між змінними йдеться про їхнє корелювання. Іншими словами, можна сказати, що при зміні значення Х обов'язково буде спостерігатися пропорційна зміна значення У.

Як інструменти використовуються різні заходи зв'язку (коефіцієнти).

На їх вибір впливає:

  • спосіб виміру випадкових чисел;
  • характер зв'язку між випадковими числами.

Існування кореляційного зв'язку може відображатися графічно (графіки) та за допомогою коефіцієнта (числове відображення).

Кореляційний зв'язок характеризується такими ознаками:

  • сила зв'язку (при коефіцієнті кореляції від ±0,7 до ±1 – сильна; від ±0,3 до ±0,699 – середня; від 0 до ±0,299 – слабка);
  • напрямок зв'язку (прямий або зворотний).

Цілі кореляційного аналізу

Кореляційний аналіз не дозволяє встановити причинну залежність між змінними, що досліджуються.

Він проводиться з метою:

  • встановлення залежності між змінними;
  • отримання певної інформації про змінну на основі іншої змінної;
  • визначення тісноти (зв'язку) цієї залежності;
  • визначення напряму встановленого зв'язку.

Методи кореляційного аналізу


Даний аналізможе виконуватися з використанням:

  • методу квадратів чи Пірсона;
  • рангового методу чи Спірмена.

p align="justify"> Метод Пірсона застосовний для розрахунків що вимагають точного визначення сили, що існує між змінними. Досліджувані за його допомогою ознаки мають виражатися лише кількісно.

Для застосування методу Спірмена або рангової кореляції немає жорстких вимог у вираженні ознак – воно може бути як кількісним, так і атрибутивним. Завдяки цьому методу виходить інформація про точному встановленні сили зв'язку, а має орієнтовний характер.

У рядах змінних можуть бути відкриті варіанти. Наприклад, коли стаж роботи виражається такими значеннями як до 1 року, більше 5 років і т.д.

Коефіцієнт кореляції

Статистична величина, що характеризує характер зміни двох змінних, отримала назву коефіцієнта кореляції або парного коефіцієнтакореляції. У кількісному вираженні він коливається не більше від -1 до +1.

Найбільш поширені коефіцієнти:

  • Пірсона- Застосуємо для змінних належать до інтервальної шкали;
  • Спірмена- Для змінних порядкової шкали.

Обмеження використання коефіцієнта кореляції

Отримання недостовірних даних при розрахунку коефіцієнта кореляції можливе у випадках, коли:

  • у розпорядженні є достатня кількість значень змінної (25-100 пар спостережень);
  • між змінними, що вивчаються, встановлено, наприклад, квадратичне співвідношення, а не лінійне;
  • у кожному випадку дані містять більше одного спостереження;
  • наявність аномальних значень (викидів) змінних;
  • досліджувані дані складаються з чітко виділених підгруп спостережень;
  • наявність кореляційного зв'язку не дозволяє встановити яка зі змінних може розглядатися як причина, а яка – як слідство.

Перевірка значущості кореляції

Для оцінки статистичних величинвикористовується поняття їх значимості або достовірності, що характеризує ймовірність випадкового виникнення величини або крайніх її значень.

Найбільш поширеним методом визначення значущості кореляції є визначення критерію Стьюдента.

Його значення порівнюється з табличним, кількість ступенів свободи приймається як 2. При отриманні розрахункового значення критерію більше табличного свідчить про значущість коефіцієнта кореляції.

Під час проведення економічних розрахунків достатнім вважається довірчий рівень 0,05 (95%) чи 0,01 (99%).

Ранги Спірмена

Коефіцієнт рангової кореляції Спірмена дозволяє статистично встановити зв'язок між явищами. Його розрахунок передбачає встановлення кожної ознаки порядкового номера – рангу. Ранг може бути зростаючим чи спадним.

Кількість ознак, що піддаються ранжируванню, може бути будь-якою. Це досить трудомісткий процес, який обмежує їх кількість. Труднощі починаються при досягненні 20 ознак.

Для розрахунку коефіцієнта Спірмена користуються формулою:

в якій:

n – відображає кількість ранжованих ознак;

d – не що інше як різницю між рангами по двох змінних;

а ∑(d2) – сума квадратів різниці рангів.

Застосування кореляційного аналізу у психології

Статистичне супроводження психологічних дослідженьдозволяє зробити їх більш об'єктивними та високо репрезентативними. Статистична обробка даних, отриманих у ході психологічних експериментівсприяє вилученню максимуму корисної інформації.

Найбільш широке застосування у обробці їх результатів отримав кореляційний аналіз.

Доречним є проведення кореляційного аналізу результатів, отриманих під час проведення досліджень:

  • тривожності (за тестами R. Temml, M. Dorca, V. Amen);
  • сімейних взаємин («Аналіз сімейних взаємин» (АСВ) опитувальник Е.Г. Ейдеміллера, В.В. Юстіцкіса);
  • рівня інтернальності-екстернальності (опитувальник Е.Ф. Бажина, Є.А. Голинкіної та А.М. Еткінда);
  • рівня емоційного вигоряння у педагогів (опитувальник В.В. Бойко);
  • зв'язки елементів вербального інтелекту учнів під час різного профільного навчання (методика К.М. Гуревича та ін.);
  • зв'язку рівня емпатії (методика В.В. Бойка) та задоволеністю шлюбом (опитувальник В.В. Століна, Т.Л. Романової, Г.П. Бутенко);
  • зв'язки між соціометричним статусом підлітків (тест Jacob L. Moreno) та особливостями стилю сімейного виховання (опитувальник Е.Г. Ейдеміллера, В.В. Юстіцкіса);
  • структури життєвих цілей підлітків, вихованих у повних та неповних сім'ях (опитувальник Edward L. Deci, Richard M. Ryan Ryan).

Коротка інструкція щодо проведення кореляційного аналізу за критерієм Спірмена

Проведення кореляційного аналізу з використанням методу Спірмена виконується за наступним алгоритмом:

  • парні зіставні ознаки розташовуються в 2 ряди, один з яких позначається за допомогою Х, а інший;
  • значення низки Х розташовуються у порядку зростання чи спадання;
  • послідовність розташування значень ряду визначається їх відповідністю значень ряду Х;
  • для кожного значення в ряді Х визначити ранг - присвоїти порядковий номер від мінімального значення до максимального;
  • для кожного із значень у ряду У також визначити ранг (від мінімального до максимального);
  • обчислити різницю (D) між рангами Х і У, вдавшись до формули D=Х-У;
  • отримані значення різниці зводяться у квадрат;
  • виконати підсумовування квадратів різниць рангів;
  • виконати розрахунки за такою формулою:

Приклад кореляції Спірмена

Необхідно встановити наявність кореляційного зв'язку між робочим стажем та показником травматизму за наявності наступних даних:

Найбільш підходящим методом аналізу є ранговий метод, т.к. одна з ознак представлена ​​у вигляді відкритих варіантів: робочий стаж до 1 року та робочий стаж 7 і більше років.

Рішення завдання починається з ранжирування даних, які зводяться до робочої таблиці і може бути виконані вручну, т.к. їх обсяг невеликий:

Робочий стаж Число травм Порядкові номери (ранги) Різниця рангів Квадрат різниці рангів
d(х-у)
до 1 року 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 і більше 6 5 1 +4 16
Σ d2 = 38,5

Поява дробових рангів у колонці пов'язана з тим, що у разі появи варіант однакових за величиною перебуває середня арифметичне значеннярангу. У даному прикладі показник травматизму 12 зустрічається двічі і йому надаються ранги 2 і 3, знаходимо середнє арифметичне цих рангів (2+3)/2= 2,5 і поміщаємо це значення в робочу таблицю для 2 показників.
Виконавши підстановку отриманих значень у робочу формулу і здійснивши нескладні розрахунки отримуємо коефіцієнт Спірмена рівний -0,92

Негативне значення коефіцієнта свідчить про наявність зворотного зв'язку між ознаками та дозволяє стверджувати, що невеликий стаж роботи супроводжується більшим числомтравм. Причому сила зв'язку цих показників досить велика.
Наступним етапом розрахунків є визначення достовірності отриманого коефіцієнта:
розраховується його помилка та критерій Стьюдента

Дисципліна " вища математика " в деяких викликає неприйняття, оскільки воістину не всім дано зрозуміти. Але ті, кому пощастило вивчати цей предмет та вирішувати завдання, використовуючи різні рівняннята коефіцієнти, що можуть похвалитися практично повною в ній обізнаності. У психологічній науці існує не тільки гуманітарна спрямованість, Але й певні формули та способи для математичної перевірки висувається в ході досліджень гіпотези. Для цього застосовуються різні коефіцієнти.

Коефіцієнт кореляції Спірмена

Це поширений вимір щодо визначення тісноти зв'язку між якими-небудь двома ознаками. Коефіцієнт ще називають непараметричним методом. Він показує статистику зв'язку. Тобто ми знаємо, наприклад, що у дитини агресія та дратівливість пов'язані між собою, а коефіцієнт кореляції рангів Спірмена показує статистичну математичну зв'язок цих двох ознак.

Як обчислюється ранговий коефіцієнт?

Природно, що всім математичних визначень чи величин існують свої формули, якими вони обчислюються. Нею має і коефіцієнт кореляції Спірмена. Формула у нього така:

З першого погляду формула не зовсім зрозуміла, але, якщо розібратися, все дуже легко обчислюється:

  • n – це кількість ознак чи показників, які проранжовані.
  • d - різницю певних двох рангів, відповідних конкретним двом змінним кожного випробуваного.
  • ∑d 2 - сума всіх квадратів різниць рангів ознаки, квадрати яких обчислюються окремо кожному за рангу.

Область застосування математичного заходу зв'язку

Для застосування рангового коефіцієнта необхідно, щоб кількісні дані ознаки були проранжовані, тобто їм присвоєно певний номер залежно від місця, на якому розташована ознака, і від його значення. Доведено, що два ряди ознак, виражених у числовому вигляді, дещо паралельні між собою. Коефіцієнт рангової кореляції Спірмена визначає рівень цієї паралельності, тісноти зв'язку ознак.

Для математичної операції з розрахунку та визначення зв'язку ознак за допомогою зазначеного коефіцієнта потрібно зробити деякі дії:

  1. Кожному значенню будь-якого випробуваного чи явища присвоюється номер у порядку - ранг. Він може відповідати значенню явища за зростанням та за спаданням.
  2. Далі зіставляються ранги значення ознак двох кількісних рядів у тому, щоб визначити різницю між ними.
  3. В окремому стовпці таблиці кожної отриманої різниці прописується її квадрат, а внизу результати сумуються.
  4. Після цих дій застосовується формула, якою розраховується коефіцієнт кореляції Спірмена.

Властивості коефіцієнта кореляції

До основних властивостей коефіцієнта Спірмена відносять такі:

  • Вимірювання значень у межах від -1 до 1.
  • Знак коефіцієнта інтерпретацій немає.
  • Тіснота зв'язку визначається за принципом: що вище величина, то тісніше зв'язок.

Як перевірити отримане значення?

Для перевірки зв'язку ознак між собою необхідно виконати певні дії:

  1. Висувається нульова гіпотеза (H0), вона основна, потім формулюється інша, альтернативна першої (H 1). Перша гіпотеза полягатиме в тому, що коефіцієнт кореляції Спірмена дорівнює 0 - це означає, що зв'язку не буде. Друга, навпаки, говорить, що коефіцієнт не дорівнює 0, тоді зв'язок є.
  2. Наступною дією буде знаходження критерію, що спостерігається. Воно знаходиться за основною формулою коефіцієнта Спірмена.
  3. Далі є критичні значення заданого критерію. Це можна зробити лише за допомогою спеціальної таблиці, де відображаються різні значення за заданими показниками: рівень значущості (l) та число, що визначає (n).
  4. Тепер потрібно порівняти два отримані значення: встановленого спостережуваного, а також критичного. Для цього необхідно збудувати критичну область. Потрібно накреслити пряму лінію, на ній відзначити точки критичного значення коефіцієнта зі знаком "-" та зі знаком "+". Ліворуч і праворуч від критичних значень півколами від точок відкладаються критичні області. Посередині, поєднуючи два значення, відзначається півколом ОЗУ.
  5. Після цього робиться висновок про тісність зв'язку між двома ознаками.

Де краще використати цю величину

Найпершою наукою, де активно використовувався цей коефіцієнт, була психологія. Адже це наука, яка не ґрунтується на цифрах, проте для доказу будь-яких важливих гіпотез щодо розвитку відносин, рис характеру людей, знань студентів потрібно статистичне підтвердження висновків. Також його використовують в економіці, зокрема при валютних оборотах. Тут оцінюються ознаки без статистики. Дуже зручний коефіцієнт рангової кореляції Спірмена у цій галузі застосування тим, що оцінка проводиться незалежно від розподілу змінних, оскільки вони замінюються ранговим числом. Активно застосовується коефіцієнт Спірмена у банківській справі. Соціологія, політологія, демографія та інші науки також використовують його у своїх дослідженнях. Результати виходять швидко та максимально точно.

Зручно та швидко використовується коефіцієнт кореляції Спірмена в Excel. Тут є спеціальні функції, які допомагають швидко отримати необхідні значення.

Які ще коефіцієнти кореляції є?

Крім того, що ми дізналися про коефіцієнт кореляції Спірмена, існують різні кореляційні коефіцієнти, що дозволяють виміряти, оцінити якісні ознаки, зв'язок між кількісними ознаками, тісноту зв'язку між ними, представленими в ранговій шкалі. Це такі коефіцієнти, як бісеріальний, рангово-бісеріальний, контенгенції, асоціації тощо. Коефіцієнт Спірмена дуже точно показує тісноту зв'язку, на відміну від решти методів її математичного визначення.

Коефіцієнт рангової кореляції Спірмена - це непараметричний метод, який використовується з метою статистичного вивчення зв'язку між явищами. У цьому випадку визначається фактичний ступінь паралелізму між двома кількісними рядами ознак, що вивчаються, і дається оцінка тісноти встановленого зв'язку за допомогою кількісно вираженого коефіцієнта.

1. Історія розробки коефіцієнта рангової кореляції

Цей критерій було розроблено та запропоновано для проведення кореляційного аналізу у 1904 році Чарльзом Едвардом Спірменом, англійським психологом, професором Лондонського та Честерфілдського університетів.

2. Для чого використовується коефіцієнт Спірмена?

Коефіцієнт рангової кореляції Спірмена використовується для виявлення та оцінки тісноти зв'язку між двома рядами порівнянних кількісних показників. У тому випадку, якщо ранги показників, упорядкованих за ступенем зростання або спадання, в більшості випадків збігаються (більше значення одного показника відповідає більшому значенню іншого показника - наприклад, при зіставленні зростання пацієнта та його маси тіла), робиться висновок про наявність прямийкореляційного зв'язку. Якщо ранги показників мають протилежну спрямованість (великому значенню одного показника відповідає менше значення іншого - наприклад, при зіставленні віку та частоти серцевих скорочень), то говорять про зворотнійзв'язок між показниками.

    Коефіцієнт кореляції Спірмена має такі властивості:
  1. Коефіцієнт кореляції може набувати значення мінус одиниці до одиниці, причому при rs=1 має місце строго прямий зв'язок, а при rs= -1 – строго зворотний зв'язок.
  2. Якщо коефіцієнт кореляції негативний, має місце зворотний, якщо позитивний, то – прямий зв'язок.
  3. Якщо коефіцієнт кореляції дорівнює нулю, зв'язок між величинами практично відсутня.
  4. Чим ближче модуль коефіцієнта кореляції до одиниці, тим сильнішим є зв'язок між вимірюваними величинами.

3. У яких випадках можна використати коефіцієнт Спірмена?

У зв'язку з тим, що коефіцієнт є методом непараметричного аналізу, перевірка на нормальність розподілу не потрібна.

Порівняні показники можуть бути виміряні як у безперервній шкалі(наприклад, число еритроцитів в 1 мкл крові), так і порядковий(наприклад, бали експертної оцінкивід 1 до 5).

Ефективність та якість оцінки методом Спірмена знижується, якщо різниця між різними значеннямиякий-небудь із вимірюваних величин досить велика. Не рекомендується використовувати коефіцієнт Спірмена, якщо має місце нерівномірний розподіл значень вимірюваної величини.

4. Як розрахувати коефіцієнт Спірмена?

Розрахунок коефіцієнта рангової кореляції Спірмена включає такі етапи:

5. Як інтерпретувати значення коефіцієнта Спірмена?

При використанні коефіцієнта рангової кореляції умовно оцінюють тісноту зв'язку між ознаками, вважаючи значення коефіцієнта рівні 0,3 і менше показниками слабкої тісноти зв'язку; значення більше 0,4, але менше 0,7 – показниками помірної тісноти зв'язку, а значення 0,7 і більше – показниками високої тісноти зв'язку.

Статистична значимість отриманого коефіцієнта оцінюється з допомогою t-критерію Стьюдента. Якщо розраховане значення t-критерію менше табличного при заданій кількості ступенів свободи, статистична значимістьспостережуваного взаємозв'язку - відсутня. Якщо більше, то кореляційний зв'язок вважається статистично значущим.

Насправді визначення тісноти зв'язку двох ознак часто застосовується коефіцієнт рангової кореляції Спірмена (Р). Значення кожної ознаки ранжуються за ступенем зростання (від 1 до n), потім визначається різниця (d) між рангами, що відповідають одному спостереженню.

Приклад №1. Залежність між обсягом промислової продукції та інвестиціями в основний капітал по 10 областях одного з федеральних округів РФ у 2003 році характеризується такими даними.
Обчисліть рангові коефіцієнти кореляції Спірменаі Кендела. Перевірити їх значення при α=0,05. Сформулюйте висновок про залежність між обсягом промислової продукції і на інвестиціями в основний капітал по аналізованим областям РФ.

Надамо ранги ознакою Y і фактору X . Знайдемо суму різниці квадратів d 2 .
Використовуючи калькулятор, обчислимо коефіцієнт рангової кореляції Спірмена:

X Y ранг X, d x ранг Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Зв'язок між ознакою Y фактором X сильний і прямий.

Оцінка коефіцієнта рангової кореляції Спірмена



По таблиці Стьюдента знаходимо Tтабл.
T табл = (18; 0.05) = 1.734
Оскільки Tнабл > Tтабл, то відхиляємо гіпотезу про рівність нулю коефіцієнта рангової кореляції. Інакше кажучи, коефіцієнта рангової кореляції Спірмена статистично - значущий.

Інтервальна оцінка для коефіцієнта рангової кореляції (довірчий інтервал)
Довірчий інтервал для коефіцієнта рангової кореляції Спірмена: p (0.5431; 0.9095).

Приклад №2. Початкові дані.

5 4
3 4
1 3
3 1
6 6
2 2
Так як у матриці є пов'язані ранги (однаковий ранговий номер) 1-го ряду, зробимо їх переформування. Переформування рангів здійснюватиметься без зміни важливості рангу, тобто між ранговими номерами повинні зберегтися відповідні співвідношення (більше, менше або рівно). Також не рекомендується ставити ранг вище 1 і нижче значення, що дорівнює кількості параметрів (в даному випадку n = 6). Переформування рангів провадиться в табл.
Нові ранги
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Так як у матриці є пов'язані ранги 2-го ряду, зробимо їх переформування. Переформування рангів провадиться в табл.
Номери місць у впорядкованому рядіРозташування факторів оцінки експертаНові ранги
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Матриця рангів.
ранг X, d xранг Y, d y(d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Оскільки серед значень ознак х і зустрічається кілька однакових, тобто. утворюються пов'язані ранги, то у такому разі коефіцієнт Спірмена обчислюється як:

де


j – номери зв'язок по порядку для ознаки х;
А j - число однакових рангів у j-й зв'язці х;
k – номери зв'язок по порядку для ознаки у;
У k - число однакових рангів k-й зв'язціза у.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

Зв'язок між ознакою Y та фактором X помірна та пряма.
Поділіться з друзями або збережіть для себе:

Завантаження...