Формула рангової кореляції. Приклад знаходження коефіцієнта рангової кореляції спірмена

- це кількісна оцінкастатистичного вивчення зв'язку між явищами, що використовується у непараметричних методах.

Показник показує, як відрізняється отримана під час спостереження сума квадратів різниць між рангами від відсутності зв'язку.

Призначення сервісу. За допомогою цього онлайн-калькулятора проводиться:

Коефіцієнт рангової кореляції Спірменавідноситься до показників оцінки тісноти зв'язку. Якісну характеристику тісноти зв'язку коефіцієнта рангової кореляції, як та інших коефіцієнтів кореляції, можна оцінити за шкалою Чеддока.

Розрахунок коефіцієнтаскладається з наступних етапів:

Властивості коефіцієнта рангової кореляції Спірмена

Галузь застосування. Коефіцієнт кореляції рангіввикористовується з метою оцінки якості зв'язку між двома сукупностями. Крім цього, його статистична значимістьзастосовується при аналізі даних на гетероскедастичність.

Приклад. За вибіркою даних змінних X і Y, що спостерігаються:

  1. скласти рангову таблицю;
  2. знайти коефіцієнт рангової кореляції Спірмена та перевірити його значущість на рівні 2a
  3. оцінити характер залежності
Рішення. Надамо ранги ознакою Y і фактору X .
XYранг X, d xранг Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Матриця рангів.
ранг X, d xранг Y, d y(d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Перевірка правильності складання матриці на основі обчислення контрольної суми:

Сума по стовпчиках матриці рівні між собою та контрольної суми, отже, матриця складена правильно.
За формулою обчислимо коефіцієнт рангової кореляції Спірмена.


Зв'язок між ознакою Y та фактором X сильний і прямий
Значення коефіцієнта рангової кореляції Спірмена
Для того щоб при рівні значущості α перевірити нульову гіпотезу про рівність нулю генерального коефіцієнта рангової кореляції Спірмена при гіпотезі конкуруючої H i . p ≠ 0, треба обчислити критичну точку:

де n – обсяг вибірки; ρ – вибірковий коефіцієнт рангової кореляції Спірмена: t(α, к) – критична точка двосторонньої критичної області, яку знаходять за таблицею критичних точокрозподілу Стьюдента, за рівнем значущості α та числом ступенів свободи k = n-2.
Якщо |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp – нульову гіпотезу відкидають. Між якісними ознаками існує значний ранговий кореляційний зв'язок.
За таблицею Стьюдента знаходимо t(α/2, k) = (0.1/2; 12) = 1.782

Оскільки T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Призначення рангового коефіцієнта кореляції

Метод рангової кореляції Спірмена дозволяє визначити тісноту (силу) та напрямок кореляційного зв'язку між двома ознакамиабо двома профілями (ієрархіями)ознак.

Опис методу

Для підрахунку рангової кореляції необхідно розташовувати двома рядами значень, які можна проранжированы. Такими рядами значень можуть бути:

1) дві ознаки,виміряні в одній і тій же групі випробуваних;

2) дві індивідуальні ієрархії ознак,виявлені у двох піддослідних за одним і тим самим набором ознак (наприклад, особистісні профілі за 16-факторним опитувальником Р. Б. Кеттелла, ієрархії цінностей за методикою Р. Рокіча, послідовності переваг у виборі з кількох альтернатив та ін.);

3) дві групові ієрархії ознак;

4) індивідуальна та груповаієрархії ознак.

Спочатку показники ранжуються окремо за кожною ознакою. Як правило, меншим значенням ознаки нараховується менший ранг.

Розглянемо випадок 1 (дві ознаки).Тут ранжуються індивідуальні значення за першою ознакою, отримані різними випробуваними, а потім індивідуальні значення за другою ознакою.

Якщо дві ознаки пов'язані позитивно, то випробувані, що мають низькі ранги по одному з них, матимуть низькі ранги та за іншою, а випробувані, що мають високі ранги за однією з ознак, матимуть за іншою ознакою також високі ранги. Для підрахунку r s необхідно визначити різниці (d) між рангами, отриманими даним випробуваним за обома ознаками. Потім ці показники d певним чином перетворюються і віднімаються з 1. Чим менше різниці між рангами, тим більше буде r s тим ближче він буде до +1.

Якщо кореляція відсутня, то всі ранги будуть перемішані і між ними не буде відповідності. Формула складена так, що в цьому випадку r s, Виявиться близьким до 0.

У разі негативної кореляції низьким рангам випробуваних за однією ознакою відповідатимуть високі ранги за іншою ознакою, і навпаки.

Чим більший розбіжність між рангами випробуваних за двома змінними, тим ближче r s до -1.

Розглянемо випадок 2 (два індивідуальні профілі).Тут ранжуються індивідуальні значення, отримані кожним із 2-х випробуваним за певним (однаковим їм обох) набору ознак. Перший ранг отримає ознаку з найнижчим значенням; другий ранг - ознака з вищим значенням тощо. Очевидно, що всі ознаки повинні бути виміряні в тих самих одиницях, інакше ранжування неможливо. Наприклад, неможливо проранжувати показники по опитувальнику Кеттелла (16) PF), якщо вони виражені в "сирих" балах, оскільки за різними факторами діапазони значень різні: від 0 до 13, від 0 до 20 і від 0 до 26. Ми не можемо сказати, який з факторів займатиме перше місце за виразністю, поки не наведемо всі значення до єдиної шкали (найчастіше це шкала стін).

Якщо індивідуальні ієрархії двох піддослідних пов'язані позитивно, то ознаки, що мають низькі ранги в одного з них, матимуть низькі ранги і в іншого, і навпаки. Наприклад, якщо в одного випробуваного фактор Е (домінантність) має найнижчий ранг, то в іншого випробуваного він повинен мати низький ранг, якщо в одного випробуваного фактор С (емоційна стійкість) має вищий ранг, то й інший випробуваний повинен мати за цим фактором високий ранг і т.д.

Розглянемо випадок 3 (два групові профілі).Тут ранжуються середньогрупові значення, отримані в 2-х групах випробуваних за певним, однаковим для двох груп, набором ознак. Надалі лінія міркувань така сама, як і в попередніх двох випадках.

Розглянемо випадок 4 (індивідуальний та груповий профілі).Тут ранжуються окремо індивідуальні значення випробуваного і среднегрупповые значення з тієї ж набору ознак, які отримані, зазвичай, крім цього окремого випробуваного - він бере участь у среднегрупповом профілі, з яким зіставлятиметься його індивідуальний профіль. Рангова кореляція дозволить перевірити, наскільки узгоджено індивідуальний та груповий профілі.

У всіх чотирьох випадках значимість отриманого коефіцієнта кореляції визначається за кількістю ранжованих значень N.У першому випадку ця кількість співпадатиме з обсягом вибірки п. У другому випадку кількістю спостережень буде кількість ознак, що становлять ієрархію. У третьому та четвертому випадку N -це також кількість зіставних ознак, а не кількість випробуваних у групах. Детальні пояснення наведено в прикладах.

Якщо абсолютна величина r s досягає критичного значення або перевищує його, кореляція є достовірною.

Гіпотези

Можливі два варіанти гіпотез. Перший відноситься до випадку 1, другий - до трьох інших випадків.

Перший варіант гіпотез

H 0: Кореляція між змінними А та Б не відрізняється від нуля.

H 1: Кореляція між змінними А та Б достовірно відрізняється від нуля.

Другий варіант гіпотез

H 0: Кореляція між ієрархіями А та Б не відрізняється від нуля.

H 1: Кореляція між ієрархіями А та Б достовірно відрізняється від нуля.

Графічне подання методу рангової кореляції

Найчастіше кореляційний зв'язок представляють графічно як хмари точок чи вигляді ліній, що відбивають загальну тенденцію розміщення точок у просторі двох осей: осі ознаки А і ознаки Б (див. рис. 6.2).

Спробуємо зобразити рангову кореляцію як двох рядів ранжованих значень, які попарно з'єднані лініями (Рис. 6.3). Якщо ранги за ознакою А і за ознакою Б збігаються, між ними виявляється горизонтальна лінія, якщо ранги не збігаються, то лінія стає похилою. Чим більше розбіжність рангів, тим похилішою стає лінія. Ліворуч на Мал. 6.3 відображена максимально висока позитивна кореляція (r = +1,0) - практично це "сходи". У центрі відображено нульову кореляцію - плетінку з неправильними переплетеннями. Усі ранги тут переплутані. Праворуч відображено максимально високу негативну кореляцію (r s =-1,0) - павутина з правильним переплетенням ліній.

Рис. 6.3. Графічне подання рангової кореляції:

а) висока позитивна кореляція;

б) нульова кореляція;

в) висока негативна кореляція

Обмеженнякоефіцієнта ранговоїкореляції

1. По кожній змінній має бути представлено не менше 5 спостережень. Верхня межа вибірки визначається наявними таблицями критичних значень (табл. XVI додатка 1), а саме N40.

2. Коефіцієнт рангової кореляції Спірмена r s при великій кількості однакових рангів по одній або обох змінних, що зіставляються, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються. У разі, якщо цієї умови не дотримується, необхідно вносити поправку на однакові ранги. Відповідна формула наведена в прикладі 4.

Приклад 1 – кореляціяміж двомаознаками

У дослідженні, що моделює діяльність авіадиспетчера (Одеришев Б.С., Шамова Є.П., Сидоренко Є.В., Ларченко Н.М., 1978), група піддослідних, студентів фізичного факультету ЛДУ проходила підготовку перед початком роботи на тренажері. Випробувані повинні були вирішувати завдання щодо вибору оптимального типу злітно-посадкової смуги для заданого типу літака. Чи пов'язана кількість помилок, допущених випробуваними у тренувальній сесії, з показниками вербального та невербального інтелекту, виміряними за методикою Д. Векслера?

Таблиця 6.1

Показники кількості помилок у тренувальній сесії та показники рівня вербального та невербального інтелекту у студентів-фізиків (N=10)

Випробуваний

Кількість помилок

Показник вербального інтелекту

Показник невербального інтелекту

Спочатку спробуємо відповісти на питання, чи пов'язані між собою показники кількості помилок та вербального інтелекту.

Сформулюємо гіпотези.

H 0: Кореляція між показником кількості помилок у тренувальній сесії та рівнем вербального інтелекту не відрізняється від нуля.

H 1 : Кореляція між показником кількості помилок у тренувальній сесії та рівнем вербального інтелекту статистично значуще відрізняється від нуля.

Далі нам необхідно проранжувати обидва показники, приписуючи меншому значенню менший ранг, потім підрахувати різниці між рангами, які отримав кожен випробуваний за двома змінними (ознаками), і звести ці різниці у квадрат. Зробимо всі необхідні розрахунки у таблиці.

У Табл. 6.2 у першій колонці зліва представлені значення за показником кількості помилок; у наступній колонці – їх ранги. У третій колонці зліва представлені значення за показником вербального інтелекту; у наступному стовпці – їх ранги. У п'ятому зліва представлені різниці d між рангом за змінною А (кількість помилок) та змінною Б (вербальний інтелект). В останньому стовпці представлені квадрати різниць d 2 .

Таблиця 6.2

Розрахунок d 2 для рангового коефіцієнта кореляції Спірмена r s при зіставленні показників кількості помилок та вербального інтелекту у студентів-фізиків (N=10)

Випробуваний

Змінна А

кількість помилок

Змінна Б

вербальний інтелект.

d (ранг А -

J 2

Індивідуальні

значення

Індивідуальні

значення

Коефіцієнт рангової кореляції Спірмена підраховується за такою формулою:

де d - різницю між рангами за двома змінними для кожного випробуваного;

N -кількість ранжованих значень, ст. даному випадку кількість випробуваних.

Розрахуємо емпіричне значення r s:

Отримане емпіричне значення г s близько до 0. І все ж визначимо критичні значення r s при N = 10 Табл. XVI Додатки 1:

Відповідь: H0 приймається. Кореляція між показником кількості помилок у тренувальній сесії та рівнем вербального інтелекту не відрізняється від нуля.

Тепер спробуємо відповісти на питання, чи пов'язані між собою показники кількості помилок та невербального інтелекту.

Сформулюємо гіпотези.

H 0: Кореляція між показником кількості помилок у тренувальній сесії та рівнем невербального інтелекту не відрізняється від 0.

H 1: Кореляція між показником кількості помилок у тренувальній сесії та рівнем невербального інтелекту статистично значуще відрізняється від 0.

Результати ранжування та зіставлення рангів представлені в Табл. 6.3.

Таблиця 6.3

Розрахунок d 2 для рангового коефіцієнта кореляції Спірмена r s при зіставленні показників кількості помилок та невербального інтелекту у студентів-фізиків (N=10)

Випробуваний

Змінна А

кількість помилок

Змінна Е

невербальний інтелект

d (ранг А -

d 2

Індивідуальні

Індивідуальні

значення

значення

Ми пам'ятаємо, що для визначення значущості r s не має значення, чи є він позитивним чи негативним, важлива лише його абсолютна величина. В даному випадку:

r s емп

Відповідь: H0 приймається. Кореляція між показником кількості помилок у тренувальній сесії та рівнем невербального інтелекту випадкова, r s не відрізняється від 0.

Водночас ми можемо звернути увагу на певну тенденцію негативноюзв'язки між цими двома змінними. Можливо, ми змогли б підтвердити її на статистично значущому рівні, якби збільшили обсяг вибірки.

Приклад 2 – кореляція між індивідуальними профілями

У дослідженні, присвяченому проблемам ціннісної реорієнтації, виявлялися ієрархії термінальних цінностей за методикою М. Рокіча у батьків та їх дорослих дітей (Сидоренко Є.В., 1996). Ранги термінальних цінностей, отримані під час обстеження пари мати-дочка (матері – 66 років, дочки – 42 роки) представлені в Табл. 6.4. Спробуємо визначити, як ці ціннісні ієрархії корелюють одна з одною.

Таблиця 6.4

Ранги термінальних цінностей за списком М.Рокича в індивідуальних ієрархіях матері та дочки

Термінальні цінності

Ранг цінностей у

Ранг цінностей у

d 2

ієрархії матері

ієрархії дочки

1 Активне діяльне життя

2 Життєва мудрість

3 Здоров'я

4 Цікава робота

5 Краса природи та мистецтво

7 Матеріально забезпечене життя

8 Наявність добрих і вірних друзів

9 Суспільне визнання

10 Пізнання

11 Продуктивна життя

12 Розвиток

13 Розваги

14 Свобода

15 Щасливе сімейне життя

16 Щастя інших

17 Творчість

18 Впевненість у собі

Сформулюємо гіпотези.

H 0: Кореляція між ієрархіями термінальних цінностей матері та дочки не відрізняється від нуля.

H 1: Кореляція між ієрархіями термінальних цінностей матері та дочки статистично значно відрізняється від нуля.

Оскільки ранжування цінностей передбачається процедурою дослідження, нам залишається лише підрахувати різниці між рангами 18 цінностей у двох ієрархіях. У 3-му та 4-му стовпцях Табл. 6.4 представлені різниці d і квадрати цих різниць d 2 .

Визначаємо емпіричне значення r s за такою формулою:

де d - різниці між рангами по кожній із змінних, у даному випадку щодо кожної з термінальних цінностей;

N- кількість змінних, які утворюють ієрархію, у разі кількість цінностей.

Для цього прикладу:

По Табл. XVI Додатки 1 визначаємо критичні значення:

Відповідь: H0 відкидається. Приймається H1. Кореляція між ієрархіями термінальних цінностей матері та дочки статистично значуща (р<0,01) и является положительной.

За даними Табл. 6.4 ми можемо визначити, що основні розбіжності припадають на цінності "Щасливе сімейне життя", "Громадське визнання" та "Здоров'я", ранги інших цінностей досить близькі.

Приклад 3 – кореляція між двома груповими ієрархіями

Джозеф Вольпе в книзі, написаній спільно з сином (Wolpe J., Wolpe D., 1981) наводить впорядкований перелік з найбільш часто зустрічаються у сучасної людини "некорисних", за його позначенням, страхів, які не несуть сигнального значення і лише заважають повноцінно жити та діяти. У вітчизняному дослідженні, проведеному М.Е. Раховий (1994) 32 піддослідних мали за 10-бальною шкалою оцінити, наскільки актуальним їм є той чи інший вид страху з переліку Вольпе 3 . Обстежена вибірка складалася зі студентів Гідрометеорологічного та Педагогічного інститутів Санкт-Петербурга: 15 юнаків та 17 дівчат віком від 17 до 28 років, середній вік 23 роки.

Дані, отримані за 10-бальною шкалою, були усереднені за 32 випробуваними, і середні проранжовані. У Табл. 6.5 представлені рангові показники, отримані Дж. Вольпе та М. Е. Рахової. Чи збігаються рангові послідовності 20 видів страху?

Сформулюємо гіпотези.

H 0: Кореляція між упорядкованими переліками видів страху в американській та вітчизняних вибірках не відрізняється від нуля.

H 1: Кореляція між упорядкованими переліками видів страху в американській та вітчизняній вибірках статистично значно відрізняється від нуля.

Всі розрахунки, пов'язані з обчисленням та зведенням у квадрат різниць між рангами різних видів страху у двох вибірках, представлені в Табл. 6.5.

Таблиця 6.5

Розрахунок d для рангового коефіцієнта кореляції Спірмена при зіставленні впорядкованих переліків видів страху в американській та вітчизняній вибірках

Види страху

Ранг в американській вибірці

Ранг у російській

Страх публічного виступу

Страх польоту

Страх зробити помилку

Страх невдачі

Страх несхвалення

Страх відкидання

Страх злих людей

Страх самотності

Страх крові

Страх відкритих ран

Страх дантиста

Страх уколів

Страх проходження тестів

Страх поліції міліції)

Страх висоти

Страх собак

Страх павуків

Страх скалічених людей

Страх лікарень

Страх темряви

Визначаємо емпіричне значення r s:

По Табл. XVI Додатка 1 визначаємо критичні значення г s при N=20:

Відповідь: H0 приймається. Кореляція між упорядкованими переліками видів страху в американській та вітчизняній вибірках не досягає рівня статистичної значущості, тобто значуще не відрізняється від нуля.

Приклад 4 - кореляція між індивідуальним та середньогруповим профілями

Вибірці петербуржців віком від 20 до 78 років (31 чоловік, 46 жінок), врівноваженою за віком таким чином, що особи віком від 55 років становили в ній 50% 4 , пропонувалося відповісти на запитання: "Який рівень розвитку кожного з наведених нижче якостей необхідний для депутата Міських зборів Санкт-Петербурга? (Сидоренко Є.В., Дерманова І.Б., Анісімова О.М., Вітенберг Є.В., Шульга А.П., 1994). Оцінка проводилася за 10-бальною шкалою. Паралельно з цим обстежувалася вибірка з депутатів та кандидатів у депутати до Міських зборів Санкт-Петербурга (n=14). Індивідуальна діагностика політичних діячів та претендентів проводилася за допомогою Оксфордської системи експрес-відеодіагностики за тим же набором особистісних якостей, що вибиралися виборцям.

У Табл. 6.6 представлені середні значення, отримані для кожного з якостей ввибірці виборців ("еталонний ряд") та індивідуальні значення одного з депутатів Міських зборів.

Спробуємо визначити, наскільки індивідуальний профіль депутата К-ва корелює з еталонним профілем.

Таблиця 6.6

Усереднені еталонні оцінки виборців (п=77) та індивідуальні показники депутата К-ва за 18 особистісними якостями експрес-відеодіагностики

Найменування якості

Усереднені еталонні оцінки виборців

Індивідуальні показники депутата К-ва

1. Загальний рівень культури

2. Навчання

4. Здатність до творчості нового

5.. Самокритичність

6. Відповідальність

7. Самостійність

8. Енергія, активність

9. Цілеспрямованість

10. Витримка, самовладання

І. Стійкість

12. Особистісна зрілість

13. Порядність

14. Гуманізм

15. Вміння спілкуватися з людьми

16. Терпимість до чужої думки

17. Гнучкість поведінки

18. Здатність справляти сприятливе враження

Таблиця 6.7

Розрахунок d 2 для рангового коефіцієнта кореляції Спірмена між еталонним та індивідуальним профілями особистісних якостей депутата

Найменування якості

ранг якості в еталонному профілі

Ряд 2: ранг якості в індивідуальному профілі

d 2

1 Відповідальність

2 Порядність

3 Вміння спілкуватися з людьми

4 Витримка, самовладання

5 Загальний рівень культури

6 Енергія, активність

8 Самокритичність

9 Самостійність

10 Особистісна зрілість

І Цілеспрямованість

12 Навчання

13 Гуманізм

14 Терпимість до чужої думки

15 Стійкість

16 Гнучкість поведінки

17 Здатність справляти сприятливе враження

18 Здатність до творчості нового

Як видно з табл. 6.6, оцінки виборців та індивідуальні показники депутата варіюють у різних діапазонах. Дійсно оцінки виборців були отримані за 10-бальною шкалою, а індивідуальні показники з експрес-відеодіагностики вимірюються за 20-бальною шкалою. Ранжування дозволяє нам перевести обидві шкали виміру в єдину шкалу, де одиницею виміру буде 1 ранг, а максимальне значення становитиме 18 рангів.

Ранжування, як ми пам'ятаємо, необхідно зробити окремо по кожному ряду значень. В даному випадку доцільно нараховувати більшому значенню менший ранг, щоб одразу можна було побачити, на якому місці за значимістю (для виборців) або за виразністю (у депутата) є та чи інша якість.

Результати ранжирування представлені в Табл. 6.7. Якості перераховані у послідовності, що відображає еталонний профіль.

Сформулюємо гіпотези.

H 0: Кореляція між індивідуальним профілем депутата К-ва та еталонним профілем, побудованим за оцінками виборців, не відрізняється від нуля.

H 1: Кореляція між індивідуальним профілем депутата К-ва та еталонним профілем, побудованим за оцінками виборців, статистично значно відрізняється від нуля. Оскільки в обох порівнюваних рангових рядах присутні

групи однакових рангів, перед підрахунком коефіцієнта рангової

кореляції необхідно внести поправки на однакові ранги Та і Т b :

де а -обсяг кожної групи однакових рангів у ранговому ряду А,

b - обсяг кожної групи однакових рангів у ранговому ряду Ст.

В даному випадку, в ряду А (еталонний профіль) присутня одна група однакових рангів - якості "навчування" і "гуманізм" мають один і той же ранг 12,5; отже, а=2.

T а = (23-2) / 12 = 0,50.

У ряду В (індивідуальний профіль) є дві групи однакових рангів, при цьому b 1 =2 і b 2 =2.

Ta =[(2 3 -2)+(2 3 -2)]/12=1,00

Для підрахунку емпіричного значення rs використовуємо формулу

В даному випадку:

Зауважимо, що якби поправка на однакові ранги нами не вносилася, то величина r s була б лише (на 0,0002) вище:

При великих кількостях однакових рангів зміни г 5 можуть виявитися значно суттєвішими. Наявність однакових рангів означає менший ступінь диференційованого упорядкованих змінних і, отже, меншу можливість оцінити ступінь зв'язку між ними (Суходольський Г.В., 1972, с.76).

По Табл. XVI Додатка 1 визначаємо критичні значення г, при N=18:

Відповідь: Hq відкидається. Кореляція між індивідуальним профілем депутата К-ва та еталонним профілем, що відповідає вимогам виборців, статистично значуща (р<0,05) и является положи­тельной.

З Табл. 6.7 видно, що депутат К-в має нижчий ранг за шкалами Вміння спілкуватися з людьми і більш високі ранги за шкалами цілеспрямованості та стійкості, ніж це передбачається виборним еталоном. Цими розбіжностями, головним чином, пояснюється деяке зниження отриманого r s .

Сформулюємо загальний алгоритм підрахунку rs.

Коефіцієнт кореляції рангів, запропонований К. Спірменом, відноситься до непараметричних показників зв'язку між змінними, виміряними в ранговій шкалі. При розрахунку цього коефіцієнта не потрібно ніяких припущень про характер розподілу ознак у генеральній сукупності. Цей коефіцієнт визначає ступінь тісноти зв'язку порядкових ознак, які у разі є ранги порівнюваних величин.

Величина коефіцієнта кореляції Спірмена лежить в інтервалі +1 і -1. Він, як і коефіцієнт Пірсона, може бути позитивним та негативним, характеризуючи спрямованість зв'язку між двома ознаками, виміряними у ранговій шкалі.

У принципі число ранжируемых ознак (якостей, чорт тощо.) може бути будь-яким, але процес ранжирування більшого, ніж 20 числа ознак - скрутний. Можливо, що саме тому таблиця критичних значень рангового коефіцієнта кореляції розрахована лише сорока ранжируемых ознак (n< 40, табл. 20 приложения 6).

Ранговий коефіцієнт кореляції Спірмена підраховується за такою формулою:

де n - кількість ранжованих ознак (показників, випробуваних);

D - різниця між рангами по двох змінних для кожного випробуваного;

Сума квадратів різниць рангів.

Використовуючи ранговий коефіцієнт кореляції, розглянемо такий приклад.

приклад: Психолог з'ясовує, як пов'язані між собою індивідуальні показники готовності до школи, отримані до початку навчання у школі у 11 першокласників та їхня середня успішність наприкінці навчального року.

Для вирішення цього завдання було проранжовано, по-перше, значення показників шкільної готовності, отримані під час вступу до школи, і, по-друге, підсумкові показники успішності наприкінці року в цих учнів у середньому. Результати представимо в табл. 13.

Таблиця 13

№ учнів

Ранги показників шкільної готовності

Ранги середньорічної успішності

Підставляємо отримані дані у формулу та проводимо розрахунок. Отримуємо:

Для знаходження рівня значущості звертаємось до табл. 20 додатка 6, в якій наведено критичні значення коефіцієнтів рангової кореляції.

Підкреслимо, що у табл. 20 додатка 6, як і таблиці для лінійної кореляції Пірсона, всі величини коефіцієнтів кореляції дані по абсолютній величині. Тому, знак коефіцієнта кореляції враховується лише за його інтерпретації.

Знаходження рівнів значимості у цій таблиці здійснюється за кількістю n, т. е. за кількістю піддослідних. У нашому випадку n = 11. Для цього числа знаходимо:

0,61 для P 0,05

0,76 для P 0,01

Будуємо відповідну ``вісь значущості'':

Отриманий коефіцієнт кореляції збігся з критичним значенням рівня значимості в 1%. Отже, можна стверджувати, що показники шкільної готовності та підсумкові оцінки першокласників пов'язані позитивною кореляційною залежністю - інакше кажучи, чим вищий показник шкільної готовності, тим краще навчається першокласник. У термінах статистичних гіпотез психолог повинен відхилити нульову (Нгіпотезу про подібність і прийняти альтернативну (Але наявності відмінностей, яка говорить про те, що зв'язок між показниками шкільної готовності та середньою успішністю відрізняється від нуля).

Випадок однакових (рівних) рангів

За наявності однакових рангів формула розрахунку коефіцієнта лінійної кореляції Спірмена буде дещо іншою. У цьому випадку до формули обчислення коефіцієнтів кореляції додаються два нових члени, що враховують однакові ранги. Вони називаються поправками на однакові ранги і додаються до чисельника розрахункової формули.

де n - число однакових рангів у першому стовпці,

k – число однакових рангів у другому стовпці.

Якщо є дві групи однакових рангів, у якомусь стовпці то формула поправки дещо ускладнюється:

де n - число однакових рангів у першій групі стовпця, що ранжується,

k - число однакових рангів у другій групі стовпця, що ранжується. Модифікація формули у випадку така:

приклад: Психолог, використовуючи тест розумового розвитку (ШТУР) проводить дослідження інтелекту у 12 учнів 9 класу. Поруч із, але вимагає вчителів літератури і математики провести ранжування цих учнів за показниками розумового розвитку. Завдання полягає в тому, щоб визначити, як пов'язані між собою об'єктивні показники розумового розвитку (дані ШТУРу) та експертні оцінки вчителів.

Експериментальні дані цієї задачі та додаткові стовпці, необхідні для розрахунку коефіцієнта кореляції Спірмена, представимо у вигляді табл. 14.

Таблиця 14

№ учнів

Ранги тестування за допомогою ШТУРу

Експертні оцінки вчителів з математики

Експертні оцінки вчителів з літератури

D (другого та третього стовпців)

D (другого та четвертого стовпців)

(другого та третього стовпців)

(другого та четвертого стовпців)

Оскільки при ранжируванні використовувалися однакові ранги, необхідно перевірити правильність ранжирування у другому, третьому і четвертому стовпцях таблиці. Підсумовування у кожному з цих стовпців дає однакову суму - 78.

Перевіряємо за розрахунковою формулою. Перевірка дає:

У п'ятому та шостому стовпцях таблиці наведено величини різниці рангів між експертними оцінками психолога за тестом ШТУР для кожного учня та величинами експертних оцінок вчителів, відповідно до математики та літератури. Сума величин різниць рангів повинна дорівнювати нулю. Підсумовування величин D в п'ятому і шостому стовпцях дало результат. Отже, віднімання рангів проведено правильно. Подібну перевірку необхідно робити щоразу під час проведення складних видів ранжування.

Перш ніж розпочати розрахунок за формулою, необхідно розрахувати поправки на однакові ранги для другого, третього і четвертого стовпців таблиці.

У нашому випадку у другому стовпці таблиці два однакові ранги, отже, за формулою величина поправки D1 ​​буде:

У третьому стовпці три однакові ранги, отже, за формулою величина поправки D2 буде:

У четвертому стовпці таблиці дві групи по три однакові ранги, отже, за формулою величина поправки D3 буде:

Перш, ніж почати вирішення завдання, нагадаємо, що психолог з'ясовує два питання - як пов'язані величини рангів за тестом ШТУР з експертними оцінками з математики та літератури. Саме тому розрахунок проводиться двічі.

Вважаємо перший ранговий коефіцієнт з урахуванням добавок за формулою. Отримуємо:

Підрахуємо без урахування добавки:

Як бачимо, різниця у величинах коефіцієнтів кореляції виявилася дуже незначною.

Вважаємо другий ранговий коефіцієнт з урахуванням добавок за формулою. Отримуємо:

Підрахуємо без урахування добавки:

І знову, відмінності виявилися дуже незначними. Оскільки кількість учнів у обох випадках однаково, по табл. 20 додатка 6 знаходимо критичні значення при n = 12 одночасно для обох коефіцієнтів кореляції.

0,58 для P 0,05

0,73 для P 0,01

Відкладаємо перше значення на "осі значущості"":

У першому випадку отриманий коефіцієнт рангової кореляції перебуває у зоні значимості. Тому психолог повинен відхилити нульову Нгіпотезу про схожість коефіцієнта кореляції з нулем і прийняти альтернативну Але значну відмінність коефіцієнта кореляції від нуля. Іншими словами, отриманий результат говорить про те, що чим вищі експертні оцінки учнів з тесту ШТУР, тим вищі їх експертні оцінки з математики.

Відкладаємо друге значення на "осі значущості"":

У другому випадку коефіцієнт рангової кореляції знаходиться у зоні невизначеності. Тому психолог може прийняти нульову Нгіпотезу про подібність коефіцієнта кореляції з нулем і відхилити альтернативну Але значну відмінність коефіцієнта кореляції від нуля. У цьому випадку отриманий результат свідчить, що експертні оцінки учнів з тесту ШТУР не пов'язані з експертними оцінками з літератури.

Для застосування коефіцієнта кореляції Спірмена, необхідно дотримуватись наступних умов:

1. Змінні змінні повинні бути отримані в порядковій (ранговій) шкалі, але можуть бути виміряні також у шкалі інтервалів та відносин.

2. Характер розподілу корелюваних величин не має значення.

3. Число змін, що варіюють, в порівнюваних змінних X і Y повинно бути однаковим.

Таблиці для визначення критичних значень коефіцієнта кореляції Спірмена (табл. 20 додаток 6) розраховані від числа ознак рівних n = 5 до n = 40 і при більшій кількості змінних, що порівнюються, слід використовувати таблицю для пірсонівського коефіцієнта кореляції (табл. 19 додаток 6). Знаходження критичних значень здійснюється за k = n.

Коефіцієнт кореляції Пірсона

Коефіцієнт r-Пірсона застосовується вивчення взаємозв'язку двох метричних змінних, виміряних однією і тієї ж вибірці. Існує безліч ситуацій, у яких доречне його застосування. Чи впливає інтелект на успішність старших курсів університету? Чи пов'язаний розмір заробітної плати працівника із його доброзичливістю до колег? Чи впливає настрій школяра на успішність розв'язання складного арифметичного завдання? Для відповіді на такі питання дослідник повинен виміряти два показники, що його цікавлять, у кожного члена вибірки.

На величину коефіцієнта кореляції впливає те, у яких одиницях виміру представлені ознаки. Отже, будь-які лінійні перетворення ознак (множення на константу, додавання константи) не змінюють значення коефіцієнта кореляції. Винятком є ​​множення однієї з ознак негативну константу: коефіцієнт кореляції змінює свій знак на протилежний.

Застосування кореляції Спірмена та Пірсона.

Кореляція Пірсона є мірою лінійного зв'язку між двома змінними. Вона дозволяє визначити, наскільки пропорційна мінливість двох змінних. Якщо змінні пропорційні один одному, то графічно зв'язок між ними можна подати у вигляді прямої лінії з позитивним (пряма пропорція) або негативним (зворотна пропорція) нахилом.

На практиці зв'язок між двома змінними, якщо він є, є імовірнісним і графічно виглядає як хмара розсіювання еліпсоїдної форми. Цей еліпсоїд, однак, можна уявити (апроксимувати) у вигляді прямої лінії, або лінії регресії. Лінія регресії - це пряма, побудована шляхом найменших квадратів: сума квадратів відстаней (обчислених по осі Y) від кожної точки графіка розсіювання до прямої є мінімальною.

Особливого значення для оцінки точності передбачення має дисперсія оцінок залежної змінної. По суті, дисперсія оцінок залежної змінної Y - це та частина її повної дисперсії, яка обумовлена ​​впливом незалежної змінної X. Інакше кажучи, відношення дисперсії оцінок залежної змінної до її істинної дисперсії дорівнює квадрату коефіцієнта кореляції.

Квадрат коефіцієнта кореляції залежної та незалежної змінних представляє частку дисперсії залежної змінної, обумовленої впливом незалежної змінної, і називається коефіцієнтом детермінації. Коефіцієнт детермінації, таким чином, показує, якою мірою мінливість однієї змінної обумовлена ​​(детермінована) впливом іншої змінної.

Коефіцієнт детермінації має важливу перевагу порівняно з коефіцієнтом кореляції. Кореляція не є лінійною функцією зв'язку між двома змінними. Тому, середнє арифметичне коефіцієнтів кореляції для кількох вибірок не збігається з кореляцією, обчисленою відразу всім випробовуваних із цих вибірок (тобто. коефіцієнт кореляції не аддитивний). Навпаки, коефіцієнт детермінації відбиває зв'язок лінійно і тому аддитивним: допускається його усереднення кількох вибірок.

Додаткову інформацію про силу зв'язку дає значення коефіцієнта кореляції у квадраті – коефіцієнт детермінації: це частина дисперсії однієї змінної, яка може бути пояснена впливом іншої змінної. На відміну від коефіцієнта кореляції, коефіцієнт детермінації лінійно зростає зі збільшенням сили зв'язку.

Коефіцієнти кореляції Спірмена та τ - Кендалла (рангові кореляції )

Якщо обидві змінні, між якими вивчається зв'язок, представлені у порядковій шкалі, або одна з них – у порядковій, а інша – у метричній, то застосовуються рангові коефіцієнти кореляції: Спірмена або τ - Кенделл. І той, і інший коефіцієнт вимагає для застосування попереднього ранжування обох змінних.

p align="justify"> Коефіцієнт рангової кореляції Спірмена - це непараметричний метод, який використовується з метою статистичного вивчення зв'язку між явищами. У цьому випадку визначається фактичний ступінь паралелізму між двома кількісними рядами ознак, що вивчаються, і дається оцінка тісноти встановленого зв'язку за допомогою кількісно вираженого коефіцієнта.

Якщо члени групи чисельністю були ранжировані спочатку змінною x, потім - змінною y, то кореляцію між змінними x і y можна отримати, просто обчисливши коефіцієнт Пірсона для двох рядів рангів. За умови відсутності зв'язків у рангах (тобто відсутності повторюваних рангів) по тій і іншій змінній, формула для Пірсона може бути спрощена в обчислювальному відношенні і перетворена на формулу, відому як Спірмена.

Потужність коефіцієнта рангової кореляції Спірмена дещо поступається потужністю параметричного коефіцієнта кореляції.

Коефіцієнт рангової кореляції доцільно застосовувати за наявності невеликої кількості спостережень. Даний метод може бути використаний не тільки для кількісно виражених даних, але також і у випадках, коли значення, що реєструються, визначаються описовими ознаками різної інтенсивності.

Коефіцієнт рангової кореляції Спірмена при великій кількості однакових рангів по одній або обох змінним, що зіставляється, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються.

Альтернативу кореляції Спірмена для рангів є кореляція τ - Кендалл. В основі кореляції, запропонованої М.Кендаллом, лежить ідея про те, що про напрям зв'язку можна судити, попарно порівнюючи між собою випробуваних: якщо у пари випробуваних зміна x збігається у напрямку зі зміною y, то це свідчить про позитивний зв'язок, якщо не збігається - то про негативний зв'язок.

Коефіцієнти кореляції були спеціально розроблені для чисельного визначення сили та напрями зв'язку між двома властивостями, виміряними у числових шкалах (метричних чи рангових). Як уже згадувалося, максимальній силі зв'язку відповідають значення кореляції +1 (суворий прямий або прямо пропорційний зв'язок) і -1 (суворий зворотний або обернено пропорційний зв'язок), відсутності зв'язку відповідає кореляція, що дорівнює нулю. Додаткову інформацію про силу зв'язку дає значення коефіцієнта детермінації: це частина дисперсії однієї змінної, яка може бути пояснена впливом іншої змінної.

9. Параметричні методи порівняння даних

Параметричні методи порівняння застосовуються у тому випадку, якщо ваші змінні були виміряні у метричній шкалі.

Порівняння дисперсій 2- х вибірок за критерієм Фішера .


Даний метод дозволяє перевірити гіпотезу про те, що дисперсії 2-х генеральних сукупностей, з яких вилучені порівнювані вибірки, відрізняються один від одного. Обмеження методу - розподілу ознаки обох вибірках нічого не винні відрізнятися від нормального.

Альтернативою порівняння дисперсій є критерій Лівена, для якого немає потреби у перевірці на нормальність розподілу. Цей метод може застосовуватися для перевірки припущення про рівність (гомогенність) дисперсій перед перевіркою достовірності відмінності середніх за критерієм Стьюдента для незалежних вибірок різної чисельності.

Насправді визначення тісноти зв'язку двох ознак часто застосовується коефіцієнт рангової кореляції Спірмена (Р). Значення кожної ознаки ранжуються за ступенем зростання (від 1 до n), потім визначається різниця (d) між рангами, які відповідають одному спостереженню.

Приклад №1. Залежність між обсягом промислової продукції та інвестиціями в основний капітал по 10 областях одного з федеральних округів РФ у 2003 році характеризується такими даними.
Обчисліть рангові коефіцієнти кореляції Спірменаі Кендела. Перевірити їх значення при α=0,05. Сформулюйте висновок про залежність між обсягом промислової продукції та інвестиціями в основний капітал за аналізованими областями РФ.

Надамо ранги ознакою Y і фактору X . Знайдемо суму різниці квадратів d 2 .
Використовуючи калькулятор, обчислимо коефіцієнт рангової кореляції Спірмена:

X Y ранг X, d x ранг Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Зв'язок між ознакою Y фактором X сильний і прямий.

Оцінка коефіцієнта рангової кореляції Спірмена



По таблиці Стьюдента знаходимо Tтабл.
T табл = (18; 0.05) = 1.734
Оскільки Tнабл > Tтабл, то відхиляємо гіпотезу про рівність нулю коефіцієнта рангової кореляції. Інакше кажучи, коефіцієнта рангової кореляції Спірмена статистично - значущий.

Інтервальна оцінка для коефіцієнта рангової кореляції (довірчий інтервал)
Довірчий інтервалдля коефіцієнта рангової кореляції Спірмена: p (0.5431; 0.9095).

Приклад №2. Початкові дані.

5 4
3 4
1 3
3 1
6 6
2 2
Так як у матриці є пов'язані ранги (однаковий ранговий номер) 1-го ряду, зробимо їх переформування. Переформування рангів здійснюватиметься без зміни важливості рангу, тобто між ранговими номерами повинні зберегтися відповідні співвідношення (більше, менше або рівно). Також не рекомендується ставити ранг вище 1 і нижче значення, що дорівнює кількості параметрів (в даному випадку n = 6). Переформування рангів провадиться в табл.
Нові ранги
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Так як у матриці є пов'язані ранги 2-го ряду, зробимо їх переформування. Переформування рангів провадиться в табл.
Номери місць у впорядкованому рядіРозташування факторів оцінки експертаНові ранги
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Матриця рангів.
ранг X, d xранг Y, d y(d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Оскільки серед значень ознак х і зустрічається кілька однакових, тобто. утворюються пов'язані ранги, то у такому разі коефіцієнт Спірмена обчислюється як:

де


j – номери зв'язок по порядку для ознаки х;
А j - число однакових рангів у j-й зв'язці х;
k – номери зв'язок по порядку для ознаки у;
У k - число однакових рангів у k-й зв'язці з у.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

Зв'язок між ознакою Y та фактором X помірна та пряма.
Поділіться з друзями або збережіть для себе:

Завантаження...