Автоматичний розрахунок кореляції спірмена. Коефіцієнт кореляції спірмена

За наявності двох рядів значень, що піддаються ранжируванню, раціонально розраховувати рангову кореляцію Спірмена.

Такі ряди можуть бути:

  • парою ознак, що визначаються в одній і тій же групі об'єктів, що досліджуються;
  • парою індивідуальних супідрядних ознак, що визначаються у 2 досліджуваних об'єктів за однаковим набором ознак;
  • парою групових підпорядкованих ознак;
  • індивідуальною та груповою супідрядністю ознак.

Метод передбачає проведення ранжування показників окремо кожному за ознак.

Найменше значення має найменший ранг.

Цей метод відноситься до непараметричного статистичного методу, призначеному для встановлення існування зв'язку явищ, що вивчаються:

  • визначення фактичного ступеня паралелізму між двома рядами кількісних даних;
  • оцінка тісноти виявленого зв'язку, що виражається кількісно.

Кореляційний аналіз

Статистичний метод, призначений виявлення існування залежності між 2 і більше випадковими величинами(змінними), а також її сили, отримав назву кореляційного аналізу.

Отримав назву від correlatio (лат.) – співвідношення.

За його використання можливі варіанти розвитку подій:

  • наявність кореляції (позитивна чи негативна);
  • відсутність кореляції (нульова).

У разі встановлення залежності між змінними йдеться про їхнє корелювання. Іншими словами, можна сказати, що при зміні значення Х обов'язково буде спостерігатися пропорційна зміна значення У.

Як інструменти використовуються різні заходи зв'язку (коефіцієнти).

На їх вибір впливає:

  • спосіб виміру випадкових чисел;
  • характер зв'язку між випадковими числами.

Існування кореляційного зв'язку може відображатися графічно (графіки) та за допомогою коефіцієнта (числове відображення).

Кореляційний зв'язок характеризується такими ознаками:

  • сила зв'язку (при коефіцієнті кореляції від ±0,7 до ±1 – сильна; від ±0,3 до ±0,699 – середня; від 0 до ±0,299 – слабка);
  • напрямок зв'язку (прямий або зворотний).

Цілі кореляційного аналізу

Кореляційний аналіз не дозволяє встановити причинну залежність між змінними, що досліджуються.

Він проводиться з метою:

  • встановлення залежності між змінними;
  • отримання певної інформації про змінну на основі іншої змінної;
  • визначення тісноти (зв'язку) цієї залежності;
  • визначення напряму встановленого зв'язку.

Методи кореляційного аналізу


Даний аналізможе виконуватися з використанням:

  • методу квадратів чи Пірсона;
  • рангового методу чи Спірмена.

p align="justify"> Метод Пірсона застосовний для розрахунків що вимагають точного визначення сили, що існує між змінними. Досліджувані за його допомогою ознаки мають виражатися лише кількісно.

Для застосування методу Спірмена або рангової кореляціїнемає жорстких вимог у вираженні ознак – воно може бути як кількісним, так і атрибутивним. Завдяки цьому методу виходить інформація про точному встановленні сили зв'язку, а має орієнтовний характер.

У рядах змінних можуть бути відкриті варіанти. Наприклад, коли стаж роботи виражається такими значеннями як до 1 року, більше 5 років і т.д.

Коефіцієнт кореляції

Статистична величина, що характеризує характер зміни двох змінних, отримала назву коефіцієнта кореляції або парного коефіцієнтакореляції. У кількісному вираженні він коливається не більше від -1 до +1.

Найбільш поширені коефіцієнти:

  • Пірсона- Застосуємо для змінних належать до інтервальної шкали;
  • Спірмена- Для змінних порядкової шкали.

Обмеження використання коефіцієнта кореляції

Отримання недостовірних даних при розрахунку коефіцієнта кореляції можливе у випадках, коли:

  • у розпорядженні є достатня кількість значень змінної (25-100 пар спостережень);
  • між змінними, що вивчаються, встановлено, наприклад, квадратичне співвідношення, а не лінійне;
  • у кожному випадку дані містять більше одного спостереження;
  • наявність аномальних значень (викидів) змінних;
  • досліджувані дані складаються з чітко виділених підгруп спостережень;
  • наявність кореляційного зв'язку не дозволяє встановити яка зі змінних може розглядатися як причина, а яка – як слідство.

Перевірка значущості кореляції

Для оцінки статистичних величинвикористовується поняття їх значимості або достовірності, що характеризує ймовірність випадкового виникнення величини або крайніх її значень.

Найбільш поширеним методом визначення значущості кореляції є визначення критерію Стьюдента.

Його значення порівнюється з табличним, кількість ступенів свободи приймається як 2. При отриманні розрахункового значення критерію більше табличного свідчить про значущість коефіцієнта кореляції.

Під час проведення економічних розрахунків достатнім вважається довірчий рівень 0,05 (95%) чи 0,01 (99%).

Ранги Спірмена

Коефіцієнт рангової кореляції Спірмена дозволяє статистично встановити зв'язок між явищами. Його розрахунок передбачає встановлення кожної ознаки порядкового номера – рангу. Ранг може бути зростаючим чи спадним.

Кількість ознак, що піддаються ранжируванню, може бути будь-якою. Це досить трудомісткий процес, який обмежує їх кількість. Труднощі починаються при досягненні 20 ознак.

Для розрахунку коефіцієнта Спірмена користуються формулою:

в якій:

n – відображає кількість ранжованих ознак;

d – не що інше як різницю між рангами по двох змінних;

а ∑(d2) – сума квадратів різниці рангів.

Застосування кореляційного аналізу у психології

Статистичне супроводження психологічних досліджень дозволяє зробити їх об'єктивнішими і високо репрезентативними. Статистична обробкаданих отриманих у ході психологічних експериментівсприяє вилученню максимуму корисної інформації.

Найбільш широке застосування у обробці їх результатів отримав кореляційний аналіз.

Доречним є проведення кореляційного аналізу результатів, отриманих під час проведення досліджень:

  • тривожності (за тестами R. Temml, M. Dorca, V. Amen);
  • сімейних взаємин («Аналіз сімейних взаємин» (АСВ) опитувальник Е.Г. Ейдеміллера, В.В. Юстіцкіса);
  • рівня інтернальності-екстернальності (опитувальник Е.Ф. Бажина, Є.А. Голинкіної та А.М. Еткінда);
  • рівня емоційного вигоряння у педагогів (опитувальник В.В. Бойко);
  • зв'язки елементів вербального інтелекту учнів під час різного профільного навчання (методика К.М. Гуревича та ін.);
  • зв'язку рівня емпатії (методика В.В. Бойка) та задоволеністю шлюбом (опитувальник В.В. Століна, Т.Л. Романової, Г.П. Бутенко);
  • зв'язки між соціометричним статусом підлітків (тест Jacob L. Moreno) та особливостями стилю сімейного виховання (опитувальник Е.Г. Ейдеміллера, В.В. Юстіцкіса);
  • структури життєвих цілей підлітків, вихованих у повних та неповних сім'ях (опитувальник Edward L. Deci, Richard M. Ryan Ryan).

Коротка інструкція щодо проведення кореляційного аналізу за критерієм Спірмена

Проведення кореляційного аналізу з використанням методу Спірмена виконується за наступним алгоритмом:

  • парні зіставні ознаки розташовуються в 2 ряди, один з яких позначається за допомогою Х, а інший;
  • значення низки Х розташовуються у порядку зростання чи спадання;
  • послідовність розташування значень ряду визначається їх відповідністю значень ряду Х;
  • для кожного значення в ряді Х визначити ранг - присвоїти порядковий номер від мінімального значення до максимального;
  • для кожного із значень у ряду У також визначити ранг (від мінімального до максимального);
  • обчислити різницю (D) між рангами Х і У, вдавшись до формули D=Х-У;
  • отримані значення різниці зводяться у квадрат;
  • виконати підсумовування квадратів різниць рангів;
  • виконати розрахунки за такою формулою:

Приклад кореляції Спірмена

Необхідно встановити наявність кореляційного зв'язку між робочим стажем та показником травматизму за наявності наступних даних:

Найбільш підходящим методом аналізу є ранговий метод, т.к. одна з ознак представлена ​​у вигляді відкритих варіантів: робочий стаж до 1 року та робочий стаж 7 і більше років.

Рішення завдання починається з ранжирування даних, які зводяться до робочої таблиці і може бути виконані вручну, т.к. їх обсяг невеликий:

Робочий стаж Число травм Порядкові номери (ранги) Різниця рангів Квадрат різниці рангів
d(х-у)
до 1 року 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 і більше 6 5 1 +4 16
Σ d2 = 38,5

Поява дробових рангів у колонці пов'язана з тим, що у разі появи варіант однакових за величиною перебуває середня арифметичне значеннярангу. У даному прикладі показник травматизму 12 зустрічається двічі і йому надаються ранги 2 і 3, знаходимо середнє арифметичне цих рангів (2+3)/2= 2,5 і поміщаємо це значення в робочу таблицю для 2 показників.
Виконавши підстановку отриманих значень у робочу формулу і здійснивши нескладні розрахунки отримуємо коефіцієнт Спірмена рівний -0,92

Негативне значення коефіцієнта свідчить про наявність зворотного зв'язку між ознаками та дозволяє стверджувати, що невеликий стаж роботи супроводжується більшим числомтравм. Причому сила зв'язку цих показників досить велика.
Наступним етапом розрахунків є визначення достовірності отриманого коефіцієнта:
розраховується його помилка та критерій Стьюдента

Метод рангової кореляції Спірмена дозволяє визначити тісноту (силу) та напрямок кореляційного зв'язку між двома ознаками або двома профілями (ієрархіями) ознак.

Для підрахунку рангової кореляції необхідно мати два ряди значень,

які можуть бути проранжовані. Такими рядами значень можуть бути:

1) дві ознаки, виміряні в одній і тій же групі випробуваних;

2) дві індивідуальні ієрархії ознак, виявлені у двох піддослідних по одному й тому набору ознак;

3) дві групові ієрархії ознак,

4) індивідуальна та групова ієрархії ознак.

Спочатку показники ранжуються окремо за кожною ознакою.

Як правило, меншим значенням ознаки нараховується менший ранг.

У першому випадку (дві ознаки) ранжуються індивідуальні значення за першою ознакою, отримані різними випробуваними, а потім індивідуальні значення за другою ознакою.

Якщо дві ознаки пов'язані позитивно, то випробувані, що мають низькі ранги по одному з них, матимуть низькі ранги та по іншому, а випробувані, що мають високі ранги за

одній з ознак, матимуть за іншою ознакою також високі ранги. Для підрахунку rs необхідно визначити різниці (d) між рангами, отриманими даним випробуваним за обома ознаками. Потім ці показники d певним чином перетворюються і віднімаються з 1.

менше різниці між рангами, тим більше буде rs, тим ближче він буде до +1.

Якщо кореляція відсутня, всі ранги будуть перемішані і між ними не буде

жодної відповідності. Формула складена так, що в цьому випадку rs виявиться близьким до 0.

У разі негативної кореляції низьким рангам випробуваних за однією ознакою

будуть відповідати високі ранги за іншою ознакою, і навпаки. Чим більший розбіжність між рангами випробуваних за двома змінними, тим ближче rs до -1.

У другому випадку (два індивідуальні профілі), ранжуються індивідуальні

значення, отримані кожним з 2-х випробуваних за певним (однаковим для них обох) набором ознак. Перший ранг отримає ознаку з найнижчим значенням; другий ранг – ознака з вищим значенням тощо. Очевидно, що всі ознаки повинні бути виміряні в тих самих одиницях, інакше ранжування неможливо. Наприклад, неможливо проранжувати показники по опитувальнику Кеттелла (16PF), якщо вони виражені в "сирих" балах, оскільки за різними факторами діапазони значень різні: від 0 до 13, від 0 до

20 і від 0 до 26. Ми не можемо сказати, який із факторів буде займати перше місце за виразністю, поки не наведемо всі значення до єдиної шкали (найчастіше це шкала стін).

Якщо індивідуальні ієрархії двох піддослідних пов'язані позитивно, то ознаки, що мають низькі ранги в одного з них, матимуть низькі ранги і в іншого, і навпаки. Наприклад, якщо в одного випробуваного фактор Е (домінантність) має найнижчий ранг, то й у іншого випробуваного він повинен мати низький ранг, якщо в одного випробуваного фактор С

(емоційна стійкість) має вищий ранг, те й інший випробуваний повинен мати по

цьому чиннику високий ранг тощо.

У третьому випадку (два групових профілю), ранжуються середньогрупові значення, отримані в 2-х групах випробуваних за певним, однаковим для двох груп, набором ознак. Надалі лінія міркувань така сама, як і в попередніх двох випадках.

У випадку 4-му (індивідуальний та груповий профілі), ранжуються окремо індивідуальні значення випробуваного та середньогрупові значення за тим же набором ознак, які отримані, як правило, при виключенні цього окремого випробуваного – він не бере участі в середньогруповому профілі, з яким буде зіставлятися його індивідуальний профіль Рангова кореляція дозволить перевірити, наскільки узгоджено індивідуальний та груповий профілі.

У всіх чотирьох випадках значимість отриманого коефіцієнта кореляції визначається за кількістю ранжованих значень N. У першому випадку ця кількість співпадатиме з обсягом вибірки n. У другому випадку кількістю спостережень буде кількість ознак, що становлять ієрархію. У третьому і четвертому випадку N – це також кількість зіставних ознак, а чи не кількість випробуваних у групах. Детальні пояснення наведено в прикладах. Якщо абсолютна величина rs досягає критичного значення або перевищує його, кореляція є достовірною.

Гіпотези.

Можливі два варіанти гіпотез. Перший відноситься до випадку 1, другий - до трьох інших випадків.

Перший варіант гіпотез

H0: Кореляція між змінними А та Б не відрізняється від нуля.

H1: Кореляція між змінними А та Б достовірно відрізняється від нуля.

Другий варіант гіпотез

H0: Кореляція між ієрархіями А та Б не відрізняється від нуля.

H1: Кореляція між ієрархіями А та Б достовірно відрізняється від нуля.

Обмеження коефіцієнта рангової кореляції

1. По кожній змінній має бути представлено не менше 5 спостережень. Верхня межа вибірки визначається наявними таблицями критичних значень.

2. Коефіцієнт рангової кореляції Спірмена rs при великій кількості однакових рангів по одній або обох змінних, що зіставляються, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються. У разі, якщо цієї умови не дотримується, необхідно вносити поправку на однакові ранги.

Коефіцієнт рангової кореляції Спірмена підраховується за такою формулою:

Якщо в обох порівнюваних рангових рядах присутні групи однакових рангів, перед підрахунком коефіцієнта рангової кореляції необхідно внести поправки на однакові ранги Та і Тв:

Та = Σ (а3 - а) / 12,

Тв = Σ (в3 - в) / 12,

де а – обсяг кожної групи однакових рангів у ранговому ряду А, у – обсяг кожної

групи однакових рангів у ранговому ряду Ст.

Для підрахунку емпіричного значення rs використовують формулу:

Розрахунок коефіцієнта рангової кореляції Спірмена rs

1. Визначити, які дві ознаки або дві ієрархії ознак братимуть участь у

зіставленні як змінні А та Ст.

2. Проранжувати значення змінної А, нараховуючи ранг 1 найменшому значенню, відповідно до правил ранжування (див. П.2.3). Занести ранги у перший стовпець таблиці за порядком номерів випробуваних чи ознак.

3. Проранжувати значення змінної, відповідно до тих самих правил. Занести ранги у другий стовпець таблиці за порядком номерів випробуваних чи ознак.

5. Звести кожну різницю у квадрат: d2. Ці значення занести до четвертого стовпця таблиці.

Та = Σ (а3 - а) / 12,

Тв = Σ (в3 - в) / 12,

де а – обсяг кожної групи однакових рангів у ранговому ряду А; в – обсяг кожної групи

однакових рангів у ранговому ряду Ст.

а) за відсутності однакових рангів

rs  1 − 6 ⋅

б) за наявності однакових рангів

Σd 2  T  T

r  1 − 6 ⋅ a в,

де Σd2 – сума квадратів різниць між рангами; Та і Тв – поправки на однакові

N – кількість випробуваних чи ознак, що брали участь у ранжируванні.

9. Визначити по Таблиці (див. Додаток 4.3) критичні значення rs для даного N. Якщо rs перевищує критичне значення або, за Крайній мірі, дорівнює йому, кореляція достовірно відрізняється від 0

Приклад 4.1.При визначенні ступеня залежності реакції вживання алкоголю на окорухову реакцію в випробуваній групі були отримані дані до вживання алкоголю та після вживання. Чи залежить реакція випробуваного стану сп'яніння?

Результати експерименту:

До:16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Після: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Сформулюємо гіпотези:

Н0: кореляція між ступенем залежності реакції до вживання алкоголю і після не відрізняється від нуля.

Н1: кореляція між ступенем залежності реакції до вживання алкоголю та після достовірно відрізняється від нуля.

Таблиця 4.1. Розрахунок d2 для рангового коефіцієнта кореляції Спірмена rs при зіставленні показників окорухової реакції до експерименту та після (N=17)

значення

значення

Оскільки ми маємо повторювані ранги, то в даному випадку будемо застосовувати формулу з поправкою на однакові ранги:

Та = ((23-2) + (33-3) + (23-2) + (33-3) + (23-2) + (23-2)) / 12 = 6

Тb = ((23-2) + (23-2) + (33-3)) / 12 = 3

Знайдемо емпіричне значення коефіцієнта Спірмена:

rs = 1 - 6 * ((767,75 +6 +3) / (17 * (172-1))) = 0,05

За таблицею (додаток 4.3) знаходимо критичні значення коефіцієнта кореляції

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Отримуємо

rs=0,05∠rкр(0,05)=0,48

Висновок: Н1гіпотеза відкидається і приймається Н0. Тобто. кореляція між ступенем

залежність реакції до вживання алкоголю і після не відрізняється від нуля.

Призначення рангового коефіцієнта кореляції

Метод рангової кореляції Спірмена дозволяє визначити тісноту (силу) та напрямок кореляційного зв'язку між двома ознакамиабо двома профілями (ієрархіями)ознак.

Опис методу

Для підрахунку рангової кореляції необхідно розташовувати двома рядами значень, які можна проранжированы. Такими рядами значень можуть бути:

1) дві ознаки,виміряні в одній і тій же групі випробуваних;

2) дві індивідуальні ієрархії ознак,виявлені у двох піддослідних за одним і тим же набором ознак (наприклад, особистісні профілі за 16-факторним опитувальником Р. Б. Кеттелла, ієрархії цінностей за методикою Р. Рокіча, послідовності переваг у виборі з кількох альтернатив та ін.);

3) дві групові ієрархії ознак;

4) індивідуальна та груповаієрархії ознак.

Спочатку показники ранжуються окремо за кожною ознакою. Як правило, меншим значенням ознаки нараховується менший ранг.

Розглянемо випадок 1 (дві ознаки).Тут ранжуються індивідуальні значення за першою ознакою, отримані різними випробуваними, а потім індивідуальні значення за другою ознакою.

Якщо дві ознаки пов'язані позитивно, то випробувані, що мають низькі ранги по одному з них, матимуть низькі ранги та по іншому, а випробувані, що мають високі ранги за однією з ознак, матимуть за іншою ознакою також високі ранги. Для підрахунку r s необхідно визначити різниці (d) між рангами, отриманими даним випробуваним за обома ознаками. Потім ці показники d певним чином перетворюються і віднімаються з 1. Чим менше різниці між рангами, тим більше буде r s тим ближче він буде до +1.

Якщо кореляція відсутня, то всі ранги будуть перемішані і між ними не буде відповідності. Формула складена так, що в цьому випадку r s, Виявиться близьким до 0.

У разі негативної кореляції низьким рангам випробуваних за однією ознакою відповідатимуть високі ранги за іншою ознакою, і навпаки.

Чим більший розбіжність між рангами випробуваних за двома змінними, тим ближче r s до -1.

Розглянемо випадок 2 (два індивідуальні профілі).Тут ранжуються індивідуальні значення, отримані кожним із 2-х випробуваним за певним (однаковим їм обох) набору ознак. Перший ранг отримає ознаку з найнижчим значенням; другий ранг - ознака з вищим значенням тощо. Очевидно, що всі ознаки повинні бути виміряні в тих самих одиницях, інакше ранжування неможливо. Наприклад, неможливо проранжувати показники по опитувальнику Кеттелла (16) PF), якщо вони виражені в "сирих" балах, оскільки за різними факторами діапазони значень різні: від 0 до 13, від 0 до 20 і від 0 до 26. Ми не можемо сказати, який з факторів займатиме перше місце за виразністю, поки не наведемо всі значення до єдиної шкали (найчастіше це шкала стін).

Якщо індивідуальні ієрархії двох піддослідних пов'язані позитивно, то ознаки, що мають низькі ранги в одного з них, матимуть низькі ранги і в іншого, і навпаки. Наприклад, якщо в одного випробуваного фактор Е (домінантність) має найнижчий ранг, то в іншого випробуваного він повинен мати низький ранг, якщо в одного випробуваного фактор С (емоційна стійкість) має вищий ранг, то й інший випробуваний повинен мати за цим фактором високий ранг і т.д.

Розглянемо випадок 3 (два групові профілі).Тут ранжуються середньогрупові значення, отримані в 2-х групах випробуваних за певним, однаковим для двох груп, набором ознак. Надалі лінія міркувань така сама, як і в попередніх двох випадках.

Розглянемо випадок 4 (індивідуальний та груповий профілі).Тут ранжуються окремо індивідуальні значення випробуваного і среднегрупповые значення з тієї ж набору ознак, які отримані, зазвичай, крім цього окремого випробуваного - він бере участь у среднегрупповом профілі, з яким зіставлятиметься його індивідуальний профіль. Рангова кореляція дозволить перевірити, наскільки узгоджено індивідуальний та груповий профілі.

У всіх чотирьох випадках значимість отриманого коефіцієнта кореляції визначається за кількістю ранжованих значень N.У першому випадку ця кількість співпадатиме з обсягом вибірки п. У другому випадку кількістю спостережень буде кількість ознак, що становлять ієрархію. У третьому та четвертому випадку N -це також кількість зіставних ознак, а не кількість випробуваних у групах. Детальні пояснення наведено в прикладах.

Якщо абсолютна величина r s досягає критичного значення або перевищує його, кореляція є достовірною.

Гіпотези

Можливі два варіанти гіпотез. Перший відноситься до випадку 1, другий - до трьох інших випадків.

Перший варіант гіпотез

H 0: Кореляція між змінними А та Б не відрізняється від нуля.

H 1: Кореляція між змінними А та Б достовірно відрізняється від нуля.

Другий варіант гіпотез

H 0: Кореляція між ієрархіями А та Б не відрізняється від нуля.

H 1: Кореляція між ієрархіями А та Б достовірно відрізняється від нуля.

Графічне подання методу рангової кореляції

Найчастіше кореляційний зв'язок представляють графічно як хмари точок чи вигляді ліній, що відбивають загальну тенденцію розміщення точок у просторі двох осей: осі ознаки і ознаки Б (див. рис. 6.2).

Спробуємо зобразити рангову кореляцію як двох рядів ранжованих значень, які попарно з'єднані лініями (Рис. 6.3). Якщо ранги за ознакою А і за ознакою Б збігаються, між ними виявляється горизонтальна лінія, якщо ранги не збігаються, то лінія стає похилою. Чим більше розбіжність рангів, тим похилішою стає лінія. Ліворуч на Мал. 6.3 відображена максимально висока позитивна кореляція (r = +1,0) - практично це "сходи". У центрі відображено нульову кореляцію - плетінку з неправильними переплетеннями. Усі ранги тут переплутані. Праворуч відображено максимально високу негативну кореляцію (r s =-1,0) - павутина з правильним переплетенням ліній.

Рис. 6.3. Графічне подання рангової кореляції:

а) висока позитивна кореляція;

б) нульова кореляція;

в) висока негативна кореляція

Обмеженнякоефіцієнта ранговоїкореляції

1. По кожній змінній має бути представлено не менше 5 спостережень. Верхня межа вибірки визначається наявними таблицями критичних значень (табл. XVI додатка 1), а саме N40.

2. Коефіцієнт рангової кореляції Спірмена r s при великій кількості однакових рангів по одній або обох змінних, що зіставляються, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються. У разі, якщо цієї умови не дотримується, необхідно вносити поправку на однакові ранги. Відповідна формула наведена в прикладі 4.

Приклад 1 – кореляціяміж двомаознаками

У дослідженні, що моделює діяльність авіадиспетчера (Одеришев Б.С., Шамова Є.П., Сидоренко Є.В., Ларченко Н.М., 1978), група піддослідних, студентів фізичного факультету ЛДУ проходила підготовку перед початком роботи на тренажері. Випробувані повинні були вирішувати завдання щодо вибору оптимального типу злітно-посадкової смуги для заданого типу літака. Чи пов'язана кількість помилок, допущених випробуваними у тренувальній сесії, з показниками вербального та невербального інтелекту, виміряними за методикою Д. Векслера?

Таблиця 6.1

Показники кількості помилок у тренувальній сесії та показники рівня вербального та невербального інтелекту у студентів-фізиків (N=10)

Випробуваний

Кількість помилок

Показник вербального інтелекту

Показник невербального інтелекту

Спочатку спробуємо відповісти на питання, чи пов'язані між собою показники кількості помилок та вербального інтелекту.

Сформулюємо гіпотези.

H 0: Кореляція між показником кількості помилок у тренувальній сесії та рівнем вербального інтелекту не відрізняється від нуля.

H 1 : Кореляція між показником кількості помилок у тренувальній сесії та рівнем вербального інтелекту статистично значуще відрізняється від нуля.

Далі нам необхідно проранжувати обидва показники, приписуючи меншому значенню менший ранг, потім підрахувати різниці між рангами, які отримав кожен випробуваний за двома змінними (ознаками), і звести ці різниці у квадрат. Зробимо всі необхідні розрахунки у таблиці.

У Табл. 6.2 у першій колонці зліва представлені значення за показником кількості помилок; у наступній колонці – їх ранги. У третій колонці зліва представлені значення за показником вербального інтелекту; у наступному стовпці – їх ранги. У п'ятому зліва представлені різниці d між рангом за змінною А (кількість помилок) та змінною Б (вербальний інтелект). В останньому стовпці представлені квадрати різниць d 2 .

Таблиця 6.2

Розрахунок d 2 для рангового коефіцієнта кореляції Спірмена r s при зіставленні показників кількості помилок та вербального інтелекту у студентів-фізиків (N=10)

Випробуваний

Змінна А

кількість помилок

Змінна Б

вербальний інтелект.

d (ранг А -

J 2

Індивідуальні

значення

Індивідуальні

значення

Коефіцієнт рангової кореляції Спірмена підраховується за такою формулою:

де d - різницю між рангами за двома змінними для кожного випробуваного;

N -кількість ранжованих значень, ст. даному випадку кількість випробуваних.

Розрахуємо емпіричне значення r s:

Отримане емпіричне значення г s близько до 0. І все ж визначимо критичні значення r s при N = 10 Табл. XVI Додатки 1:

Відповідь: H0 приймається. Кореляція між показником кількості помилок у тренувальній сесії та рівнем вербального інтелекту не відрізняється від нуля.

Тепер спробуємо відповісти на питання, чи пов'язані між собою показники кількості помилок та невербального інтелекту.

Сформулюємо гіпотези.

H 0: Кореляція між показником кількості помилок у тренувальній сесії та рівнем невербального інтелекту не відрізняється від 0.

H 1: Кореляція між показником кількості помилок у тренувальній сесії та рівнем невербального інтелекту статистично значуще відрізняється від 0.

Результати ранжування та зіставлення рангів представлені в Табл. 6.3.

Таблиця 6.3

Розрахунок d 2 для рангового коефіцієнта кореляції Спірмена r s при зіставленні показників кількості помилок та невербального інтелекту у студентів-фізиків (N=10)

Випробуваний

Змінна А

кількість помилок

Змінна Е

невербальний інтелект

d (ранг А -

d 2

Індивідуальні

Індивідуальні

значення

значення

Ми пам'ятаємо, що для визначення значущості r s не має значення, чи є він позитивним чи негативним, важлива лише його абсолютна величина. В даному випадку:

r s емп

Відповідь: H0 приймається. Кореляція між показником кількості помилок у тренувальній сесії та рівнем невербального інтелекту випадкова, r s не відрізняється від 0.

Разом з тим ми можемо звернути увагу на певну тенденцію негативноюзв'язки між цими двома змінними. Можливо, ми змогли б підтвердити її на статистично значущому рівні, якби збільшили обсяг вибірки.

Приклад 2 – кореляція між індивідуальними профілями

У дослідженні, присвяченому проблемам ціннісної реорієнтації, виявлялися ієрархії термінальних цінностей за методикою М. Рокіча у батьків та їх дорослих дітей (Сидоренко Є.В., 1996). Ранги термінальних цінностей, отримані під час обстеження пари мати-дочка (матері – 66 років, дочки – 42 роки) представлені в Табл. 6.4. Спробуємо визначити, як ці ціннісні ієрархії корелюють одна з одною.

Таблиця 6.4

Ранги термінальних цінностей за списком М.Рокича в індивідуальних ієрархіях матері та дочки

Термінальні цінності

Ранг цінностей у

Ранг цінностей у

d 2

ієрархії матері

ієрархії дочки

1 Активне діяльне життя

2 Життєва мудрість

3 Здоров'я

4 Цікава робота

5 Краса природи та мистецтво

7 Матеріально забезпечене життя

8 Наявність добрих і вірних друзів

9 Суспільне визнання

10 Пізнання

11 Продуктивна життя

12 Розвиток

13 Розваги

14 Свобода

15 Щасливе сімейне життя

16 Щастя інших

17 Творчість

18 Впевненість у собі

Сформулюємо гіпотези.

H 0: Кореляція між ієрархіями термінальних цінностей матері та дочки не відрізняється від нуля.

H 1: Кореляція між ієрархіями термінальних цінностей матері та дочки статистично значно відрізняється від нуля.

Оскільки ранжування цінностей передбачається процедурою дослідження, нам залишається лише підрахувати різниці між рангами 18 цінностей у двох ієрархіях. У 3-му та 4-му стовпцях Табл. 6.4 представлені різниці d і квадрати цих різниць d 2 .

Визначаємо емпіричне значення r s за такою формулою:

де d - різниці між рангами по кожній із змінних, у даному випадку щодо кожної з термінальних цінностей;

N- кількість змінних, які утворюють ієрархію, у разі кількість цінностей.

Для цього прикладу:

По Табл. XVI Додатки 1 визначаємо критичні значення:

Відповідь: H0 відкидається. Приймається H1. Кореляція між ієрархіями термінальних цінностей матері та дочки статистично значуща (р<0,01) и является положительной.

За даними Табл. 6.4 ми можемо визначити, що основні розбіжності припадають на цінності "Щасливе сімейне життя", "Громадське визнання" та "Здоров'я", ранги інших цінностей досить близькі.

Приклад 3 – кореляція між двома груповими ієрархіями

Джозеф Вольпе в книзі, написаній спільно з сином (Wolpe J., Wolpe D., 1981) наводить впорядкований перелік з найбільш часто зустрічаються у сучасної людини "некорисних", за його позначенням, страхів, які не несуть сигнального значення і лише заважають повноцінно жити та діяти. У вітчизняному дослідженні, проведеному М.Е. Раховий (1994) 32 піддослідних мали за 10-бальною шкалою оцінити, наскільки актуальним їм є той чи інший вид страху з переліку Вольпе 3 . Обстежена вибірка складалася зі студентів Гідрометеорологічного та Педагогічного інститутів Санкт-Петербурга: 15 юнаків та 17 дівчат віком від 17 до 28 років, середній вік 23 роки.

Дані, отримані за 10-бальною шкалою, були усереднені за 32 випробуваними, і середні проранжовані. У Табл. 6.5 представлені рангові показники, отримані Дж. Вольпе та М. Е. Рахової. Чи збігаються рангові послідовності 20 видів страху?

Сформулюємо гіпотези.

H 0: Кореляція між упорядкованими переліками видів страху в американській та вітчизняних вибірках не відрізняється від нуля.

H 1: Кореляція між упорядкованими переліками видів страху в американській та вітчизняній вибірках статистично значно відрізняється від нуля.

Всі розрахунки, пов'язані з обчисленням та зведенням у квадрат різниць між рангами різних видів страху у двох вибірках, представлені в Табл. 6.5.

Таблиця 6.5

Розрахунок d для рангового коефіцієнта кореляції Спірмена при зіставленні впорядкованих переліків видів страху в американській та вітчизняній вибірках

Види страху

Ранг в американській вибірці

Ранг у російській

Страх публічного виступу

Страх польоту

Страх зробити помилку

Страх невдачі

Страх несхвалення

Страх відкидання

Страх злих людей

Страх самотності

Страх крові

Страх відкритих ран

Страх дантиста

Страх уколів

Страх проходження тестів

Страх поліції міліції)

Страх висоти

Страх собак

Страх павуків

Страх скалічених людей

Страх лікарень

Страх темряви

Визначаємо емпіричне значення r s:

По Табл. XVI Додатка 1 визначаємо критичні значення г s при N=20:

Відповідь: H0 приймається. Кореляція між упорядкованими переліками видів страху в американській та вітчизняній вибірках не досягає рівня статистичної значущості, тобто значуще не відрізняється від нуля.

Приклад 4 - кореляція між індивідуальним та середньогруповим профілями

Вибірці петербуржців віком від 20 до 78 років (31 чоловік, 46 жінок), врівноваженою за віком таким чином, що особи віком від 55 років становили в ній 50% 4 , пропонувалося відповісти на запитання: "Який рівень розвитку кожного з наведених нижче якостей необхідний для депутата Міських зборів Санкт-Петербурга? (Сидоренко Є.В., Дерманова І.Б., Анісімова О.М., Вітенберг Є.В., Шульга А.П., 1994). Оцінка проводилася за 10-бальною шкалою. Паралельно з цим обстежувалася вибірка з депутатів та кандидатів у депутати до Міських зборів Санкт-Петербурга (n=14). Індивідуальна діагностика політичних діячів і претендентів проводилася за допомогою Оксфордської системи експрес-відеодіагностики за тим же набором особистісних якостей, які вибирали виборці.

У Табл. 6.6 представлені середні значення, отримані для кожного з якостей ввибірці виборців ("еталонний ряд") та індивідуальні значення одного з депутатів Міських зборів.

Спробуємо визначити, наскільки індивідуальний профіль депутата К-ва корелює з еталонним профілем.

Таблиця 6.6

Усереднені еталонні оцінки виборців (п=77) та індивідуальні показники депутата К-ва за 18 особистісними якостями експрес-відеодіагностики

Найменування якості

Усереднені еталонні оцінки виборців

Індивідуальні показники депутата К-ва

1. Загальний рівень культури

2. Навчання

4. Здатність до творчості нового

5.. Самокритичність

6. Відповідальність

7. Самостійність

8. Енергія, активність

9. Цілеспрямованість

10. Витримка, самовладання

І. Стійкість

12. Особистісна зрілість

13. Порядність

14. Гуманізм

15. Вміння спілкуватися з людьми

16. Терпимість до чужої думки

17. Гнучкість поведінки

18. Здатність справляти сприятливе враження

Таблиця 6.7

Розрахунок d 2 для рангового коефіцієнта кореляції Спірмена між еталонним та індивідуальним профілями особистісних якостей депутата

Найменування якості

ранг якості в еталонному профілі

Ряд 2: ранг якості в індивідуальному профілі

d 2

1 Відповідальність

2 Порядність

3 Вміння спілкуватися з людьми

4 Витримка, самовладання

5 Загальний рівень культури

6 Енергія, активність

8 Самокритичність

9 Самостійність

10 Особистісна зрілість

І Цілеспрямованість

12 Навчання

13 Гуманізм

14 Терпимість до чужої думки

15 Стійкість

16 Гнучкість поведінки

17 Здатність справляти сприятливе враження

18 Здатність до творчості нового

Як видно з табл. 6.6, оцінки виборців та індивідуальні показники депутата варіюють у різних діапазонах. Дійсно оцінки виборців були отримані за 10-бальною шкалою, а індивідуальні показники з експрес-відеодіагностики вимірюються за 20-бальною шкалою. Ранжування дозволяє нам перевести обидві шкали виміру в єдину шкалу, де одиницею виміру буде 1 ранг, а максимальне значення становитиме 18 рангів.

Ранжування, як ми пам'ятаємо, необхідно зробити окремо по кожному ряду значень. В даному випадку доцільно нараховувати більшому значенню менший ранг, щоб одразу можна було побачити, на якому місці за значимістю (для виборців) або за виразністю (у депутата) є та чи інша якість.

Результати ранжирування представлені в Табл. 6.7. Якості перераховані у послідовності, що відображає еталонний профіль.

Сформулюємо гіпотези.

H 0: Кореляція між індивідуальним профілем депутата К-ва та еталонним профілем, побудованим за оцінками виборців, не відрізняється від нуля.

H 1: Кореляція між індивідуальним профілем депутата К-ва та еталонним профілем, побудованим за оцінками виборців, статистично значно відрізняється від нуля. Оскільки в обох порівнюваних рангових рядах присутні

групи однакових рангів, перед підрахунком коефіцієнта рангової

кореляції необхідно внести поправки на однакові ранги Та і Т b :

де а -обсяг кожної групи однакових рангів у ранговому ряду А,

b - обсяг кожної групи однакових рангів у ранговому ряду Ст.

В даному випадку, в ряду А (еталонний профіль) присутня одна група однакових рангів - якості "навчування" і "гуманізм" мають один і той же ранг 12,5; отже, а=2.

T а = (23-2) / 12 = 0,50.

У ряду В (індивідуальний профіль) є дві групи однакових рангів, при цьому b 1 =2 і b 2 =2.

Ta =[(2 3 -2)+(2 3 -2)]/12=1,00

Для підрахунку емпіричного значення rs використовуємо формулу

В даному випадку:

Зауважимо, що якби поправка на однакові ранги нами не вносилася, то величина r s була б лише (на 0,0002) вище:

При великих кількостях однакових рангів зміни г 5 можуть виявитися значно суттєвішими. Наявність однакових рангів означає менший ступінь диференційованого упорядкованих змінних і, отже, меншу можливість оцінити ступінь зв'язку між ними (Суходольський Г.В., 1972, с.76).

По Табл. XVI Додатка 1 визначаємо критичні значення г, при N=18:

Відповідь: Hq відкидається. Кореляція між індивідуальним профілем депутата К-ва та еталонним профілем, що відповідає вимогам виборців, статистично значуща (р<0,05) и является положи­тельной.

З Табл. 6.7 видно, що депутат К-в має нижчий ранг за шкалами Вміння спілкуватися з людьми і більш високі ранги за шкалами Цілеспрямованості та Стійкості, ніж це передбачається виборним зразком. Цими розбіжностями, головним чином, пояснюється деяке зниження отриманого r s .

Сформулюємо загальний алгоритм підрахунку rs.

Коефіцієнт кореляції Пірсона

Коефіцієнт r-Пірсона застосовується вивчення взаємозв'язку двох метричних змінних, виміряних однією і тієї ж вибірці. Існує безліч ситуацій, у яких доречне його застосування. Чи впливає інтелект на успішність старших курсів університету? Чи пов'язаний розмір заробітної плати працівника із його доброзичливістю до колег? Чи впливає настрій школяра на успішність розв'язання складного арифметичного завдання? Для відповіді на такі питання дослідник повинен виміряти два показники, що його цікавлять, у кожного члена вибірки.

На величину коефіцієнта кореляції впливає те, у яких одиницях виміру представлені ознаки. Отже, будь-які лінійні перетворення ознак (множення на константу, додавання константи) не змінюють значення коефіцієнта кореляції. Винятком є ​​множення однієї з ознак негативну константу: коефіцієнт кореляції змінює свій знак на протилежний.

Застосування кореляції Спірмена та Пірсона.

Кореляція Пірсона є мірою лінійного зв'язку між двома змінними. Вона дозволяє визначити, наскільки пропорційна мінливість двох змінних. Якщо змінні пропорційні один одному, то графічно зв'язок між ними можна подати у вигляді прямої лінії з позитивним (пряма пропорція) або негативним (зворотна пропорція) нахилом.

На практиці зв'язок між двома змінними, якщо він є, є імовірнісним і графічно виглядає як хмара розсіювання еліпсоїдної форми. Цей еліпсоїд, однак, можна уявити (апроксимувати) у вигляді прямої лінії, або лінії регресії. Лінія регресії - це пряма, побудована шляхом найменших квадратів: сума квадратів відстаней (обчислених по осі Y) від кожної точки графіка розсіювання до прямої є мінімальною.

Особливого значення для оцінки точності передбачення має дисперсія оцінок залежної змінної. По суті, дисперсія оцінок залежної змінної Y - це та частина її повної дисперсії, яка обумовлена ​​впливом незалежної змінної X. Інакше кажучи, відношення дисперсії оцінок залежної змінної до її істинної дисперсії дорівнює квадрату коефіцієнта кореляції.

Квадрат коефіцієнта кореляції залежної та незалежної змінних представляє частку дисперсії залежної змінної, обумовленої впливом незалежної змінної, і називається коефіцієнтом детермінації. Коефіцієнт детермінації, таким чином, показує, якою мірою мінливість однієї змінної обумовлена ​​(детермінована) впливом іншої змінної.

Коефіцієнт детермінації має важливу перевагу порівняно з коефіцієнтом кореляції. Кореляція не є лінійною функцією зв'язку між двома змінними. Тому, середнє арифметичне коефіцієнтів кореляції для кількох вибірок не збігається з кореляцією, обчисленою відразу всім випробовуваних із цих вибірок (тобто. коефіцієнт кореляції не аддитивний). Навпаки, коефіцієнт детермінації відбиває зв'язок лінійно і тому аддитивним: допускається його усереднення кількох вибірок.

Додаткову інформацію про силу зв'язку дає значення коефіцієнта кореляції у квадраті – коефіцієнт детермінації: це частина дисперсії однієї змінної, яка може бути пояснена впливом іншої змінної. На відміну від коефіцієнта кореляції, коефіцієнт детермінації лінійно зростає зі збільшенням сили зв'язку.

Коефіцієнти кореляції Спірмена та τ - Кендалла (рангові кореляції )

Якщо обидві змінні, між якими вивчається зв'язок, представлені у порядковій шкалі, або одна з них – у порядковій, а інша – у метричній, то застосовуються рангові коефіцієнти кореляції: Спірмена або τ - Кенделл. І той, і інший коефіцієнт вимагає для застосування попереднього ранжування обох змінних.

p align="justify"> Коефіцієнт рангової кореляції Спірмена - це непараметричний метод, який використовується з метою статистичного вивчення зв'язку між явищами. У цьому випадку визначається фактичний ступінь паралелізму між двома кількісними рядами ознак, що вивчаються, і дається оцінка тісноти встановленого зв'язку за допомогою кількісно вираженого коефіцієнта.

Якщо члени групи чисельністю були ранжировані спочатку змінною x, потім - змінною y, то кореляцію між змінними x і y можна отримати, просто обчисливши коефіцієнт Пірсона для двох рядів рангів. За умови відсутності зв'язків у рангах (тобто відсутності повторюваних рангів) за тією та іншою змінною, формула для Пірсона може бути суттєво спрощена у обчислювальному відношенні та перетворена на формулу, відому як Спірмена.

Потужність коефіцієнта рангової кореляції Спірмена дещо поступається потужністю параметричного коефіцієнта кореляції.

Коефіцієнт рангової кореляції доцільно застосовувати за наявності невеликої кількості спостережень. Даний метод може бути використаний не тільки для кількісно виражених даних, але також і у випадках, коли значення, що реєструються, визначаються описовими ознаками різної інтенсивності.

Коефіцієнт рангової кореляції Спірмена при великій кількості однакових рангів по одній або обох змінним, що зіставляється, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються.

Альтернативу кореляції Спірмена для рангів є кореляція τ - Кендалл. В основі кореляції, запропонованої М.Кендаллом, лежить ідея про те, що про напрям зв'язку можна судити, попарно порівнюючи між собою випробуваних: якщо у пари випробуваних зміна x збігається у напрямку зі зміною y, то це свідчить про позитивний зв'язок, якщо не збігається - то про негативний зв'язок.

Коефіцієнти кореляції були спеціально розроблені для чисельного визначення сили та напрями зв'язку між двома властивостями, виміряними у числових шкалах (метричних чи рангових). Як уже згадувалося, максимальній силі зв'язку відповідають значення кореляції +1 (суворий прямий або прямо пропорційний зв'язок) і -1 (суворий зворотний або обернено пропорційний зв'язок), відсутності зв'язку відповідає кореляція, що дорівнює нулю. Додаткову інформацію про силу зв'язку дає значення коефіцієнта детермінації: це частина дисперсії однієї змінної, яка може бути пояснена впливом іншої змінної.

9. Параметричні методи порівняння даних

Параметричні методи порівняння застосовуються у тому випадку, якщо ваші змінні були виміряні у метричній шкалі.

Порівняння дисперсій 2- х вибірок за критерієм Фішера .


Даний метод дозволяє перевірити гіпотезу про те, що дисперсії 2-х генеральних сукупностей, з яких вилучені порівнювані вибірки, відрізняються один від одного. Обмеження методу - розподілу ознаки обох вибірках нічого не винні відрізнятися від нормального.

Альтернативою порівняння дисперсій є критерій Лівена, для якого немає потреби у перевірці на нормальність розподілу. Даний метод може застосовуватися для перевірки припущення про рівність (гомогенність) дисперсій перед перевіркою достовірності відмінності середніх за критерієм Стьюдента для незалежних вибірок різної чисельності.

Кореляційний аналіз є методом, що дозволяє виявляти залежність між певною кількістю випадкових величин. Мета кореляційного аналізу, зводиться до виявлення оцінки сили зв'язків між такими випадковими величинами чи ознаками, що характеризують певні реальні процеси.

Сьогодні ми пропонуємо розглянути, як застосовується кореляційний аналіз Спірмена, для наочного відображення форм зв'язку в практичному трейдингу.

Кореляція за Спірменом чи основа кореляційного аналізу

Щоб зрозуміти, що таке кореляційний аналіз, спочатку слід усвідомити поняття кореляції.

При цьому, якщо ціна почне рухатися в потрібному напрямку, необхідно вчасно розлокувати позиції.


Для цієї стратегії основою якої покладено кореляційний аналіз, найкраще підходять торгові інструменти мають високий рівень кореляції (EUR/USD і GBP/USD, EUR/AUD і EUR/NZD, AUD/USD і NZD/USD, контракти CFD тощо) .

Відео: Застосування кореляції Спирмена на ринку Форекс

Поділіться з друзями або збережіть для себе:

Завантаження...