Метод кореляції спірмена. Рангова кореляція та коефіцієнт рангової кореляції спірмена

Калькулятор нижче обчислює коефіцієнт рангової кореляціїСпірмена між двома випадковими величинами. Теоретична частина, щоб не відволікатися від калькулятора, зазвичай розміщується під ним.

add import_export mode_edit delete

Зміни випадкових величин

arrow_upwardarrow_downward Xarrow_upwardarrow_downward Y
Розмір сторінки: 5 10 20 50 100 chevron_left chevron_right

Зміни випадкових величин

Імпортувати даніПомилка імпорту

Для поділу полів можна використовувати один із цих символів: Tab, ";" або "," Приклад: -50.5;-50.5

Імпортувати Назад Скасувати

Метод розрахунку коефіцієнта рангової кореляції Спірмена насправді описується дуже легко. Це той самий Коефіцієнт кореляції Пірсона, тільки розрахований не для результатів вимірювань випадкових величин, а для них рангових значень.

Тобто,

Залишилося тільки розібратися, що таке рангові значення і для чого це потрібно.

Якщо елементи варіаційного ряду розташувати у порядку зростання чи спадання, то рангомелемент буде його номер у цьому впорядкованому ряду.

Наприклад, нехай ми маємо варіаційний ряд (17,26,5,14,21). Відсортуємо його елементи у порядку зменшення (26,21,17,14,5). 26 має ранг 1, 21 – ранг 2 і т.д. Варіаційний ряд рангових значень виглядатиме так (3,1,5,4,2).

Тобто при розрахунку коефіцієнта Спірмена вихідні варіаційні рядиперетворюються на варіаційні ряди рангових значень, після чого до них застосовується формула Пірсона.

Є одна тонкість - ранг значень, що повторюються, береться як середнє з рангів. Тобто для ряду (17, 15, 14, 15) ряд рангових значень буде виглядати як (1, 2.5, 4, 2.5), так як перший елемент 15 має ранг 2, а другий - ранг 3, і .

Якщо ж повторюваних значень немає, тобто всі значення рангових рядів – числа з діапазону від 1 до n, формулу Пірсона можна спростити до

Ну і до речі, ця формула найчастіше наводиться як формула розрахунку коефіцієнта Спірмена.

У чому ж суть переходу від самих значень до рангових значень?
А суть у тому, що досліджуючи кореляцію рангових значень можна встановити наскільки добре залежність двох змінних описується монотонною функцією.

Знак коефіцієнта свідчить про напрям зв'язок між змінними. Якщо знак позитивний, значення Y мають тенденцію збільшуватися зі збільшенням значень X; якщо знак негативний, то значення Y мають тенденцію зменшуватися зі збільшенням значень X. Якщо коефіцієнт дорівнює 0, ніякої тенденції немає. Якщо коефіцієнт дорівнює 1 або -1, то залежність між X і Y має вигляд монотонної функції - тобто, при збільшенні X, Y також збільшується, або навпаки, при збільшенні X, Y зменшується.

Тобто, на відміну від коефіцієнта кореляції Пірсона, який може виявити лише лінійну залежність однієї змінної від іншої, коефіцієнт кореляції Спірмена може виявити монотонну залежність там, де безпосередній лінійний зв'язок не виявляється.

Поясню з прикладу. Припустимо, що досліджуємо функцію y=10/x.
У нас є наступні результати вимірювань X та Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Для цих даних коефіцієнт кореляції Пірсона дорівнює -0.4686, тобто зв'язок слабкий або відсутній. А ось коефіцієнт кореляції Спірмена строго дорівнює -1, що натякає досліднику, що Y має строгу негативну монотонну залежність від X.

Метод рангової кореляції Спірмена дозволяє визначити тісноту (силу) та напрямок кореляційного зв'язку між двома ознаками або двома профілями (ієрархіями) ознак.

Для підрахунку рангової кореляції необхідно мати два ряди значень,

які можуть бути проранжовані. Такими рядами значень можуть бути:

1) дві ознаки, виміряні в одній і тій же групі випробуваних;

2) дві індивідуальні ієрархії ознак, виявлені у двох піддослідних по одному й тому набору ознак;

3) дві групові ієрархії ознак,

4) індивідуальна та групова ієрархії ознак.

Спочатку показники ранжуються окремо за кожною ознакою.

Як правило, меншим значенням ознаки нараховується менший ранг.

У першому випадку (дві ознаки) ранжуються індивідуальні значення за першою ознакою, отримані різними випробуваними, а потім індивідуальні значення за другою ознакою.

Якщо дві ознаки пов'язані позитивно, то випробувані, що мають низькі ранги по одному з них, матимуть низькі ранги та по іншому, а випробувані, що мають високі ранги за

одній з ознак, матимуть за іншою ознакою також високі ранги. Для підрахунку rs необхідно визначити різниці (d) між рангами, отриманими даним випробуваним за обома ознаками. Потім ці показники d певним чином перетворюються і віднімаються з 1.

менше різниці між рангами, тим більше буде rs, тим ближче він буде до +1.

Якщо кореляція відсутня, всі ранги будуть перемішані і між ними не буде

жодної відповідності. Формула складена так, що в цьому випадку rs виявиться близьким до 0.

У разі негативної кореляції низьким рангам випробуваних за однією ознакою

будуть відповідати високі ранги за іншою ознакою, і навпаки. Чим більший розбіжність між рангами випробуваних за двома змінними, тим ближче rs до -1.

У другому випадку (два індивідуальні профілі), ранжуються індивідуальні

значення, отримані кожним з 2-х випробуваних за певним (однаковим для них обох) набором ознак. Перший ранг отримає ознаку з найнижчим значенням; другий ранг – ознака з вищим значенням тощо. Очевидно, що всі ознаки повинні бути виміряні в тих самих одиницях, інакше ранжування неможливо. Наприклад, неможливо проранжувати показники по опитувальнику Кеттелла (16PF), якщо вони виражені в "сирих" балах, оскільки за різними факторами діапазони значень різні: від 0 до 13, від 0 до

20 і від 0 до 26. Ми не можемо сказати, який із факторів буде займати перше місце за виразністю, поки не наведемо всі значення до єдиної шкали (найчастіше це шкала стін).

Якщо індивідуальні ієрархії двох піддослідних пов'язані позитивно, то ознаки, що мають низькі ранги в одного з них, матимуть низькі ранги і в іншого, і навпаки. Наприклад, якщо в одного випробуваного фактор Е (домінантність) має найнижчий ранг, то й у іншого випробуваного він повинен мати низький ранг, якщо в одного випробуваного фактор С

(емоційна стійкість) має вищий ранг, те й інший випробуваний повинен мати по

цьому чиннику високий ранг тощо.

У третьому випадку (два групових профілю), ранжуються середньогрупові значення, отримані в 2-х групах випробуваних за певним, однаковим для двох груп, набором ознак. Надалі лінія міркувань така сама, як і в попередніх двох випадках.

У випадку 4-му (індивідуальний та груповий профілі), ранжуються окремо індивідуальні значення випробуваного та середньогрупові значення за тим же набором ознак, які отримані, як правило, при виключенні цього окремого випробуваного – він не бере участі в середньогруповому профілі, з яким буде зіставлятися його індивідуальний профіль Рангова кореляція дозволить перевірити, наскільки узгоджено індивідуальний та груповий профілі.

У всіх чотирьох випадках значимість отриманого коефіцієнта кореляції визначається за кількістю ранжованих значень N. У першому випадку ця кількість співпадатиме з обсягом вибірки n. У другому випадку кількістю спостережень буде кількість ознак, що становлять ієрархію. У третьому і четвертому випадку N – це також кількість зіставних ознак, а чи не кількість випробуваних у групах. Детальні пояснення наведено в прикладах. Якщо абсолютна величина rs досягає критичного значення або перевищує його, кореляція є достовірною.

Гіпотези.

Можливі два варіанти гіпотез. Перший відноситься до випадку 1, другий - до трьох інших випадків.

Перший варіант гіпотез

H0: Кореляція між змінними А та Б не відрізняється від нуля.

H1: Кореляція між змінними А та Б достовірно відрізняється від нуля.

Другий варіант гіпотез

H0: Кореляція між ієрархіями А та Б не відрізняється від нуля.

H1: Кореляція між ієрархіями А та Б достовірно відрізняється від нуля.

Обмеження коефіцієнта рангової кореляції

1. По кожній змінній має бути представлено не менше 5 спостережень. Верхня межа вибірки визначається наявними таблицями критичних значень.

2. Коефіцієнт рангової кореляції Спірмена rs при великій кількості однакових рангів по одній або обох змінних, що зіставляються, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються. У разі, якщо цієї умови не дотримується, необхідно вносити поправку на однакові ранги.

Коефіцієнт рангової кореляції Спірмена підраховується за такою формулою:

Якщо в обох порівнюваних рангових рядах присутні групи однакових рангів, перед підрахунком коефіцієнта рангової кореляції необхідно внести поправки на однакові ранги Та і Тв:

Та = Σ (а3 - а) / 12,

Тв = Σ (в3 - в) / 12,

де а – обсяг кожної групи однакових рангів у ранговому ряду А, у – обсяг кожної

групи однакових рангів у ранговому ряду Ст.

Для підрахунку емпіричного значення rs використовують формулу:

Розрахунок коефіцієнта рангової кореляції Спірмена rs

1. Визначити, які дві ознаки або дві ієрархії ознак братимуть участь у

зіставленні як змінні А та Ст.

2. Проранжувати значення змінної А, нараховуючи ранг 1 найменшому значенню, відповідно до правил ранжування (див. П.2.3). Занести ранги у перший стовпець таблиці за порядком номерів випробуваних чи ознак.

3. Проранжувати значення змінної, відповідно до тих самих правил. Занести ранги у другий стовпець таблиці за порядком номерів випробуваних чи ознак.

5. Звести кожну різницю у квадрат: d2. Ці значення занести до четвертого стовпця таблиці.

Та = Σ (а3 - а) / 12,

Тв = Σ (в3 - в) / 12,

де а – обсяг кожної групи однакових рангів у ранговому ряду А; в – обсяг кожної групи

однакових рангів у ранговому ряду Ст.

а) за відсутності однакових рангів

rs  1 − 6 ⋅

б) за наявності однакових рангів

Σd 2  T  T

r  1 − 6 ⋅ a в,

де Σd2 – сума квадратів різниць між рангами; Та і Тв – поправки на однакові

N – кількість випробуваних чи ознак, що брали участь у ранжируванні.

9. Визначити по Таблиці (див. Додаток 4.3) критичні значення rs для даного N. Якщо rs перевищує критичне значення або, за Крайній мірі, дорівнює йому, кореляція достовірно відрізняється від 0

Приклад 4.1.При визначенні ступеня залежності реакції вживання алкоголю на окорухову реакцію в випробуваній групі були отримані дані до вживання алкоголю та після вживання. Чи залежить реакція випробуваного стану сп'яніння?

Результати експерименту:

До:16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Після: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Сформулюємо гіпотези:

Н0: кореляція між ступенем залежності реакції до вживання алкоголю і після не відрізняється від нуля.

Н1: кореляція між ступенем залежності реакції до вживання алкоголю та після достовірно відрізняється від нуля.

Таблиця 4.1. Розрахунок d2 для рангового коефіцієнта кореляції Спірмена rs при зіставленні показників окорухової реакції до експерименту та після (N=17)

значення

значення

Оскільки ми маємо повторювані ранги, то в даному випадку будемо застосовувати формулу з поправкою на однакові ранги:

Та = ((23-2) + (33-3) + (23-2) + (33-3) + (23-2) + (23-2)) / 12 = 6

Тb = ((23-2) + (23-2) + (33-3)) / 12 = 3

Знайдемо емпіричне значення коефіцієнта Спірмена:

rs = 1 - 6 * ((767,75 +6 +3) / (17 * (172-1))) = 0,05

За таблицею (додаток 4.3) знаходимо критичні значення коефіцієнта кореляції

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Отримуємо

rs=0,05∠rкр(0,05)=0,48

Висновок: Н1гіпотеза відкидається і приймається Н0. Тобто. кореляція між ступенем

залежність реакції до вживання алкоголю і після не відрізняється від нуля.

37. Коефіцієнт рангової кореляції Спірмена.

С. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Коефіцієнт рангової кореляції Спірмена використовується у випадках, коли:
- змінні мають рангову шкалувимірювання;
- розподіл даних занадто відрізняється від нормальногочи взагалі невідомо;
- вибірки мають невеликий обсяг (N< 30).

Інтерпретація рангового коефіцієнта кореляції Спірмена не відрізняється від коефіцієнта Пірсона, проте його сенс дещо відмінний. Щоб зрозуміти відмінність цих методів і логічно обґрунтувати сфери їх застосування порівняємо їх формули.

Коефіцієнт кореляції Пірсона:

Коефіцієнт кореляції Спірмена:

Як бачимо, формули значно різняться. Порівняємо формули

У формулі кореляції Пірсона використовується середнє арифметичне та стандартне відхилення корелюваних рядів, а у формулі Спірмена не використовується. Таким чином, для отримання адекватного результату за формулою Пірсона, необхідно, щоб корелювані ряди були наближені до нормального розподілу (середнє та стандартне відхилення є параметрами нормального розподілу ). Для формули Спірмена це актуально.

Елементом формули Пірсона є стандартизація кожного ряду z-шкалу.

Як бачимо, переведення змінних у Z-шкалу є у формулі коефіцієнта кореляції Пірсона. Відповідно, для коефіцієнта Пірсона абсолютно не має значення масштаб даних: наприклад, ми можемо корелювати дві змінні, одна з яких має хв. = 0 та макс. = 1, а друга хв. = 100 та макс. = 1000. Як би розрізнявся розмах діапазону значень, всі вони будуть переведені в стандартні z-значення однакові за своїм масштабом.

У коефіцієнті Спірмена такої нормалізації немає, тому

ОБОВ'ЯЗКОВИМ УМОВОМ ВИКОРИСТАННЯ КОЕФІЦІЄНТА СПІРМЕНА Є РІВНІСТЬ РОЗМАХУ ДВОХ ЗМІННИХ.

Перед використанням коефіцієнта Спірмена для рядів даних з різним розмахом необхідно обов'язково їх ранжувати. Ранжування призводить до того, що значення цих рядів набувають однакового мінімуму = 1 (мінімальний ранг) і максимум, що дорівнює кількості значень (максимальний, останній ранг = N, тобто. максимальної кількостівипадків у вибірці).

У яких випадках можна обійтись без ранжування

Це випадки, коли дані мають вихідно рангову шкалу. Наприклад, тест ціннісних орієнтаційРокича.

Також, це випадки, коли кількість варіантів значень невелика і у вибірці є фіксовані мінімум і максимум. Наприклад, у семантичному диференціалі мінімум = 1, максимум = 7.

Приклад розрахунку рангового коефіцієнта кореляції Спірмена

Тест ціннісних орієнтацій Рокича провели на двох вибірках Xи Y. Завдання: дізнатися, наскільки близькі ієрархії цінностей даних вибірок (буквально – скільки вони схожі).

Отримане значення r=0,747 перевіряється за таблиці критичних значень. Згідно з таблицею, при N=18, отримане значення достовірно на рівні p<=0,005

Рангові коефіцієнти кореляції за Спірманом та Кендалом

Для змінних, що належать до порядкової шкали або для змінних, що не підкоряються нормальному розподілу, а також для змінних, що належать до інтервальної шкали, замість коефіцієнта Пірсона розраховується рангова кореляція за Спірманом. І тому окремим значенням змінних присвоюються рангові місця, які згодом обробляються з допомогою відповідних формул. Щоб виявити рангову кореляцію, заберіть у діалоговому вікні Bivariate Correlations... (Парні кореляції) позначку для розрахунку кореляції за Пірсоном, встановлену за замовчуванням. Натомість активуйте розрахунок кореляції Спірмана. Це розрахунок дасть такі результати. Коефіцієнти рангової кореляції дуже близькі до відповідних значень коефіцієнтів Пірсона (початкові змінні мають нормальний розподіл).

titkova-matmetody.pdf с. 45

Метод рангової кореляції Спірмена дозволяє визначити тісноту (силу) та напрямок

кореляційного зв'язку між двома ознакамиабо двома профілями (ієрархіями)ознак.

Для підрахунку рангової кореляції необхідно мати два ряди значень,

які можуть бути проранжовані. Такими рядами значень можуть бути:

1) дві ознаки,виміряні в одній і тій же групівипробуваних;

2) дві індивідуальні ієрархії ознак,виявлені у двох піддослідних по тому самому

набору ознак;

3) дві групові ієрархії ознак,

4) індивідуальна та груповаієрархії ознак.

Спочатку показники ранжуються окремо за кожною ознакою.

Як правило, меншим значенням ознаки нараховується менший ранг.

У першому випадку (дві ознаки) ранжуються індивідуальні значення за першим

ознакою, отриманими різними випробуваними, а потім індивідуальними значеннями по другому

ознакою.

Якщо дві ознаки пов'язані позитивно, то випробувані, що мають низькі ранги по

одному з них, будуть мати низькі ранги і по іншому, а випробувані, що мають високі ранги за

одній з ознак, матимуть за іншою ознакою також високі ранги. Для підрахунку rs

необхідно визначити різниці (d)між рангами, отриманими даним випробуваним по обом

ознак. Потім ці показники d певним чином перетворюються і віднімаються з 1.

менше різниці між рангами, тим більше буде rs, тим ближче він буде до +1.

Якщо кореляція відсутня, всі ранги будуть перемішані і між ними не буде

жодної відповідності. Формула складена так, що в цьому випадку rs виявиться близьким до 0.

У разі негативної кореляціїнизьким рангам випробуваних за однією ознакою

будуть відповідати високі ранги за іншою ознакою, і навпаки. Чим більший розбіжність

між рангами випробуваних за двома змінними, тим ближче rs до -1.

У другому випадку (два індивідуальні профілі), ранжуються індивідуальні

значення, отримані кожним з 2-х випробуваних за певним (однаковим для них

обох) набору ознак. Перший ранг отримає ознаку з найнижчим значенням; другий ранг -

ознака з вищим значенням тощо. Очевидно, що всі ознаки повинні бути виміряні в

одних і тих самих одиницях, інакше ранжування неможливе. Наприклад, неможливо

проранжувати показники по опитувальнику Кеттелла (16PF), якщо вони виражені в

"сирих" балах, оскільки з різних факторів діапазони значень різні: від 0 до 13, від 0 до

20 і від 0 до 26. Ми не можемо сказати, який з факторів займатиме перше місце по

виразності, поки не наведемо всі значення до єдиної шкали (найчастіше це шкала стін).

Якщо індивідуальні ієрархії двох піддослідних пов'язані позитивно, ознаки,

мають низькі ранги в одного з них, матимуть низькі ранги і в іншого, і навпаки.

Наприклад, якщо в одного випробуваного фактор Е (домінантність) має найнижчий ранг, то й у

іншого випробуваного він повинен мати низький ранг, якщо в одного випробуваного фактор С

(емоційна стійкість) має вищий ранг, те й інший випробуваний повинен мати по

цьому чиннику високий ранг тощо.

У третьому випадку (два групових профілю), ранжуються середньогрупові значення,

отримані в 2-х групах випробуваних за певним, однаковим для двох груп, набором

ознак. Надалі лінія міркувань така сама, як і в попередніх двох випадках.

У випадку 4-му (індивідуальний та груповий профілі), ранжуються окремо

індивідуальні значення випробуваного та середньогрупові значення за тим же набором

ознак, які отримані, як правило, при виключенні цього окремого випробуваного – він

не бере участі в середньогруповому профілі, з яким зіставлятиметься його індивідуальний

профіль. Рангова кореляція дозволить перевірити, наскільки узгоджені індивідуальні та

груповий профілі.

У всіх чотирьох випадках значимість отриманого коефіцієнта кореляції визначається

за кількістю ранжованих значень N.У першому випадку ця кількість співпадатиме з

обсягом вибірки n. У другому випадку кількістю спостережень буде кількість ознак,

складових ієрархію. У третьому та четвертому випадку N – це також кількість зіставних

ознак, а чи не кількість випробуваних у групах. Детальні пояснення наведено в прикладах. Якщо

абсолютна величина rs досягає критичного значення або перевищує його, кореляція

достовірна.

Гіпотези.

Можливі два варіанти гіпотез. Перший відноситься до випадку 1, другий - до трьох інших

Перший варіант гіпотез

H0: Кореляція між змінними А та Б не відрізняється від нуля.

H2: Кореляція між змінними А та Б достовірно відрізняється від нуля.

Другий варіант гіпотез

H0: Кореляція між ієрархіями А та Б не відрізняється від нуля.

H2: Кореляція між ієрархіями А та Б достовірно відрізняється від нуля.

Обмеження коефіцієнта рангової кореляції

1. По кожній змінній має бути представлено не менше 5 спостережень. Верхня

межа вибірки визначається наявними таблицями критичних значень .

2. Коефіцієнт рангової кореляції Спірмена rs за великої кількості однакових

рангів по одній або обох змінним, що зіставляється, дає огрублені значення. В ідеалі

обидва корелювані ряди повинні являти собою дві послідовності несхожих

значень. У разі, якщо цієї умови не дотримується, необхідно вносити поправку на

однакові ранги.

Коефіцієнт рангової кореляції Спірмена підраховується за такою формулою:

Якщо в обох зіставних рангових рядах присутні групи однакових рангів,

перед підрахунком коефіцієнта рангової кореляції необхідно внести поправки на однакові

ранги Та і Тв:

Та = Σ (а3 - а) / 12,

Тв = Σ (в3 - в) / 12,

де а –обсяг кожної групи однакових рангів у ранговому ряду А, обсяг кожної

групи однакових рангів у ранговому ряду Ст.

Для підрахунку емпіричного значення rs використовують формулу:

38. Точково-бісеріальний коефіцієнт кореляції.

Про кореляцію взагалі див. питання № 36с. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Нехай змінна X виміряна у сильній шкалі, а змінна Y – у дихотомічній. Точковий бісеріальний коефіцієнт кореляції rpb обчислюється за такою формулою:

Тут x 1 - Середнє значення по Х об'єктів зі значенням «одиниця» по Y;

x 0 – середнє значення Х об'єктів зі значенням «нуль» по Y;

s х - Середнє квадратичне відхилення всіх значень по Х;

n 1 – число об'єктів «одиниця» за Y, n 0 – число об'єктів «нуль» за Y;

n = n 1 + n 0 – обсяг вибірки.

Точковий бісеріальний коефіцієнт кореляції можна розрахувати також за допомогою інших еквівалентних виразів:

Тут x– загальне середнє значення змінної Х.

Точковий бісеріальний коефіцієнт кореляції rpbзмінюється не більше –1 до +1. Його значення дорівнює нулю в тому випадку, якщо змінні з одиницею по Yмають середнє по Y, що дорівнює середньому змінних з нулем по Y.

Перевірка гіпотези про значимістьточкового бісеріального коефіцієнта кореляції полягає у перевірці нульової гіпотезиh 0 про рівність генерального коефіцієнта кореляції нулю: ρ = 0, що здійснюється за допомогою критерію Стьюдента. Емпіричне значення

порівнюється з критичними значеннями t a (df) для числа ступенів свободи df = n– 2

Якщо виконується умова | t| ≤ (df), нульова гіпотеза ρ = 0 не відкидається. Точковий бісеріальний коефіцієнт кореляції істотно відрізняється від нуля, якщо емпіричне значення | t| потрапляє у критичну область, тобто якщо виконується умова | t| > (n- 2). Достовірність зв'язку, розрахованого за допомогою точкового бісеріального коефіцієнта кореляції rpb, можна визначити також за допомогою критерію χ 2 для числа ступенів свободи df= 2.

Точково-бісеріальна кореляція

Наступна модифікація коефіцієнта кореляції твору моментів отримала відображення у точково бісеріальному r. Ця стаття. показує зв'язок між двома змінними, одна з яких брало імовірно безперервна і нормально розподілена, а ін. яв-ся дискретної в точному сенсі слова. Точково-бісеріальний коефіцієнт кореляції позначається через r pbisОскільки в r pbisдихотомія відбиває справжню природу дискретної змінної, а чи не яв-ся штучної, як у разі r bisйого знак визначається довільно. Тому всім практ. цілей r pbisрозглядається у діапазоні від 0,00 до +1,00.

Існує і такий випадок, коли дві змінні вважаються безперервними та нормально розподіленими, але обидві штучно дихотомізовані, як у разі бісеріальної кореляції. Для оцінки зв'язку між такими змінними застосовується тетрахоричний коефіцієнт кореляції r tet, який був також виведений Пірсоном. основ. (точні) формули та процедури для обчислення r tetдосить складні. Тому за практ. застосування цього методу використовуються наближення r tet, одержувані з урахуванням скорочених процедур і таблиць.

/on-line/dictionary/dictionary.php?term=511

ТОЧКОВО-БІСЕРІАЛЬНИЙ КОЕФІЦІЄНТ КОРРЕЛЯЦІЇ- це коефіцієнт кореляції між двома змінними, одна з яких виміряна у дихотомічній шкалі, а інша – в інтервальній шкалі. Застосовується в класичній та сучасній тестології як показник якості тестового завдання – надійності-узгодженості з загальним баломза тестом.

Для корелювання змінних, виміряних у дихотомічної та інтервальної шкаливикористовують точково-бісеріальний коефіцієнт кореляції.
Точково-бісеріальний коефіцієнт кореляції – це метод кореляційного аналізувідносини змінних, одна з яких виміряна в шкалі найменувань і приймає лише 2 значення (наприклад, чоловіка/жінки, відповідь вірна/відповідь невірна, ознака є/ознака немає), а друга в шкалі стосунків або інтервальній шкалі. Формула розрахунку коефіцієнта точково-бісеріальної кореляції:

Де:
m1 і m0 - середні значення Х зі значенням 1 або 0 Y.
σx – стандартне відхилення всіх значень по Х
n1, n0 – кількість значень Х з 1 або 0 Y.
n – загальна кількість пар значень

Найчастіше цей вид коефіцієнта кореляції застосовується до розрахунку зв'язку пунктів тесту з сумарною шкалою. Це один із видів перевірки валідності.

39. Рангово-бісеріальний коефіцієнт кореляції.

Про кореляцію взагалі див. питання № 36с. 56 (64) 063.JPG

harchenko-korranaliz.pdf с. 28

Рангово-бісеріальний коефіцієнт кореляції, що використовується у випадках, коли одна із змінних ( Х) представлена ​​в порядковій шкалі, а інша ( Y) – у дихотомічній, обчислюється за формулою

.

Тут – середній ранг об'єктів, що мають одиницю по Y; - Середній ранг об'єктів з нулем по Y, n- Обсяг вибірки.

Перевірка гіпотези про значимістьрангово-бісеріального коефіцієнта кореляції здійснюється аналогічно точковому бісеріальному коефіцієнту кореляції за допомогою критерію Стьюдента із заміною у формулах rpbна rrb.

У тих випадках, коли одна змінна вимірюється у дихотомічній шкалі (змінна X),а інша в ранговій шкалі (змінна У), використовується рангово-бісеріальний коефіцієнт кореляції. Ми пам'ятаємо, що змінна X,виміряна в дихотомічній шкалі, приймає лише два значення (коду) 0 і 1. Особливо підкреслимо: незважаючи на те, що цей коефіцієнт змінюється в діапазоні від -1 до +1, його знак для інтерпретації результатів не має значення. Це ще один виняток із загального правила.

Розрахунок цього коефіцієнта провадиться за формулою:

де ` X 1середній ранг за тими елементами змінної Y, яким відповідає код (ознака) 1 у змінній Х;

`X 0– середній ранг за тими елементами змінної Y,яким відповідає код (ознака) 0 у змінній Х\

N –загальна кількість елементів у змінній X.

Для застосування рангово-бісеріального коефіцієнта кореляції необхідно дотримуватись наступних умов:

1. Змінні змінні повинні бути виміряні в різних шкалах: одна X –у дихотомічній шкалі; інша Y-у ранговій шкалі.

2. Число варіюючих ознак у порівнюваних змінних Xі Yмає бути однаковим.

3. Для оцінки рівня достовірності рангово-бісеріального коефіцієнта кореляції слід користуватися формулою (11.9) та таблицею критичних значень для критерію Стьюдентапрі k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Випадки, коли одна із змінних представлена ​​в дихотомічній шкалі, а інша в ранговий (порядковий), Вимагають застосування коефіцієнта рангово-бісеріальної кореляції:

rpb = 2 / n * (m1 - m0)

де:
n – кількість об'єктів виміру
m1 та m0 - середній ранг об'єктів з 1 або 0 по другій змінній.
Цей коефіцієнт також застосовується під час перевірки валідності тестів.

40. Коефіцієнт лінійної кореляції.

Про кореляцію взагалі (і зокрема про лінійну саме) див. питання № 36с. 56 (64) 063.JPG

КОЕФІЦІЄНТ КОРРЕЛЯЦІЇ г-ПІРСОНА

r-Пірсона (Pearson r) застосовується для вивчення взаємозв'язку двох метрич-ких змінних, виміряних на одній і тій же вибірці.Існує безліч ситуацій, у яких доречне його застосування. Чи впливає інтелект на успішність на старших курсах університету? Чи пов'язаний розмір заробітної плати працівника з його доброзичливістю до колег? Чи впливає настрій школяра на успішність розв'язання складного арифметичного завдання? Для відповіді на подібні питання дослідник повинен виміряти два цікаві для його показника у кожного члена вибірки. Дані вивчення взаємозв'язку потім зводяться в таблицю, як у наведеному нижче прикладі.

ПРИКЛАД 6.1

У таблиці наведено приклад вихідних даних вимірювання двох показників інтелекту (вербального та невербального) у 20 учнів 8-го класу.

Зв'язок між цими змінними можна зобразити за допомогою діаграми розсіювання (див. рис. 6.3). Діаграма показує, що існує деякий взаємозв'язок виміряних показників: чим більше значення вербального інтелекту, тим (переважно) більше значення невербального інтелекту.

Перш ніж дати формулу коефіцієнта кореляції, спробуємо простежити логіку її виникнення, використовуючи дані прикладу 6.1. Положення кожної /-точки (випробуваного з номером /) на діаграмі розсіювання щодо інших точок (рис. 6.3) може бути задано величинами і знаками відхилень відповідних значень змінних від своїх середніх величин: (xj - MJ і (у, -М у ). Якщо знаки цих відхилень збігаються, це свідчить на користь позитивного взаємозв'язку (великим значенням по хвідповідають великі значення по уабо меншим значенням по хвідповідають менші значення по у).

Для випробуваного № 1 відхилення від середнього по хі по упозитивне, а випробуваного № 3 і те й інше відхилення негативні. Отже, дані того й іншого свідчать про позитивний взаємозв'язок досліджуваних ознак. Навпаки, якщо знаки відхилень від середніх по хі по урізняться, це свідчить про негативної взаємозв'язку між ознаками. Так, для випробуваного № 4 відхилення від середнього по хє негативним, за у -позитивним, а для випробуваного №9 – навпаки.

Таким чином, якщо добуток відхилень (х,- М х ) х (у, - М у ) позитивне, то дані /-випробуваного свідчать про прямий (позитивний) взаємозв'язок, а якщо негативне - то про зворотний (негативний) взаємозв'язок. Відповідно, якщо хwу ъосновному пов'язані прямо пропорційно, більшість творів відхилень буде позитивним, і якщо вони пов'язані зворотним співвідношенням, більшість творів буде негативним. Отже, загальним показникомдля сили та напрями взаємозв'язку може бути сума всіх творів відхилень для даної вибірки:

При прямо пропорційному зв'язку між змінними ця величина є великою і позитивною - для більшості випробуваних відхилення збігаються за знаком (великим значенням однієї змінної відповідають великі значення інший змінної і навпаки). Якщо ж хі умають зворотний зв'язок, то для більшості випробуваних великим значенням однієї змінної будуть відповідати менші значення іншої змінної, тобто знаки творів будуть негативними, а сума творів в цілому буде теж великий за абсолютною величиною, але негативною за знаком. Якщо систематичного зв'язку між змінними нічого очікувати спостерігатися, то позитивні доданки (твори відхилень) врівноважаться негативними доданками, і сума всіх творів відхилень буде близька до нуля.

Щоб сума творів не залежала від обсягу вибірки, достатньо її усереднити. Але міра взаємозв'язку нас цікавить не як генеральний параметр, бо як його оцінка - статистика. Тому, як і для формули дисперсії, в цьому випадку вчинимо також, ділимо суму творів відхилень не на N, а на TV-1. Виходить міра зв'язку, що широко застосовується у фізиці та технічних науках, яка називається підступністю (Covahance):


У психології, на відміну фізики, більшість змінних вимірюються в довільних шкалах, оскільки психологів цікавить не абсолютне значення ознаки, а взаємне розташуваннявипробуваних у групі. До того ж коваріація дуже чутлива до масштабу шкали (дисперсії), де виміряно ознаки. Щоб зробити міру зв'язку незалежною від одиниць виміру того й іншого ознаки, досить розділити коваріацію на відповідні стандартні відхилення. Таким чином і було отримано фор-мула коефіцієнта кореляції К. Пірсона:

або, після підстановки виразів для х і


Якщо значення тієї та іншої змінної були перетворені на г-значення за формулою


то формула коефіцієнта кореляції r-Пірсона виглядає простіше (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

КОРЕЛЯЦІЯ ЛІНІЙНА- статистичний лінійний зв'язок непричинного характеру між двома кількісними змінними хі у. Вимірюється за допомогою "коефіцієнта К.Л." Пірсона, який є результатом поділу коваріації на стандартні відхилення обох змінних:

,

де s xy- коваріація між змінними хі у;

s x , s y- стандартні відхилення для змінних хі у;

x i , y i- значення змінних хі удля об'єкта з номером i;

x, y- середні арифметичні для змінних хі у.

Коефіцієнт Пірсона rможе набувати значення з інтервалу [-1; +1]. Значення r = 0означає відсутність лінійного зв'язку між змінними хі у(але не виключає статистичного зв'язку нелінійного). Позитивні значеннякоефіцієнта ( r> 0) свідчать про прямий лінійний зв'язок; що ближче його значення до +1, то сильніший зв'язок статистична пряма. Від'ємні значеннякоефіцієнта ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 означають наявність повного лінійного зв'язку, прямого або зворотного. У разі повного зв'язку всі точки з координатами ( x i , y i) лежать на прямій y = a + bx.

"Коефіцієнт К.Л." Пірсона застосовується також для вимірювання тісноти зв'язку в моделі регресії лінійної парної.

41. Кореляційна матриця та кореляційний граф.

Про кореляцію взагалі див. питання № 36с. 56 (64) 063.JPG

Кореляційна матриця.Часто кореляційний аналіз включає вивчення зв'язків не двох, а безлічі змінних, виміряних в кількісної шкалі на одній вибірці. У цьому випадку обчислюються кореляції для кожної пари з цієї множини змінних. Обчислення зазвичай проводяться на комп'ютері, а результатом є кореляційна матриця.

Кореляційна матриця(Correlation Matrix) - це результат обчислення кореляцій одного типу для кожної пари з множини Рзмінних, виміряних в кількісній шкалі на одній вибірці.

ПРИКЛАД

Припустимо, вивчаються зв'язки між 5 змінними (vl, v2,..., v5; P= 5), виміряними на вибірці чисельністю N=30людина. Нижче наведена таблиця вихідних даних і кореляційна матриця.

І
подібні дані:

Кореляційна матриця:

Неважко помітити, що кореляційна матриця є квадратною, симетричною відносно головної діагоналі (таккакг, у = /) у), з одиницями на головній діагоналі (бо г і = Гу = 1).

Кореляційна матриця є квадратної:число рядків і стовпців дорівнює кількості змінних. Вона симетричнащодо головної діагоналі, оскільки кореляція хз удорівнює кореляції уз х.На її головній діагоналі розташовуються одиниці, оскільки кореляція ознаки із собою дорівнює одиниці. Отже, аналізу підлягають не всі елементи кореляційної матриці, а ті, які знаходяться вище або нижче головної діагоналі.

Кількість коефіцієнтів кореляції,підлягають аналізу щодо зв'язків Рпризнаків визначається формулою: Р(Р- 1)/2. У наведеному прикладі кількість таких коефіцієнтів кореляції 5(5 - 1)/2 = 10.

Основне завдання аналізу кореляційної матриці -виявлення структури взаємозв'язків безлічі ознак. При цьому можливий візуальний аналіз кореляційних плеяд- графічного зображення структури статистичнозначних зв'язків,якщо таких зв'язків дуже багато (до 10-15). Інший спосіб - застосування багатовимірних методів: множинного регресійного, факторного або кластерного аналізу (див. розділ «Багатомірні методи ...»). Застосовуючи факторний або кластерний аналіз, можна виділити угруповання змінних, які тісніше пов'язані один з одним, ніж з іншими змінними. Дуже ефективним є і поєднання цих методів, наприклад, якщо ознак багато і вони не однорідні.

Порівняння кореляцій -додаткове завдання аналізу кореляційної матриці, що має два варіанти. Якщо необхідно порівняння кореляцій в одному з рядків кореляційної матриці (для однієї зі змінних), застосовується метод порівняння для залежних вибірок (с. 148-149). При порівнянні однойменних кореляцій, обчислених для різних вибірок, застосовується метод порівняння для незалежних вибірок (с. 147-148).

Методи порівняннякореляцій у діагоналяхкореляційної матриці (для оцінки стаціонарності випадкового процесу) та порівняння кількохкореляційних матриць, отриманих для різних вибірок (на предмет їх однорідності), є трудомісткими і виходять за рамки цієї книги. Познайомитись з цими методами можна за книгою Г. В. Суходольського 1 .

Проблема статистичної значимостікореляцій.Проблема полягає в тому, що процедура статистичної перевіркигіпотези передбачає одне-кратневипробування, проведене однією вибірці. Якщо той самий метод застосовується багаторазово,нехай навіть щодо різних змінних, то збільшується ймовірність отримати результат чисто випадково. У загальному випадку, якщо ми повторюємо той самий метод перевірки гіпотези разщодо різних змінних або вибірок, то при встановленій величині а ми гарантовано отримаємо підтвердження гіпотези в ахкчисла випадків.

Припустимо, аналізується кореляційна матриця для 15 змінних, тобто обчислено 15(15-1)/2 = 105 коефіцієнтів кореляції. Для перевірки гіпотез встановлено рівень а = 0,05. Перевіряючи гіпотезу 105 разів, ми п'ять разів (!) отримаємо її підтвердження незалежно від того, чи існує зв'язок насправді. Знаючи це і отримавши, скажімо, 15 «статистично достовірних» коефіцієнтів кореляції, чи зможемо ми сказати, які з них отримані випадково, а які - відбивають реальний зв'язок?

Строго кажучи, для ухвалення статистичного рішеннянеобхідно зменшити рівень а в стільки разів, скільки гіпотез перевіряється. Але навряд чи це доцільно, тому що непередбачуваним чином збільшується ймовірність проігнорувати реально існуючий зв'язок (припуститися помилки II роду).

Одна тільки кореляційна матриця не є достатньою основоюдля статистичних висновків щодо входять до неї окремих коефіцієнтів.цієнтів кореляцій!

Можна вказати лише один дійсно переконливий спосіб вирішення цієї проблеми: розділити вибірку випадковим чином на дві частини і приймати до уваги тільки ті кореляції, які статистично значущі в обох частинах вибірки. Альтернативою може бути використання багатовимірних методів (факторного, кластерного або множинного регресійного аналізу) - для виділення і подальшої інтерпретації груп статистично значимо пов'язаних змінних.

Проблема пропущених значень.Якщо даних є пропущені значення, то можливі два варіанти розрахунку кореляційної матриці: а) посрочное видалення значень (Excludecaseslistwise); б) попарне видалення значень (Excludecasespairwise). При порядковому видаленніспостережень з перепустками видаляється весь рядок для об'єкта (випробуваного), який має хоча б одне пропущене значення за однією зі змінних. Цей спосіб призводить до «правильної» кореляційної матриці в тому сенсі, що всі коефіцієнти обчислені по одному і тому ж безлічі об'єктів. Однак якщо пропущені значення розподілені випадковим чином змінних, то даний методможе призвести до того, що в множині даних, що розглядається, не залишиться жодного об'єкта (у кожному рядку зустрінеться, принаймні, одне пропущене значення). Щоб уникнути подібної ситуації, використовують інший спосіб, який називають попарним видаленням.У цьому способі враховуються лише перепустки в кожній вибраній парі стовпців-змінних і ігноруються перепустки в інших змінних. Кореляція для пари змінних обчислюється за тими об'єктами, де немає перепусток. У багатьох ситуаціях, особливо коли кількість перепусток відносно мала, скажімо 10%, і перепустки розподілені досить хаотично, цей метод не призводить до серйозних помилок. Однак, іноді це не так. Наприклад, у систематичному зміщенні (зрушенні) оцінки може «ховатися» систематичне розташування перепусток, що є причиною відмінності коефіцієнтів кореляції, побудованих за різними підмножинами (наприклад - для різних підгруп об'єктів). Інша проблема, пов'язана з кореляційною матрицею, обчисленою при попарномувидалення перепусток, виникає при використанні цієї матриці в інших видах аналізу (наприклад, у множинному регресійному або факторному аналізі). У них передбачається, що використовується «правильна» кореляційна матриця з певним рівнем спроможності та «відповідності» різних коефіцієнтів. Використання матриці з «поганими» (зміщеними) оцінками призводить до того, що програма або не в змозі аналізувати таку матрицю, або результати будуть помилковими. Тому, якщо застосовується попарний метод виключення пропущених даних, необхідно перевірити, чи є чи ні систематичні закономірності у розподілі перепусток.

Якщо попарне виключення пропущених даних не призводить до будь-якого систематичного зсуву середніх значень та дисперсій (стандартних відхилень), то ці статистики будуть схожі на аналогічні показники, обчислені при строковому способі видалення перепусток. Якщо спостерігається значну відмінність, тобто підставу припускати наявність зсуву в оцінках. Наприклад, якщо середнє (або стандартне відхилення) значень змінної А,яке використовувалося при обчисленні її кореляції зі змінною В,набагато менше середнього (або стандартного відхилення) тих же значень змінної А,які використовувалися при обчисленні її кореляції з пе-ременной С, то є всі підстави очікувати, що ці дві кореляції (А-ВнА-С)засновані на різних підмножинах даних. У кореляціях буде зрушення, викликане невипадковим розташуванням перепусток у значеннях змінних.

Аналіз кореляційних плеяд.Після вирішення проблеми статистичної значимості елементів кореляційної матриці статистично значущі кореляції можна представити графічно у вигляді кореляційної плеяди або плеяд. Кореляційна плеядаце фігура, що складається з вершин і ліній, що їх з'єднують. Вершини відповідають ознакам і позначаються зазвичай цифрами - номерами змінних. Лінії відповідають статистично достовірним зв'язкам і графічно виражають знак, інколи ж - і /j-рівень значущості зв'язку.

Кореляційна плеяда може відображати всістатистично значущі зв'язки кореляційної матриці (іноді називається кореляційним графом ) або тільки їх змістовно виділену частину (наприклад, відповідну одному фактору за результатами факторного аналізу).

ПРИКЛАД ПОБУДУВАННЯ КОРРЕЛЯЦІЙНОЇ ПЛЕЯДИ


Підготовка до проведення державної (підсумкової) атестації випускників: формування бази ЄДІ (загальний список учасників ЄДІ всіх категорій із зазначенням предметів) – з урахуванням резервних днів у разі збігу предметів;

  • План роботи (27)

    Рішення

    2. Діяльність ОУ з удосконалення змісту та оцінки якості з предметів природничо-математичної освіти МОУ ЗОШ № 4, Литвинівська, Чапаєвська,

  • Насправді визначення тісноти зв'язку двох ознак часто застосовується коефіцієнт рангової кореляції Спірмена (Р). Значення кожної ознаки ранжуються за ступенем зростання (від 1 до n), потім визначається різниця (d) між рангами, які відповідають одному спостереженню.

    Приклад №1. Залежність між обсягом промислової продукції та інвестиціями в основний капітал по 10 областях одного з федеральних округів РФ у 2003 році характеризується такими даними.
    Обчисліть рангові коефіцієнтикореляції Спірменаі Кендела. Перевірити їх значення при α=0,05. Сформулюйте висновок про залежність між обсягом промислової продукції та інвестиціями в основний капітал за аналізованими областями РФ.

    Надамо ранги ознакою Y і фактору X . Знайдемо суму різниці квадратів d 2 .
    Використовуючи калькулятор, обчислимо коефіцієнт рангової кореляції Спірмена:

    X Y ранг X, d x ранг Y, d y (d x - d y) 2
    1.3 300 1 2 1
    1.8 1335 2 12 100
    2.4 250 3 1 4
    3.4 946 4 8 16
    4.8 670 5 7 4
    5.1 400 6 4 4
    6.3 380 7 3 16
    7.5 450 8 5 9
    7.8 500 9 6 9
    17.5 1582 10 16 36
    18.3 1216 11 9 4
    22.5 1435 12 14 4
    24.9 1445 13 15 4
    25.8 1820 14 19 25
    28.5 1246 15 10 25
    33.4 1435 16 14 4
    42.4 1800 17 18 1
    45 1360 18 13 25
    50.4 1256 19 11 64
    54.8 1700 20 17 9
    364

    Зв'язок між ознакою Y фактором X сильний і прямий.

    Оцінка коефіцієнта рангової кореляції Спірмена



    По таблиці Стьюдента знаходимо Tтабл.
    T табл = (18; 0.05) = 1.734
    Оскільки Tнабл > Tтабл, то відхиляємо гіпотезу про рівність нулю коефіцієнта рангової кореляції. Інакше кажучи, коефіцієнта рангової кореляції Спірмена статистично - значущий.

    Інтервальна оцінка для коефіцієнта рангової кореляції (довірчий інтервал)
    Довірчий інтервал для коефіцієнта рангової кореляції Спірмена: p (0.5431; 0.9095).

    Приклад №2. Початкові дані.

    5 4
    3 4
    1 3
    3 1
    6 6
    2 2
    Так як у матриці є пов'язані ранги (однаковий ранговий номер) 1-го ряду, зробимо їх переформування. Переформування рангів здійснюватиметься без зміни важливості рангу, тобто між ранговими номерами повинні зберегтися відповідні співвідношення (більше, менше або рівно). Також не рекомендується ставити ранг вище 1 і нижче значення, що дорівнює кількості параметрів (в даному випадку n = 6). Переформування рангів провадиться в табл.
    Нові ранги
    1 1 1
    2 2 2
    3 3 3.5
    4 3 3.5
    5 5 5
    6 6 6
    Так як у матриці є пов'язані ранги 2-го ряду, зробимо їх переформування. Переформування рангів провадиться в табл.
    Номери місць у впорядкованому рядіРозташування факторів оцінки експертаНові ранги
    1 1 1
    2 2 2
    3 3 3
    4 4 4.5
    5 4 4.5
    6 6 6
    Матриця рангів.
    ранг X, d xранг Y, d y(d x - d y) 2
    5 4.5 0.25
    3.5 4.5 1
    1 3 4
    3.5 1 6.25
    6 6 0
    2 2 0
    21 21 11.5
    Оскільки серед значень ознак х і зустрічається кілька однакових, тобто. утворюються пов'язані ранги, то у такому разі коефіцієнт Спірмена обчислюється як:

    де


    j – номери зв'язок по порядку для ознаки х;
    А j - число однакових рангів j-й зв'язціза х;
    k – номери зв'язок по порядку для ознаки у;
    У k - число однакових рангів у k-й зв'язці з у.
    A = [(2 3 -2)]/12 = 0.5
    B = [(2 3 -2)]/12 = 0.5
    D = A + B = 0.5 + 0.5 = 1

    Зв'язок між ознакою Y та фактором X помірна та пряма.

    За наявності двох рядів значень, що піддаються ранжируванню, раціонально розраховувати рангову кореляцію Спірмена.

    Такі ряди можуть бути:

    • парою ознак, що визначаються в одній і тій же групі об'єктів, що досліджуються;
    • парою індивідуальних супідрядних ознак, що визначаються у 2 досліджуваних об'єктів за однаковим набором ознак;
    • парою групових підпорядкованих ознак;
    • індивідуальною та груповою супідрядністю ознак.

    Метод передбачає проведення ранжування показників окремо кожному за ознак.

    Найменше значення має найменший ранг.

    Цей метод відноситься до непараметричного статистичного методу, призначеному для встановлення існування зв'язку явищ, що вивчаються:

    • визначення фактичного ступеня паралелізму між двома рядами кількісних даних;
    • оцінка тісноти виявленого зв'язку, що виражається кількісно.

    Кореляційний аналіз

    Статистичний метод, призначений виявлення існування залежності між 2 і більше випадковими величинами (змінними), і навіть її сили, отримав назву кореляційного аналізу.

    Отримав назву від correlatio (лат.) – співвідношення.

    За його використання можливі варіанти розвитку подій:

    • наявність кореляції (позитивна чи негативна);
    • відсутність кореляції (нульова).

    У разі встановлення залежності між змінними йдеться про їхнє корелювання. Іншими словами, можна сказати, що при зміні значення Х обов'язково буде спостерігатися пропорційна зміна значення У.

    Як інструменти використовуються різні заходи зв'язку (коефіцієнти).

    На їх вибір впливає:

    • спосіб виміру випадкових чисел;
    • характер зв'язку між випадковими числами.

    Існування кореляційного зв'язку може відображатися графічно (графіки) та за допомогою коефіцієнта (числове відображення).

    Кореляційний зв'язок характеризується такими ознаками:

    • сила зв'язку (при коефіцієнті кореляції від ±0,7 до ±1 – сильна; від ±0,3 до ±0,699 – середня; від 0 до ±0,299 – слабка);
    • напрямок зв'язку (прямий або зворотний).

    Цілі кореляційного аналізу

    Кореляційний аналіз не дозволяє встановити причинну залежність між змінними, що досліджуються.

    Він проводиться з метою:

    • встановлення залежності між змінними;
    • отримання певної інформації про змінну на основі іншої змінної;
    • визначення тісноти (зв'язку) цієї залежності;
    • визначення напряму встановленого зв'язку.

    Методи кореляційного аналізу


    Даний аналізможе виконуватися з використанням:

    • методу квадратів чи Пірсона;
    • рангового методу чи Спірмена.

    p align="justify"> Метод Пірсона застосовний для розрахунків що вимагають точного визначення сили, що існує між змінними. Досліджувані за його допомогою ознаки мають виражатися лише кількісно.

    Для застосування методу Спірмена або рангової кореляції немає жорстких вимог у вираженні ознак – воно може бути як кількісним, так і атрибутивним. Завдяки цьому методу виходить інформація про точному встановленні сили зв'язку, а має орієнтовний характер.

    У рядах змінних можуть бути відкриті варіанти. Наприклад, коли стаж роботи виражається такими значеннями як до 1 року, більше 5 років і т.д.

    Коефіцієнт кореляції

    Статистична величина, що характеризує характер зміни двох змінних, отримала назву коефіцієнта кореляції або парного коефіцієнтакореляції. У кількісному вираженні він коливається не більше від -1 до +1.

    Найбільш поширені коефіцієнти:

    • Пірсона- Застосуємо для змінних належать до інтервальної шкали;
    • Спірмена- Для змінних порядкової шкали.

    Обмеження використання коефіцієнта кореляції

    Отримання недостовірних даних при розрахунку коефіцієнта кореляції можливе у випадках, коли:

    • у розпорядженні є достатня кількість значень змінної (25-100 пар спостережень);
    • між змінними, що вивчаються, встановлено, наприклад, квадратичне співвідношення, а не лінійне;
    • у кожному випадку дані містять більше одного спостереження;
    • наявність аномальних значень (викидів) змінних;
    • досліджувані дані складаються з чітко виділених підгруп спостережень;
    • наявність кореляційного зв'язку не дозволяє встановити яка зі змінних може розглядатися як причина, а яка – як слідство.

    Перевірка значущості кореляції

    Для оцінки статистичних величинвикористовується поняття їх значимості або достовірності, що характеризує ймовірність випадкового виникнення величини або крайніх її значень.

    Найбільш поширеним методом визначення значущості кореляції є визначення критерію Стьюдента.

    Його значення порівнюється з табличним, кількість ступенів свободи приймається як 2. При отриманні розрахункового значення критерію більше табличного свідчить про значущість коефіцієнта кореляції.

    Під час проведення економічних розрахунків достатнім вважається довірчий рівень 0,05 (95%) чи 0,01 (99%).

    Ранги Спірмена

    Коефіцієнт рангової кореляції Спірмена дозволяє статистично встановити зв'язок між явищами. Його розрахунок передбачає встановлення кожної ознаки порядкового номера – рангу. Ранг може бути зростаючим чи спадним.

    Кількість ознак, що піддаються ранжируванню, може бути будь-якою. Це досить трудомісткий процес, який обмежує їх кількість. Труднощі починаються при досягненні 20 ознак.

    Для розрахунку коефіцієнта Спірмена користуються формулою:

    в якій:

    n – відображає кількість ранжованих ознак;

    d – не що інше як різницю між рангами по двох змінних;

    а ∑(d2) – сума квадратів різниці рангів.

    Застосування кореляційного аналізу у психології

    Статистичне супроводження психологічних дослідженьдозволяє зробити їх більш об'єктивними та високо репрезентативними. Статистична обробка даних, отриманих у ході психологічних експериментівсприяє вилученню максимуму корисної інформації.

    Найбільш широке застосування у обробці їх результатів отримав кореляційний аналіз.

    Доречним є проведення кореляційного аналізу результатів, отриманих під час проведення досліджень:

    • тривожності (за тестами R. Temml, M. Dorca, V. Amen);
    • сімейних взаємин («Аналіз сімейних взаємин» (АСВ) опитувальник Е.Г. Ейдеміллера, В.В. Юстіцкіса);
    • рівня інтернальності-екстернальності (опитувальник Е.Ф. Бажина, Є.А. Голинкіної та А.М. Еткінда);
    • рівня емоційного вигоряння у педагогів (опитувальник В.В. Бойко);
    • зв'язки елементів вербального інтелекту учнів під час різного профільного навчання (методика К.М. Гуревича та ін.);
    • зв'язку рівня емпатії (методика В.В. Бойка) та задоволеністю шлюбом (опитувальник В.В. Століна, Т.Л. Романової, Г.П. Бутенко);
    • зв'язки між соціометричним статусом підлітків (тест Jacob L. Moreno) та особливостями стилю сімейного виховання (опитувальник Е.Г. Ейдеміллера, В.В. Юстіцкіса);
    • структури життєвих цілей підлітків, вихованих у повних та неповних сім'ях (опитувальник Edward L. Deci, Richard M. Ryan Ryan).

    Коротка інструкція щодо проведення кореляційного аналізу за критерієм Спірмена

    Проведення кореляційного аналізу з використанням методу Спірмена виконується за наступним алгоритмом:

    • парні зіставні ознаки розташовуються в 2 ряди, один з яких позначається за допомогою Х, а інший;
    • значення низки Х розташовуються у порядку зростання чи спадання;
    • послідовність розташування значень ряду визначається їх відповідністю значень ряду Х;
    • для кожного значення в ряді Х визначити ранг - присвоїти порядковий номер від мінімального значення до максимального;
    • для кожного із значень у ряду У також визначити ранг (від мінімального до максимального);
    • обчислити різницю (D) між рангами Х і У, вдавшись до формули D=Х-У;
    • отримані значення різниці зводяться у квадрат;
    • виконати підсумовування квадратів різниць рангів;
    • виконати розрахунки за такою формулою:

    Приклад кореляції Спірмена

    Необхідно встановити наявність кореляційного зв'язку між робочим стажем та показником травматизму за наявності наступних даних:

    Найбільш підходящим методом аналізу є ранговий метод, т.к. одна з ознак представлена ​​у вигляді відкритих варіантів: робочий стаж до 1 року та робочий стаж 7 і більше років.

    Рішення завдання починається з ранжирування даних, які зводяться до робочої таблиці і може бути виконані вручну, т.к. їх обсяг невеликий:

    Робочий стаж Число травм Порядкові номери (ранги) Різниця рангів Квадрат різниці рангів
    d(х-у)
    до 1 року 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,5
    7 і більше 6 5 1 +4 16
    Σ d2 = 38,5

    Поява дробових рангів у колонці пов'язана з тим, що у разі появи варіант однакових за величиною перебуває середня арифметичне значеннярангу. У даному прикладі показник травматизму 12 зустрічається двічі і йому надаються ранги 2 і 3, знаходимо середнє арифметичне цих рангів (2+3)/2= 2,5 і поміщаємо це значення в робочу таблицю для 2 показників.
    Виконавши підстановку отриманих значень у робочу формулу і здійснивши нескладні розрахунки отримуємо коефіцієнт Спірмена рівний -0,92

    Негативне значення коефіцієнта свідчить про наявність зворотного зв'язку між ознаками та дозволяє стверджувати, що невеликий стаж роботи супроводжується більшим числомтравм. Причому сила зв'язку цих показників досить велика.
    Наступним етапом розрахунків є визначення достовірності отриманого коефіцієнта:
    розраховується його помилка та критерій Стьюдента

    Поділіться з друзями або збережіть для себе:

    Завантаження...