Автоматично изчисляване на корелацията на Spearman. коефициент на корелация на spearman

При наличието на две серии от стойности, подложени на класиране, е рационално да се изчисли ранговата корелация на Spearman.

Такива редове могат да бъдат представени:

  • двойка признаци, определени в една и съща група изследвани обекти;
  • двойка отделни подчинени признаци, определени в 2 изследвани обекта от същия набор от признаци;
  • двойка групови подчинени знаци;
  • индивидуална и групова подчиненост на признаци.

Методът включва ранжиране на показателите поотделно за всеки от признаците.

Най-малката стойност има най-малък ранг.

Този метод е непараметричен статистически метод, предназначени да установят наличието на връзка между изследваните явления:

  • определяне на действителната степен на паралелност между двете серии от количествени данни;
  • оценка на стегнатостта на идентифицираната връзка, изразена количествено.

Корелационен анализ

Статистически метод, предназначен да открие наличието на връзка между 2 или повече случайни променливи(променливи), както и силата му, беше наречена корелационен анализ.

Името си получава от correlatio (лат.) - съотношение.

При използването му са възможни следните сценарии:

  • наличието на корелация (положителна или отрицателна);
  • няма корелация (нула).

В случай на установяване на връзка между променливи, говорим за тяхната корелация. С други думи, можем да кажем, че когато стойността на X се промени, непременно ще се наблюдава пропорционална промяна в стойността на Y.

Като инструменти се използват различни мерки за връзка (коефициенти).

Техният избор се влияе от:

  • начин за измерване на случайни числа;
  • естеството на връзката между произволни числа.

Съществуването на корелация може да се покаже графично (графики) и с коефициент (числово показване).

Корелацията се характеризира със следните характеристики:

  • сила на връзката (с коефициент на корелация от ±0,7 до ±1 - силна; от ±0,3 до ±0,699 - средна; от 0 до ±0,299 - слаба);
  • посока на комуникация (напред или назад).

Цели на корелационния анализ

Корелационният анализ не позволява да се установи причинно-следствена връзка между изследваните променливи.

Провежда се с цел:

  • установяване на зависимост между променливи;
  • получаване на определена информация за променлива въз основа на друга променлива;
  • определяне на близостта (свързаността) на тази зависимост;
  • определяне посоката на установената връзка.

Методи за корелационен анализ


Този анализможе да се направи с помощта на:

  • метод на квадратите или Pearson;
  • ранг метод или Spearman.

Методът на Pearson е приложим за изчисления, изискващи точно определяне на силата, която съществува между променливите. Признаците, изучавани с негова помощ, трябва да се изразяват само количествено.

За да приложите метода на Спирман или рангова корелацияняма строги изисквания при изразяването на признаците - то може да бъде както количествено, така и атрибутивно. Благодарение на този метод се получава информация не за точното установяване на силата на връзката, а с ориентировъчен характер.

Променливите редове могат да съдържат отворени опции. Например, когато трудовият стаж се изразява със стойности като до 1 година, повече от 5 години и т.н.

Коефициент на корелация

Статистическа стойност, характеризираща естеството на промяната в две променливи, се нарича корелационен коефициент или двойка коефициенткорелации. В количествено отношение той варира от -1 до +1.

Най-често срещаните съотношения са:

  • Пиърсън– приложимо за променливи, принадлежащи към интервалната скала;
  • Копиеносец– за променливи с порядъчна скала.

Ограничения при използването на корелационния коефициент

Получаването на ненадеждни данни при изчисляване на коефициента на корелация е възможно в случаите, когато:

  • има достатъчен брой стойности за променливата (25-100 двойки наблюдения);
  • между изследваните променливи например се установява квадратична връзка, а не линейна;
  • във всеки случай данните съдържат повече от едно наблюдение;
  • наличието на анормални стойности (отклонения) на променливите;
  • изследваните данни се състоят от добре дефинирани подгрупи от наблюдения;
  • наличието на корелация не позволява да се установи коя от променливите може да се разглежда като причина и коя - като следствие.

Тест за корелационна значимост

За ставка статистикаизползва се концепцията за тяхната значимост или надеждност, която характеризира вероятността от случайно появяване на величина или нейни екстремни стойности.

Най-често срещаният метод за определяне на значимостта на корелация е определянето на t-теста на Стюдънт.

Стойността му се сравнява с табличната стойност, броят на степените на свобода се приема за 2. Когато изчислената стойност на критерия е по-голяма от табличната стойност, това показва значимостта на корелационния коефициент.

При извършване на икономически изчисления се счита за достатъчно ниво на доверие от 0,05 (95%) или 0,01 (99%).

Копиеносци редици

Коефициентът на рангова корелация на Спирман дава възможност да се установи статистически наличието на връзка между явленията. Изчисляването му включва установяването на пореден номер за всеки атрибут - ранг. Рангът може да бъде възходящ или низходящ.

Броят на характеристиките, които трябва да бъдат класирани, може да бъде произволен. Това е доста трудоемък процес, ограничаващ броя им. Трудностите започват, когато достигнете 20 знака.

За да изчислите коефициента на Спирман, използвайте формулата:

където:

n - показва броя на класираните характеристики;

d не е нищо повече от разликата между ранговете в две променливи;

и ∑(d2) е сумата от квадратните разлики в ранга.

Приложение на корелационния анализ в психологията

Статистическата подкрепа на психологическите изследвания позволява те да бъдат по-обективни и високо представителни. Статистическа обработкаданни, получени по време на психологически експериментипомага да се извлече максимум полезна информация.

Корелационният анализ е получил най-широко приложение при обработката на техните резултати.

Целесъобразно е да се извърши корелационен анализ на резултатите, получени по време на изследването:

  • тревожност (според тестовете на R. Temml, M. Dorca, V. Amen);
  • семейни отношения (въпросник „Анализ на семейните отношения” (DIA) на E.G. Eidemiller, V.V. Yustitskis);
  • нивото на интерналност-външност (въпросник на E.F. Bazhin, E.A. Golynkina и A.M. Etkind);
  • нивото на емоционално прегаряне сред учителите (въпросник V.V. Boyko);
  • връзки между елементите на вербалната интелигентност на учениците в различни профили на обучение (метод на К. М. Гуревич и др.);
  • връзка между нивото на емпатия (метод на В. В. Бойко) и удовлетворението от брака (въпросник на В. В. Столин, Т. Л. Романова, Г. П. Бутенко);
  • връзки между социометричния статус на подрастващите (тест от Jacob L. Moreno) и характеристиките на стила на семейно образование (въпросник от E.G. Eidemiller, V.V. Yustitskis);
  • структури на житейски цели на юноши, отгледани в пълни семейства и семейства с един родител (въпросник Edward L. Deci, Richard M. Ryan Ryan).

Кратки указания за провеждане на корелационен анализ по критерия на Спирман

Извършва се корелационен анализ по метода на Spearman по следния алгоритъм:

  • сдвоените сравними признаци са подредени в 2 реда, единият от които е обозначен с X, а другият с Y;
  • стойностите на серията X са подредени във възходящ или низходящ ред;
  • последователността на подреждане на стойностите от серията Y се определя от тяхното съответствие със стойностите на серията X;
  • за всяка стойност в серията X определете ранга - задайте пореден номер от минималната стойност до максималната;
  • за всяка от стойностите в серията Y също определете ранга (от минимум до максимум);
  • изчислете разликата (D) между ранговете на X и Y, като използвате формулата D=X-Y;
  • получените стойности на разликата се повдигат на квадрат;
  • сумирайте квадратите на разликите в ранговете;
  • извършете изчисления по формулата:

Пример за корелация на Спирман

Необходимо е да се установи наличието на връзка между трудовия стаж и процента на наранявания при наличие на следните данни:

Най-подходящият метод за анализ е метод на ранг, защото един от знаците е представен под формата на отворени опции: трудов стаж до 1 година и трудов стаж 7 или повече години.

Решаването на задачата започва с класирането на данните, което се обобщава в работен лист и може да се извърши ръчно, т.к. обемът им не е голям:

Работен опит Брой наранявания Редни числа (класове) Разлика в ранга разлика в ранга на квадрат
d(x-y)
до 1 година 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 или повече 6 5 1 +4 16
Σd2 = 38,5

Появата на дробни рангове в колоната се дължи на факта, че в случай на появата на вариант със същата стойност се намира средната стойност аритметична стойностранг. В този пример процентът на нараняванията 12 се среща два пъти и му се присвояват рангове 2 и 3, намираме средноаритметичната стойност на тези рангове (2 + 3) / 2 = 2,5 и поставяме тази стойност в работния лист за 2 индикатора.
Като заместим получените стойности в работната формула и направим прости изчисления, получаваме коефициента на Спирман, равен на -0,92

Отрицателната стойност на коефициента показва наличието на обратна връзка между знаците и предполага, че краткият трудов стаж е придружен от Голям бройнаранявания. Освен това силата на връзката на тези показатели е доста голяма.
Следващият етап от изчисленията е да се определи надеждността на получения коефициент:
изчисляват се неговата грешка и критерият на Стюдънт

Методът на ранговата корелация на Spearman ви позволява да определите плътността (силата) и посоката на корелацията между две характеристики или два профила (йерархии) на характеристиките.

За да се изчисли ранговата корелация, е необходимо да има две серии от стойности,

които могат да бъдат класирани. Тези диапазони от стойности могат да бъдат:

1) два признака, измерени в една и съща група субекти;

2) две отделни йерархии от черти, идентифицирани в два субекта за един и същи набор от черти;

3) две групови йерархии на функции,

4) индивидуални и групови йерархии на признаци.

Първо, индикаторите се класират отделно за всяка от характеристиките.

По правило на по-ниска стойност на характеристика се присвоява по-нисък ранг.

В първия случай (две характеристики) се класират индивидуалните стойности за първата характеристика, получени от различни субекти, а след това индивидуалните стойности за втората характеристика.

Ако два атрибута са положително свързани, тогава субектите с ниски рангове в един от тях ще имат ниски рангове в другия, а субектите с високи рангове в

една от чертите също ще има високи рангове на другата черта. За да се изчисли rs, е необходимо да се определи разликата (d) между ранговете, получени от дадения субект на двете основания. След това тези показатели d се трансформират по определен начин и се изваждат от 1. Than

колкото по-малка е разликата между ранговете, толкова по-голям ще бъде rs, толкова по-близо до +1.

Ако няма корелация, тогава всички рангове ще бъдат смесени и няма да има

няма съвпадение. Формулата е проектирана така, че в този случай rs да бъде близо до 0.

В случай на отрицателна корелация, ниските рангове на субектите по един признак

ще съответства на високи рангове по друг атрибут и обратно. Колкото по-голямо е несъответствието между ранговете на субектите по две променливи, толкова по-близо е rs до -1.

Във втория случай (два индивидуални профила), индивид

стойностите, получени от всеки от 2 субекта според определен (еднакъв и за двамата) набор от характеристики. Първият ранг ще получи чертата с най-ниска стойност; вторият ранг е характеристика с по-висока стойност и т.н. Очевидно всички характеристики трябва да се измерват в едни и същи единици, в противен случай класирането е невъзможно. Например, не е възможно да се класират индикатори по въпросника за личността на Cattell (16PF), ако те са изразени в "сурови" резултати, тъй като диапазоните на стойностите за различни фактори са различни: от 0 до 13, от 0 до

20 и от 0 до 26. Не можем да кажем кой от факторите ще заеме първо място по отношение на тежестта, докато не приведем всички стойности в една скала (най-често това е стенната скала).

Ако отделните йерархии на два субекта са положително свързани, тогава характеристиките, които имат ниски рангове за един от тях, ще имат ниски рангове за другия и обратно. Например, ако за един предмет факторът E (доминиране) има най-нисък ранг, тогава за друг предмет той трябва да има нисък ранг, ако един субект има фактор C

(емоционална стабилност) има най-висок ранг, тогава другият субект също трябва да има

този фактор има висок ранг и т.н.

В третия случай (два групови профила) средните групови стойности, получени в 2 групи субекти, се класират според определен набор от характеристики, който е еднакъв за две групи. По-нататък разсъжденията са същите като в предишните два случая.

В случай на 4-ти (индивидуални и групови профили), индивидуалните стойности на субекта и средните групови стойности се класират отделно според същия набор от характеристики, които се получават, като правило, чрез изключване на този индивид субект - не участва в средногруповия профил, с който ще се сравнява индивидуален профил. Корелацията по ранг ще ви позволи да проверите колко последователни са индивидуалните и груповите профили.

И в четирите случая значимостта на получения коефициент на корелация се определя от броя на класираните стойности N. В първия случай това число ще съвпадне с размера на извадката n. Във втория случай броят на наблюденията ще бъде броят на характеристиките, които съставят йерархията. В третия и четвъртия случай N също е броят на сравняваните характеристики, а не броят на субектите в групите. Подробни обяснения са дадени в примерите. Ако абсолютната стойност на rs достигне или надвиши критична стойност, корелацията е значителна.

Хипотези.

Има две възможни хипотези. Първият се отнася за случай 1, вторият за останалите три случая.

Първата версия на хипотезите

H0: Корелацията между променливи A и B не е различна от нула.

H1: Корелацията между променливи A и B е значително различна от нула.

Втората версия на хипотезите

H0: Корелацията между йерархии A и B не е различна от нула.

H1: Корелацията между йерархии A и B е значително различна от нула.

Ограничения на коефициента на рангова корелация

1. Най-малко 5 наблюдения трябва да бъдат представени за всяка променлива. Горната граница на извадката се определя от наличните таблици с критични стойности.

2. Коефициентът на рангова корелация на Spearman rs с голям брой идентични рангове за една или двете сравнявани променливи дава груби стойности. В идеалния случай и двете корелирани серии трябва да бъдат две поредици от несъвпадащи стойности. Ако това условие не е изпълнено, е необходимо да се направи корекция за същите рангове.

Коефициентът на рангова корелация на Spearman се изчислява по формулата:

Ако и в двете сравнявани рангови серии има групи от еднакви рангове, преди да се изчисли коефициентът на рангова корелация, е необходимо да се направят корекции за едни и същи рангове Ta и Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

където a е обемът на всяка група от идентични рангове в серията рангове A, c е обемът на всеки

групи с еднакъв ранг в ранговата серия B.

За да изчислите емпиричната стойност на rs, използвайте формулата:

Изчисляване на коефициента на рангова корелация на Spearman rs

1. Определете в кои две характеристики или две характерни йерархии ще участват

сравнение като променливи A и B.

2. Класирайте стойностите на променливата A, присвоявайки ранг 1 на най-малката стойност, в съответствие с правилата за класиране (вижте A.2.3). Въведете ранговете в първата колона на таблицата по реда на номерата на субектите или знаците.

3. Подредете стойностите на променливата B в съответствие със същите правила. Въведете ранговете във втората колона на таблицата по реда на номерата на субектите или знаците.

5. Повдигнете на квадрат всяка разлика: d2. Въведете тези стойности в четвъртата колона на таблицата.

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

където a е обемът на всяка група от еднакви рангове в ранговия ред A; c - обемът на всяка група

същото място в ранглистата серия B.

а) при липса на еднакви рангове

rs  1 − 6 ⋅

б) при наличие на същите чинове

Σd 2  T  T

r  1 − 6 ⋅ a in,

където Σd2 е сумата от квадратите на разликите между ранговете; Та и ТВ са корекции за едно и също

N е броят на субектите или характеристиките, участвали в класирането.

9. Определете от таблицата (вижте Приложение 4.3) критичните стойности на rs за даден N. Ако rs надвишава критичната стойност или според поне, е равно на него, корелацията е значително различна от 0.

Пример 4.1 При определяне на степента на зависимост на реакцията на пиене на алкохол от окуломоторната реакция в тестовата група са получени данни преди пиене на алкохол и след пиене. Реакцията на субекта зависи ли от състоянието на интоксикация?

Резултати от експеримента:

Преди: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. След: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Нека формулираме хипотези:

H0: корелацията между степента на зависимост на реакцията преди пиене на алкохол и след пиене не се различава от нула.

H1: корелацията между степента на зависимост на реакцията преди пиене на алкохол и след пиене е значително различна от нула.

Таблица 4.1. Изчисляване на d2 за ранговия корелационен коефициент rs на Spearman при сравняване на параметрите на окуломоторната реакция преди и след експеримента (N=17)

стойности

стойности

Тъй като имаме дублирани рангове, в този случай ще приложим формулата, коригирана за едни и същи рангове:

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Tb =((23-2)+(23-2)+(33-3))/12=3

Намерете емпиричната стойност на коефициента на Спирман:

rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

Според таблицата (Приложение 4.3) намираме критичните стойности на коефициента на корелация

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Получаваме

rs=0.05∠rcr(0.05)=0.48

Заключение: Хипотезата H1 се отхвърля и H0 се приема. Тези. корелация между степен

зависимостта на реакцията преди и след консумация на алкохол не се различава от нула.

Определяне на коефициента на рангова корелация

Методът на ранговата корелация на Spearman ви позволява да определите стегнатостта (силата) и посоката на корелацията между два знакаили два профила (йерархии)знаци.

Описание на метода

За да се изчисли корелацията на ранг, е необходимо да има два реда от стойности, които могат да бъдат класирани. Тези диапазони от стойности могат да бъдат:

1) два знакаизмерени в същата група субекти;

2) две отделни йерархии на функции,идентифицирани в два субекта според същия набор от характеристики (например профили на личността според 16-факторния въпросник на R. B. Cattell, йерархия на ценностите според метода на R. Rokeach, последователности от предпочитания при избор от няколко алтернативи и т.н.);

3) две групови йерархии на функции;

4) индивидуални и груповийерархия на характеристиките.

Първо, индикаторите се класират отделно за всяка от характеристиките. По правило на по-ниска стойност на характеристика се присвоява по-нисък ранг.

Разгледайте случай 1 (две характеристики).Тук се класират индивидуалните стойности за първата характеристика, получени от различни субекти, а след това индивидуалните стойности за втората характеристика.

Ако две характеристики са положително свързани, тогава субекти, които имат ниски рангове в едната от тях, ще имат ниски рангове в другата, а субекти, които имат високи рангове в една от характеристиките, също ще имат високи рангове в другата характеристика. За броене r с необходимо е да се определят разликите (d) между ранговете, получени от дадения субект по двете основания. След това тези показатели d се трансформират по определен начин и се изваждат от 1. Колкото по-малка е разликата между ранговете, толкова по-голямо ще бъде r s, толкова по-близо до +1.

Ако няма корелация, тогава всички рангове ще бъдат смесени и няма да има съответствие между тях. Формулата е създадена така, че в този случай r с, ще бъде близо до 0.

В случай на отрицателна корелация, ниските рангове на субектите по един атрибут ще съответстват на високи рангове по друг атрибут и обратно.

Колкото по-голямо е несъответствието между ранговете на субектите по двете променливи, толкова по-близо е r s до -1.

Разгледайте случай 2 (два индивидуални профила).Тук индивидуалните стойности, получени от всеки от двата субекта, се класират според определен (еднакъв и за двамата) набор от признаци. Първият ранг ще получи чертата с най-ниска стойност; вторият ранг е характеристика с по-висока стойност и т.н. Очевидно всички характеристики трябва да се измерват в едни и същи единици, в противен случай класирането е невъзможно. Например, невъзможно е да се класират показатели според личностния въпросник на Cattell (16 PF), ако са изразени в "сурови" резултати, тъй като диапазоните на стойностите са различни за различните фактори: от 0 до 13, от 0 до 20 и от 0 до 26. Не можем да кажем кой от факторите ще вземе първо място по отношение на тежестта, но няма да приведем всички стойности в една скала (най-често това е скалата на стените).

Ако отделните йерархии на два субекта са положително свързани, тогава характеристиките, които имат ниски рангове за един от тях, ще имат ниски рангове за другия и обратно. Например, ако фактор E (доминиране) има най-нисък ранг за един субект, тогава за друг субект той трябва да има нисък ранг, ако фактор C (емоционална стабилност) има най-висок ранг за един субект, тогава другият субект трябва да има висок ранг за този фактор ранг и т.н.

Разгледайте случай 3 (два групови профила).Тук средните групови стойности, получени в 2 групи субекти, се класират според определен набор от характеристики, който е еднакъв за двете групи. По-нататък разсъжденията са същите като в предишните два случая.

Разгледайте случай 4 (индивидуални и групови профили).Тук индивидуалните стойности на субекта и средните групови стойности се класират отделно за един и същ набор от характеристики, които се получават, като правило, чрез изключване на този индивидуален субект - той не участва в профила на средната група, с които ще се сравнява индивидуалния му профил. Корелацията по ранг ще ви позволи да проверите колко последователни са индивидуалните и груповите профили.

И в четирите случая значимостта на получения корелационен коефициент се определя от броя на класираните стойности Н.В първия случай това число ще съвпадне с размера на извадката n. Във втория случай броят на наблюденията ще бъде броят на характеристиките, които съставляват йерархията. В третия и четвъртия случай Н-това е и броят на сравняваните характеристики, а не броят на субектите в групите. Подробни обяснения са дадени в примерите.

Ако абсолютната стойност на r s достигне или надвиши критична стойност, корелацията е значителна.

Хипотези

Има две възможни хипотези. Първият се отнася за случай 1, вторият за останалите три случая.

Първата версия на хипотезите

H 0: Корелацията между променливите A и B е различна от нула.

H 1: Корелацията между променливи A и B е значително различна от нула.

Втората версия на хипотезите

H 0: Корелацията между йерархиите A и B е различна от нула.

H1: Корелацията между йерархии A и B е значително различна от нула.

Графично представяне на метода на ранговата корелация

Най-често корелацията се представя графично под формата на облак от точки или под формата на линии, отразяващи общата тенденция в разположението на точките в пространството на две оси: осите на характеристика A и характеристика B (виж фиг. 6.2).

Нека се опитаме да изобразим ранговата корелация като две серии от класирани стойности, които са свързани по двойки с линии (фиг. 6.3). Ако ранговете на атрибут A и на атрибут B съвпадат, тогава между тях има хоризонтална линия, ако ранговете не съвпадат, тогава линията става наклонена. Колкото по-голямо е несъответствието в ранга, толкова по-наклонена става линията. Отляво на фиг. 6.3 показва най-високата възможна положителна корелация (r in = +1.0) - практически това е "стълба". В центъра се показва нулева корелация - плитка с неправилни тъкани. Всички рангове са смесени тук. Най-високата отрицателна корелация (r s =-1.0) се показва вдясно - мрежа с правилно преплитане на линии.

Ориз. 6.3. Графично представяне на ранговата корелация:

а) висока положителна корелация;

б) нулева корелация;

в) висока отрицателна корелация

Ограничениярангов коефициенткорелации

1. Най-малко 5 наблюдения трябва да бъдат представени за всяка променлива. Горната граница на извадката се определя от наличните таблици на критичните стойности (Таблица XVI от Приложение 1), а именно н40.

2. Коефициентът на рангова корелация на Spearman r s с голям брой идентични рангове за една или и двете сравнявани променливи дава груби стойности. В идеалния случай и двете корелирани серии трябва да бъдат две поредици от несъвпадащи стойности. Ако това условие не е изпълнено, е необходимо да се направи корекция за същите рангове. Съответната формула е дадена в пример 4.

Пример 1 - Корелациямежду двамазнаци

В проучване, симулиращо дейността на ръководител на полети (Одеришев Б.С., Шамова Е.П., Сидоренко Е.В., Ларченко Н.Н., 1978), група субекти, студенти от Физическия факултет на Ленинградския държавен университет, бяха обучени преди да започнат работа по симулатор. Субектите трябваше да решат проблема с избора на оптималния тип писта за даден тип самолет. Свързан ли е броят на грешките, допуснати от субектите в тренировъчната сесия, с показателите за вербална и невербална интелигентност, измерени по метода на Д. Векслер?

Таблица 6.1

Индикатори за броя на грешките в учебната сесия и показатели за нивото на вербална и невербална интелигентност сред студентите по физика (N=10)

тестов обект

Брой грешки

Резултат за вербална интелигентност

Резултат за невербална интелигентност

Първо, нека се опитаме да отговорим на въпроса дали показателите за броя на грешките и вербалната интелигентност са свързани.

Да формулираме хипотези.

H 0: Корелацията между броя на грешките в тренировъчната сесия и нивото на вербална интелигентност не се различава от нула.

H1 : Корелацията между показателя за броя на грешките в тренировъчната сесия и нивото на вербална интелигентност е статистически значимо различна от нула.

След това трябва да класираме и двата индикатора, приписвайки по-нисък ранг на по-малката стойност, след това да изчислим разликите между ранговете, които всеки субект е получил за две променливи (характеристики), и да повдигнем тези разлики на квадрат. Ние ще направим всички необходими изчисления в таблицата.

В табл. 6.2 в първата колона вляво са стойностите по отношение на броя на грешките; в следващата колона, техните редици. Третата колона отляво представя стойности за вербална интелигентност; следващата колона е техните редици. Петият отляво показва разликите д между ранга в променлива A (брой грешки) и променлива B (вербален интелект). Последната колона показва квадратите на разликите - д 2 .

Таблица 6.2

Изчисляване д 2 за коефициента на рангова корелация на Spearman r s при сравняване на показателите за броя на грешките и вербалната интелигентност сред студентите по физика (N=10)

тестов обект

Променлива А

брой грешки

Променлива Б

вербална интелигентност.

д (ранг А -

Дж 2

Индивидуален

стойности

Индивидуален

стойности

Коефициентът на рангова корелация на Spearman се изчислява по формулата:

където д - разликата между ранговете на двете променливи за всеки субект;

Н-брой класирани стойности, c. в този случай броят на субектите.

Нека изчислим емпиричната стойност на r s:

Получената емпирична стойност на r s е близка до 0. И все пак определяме критичните стойности на r s при N=10 съгласно табл. XVI Приложение 1:

Отговор: H 0 се получава. Корелацията между показателя за броя на грешките в тренировъчната сесия и нивото на вербална интелигентност не се различава от нула.

Сега нека се опитаме да отговорим на въпроса дали показателите за броя на грешките и невербалната интелигентност са свързани.

Да формулираме хипотези.

H 0: Корелацията между броя на грешките в тренировъчната сесия и нивото на невербална интелигентност не се различава от 0.

H 1: Корелацията между броя на грешките в тренировъчната сесия и нивото на невербална интелигентност е статистически значимо различна от 0.

Резултатите от класирането и сравнението на ранговете са представени в табл. 6.3.

Таблица 6.3

Изчисляване д 2 за коефициента на рангова корелация на Spearman r s при сравняване на показатели за броя на грешките и невербалната интелигентност сред студентите по физика (N=10)

тестов обект

Променлива А

брой грешки

Променлива Е

невербална интелигентност

д (ранг А -

д 2

Индивидуален

Индивидуален

стойности

стойности

Спомняме си, че за определяне на значимостта на r s няма значение дали е положителна или отрицателна, важна е само нейната абсолютна стойност. В такъв случай:

r s emp

Отговор: H 0 се получава. Корелацията между показателя за броя на грешките в тренировъчната сесия и нивото на невербална интелигентност е случайна, r s не се различава от 0.

Все пак можем да обърнем внимание на определена тенденция отрицателенвръзка между тези две променливи. Може би бихме могли да го потвърдим на статистически значимо ниво, ако увеличим размера на извадката.

Пример 2 - корелация между отделните профили

В проучване, посветено на проблемите на ценностната преориентация, йерархиите на терминалните ценности са идентифицирани според метода на M. Rokeach при родители и техните възрастни деца (Sidorenko E.V., 1996). Ранговете на терминалните стойности, получени по време на изследването на двойка майка-дъщеря (майка - 66 години, дъщери - 42 години) са представени в табл. 6.4. Нека се опитаме да определим как тези ценностни йерархии корелират една с друга.

Таблица 6.4

Ранговете на крайните стойности според списъка на M. Rokeach в индивидуалните йерархии на майка и дъщеря

крайни стойности

Рангът на ценностите в

Рангът на ценностите в

д 2

йерархия на майката

дъщерна йерархия

1 Активен активен живот

2 Житейска мъдрост

3 Здраве

4 Интересна работа

5 Красотата на природата и изкуството

7 Финансово осигурен живот

8 Да имаш добри и верни приятели

9 Обществено признание

10 Познание

11 Продуктивен живот

12 Развитие

13 Развлечения

14 Свобода

15 Щастлив семеен живот

16 Щастието на другите

17 Творчество

18 самочувствие

Да формулираме хипотези.

H 0: Корелацията между йерархиите на крайната стойност на майката и дъщерята не се различава от нула.

H 1: Корелацията между йерархиите на терминалните стойности на майката и дъщерята е статистически значимо различна от нула.

Тъй като класирането на стойностите се подразбира от самата изследователска процедура, трябва само да изчислим разликите между ранговете на 18-те стойности в двете йерархии. В 3-та и 4-та колона на табл. 6.4 представя разликите д и квадратите на тези разлики д 2 .

Определяме емпиричната стойност r s по формулата:

където д - разлики между ранговете за всяка от променливите, в случая за всяка от крайните стойности;

н- броят на променливите, образуващи йерархията, в този случай броят на стойностите.

За този пример:

Според табл. XVI Приложение 1 определя критичните стойности:

Отговор: H 0 се отхвърля. H 1 се приема. Корелацията между йерархиите на терминалните стойности на майката и дъщерята е статистически значима (стр<0,01) и является положительной.

Според табл. 6.4 можем да определим, че основните разлики са в ценностите "Щастлив семеен живот", "Обществено признание" и "Здраве", редиците на други ценности са доста близки.

Пример 3 - Корелация между две групови йерархии

Джоузеф Уолпе в книга, написана съвместно със сина му (Wolpe J., Wolpe D., 1981) дава подреден списък на най-често срещаните „безполезни“ страхове в съвременния човек, както той ги нарича, които не носят сигнална стойност и само пречат на пълноценния живот и действие. В местно проучване, проведено от M.E. Рахова (1994) 32 субекта трябваше да оценят по 10-бална скала доколко този или онзи вид страх от списъка на Волпе е подходящ за тях 3 . Изследваната извадка се състоеше от студенти от Хидрометеорологичните и Педагогическите институти на Санкт Петербург: 15 момчета и 17 момичета на възраст от 17 до 28 години, средна възраст 23 години.

Данните, получени по 10-точкова скала, бяха осреднени за 32 субекта и средните стойности бяха класирани. В табл. 6.5 са представени рейтинговите показатели, получени от J. Volpe и M. E. Rakhova. Съвпадат ли последователностите за класиране на 20-те вида страх?

Да формулираме хипотези.

H 0: Корелацията между подредените списъци с видове страх в американската и местната извадка не се различава от нула.

H 1: Корелацията между подредените списъци с видове страх в американската и руската извадка е статистически значимо различна от нула.

Всички изчисления, свързани с изчисляването и квадратурата на разликите между ранговете на различните видове страх в две извадки, са представени в табл. 6.5.

Таблица 6.5

Изчисляване д за коефициента на рангова корелация на Спирман при сравняване на подредени списъци с видове страх в американски и руски проби

Видове страх

Класиране в американската извадка

Ранг на руски

Страх от публично говорене

Страх от летене

Страх от грешка

Страх от провал

Страх от неодобрение

Страх от отхвърляне

Страх от зли хора

Страх да останеш сам

Страх от кръв

Страх от отворени рани

Страх от зъболекар

Страх от инжекции

Страх от вземане на тестове

Страх от полиция ^милиция)

Страх от височини

страх от кучета

Страх от паяци

Страх от осакатени хора

Страх от болници

Страх от тъмното

Определяме емпиричната стойност r s:

Според табл. XVI Приложение 1 определя критичните стойности на g s при N=20:

Отговор: H 0 се получава. Корелацията между подредените списъци с видове страх в американската и руската извадка не достига нивото на статистическа значимост, т.е. не се различава значително от нула.

Пример 4 - Корелация между индивидуални и групови средни профили

Извадка от жители на Санкт Петербург на възраст от 20 до 78 години (31 мъже, 46 жени), балансирани по възраст по такъв начин, че хората на възраст над 55 години представляват 50% от тях 4 , беше помолена да отговори на въпроса: " Какво е нивото на развитие на всяко от следните качества, необходимо за депутат от градското събрание на Санкт Петербург?" (Сидоренко Е.В., Дерманова И.Б., Анисимова О.М., Витенберг Е.В., Шулга А.П., 1994 г.). Оценката е извършена по 10-бална система. Успоредно с това беше анкетирана извадка от депутати и кандидати за депутати в Градското събрание на Санкт Петербург (n=14). Индивидуалната диагностика на политици и кандидати беше извършена с помощта на Оксфордската система за експресна видеодиагностика според същия набор от лични качества, който беше представен на извадка от избиратели.

В табл. 6.6 показва средните стойности, получени за всяко от качествата визвадка от гласоподаватели ("референтен ред") и индивидуални стойности на един от депутатите на Градското събрание.

Нека се опитаме да определим как индивидуалният профил на заместника на K-va корелира с референтния профил.

Таблица 6.6

Осреднени референтни оценки на избирателите (n=77) и индивидуални показатели на депутата от К-ва по 18 лични качества на експресна видеодиагностика

Име на качеството

Средни показатели за избиратели

Индивидуални показатели на зам.К-ва

1. Общо ниво на култура

2. Възможност за обучение

4. Способност за създаване на нещо ново

5. Самокритика

6. Отговорност

7. Разчитане на собствените сили

8. Енергия, активност

9. Целенасоченост

10. Издръжливост, самоконтрол

I. Постоянство

12. Личностна зрялост

13. Благоприличие

14. Хуманизъм

15. Умение за общуване с хора

16. Толерантност към чуждото мнение

17. Гъвкавост на поведението

18. Способност да правите благоприятно впечатление

Таблица 6.7

Изчисляване д 2 за коефициента на рангова корелация на Spearman между референтния и индивидуалния профил на личните качества на депутата

Име на качеството

качествен ранг в референтния профил

Ред 2: Ранг на качеството в индивидуалния профил

д 2

1 Отговорност

2 Почтеност

3 Способност за общуване с хора

4 Издръжливост, самоконтрол

5 Общо ниво на култура

6 Енергия, активност

8 Самокритика

9 Автономия

10 Лична зрялост

И Целенасоченост

12 Възможност за обучение

13 Хуманизъм

14 Толерантност към чуждото мнение

15 Сила на духа

16 Гъвкавост на поведението

17 Способност да правите благоприятно впечатление

18 Възможност за създаване на нови

Както се вижда от табл. 6.6 оценките на избирателите и индивидуалните показатели на депутата варират в различни граници. Действително оценките на избирателите са получени по 10-бална скала, а индивидуалните показатели за експресна видеодиагностика се измерват по 20-бална скала. Класирането ни позволява да преведем двете измервателни скали в една скала, където мерната единица ще бъде 1 ранг, а максималната стойност ще бъде 18 ранга.

Класирането, както си спомняме, трябва да се извършва отделно за всяка серия от стойности. В този случай е препоръчително да присвоите по-нисък ранг на по-висока стойност, така че веднага да видите на какво място по отношение на значимостта (за избирателите) или по отношение на тежестта (за депутат) се намира това или онова качество .

Резултатите от класирането са представени в табл. 6.7. Качествата са изброени в последователност, която отразява референтния профил.

Да формулираме хипотези.

H 0: Корелацията между индивидуалния профил на депутата от К-ва и референтния профил, изграден на базата на оценки на избирателите, не се различава от нула.

H 1: Корелацията между индивидуалния профил на депутата от К-ва и референтния профил, изграден на базата на оценки на избирателите, е статистически значимо различна от нула. Тъй като и двете сравнени класационни серии съдържат

групи от еднакви рангове, преди да се изчисли ранговият коефициент

корелация, е необходимо да се коригират за същите рангове T a и T b :

където а -обемът на всяка група от еднакви рангове в ранг ред А,

b - обемът на всяка група от еднакви рангове в серията рангове B.

В този случай в ред А (референтен профил) има една група от еднакви рангове – качествата „способност за учене” и „хуманизъм” са с еднакъв ранг 12,5; Следователно, а=2.

T a \u003d (2 3 -2) / 12 \u003d 0,50.

В ред B (индивидуален профил) има две групи от еднакви степени, докато b 1 =2 и b 2 =2.

T a =[(2 3 -2)+(2 3 -2)]/12=1,00

За да изчислим емпиричната стойност на r s, използваме формулата

В такъв случай:

Обърнете внимание, че ако не въведохме корекция за същите рангове, тогава стойността на r s би била само (с 0,0002) по-висока:

За голям брой еднакви рангове промените в r 5 могат да се окажат много по-значими. Наличието на едни и същи рангове означава по-малка степен на диференцирани™ подредени променливи и, следователно, по-ниска способност да се оцени степента на връзка между тях (Sukhodolsky G.V., 1972, p. 76).

Според табл. XVI Приложение 1 определя критичните стойности на r, при N=18:

Отговор: hq е отхвърлен. Корелацията между индивидуалния профил на депутата от Q-va и референтния профил, който отговаря на изискванията на избирателите, е статистически значима (p<0,05) и является положи­тельной.

От табл. 6.7 се вижда, че Заместник K-v има по-нисък ранг по скалите Способност за общуване с хората и по-висок ранг по скалите Целеустременост и Сила на духа от предписаните от изборния стандарт. Тези несъответствия обясняват главно известно намаление на получените r s .

Нека формулираме общ алгоритъм за броене на r s .

Коефициент на корелация на Пиърсън

Коефициент р- Pearson се използва за изследване на връзката на две метрични променливи, измерени върху една и съща проба. Има много ситуации, в които е подходящо да се използва. Влияе ли интелигентността на представянето на студентите? Свързана ли е заплатата на един служител с добронамереността му към колегите? Влияе ли настроението на ученика върху успеха при решаването на сложна аритметична задача? За да отговори на такива въпроси, изследователят трябва да измери два показателя, представляващи интерес за всеки член на извадката.

Стойността на коефициента на корелация не се влияе от единиците, в които са представени признаците. Следователно всякакви линейни трансформации на признаци (умножение по константа, добавяне на константа) не променят стойността на корелационния коефициент. Изключение е умножаването на един от знаците с отрицателна константа: коефициентът на корелация променя знака си на противоположния.

Приложение на корелацията на Спирман и Пиърсън.

Корелацията на Пиърсън е мярка за линейната връзка между две променливи. Тя ви позволява да определите колко пропорционална е променливостта на две променливи. Ако променливите са пропорционални една на друга, тогава графично връзката между тях може да бъде представена като права линия с положителен (пряка пропорция) или отрицателен (обратна пропорция) наклон.

На практика връзката между две променливи, ако има такава, е вероятностна и графично изглежда като елипсоидален разпръснат облак. Този елипсоид обаче може да бъде представен (апроксимиран) като права линия или регресионна линия. Регресионната линия е права линия, конструирана чрез метода на най-малките квадрати: сумата от квадратите на разстоянията (изчислени по оста y) от всяка точка на диаграмата на разсейване до линията е минимална.

От особено значение за оценка на точността на прогнозата е дисперсията на оценките на зависимата променлива. По същество дисперсията на оценките на зависимата променлива Y е тази част от нейната обща дисперсия, която се дължи на влиянието на независимата променлива X. С други думи, съотношението на дисперсията на оценките на зависимата променлива към нейната истинска дисперсия е равен на квадрата на корелационния коефициент.

Квадратът на корелационния коефициент на зависимите и независимите променливи представлява съотношението на дисперсията на зависимата променлива поради влиянието на независимата променлива и се нарича коефициент на детерминация. Следователно коефициентът на детерминация показва степента, в която променливостта на една променлива се дължи (определя) от влиянието на друга променлива.

Коефициентът на детерминация има важно предимство пред коефициента на корелация. Корелацията не е линейна функция на връзката между две променливи. Следователно средноаритметичната стойност на коефициентите на корелация за няколко проби не съвпада с корелацията, изчислена веднага за всички субекти от тези проби (т.е. коефициентът на корелация не е адитивен). Напротив, коефициентът на определяне отразява връзката линейно и следователно е адитивен: може да бъде осреднен за няколко проби.

Допълнителна информация за силата на връзката се дава от стойността на корелационния коефициент на квадрат - коефициентът на детерминация: това е частта от дисперсията на една променлива, която може да се обясни с влиянието на друга променлива. За разлика от коефициента на корелация, коефициентът на детерминация нараства линейно с увеличаване на силата на връзката.

Корелационните коефициенти на Спирман и τ - Кендъл (рангови корелации )

Ако и двете променливи, между които се изследва връзката, са представени в ординална скала или едната от тях е в ординална скала, а другата е в метрична скала, тогава се прилагат коефициентите на рангова корелация: Spearman или τ - Кендел. И двата коефициента изискват предварително класиране на двете променливи за тяхното приложение.

Коефициентът на рангова корелация на Спирман е непараметричен метод, който се използва за статистическо изследване на връзката между явленията. В този случай се определя действителната степен на паралелизъм между двата количествени реда на изследваните признаци и се дава оценка за стегнатостта на установената връзка с помощта на количествено изразен коефициент.

Ако членовете на групата са класирани първо по променливата x и след това по променливата y, тогава корелацията между променливите x и y може да се получи чрез просто изчисляване на коефициента на Pearson за двете рангови серии. При условие, че няма връзки в ранговете (т.е. няма повтарящи се класации) за която и да е променлива, формулата за Pearson може да бъде значително опростена изчислително и преобразувана във формулата, известна като Spearman.

Мощността на коефициента на рангова корелация на Spearman е малко по-ниска от мощността на параметричния коефициент на корелация.

Препоръчително е да използвате коефициента на рангова корелация при наличие на малък брой наблюдения. Този метод може да се използва не само за количествени данни, но и в случаите, когато записаните стойности се определят от описателни характеристики с различна интензивност.

Коефициентът на рангова корелация на Spearman с голям брой идентични рангове за една или и двете сравнявани променливи дава груби стойности. В идеалния случай и двете корелирани серии трябва да бъдат две поредици от несъвпадащи стойности

Алтернатива на корелацията на Спирман за ранговете е корелацията τ - Кендъл. Корелацията, предложена от М. Кендъл, се основава на идеята, че посоката на връзката може да се прецени чрез сравняване на субектите по двойки: ако двойка субекти има промяна в x, която съвпада по посока с промяна в y, тогава това показва положителна връзка, ако не съвпада - нещо за отрицателна връзка.

Коефициентите на корелация са специално разработени, за да определят числено силата и посоката на връзката между две свойства, измерени на цифрови скали (метрични или рангови). Както вече беше споменато, стойностите на корелация +1 (строга пряка или правопропорционална връзка) и -1 (строга обратна или обратно пропорционална връзка) съответстват на максималната сила на връзката, корелацията, равна на нула, съответства на липсата на връзка. Допълнителна информация за силата на връзката се предоставя от стойността на коефициента на детерминация: това е частта от дисперсията на една променлива, която може да се обясни с влиянието на друга променлива.

9. Параметрични методи за сравнение на данни

Методите за параметрично сравнение се прилагат, ако вашите променливи са измерени по метрична скала.

Сравнение на дисперсии 2- x проби чрез теста на Фишер .


Този метод ви позволява да тествате хипотезата, че дисперсиите на 2 генерални съвкупности, от които са извлечени сравнените проби, се различават една от друга. Ограничения на метода - разпределението на признака в двете проби не трябва да се различава от нормалното.

Алтернатива на сравняването на дисперсии е тестът на Lieven, за който не е необходимо да се тества за нормално разпределение. Този метод може да се използва за тестване на предположението за равенство (хомогенност) на дисперсиите, преди да се провери надеждността на разликата в средните стойности чрез t-теста на Стюдънт за независими проби с различни размери.

Корелационният анализ е метод, който ви позволява да откриете връзки между определен брой случайни променливи. Целта на корелационния анализ е да се определи оценка на силата на връзките между такива случайни променливи или характеристики, които характеризират определени реални процеси.

Днес предлагаме да разгледаме как корелационният анализ на Spearman се използва за визуално показване на формите на връзка в практическата търговия.

Корелация на Спирман или основа на корелационния анализ

За да разберете какво е корелационен анализ, първо трябва да разберете концепцията за корелация.

В същото време, ако цената започне да се движи в посоката, от която се нуждаете, е необходимо да деблокирате позиции навреме.


За тази стратегия, която се основава на корелационен анализ, инструменти за търговия с висока степен на корелация (EUR/USD и GBP/USD, EUR/AUD и EUR/NZD, AUD/USD и NZD/USD, CFD договори и др.) .

Видео: Прилагане на корелацията на Спирман към Форекс пазара

Споделете с приятели или запазете за себе си:

Зареждане...