روش همبستگی اسپیرمن. همبستگی رتبه و ضریب همبستگی رتبه اسپیرمن

ماشین حساب زیر نسبت را محاسبه می کند همبستگی رتبهاسپیرمن بین دو متغیرهای تصادفی. بخش تئوری، به طوری که از ماشین حساب پرت نشود، به طور سنتی در زیر آن قرار می گیرد.

اضافه کردن واردات_صادرات mode_edit حذف

تغییرات در متغیرهای تصادفی

arrow_upwardarrow_downwardایکسarrow_upwardarrow_downward Y
اندازه صفحه: 5 10 20 50 100 chevron_left شورون_راست

تغییرات در متغیرهای تصادفی

داده ها را وارد کنیدخطای واردات

می توانید از یکی از این کاراکترها برای جداسازی فیلدها استفاده کنید: Tab، ";" یا ""، مثال: -50.5;-50.5

واردات برگشت لغو

روش محاسبه ضریب همبستگی رتبه اسپیرمن در واقع بسیار ساده توصیف شده است. این همان ضریب همبستگی پیرسون است که فقط نه برای نتایج اندازه گیری خود متغیرهای تصادفی، بلکه برای آنها محاسبه می شود. ارزش های رتبه.

به این معنا که،

فقط باید بفهمیم که ارزش های رتبه بندی چیست و چرا همه اینها مورد نیاز است.

اگر عناصر سری تغییرات به ترتیب صعودی یا نزولی مرتب شوند، پس رتبهعنصر شماره آن در این سری مرتب شده خواهد بود.

به عنوان مثال، فرض کنید یک سری تغییرات (17،26،5،14،21) داریم. عناصر آن را به ترتیب نزولی مرتب کنید (26،21،17،14،5). 26 دارای رتبه 1، 21 دارای رتبه 2 و غیره است. سری تغییرات مقادیر رتبه به این شکل خواهد بود (3،1،5،4،2).

یعنی هنگام محاسبه ضریب اسپیرمن، اولیه سری تغییراتبه سری تغییرات مقادیر رتبه تبدیل می شوند و پس از آن فرمول پیرسون برای آنها اعمال می شود.

یک نکته ظریف وجود دارد - رتبه مقادیر تکرار شده به عنوان میانگین رتبه ها در نظر گرفته می شود. یعنی برای سری (17، 15، 14، 15)، سری مقادیر رتبه مانند (1، 2.5، 4، 2.5) خواهد بود، زیرا اولین عنصر برابر با 15 دارای رتبه 2 است، و دوم - رتبه 3 و .

اگر مقادیر تکرار شونده وجود نداشته باشد، یعنی تمام مقادیر سری رتبه بندی اعدادی از محدوده 1 تا n هستند، فرمول پیرسون را می توان ساده کرد.

خوب، به هر حال، این فرمول اغلب به عنوان فرمولی برای محاسبه ضریب اسپیرمن ارائه می شود.

جوهر انتقال از خود ارزش ها به ارزش های رتبه ای آنها چیست؟
و نکته این است که با بررسی همبستگی مقادیر رتبه، می توان تعیین کرد که چقدر وابستگی دو متغیر توسط یک تابع یکنواخت توصیف می شود.

علامت ضریب جهت ارتباط بین متغیرها را نشان می دهد. اگر علامت مثبت باشد، با افزایش مقادیر X، مقادیر Y تمایل به افزایش دارند. اگر علامت منفی باشد، با افزایش مقادیر X، مقادیر Y تمایل به کاهش دارند، اگر ضریب 0 باشد، روندی وجود ندارد. اگر ضریب برابر با 1 یا -1 باشد، رابطه بین X و Y به شکل یک تابع یکنواخت است - یعنی با افزایش X، Y نیز افزایش می یابد، یا برعکس، با افزایش X، Y. کاهش می دهد.

یعنی بر خلاف ضریب همبستگی پیرسون، که می‌تواند فقط وابستگی خطی یک متغیر را به متغیر دیگر نشان دهد، ضریب همبستگی اسپیرمن می‌تواند وابستگی یکنواخت را نشان دهد، جایی که یک رابطه خطی مستقیم آشکار نمی‌شود.

بگذارید با یک مثال توضیح دهم. فرض کنید تابع y=10/x را بررسی می کنیم.
ما نتایج اندازه گیری X و Y زیر را داریم
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
برای این داده ها، ضریب همبستگی پیرسون 0.4686- است، یعنی رابطه ضعیف است یا وجود ندارد. اما ضریب همبستگی اسپیرمن دقیقاً برابر با 1- است، که، همانطور که بود، به محقق اشاره می کند که Y وابستگی شدید یکنواخت منفی به X دارد.

روش همبستگی رتبه اسپیرمن به شما امکان می دهد تنگی (قدرت) و جهت همبستگی بین دو ویژگی یا دو پروفایل (سلسله مراتب) ویژگی ها را تعیین کنید.

برای محاسبه همبستگی رتبه، لازم است دو سری مقدار داشته باشیم.

که می توان رتبه بندی کرد. این محدوده از مقادیر می تواند:

1) دو علامت اندازه گیری شده در یک گروه از افراد؛

2) دو سلسله مراتب فردی از صفات شناسایی شده در دو موضوع برای یک مجموعه از صفات.

3) دو سلسله مراتب گروهی از ویژگی ها،

4) سلسله مراتب فردی و گروهی از ویژگی ها.

ابتدا، شاخص ها برای هر یک از ویژگی ها به طور جداگانه رتبه بندی می شوند.

به عنوان یک قاعده، به مقدار کمتری از یک ویژگی، رتبه پایین تری اختصاص می یابد.

در حالت اول (دو ویژگی)، مقادیر فردی برای ویژگی اول، به دست آمده توسط موضوعات مختلف، رتبه بندی می شوند و سپس مقادیر فردی برای ویژگی دوم رتبه بندی می شوند.

اگر دو صفت با هم رابطه مثبت داشته باشند، آزمودنی هایی که در یکی از آنها رتبه های پایینی دارند در دیگری دارای رتبه های پایین و آزمودنی هایی با رتبه های بالا در دیگری هستند.

یکی از صفات نیز در صفت دیگر دارای رتبه های بالایی خواهد بود. برای محاسبه rs، لازم است تفاوت (d) بین رتبه های به دست آمده توسط موضوع مورد نظر در هر دو زمینه تعیین شود. سپس این شاخص های d به روش خاصی تبدیل شده و از 1 کم می شود

هرچه اختلاف بین رتبه ها کمتر باشد، rs بزرگتر خواهد بود، به 1+ نزدیکتر می شود.

اگر همبستگی وجود نداشته باشد، در آن صورت همه رتبه ها مخلوط می شوند و وجود نخواهد داشت

مطابقت ندارد. فرمول به گونه ای طراحی شده است که در این حالت rs نزدیک به 0 خواهد بود.

در صورت همبستگی منفی، رتبه پایین آزمودنی ها در یک ویژگی

با رتبه های بالا در یک ویژگی دیگر مطابقت دارد و بالعکس. هرچه اختلاف بین رتبه‌های آزمودنی‌ها در دو متغیر بیشتر باشد، rs به ​​-1 نزدیک‌تر است.

در حالت دوم (دو پروفایل فردی)، فردی

مقادیر به دست آمده توسط هر یک از 2 موضوع با توجه به مجموعه مشخصی از ویژگی ها (برای هر دوی آنها یکسان است). رتبه اول صفتی را با کمترین مقدار دریافت می کند. رتبه دوم یک ویژگی با ارزش بالاتر و غیره است. بدیهی است که همه ویژگی ها باید در یک واحد اندازه گیری شوند، در غیر این صورت رتبه بندی غیر ممکن است. به عنوان مثال، رتبه بندی شاخص ها بر اساس پرسشنامه شخصیت کتل (16PF) غیرممکن است، اگر آنها در نمرات "خام" بیان شوند، زیرا محدوده مقادیر برای عوامل مختلف متفاوت است: از 0 تا 13، از 0 تا

20 و از 0 تا 26. نمی توانیم بگوییم که کدام یک از عوامل از نظر شدت در جایگاه اول قرار می گیرد مگر اینکه همه مقادیر را به یک مقیاس واحد برسانیم (اغلب این مقیاس دیوار است).

اگر سلسله مراتب فردی دو موضوع رابطه مثبت داشته باشد، آنگاه ویژگی هایی که برای یکی از آنها رتبه های پایینی دارند، برای دیگری رتبه های پایینی خواهند داشت و بالعکس. به عنوان مثال، اگر برای یک موضوع، عامل E (غلبه) کمترین رتبه را داشته باشد، برای آزمودنی دیگر باید رتبه پایینی داشته باشد، اگر یک آزمودنی دارای عامل C باشد.

(ثبات عاطفی) بالاترین رتبه را دارد پس موضوع دیگر نیز باید داشته باشد

این عامل رتبه بالایی دارد و غیره.

در حالت سوم (پروفایل دو گروهی)، میانگین مقادیر گروهی به دست آمده در 2 گروه از آزمودنی ها بر اساس مجموعه مشخصی از ویژگی ها که برای دو گروه یکسان است، رتبه بندی می شوند. در ادامه، خط استدلال مانند دو مورد قبل است.

در مورد چهارم (نمایه های فردی و گروهی)، مقادیر فردی موضوع و مقادیر میانگین گروه به طور جداگانه با توجه به مجموعه ویژگی های یکسانی رتبه بندی می شوند که معمولاً با حذف این فرد به دست می آیند. موضوع - او در پروفایل میانگین گروهی که با آن مقایسه می شود شرکت نمی کند. همبستگی رتبه به شما امکان می دهد بررسی کنید که پروفایل های فردی و گروهی چقدر سازگار هستند.

در هر چهار مورد، معنی‌داری ضریب همبستگی به‌دست‌آمده با تعداد مقادیر رتبه‌بندی‌شده N تعیین می‌شود. در حالت اول، این عدد با حجم نمونه n منطبق خواهد بود. در حالت دوم، تعداد مشاهدات، تعداد ویژگی هایی خواهد بود که سلسله مراتب را تشکیل می دهند. در حالت سوم و چهارم، N نیز تعداد ویژگی های مقایسه شده است و نه تعداد افراد در گروه ها. توضیحات مفصل در مثال ها آورده شده است. اگر مقدار مطلق rs به ​​یک مقدار بحرانی برسد یا از آن فراتر رود، همبستگی معنادار است.

فرضیه ها

دو فرضیه ممکن وجود دارد. اولی به مورد 1 و دومی به سه مورد دیگر اشاره دارد.

نسخه اول فرضیه ها

H0: همبستگی بین متغیرهای A و B با صفر تفاوتی ندارد.

H1: همبستگی بین متغیرهای A و B با صفر تفاوت معناداری دارد.

نسخه دوم فرضیه ها

H0: همبستگی بین سلسله مراتب A و B با صفر تفاوتی ندارد.

H1: همبستگی بین سلسله مراتب A و B به طور قابل توجهی با صفر متفاوت است.

محدودیت های ضریب همبستگی رتبه

1. حداقل 5 مشاهده برای هر متغیر باید ارائه شود. حد بالایی نمونه با جداول موجود مقادیر بحرانی تعیین می شود.

2. ضریب همبستگی رتبه اسپیرمن rs با تعداد زیادی از رتبه های یکسان برای یک یا هر دو متغیر مقایسه شده مقادیر درشت را به دست می دهد. در حالت ایده‌آل، هر دو سری همبسته باید دو دنباله از مقادیر نامتناسب باشند. در صورت عدم رعایت این شرط لازم است برای همان رتبه ها تعدیل صورت گیرد.

ضریب همبستگی رتبه اسپیرمن با فرمول زیر محاسبه می شود:

اگر در هر دو سری رتبه مقایسه شده گروه هایی با رتبه های یکسان وجود دارد، قبل از محاسبه ضریب همبستگی رتبه، لازم است برای رتبه های یکسان Ta و Tv اصلاحاتی انجام شود:

Ta \u003d Σ (a3 - a) / 12،

TV \u003d Σ (v3 - c) / 12،

که در آن a حجم هر گروه از رتبه های یکسان در سری رتبه A است، c حجم هر یک است.

گروه های دارای رتبه های مساوی در سری رتبه های B.

برای محاسبه مقدار تجربی rs از فرمول استفاده کنید:

محاسبه ضریب همبستگی رتبه اسپیرمن rs

1. تعیین کنید که در کدام دو ویژگی یا دو سلسله مراتب مشخص شرکت خواهند کرد

مقایسه به عنوان متغیرهای A و B.

2. طبق قوانین رتبه بندی، مقادیر متغیر A را رتبه بندی کنید، با اختصاص رتبه 1 به کوچکترین مقدار، مطابق با قوانین رتبه بندی (به A.2.3 مراجعه کنید). در ستون اول جدول رتبه ها را به ترتیب تعداد موضوعات یا نشانه ها وارد کنید.

3. مقادیر متغیر B را مطابق با همان قوانین مرتب کنید. در ستون دوم جدول رتبه ها را به ترتیب تعداد موضوعات یا نشانه ها وارد کنید.

5. مربع هر اختلاف: d2. این مقادیر را در ستون چهارم جدول وارد کنید.

Ta \u003d Σ (a3 - a) / 12،

TV \u003d Σ (v3 - c) / 12،

که در آن a حجم هر گروه از رتبه های یکسان در ردیف رتبه A است. ج - حجم هر گروه

همین رتبه ها در سری رتبه بندی B.

الف) در صورت عدم وجود رتبه های یکسان

rs  1 − 6 ⋅

ب) در حضور همان مراتب

Σd 2  T  T

r  1 − 6 ⋅ a in،

که Σd2 مجموع مجذور اختلاف بین رتبه‌ها است. تا و تلویزیون اصلاحاتی برای همین هستند

N تعداد موضوعات یا ویژگی هایی است که در رتبه بندی شرکت کرده اند.

9. از جدول (به ضمیمه 4.3 مراجعه کنید) مقادیر بحرانی rs را برای یک N معین تعیین کنید. اگر rs از مقدار بحرانی بیشتر شود یا مطابق با حداقل، برابر با آن است، همبستگی با 0 تفاوت معنی داری دارد.

مثال 4.1. هنگام تعیین درجه وابستگی واکنش نوشیدن الکل به واکنش حرکتی چشمی در گروه آزمایش، داده ها قبل از نوشیدن الکل و بعد از نوشیدن به دست آمد. آیا واکنش سوژه به حالت مسمومیت بستگی دارد؟

نتایج آزمایش:

قبل از: 16، 13، 14، 9، 10، 13، 14، 14، 18، 20، 15، 10، 9، 10، 16، 17، 18. بعد از: 24، 9، 10، 23، 20، 11، 12، 19، 18، 13، 14، 12، 14، 7، 9، 14. بیایید فرضیه ها را فرموله کنیم:

H0: همبستگی بین میزان وابستگی واکنش قبل از نوشیدن الکل و بعد از نوشیدن با صفر تفاوتی ندارد.

H1: همبستگی بین درجه وابستگی واکنش قبل از نوشیدن الکل و بعد از نوشیدن به طور قابل توجهی با صفر متفاوت است.

جدول 4.1. محاسبه d2 برای ضریب همبستگی رتبه اسپیرمن rs هنگام مقایسه پارامترهای واکنش چشمی قبل و بعد از آزمایش (N=17)

ارزش های

ارزش های

از آنجایی که ما رتبه های تکراری داریم، در این مورد فرمول تنظیم شده برای همان رتبه ها را اعمال می کنیم:

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Tb =((23-2)+(23-2)+(33-3))/12=3

مقدار تجربی ضریب اسپیرمن را پیدا کنید:

rs = 1- 6*((767.75+6+3)/(17*(172-1)))=0.05

با توجه به جدول (پیوست 4.3) مقادیر بحرانی ضریب همبستگی را پیدا می کنیم.

0.48  (0.05 ≤ p)

≥0.62 (p ≤ 0.01)

ما گرفتیم

rs=0.05∠rcr(0.05)=0.48

نتیجه گیری: فرضیه H1 رد و H0 پذیرفته می شود. آن ها همبستگی بین مدرک تحصیلی

وابستگی واکنش قبل از مصرف الکل و بعد از آن با صفر تفاوتی ندارد.

37. ضریب همبستگی رتبه اسپیرمن.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

ضریب همبستگی رتبه اسپیرمن زمانی استفاده می شود که:
- متغیرها دارند مقیاس رتبه بندیاندازه گیری ها
- توزیع داده ها بسیار متفاوت از طبیعییا اصلا معلوم نیست
- نمونه ها کوچک هستند (N< 30).

تفسیر ضریب همبستگی رتبه اسپیرمن با ضریب پیرسون تفاوتی ندارد، اما معنای آن تا حدودی متفاوت است. برای درک تفاوت بین این روش ها و اثبات منطقی حوزه های کاربرد آنها، اجازه دهید فرمول های آنها را با هم مقایسه کنیم.

ضریب همبستگی پیرسون:

ضریب همبستگی اسپیرمن:

همانطور که می بینید، فرمول ها به طور قابل توجهی متفاوت هستند. مقایسه فرمول ها

فرمول همبستگی پیرسون از میانگین حسابی و انحراف معیار سری همبسته استفاده می کند، در حالی که فرمول اسپیرمن از این استفاده نمی کند. بنابراین، برای به دست آوردن نتیجه مناسب طبق فرمول پیرسون، لازم است سری همبسته نزدیک به توزیع نرمال باشد (میانگین و انحراف استاندارد مولفه های توزیع نرمال ). برای فرمول اسپیرمن، این موضوع مرتبط نیست.

یکی از عناصر فرمول پیرسون استانداردسازی هر سری در است z-score.

همانطور که می بینید، تبدیل متغیرها به مقیاس Z در فرمول ضریب همبستگی پیرسون وجود دارد. بر این اساس، برای ضریب پیرسون، مقیاس داده‌ها کاملاً نامربوط است: به عنوان مثال، می‌توانیم دو متغیر را به هم مرتبط کنیم که یکی از آنها حداقل است. = 0 و حداکثر = 1 و دقیقه دوم. = 100 و حداکثر = 1000. مهم نیست که دامنه مقادیر چقدر متفاوت باشد، همه آنها به مقادیر z استاندارد تبدیل می شوند که در مقیاس یکسان هستند.

چنین نرمال سازی در ضریب اسپیرمن وجود ندارد، بنابراین

یک شرط اجباری برای استفاده از ضریب اسپیرمن، برابری محدوده دو متغیر است.

قبل از استفاده از ضریب اسپیرمن برای سری های داده با دامنه های مختلف، لازم است رتبه. رتبه بندی باعث می شود که مقادیر این سری ها همان حداقل = 1 (حداقل رتبه) و حداکثر برابر با تعداد مقادیر (حداکثر، آخرین رتبه = N، یعنی. حداکثر تعدادموارد موجود در نمونه).

در چه مواردی می توان بدون رتبه بندی انجام داد

اینها مواردی هستند که داده ها در اصل هستند مقیاس رتبه بندی. مثلا تست کنید جهت گیری های ارزشیروکش.

همچنین این موارد زمانی است که تعداد گزینه های مقدار کم است و حداقل و حداکثر در نمونه ثابت است. به عنوان مثال، در دیفرانسیل معنایی، حداقل = 1، حداکثر = 7.

مثالی از محاسبه ضریب همبستگی رتبه اسپیرمن

آزمون جهت گیری های ارزش روکیچ روی دو نمونه X و Y انجام شد. وظیفه این بود که بفهمیم سلسله مراتب ارزش این نمونه ها چقدر نزدیک است (به معنای واقعی کلمه، چقدر شبیه به هم هستند).

مقدار حاصله r=0.747 با آن بررسی می شود جدول ارزش بحرانی. مطابق جدول در N=18 مقدار به دست آمده در سطح p قابل اعتماد است<=0,005

ضرایب همبستگی رتبه بر اساس اسپیرمن و کندال

برای متغیرهای متعلق به مقیاس ترتیبی یا برای متغیرهایی که از توزیع نرمال پیروی نمی کنند و همچنین برای متغیرهای متعلق به مقیاس فاصله ای، همبستگی رتبه اسپیرمن به جای ضریب پیرسون محاسبه می شود. برای انجام این کار، مقادیر جداگانه متغیرها به مکان های رتبه بندی اختصاص می یابد، که متعاقبا با استفاده از فرمول های مناسب پردازش می شوند. برای آشکار کردن همبستگی رتبه، تیک کادر پیش‌فرض همبستگی پیرسون را در کادر محاوره‌ای همبستگی‌های دو متغیره بردارید. در عوض، محاسبه همبستگی اسپیرمن را فعال کنید. این محاسبه نتایج زیر را به همراه خواهد داشت. ضرایب همبستگی رتبه ای بسیار نزدیک به مقادیر متناظر ضرایب پیرسون هستند (متغیرهای اصلی دارای توزیع نرمال هستند).

titkova-matmetody.pdf ص. 45

روش همبستگی رتبه اسپیرمن به شما امکان می دهد سفتی (قدرت) و جهت را تعیین کنید

همبستگی بین دو نشانهیا دو پروفایل (سلسله مراتب)نشانه ها

برای محاسبه همبستگی رتبه، لازم است دو سری مقدار داشته باشیم.

که می توان رتبه بندی کرد. این محدوده از مقادیر می تواند:

1) دو نشانهدر همان اندازه گیری شد گروهموضوعات آزمون؛

2) دو سلسله مراتب ویژگی های فردی،در دو موضوع برای یکسان مشخص شد

مجموعه ای از ویژگی ها؛

3) دو سلسله مراتب گروهی از ویژگی ها،

4) فردی و گروهیسلسله مراتب ویژگی

ابتدا، شاخص ها برای هر یک از ویژگی ها به طور جداگانه رتبه بندی می شوند.

به عنوان یک قاعده، به مقدار کمتری از یک ویژگی، رتبه پایین تری اختصاص می یابد.

در حالت اول (دو ویژگی)، مقادیر فردی طبق اولی رتبه بندی می شوند

صفت به دست آمده توسط افراد مختلف و سپس مقادیر فردی برای دوم

امضاء کردن.

اگر دو علامت با هم رابطه مثبت داشته باشند، آزمودنی هایی که رتبه های پایینی دارند

یکی از آنها در دیگری رتبه های پایینی خواهد داشت و موضوعاتی که رتبه های بالایی دارند

یکی از صفات نیز در صفت دیگر دارای رتبه های بالایی خواهد بود. برای شمارش rs

تعیین تفاوت ها ضروری است (د)بین رتبه های به دست آمده توسط این افراد در هر دو

نشانه ها سپس این شاخص های d به روش خاصی تبدیل شده و از 1 کم می شود

هرچه اختلاف بین رتبه ها کمتر باشد، rs بزرگتر خواهد بود، به 1+ نزدیکتر می شود.

اگر همبستگی وجود نداشته باشد، در آن صورت همه رتبه ها مخلوط می شوند و وجود نخواهد داشت

مطابقت ندارد. فرمول به گونه ای طراحی شده است که در این حالت rs نزدیک به 0 خواهد بود.

در صورت وجود همبستگی منفیرتبه پایین سوژه ها بر اساس یک پایه

با رتبه های بالا در یک ویژگی دیگر مطابقت دارد و بالعکس. ناهماهنگی بیشتر

بین رتبه‌های آزمودنی‌ها در دو متغیر، rs نزدیک‌تر به -1 است.

در مورد دوم (دو پروفایل فردی)، شخصی

مقادیر به دست آمده توسط هر یک از 2 موضوع بر اساس یک معین (برای آنها یکسان است

هر دو) مجموعه ای از ویژگی ها. رتبه اول صفتی را با کمترین مقدار دریافت می کند. رتبه دوم -

علامتی با ارزش بالاتر و غیره بدیهی است که تمام ویژگی ها باید در اندازه گیری شوند

همان واحدها، در غیر این صورت رتبه بندی غیرممکن است. به عنوان مثال، غیر ممکن است

اگر شاخص ها به صورت بیان شده باشند، بر اساس پرسشنامه شخصیت کتل (16PF) رتبه بندی کنید.

نمرات "خام"، زیرا محدوده مقادیر برای عوامل مختلف متفاوت است: از 0 تا 13، از 0 تا

20 و از 0 تا 26. نمی توانیم بگوییم که کدام یک از عوامل در رتبه اول قرار می گیرند

شدت، تا زمانی که همه مقادیر را به یک مقیاس بیاوریم (اغلب این مقیاس دیوارها است).

اگر سلسله مراتب فردی دو موضوع ارتباط مثبت داشته باشد، آنگاه نشانه ها

داشتن رتبه های پایین در یکی از آنها در دیگری دارای رتبه های پایین خواهد بود و بالعکس.

به عنوان مثال، اگر برای یک موضوع عامل E (غلبه) کمترین رتبه را داشته باشد، برای

موضوع دیگری، اگر یک موضوع فاکتور C داشته باشد، باید رتبه پایینی داشته باشد

(ثبات عاطفی) بالاترین رتبه را دارد پس موضوع دیگر نیز باید داشته باشد

این عامل رتبه بالایی دارد و غیره.

در حالت سوم (پروفایل دو گروه)، میانگین مقادیر گروه رتبه بندی می شود.

دریافت در 2 گروه از افراد با توجه به معین، یکسان برای دو گروه، مجموعه

نشانه ها در ادامه، خط استدلال مانند دو مورد قبل است.

در مورد 4 (پروفایل فردی و گروهی) آنها به طور جداگانه رتبه بندی می شوند

مقادیر فردی موضوع و مقادیر میانگین گروه برای همان مجموعه

علائمی که معمولاً با حذف این موضوع فردی - او به دست می آید

در میانگین پروفایل گروهی که فرد او با آن مقایسه می شود، شرکت نمی کند

مشخصات. همبستگی رتبه به شما این امکان را می دهد که میزان سازگاری فرد و

پروفایل های گروه

در هر چهار مورد، معنی داری ضریب همبستگی به دست آمده توسط

بر اساس تعداد مقادیر رتبه بندی شده ن.در حالت اول، این عدد مطابق خواهد بود

اندازه نمونه n در حالت دوم، تعداد مشاهدات، تعداد ویژگی ها خواهد بود،

تشکیل یک سلسله مراتب در حالت سوم و چهارم، N نیز تعداد تطبیق داده شده است

نشانه ها، نه تعداد افراد در گروه ها. توضیحات مفصل در مثال ها آورده شده است. اگر یک

مقدار مطلق rs به ​​یک مقدار بحرانی می رسد یا از آن فراتر می رود، همبستگی

قابل اعتماد.

فرضیه ها

دو فرضیه ممکن وجود دارد. اولی به مورد 1 و دومی به سه مورد دیگر اشاره دارد

نسخه اول فرضیه ها

H0: همبستگی بین متغیرهای A و B با صفر تفاوتی ندارد.

H2: همبستگی بین متغیرهای A و B با صفر تفاوت معناداری دارد.

نسخه دوم فرضیه ها

H0: همبستگی بین سلسله مراتب A و B با صفر تفاوتی ندارد.

H2: همبستگی بین سلسله مراتب A و B با صفر تفاوت معناداری دارد.

محدودیت های ضریب همبستگی رتبه

1. حداقل 5 مشاهده برای هر متغیر باید ارائه شود. بالا

حد نمونه برداری توسط جداول موجود مقادیر بحرانی تعیین می شود .

2. ضریب همبستگی رتبه اسپیرمن با تعداد زیادی از یکسان است

رتبه بندی برای یک یا هر دو متغیر منطبق، مقادیر درشتی به دست می دهد. در حالت ایده آل

هر دو سری همبسته باید دو دنباله از عدم تطابق باشند

ارزش های. اگر این شرط برآورده نشد، باید تعدیل انجام شود

همان رتبه ها

ضریب همبستگی رتبه اسپیرمن با فرمول زیر محاسبه می شود:

اگر در هر دو سری رتبه بندی مقایسه شده گروه هایی با رتبه های یکسان وجود داشته باشد،

قبل از محاسبه ضریب همبستگی رتبه، باید همان را اصلاح کرد

رتبه های تا و تلویزیون:

Ta \u003d Σ (a3 - a) / 12،

TV \u003d Σ (v3 - c) / 12،

جایی که آ -حجم هر گروه از رتبه های یکسان در سری رتبه های A، در حجم هر کدام

گروه های دارای رتبه های مساوی در سری رتبه های B.

برای محاسبه مقدار تجربی rs از فرمول استفاده کنید:

38. ضریب همبستگی دو سریال نقطه‌دار.

برای همبستگی به طور کلی به سوال شماره 36 مراجعه کنیدبا. 56 (64) 063.JPG

harchenko-korranaliz.pdf

اجازه دهید متغیر X در مقیاس قوی و متغیر Y در مقیاس دوگانه اندازه گیری شود. ضریب همبستگی دو سریال نقطه rpb با فرمول محاسبه می شود:

در اینجا x 1 مقدار متوسط ​​برای X اشیاء با مقدار "one" برای Y است.

x 0 - مقدار متوسط ​​برای اشیاء X با مقدار "صفر" برای Y.

s x - انحراف استاندارد تمام مقادیر برای X.

n 1 - تعداد اشیاء "یک" در Y ، n 0 - تعداد اشیاء "صفر" در Y.

n = n 1 + n 0 حجم نمونه است.

ضریب همبستگی دو سریال نقطه ای را می توان با استفاده از عبارات معادل دیگر نیز محاسبه کرد:

اینجا xمقدار میانگین کلی برای متغیر است ایکس.

ضریب همبستگی دوسری نقطه ای rpbاز -1 تا +1 متغیر است. در صورتی که متغیرهایی با یک واحد برای، برابر با صفر است Yمیانگین داشته باشد Y، برابر با میانگین متغیرهای با صفر بیش از Y.

معاینه فرضیه های اهمیتنقطه ضریب همبستگی دو سریال برای بررسی است فرضیه صفرساعت 0 در مورد برابری ضریب همبستگی کلی به صفر: ρ = 0 که با استفاده از معیار Student انجام می شود. ارزش تجربی

در مقایسه با مقادیر بحرانی تی آ (df) برای تعداد درجات آزادی df = n– 2

اگر شرط | تی| ≤ تا(df، فرضیه صفر ρ = 0 رد نمی شود. ضریب همبستگی دو سریال نقطه به طور قابل توجهی با صفر متفاوت است اگر مقدار تجربی | تی| در منطقه بحرانی قرار می گیرد، یعنی اگر شرط | تی| > تا(n– 2). پایایی رابطه با استفاده از ضریب همبستگی دو سریال نقطه ای محاسبه شد rpb، همچنین می توان با استفاده از معیار تعیین کرد χ 2 برای تعداد درجات آزادی df= 2.

همبستگی نقطه-دوسری

اصلاح بعدی ضریب همبستگی حاصلضرب گشتاورها در نقطه‌ای-دوسری منعکس شد. r. این آمار رابطه بین دو متغیر را نشان می دهد که یکی از آنها ظاهراً پیوسته و به طور معمول توزیع شده است، در حالی که دیگری به معنای دقیق کلمه گسسته است. ضریب همبستگی نقطه-دوسری با نشان داده می شود r pbisزیرا در r pbisاین دوگانگی ماهیت واقعی متغیر گسسته را منعکس می‌کند و مانند مورد، مصنوعی نیست r بیس، علامت آن خودسرانه تعیین می شود. بنابراین، برای همه اعمال اهداف r pbisدر محدوده 0.00 تا +1.00 در نظر گرفته شده است.

همچنین چنین موردی وجود دارد که دو متغیر پیوسته و به طور معمول توزیع شده در نظر گرفته شوند، اما هر دو به طور مصنوعی مانند همبستگی دوتایی تقسیم می شوند. برای ارزیابی رابطه بین این متغیرها از ضریب همبستگی تتراکوریک استفاده شده است r تتکه توسط پیرسون نیز پرورش داده شد. اصلی (دقیق) فرمول ها و روش های محاسبه r تتکاملا پیچیده هستند بنابراین، با تمرین. این روش از تقریب ها استفاده می کند r تتبر اساس رویه ها و جداول کوتاه شده به دست آمده است.

/online/dictionary/dictionary.php?term=511

ضریب همبستگی دو سریال نقطه‌دارضریب همبستگی بین دو متغیر است که یکی از آنها در مقیاس دوگانه و دیگری در مقیاس فاصله ای اندازه گیری می شود. در آزمون شناسی کلاسیک و مدرن به عنوان شاخص کیفیت یک کار آزمایشی - قابلیت اطمینان - سازگاری با نمره کلتوسط آزمون

برای همبستگی متغیرهای اندازه گیری شده در مقیاس دوگانه و فاصله ایاستفاده کنید ضریب همبستگی نقطه ای-دوسری.
ضریب همبستگی نقطه ای-دوسری یک روش است تجزیه و تحلیل همبستگینسبت متغیرها که یکی از آنها در مقیاس نام اندازه گیری می شود و فقط 2 مقدار می گیرد (به عنوان مثال، مردان / زنان، پاسخ صحیح است / پاسخ نادرست است، علامت وجود دارد / علامت وجود ندارد) و دومی در یک مقیاس نسبت یا یک مقیاس فاصله. فرمول محاسبه ضریب همبستگی نقطه-دوسری:

جایی که:
m1 و m0 مقادیر متوسط ​​X با مقدار 1 یا 0 در Y هستند.
σx انحراف استاندارد تمام مقادیر برای X است
n1 ,n0 - تعداد مقادیر X از 1 یا 0 تا Y.
n تعداد کل جفت مقادیر است

اغلب از این نوع ضریب همبستگی برای محاسبه رابطه آیتم های آزمون با مقیاس خلاصه استفاده می شود. این یکی از انواع بررسی اعتبار است.

39. ضریب همبستگی رتبه-دوسری.

برای همبستگی به طور کلی به سوال شماره 36 مراجعه کنیدبا. 56 (64) 063.JPG

harchenko-korranaliz.pdf ص. 28

ضریب همبستگی رتبه-دوسری زمانی که یکی از متغیرهای ( ایکس) در مقیاس ترتیبی ارائه می شود و دیگری ( Y) - به صورت دوگانه، با فرمول محاسبه می شود

.

در اینجا، میانگین رتبه اشیاء با وحدت در است Y; میانگین رتبه اجسام با صفر اینچ است Y, nحجم نمونه است.

معاینه فرضیه های اهمیتضریب همبستگی رتبه‌ای-دوسری مشابه ضریب همبستگی دوسری نقطه‌ای با استفاده از آزمون t Student با جایگزینی در فرمول‌ها انجام می‌شود. rpbبر روی rrb.

وقتی یک متغیر در مقیاس دوگانه (متغیر ایکس)،و دیگری در مقیاس رتبه ای (متغیر Y)، با استفاده از ضریب همبستگی رتبه-دوسری. ما آن متغیر را به یاد می آوریم ایکس،اندازه گیری شده در مقیاس دوگانه، تنها دو مقدار (کد) 0 و 1 را می گیرد. به طور خاص تأکید کنیم که علیرغم اینکه این ضریب در محدوده -1 تا +1 متفاوت است، علامت آن برای تفسیر مهم نیست. نتایج. این یک استثنا دیگر از قاعده کلی است.

محاسبه این ضریب طبق فرمول انجام می شود:

کجا ` ایکس 1رتبه متوسط ​​نسبت به آن عناصر متغیر Y، که مربوط به کد (ویژگی) 1 در متغیر است ایکس;

`X 0 - رتبه متوسط ​​برای آن عناصر متغیر که مربوط به کد (ویژگی) 0 در متغیر است ایکس\

N-تعداد کل عناصر در متغیر ایکس.

برای اعمال ضریب همبستگی رتبه-دوسری، شرایط زیر باید رعایت شود:

1. متغیرهای مورد مقایسه باید در مقیاس های مختلف اندازه گیری شوند: یک ایکس-در مقیاس دوگانه؛ یکی دیگر Y–در مقیاس رتبه بندی

2. تعداد ویژگی های متفاوت در متغیرهای مقایسه شده ایکسو Yباید همینطور باشد

3. برای ارزیابی سطح پایایی ضریب همبستگی رتبه-دوسری باید از فرمول (9/11) و جدول مقادیر بحرانی برای آزمون دانشجو استفاده کرد که k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

مواردی که یکی از متغیرها وجود دارد مقیاس دوگانه، و دیگری در رتبه (ترتیبی)، نیاز به استفاده دارد ضریب همبستگی رتبه-دوسری:

rpb=2 / n * (m1 - m0)

جایی که:
n تعداد اشیاء اندازه گیری است
m1 و m0 - میانگین رتبه اشیاء با 1 یا 0 در متغیر دوم.
از این ضریب برای بررسی اعتبار آزمون ها نیز استفاده می شود.

40. ضریب همبستگی خطی.

در مورد همبستگی به طور کلی (و در مورد همبستگی خطی به طور خاص) به سوال شماره 36 مراجعه کنیدبا. 56 (64) 063.JPG

ضریب همبستگی آقای پیرسون

r-پیرسون (پیرسون r) برای بررسی رابطه بین دو متریک استفاده می شودسایر متغیرهای اندازه گیری شده در همان نمونهموقعیت های زیادی وجود دارد که استفاده از آن مناسب است. آیا هوش بر عملکرد در سال های آخر دانشگاه تأثیر می گذارد؟ آیا میزان حقوق یک کارمند با حسن نیت او نسبت به همکاران مرتبط است؟ آیا روحیه دانش آموز بر موفقیت در حل یک مسئله پیچیده حسابی تأثیر می گذارد؟ برای پاسخ به چنین سؤالاتی، محقق باید دو شاخص مورد علاقه هر یک از اعضای نمونه را اندازه گیری کند. سپس داده های مورد مطالعه برای بررسی رابطه، مانند مثال زیر جدول بندی می شوند.

مثال 6.1

جدول نمونه ای از داده های اندازه گیری اولیه برای دو شاخص هوش (کلامی و غیرکلامی) در 20 دانش آموز پایه هشتم را نشان می دهد.

رابطه بین این متغیرها را می توان با استفاده از نمودار پراکندگی نشان داد (شکل 6.3 را ببینید). نمودار نشان می دهد که بین شاخص های اندازه گیری شده رابطه وجود دارد: هر چه ارزش هوش کلامی بیشتر باشد (عمدتاً) ارزش هوش غیرکلامی بیشتر است.

قبل از ارائه فرمول ضریب همبستگی، بیایید سعی کنیم منطق وقوع آن را با استفاده از داده های مثال 6.1 ردیابی کنیم. موقعیت هر نقطه / (موضوع با عدد /) در نمودار پراکندگی نسبت به نقاط دیگر (شکل 6.3) را می توان با بزرگی ها و علائم انحراف مقادیر متناظر متغیرها از آنها نشان داد. مقادیر متوسط: (xj - ام جی و (ذهن در ). اگر علائم این انحرافات همزمان باشد، این نشان دهنده یک رابطه مثبت است (مقادیر بزرگ برای ایکسبا مقادیر بزرگ مطابقت دارد دریا مقادیر کوچکتر برای ایکسبا مقادیر کوچکتر مطابقت دارد y).

برای موضوع شماره 1 انحراف از میانگین ایکسو توسط درمثبت و برای موضوع شماره 3 هر دو انحراف منفی هستند. در نتیجه داده های هر دو نشان دهنده رابطه مثبت بین صفات مورد مطالعه است. در مقابل، اگر علائم انحراف از میانگین ایکسو توسط درمتفاوت باشد، این نشان دهنده رابطه منفی بین علائم است. بنابراین، برای موضوع شماره 4، انحراف از میانگین ایکسمنفی است، با توجه به y -مثبت، و برای موضوع شماره 9 - بالعکس.

بنابراین، اگر حاصل ضرب انحرافات (x، - م ایکس ) ایکس (ذهن در ) مثبت، سپس داده های موضوع / یک رابطه مستقیم (مثبت) و اگر منفی است، یک رابطه معکوس (منفی) نشان می دهد. بر این اساس، اگر ایکسwyاکثراً نسبت مستقیم دارند، در این صورت اکثر محصولات انحرافات مثبت خواهند بود و اگر رابطه معکوس داشته باشند، بیشتر محصولات منفی خواهند بود. در نتیجه، شاخص کلیبرای قدرت و جهت رابطه، مجموع همه محصولات انحرافات برای یک نمونه معین می تواند خدمت کند:

با یک رابطه مستقیم بین متغیرها، این مقدار بزرگ و مثبت است - برای اکثر افراد، انحرافات در علامت منطبق هستند (مقادیر بزرگ یک متغیر با مقادیر بزرگ متغیر دیگر مطابقت دارد و بالعکس). اگر ایکسو دربازخورد داشته باشید، سپس برای اکثر آزمودنی ها، مقادیر بزرگ یک متغیر با مقادیر کوچکتر متغیر دیگر مطابقت دارد، یعنی علائم محصولات منفی خواهد بود، و مجموع محصولات در کل نیز بزرگ خواهد بود. در مقدار مطلق، اما در علامت منفی. اگر رابطه سیستماتیک بین متغیرها وجود نداشته باشد، جملات مثبت (محصولات انحرافات) با عبارات منفی متعادل می شوند و مجموع همه حاصلضرب انحرافات نزدیک به صفر خواهد بود.

برای اینکه مجموع محصولات به حجم نمونه بستگی نداشته باشد کافی است آن را معدل کنید. اما ما به اندازه گیری رابطه نه به عنوان یک پارامتر کلی، بلکه به عنوان یک برآورد محاسبه شده از آن - آمار علاقه مندیم. بنابراین، در مورد فرمول پراکندگی، در این مورد نیز همین کار را انجام می دهیم، مجموع حاصلضرب انحرافات را تقسیم نمی کنیم. ن, و در تلویزیون - 1. به نظر می رسد معیاری از ارتباطات است که به طور گسترده در فیزیک و علوم فنی استفاده می شود که به نام کوواریانس (Covahance):


AT روانشناسی، بر خلاف فیزیک، اکثر متغیرها در مقیاس های دلخواه اندازه گیری می شوند، زیرا روانشناسان علاقه ای به قدر مطلق ویژگی ندارند، اما ترتیب متقابلآزمودنی ها در گروه علاوه بر این، کوواریانس به مقیاس (پراکندگی) که ویژگی ها در آن اندازه گیری می شوند بسیار حساس است. برای اینکه معیار ارتباط مستقل از واحدهای اندازه گیری هر یک از ویژگی ها باشد، کافی است کوواریانس را به انحرافات استاندارد مربوطه تقسیم کنیم. بدین ترتیب به دست آمد برای-قاطر ضریب همبستگی کی.پیرسون:

یا پس از جایگزینی عبارت های o x و


اگر مقادیر هر دو متغیر با استفاده از فرمول به r-values ​​تبدیل شوند


سپس فرمول ضریب همبستگی r-Pearson ساده تر به نظر می رسد (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

همبستگی خطی- رابطه خطی غیر علّی آماری بین دو متغیر کمی ایکسو در. اندازه گیری با استفاده از "فاکتور K.L." پیرسون که حاصل تقسیم کوواریانس بر انحراف معیار هر دو متغیر است:

,

جایی که س xy- کوواریانس بین متغیرها ایکسو در;

س ایکس , س y- انحراف استاندارد برای متغیرها ایکسو در;

ایکس من , y من- مقادیر متغیر ایکسو دربرای شماره شی من;

ایکس, y- میانگین های حسابی برای متغیرها ایکسو در.

نسبت پیرسون rمی تواند مقادیر را از بازه [-1; +1]. معنی r = 0به معنی عدم وجود رابطه خطی بین متغیرها است ایکسو در(اما یک رابطه آماری غیر خطی را رد نمی کند). ارزش های مثبتضریب ( r> 0) یک رابطه خطی مستقیم را نشان می دهد. هر چه مقدار آن به +1 نزدیکتر باشد، رابطه مستقیم آماری قوی تر است. ارزش های منفیضریب ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ± 1 به معنای وجود یک اتصال خطی کامل، مستقیم یا معکوس است. در صورت اتصال کامل، تمام نقاط دارای مختصات ( ایکس من , y من) روی یک خط مستقیم دراز بکشید y = آ + bx.

"ضریب K.L." پیرسون همچنین برای اندازه گیری تنگی رابطه در مدل رگرسیون جفت خطی استفاده می شود.

41. ماتریس همبستگی و نمودار همبستگی.

برای همبستگی به طور کلی به سوال شماره 36 مراجعه کنیدبا. 56 (64) 063.JPG

ماتریس همبستگی.اغلب، تجزیه و تحلیل همبستگی شامل مطالعه رابطه نه دو، بلکه بسیاری از متغیرها است که در مقیاس کمی در یک نمونه واحد اندازه‌گیری می‌شوند. در این حالت برای هر جفت از این مجموعه متغیرها همبستگی محاسبه می شود. محاسبات معمولاً در رایانه انجام می شود و نتیجه یک ماتریس همبستگی است.

ماتریس همبستگی(همبستگی ماتریس) نتیجه محاسبه همبستگی های یکسان برای هر جفت از مجموعه است آرمتغیرها در مقیاس کمی در یک نمونه اندازه گیری می شوند.

مثال

فرض کنید که ما در حال مطالعه روابط بین 5 متغیر هستیم (vl, v2,..., v5; پ= 5) بر روی نمونه اندازه گیری شد N=30انسان. در زیر جدول داده های اولیه و ماتریس همبستگی آورده شده است.

و
داده های مرتبط:

ماتریس همبستگی:

به راحتی می توان دید که ماتریس همبستگی مربع است، متقارن با توجه به قطر اصلی (takkakg، y = /) y)، با واحدهای روی مورب اصلی (از آنجا که جی و = گو = 1).

ماتریس همبستگی است مربع:تعداد سطرها و ستون ها برابر است با تعداد متغیرها. او است متقارننسبت به قطر اصلی، از همبستگی ایکسبا دربرابر است با همبستگی دربا ایکس.واحدها در مورب اصلی آن قرار دارند، زیرا همبستگی یک ویژگی با خودش برابر با یک است. در نتیجه، همه عناصر ماتریس همبستگی در معرض تجزیه و تحلیل قرار نمی گیرند، بلکه آنهایی که در بالا یا پایین قطر اصلی قرار دارند.

تعداد ضرایب همبستگی،ویژگی های P که در مطالعه روابط مورد تجزیه و تحلیل قرار می گیرند با فرمول تعیین می شود: P(P- 1)/2. در مثال بالا، تعداد چنین ضرایب همبستگی 5 (5 - 1)/2 = 10 است.

وظیفه اصلی تجزیه و تحلیل ماتریس همبستگی استنشان دادن ساختار روابط متقابل مجموعه ای از ویژگی ها. این امکان تجزیه و تحلیل بصری را فراهم می کند گروه های همبستگی- تصویر گرافیکی ساختارها از نظر آماریارتباطات قابل توجهاگر چنین اتصالات زیادی وجود نداشته باشد (تا 10-15). روش دیگر استفاده از روش های چند متغیره است: رگرسیون چندگانه، تحلیل فاکتوریل یا خوشه ای (به بخش "روش های چند متغیره..." مراجعه کنید). با استفاده از تحلیل عاملی یا خوشه‌ای، می‌توان گروه‌هایی از متغیرها را شناسایی کرد که ارتباط نزدیک‌تری با یکدیگر نسبت به سایر متغیرها دارند. ترکیبی از این روش ها نیز بسیار مؤثر است، مثلاً اگر نشانه های زیادی وجود داشته باشد و همگن نباشد.

مقایسه همبستگی ها -یک کار اضافی برای تجزیه و تحلیل ماتریس همبستگی، که دو گزینه دارد. در صورت لزوم مقایسه همبستگی ها در یکی از ردیف های ماتریس همبستگی (برای یکی از متغیرها)، از روش مقایسه برای نمونه های وابسته استفاده می شود (ص 148-149). هنگام مقایسه همبستگی های همنام محاسبه شده برای نمونه های مختلف، از روش مقایسه برای نمونه های مستقل استفاده می شود (ص 147-148).

روش های مقایسههمبستگی ها در مورب هاماتریس همبستگی (برای ارزیابی ثابت بودن یک فرآیند تصادفی) و مقایسه چندینماتریس‌های همبستگی به‌دست‌آمده برای نمونه‌های مختلف (به دلیل همگنی آن‌ها) زمان‌بر و خارج از محدوده این کتاب هستند. شما می توانید با این روش ها از کتاب GV Sukhodolsky 1 آشنا شوید.

مسئله اهمیت آماریهمبستگی هامشکل این است که روش بررسی آماریفرضیه پیشنهاد می کند یک-چندگانهآزمایش روی یک نمونه انجام شد اگر همین روش اعمال شود چندین بار،حتی اگر در رابطه با متغیرهای مختلف باشد، احتمال به دست آوردن نتیجه صرفاً تصادفی افزایش می یابد. AT مورد کلیاگر همان روش آزمون فرضیه را تکرار کنیم به زمان هادر رابطه با متغیرها یا نمونه های مختلف، پس با مقدار تعیین شده a، تضمینی برای دریافت تایید فرضیه در اهکتعداد موارد

فرض می کنیم که ماتریس همبستگی برای 15 متغیر تحلیل شده است، یعنی 15(15-1)/2 = 105 ضرایب همبستگی محاسبه می شود. برای آزمون فرضیه ها سطح a = 0.05 تنظیم می شود که با 105 بار آزمایش فرضیه بدون در نظر گرفتن اینکه واقعاً اتصال وجود داشته باشد، تأیید آن را پنج بار (!) می گیریم. با دانستن این موضوع و دریافت مثلاً 15 ضریب همبستگی «از لحاظ آماری معنی دار»، آیا می توانیم بگوییم که کدام یک از آنها به طور تصادفی به دست آمده اند و کدام یک رابطه واقعی را نشان می دهند؟

به طور دقیق، قبول کنید راه حل آماریلازم است هر چند بار که فرضیه ها مورد آزمایش قرار می گیرند، سطح a کاهش یابد. اما این به سختی توصیه می شود، زیرا احتمال نادیده گرفتن یک اتصال واقعی (ایجاد خطای نوع II) به روشی غیرقابل پیش بینی افزایش می یابد.

ماتریس همبستگی به تنهایی مبنای کافی نیستبرای نتیجه گیری های آماری در مورد ضرایب فردی موجود در آنهمبستگی ها!

تنها یک راه واقعاً قانع کننده برای حل این مشکل وجود دارد: نمونه را به طور تصادفی به دو قسمت تقسیم کنید و فقط آن دسته از همبستگی هایی را که از نظر آماری در هر دو قسمت نمونه معنی دار هستند در نظر بگیرید. یک جایگزین ممکن است استفاده از روش‌های چند متغیره (تحلیل رگرسیون فاکتوری، خوشه‌ای یا چندگانه) - برای انتخاب و تفسیر بعدی گروه‌هایی از متغیرهای آماری مرتبط با هم باشد.

مشکل کمبود مقادیراگر مقادیر گم شده در داده ها وجود داشته باشد، دو گزینه برای محاسبه ماتریس همبستگی امکان پذیر است: الف) حذف خط به خط مقادیر (حذف کردنمواردفهرستی); ب) حذف دوتایی مقادیر (حذف کردنمواردبه صورت جفتی). در حذف خط به خطمشاهدات با شکاف، کل خط برای شی (موضوع) که حداقل یک مقدار گم شده برای یکی از متغیرها دارد حذف می شود. این روش منجر به یک ماتریس همبستگی "صحیح" می شود به این معنا که همه ضرایب از یک مجموعه از اشیاء محاسبه می شوند. با این حال، اگر مقادیر از دست رفته به طور تصادفی در متغیرها توزیع شوند، پس این روشمی تواند منجر به این واقعیت شود که در مجموعه داده در نظر گرفته شده یک شی واحد وجود نخواهد داشت (هر ردیف حداقل یک مقدار از دست رفته را شامل می شود). برای جلوگیری از این وضعیت، از روش دیگری به نام استفاده کنید حذف جفتیاین روش فقط شکاف‌ها را در هر جفت ستون متغیر انتخاب شده در نظر می‌گیرد و شکاف‌ها را در سایر متغیرها نادیده می‌گیرد. همبستگی برای یک جفت متغیر برای آن اشیایی که هیچ شکافی وجود ندارد محاسبه می شود. در بسیاری از موقعیت ها، به خصوص زمانی که تعداد شکاف ها نسبتاً کم است، مثلاً 10٪، و شکاف ها به طور نسبتاً تصادفی توزیع می شوند، این روش منجر به خطاهای جدی نمی شود. با این حال، گاهی اوقات این مورد نیست. به عنوان مثال، در سوگیری سیستماتیک (تغییر) برآورد، مکان سیستماتیک شکاف ها را می توان "پنهان" کرد، که دلیل آن تفاوت در ضرایب همبستگی ساخته شده بر روی زیر مجموعه های مختلف است (به عنوان مثال، برای زیر گروه های مختلف اشیاء). ). یکی دیگر از مشکلات مرتبط با ماتریس همبستگی محاسبه شده با به صورت جفتحذف شکاف زمانی رخ می دهد که از این ماتریس در انواع دیگر آنالیز استفاده می شود (به عنوان مثال، در رگرسیون چندگانه یا تحلیل عاملی). آنها فرض می کنند که یک ماتریس همبستگی "صحیح" با سطح مشخصی از سازگاری و "تطابق" ضرایب مختلف استفاده می شود. استفاده از یک ماتریس با برآوردهای "بد" (سوگیری) منجر به این واقعیت می شود که برنامه یا قادر به تجزیه و تحلیل چنین ماتریسی نیست و یا نتایج اشتباه خواهد بود. بنابراین، در صورت استفاده از روش زوجی برای حذف داده های از دست رفته، باید بررسی شود که آیا الگوهای سیستماتیک در توزیع شکاف ها وجود دارد یا خیر.

اگر حذف زوجی داده‌های از دست رفته منجر به تغییر سیستماتیک در میانگین‌ها و واریانس‌ها (انحرافات استاندارد) نشود، آنگاه این آمار مشابه آمارهای محاسبه‌شده با روش خط به خط حذف شکاف‌ها خواهد بود. اگر تفاوت قابل توجهی وجود داشته باشد، دلیلی وجود دارد که فرض کنیم تغییری در برآوردها وجود دارد. برای مثال، اگر میانگین (یا انحراف معیار) مقادیر متغیر باشد ولی،که در محاسبه همبستگی آن با متغیر مورد استفاده قرار گرفت AT،بسیار کمتر از حد متوسط ​​(یا انحراف معیار) مقادیر یکسان متغیر ولی،که در محاسبه همبستگی آن با متغیر C استفاده شد، پس دلایل زیادی وجود دارد که انتظار داشته باشیم که این دو همبستگی (الف-بما)بر اساس زیر مجموعه های مختلف داده ها تغییری در همبستگی های ناشی از مکان غیرتصادفی شکاف ها در مقادیر متغیرها وجود خواهد داشت.

تجزیه و تحلیل پلیادهای همبستگی.پس از حل مسئله اهمیت آماری عناصر ماتریس همبستگی، همبستگی‌های آماری معنی‌دار را می‌توان به صورت گرافیکی در قالب یک همبستگی یا پلیاد نمایش داد. کهکشان همبستگی -شکلی متشکل از رئوس و خطوطی است که آنها را به هم متصل می کند. راس ها با ویژگی ها مطابقت دارند و معمولاً با اعداد - اعداد متغیرها - نشان داده می شوند. خطوط با روابط آماری معنی دار مطابقت دارند و به صورت گرافیکی علامت و گاهی سطح معناداری /j رابطه را بیان می کنند.

کهکشان همبستگی می تواند منعکس شود همهروابط معنی دار آماری ماتریس همبستگی (گاهی اوقات نامیده می شود نمودار همبستگی ) یا فقط قسمتی که به طور معناداری انتخاب شده است (به عنوان مثال، مطابق با یک عامل مطابق با نتایج تحلیل عاملی).

نمونه ای از ساخت یک PLEIADI همبستگی


آماده سازی برای صدور گواهینامه ایالتی (نهایی) فارغ التحصیلان: تشکیل پایگاه داده USE (فهرست عمومی شرکت کنندگان USE از همه دسته ها، نشان دهنده موضوعات) - با در نظر گرفتن روزهای ذخیره در صورت همزمانی موضوعات؛

  • برنامه کاری (27)

    راه حل

    2. فعالیت های مؤسسه آموزشی برای بهبود محتوا و ارزیابی کیفیت در موضوعات آموزش طبیعی و ریاضی تفاهم نامه دبیرستان شماره 4، لیتوینوفسکایا، چاپایوسکایا،

  • در عمل، ضریب همبستگی رتبه اسپیرمن (P) اغلب برای تعیین نزدیکی رابطه بین دو ویژگی استفاده می شود. مقادیر هر ویژگی به ترتیب صعودی (از 1 تا n) رتبه بندی می شوند، سپس تفاوت (d) بین رتبه های مربوط به یک مشاهده تعیین می شود.

    مثال شماره 1. رابطه بین حجم تولید صنعتی و سرمایه گذاری در سرمایه ثابت در 10 منطقه یکی از مناطق فدرال فدراسیون روسیه در سال 2003 با داده های زیر مشخص می شود.
    محاسبه ضرایب رتبههمبستگی های اسپیرمنو کندالا اهمیت آنها را در α=0.05 بررسی کنید. نتیجه گیری در مورد رابطه بین حجم تولید صنعتی و سرمایه گذاری در دارایی های ثابت در مناطق تحت بررسی فدراسیون روسیه.

    رتبه هایی را به ویژگی Y و عامل X اختصاص دهید. مجموع تفاضل مربعات d 2 را بیابید.
    با استفاده از ماشین حساب، ضریب همبستگی رتبه اسپیرمن را محاسبه می کنیم:

    ایکس Y رتبه X، dx رتبه Y, d y (dx - dy) 2
    1.3 300 1 2 1
    1.8 1335 2 12 100
    2.4 250 3 1 4
    3.4 946 4 8 16
    4.8 670 5 7 4
    5.1 400 6 4 4
    6.3 380 7 3 16
    7.5 450 8 5 9
    7.8 500 9 6 9
    17.5 1582 10 16 36
    18.3 1216 11 9 4
    22.5 1435 12 14 4
    24.9 1445 13 15 4
    25.8 1820 14 19 25
    28.5 1246 15 10 25
    33.4 1435 16 14 4
    42.4 1800 17 18 1
    45 1360 18 13 25
    50.4 1256 19 11 64
    54.8 1700 20 17 9
    364

    رابطه بین ویژگی Y عامل X قوی و مستقیم است.

    برآورد ضریب همبستگی رتبه اسپیرمن



    با توجه به جدول Student، Ttable را پیدا می کنیم.
    T جدول \u003d (18; 0.05) \u003d 1.734
    از آنجایی که Tobs > Ttabl، این فرضیه که ضریب همبستگی رتبه برابر با صفر است را رد می کنیم. به عبارت دیگر ضریب همبستگی رتبه اسپیرمن از نظر آماری معنادار است.

    برآورد فاصله برای ضریب همبستگی رتبه (فاصله اطمینان)
    فاصله اطمینان برای ضریب همبستگی رتبه اسپیرمن: p(0.5431;0.9095).

    مثال شماره 2. اطلاعات اولیه.

    5 4
    3 4
    1 3
    3 1
    6 6
    2 2
    از آنجایی که ماتریس دارای رتبه های مرتبط (همان شماره رتبه) ردیف 1 است، آنها را تغییر شکل می دهیم. رتبه‌ها بدون تغییر در اهمیت رتبه مجدداً تشکیل می‌شوند، یعنی نسبت‌های مربوطه (بزرگتر، کمتر یا مساوی) باید بین اعداد رتبه حفظ شوند. همچنین توصیه نمی شود که رتبه را بالاتر از 1 و کمتر از مقدار برابر با تعداد پارامترها (در این مورد n = 6) قرار دهید. اصلاح رتبه ها در جدول ساخته شده است.
    رتبه های جدید
    1 1 1
    2 2 2
    3 3 3.5
    4 3 3.5
    5 5 5
    6 6 6
    از آنجایی که در ماتریس ردیف دوم ردیف دوم وجود دارد، آنها را تغییر شکل می دهیم. اصلاح رتبه ها در جدول ساخته شده است.
    شماره صندلی در ردیف مرتب شدهمکان یابی عوامل بر اساس ارزیابی کارشناسرتبه های جدید
    1 1 1
    2 2 2
    3 3 3
    4 4 4.5
    5 4 4.5
    6 6 6
    ماتریس رتبه
    رتبه X، dxرتبه Y, d y(dx - dy) 2
    5 4.5 0.25
    3.5 4.5 1
    1 3 4
    3.5 1 6.25
    6 6 0
    2 2 0
    21 21 11.5
    از آنجایی که در بین مقادیر ویژگی های x و y چندین مورد یکسان وجود دارد، به عنوان مثال. رتبه های محدود تشکیل می شوند، سپس در این مورد ضریب اسپیرمن به صورت زیر محاسبه می شود:

    جایی که


    j - تعداد پیوندها به ترتیب ویژگی x.
    و j تعداد رتبه های یکسان در آن است بسته j-امتوسط x;
    k - تعداد قرقره ها به ترتیب برای ویژگی y.
    در k - تعداد رتبه های یکسان در بسته k-امین در y.
    A = [(2 3 -2)]/12 = 0.5
    B = [(2 3 -2)]/12 = 0.5
    D = A + B = 0.5 + 0.5 = 1

    رابطه بین ویژگی Y و عامل X متوسط ​​و مستقیم است.

    در حضور دو سری از مقادیر مشمول رتبه بندی، محاسبه همبستگی رتبه اسپیرمن منطقی است.

    چنین ردیف هایی را می توان نشان داد:

    • یک جفت ویژگی تعیین شده در همان گروه از اشیاء مورد مطالعه؛
    • یک جفت علامت فرعی منفرد که در 2 شیء مورد مطالعه توسط همان مجموعه علائم تعیین می شود.
    • یک جفت علامت فرعی گروهی؛
    • تبعیت فردی و گروهی علائم.

    این روش شامل رتبه بندی شاخص ها به طور جداگانه برای هر یک از ویژگی ها است.

    کوچکترین مقدار کمترین رتبه را دارد.

    این روش ناپارامتریک است روش آماریطراحی شده برای ایجاد ارتباط بین پدیده های مورد مطالعه:

    • تعیین درجه موازی واقعی بین دو سری داده های کمی.
    • ارزیابی تنگاتنگی رابطه شناسایی شده، به صورت کمی بیان شده است.

    تجزیه و تحلیل همبستگی

    روش آماری طراحی شده برای شناسایی وجود رابطه بین 2 یا چند متغیر تصادفی (متغیر) و همچنین قدرت آن، تحلیل همبستگی نامیده می شود.

    نام خود را از correlatio (lat.) - ratio گرفته است.

    هنگام استفاده از آن، سناریوهای زیر ممکن است:

    • وجود یک همبستگی (مثبت یا منفی)؛
    • بدون همبستگی (صفر).

    در مورد ایجاد رابطه بین متغیرها، ما در مورد همبستگی آنها صحبت می کنیم. به عبارت دیگر می توان گفت که وقتی مقدار X تغییر می کند، لزوماً تغییر متناسبی در مقدار Y مشاهده می شود.

    از معیارهای مختلف اتصال (ضرایب) به عنوان ابزار استفاده می شود.

    انتخاب آنها تحت تأثیر موارد زیر است:

    • روشی برای اندازه گیری اعداد تصادفی؛
    • ماهیت رابطه بین اعداد تصادفی

    وجود همبستگی را می توان به صورت گرافیکی (نمودار) و با ضریب (نمایش عددی) نمایش داد.

    همبستگی با ویژگی های زیر مشخص می شود:

    • قدرت اتصال (با ضریب همبستگی از 0.7 ± تا 1 ± - قوی؛ از 0.3 ± تا 0.699 ± - متوسط؛ از 0 تا 0.299 ± - ضعیف)؛
    • جهت ارتباط (به جلو یا معکوس).

    اهداف تحلیل همبستگی

    تحلیل همبستگی اجازه ایجاد رابطه علی بین متغیرهای مورد مطالعه را نمی دهد.

    با هدف انجام می شود:

    • ایجاد وابستگی بین متغیرها؛
    • به دست آوردن اطلاعات معینی در مورد یک متغیر بر اساس متغیر دیگر؛
    • تعیین نزدیکی (ارتباط) این وابستگی؛
    • تعیین جهت اتصال برقرار شده

    روشهای تحلیل همبستگی


    این تحلیلمی توان با استفاده از:

    • روش مربع یا پیرسون؛
    • روش رتبه یا اسپیرمن.

    روش پیرسون برای محاسباتی که نیاز به تعیین دقیق نیرویی که بین متغیرها وجود دارد قابل استفاده است. علائم مورد مطالعه با کمک آن باید فقط به صورت کمی بیان شود.

    برای اعمال روش اسپیرمن یا همبستگی رتبه ای، هیچ الزام سختگیرانه ای در بیان ویژگی ها وجود ندارد - می تواند هم کمی و هم اسنادی باشد. با تشکر از این روش، اطلاعات نه در مورد ایجاد دقیق قدرت اتصال، بلکه ماهیت نشانگر به دست می آید.

    ردیف های متغیر می توانند شامل گزینه های باز باشند. به عنوان مثال، زمانی که تجربه کاری با مقادیری مانند تا 1 سال، بیش از 5 سال و غیره بیان می شود.

    ضریب همبستگی

    یک مقدار آماری که ماهیت تغییر در دو متغیر را مشخص می کند، ضریب همبستگی یا ضریب همبستگی نامیده می شود. ضریب جفتهمبستگی ها از نظر کمی، از -1 تا +1 متغیر است.

    رایج ترین نسبت ها عبارتند از:

    • پیرسون- قابل استفاده برای متغیرهای متعلق به مقیاس فاصله.
    • نیزه دار- برای متغیرهای مقیاس ترتیبی.

    محدودیت در استفاده از ضریب همبستگی

    به دست آوردن داده های غیر قابل اعتماد هنگام محاسبه ضریب همبستگی در مواردی امکان پذیر است که:

    • تعداد کافی مقادیر برای متغیر (25-100 جفت مشاهدات) وجود دارد.
    • به عنوان مثال، بین متغیرهای مورد مطالعه، یک رابطه درجه دوم برقرار است، نه خطی.
    • در هر مورد، داده ها شامل بیش از یک مشاهده است.
    • وجود مقادیر غیرعادی (غیرطبیعی) متغیرها؛
    • داده های مورد مطالعه شامل زیرگروه های مشاهدات کاملاً تعریف شده ای است.
    • وجود یک همبستگی اجازه نمی دهد که مشخص شود کدام یک از متغیرها می تواند به عنوان یک علت در نظر گرفته شود و کدام - در نتیجه.

    آزمون اهمیت همبستگی

    برای نرخ آماراز مفهوم اهمیت یا قابلیت اطمینان آنها استفاده می شود که احتمال وقوع تصادفی یک کمیت یا مقادیر شدید آن را مشخص می کند.

    متداول ترین روش برای تعیین معنی داری همبستگی، تعیین آزمون تی استودنت است.

    مقدار آن با مقدار جدولی مقایسه می شود، تعداد درجات آزادی 2 در نظر گرفته می شود. وقتی مقدار محاسبه شده معیار از مقدار جدولی بیشتر باشد، نشان دهنده اهمیت ضریب همبستگی است.

    هنگام انجام محاسبات اقتصادی، سطح اطمینان 0.05 (95٪) یا 0.01 (99٪) کافی در نظر گرفته می شود.

    رتبه های اسپیرمن

    ضریب همبستگی رتبه اسپیرمن امکان برقراری آماری وجود ارتباط بین پدیده ها را فراهم می کند. محاسبه آن شامل ایجاد یک شماره سریال برای هر ویژگی - یک رتبه است. رتبه می تواند صعودی یا نزولی باشد.

    تعداد ویژگی هایی که باید رتبه بندی شوند می تواند هر کدام باشد. این یک فرآیند نسبتاً پر زحمت است و تعداد آنها را محدود می کند. مشکلات زمانی شروع می شوند که به 20 علامت برسید.

    برای محاسبه ضریب اسپیرمن از فرمول استفاده کنید:

    که در آن:

    n - تعداد ویژگی های رتبه بندی شده را نمایش می دهد.

    d چیزی بیش از تفاوت بین رتبه ها در دو متغیر نیست.

    و ∑(d2) مجموع اختلاف رتبه های مجذور است.

    کاربرد تحلیل همبستگی در روانشناسی

    پشتیبانی آماری تحقیقات روانشناختیآنها را عینی تر و بسیار نماینده می کند. پردازش آماری داده های به دست آمده در طول آزمایشات روانشناختیبه استخراج حداکثر اطلاعات مفید کمک می کند.

    تجزیه و تحلیل همبستگی گسترده ترین کاربرد را در پردازش نتایج خود دریافت کرده است.

    مناسب است که یک تحلیل همبستگی از نتایج به دست آمده در طول تحقیق انجام شود:

    • اضطراب (طبق آزمون های R. Temml، M. Dorca، V. Amen)؛
    • روابط خانوادگی (پرسشنامه "تحلیل روابط خانوادگی" (DIA) E.G. Eidemiller، V.V. Yustitskis)؛
    • سطح درونی- بیرونی (پرسشنامه E.F. Bazhin، E.A. Golynkina و A.M. Etkind)؛
    • سطح فرسودگی عاطفی در بین معلمان (پرسشنامه V.V. Boyko)؛
    • ارتباط بین عناصر هوش کلامی دانش آموزان در پروفایل های مختلف آموزشی (روش K.M. Gurevich و دیگران)؛
    • رابطه بین سطح همدلی (روش V.V. Boyko) و رضایت از ازدواج (پرسشنامه V.V. Stolin، T.L. Romanova، G.P. Butenko)؛
    • ارتباط بین وضعیت جامعه‌سنجی نوجوانان (آزمون جیکوب ال. مورنو) و ویژگی‌های سبک تربیت خانواده (پرسشنامه E.G. Eidemiller، V.V. Yustitskis).
    • ساختارهای اهداف زندگی نوجوانان پرورش یافته در خانواده های کامل و تک والدی (پرسشنامه ادوارد ال. دسی، ریچارد ام. رایان رایان).

    دستورالعمل مختصری برای انجام تحلیل همبستگی با توجه به معیار اسپیرمن

    تحلیل همبستگی با استفاده از روش اسپیرمن انجام شده است طبق الگوریتم زیر:

    • ویژگی های قابل مقایسه زوجی در 2 ردیف مرتب شده اند که یکی از آنها با X و دیگری با Y نشان داده شده است.
    • مقادیر سری X به ترتیب صعودی یا نزولی مرتب شده اند.
    • ترتیب ترتیب مقادیر سری Y با مطابقت آنها با مقادیر سری X تعیین می شود.
    • برای هر مقدار در سری X، رتبه را تعیین کنید - یک شماره سریال از حداقل مقدار به حداکثر اختصاص دهید.
    • برای هر یک از مقادیر در سری Y، رتبه را نیز تعیین کنید (از حداقل تا حداکثر).
    • تفاوت (D) بین رتبه های X و Y را با استفاده از فرمول D=X-Y محاسبه کنید.
    • مقادیر اختلاف حاصل مربع می شوند.
    • مجموع مجذورات اختلاف رتبه ها.
    • محاسبات را با استفاده از فرمول انجام دهید:

    مثال همبستگی اسپیرمن

    وجود یک ارتباط بین طول خدمت و میزان آسیب در حضور داده های زیر ضروری است:

    مناسب ترین روش تحلیل، روش رتبه بندی است، زیرا یکی از نشانه ها به صورت گزینه های باز ارائه می شود: سابقه کار تا 1 سال و سابقه کار 7 سال یا بیشتر.

    حل مشکل با رتبه بندی داده ها شروع می شود که در یک کاربرگ خلاصه می شود و می تواند به صورت دستی انجام شود، زیرا. حجم آنها زیاد نیست:

    تجربه کاری تعداد جراحات اعداد ترتیبی (رتبه ها) تفاوت رتبه مجذور اختلاف رتبه
    d (x-y)
    تا 1 سال 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,5
    7 یا بیشتر 6 5 1 +4 16
    Σd2 = 38.5

    ظاهر رتبه های کسری در ستون به این دلیل است که در مورد ظاهر یک نوع با همان مقدار، میانگین پیدا می شود. مقدار حسابیرتبه در این مثال، میزان آسیب 12 دو بار اتفاق می افتد و به آن رتبه های 2 و 3 اختصاص داده می شود، میانگین حسابی این رتبه ها (2 + 3) / 2 = 2.5 را پیدا می کنیم و این مقدار را برای 2 شاخص در کاربرگ قرار می دهیم.
    با جایگزینی مقادیر به دست آمده در فرمول کاری و انجام محاسبات ساده، ضریب اسپیرمن برابر با 0.92- را بدست می آوریم.

    مقدار منفی ضریب نشان دهنده وجود بازخورد بین علائم است و نشان می دهد که یک تجربه کاری کوتاه همراه با تعداد زیادیصدمات. علاوه بر این، قدرت رابطه این شاخص ها بسیار زیاد است.
    مرحله بعدی محاسبات تعیین قابلیت اطمینان ضریب به دست آمده است:
    خطای آن و معیار دانشجویی محاسبه می شود

    با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

    بارگذاری...