همبستگی، محاسبه ضرایب همبستگی. ویژگی های ضریب همبستگی خطی

پدیده های مختلف اقتصادی چه در سطح خرد و چه در سطح کلان مستقل نیستند، بلکه به هم مرتبط هستند (قیمت یک محصول و تقاضا برای آن، حجم تولید و سود شرکت و ...).

این وابستگی می تواند کاملاً عملکردی (قطعی) و آماری باشد.

رابطه بین و
تماس گرفت عملکردی،زمانی که هر مقدار از یک ویژگی با یک مقدار واحد از ویژگی دیگر مطابقت دارد. (نمونه ای از چنین وابستگی یک به یک، وابستگی مساحت یک دایره به شعاع است).

در واقعیت، ارتباط دیگری بین پدیده ها رایج تر است، زمانی که هر مقدار از یک ویژگی می تواند با چندین مقدار ویژگی دیگر مطابقت داشته باشد (به عنوان مثال، رابطه بین سن کودکان و قد آنها).

شکل ارتباطی که در آن یک یا چند شاخص (عامل) مرتبط با یکدیگر، نه به طور واضح، بلکه با درجه ای از احتمال، بر شاخص دیگر (نتیجه) تأثیر می گذارند. آماری. به ویژه، اگر تغییر در یکی از کمیت ها، مقدار میانگین دیگری را تغییر دهد، در این حالت وابستگی آماری نامیده می شود. همبستگی.

بسته به تعداد عوامل موجود در مدل، وجود دارد همبستگی جفتی(ارتباط دو متغیر) و چندگانه(نتیجه به عوامل مختلفی بستگی دارد).

تجزیه و تحلیل همبستگیتعریف کردن است جهت ها، فرم ها و درجاتاتصالات (سفتی) بین دو (چند) علامت تصادفی
و .

توسط جهتهمبستگی اتفاق می افتد مثبت (مستقیم)اگر افزایش مقدار یک متغیر، مقدار متغیر دیگر را افزایش دهد، و منفی (معکوس)زمانی که افزایش در مقدار یک متغیر، مقدار متغیر دیگر را کاهش می دهد.

توسط فرمهمبستگی می تواند باشد خطی (مستقیم)، هنگامی که تغییر در مقادیر یک ویژگی منجر به تغییر یکنواخت در ویژگی دیگر می شود (از لحاظ ریاضی با معادله یک خط مستقیم توصیف می شود.
) و منحنی، هنگامی که تغییر در مقادیر یک ویژگی منجر به تغییرات نابرابر در ویژگی دیگر می شود (از نظر ریاضی، با معادلات خطوط منحنی توصیف می شود، به عنوان مثال، هذلولی
، سهمی ها
و غیره.).

ساده ترین شکل رابطه بین متغیرها رابطه خطی است. و بررسی وجود چنین وابستگی، ارزیابی شاخص ها و پارامترهای آن یکی از مهم ترین حوزه های اقتصاد سنجی است.

روش‌های آماری خاصی و بر این اساس شاخص‌هایی وجود دارد که مقادیر آن‌ها به نحوی مشخص وجود یا عدم وجود رابطه خطی بین متغیرها را نشان می‌دهد.

3.1. ضریب همبستگی خطی

ساده ترین و تقریبی ترین راه برای شناسایی یک همبستگی است گرافیکی.

با حجم نمونه کوچک، داده های تجربی به صورت دو سری از مقادیر به هم پیوسته ارائه می شوند و . اگر هر جفت
نشان دهنده یک نقطه در یک هواپیما
، سپس به اصطلاح فیلد همبستگی (شکل 1).

اگر میدان همبستگی یک بیضی باشد که محور آن از چپ به راست و از پایین به بالا قرار دارد (شکل 1c)، آنگاه می‌توانیم فرض کنیم که یک رابطه مثبت خطی بین ویژگی‌ها وجود دارد.

اگر میدان همبستگی در امتداد محور از چپ به راست و از بالا به پایین کشیده شود (شکل 1d)، آنگاه می‌توانیم وجود یک رابطه منفی خطی را فرض کنیم.

اگر نقاط مشاهده به طور تصادفی روی صفحه قرار گیرند، یعنی میدان همبستگی یک دایره را تشکیل می دهد (شکل 1a)، آنگاه این نشان دهنده عدم وجود ارتباط بین ویژگی ها است.

شکل 1b یک اتصال عملکردی خطی دقیق را نشان می دهد.

زیر تنگیارتباط بین دو کمیت، میزان هم‌زبانی بین آنها را درک می‌کند که با تغییر در کمیت‌های مورد مطالعه پیدا می‌شود. اگر هر مقدار داده شده
ارزش ها به هم نزدیک هستند ، سپس اتصال نزدیک (قوی) در نظر گرفته می شود. اگر مقادیر به شدت پراکنده است، سپس اتصال کمتر نزدیک در نظر گرفته می شود. با یک همبستگی نزدیک، میدان همبستگی یک بیضی کم و بیش فشرده است.

یک معیار کمی برای جهت و تنگی یک رابطه خطی است ضریب همبستگی خطی .

ضریب همبستگی تعیین شده از داده های نمونه نامیده می شود ضریب همبستگی نمونهطبق فرمول محاسبه می شود:

جایی که , مقادیر فعلی ویژگی ها
و ;و  مقادیر میانگین حسابی ویژگی ها؛
- گزینه میانگین حسابی محصولات،
و
 انحراف معیار این ویژگی ها؛  حجم نمونه

برای محاسبه ضریب همبستگی، کافی است فرض یک رابطه خطی بین ویژگی های تصادفی را بپذیریم. سپس ضریب همبستگی محاسبه شده، معیار این رابطه خطی خواهد بود.

ضریب همبستگی خطی مقادیری از -1 را در مورد یک رابطه منفی خطی دقیق، تا +1 در مورد یک رابطه مثبت خطی دقیق (به عنوان مثال.
). نزدیک بودن ضریب همبستگی به 0 نشان دهنده عدم وجود است خطیارتباط بین ویژگی‌ها، اما نه در مورد عدم وجود ارتباط بین آنها.

ضریب همبستگی را می توان یک تفسیر گرافیکی بصری داد.

اگر یک
، سپس بین علائم یک وابستگی عملکردی خطی شکل وجود دارد
، که به معنی همبستگی کاملنشانه ها در
، خط نسبت به محور دارای شیب مثبت است
، در
 منفی (شکل 1b).

اگر یک
، نکته ها
در ناحیه ای هستند که با خطی شبیه بیضی محدود شده است. هر چه ضریب همبستگی به آن نزدیکتر باشد
، هر چه بیضی باریکتر باشد و نقاط نزدیک به خط مستقیم متمرکز شوند. در
صحبت کردن در مورد همبستگی مثبت. در این مورد، مقادیر تمایل به افزایش با افزایش دارند (شکل 1c). در
صحبت کردن در مورد همبستگی منفی; ارزش های با افزایش تمایل به کاهش دارند (شکل 1d).

اگر یک
، سپس نقاط
در ناحیه محدود به دایره قرار دارند. این بدان معنی است که بین علائم تصادفی
و هیچ همبستگی وجود ندارد و چنین علائمی نامیده می شود نامرتبط(شکل 1a).

هنگام ارزیابی تنگاتنگی رابطه، می توانید از جدول مشروط زیر استفاده کنید:

نزدیکی ارتباطات

مقدار ضریب همبستگی، در صورت وجود

اتصال مستقیم (+)

بازخورد (-)

بدون اتصال

ارتباط ضعیف است

ارتباط متوسط ​​است

ارتباط قوی است

کاملا کاربردی

توجه داشته باشید که در صورت شمارش ضریب نمونه همبستگی خطی کمیت ها
و با پوشیدن آنها شاخص کوواریانس:

این شاخص، مانند ضریب همبستگی، درجه رابطه خطی بین مقادیر را مشخص می کند
و . اگر بزرگتر از صفر باشد، رابطه بین مقادیر مثبت است، اگر کمتر از صفر باشد، رابطه منفی است، برابر با صفر - هیچ رابطه خطی وجود ندارد.

برخلاف ضریب همبستگی، شاخص کوواریانس نرمال شده است - یک بعد دارد و مقدار آن به واحدهای اندازه گیری بستگی دارد.
و . در تحلیل های آماری، کوواریانس معمولاً به عنوان یک عنصر میانی در محاسبه ضریب همبستگی خطی استفاده می شود. که فرمول محاسبه ضریب همبستگی نمونه به شکل زیر است:

ضریب همبستگی استاندازه گیری وابستگی خطی دو متغیرهای تصادفیدر نظریه احتمال و آمار برخی از گونه ها ضرایب همبستگیممکن است مثبت یا منفی باشد. در حالت اول، فرض بر این است که فقط وجود یا عدم وجود یک اتصال و در حالت دوم، جهت آن را نیز می توانیم تعیین کنیم.

متغیر تصادفی در نظریه احتمال

ضریب همبستگی استیک شاخص آماری که نشان می دهد نوسانات در مقادیر دو شاخص دیگر چقدر به هم مرتبط هستند. به عنوان مثال، تا چه حد حرکت بازده صندوق سرمایه‌گذاری مشترک مرتبط است، با حرکت شاخص انتخاب‌شده برای محاسبه بازتاب (همبستگی) دارد. ضریببتا برای این صندوق سرمایه گذاری مشترک. هر چه ارزش نزدیکتر باشد ضریب همبستگیبه 1، صندوق سرمایه گذاری مشترک و شاخص همبستگی بیشتری دارند، به این معنی ضریببتا و بنابراین ضریبآلفا را می توان در نظر گرفت. اگر ارزش این ضریب همبستگیکمتر از 0.75، پس این شاخص ها بی معنی هستند.


چرخه متغیرهای تصادفی

تحلیل همبستگی به میزان رابطه بین دو متغیر تصادفی X و Y می پردازد.

تحلیل همبستگی داده های تجربی برای دو متغیر تصادفی شامل تکنیک های اساسی زیر است:
1. محاسبه ضرایب همبستگی نمونه.
2. ترسیم جدول همبستگی.
3. تأیید فرضیه آماریاهمیت اتصال

تعریف. وابستگی همبستگی بین متغیرهای تصادفی X و Y در صورتی همبستگی خطی نامیده می شود که هر دو تابع رگرسیون f(x) و φ(x) خطی باشند. در این مورد، هر دو خط رگرسیون خطوط مستقیم هستند. آنها را رگرسیون مستقیم می نامند.

به اندازه کافی توضیحات کاملویژگی‌های وابستگی همبستگی بین مقادیر، تعیین شکل این وابستگی و در مورد وابستگی خطی، ارزیابی قدرت آن با مقدار ضریب رگرسیون کافی نیست. به عنوان مثال، مشخص است که وابستگی همبستگی سن دانش آموزان Y دبیرستاناز سال X تحصیل آنها، به طور معمول، نزدیکتر از وابستگی مشابه سن دانش آموزان آموزش عالی است. موسسه تحصیلیاز سال تحصیلی، از آنجایی که در بین دانشجویان همان سال تحصیلی در دانشگاه، معمولاً تفاوت سنی بیشتر از دانشجویان هم کلاس است.

برای تخمین تنگی همبستگی های خطی بین مقادیر X و Y بر اساس نتایج مشاهدات نمونه، مفهوم ضریب همبستگی خطی نمونه معرفی شده است که با فرمول تعیین می شود:



که σ X و σ Y نمونه انحراف استاندارد مقادیر X و Y هستند که با فرمول های زیر محاسبه می شوند:

لازم به ذکر است که معنای اصلی ضریب همبستگی خطی نمونه r B این است که یک تخمین تجربی (یعنی از نتایج مشاهدات بر روی مقادیر X و Y بدست آمده) از ضریب همبستگی خطی کلی مربوطه r: r = r است. ب (9)

با در نظر گرفتن فرمول ها:

می بینیم که معادله نمونه است رگرسیون خطی Y روی X به شکل زیر است:

(10)

جایی که . همین را می توان در مورد معادلات نمونه رگرسیون خطی X روی Y گفت:

(11)

ویژگی های اصلی ضریب همبستگی خطی نمونه:

1. ضریب همبستگی دو کمیت که با وابستگی همبستگی خطی به هم مرتبط نیستند برابر با صفر است.
2. ضریب همبستگی دو کمیت مرتبط با یک وابستگی همبستگی خطی برابر با 1 در حالت وابستگی فزاینده و -1 در مورد وابستگی کاهشی است.
3. مقدار مطلق ضریب همبستگی دو کمیت مرتبط با یک وابستگی همبستگی خطی، نابرابری 0 را برآورده می کند.<|r|<1. При этом коэффициент корреляции положителен, если корреляционная зависимость возрастающая, и отрицателен, если корреляционная зависимость убывающая.
4. نزدیکتر |r| به 1، همبستگی خط مستقیم بین مقادیر Y، X نزدیکتر است.

از نظر ماهیت، همبستگی می تواند مستقیم و معکوس باشد و از نظر قدرت - قوی، متوسط، ضعیف. علاوه بر این، اتصال ممکن است وجود نداشته باشد یا کامل باشد.

قدرت و ماهیت رابطه بین پارامترها

مثال 4. رابطه بین دو کمیت Y و X بررسی شد.نتایج مشاهدات در جدول به صورت نمونه دو بعدی از حجم 11 آورده شده است:



ایکس
Y

ضروری:
1) ضریب همبستگی نمونه را محاسبه کنید.
2) ماهیت و قدرت همبستگی را ارزیابی کنید.
3) یک معادله رگرسیون خطی برای Y بر روی X بنویسید.

راه حل. فرمول های شناخته شده:

از این رو، مطابق (7) و (8):

بنابراین، باید نتیجه گرفت که وابستگی همبستگی مورد بررسی بین مقادیر X و Y از نظر شخصیت معکوس و از نظر قدرت متوسط ​​است.

3) معادله رگرسیون خطی Y روی X:

مثال 5 رابطه بین کیفیت Y (%) و کمیت X (عدد) مورد مطالعه قرار گرفت. نتایج مشاهدات در قالب یک جدول همبستگی آورده شده است:

Y\X n y
90
n x

لازم است ضریب نمونه همبستگی خطی وابستگی Y به X محاسبه شود.

راه حل. برای ساده کردن محاسبات، بیایید به متغیرهای جدید برویم - گزینه های شرطی (u i، v i)، با استفاده از فرمول های (*) (§3) برای h 1 = 4، h 2 = 5، x 0 = 26، y 0 =80. . برای راحتی، این جدول را با نماد جدید بازنویسی می کنیم:

u\v -2 -1 n v
-2
-1
تو

برای x i =u i و y j =v j داریم:

به این ترتیب:

از اینجا،

نتیجه گیری: وابستگی همبستگی بین مقادیر X و Y مستقیم و قوی است.

ضریب همبستگی چندگانه، تنگی رابطه خطی بین یک متغیر و مجموعه متغیرهای دیگر را مشخص می کند.

محاسبه ضریب همبستگی چندگانه ویژگی حاصله y با ضریب x1, x2,…, xm از اهمیت ویژه‌ای برخوردار است، فرمولی برای تعیین اینکه در حالت کلی کدام است.

جایی که ∆r تعیین کننده ماتریس همبستگی است. ∆11 متمم جبری عنصر ryy ماتریس همبستگی است.

اگر فقط دو علامت عامل در نظر گرفته شود، می توان از فرمول زیر برای محاسبه ضریب همبستگی چندگانه استفاده کرد:

ساخت یک ضریب همبستگی چندگانه فقط در مواردی توصیه می شود که ضرایب همبستگی جزئی معنی دار باشند و رابطه بین ویژگی حاصل و عوامل موجود در مدل واقعاً وجود داشته باشد.

تنگی و جهت رابطه بین دو ویژگی همبسته را در صورت وجود رابطه خطی بین آنها مشخص می کند.
ضریب همبستگی خطی در بررسی پدیده ها و فرآیندهای اجتماعی-اقتصادی که توزیع آنها نزدیک به نرمال است از اهمیت بالایی برخوردار است.
در عمل از اصلاحات مختلفی در فرمول های محاسبه این ضریب استفاده می شود. ساده ترین آنها وابستگی فرم است
_xy-xy
r (1 >
تفسیر فیزیکی مقادیر ضریب همبستگی در جدول 1 آورده شده است. جدول 1. برآورد ضریب خطی (همبستگی علمی) مقدار ضریب خطیهمبستگی ماهیت رابطه تفسیر رابطه r=0 وجود ندارد - 0r
l/n - 2
"ر_
(2)
من
(n - 2_
1-r
r
VT
اگر مقدار محاسبه شده t^ >t^ (جدول) باشد، فرضیه H0 رد می شود که نشان دهنده معنی دار بودن ضریب همبستگی خطی و در نتیجه معنی دار بودن آماری رابطه X و Y است. توجه داشته باشید! این معیار برای ارزیابی معنی‌داری برای جمعیت‌های n استفاده می‌شود.
r
(3)
t„ = , - Vn
p I-2
r
مثال. بر اساس داده های نمونه در مورد فعالیت تجاری شرکت های مشابه، نزدیکی رابطه را با استفاده از یک ضریب همبستگی خطی بین سود Y (هزار روبل) و هزینه ها (X) به کوپک در هر 1 روبل ارزیابی کنید. محصولات تولیدی (جدول 2). الگوریتم محاسبه
مقادیر واریانس را محاسبه کنید
st2y = 78029.3; =46.
مقدار ضریب همبستگی را با توجه به فرمول (1) r = (60400.67 - 744.33 * 83.67) / (78029.3 * 46) 0 "5 = -0.98 محاسبه می کنیم.
ما اهمیت ضریب همبستگی را بررسی می کنیم، برای این منظور t - آمار دانشجویی را محاسبه می کنیم
tp \u003d n - 2 \u003d (0.98 / V1-(0.98) 2) * V6-2 \u003d 14.036.
V1-r
جدول شماره 2. - داده های اولیه سود شرکت، هزار هزینه، کوپک، x روبل، y 0.05 و تعداد درجات آزادی k =6-2=4 که برابر است با t cr =2.776.
نتیجه. فرضیه H0 رد می شود زیرا | tF|>t cr =2.776 که نشان دهنده معناداری این ضریب همبستگی است.
باید به خاطر داشت! وابستگی های فوق و نتایج محاسبات عملی به فرضیات مربوط به وجود رابطه خطی بین پارامترهای برآورد شده اشاره دارد. اگر از قبل مشخص شده باشد که رابطه غیرخطی است، می توانید از رابطه همبستگی تجربی استفاده کنید.

هنگام محاسبه این شاخص، انحراف مقادیر فردی صفت از میانگین در نظر گرفته می شود، یعنی. به ترتیب برای نشانه های فاکتوریل و نتیجه مقدار .

با این حال، این مقادیر مطلق را نمی توان به طور مستقیم با یکدیگر مقایسه کرد. علائم را می توان در واحدهای مختلف بیان کرد و با واحدهای اندازه گیری یکسان، میانگین ها می توانند از نظر ارزش متفاوت باشند. مقایسه در معرض انحرافات بیان شده در کسری از میانگین است انحراف معیار(انحرافات نرمال شده).

محاسبه میانگین حاصلضرب انحرافات نرمال شده که نامیده می شود ضریب همبستگی خطی:

با انجام تبدیل های ساده می توانید فرمول زیر را برای محاسبه ضریب همبستگی خطی بدست آورید:

هنگام استفاده از این فرمول، نیازی به محاسبه انحراف مقادیر ویژگی های فردی از آن نیست سایز متوسط، که خطا در محاسبات را هنگام گرد کردن میانگین ها حذف می کند.

ضریب همبستگی خطیمی تواند هر ارزشی را از -1 قبل از + 1 . هر چه مقدار مطلق ضریب همبستگی به 1 نزدیکتر باشد، رابطه بین ویژگی ها نزدیکتر است. علامت ضریب همبستگی خطی جهت رابطه را نشان می دهد. یک رابطه مستقیم با علامت مثبت مطابقت دارد و رابطه معکوس- علامت منفی ضریب همبستگی خطی برای اندازه گیری تنگی اتصال فقط با یک شکل خطی ارتباط استفاده می شود. .

برابری فقط از فقدان یک وابستگی همبستگی خطی صحبت می کند، اما نه به طور کلی از فقدان همبستگی، و حتی بیشتر از یک وابستگی آماری. مقدار ضریب همبستگی دلیلی بر وجود رابطه علی بین ویژگی‌های مورد مطالعه نیست، بلکه ارزیابی میزان سازگاری متقابل در تغییرات ویژگی‌ها است. ایجاد رابطه علت و معلولی با تحلیل ماهیت کیفی پدیده ها مقدم است. هنگام تفسیر ضرایب همبستگی به‌دست‌آمده برای اندازه‌های نمونه کوچک باید دقت ویژه‌ای داشت.

اجازه دهید نتایج مشاهده انتخابی. آیا این با همبستگی واقعاً موجود بین ویژگی‌ها توضیح داده می‌شود جمعیتیا نتیجه انتخاب تصادفی عناصر در نمونه است؟

با توجه به مقدار محاسبه شده ضریب همبستگی نمونه، آزمون فرضیه الزامی است

H 0: ضریب همبستگی در جمعیت عمومی با جایگزین صفر است

H 1: ضریب همبستگی در جمعیت عمومی برابر با صفر نیست.

به عنوان یک معیار آماری برای فرضیه H 0، مقدار

که طبق قانون دانشجویی با درجات آزادی توزیع می شود. فرضیه H 0 رد می شود (یعنی وابستگی ثابت در نظر گرفته می شود) اگر از مقدار مجاز در سطح معنی داری و درجات آزادی فراتر رود. برخی از مقادیر معیار در جدول زیر آورده شده است.


جدول 11

مقادیر مجاز معیار دانشجویی با تعداد درجات آزادی و سطح معناداری.

0,05 0,01
2,10 2,88
2,09 2,86
2,09 2,85
2,08 2,83
2,07 2,82
2,07 2,81
2,06 2,80
2,06 2,79
2,06 2,78
2,05 2,77
2,05 2,76
2,05 2,76
2,04 2,75
2,02 2,70
2,00 2,66
1,98 2,62
1,96 2,58

ضریب همبستگی با دقت نسبتاً درجه نزدیکی رابطه را فقط در مورد رابطه خطی بین ویژگی ها ارزیابی می کند. با وابستگی منحنی، ضریب همبستگی خطی درجه نزدیکی اتصال را دست کم می گیرد و حتی می تواند برابر 0 باشد و بنابراین در چنین مواردی توصیه می شود از مقادیر دیگر به عنوان شاخص درجه نزدیکی استفاده شود. اتصال. در نظر گرفتن همبستگی تجربی .

مطابق با قانون جمع واریانس، واریانس کل برابر است با مجموع میانگین گروه و بین گروه

یا

نسبت همبستگی زمانی که نوسانی در مقدار میانگین مقادیر مشخصه حاصل برای گروه های انتخابی وجود نداشته باشد برابر با صفر است. در مواردی که میانگین واریانس های گروهینزدیک به صفر است، یعنی تقریباً تمام تغییرات ویژگی مؤثر به دلیل عمل عامل است , اندازه رابطه همبستگینزدیک به 1 است. ما به راحتی می توانیم جهت اتصال را مطابق با داده های جدول گروه تعیین کنیم (به مثال 9 مراجعه کنید).

آزمون همبستگی پیرسون یک روش آماری پارامتریک است که به شما امکان می دهد وجود یا عدم وجود رابطه خطی بین دو شاخص کمی را تعیین کنید و همچنین نزدیکی و اهمیت آماری آن را ارزیابی کنید. به عبارت دیگر، آزمون همبستگی پیرسون به شما امکان می دهد تعیین کنید که آیا رابطه خطی بین تغییرات مقادیر دو متغیر وجود دارد یا خیر. در محاسبات و استنباط های آماری، ضریب همبستگی معمولاً به صورت نشان داده می شود rxyیا Rxy.

1. تاریخچه توسعه معیار همبستگی

آزمون همبستگی پیرسون توسط تیمی از دانشمندان بریتانیایی به رهبری کارل پیرسون(1857-1936) در دهه 90 قرن 19، برای ساده سازی تحلیل کوواریانس دو متغیر تصادفی. علاوه بر کارل پیرسون، روی آزمون همبستگی پیرسون نیز کار شد فرانسیس اجورثو رافائل ولدون.

2. آزمون همبستگی پیرسون برای چیست؟

معیار همبستگی پیرسون به شما اجازه می دهد تا تعیین کنید نزدیکی (یا قدرت) همبستگی بین دو شاخص اندازه گیری شده در مقیاس کمی چقدر است. با کمک محاسبات اضافی، می توانید تعیین کنید که رابطه شناسایی شده چقدر از نظر آماری معنادار است.

به عنوان مثال، با استفاده از معیار همبستگی پیرسون، می توان به این سوال پاسخ داد که آیا بین دمای بدن و محتوای لکوسیت ها در خون در عفونت های حاد تنفسی، بین قد و وزن بیمار، بین محتوای موجود در خون رابطه وجود دارد یا خیر. آب آشامیدنیفلوراید و بروز پوسیدگی در جمعیت

3. شرایط و محدودیت های استفاده از آزمون کای اسکوئر پیرسون

  1. شاخص های قابل مقایسه باید در اندازه گیری شوند مقیاس کمی(به عنوان مثال، ضربان قلب، دمای بدن، تعداد لکوسیت ها در هر 1 میلی لیتر خون، فشار خون سیستولیک).
  2. با استفاده از معیار همبستگی پیرسون، فقط می توان آن را تعیین کرد وجود و قدرت یک رابطه خطیبین مقادیر سایر ویژگی‌های رابطه، از جمله جهت (مستقیم یا معکوس)، ماهیت تغییرات (مستقیم یا منحنی خط)، و همچنین وابستگی یک متغیر به متغیر دیگر، با استفاده از تحلیل رگرسیون تعیین می‌شوند.
  3. تعداد مقادیر مورد مقایسه باید برابر با دو باشد. در مورد تجزیه و تحلیل رابطه سه یا چند پارامتر، باید از روش استفاده کنید تحلیل عاملی.
  4. معیار همبستگی پیرسون است پارامتریک، در رابطه با آن شرط اعمال آن است توزیع نرمالمتغیرهای همسان در صورت نیاز تجزیه و تحلیل همبستگیشاخص هایی که توزیع آنها با نرمال متفاوت است، از جمله شاخص هایی که در مقیاس ترتیبی اندازه گیری می شوند، باید از ضریب همبستگی رتبه اسپیرمن استفاده شود.
  5. لازم است به وضوح بین مفاهیم وابستگی و همبستگی تمایز قائل شد. وابستگی مقادیر وجود همبستگی بین آنها را تعیین می کند، اما نه برعکس.

مثلاً رشد کودک به سن او بستگی دارد، یعنی چه کودک بزرگتر، هر چه بالاتر باشد. اگر دو تا بچه بگیریم سنین مختلف، پس با احتمال زیاد رشد کودک بزرگتر از کوچکتر خواهد بود. این پدیدهو تماس گرفت اعتیاد، دلالت بر رابطه علی بین شاخص ها دارد. البته وجود دارند همبستگییعنی تغییرات یک اندیکاتور با تغییرات اندیکاتور دیگر همراه است.

در موقعیتی دیگر، رابطه بین رشد کودک و ضربان قلب (HR) را در نظر بگیرید. همانطور که می دانید، هر دوی این مقادیر به طور مستقیم به سن بستگی دارند، بنابراین، در بیشتر موارد، کودکان با قد بیشتر (و در نتیجه در سنین بالاتر) مقادیر ضربان قلب کمتری خواهند داشت. به این معنا که، همبستگیمشاهده خواهد شد و ممکن است سفتی به اندازه کافی بالا داشته باشد. با این حال اگر بچه بگیریم هم سن، ولی ارتفاع متفاوت، پس به احتمال زیاد ضربان قلب آنها به میزان ناچیزی متفاوت خواهد بود که در رابطه با آن می توان نتیجه گرفت که استقلالضربان قلب از رشد.

مثال بالا نشان می دهد که تمایز بین مفاهیم اساسی در آمار چقدر مهم است اتصالاتو وابستگی هاشاخص هایی برای نتیجه گیری صحیح

4. چگونه ضریب همبستگی پیرسون را محاسبه کنیم؟

ضریب همبستگی پیرسون با استفاده از فرمول زیر محاسبه می شود:

5. چگونه مقدار ضریب همبستگی پیرسون را تفسیر کنیم؟

مقادیر ضریب همبستگی پیرسون بر اساس مقادیر مطلق آن تفسیر می شوند. مقادیر احتمالی ضریب همبستگی از 0 تا 1± متغیر است. هر چه قدر مطلق r xy بیشتر باشد، نزدیکی رابطه بین دو کمیت بیشتر است. r xy = 0 نشان دهنده عدم اتصال کامل است. r xy = 1 - نشان دهنده وجود یک اتصال مطلق (عملکردی) است. اگر مقدار معیار همبستگی پیرسون بزرگتر از 1 یا کمتر از 1- بود، در محاسبات خطا رخ داده است.

برای ارزیابی نزدیکی یا قدرت همبستگی، معیارهای پذیرفته شده عمومی استفاده می شود که بر اساس آن مقادیر مطلق r xy< 0.3 свидетельствуют о ضعیفاتصال، مقادیر r xy از 0.3 تا 0.7 - در مورد اتصال وسطسفتی، مقادیر r xy > 0.7 - o قویاتصالات

تخمین دقیق تری از قدرت همبستگی را می توان با استفاده از میز چادوک:

مقطع تحصیلی اهمیت آماری ضریب همبستگی r xy با استفاده از آزمون t انجام می شود که با فرمول زیر محاسبه می شود:

مقدار به دست آمده t r با مقدار بحرانی در سطح معینی از اهمیت و تعداد درجات آزادی n-2 مقایسه می شود. اگر t r از t crit بیشتر باشد، در مورد اهمیت آماری همبستگی شناسایی شده نتیجه گیری می شود.

6. مثالی از محاسبه ضریب همبستگی پیرسون

هدف از این مطالعه شناسایی، تعیین تنگی و اهمیت آماری همبستگی بین دو شاخص کمی: سطح تستوسترون خون (X) و درصد بود. توده عضلانیدر بدن (Y). داده های اولیه برای یک نمونه 5 نفری (n = 5) در جدول خلاصه شده است.

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...