برای ارزیابی معنی داری از آزمون F فیشر استفاده می شود. آزمون فیشر و ضریب فیشر برای معادله رگرسیون چندگانه

معیار فیشر

از معیار فیشر برای آزمایش این فرضیه استفاده می شود که واریانس دو جمعیت کلی برابر هستند، که بر اساس توزیع شده اند. قانون عادی. یک معیار پارامتریک است.

آزمون F فیشر نسبت واریانس نامیده می شود، زیرا به عنوان نسبت دو تخمین بی طرفانه واریانس مقایسه شده است.

بگذارید دو نمونه در نتیجه مشاهدات به دست آید. بر اساس آنها، واریانس ها و داشتن و درجه آزادی. فرض می کنیم که اولین نمونه از جامعه عمومی با واریانس گرفته شده است ، و دوم - از جمعیت عمومی با یک واریانس . فرضیه صفر در مورد برابری دو واریانس، یعنی. H0:
یا . برای رد این فرضیه، اثبات اهمیت تفاوت در سطح معینی از اهمیت ضروری است.
.

مقدار معیار با فرمول محاسبه می شود:

بدیهی است که در صورت مساوی بودن واریانس ها، مقدار معیار برابر با یک خواهد بود. در موارد دیگر، بزرگتر (کمتر) از یک خواهد بود.

این معیار دارای توزیع فیشر است
. آزمون فیشر یک آزمون دو طرفه و فرضیه صفر است
به نفع جایگزین رد شد
اگر . اینجا کجاست
به ترتیب حجم نمونه اول و دوم است.

سیستم STATISTICA یک آزمایش فیشر یک طرفه را پیاده سازی می کند. مثل همیشه حداکثر پراکندگی را بگیرید. در این حالت، فرض صفر به نفع جایگزین رد می شود اگر .

مثال

بگذارید وظیفه مقایسه اثربخشی آموزش دو گروه از دانش آموزان تعیین شود. سطح پیشرفت، سطح مدیریت فرآیند یادگیری را مشخص می کند، و پراکندگی، کیفیت مدیریت یادگیری، درجه سازماندهی فرآیند یادگیری را مشخص می کند. هر دو شاخص مستقل و مورد کلیباید به صورت مشترک در نظر گرفته شود. سطح پیشرفت (انتظار ریاضی) هر گروه از دانش آموزان با میانگین حسابی مشخص می شود و، و کیفیت با واریانس های نمونه مربوطه از برآوردها مشخص می شود: و. هنگام ارزیابی سطح عملکرد فعلی، مشخص شد که برای هر دو دانش‌آموز یکسان است: == 4.0. واریانس های نمونه:
و
. تعداد درجات آزادی مربوط به این برآوردها:
و
. از این رو، برای ایجاد تفاوت در اثربخشی آموزش، می توان از ثبات عملکرد تحصیلی استفاده کرد. بیایید فرضیه را آزمایش کنیم.

محاسبه کنید
(شمارگر باید واریانس زیادی داشته باشد)، . طبق جداول ( آماراحتمالتوزیعماشین حساب) می یابیم که کمتر از محاسبه شده است، بنابراین، فرضیه صفر باید به نفع جایگزین رد شود. این نتیجه ممکن است محقق را راضی نکند، زیرا او به ارزش واقعی نسبت علاقه مند است
(ما همیشه واریانس زیادی در صورتگر داریم). هنگام بررسی یک معیار یک طرفه، ما دریافت می کنیم که کمتر از مقدار محاسبه شده در بالا است. بنابراین، فرض صفر باید به نفع جایگزین رد شود.

تست فیشر در برنامه STATISTICA در محیط ویندوز

برای مثالی از آزمایش یک فرضیه (معیار فیشر)، از یک فایل با دو متغیر (fisher.sta) استفاده می کنیم (ایجاد می کنیم):

برنج. 1. جدول با دو متغیر مستقل

برای آزمون فرضیه، لازم است در آمار پایه ( پایه ایآماروجداول) آزمون Student را برای متغیرهای مستقل انتخاب کنید. ( آزمون t، مستقل، توسط متغیرها).

برنج. 2. آزمون فرضیه های پارامتریک

پس از انتخاب متغیرها و فشار دادن کلید خلاصهمقادیر انحرافات استاندارد و آزمون فیشر محاسبه می شود. علاوه بر این، سطح اهمیت تعیین می شود پ، جایی که تفاوت ناچیز است.

برنج. 3. نتایج آزمون فرضیه (آزمون F)

استفاده كردن احتمالماشین حسابو با تنظیم مقدار پارامترها می توانید توزیع فیشر را با علامت مقدار محاسبه شده رسم کنید.

برنج. 4. حوزه پذیرش (رد) فرضیه (معیار F)

منابع.

    آزمون فرضیه ها در مورد رابطه دو واریانس

URL: /tryphonov3/terms3/testdi.htm

    سخنرانی 6. :8080/resources/math/mop/lections/lection_6.htm

    و - معیار فیشر

URL: /home/portal/applications/Multivariatadvisor/F-Fisheer/F-Fisheer.htm

    نظریه و عمل تحقیقات احتمالی و آماری.

URL: /active/referats/read/doc-3663-1.html

    و - معیار فیشر

معیار فیشربه شما امکان می دهد مقادیر واریانس نمونه دو نمونه مستقل را با هم مقایسه کنید. برای محاسبه F emp باید نسبت واریانس دو نمونه را پیدا کنید، به طوری که واریانس بزرگتر در صورت و کوچکتر در مخرج باشد. فرمول محاسبه معیار فیشر به شرح زیر است:

واریانس نمونه اول و دوم به ترتیب کجاست.

از آنجایی که با توجه به شرط ملاک، مقدار صورت باید بزرگتر یا مساوی مقدار مخرج باشد، مقدار Femp همیشه بزرگتر یا مساوی یک خواهد بود.

تعداد درجات آزادی نیز به سادگی تعریف می شود:

ک 1 =n ل - 1 برای نمونه اول (یعنی برای نمونه ای که واریانس آن بزرگتر است) و ک 2 = n 2 - 1 برای نمونه دوم

در پیوست 1، مقادیر بحرانی معیار فیشر با مقادیر k 1 (خط بالای جدول) و k 2 (ستون چپ جدول) یافت می شود.

اگر t emp >t crit، فرضیه صفر پذیرفته می شود، در غیر این صورت جایگزین پذیرفته می شود.

مثال 3در دو کلاس سوم، ده دانش آموز از نظر رشد ذهنی بر اساس آزمون TURMS مورد آزمایش قرار گرفتند. مقادیر میانگین به دست آمده تفاوت معنی داری نداشتند، با این حال، روانشناس به این سوال علاقه مند است - آیا تفاوت هایی در میزان همگنی شاخص های رشد ذهنی بین کلاس ها وجود دارد.

راه حل. برای معیار فیشر، مقایسه واریانس نمرات آزمون در هر دو کلاس ضروری است. نتایج آزمون در جدول ارائه شده است:

جدول 3

تعداد دانش آموزان

کلاس اول

درجه دوم

پس از محاسبه واریانس برای متغیرهای X و Y، به دست می آوریم:

س ایکس 2 =572.83; س y 2 =174,04

سپس با توجه به فرمول (8) برای محاسبه بر اساس معیار F Fisher، در می یابیم:

طبق جدول ضمیمه 1 برای معیار F با درجه آزادی در هر دو مورد برابر با k=10 - 1 = 9 F crit = 3.18 (<3.29), следовательно, в терминах статистических гипотез можно утвер­ждать, что Н 0 (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н 1 . Иcследователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

6.2 آزمون های ناپارامتریک

محقق با مقایسه چشمی (بر حسب درصد) نتایج قبل و بعد از هر گونه مواجهه به این نتیجه می رسد که در صورت مشاهده تفاوت، در نمونه های مقایسه شده تفاوت وجود دارد. چنین رویکردی کاملاً غیرقابل قبول است، زیرا تعیین سطح اطمینان در تفاوت ها برای درصد غیرممکن است. درصدهای گرفته شده به خودی خود امکان نتیجه گیری آماری قابل اعتماد را فراهم نمی کند. برای اثبات اثربخشی هر گونه تأثیر، لازم است یک روند آماری معنی دار در تغییر (تغییر) شاخص ها شناسایی شود. برای حل چنین مسائلی محقق می تواند از تعدادی معیار تفاوت استفاده کند. در زیر، آزمون های ناپارامتریک در نظر گرفته می شود: آزمون علامت و آزمون کای دو.

اهمیت معادله رگرسیون چندگانه به عنوان یک کل، و همچنین در رگرسیون زوجی، با استفاده از معیار فیشر ارزیابی می شود:

, (2.22)

جایی که
مجموع فاکتوریل مربع ها در درجه آزادی است.
مجموع باقیمانده مربع ها در هر درجه آزادی است.
- ضریب (شاخص) تعیین چندگانه؛
تعداد پارامترهای متغیرها است (در رگرسیون خطی با تعداد عوامل موجود در مدل منطبق است). تعداد مشاهدات است.

اهمیت نه تنها معادله به عنوان یک کل، بلکه عاملی که در مدل رگرسیون گنجانده شده است نیز ارزیابی می شود. نیاز به چنین ارزیابی به این دلیل است که هر عاملی که در مدل گنجانده شده است نمی تواند به طور قابل توجهی نسبت تغییرات توضیح داده شده ویژگی حاصل را افزایش دهد. علاوه بر این، اگر چندین عامل در مدل وجود داشته باشد، می توان آنها را در توالی های مختلف به مدل معرفی کرد. با توجه به همبستگی بین عوامل، اهمیت یک عامل ممکن است بسته به ترتیب ورود آن به مدل متفاوت باشد. معیار برای ارزیابی گنجاندن یک عامل در مدل، خصوصی است
-معیار، یعنی .

خصوصی
معیار مبتنی بر مقایسه افزایش واریانس عاملی، به دلیل تأثیر یک عامل اضافی، با واریانس باقیمانده در هر یک درجه آزادی با توجه به مدل رگرسیون به عنوان یک کل است. به طور کلی، برای عامل خصوصی
-معیار به این صورت تعریف می شود

, (2.23)

جایی که
- ضریب تعیین چندگانه برای یک مدل با مجموعه کاملی از عوامل،
- همان شاخص، اما بدون درج فاکتور در مدل ,تعداد مشاهدات است،
تعداد پارامترهای مدل (بدون ترم آزاد) است.

مقدار واقعی ضریب
-معیار در سطح معنی داری با جدول مقایسه می شود
و تعداد درجات آزادی: 1 و
. اگر مقدار واقعی باشد فراتر می رود
، سپس گنجاندن اضافی عامل در مدل از نظر آماری توجیه شده و ضریب رگرسیون خالص است با یک عامل از نظر آماری معنی دار است. اگر مقدار واقعی باشد کمتر از جدول، سپس گنجاندن اضافی در مدل عامل به طور قابل توجهی نسبت تغییرات توضیح داده شده این صفت را افزایش نمی دهد بنابراین، گنجاندن آن در مدل نامناسب است. ضریب رگرسیون برای این عامل در این مورد از نظر آماری ناچیز است.

برای یک معادله دو عاملی، ضرایب
-معیارها به این صورت هستند:

,
. (2.23a)

با کمک یک خصوصی
-تست، شما می توانید اهمیت تمام ضرایب رگرسیون را با این فرض که هر عامل مربوطه آخرین وارد معادله رگرسیون چندگانه شد.

-آزمون دانشجویی برای معادله رگرسیون چندگانه.

خصوصی
معیار، اهمیت ضرایب رگرسیون خالص را ارزیابی می کند. دانستن قدر ، امکان تعیین آن وجود دارد -معیار ضریب رگرسیون در -عامل، ، برای مثال:

. (2.24)

برآورد معناداری ضرایب رگرسیون خالص توسط -معیار دانشجویی بدون محاسبه خصوصی قابل انجام است
-شاخص. در این حالت، مانند رگرسیون زوجی، برای هر عامل از فرمول زیر استفاده می شود:

, (2.25)

جایی که ضریب رگرسیون خالص با عامل است ,میانگین مربعات (استاندارد) خطای ضریب رگرسیون است .

برای یک معادله رگرسیون چندگانه، خطای استاندارد ضریب رگرسیون را می توان با فرمول زیر تعیین کرد:

, (2.26)

جایی که ,- انحراف استاندارد برای ویژگی ,
ضریب تعیین معادله رگرسیون چندگانه است،
- ضریب تعیین برای وابستگی عامل با همه عوامل دیگر معادله رگرسیون چندگانه؛
تعداد درجات آزادی برای مجموع مجذور انحرافات است.

همانطور که می بینید، برای استفاده از این فرمول، به یک ماتریس همبستگی بین عاملی و محاسبه ضرایب تعیین مربوطه با استفاده از آن نیاز دارید.
. بنابراین، برای معادله
ارزیابی اهمیت ضرایب رگرسیون ,,شامل محاسبه سه ضریب تعیین بین فاکتور است:
,
,
.

رابطه متقابل شاخص های ضریب همبستگی جزئی، خصوصی
-معیارها و -آزمون دانشجو برای ضرایب رگرسیون محض می تواند در روش انتخاب عامل استفاده شود. حذف عوامل در هنگام ساخت معادله رگرسیون با روش حذف عملاً می تواند نه تنها با ضرایب همبستگی جزئی انجام شود، و در هر مرحله عاملی با کوچکترین مقدار ناچیز ضریب همبستگی جزئی را حذف کند، بلکه توسط مقادیر نیز انجام شود. و . خصوصی
معیار به طور گسترده در ساخت مدل با گنجاندن متغیرها و روش رگرسیون گام به گام استفاده می شود.

تابع FISHER تبدیل فیشر آرگومان های X را برمی گرداند. این تبدیل تابعی را ایجاد می کند که دارای توزیع نرمال به جای نامتقارن است. از تابع FISHER برای آزمون فرضیه با استفاده از ضریب همبستگی استفاده می شود.

شرح تابع FISHER در اکسل

هنگام کار با این تابع، باید مقدار متغیر را تنظیم کنید. فوراً باید توجه داشت که برخی از موقعیت‌ها وجود دارد که در آن این عملکرد نتیجه نمی‌دهد. این در صورتی امکان پذیر است که متغیر:

  • یک عدد نیست در چنین شرایطی، تابع FISHER مقدار خطای #VALUE!
  • در این حالت، تابع FISHER مقدار خطای #NUM! را برمی گرداند.

معادله ای که برای توصیف ریاضی تابع FISHER استفاده می شود:

Z"=1/2*ln(1+x)/(1-x)

بیایید کاربرد این تابع را در 3 مثال خاص در نظر بگیریم.



ارزیابی رابطه بین سود و هزینه با استفاده از تابع FISHER

مثال 1. با استفاده از داده‌های مربوط به فعالیت سازمان‌های تجاری، ارزیابی رابطه بین سود Y (میلیون روبل) و هزینه X (میلیون روبل) مورد استفاده برای توسعه محصولات (در جدول 1 ارائه شده است) ضروری است.

جدول 1 - داده های اولیه:

ایکسY
1 210,000,000 روبل95,000,000 دلار
2 1,068,000,000 روبل76,000,000 روبل
3 1,005,000,000 روبل78,000,000 روبل
4 610,000,000 روبل89,000,000 روبل
5 768,000,000 روبل77,000,000 روبل
6 799,000,000 روبل85,000,000 روبل

طرح حل چنین مشکلاتی به شرح زیر است:

  1. ضریب همبستگی خطی r xy محاسبه می شود.
  2. اهمیت ضریب همبستگی خطی بر اساس آزمون t استودنت بررسی می شود. در عین حال، فرضیه برابری ضریب همبستگی با صفر مطرح و مورد آزمون قرار می گیرد. هنگام آزمون این فرضیه، از آماره t استفاده می شود. در صورت تایید فرضیه، آماره t دارای توزیع Student است. اگر مقدار محاسبه شده t p > t cr باشد، فرضیه رد می شود که نشان دهنده اهمیت ضریب همبستگی خطی و در نتیجه معنی دار بودن آماری رابطه بین X و Y است.
  3. تخمین فاصله ای برای یک ضریب همبستگی خطی از نظر آماری معنی دار تعیین می شود.
  4. برآورد فاصله ای برای ضریب همبستگی خطی بر اساس معکوس تبدیل فیشر z تعیین می شود.
  5. خطای استاندارد ضریب همبستگی خطی محاسبه می شود.

نتایج حل این مشکل با توابع استفاده شده در بسته اکسل در شکل 1 نشان داده شده است.


شکل 1 - نمونه ای از محاسبات.

شماره p / pنام نشانگرفرمول محاسبه
1 ضریب همبستگی=CORREL(B2:B7,C2:C7)
2 مقدار تخمینی t-معیار tp=ABS(C8)/ROOT(1-POWER(C8,2))*ROOT(6-2)
3 مقدار جدول t-test trh=STUDISP(0.05،4)
4 مقدار جدول توزیع نرمال استاندارد zy=NORMINV((0.95+1)/2)
5 مقدار تبدیل فیشر z'=FISHER(C8)
6 تخمین فاصله سمت چپ برای z=C12-C11*ROOT(1/(6-3))
7 تخمین فاصله درست برای z=C12+C11*ROOT(1/(6-3))
8 تخمین فاصله سمت چپ برای rxy=FISCHEROBR(C13)
9 تخمین فاصله درست برای rxy=FISCHEROBR(C14)
10 انحراف استاندارد برای rxy=ROOT((1-C8^2)/4)

بنابراین، با احتمال 0.95، ضریب همبستگی خطی در محدوده (0.386-) تا (0.990-) با خطای استاندارد 0.205 قرار دارد.

بررسی اهمیت آماری رگرسیون بر روی تابع FDISP

مثال 2. اهمیت آماری معادله رگرسیون چندگانه را با استفاده از آزمون F فیشر بررسی کنید، نتیجه گیری کنید.

برای آزمایش اهمیت معادله به عنوان یک کل، فرضیه H 0 را در مورد بی اهمیت بودن آماری ضریب تعیین و فرضیه مخالف H 1 را در مورد معنی دار بودن آماری ضریب تعیین مطرح می کنیم:

H 1: R 2 ≠ 0.

بیایید فرضیه ها را با استفاده از آزمون F فیشر آزمایش کنیم. شاخص ها در جدول 2 نشان داده شده است.

جدول 2 - داده های اولیه

برای این کار از تابع زیر در بسته اکسل استفاده می کنیم:

FDISP(α;p;n-p-1)

  • α احتمال مرتبط با توزیع داده شده است.
  • p و n به ترتیب صورت و مخرج درجات آزادی هستند.

با دانستن اینکه α = 0.05، p = 2 و n = 53، مقدار زیر را برای F crit به دست می آوریم (شکل 2 را ببینید).


شکل 2 - نمونه ای از محاسبات.

بنابراین، می توان گفت که F calc > F crit. در نتیجه، فرضیه H 1 در مورد معنی دار بودن آماری ضریب تعیین پذیرفته می شود.

محاسبه مقدار اندیکاتور همبستگی در اکسل

مثال 3. استفاده از داده های 23 شرکت در مورد: X - قیمت محصول A، هزار روبل. Y - سود یک شرکت تجاری، میلیون روبل، وابستگی آنها در حال مطالعه است. ارزیابی مدل رگرسیون به شرح زیر است: ∑(yi-yx) 2 = 50000; ∑(yi-yср) 2 = 130000. چه شاخص همبستگی را می توان از این داده ها تعیین کرد؟ مقدار شاخص همبستگی را محاسبه کرده و با استفاده از آزمون فیشر در مورد کیفیت مدل رگرسیون نتیجه گیری کنید.

بیایید F crit را از عبارت تعریف کنیم:

F calc \u003d R 2 / 23 * (1-R 2)

که در آن R ضریب تعیین برابر با 0.67 است.

بنابراین، مقدار محاسبه شده F calc = 46 است.

برای تعیین F crit، از توزیع فیشر استفاده می کنیم (شکل 3 را ببینید).


شکل 3 - نمونه ای از محاسبات.

بنابراین، برآورد به دست آمده از معادله رگرسیون قابل اعتماد است.

برای مقایسه دو جمعیت با توزیع نرمال که تفاوتی در میانگین نمونه ندارند، اما تفاوت در واریانس وجود دارد، استفاده کنید. معیار فیشر. معیار واقعی با فرمول محاسبه می شود:

که در آن صورت، مقدار بزرگتر واریانس نمونه، و مخرج مقدار کوچکتر است. برای استنباط اهمیت تفاوت بین نمونه ها، از اصل اساسی آزمون فرضیه های آماری نقاط بحرانی برای
در جدول موجود است. اگر مقدار واقعی باشد، فرض صفر رد می شود
از مقدار بحرانی (استاندارد) تجاوز کرده یا برابر خواهد بود
این مقدار برای سطح معناداری پذیرفته شده است و تعداد درجات آزادی ک 1 = n بزرگ -1 ; ک 2 = n کمتر -1 .

مثال: هنگام مطالعه اثر یک داروی خاص بر سرعت جوانه زنی بذر، مشخص شد که در دسته آزمایشی بذر و شاهد، میانگین سرعت جوانه زنی یکسان است، اما در پراکندگی تفاوت وجود دارد.
=1250,
=417. حجم نمونه یکسان و برابر با 20 است.

=2.12. بنابراین فرض صفر رد می شود.

وابستگی همبستگی ضریب همبستگی و خواص آن. معادلات رگرسیون

یک وظیفهتجزیه و تحلیل همبستگی به موارد زیر کاهش می یابد:

    تعیین جهت و شکل ارتباط بین علائم.

    اندازه گیری سفتی آن

کاربردی رابطه یک به یک بین متغیرها زمانی فراخوانی می شود که مقدار مشخصی از یک متغیر (مستقل) باشد ایکس ، که آرگومان نامیده می شود، با مقدار معینی از متغیر (وابسته) دیگر مطابقت دارد در تابع نامیده می شود. ( مثال: وابستگی سرعت یک واکنش شیمیایی به دما. وابستگی نیروی جاذبه به جرم اجسام جذب شده و فاصله بین آنها).

همبستگی رابطه بین متغیرهای ماهیت آماری زمانی نامیده می شود که مقدار معینی از یک ویژگی (که به عنوان یک متغیر مستقل در نظر گرفته می شود) با یک سری کامل از مقادیر عددی یک ویژگی دیگر مطابقت دارد. ( مثال: رابطه بین عملکرد و بارندگی; بین قد و وزن و غیره).

زمینه همبستگی مجموعه ای از نقاط است که مختصات آنها با جفت مقادیر متغیر به دست آمده به طور تجربی برابر است ایکس و در .

با شکل میدان همبستگی می توان وجود یا عدم وجود یک اتصال و نوع آن را قضاوت کرد.



اتصال نامیده می شود مثبت اگر افزایش یک متغیر، متغیر دیگری را افزایش دهد.

اتصال نامیده می شود منفی وقتی افزایش یک متغیر باعث کاهش متغیر دیگر می شود.

اتصال نامیده می شود خطی ، اگر بتوان آن را به صورت تحلیلی نشان داد
.

نشانگر محکم بودن اتصال است ضریب همبستگی . ضریب همبستگی تجربی به صورت زیر بدست می آید:

ضریب همبستگی در محدوده از قرار دارد -1 قبل از 1 و درجه نزدیکی بین کمیت ها را مشخص می کند ایکس و y . اگر یک:


وابستگی همبستگی بین ویژگی ها را می توان به روش های مختلفی توصیف کرد. به طور خاص، هر شکلی از اتصال را می توان با یک معادله کلی بیان کرد
. معادله نوع
و
تماس گرفت پسرفت . معادله رگرسیون مستقیم در بر روی ایکس به طور کلی می توان به شکل نوشت

معادله رگرسیون مستقیم ایکس بر روی در به طور کلی به نظر می رسد

محتمل ترین مقادیر ضرایب آو که در, باو درا می توان برای مثال با استفاده از روش حداقل مربعات محاسبه کرد.

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...