محاسبه معیار فیشر. تابع فیشر در اکسل و نمونه هایی از کار آن

معیار فیشر

از معیار فیشر برای آزمایش این فرضیه استفاده می شود که واریانس دو جمعیت کلی برابر هستند، که بر اساس توزیع شده اند. قانون عادی. یک معیار پارامتریک است.

آزمون F فیشر نسبت واریانس نامیده می شود، زیرا به عنوان نسبت دو تخمین بی طرفانه واریانس مقایسه شده است.

بگذارید دو نمونه در نتیجه مشاهدات به دست آید. بر اساس آنها، واریانس ها و داشتن و درجه آزادی. فرض می کنیم که اولین نمونه از جامعه عمومی با واریانس گرفته شده است ، و دوم - از جمعیت عمومی با یک واریانس . فرضیه صفر در مورد برابری دو واریانس، یعنی. H0:
یا . برای رد این فرضیه، اثبات اهمیت تفاوت در سطح معینی از اهمیت ضروری است.
.

مقدار معیار با فرمول محاسبه می شود:

بدیهی است که در صورت مساوی بودن واریانس ها، مقدار معیار برابر با یک خواهد بود. در موارد دیگر، بزرگتر (کمتر) از یک خواهد بود.

این معیار دارای توزیع فیشر است
. آزمون فیشر یک آزمون دو طرفه و فرضیه صفر است
به نفع جایگزین رد شد
اگر . اینجا کجاست
به ترتیب حجم نمونه اول و دوم است.

سیستم STATISTICA یک آزمایش فیشر یک طرفه را پیاده سازی می کند. مثل همیشه حداکثر پراکندگی را بگیرید. در این حالت، فرض صفر به نفع جایگزین رد می شود اگر .

مثال

بگذارید وظیفه مقایسه اثربخشی آموزش دو گروه از دانش آموزان تعیین شود. سطح پیشرفت، سطح مدیریت فرآیند یادگیری را مشخص می کند، و پراکندگی، کیفیت مدیریت یادگیری، درجه سازماندهی فرآیند یادگیری را مشخص می کند. هر دو شاخص مستقل و مورد کلیباید به صورت مشترک در نظر گرفته شود. سطح پیشرفت (انتظار ریاضی) هر گروه از دانش آموزان با میانگین حسابی مشخص می شود و، و کیفیت با واریانس های نمونه مربوطه از برآوردها مشخص می شود: و. هنگام ارزیابی سطح عملکرد فعلی، مشخص شد که برای هر دو دانش‌آموز یکسان است: == 4.0. واریانس های نمونه:
و
. تعداد درجات آزادی مربوط به این برآوردها:
و
. از این رو، برای ایجاد تفاوت در اثربخشی آموزش، می توان از ثبات عملکرد تحصیلی استفاده کرد. بیایید فرضیه را آزمایش کنیم.

محاسبه کنید
(شمارگر باید واریانس زیادی داشته باشد)، . طبق جداول ( آماراحتمالتوزیعماشین حساب) می یابیم که کمتر از محاسبه شده است، بنابراین، فرضیه صفر باید به نفع جایگزین رد شود. این نتیجه ممکن است محقق را راضی نکند، زیرا او به ارزش واقعی نسبت علاقه مند است
(ما همیشه واریانس زیادی در صورتگر داریم). هنگام بررسی یک معیار یک طرفه، ما دریافت می کنیم که کمتر از مقدار محاسبه شده در بالا است. بنابراین، فرض صفر باید به نفع جایگزین رد شود.

تست فیشر در برنامه STATISTICA در محیط ویندوز

برای مثالی از آزمایش یک فرضیه (معیار فیشر)، از یک فایل با دو متغیر (fisher.sta) استفاده می کنیم (ایجاد می کنیم):

برنج. 1. جدول با دو متغیر مستقل

برای آزمون فرضیه، لازم است در آمار پایه ( پایه ایآماروجداول) آزمون Student را برای متغیرهای مستقل انتخاب کنید. ( آزمون t، مستقل، توسط متغیرها).

برنج. 2. آزمون فرضیه های پارامتریک

پس از انتخاب متغیرها و فشار دادن کلید خلاصهمقادیر انحرافات استاندارد و آزمون فیشر محاسبه می شود. علاوه بر این، سطح اهمیت تعیین می شود پ، جایی که تفاوت ناچیز است.

برنج. 3. نتایج آزمون فرضیه (آزمون F)

استفاده كردن احتمالماشین حسابو با تنظیم مقدار پارامترها می توانید توزیع فیشر را با علامت مقدار محاسبه شده رسم کنید.

برنج. 4. حوزه پذیرش (رد) فرضیه (معیار F)

منابع.

    آزمون فرضیه ها در مورد رابطه دو واریانس

URL: /tryphonov3/terms3/testdi.htm

    سخنرانی 6. :8080/resources/math/mop/lections/lection_6.htm

    و - معیار فیشر

URL: /home/portal/applications/Multivariatadvisor/F-Fisheer/F-Fisheer.htm

    نظریه و عمل تحقیقات احتمالی و آماری.

URL: /active/referats/read/doc-3663-1.html

    و - معیار فیشر

اهمیت معادله رگرسیون چندگانه به عنوان یک کل، و همچنین در رگرسیون زوجی، با استفاده از معیار فیشر ارزیابی می شود:

, (2.22)

جایی که
مجموع فاکتوریل مربع ها در درجه آزادی است.
مجموع باقیمانده مربع ها در هر درجه آزادی است.
- ضریب (شاخص) تعیین چندگانه؛
تعداد پارامترهای متغیرها است (که در رگرسیون خطیمنطبق بر تعداد عوامل موجود در مدل)؛ تعداد مشاهدات است.

اهمیت نه تنها معادله به عنوان یک کل، بلکه عاملی که در مدل رگرسیون گنجانده شده است نیز ارزیابی می شود. نیاز به چنین ارزیابی به این دلیل است که هر عاملی که در مدل گنجانده شده است نمی تواند به طور قابل توجهی نسبت تغییرات توضیح داده شده ویژگی حاصل را افزایش دهد. علاوه بر این، اگر چندین عامل در مدل وجود داشته باشد، می توان آنها را در توالی های مختلف به مدل معرفی کرد. با توجه به همبستگی بین عوامل، اهمیت یک عامل ممکن است بسته به ترتیب ورود آن به مدل متفاوت باشد. معیار برای ارزیابی گنجاندن یک عامل در مدل، خصوصی است
-معیار، یعنی .

خصوصی
- معیار مبتنی بر مقایسه افزایش واریانس عامل، به دلیل تأثیر یک عامل اضافی شامل، با واریانس باقیمانده در هر یک درجه آزادی با توجه به مدل رگرسیونبطور کلی. AT نمای کلیبرای عامل خصوصی
-معیار به این صورت تعریف می شود

, (2.23)

جایی که
- ضریب تعیین چندگانه برای یک مدل با مجموعه کاملی از عوامل،
- همان شاخص، اما بدون درج فاکتور در مدل ,تعداد مشاهدات است،
تعداد پارامترهای مدل (بدون ترم آزاد) است.

مقدار واقعی ضریب
-معیار در سطح معنی داری با جدول مقایسه می شود
و تعداد درجات آزادی: 1 و
. اگر مقدار واقعی باشد فراتر می رود
، سپس گنجاندن اضافی عامل در مدل از نظر آماری توجیه شده و ضریب رگرسیون خالص است با یک عامل از نظر آماری معنی دار است. اگر مقدار واقعی باشد کمتر از جدول، سپس گنجاندن اضافی در مدل عامل به طور قابل توجهی نسبت تغییرات توضیح داده شده این صفت را افزایش نمی دهد بنابراین، گنجاندن آن در مدل نامناسب است. ضریب رگرسیون برای این عامل در این مورد از نظر آماری ناچیز است.

برای یک معادله دو عاملی، ضرایب
-معیارها به این صورت هستند:

,
. (2.23a)

با کمک یک خصوصی
-تست، شما می توانید اهمیت تمام ضرایب رگرسیون را با این فرض که هر عامل مربوطه آخرین وارد معادله رگرسیون چندگانه شد.

-آزمون دانشجویی برای معادله رگرسیون چندگانه.

خصوصی
معیار، اهمیت ضرایب رگرسیون خالص را ارزیابی می کند. دانستن قدر ، امکان تعیین آن وجود دارد -معیار ضریب رگرسیون در -عامل، ، برای مثال:

. (2.24)

برآورد معناداری ضرایب رگرسیون خالص توسط -معیار دانشجویی بدون محاسبه خصوصی قابل انجام است
-شاخص. در این حالت، مانند رگرسیون زوجی، برای هر عامل از فرمول زیر استفاده می شود:

, (2.25)

جایی که ضریب رگرسیون خالص با عامل است ,میانگین مربعات (استاندارد) خطای ضریب رگرسیون است .

برای معادله رگرسیون چندگانهمیانگین خطای درجه دومضریب رگرسیون را می توان با فرمول زیر تعیین کرد:

, (2.26)

جایی که ,- انحراف استاندارد برای ویژگی ,
ضریب تعیین معادله رگرسیون چندگانه است،
- ضریب تعیین برای وابستگی عامل با همه عوامل دیگر معادله رگرسیون چندگانه؛
تعداد درجات آزادی برای مجموع مجذور انحرافات است.

همانطور که می بینید، برای استفاده از این فرمول، به یک ماتریس همبستگی بین عاملی و محاسبه ضرایب تعیین مربوطه با استفاده از آن نیاز دارید.
. بنابراین، برای معادله
ارزیابی اهمیت ضرایب رگرسیون ,,شامل محاسبه سه ضریب تعیین بین فاکتور است:
,
,
.

رابطه متقابل شاخص های ضریب همبستگی جزئی، خصوصی
-معیارها و -آزمون دانشجو برای ضرایب رگرسیون محض می تواند در روش انتخاب عامل استفاده شود. حذف عوامل در هنگام ساخت معادله رگرسیون با روش حذف عملاً می تواند نه تنها با ضرایب همبستگی جزئی انجام شود، و در هر مرحله عاملی با کوچکترین مقدار ناچیز ضریب همبستگی جزئی را حذف کند، بلکه توسط مقادیر نیز انجام شود. و . خصوصی
معیار به طور گسترده در ساخت مدل با گنجاندن متغیرها و روش رگرسیون گام به گام استفاده می شود.

در این مثال، بیایید در نظر بگیریم که پایایی معادله رگرسیون به دست آمده چگونه برآورد می شود. از همین آزمون برای آزمون این فرضیه استفاده می شود که ضرایب رگرسیون هر دو صفر هستند، a=0، b=0. به عبارت دیگر، ماهیت محاسبات در پاسخ به این سوال است: آیا می توان از آن برای تحلیل و پیش بینی بیشتر استفاده کرد؟

از این آزمون t برای تعیین شباهت یا تفاوت بین واریانس ها در دو نمونه استفاده کنید.


بنابراین، هدف از تجزیه و تحلیل به دست آوردن تخمینی است که با کمک آن می توان ادعا کرد که در سطح معینی از α، معادله رگرسیون حاصل از نظر آماری قابل اعتماد است. برای این از ضریب تعیین R 2 استفاده می شود.
اهمیت مدل رگرسیون با استفاده از آزمون F فیشر بررسی می شود که مقدار محاسبه شده آن به عنوان نسبت واریانس سری اولیه مشاهدات شاخص مورد مطالعه و برآورد بی طرفانه از واریانس دنباله باقیمانده برای یافت می شود. این مدل.
اگر مقدار محاسبه شده با k1 =(m) و k2 =(n-m-1) درجه آزادی بیشتر از مقدار جدولی در سطح معنی‌داری معین باشد، آن‌گاه مدل معنادار در نظر گرفته می‌شود.

که m تعداد فاکتورهای مدل است.
مقطع تحصیلی اهمیت آماریرگرسیون خطی زوجی طبق الگوریتم زیر انجام می شود:
1. یک فرضیه صفر مطرح می شود که معادله به عنوان یک کل از نظر آماری بی اهمیت است: H 0: R 2 = 0 در سطح معنی داری α.
2. سپس، مقدار واقعی معیار F را تعیین کنید:


که در آن m=1 برای رگرسیون زوجی.
3. مقدار جدولی از جداول توزیع فیشر برای سطح معنی‌داری معین تعیین می‌شود، با در نظر گرفتن اینکه تعداد درجات آزادی برای مبلغ کلمربع (واریانس بزرگتر) 1 است و تعداد درجات آزادی مجموع مربعات باقیمانده (واریانس کمتر) در رگرسیون خطی n-2 (یا از طریق) است. تابع اکسل FDISP (احتمال، 1، n-2)).
جدول F حداکثر مقدار ممکن معیار تحت تأثیر عوامل تصادفی برای درجات آزادی معین و سطح اهمیت α است. سطح معناداری α - احتمال رد فرضیه صحیح به شرط اینکه درست باشد. معمولا α برابر با 0.05 یا 0.01 در نظر گرفته می شود.
4. اگر مقدار واقعی معیار F از مقدار جدول کمتر باشد، می گویند دلیلی برای رد فرضیه صفر وجود ندارد.
در غیر این صورت، فرض صفر رد می شود و فرضیه جایگزین در مورد اهمیت آماری کل معادله با احتمال (1-α) پذیرفته می شود.
مقدار جدول معیار با درجه آزادی k 1 = 1 و k 2 = 48، جدول F = 4

یافته ها: از آنجایی که مقدار واقعی جدول F > F، ضریب تعیین از نظر آماری معنادار است ( تخمین یافت شده از معادله رگرسیون از نظر آماری قابل اعتماد است) .

تحلیل واریانس

.

شاخص های کیفی معادله رگرسیون

مثال. بر اساس مجموع 25 شرکت تجاری، رابطه بین علائم مورد مطالعه قرار می گیرد: X - قیمت کالا A، هزار روبل. Y - سود یک شرکت تجاری، میلیون روبل. هنگام ارزیابی مدل رگرسیون، نتایج میانی زیر به دست آمد: ∑(y i -y x) 2 = 46000; ∑(y i -y sr) 2 = 138000. چه شاخص همبستگی را می توان از این داده ها تعیین کرد؟ مقدار این اندیکاتور را بر اساس این نتیجه و با استفاده از آن محاسبه کنید تست F فیشردر مورد کیفیت مدل رگرسیون نتیجه گیری کنید.
تصمیم. بر اساس این داده ها، یک همبستگی تجربی را می توان تعیین کرد: ، که در آن ∑(y cf -y x) 2 = ∑(y i -y cf) 2 - ∑(y i -y x) 2 = 138000 - 46000 = 92000.
η 2 = 92000/138000 = 0.67، η = 0.816 (0.7< η < 0.9 - связь между X и Y высокая).

تست F فیشر: n = 25، m = 1.
R 2 \u003d 1 - 46000 / 138000 \u003d 0.67, F \u003d 0.67 / (1-0.67)x (25 - 1 - 1) \u003d 46. جدول F (1؛ 23) \u003d 4.
از آنجایی که مقدار واقعی F > Ftabl است، برآورد یافت شده از معادله رگرسیون از نظر آماری قابل اعتماد است.

سوال: برای آزمون معناداری مدل رگرسیون از چه آماری استفاده می شود؟
پاسخ: برای معنی دار بودن کل مدل از آماره F (معیار فیشر) استفاده می شود.

معیار فیشربه شما امکان می دهد مقادیر واریانس نمونه دو نمونه مستقل را با هم مقایسه کنید. برای محاسبه F emp باید نسبت واریانس دو نمونه را پیدا کنید، به طوری که واریانس بزرگتر در صورت و کوچکتر در مخرج باشد. فرمول محاسبه معیار فیشر به شرح زیر است:

واریانس نمونه اول و دوم به ترتیب کجاست.

از آنجایی که با توجه به شرط ملاک، مقدار صورت باید بزرگتر یا مساوی مقدار مخرج باشد، مقدار Femp همیشه بزرگتر یا مساوی یک خواهد بود.

تعداد درجات آزادی نیز به سادگی تعریف می شود:

ک 1 =n ل - 1 برای نمونه اول (یعنی برای نمونه ای که واریانس آن بزرگتر است) و ک 2 = n 2 - 1 برای نمونه دوم

در پیوست 1، مقادیر بحرانی معیار فیشر با مقادیر k 1 (خط بالای جدول) و k 2 (ستون چپ جدول) یافت می شود.

اگر t emp >t crit، فرضیه صفر پذیرفته می شود، در غیر این صورت جایگزین پذیرفته می شود.

مثال 3در دو کلاس سوم، ده دانش آموز از نظر رشد ذهنی بر اساس آزمون TURMS مورد آزمایش قرار گرفتند. مقادیر میانگین به دست آمده تفاوت معنی داری نداشتند، با این حال، روانشناس به این سوال علاقه مند است - آیا تفاوت هایی در میزان همگنی شاخص های رشد ذهنی بین کلاس ها وجود دارد.

تصمیم. برای معیار فیشر، مقایسه واریانس نمرات آزمون در هر دو کلاس ضروری است. نتایج آزمون در جدول ارائه شده است:

جدول 3

تعداد دانش آموزان

کلاس اول

درجه دوم

پس از محاسبه واریانس برای متغیرهای X و Y، به دست می آوریم:

س ایکس 2 =572.83; س y 2 =174,04

سپس با توجه به فرمول (8) برای محاسبه بر اساس معیار F Fisher، در می یابیم:

طبق جدول ضمیمه 1 برای معیار F با درجه آزادی در هر دو مورد برابر با k=10 - 1 = 9 F crit = 3.18 (<3.29), следовательно, в терминах статистических гипотез можно утвер­ждать, что Н 0 (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н 1 . Иcследователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

6.2 آزمون های ناپارامتریک

محقق با مقایسه چشمی (بر حسب درصد) نتایج قبل و بعد از هر گونه مواجهه به این نتیجه می رسد که در صورت مشاهده تفاوت، در نمونه های مقایسه شده تفاوت وجود دارد. چنین رویکردی کاملاً غیرقابل قبول است، زیرا تعیین سطح اطمینان در تفاوت ها برای درصد غیرممکن است. درصدهای گرفته شده به خودی خود امکان نتیجه گیری آماری قابل اعتماد را فراهم نمی کند. برای اثبات اثربخشی هر گونه تأثیر، لازم است یک روند آماری معنی دار در تغییر (تغییر) شاخص ها شناسایی شود. برای حل چنین مسائلی محقق می تواند از تعدادی معیار تفاوت استفاده کند. در زیر، آزمون های ناپارامتریک در نظر گرفته می شود: آزمون علامت و آزمون کای دو.

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...