معیار T دانشجویی محاسبه خودکار. توزیع آزمون تی دانشجویی برای آزمون فرضیه میانگین و محاسبه فاصله اطمینان در MS Excel

جدول توزیع دانش آموزان

جداول انتگرال احتمال برای نمونه های بزرگ از بی نهایت بزرگ استفاده می شود جمعیت. اما در حال حاضر در (n)< 100 получается Несоответствие между

داده های جدولی و حد احتمال؛ در (n)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

جمعیت عمومی مهم نیست، زیرا توزیع انحرافات شاخص نمونه از ویژگی عمومی با یک نمونه بزرگ همیشه طبیعی است.

نام در نمونه های کوچک (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

جمعیتی که دارد توزیع نرمال. تئوری نمونه های کوچک توسط آماردان انگلیسی W. Gosset (که با نام مستعار Student می نوشت) در آغاز قرن بیستم ایجاد شد. که در

در سال 1908، او توزیع ویژه ای ساخت که حتی با نمونه های کوچک، امکان همبستگی (t) و احتمال اطمینان F(t) را فراهم می کرد. برای (n)> 100، جداول توزیع دانش آموز نتایج مشابهی با جداول انتگرال احتمال لاپلاس برای 30 به دست می دهند.< (n ) <

100 تفاوت ناچیز است. بنابراین نمونه های عملا کوچک شامل نمونه هایی با حجم کمتر از 30 واحد می شود (البته نمونه با حجم بیش از 100 واحد بزرگ در نظر گرفته می شود).

استفاده از نمونه های کوچک در برخی موارد به دلیل ماهیت جمعیت مورد بررسی است. بنابراین، در کار پرورش، تجربه "خالص" با تعداد کمی آسان تر است

توطئه ها آزمایش تولید و اقتصادی مربوط به هزینه های اقتصادی نیز بر روی تعداد کمی آزمایش انجام می شود. همانطور که قبلاً ذکر شد، در مورد یک نمونه کوچک، هم احتمالات اطمینان و هم محدودیت های اطمینان میانگین کلی را می توان فقط برای یک جمعیت معمولی محاسبه کرد.

چگالی احتمال توزیع Student توسط تابع توصیف می شود.

1 + t2

f (t ,n) := Bn

n - 1

t - متغیر فعلی؛ n - اندازه نمونه.

B کمیتی است که فقط به (n) بستگی دارد.

توزیع Student فقط یک پارامتر دارد: (d.f.) - تعداد درجات آزادی (گاهی اوقات با (k) نشان داده می شود). این توزیع، مانند توزیع عادی، متقارن با نقطه (t) = 0 است، اما مسطح تر است. با افزایش حجم نمونه، و در نتیجه، تعداد درجات آزادی، توزیع دانشجو به سرعت به نرمال نزدیک می شود. تعداد درجات آزادی برابر با تعداد آن دسته از مقادیر ویژگی های فردی است که باید توزیع شوند

فرض کنید مشخصه مورد نظر را تعیین کنید. بنابراین، برای محاسبه واریانس، مقدار متوسط ​​باید شناخته شود. بنابراین، هنگام محاسبه واریانس، از (d.f.) = n - 1 استفاده کنید.

جداول توزیع دانش آموزان در دو نسخه منتشر شده است:

1. مشابه جداول انتگرال احتمال، مقادیر ( t) و مربوطه

احتمالات فعلی F(t) برای اعداد مختلف درجات آزادی.

2. مقادیر (t) برای رایج ترین احتمالات اطمینان داده شده است

0.70; 0.75; 0.80; 0.85; 0.90; 0.95 و 0.99 یا برای 1 - 0.70 = 0.3. 1 - 0.80 = 0.2; …… 1 - 0.99 = 0.01.

3. در تعداد درجات آزادی متفاوت این نوع جدول در پیوست آورده شده است

(جدول 1 - 20)، و همچنین مقدار (t) - آزمون دانش آموز در سطح معنی داری 0.7

آزمون فرضیه های آماری به ما این امکان را می دهد که بر اساس داده های نمونه استنباط قوی در مورد ویژگی های یک جامعه داشته باشیم. فرضیه های مختلفی وجود دارد. یکی از آنها فرضیه میانگین ( انتظارات ریاضی). ماهیت آن این است که فقط بر اساس نمونه موجود، یک نتیجه‌گیری درست در مورد جایی که میانگین عمومی ممکن است قرار داشته باشد یا نباشد (ما هرگز حقیقت دقیق را نمی‌دانیم، اما می‌توانیم جستجو را محدود کنیم) است.

رویکرد کلی برای آزمون فرضیه ها شرح داده شده است، بنابراین بیایید مستقیماً به اصل مطلب برویم. ابتدا فرض می کنیم که نمونه از یک جامعه عادی از متغیرهای تصادفی گرفته شده است ایکسبا میانگین عمومی μ و واریانس σ 2(می دانم، می دانم که این اتفاق نمی افتد، اما حرف من را قطع نکنید!). میانگین حسابی این نمونه بدیهی است که خود یک متغیر تصادفی است. اگر تعداد زیادی از این نمونه ها را استخراج کنید و میانگین آنها را محاسبه کنید، آنگاه یک انتظار ریاضی نیز خواهند داشت μ و

سپس مقدار تصادفی

این سوال مطرح می شود: آیا میانگین عمومی با احتمال 95 درصد در محدوده 1.96 ± خواهد بود؟ s x̅. به عبارت دیگر، توزیع متغیرهای تصادفی هستند

معادل.

این سوال برای اولین بار توسط یک شیمیدان که در کارخانه آبجو گینس در دوبلین (ایرلند) کار می کرد مطرح شد (و حل شد). نام این شیمیدان ویلیام سیلی گوست بود و نمونه هایی از آبجو را برای تجزیه و تحلیل شیمیایی گرفت. ظاهراً در مقطعی، ویلیام شروع به شکنجه مبهم در مورد توزیع میانگین ها کرد. معلوم شد که کمی بیشتر از یک توزیع معمولی لکه دار شده است.

شیمیدان دوبلینی ویلیام گوست پس از جمع آوری مبنای ریاضی و محاسبه مقادیر تابع توزیعی که کشف کرد، یادداشتی نوشت که در شماره مارس 1908 مجله Biometrics (سردبیر - کارل پیرسون) منتشر شد. زیرا گینس افشای اسرار دم کردن را به شدت ممنوع کرد؛ گوست با نام مستعار دانشجو امضا کرد.

علیرغم این واقعیت که K. Pearson قبلاً توزیع را اختراع کرده بود، ایده کلی عادی بودن همچنان غالب بود. هیچ کس فکر نمی کرد که توزیع نمرات نمونه ممکن است عادی نباشد. بنابراین، مقاله W. Gosset عملا مورد توجه قرار نگرفت و فراموش شد. و فقط رونالد فیشر از کشف گوست قدردانی کرد. فیشر از توزیع جدید در کار خود استفاده کرد و نام آن را گذاشت توزیع تی دانشجویی. بر این اساس، معیار آزمون فرضیه ها تبدیل شد آزمون تی دانشجویی. اینگونه بود که یک "انقلاب" در آمار رخ داد که به عصر تجزیه و تحلیل داده های نمونه قدم گذاشت. این یک سفر کوتاه به تاریخ بود.

بیایید ببینیم W. Gosset چه چیزی می تواند ببیند. بیایید 20 هزار نمونه طبیعی از 6 مشاهده با میانگین ( ایکس) 50 و انحراف معیار ( σ ) 10. سپس به معنی استفاده از نمونه نرمال می کنیم واریانس عمومی:

ما 20 هزار میانگین حاصل را در فواصل 0.1 گروه بندی می کنیم و فرکانس ها را محاسبه می کنیم. اجازه دهید توزیع فرکانس واقعی (Norm) و نظری (ENorm) میانگین نمونه را روی نمودار نشان دهیم.

نقاط (فرکانس های مشاهده شده) عملاً با خط (فرکانس های نظری) منطبق هستند. این قابل درک است، زیرا داده ها از همان جمعیت عمومی گرفته شده اند و تفاوت ها فقط خطاهای نمونه گیری است.

بیایید یک آزمایش جدید انجام دهیم. با استفاده از میانگین ها را عادی می کنیم واریانس نمونه.

بیایید دوباره فرکانس ها را بشماریم و آنها را به شکل نقاط روی نمودار رسم کنیم و یک خط توزیع نرمال استاندارد برای مقایسه باقی بگذاریم. بیایید بسامد تجربی میانگین ها را مثلاً با حرف نشان دهیم تی.

مشاهده می شود که توزیع ها این بار چندان منطبق نیستند. ببند، بله، اما یکسان نیست. دم ها "سنگین تر" شده اند.

Gosset-Student آخرین نسخه MS Excel را نداشت، اما این دقیقاً همان تأثیری است که او متوجه شد. چرا این اتفاق می افتد؟ توضیح این است که متغیر تصادفی

نه تنها به خطای نمونه گیری (عد کننده)، بلکه به خطای استاندارد میانگین (مخرج)، که یک متغیر تصادفی نیز می باشد، بستگی دارد.

بیایید کمی به این موضوع نگاه کنیم که چنین متغیر تصادفی چه توزیعی باید داشته باشد. اول، شما باید چیزی را از آمار ریاضی به خاطر بسپارید (یا یاد بگیرید). قضیه فیشر وجود دارد که بیان می کند در نمونه ای از توزیع نرمال:

1. متوسط ایکسو واریانس نمونه s 2مقادیر مستقل هستند.

2. نسبت نمونه و واریانس جامعه، ضرب در تعداد درجات آزادی، دارای توزیع است. χ 2(خی دو) با همان تعداد درجات آزادی، یعنی.

جایی که ک- تعداد درجات آزادی (به انگلیسی درجه آزادی (d.f.))

بسیاری از نتایج دیگر در آمار مدل های عادی بر اساس این قانون است.

بیایید به توزیع میانگین برگردیم. صورت و مخرج عبارت را تقسیم کنید

بر σ X̅. ما گرفتیم

شماره‌گذار یک متغیر تصادفی معمولی استاندارد است (ما نشان می‌دهیم ξ (xi)). اجازه دهید مخرج را از قضیه فیشر بیان کنیم.

سپس عبارت اصلی شکل خواهد گرفت

این همان چیزی است که در شکل کلی است (رابطه دانشجویی). شما می توانید تابع توزیع آن را مستقیماً استخراج کنید، زیرا توزیع هر دو متغیر تصادفی در این عبارت مشخص است. این لذت را به ریاضیدانان بسپاریم.

تابع توزیع t Student فرمولی دارد که درک آن بسیار دشوار است، بنابراین هیچ فایده ای برای تجزیه و تحلیل آن وجود ندارد. به هر حال کسی از آن استفاده نمی کند، زیرا ... احتمالات در جداول ویژه توزیع دانشجویی (که گاهی جداول ضرایب دانشجو نامیده می شود) آورده شده است، یا در فرمول های PC گنجانده شده است.

بنابراین، با داشتن این دانش جدید، می توانید تعریف رسمی توزیع Student را درک کنید.
یک متغیر تصادفی موضوع توزیع دانشجو با کدرجه آزادی نسبت متغیرهای تصادفی مستقل است

جایی که ξ طبق قانون معمولی استاندارد توزیع شده و χ 2 kاز توزیع تبعیت می کند χ 2ج کدرجه آزادی.

بنابراین، فرمول آزمون t Student برای میانگین حسابی

یک مورد خاص از رابطه دانشجویی وجود دارد

از فرمول و تعریف به دست می آید که توزیع آزمون t Student فقط به تعداد درجات آزادی بستگی دارد.

در ک> 30 t-test عملاً با توزیع نرمال استاندارد تفاوتی ندارد.

بر خلاف مجذور کای، آزمون t می تواند یک دم یا دو دنباله باشد. معمولاً از دو طرف استفاده می کنند، با این فرض که انحراف می تواند در هر دو جهت از میانگین رخ دهد. اما اگر شرط مشکل فقط در یک جهت اجازه انحراف را بدهد، منطقی است که از یک معیار یک طرفه استفاده کنیم. این قدرت را کمی افزایش می دهد، زیرا ... در سطح معناداری ثابت، مقدار بحرانی اندکی به صفر نزدیک می شود.

شرایط استفاده از آزمون t Student

علیرغم این واقعیت که کشف Student در یک زمان آمار را متحول کرد، آزمون t هنوز در امکانات کاربردی آن بسیار محدود است، زیرا خود از فرض توزیع نرمال داده های اصلی ناشی می شود. اگر داده ها نرمال نباشند (که معمولاً اینطور است)، آزمون t دیگر توزیع Student نخواهد داشت. با این حال، با توجه به عمل قضیه حد مرکزی، میانگین حتی برای داده‌های غیرعادی به سرعت یک توزیع زنگ‌شکل پیدا می‌کند.

به عنوان مثال، داده هایی را در نظر بگیرید که به وضوح به سمت راست متمایل هستند، مانند توزیع کای دو با 5 درجه آزادی.

حالا بیایید 20 هزار نمونه ایجاد کنیم و مشاهده کنیم که چگونه توزیع میانگین ها بسته به حجم آنها تغییر می کند.

تفاوت در نمونه های کوچک تا 15-20 مشاهده کاملاً قابل توجه است. اما سپس به سرعت ناپدید می شود. بنابراین، غیر عادی بودن توزیع، البته خوب نیست، اما بحرانی نیست.

بیشتر از همه، آزمون t از موارد پرت «ترس» است، یعنی. انحرافات غیر طبیعی بیایید 20 هزار نمونه طبیعی از هر 15 مشاهده را برداریم و به برخی از آنها یک عدد پرت تصادفی اضافه کنیم.

تصویر تیره و تار به نظر می رسد. فرکانس های واقعی میانگین ها با فرکانس های نظری بسیار متفاوت است. استفاده از توزیع t در چنین شرایطی به یک کار بسیار پرخطر تبدیل می شود.

بنابراین، در نمونه‌های نه چندان کوچک (از 15 مشاهده)، آزمون t در برابر توزیع غیرعادی داده‌های اصلی نسبتاً مقاوم است. اما نقاط پرت در داده ها توزیع آزمون t را به شدت مخدوش می کند، که به نوبه خود می تواند منجر به خطا در استنتاج آماری شود، بنابراین مشاهدات غیرعادی باید حذف شوند. اغلب، تمام مقادیری که در انحراف استاندارد 2± از میانگین قرار می گیرند از نمونه حذف می شوند.

نمونه ای از آزمون فرضیه ای در مورد انتظارات ریاضی با استفاده از آزمون t Student در MS Excel

اکسل چندین توابع مرتبط با توزیع t دارد. بیایید به آنها نگاه کنیم.

STUDENT.DIST - توزیع تی دانشجویی سمت چپ "کلاسیک". ورودی مقدار معیار t، تعداد درجات آزادی و یک گزینه (0 یا 1) است که تعیین می کند چه چیزی باید محاسبه شود: چگالی یا مقدار تابع. در خروجی به ترتیب چگالی یا احتمال اینکه متغیر تصادفی کمتر از معیار t مشخص شده در آرگومان باشد را بدست می آوریم.

STUDENT.DIST.2X – توزیع دو طرفه. آرگومان قدر مطلق (مدول) آزمون t و تعداد درجات آزادی است. در نتیجه، احتمال به دست آوردن مقدار معیار t یکسان یا حتی بیشتر، یعنی. سطح اهمیت واقعی (سطح p).

STUDENT.DIST.PH - توزیع t سمت راست. بنابراین، 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PH(2;5) = 0.05097. اگر آزمون t مثبت باشد، احتمال به دست آمده در سطح p است.

STUDENT.INR - برای محاسبه معکوس سمت چپ توزیع t استفاده می شود. بحث احتمال و تعداد درجات آزادی است. در خروجی مقدار معیار t مربوط به این احتمال را بدست می آوریم. شمارش احتمال در سمت چپ است. بنابراین، دم چپ به خود سطح اهمیت نیاز دارد α ، و برای مناسب 1 - α .

STUDENT.OBR.2X - مقدار معکوس برای توزیع دانشجویی دو طرفه، یعنی. مقدار آزمون t (مدول). سطح معنی داری نیز به ورودی ارائه می شود α . فقط این بار شمارش از هر دو طرف به طور همزمان انجام می شود، بنابراین احتمال به دو دم تقسیم می شود. بنابراین، STUDENT.ARV(1-0.025;5) = STUDENT.ARV.2X(0.05;5) = 2.57058

STUDENT.TEST تابعی برای آزمون فرضیه برابری انتظارات ریاضی در دو نمونه است. جایگزین دسته ای از محاسبات می شود، زیرا کافی است فقط دو محدوده با داده و چند پارامتر دیگر را مشخص کنید. خروجی در سطح p است.

CONFIDENCE.STUDENT - محاسبه فاصله اطمینان میانگین با در نظر گرفتن توزیع t.

بیایید این مثال آموزشی را در نظر بگیریم. در این شرکت، سیمان در کیسه های 50 کیلوگرمی بسته بندی می شود. به دلیل تصادفی بودن، مقداری انحراف از جرم مورد انتظار در یک کیسه مجاز است، اما میانگین کلی باید 50 کیلوگرم باقی بماند. بخش کنترل کیفیت به طور تصادفی 9 کیسه را وزن کرد و نتایج زیر را به دست آورد: وزن متوسط ​​( ایکس) 50.3 کیلوگرم بود، انحراف معیار ( س) – 0.5 کیلوگرم.

آیا این نتیجه با فرضیه صفر که میانگین کلی 50 کیلوگرم است مطابقت دارد؟ به عبارت دیگر، اگر تجهیزات به درستی کار کنند و به طور متوسط ​​50 کیلوگرم پرکننده تولید کنند، می توان به طور تصادفی به چنین نتیجه ای رسید؟ اگر فرضیه رد نشود، تفاوت حاصل در محدوده نوسانات تصادفی قرار می گیرد، اما اگر این فرضیه رد شود، به احتمال زیاد در تنظیمات دستگاهی که کیسه ها را پر می کند، نقصی وجود داشته است. باید بررسی و پیکربندی شود.

یک شرط کوتاه در نماد پذیرفته شده عمومی به این شکل است.

H0: μ = 50 کیلوگرم

H1: μ ≠ 50 کیلوگرم

دلیلی وجود دارد که فرض کنیم توزیع کیسه های پر از توزیع نرمال پیروی می کند (یا تفاوت زیادی با آن ندارد). به این معنی که برای آزمون فرضیه انتظارات ریاضی می توانید از آزمون t-student استفاده کنید. انحرافات تصادفیمی تواند در هر جهت رخ دهد، به این معنی که یک آزمون t دو دنباله مورد نیاز است.

ابتدا از ابزارهای ضد غرق استفاده خواهیم کرد: محاسبه دستی معیار t و مقایسه آن با مقدار جدول بحرانی. آزمون t محاسبه شده:

حال بیایید تعیین کنیم که آیا عدد حاصل از سطح بحرانی در سطح معنی‌داری فراتر می‌رود یا خیر α = 0.05. بیایید از جدول توزیع t Student (موجود در هر کتاب درسی آمار) استفاده کنیم.

ستون ها احتمال سمت راست توزیع را نشان می دهند و ردیف ها تعداد درجات آزادی را نشان می دهند. ما به یک آزمون t دو دنباله با سطح معنی داری 0.05 علاقه مندیم که معادل مقدار t برای نیمی از سطح معنی داری در سمت راست است: 1 - 0.05/2 = 0.975. تعداد درجات آزادی حجم نمونه منهای 1 است، یعنی. 9 - 1 = 8. در تقاطع ما مقدار جدول آزمون t را پیدا می کنیم - 2.306. اگر از توزیع نرمال استاندارد استفاده کنیم، پس نقطه بحرانیمقدار 1.96 خواهد بود، اما در اینجا بیشتر است، زیرا توزیع t در نمونه های کوچک ظاهر مسطح تری دارد.

بیایید مقدار واقعی (1.8) و جدول (2.306) را با هم مقایسه کنیم. معیار محاسبه شده کمتر از معیار جدول بندی شده بود. در نتیجه، داده های موجود با فرضیه H 0 که میانگین کلی 50 کیلوگرم است، تناقض ندارد (اما آن را نیز ثابت نمی کند). این تمام چیزی است که می توانیم با استفاده از جداول یاد بگیریم. البته می توانید سعی کنید سطح p را نیز پیدا کنید، اما تقریبی خواهد بود. و به عنوان یک قاعده، این سطح p است که برای آزمون فرضیه ها استفاده می شود. بنابراین، در مرحله بعدی به اکسل می رویم.

هیچ تابع آماده ای برای محاسبه t-test در اکسل وجود ندارد. اما این ترسناک نیست، زیرا فرمول آزمون t Student بسیار ساده است و به راحتی می توان آن را درست در یک سلول اکسل ساخت.

ما همان 1.8 را گرفتیم. اجازه دهید ابتدا مقدار بحرانی را پیدا کنیم. آلفا 0.05 را می گیریم، معیار دو طرفه است. ما به تابع توزیع t معکوس برای فرضیه دو طرفه STUDENT.OBR.2X نیاز داریم.

مقدار به دست آمده منطقه بحرانی را قطع می کند. آزمون t مشاهده شده در آن قرار نمی گیرد، بنابراین فرضیه رد نمی شود.

با این حال، این همان روش آزمایش یک فرضیه با استفاده از مقدار جدول است. محاسبه سطح p آموزنده تر خواهد بود، یعنی. احتمال به دست آوردن انحراف مشاهده شده یا حتی بیشتر از میانگین 50 کیلوگرم، در صورتی که این فرضیه صحیح باشد. برای فرضیه دو طرفه STUDENT.DIST.2X به تابع توزیع دانشجو نیاز دارید.

سطح P 0.1096 است که بیشتر از سطح معنی داری قابل قبول 0.05 است - ما این فرضیه را رد نمی کنیم. اما اکنون می توانیم در مورد درجه اثبات قضاوت کنیم. سطح P کاملاً نزدیک به سطحی است که فرضیه رد می شود و این منجر به افکار متفاوت می شود. به عنوان مثال، اینکه نمونه برای تشخیص انحراف قابل توجه بسیار کوچک بود.

پس از مدتی، بخش کنترل مجدداً تصمیم گرفت تا نحوه حفظ استاندارد پر کردن کیسه را بررسی کند. این بار برای اطمینان بیشتر، نه 9، بلکه 25 کیسه انتخاب شد. به طور شهودی واضح است که گسترش میانگین کاهش می یابد، و بنابراین، شانس یافتن خرابی در سیستم بیشتر می شود.

فرض کنید همان مقادیر میانگین و انحراف معیار برای نمونه بار اول به دست آمد (به ترتیب 50.3 و 0.5). بیایید آزمون t را محاسبه کنیم.


مقدار بحرانی برای 24 درجه آزادی و α = 0.05 2.064 است. تصویر زیر نشان می دهد که آزمون t در محدوده رد فرضیه قرار می گیرد.

می توان نتیجه گرفت که با احتمال اطمینان بیش از 95٪، میانگین کلی با 50 کیلوگرم متفاوت است. برای متقاعد کردن بیشتر، اجازه دهید به سطح p (آخرین خط جدول) نگاه کنیم. احتمال به دست آوردن میانگین با انحراف یکسان یا حتی بیشتر از 50، در صورت صحت فرضیه، 0.0062 یا 0.62 درصد است که با یک اندازه گیری عملاً غیرممکن است. به طور کلی، ما این فرضیه را بعید رد می کنیم.

محاسبه فاصله اطمینان با استفاده از توزیع t دانش آموز

یکی دیگر از رابطه نزدیک با آزمون فرضیه ها است روش آماریمحاسبه فواصل اطمینان. اگر بازه حاصل حاوی مقداری مطابق با فرضیه صفر باشد، این معادل با این واقعیت است که فرضیه صفر رد نمی شود. در غیر این صورت فرضیه با سطح اطمینان مربوطه رد می شود. در برخی موارد، تحلیلگران اصلاً فرضیه ها را آزمایش نمی کنند. ظاهر کلاسیک، و فقط فواصل اطمینان محاسبه می شود. این روش به شما امکان می دهد اطلاعات مفیدتری را استخراج کنید.

بیایید فواصل اطمینان را برای میانگین 9 و 25 مشاهده محاسبه کنیم. برای این استفاده خواهیم کرد تابع اکسلمعتمد.دانشجو. در اینجا، به اندازه کافی عجیب، همه چیز بسیار ساده است. آرگومان های تابع فقط باید سطح اهمیت را نشان دهند α , انحراف معیاربر اساس نمونه و حجم نمونه در خروجی، نصف عرض فاصله اطمینان را می گیریم، یعنی مقداری که باید در هر دو طرف میانگین قرار گیرد. پس از انجام محاسبات و ترسیم نمودار بصری، موارد زیر را دریافت می کنیم.

همانطور که می بینید، با یک نمونه از 9 مشاهده، مقدار 50 در آن قرار می گیرد فاصله اطمینان(فرضیه رد نمی شود)، اما پس از 25 مشاهده ضربه نمی زند (فرضیه رد می شود). علاوه بر این، در آزمایشی با 25 کیسه، می توان بیان کرد که با احتمال 97.5 درصد میانگین کلی از 50.1 کیلوگرم فراتر می رود (حد پایین فاصله اطمینان 50.094 کیلوگرم است). و این اطلاعات بسیار ارزشمندی است.

بنابراین، ما همان مشکل را به سه روش حل کردیم:

1. با استفاده از رویکرد قدیمی، مقایسه مقادیر محاسبه شده و جدول بندی شده آزمون t
2. مدرن تر، با محاسبه سطح p، افزودن درجه ای از اطمینان هنگام رد فرضیه.
3. با محاسبه فاصله اطمینان و به دست آوردن حداقل مقدار میانگین عمومی، حتی اطلاعات بیشتر.

مهم است که به یاد داشته باشید که آزمون t به آن اشاره دارد روش های پارامتریک، زیرا بر اساس یک توزیع نرمال است (دارای دو پارامتر است: میانگین و واریانس). بنابراین، برای کاربرد موفقیت آمیز آن، حداقل نرمال بودن تقریبی داده های اولیه و عدم وجود نقاط پرت مهم است.

در نهایت، پیشنهاد می کنم ویدیویی را در مورد نحوه انجام محاسبات مربوط به آزمون t-test دانشجویی در اکسل تماشا کنید.

در سراسر مثال، از اطلاعات ساختگی استفاده خواهیم کرد تا خواننده بتواند به تنهایی تغییرات لازم را انجام دهد.

بنابراین، فرض کنید در جریان تحقیق، تأثیر داروی A را بر محتوای ماده B (به میلی مول در گرم) در بافت C و غلظت ماده D در خون (به میلی مول در لیتر) در بیماران بررسی کردیم. با توجه به معیار E به 3 گروه با حجم مساوی (10 = n) تقسیم می شود. نتایج چنین مطالعه ساختگی در جدول نشان داده شده است:

محتوای ماده B، mmol/g

ماده D، mmol/l

افزایش غلظت


مایلیم به شما هشدار دهیم که برای سهولت ارائه داده ها و محاسبات، نمونه هایی با اندازه 10 را در نظر می گیریم؛ در عمل، چنین حجم نمونه ای معمولا برای نتیجه گیری آماری کافی نیست.

به عنوان مثال، داده های ستون 1 جدول را در نظر بگیرید.

آمار توصیفی

میانگین نمونه

میانگین حسابی که اغلب به سادگی "میانگین" نامیده می شود، با جمع کردن همه مقادیر و تقسیم آن مجموع بر تعداد مقادیر موجود در مجموعه به دست می آید. این را می توان با استفاده از فرمول جبری نشان داد. مجموعه ای از n مشاهدات متغیر x را می توان به صورت x 1 , x 2 , x 3 , ..., x n نمایش داد.

فرمول تعیین میانگین حسابی مشاهدات (تلفظ "X با یک خط"):

= (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

واریانس نمونه

یکی از راه‌های اندازه‌گیری پراکندگی داده‌ها، تعیین میزان انحراف هر مشاهده از میانگین حسابی است. بدیهی است که هر چه انحراف بیشتر باشد، تغییرپذیری، تغییرپذیری مشاهدات بیشتر است. با این حال، ما نمی توانیم از میانگین این انحرافات استفاده کنیم به عنوان معیاری برای پراکندگی، زیرا انحرافات مثبت انحرافات منفی را جبران می کنند (مجموع آنها صفر است). برای حل این مشکل، هر انحراف را مربع می کنیم و میانگین مجذور انحراف ها را پیدا می کنیم. این کمیت تغییر یا پراکندگی نامیده می شود. بیایید n مشاهده کنیم x 1، x 2، x 3، ...، x n، متوسط که برابر است با. محاسبه واریانس این، معمولا به عنوانs2،این مشاهدات:

واریانس نمونه این شاخص s 2 = 3.2 است.

انحراف معیار

انحراف استاندارد (میانگین مربع) مثبت است ریشه دوماز پراکندگی با استفاده از n مشاهدات به عنوان مثال، به نظر می رسد:

ما می توانیم انحراف معیار را نوعی انحراف متوسط ​​مشاهدات از میانگین در نظر بگیریم. در همان واحدها (ابعاد) داده های اصلی محاسبه می شود.

s = sqrt (s 2) = sqrt (3،2) = 1.79.

ضریب تغییرات

اگر انحراف معیار را بر میانگین حسابی تقسیم کنید و نتیجه را به صورت درصد بیان کنید، ضریب تغییرات به دست می آید.

CV = (1.79 / 13.1) * 100٪ = 13.7

میانگین خطای نمونه

1.79/sqrt(10) = 0.57;

ضریب t دانش آموز (تست تک نمونه ای)

برای آزمایش این فرضیه استفاده می شود که مقدار میانگین با مقدار معینی متفاوت است ارزش شناخته شدهمتر

تعداد درجات آزادی به صورت f=n-1 محاسبه می شود.

در این حالت، فاصله اطمینان برای میانگین بین مرزهای 11.87 و 14.39 است.

برای سطح احتمال اطمینان 95% m=11.87 یا m=14.39، یعنی= |13.1-11.82| = |13.1-14.38| = 1.28

بر این اساس، در این مورد، برای تعداد درجات آزادی f = 10 - 1 = 9 و سطح اطمینان 95٪ t = 2.26.

آمار و جداول پایه دیالوگ

در ماژول آمار و جداول پایهبیایید انتخاب کنیم آمار توصیفی.

یک کادر محاوره ای باز می شود آمار توصیفی.

در زمینه متغیرهابیایید انتخاب کنیم گروه 1.

فشار دادن خوب، جداول نتایج را با آمار توصیفی متغیرهای انتخاب شده بدست می آوریم.

یک کادر محاوره ای باز می شود آزمون t تک نمونه ای.

فرض کنید می دانیم که میانگین محتوای ماده B در بافت C 11 است.

جدول نتایج به همراه آمار توصیفی و آزمون تی دانشجویی به شرح زیر است:

ما مجبور شدیم این فرضیه را رد کنیم که میانگین محتوای ماده B در بافت C 11 است.

از آنجایی که مقدار محاسبه شده معیار بزرگتر از مقدار جدول (26/2) است، فرضیه صفر در سطح معناداری انتخاب شده رد می شود و تفاوت بین نمونه و مقدار شناخته شده از نظر آماری معنی دار در نظر گرفته می شود. بنابراین، نتیجه گیری در مورد وجود تفاوت های ایجاد شده با استفاده از آزمون Student با استفاده از این روش تأیید می شود.

آزمون t دانشجویی یک نام کلی برای دسته ای از روش ها است تست آماریفرضیه ها (آزمون های آماری) بر اساس توزیع دانشجو. رایج ترین کاربردهای آزمون t شامل تست برابری میانگین ها در دو نمونه است.

1. تاریخچه توسعه آزمون t

این معیار تدوین شد ویلیام گوستبرای ارزیابی کیفیت آبجو در شرکت گینس. با توجه به تعهدات شرکت در خصوص عدم افشای اسرار تجاری، مقاله Gosset در سال 1908 در مجله Biometrics با نام مستعار "Student" منتشر شد.

2. آزمون t Student برای چه مواردی استفاده می شود؟

برای تعیین از آزمون تی دانشجویی استفاده می شود اهمیت آماریتفاوت در مقادیر متوسط می توان از هر دو در موارد مقایسه نمونه های مستقل استفاده کرد ( به عنوان مثال، گروهی از بیماران دیابت قندیو گروه های سالم، و هنگام مقایسه جمعیت های مرتبط ( برای مثال میانگین ضربان قلب در همان بیماران قبل و بعد از مصرف داروی ضد آریتمی).

3. در چه مواردی می توان از آزمون t Student استفاده کرد؟

برای اعمال آزمون تی دانشجویی لازم است که داده های اصلی داشته باشند توزیع نرمال. در مورد اعمال معیار دو نمونه ای برای نمونه های مستقل نیز رعایت شرط لازم است. برابری (همسان سازی) واریانس ها.

اگر این شرایط برآورده نشد، باید از روش های مشابه در هنگام مقایسه میانگین های نمونه استفاده کرد. آمار ناپارامتریککه از جمله معروف ترین آنها هستند تست U Mann-Whitney(به عنوان یک آزمون دو نمونه ای برای نمونه های مستقل)، و معیار علامتو تست ویلکاکسون(در موارد نمونه های وابسته استفاده می شود).

4. چگونه آزمون t Student را محاسبه کنیم؟

برای مقایسه مقادیر میانگین، آزمون t Student با استفاده از فرمول زیر محاسبه می شود:

جایی که M 1- میانگین حسابی اولین جمعیت مقایسه شده (گروه)، M 2- میانگین حسابی دومین جمعیت مقایسه شده (گروه)، متر 1 - خطای متوسطمیانگین حسابی اول، متر 2- میانگین خطای میانگین حسابی دوم.

5. چگونه مقدار آزمون t Student را تفسیر کنیم؟

مقدار آزمون t Student حاصل باید به درستی تفسیر شود. برای این کار باید تعداد آزمودنی های هر گروه (n 1 و n 2) را بدانیم. پیدا کردن تعداد درجات آزادی fطبق فرمول زیر:

f = (n 1 + n 2) - 2

پس از این، مقدار بحرانی آزمون t Student را برای سطح معنی‌داری مورد نیاز (به عنوان مثال p = 0.05) و برای تعداد معینی از درجات آزادی تعیین می‌کنیم. fطبق جدول ( زیر را ببینید).

ما مقادیر بحرانی و محاسبه شده معیار را با هم مقایسه می کنیم:

  • اگر مقدار محاسبه شده آزمون t Student برابر یا بیشتربحرانی، که از جدول پیدا شده است، نتیجه می گیریم که تفاوت بین مقادیر مقایسه شده از نظر آماری معنی دار است.
  • اگر مقدار آزمون t Student محاسبه شده باشد کمترجدولی، به این معنی که تفاوت بین مقادیر مقایسه شده از نظر آماری معنی دار نیست.

6. نمونه ای از محاسبه آزمون t Student

برای بررسی اثربخشی فرآورده آهن جدید، دو گروه از بیماران مبتلا به کم خونی انتخاب شدند. در گروه اول، بیماران به مدت دو هفته دریافت کردند داروی جدیدو در گروه دوم دارونما دریافت کردند. سپس سطح هموگلوبین خون محیطی اندازه گیری شد. در گروه اول، میانگین سطح هموگلوبین 1.2±115.4 گرم در لیتر و در گروه دوم - 2.3±103.7 گرم در لیتر بود (داده ها در قالب ارائه شده است. M±m، جمعیت های مورد مقایسه دارای توزیع نرمال هستند. تعداد گروه اول 34 نفر و گروه دوم 40 نفر بود. نتیجه گیری در مورد اهمیت آماری تفاوت های به دست آمده و اثربخشی آماده سازی آهن جدید ضروری است.

راه حل:برای ارزیابی معنی‌داری تفاوت‌ها، از آزمون t Student استفاده می‌کنیم که به عنوان تفاوت در مقادیر میانگین تقسیم بر مجموع مجذور خطاها محاسبه می‌شود:

پس از انجام محاسبات، مقدار آزمون t برابر 4.51 شد. ما تعداد درجات آزادی را به صورت (34 + 40) - 2 = 72 می یابیم. ما مقدار آزمون t استودنت 4.51 حاصل را با مقدار بحرانی 0.05 = p که در جدول نشان داده شده است مقایسه می کنیم: 1.993. از آنجایی که مقدار محاسبه شده معیار بزرگتر از مقدار بحرانی است، نتیجه می گیریم که تفاوت های مشاهده شده از نظر آماری معنی دار هستند (سطح معنی داری p<0,05).

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...