توزیع Xi. آزمون: توزیع کای دو و کاربرد آن

  • ریاضی
  • در این مقاله در مورد بررسی رابطه بین ویژگی ها یا به دلخواه متغیرهای تصادفی، متغیرها صحبت خواهیم کرد. به طور خاص، نحوه معرفی یک معیار وابستگی بین ویژگی ها با استفاده از آزمون Chi-square و مقایسه آن با ضریب همبستگی را تجزیه و تحلیل خواهیم کرد.

    چرا ممکن است این مورد نیاز باشد؟ به عنوان مثال، برای درک اینکه کدام ویژگی ها در هنگام ساخت امتیازدهی اعتباری به متغیر هدف بیشتر وابسته هستند - تعیین احتمال پیش فرض مشتری. یا، مانند مورد من، برای درک اینکه چه شاخص هایی باید برای برنامه ریزی یک ربات معامله گر استفاده شود.

    به طور جداگانه، توجه می کنم که برای تجزیه و تحلیل داده ها از زبان c# استفاده می کنم. شاید همه اینها قبلاً در R یا Python پیاده سازی شده باشد، اما استفاده از c # برای من به من اجازه می دهد تا موضوع را با جزئیات درک کنم، علاوه بر این، این زبان برنامه نویسی مورد علاقه من است.

    بیایید با مطلق شروع کنیم یک مثال ساده، با استفاده از یک مولد اعداد تصادفی چهار ستون در اکسل ایجاد کنید:
    ایکس=RANDOMBETWEEN(-100,100)
    Y =ایکس*10+20
    ز =ایکس*ایکس
    تی=RANDOMBETWEEN(-100,100)

    همانطور که می بینید، متغیر Yبه صورت خطی وابسته به ایکس; متغیر زوابسته به درجه دوم ایکس; متغیرها ایکسو تیمستقل. من این انتخاب را عمدا انجام دادم، زیرا اندازه گیری وابستگی خود را با ضریب همبستگی مقایسه خواهیم کرد. همانطور که می دانید، بین دو متغیر تصادفی اگر بین آنها "سخت ترین" نوع وابستگی خطی باشد، مدول 1 است. بین دو متغیر تصادفی مستقل همبستگی صفر وجود دارد، اما استقلال ضریب همبستگی از برابری ضریب همبستگی ناشی نمی شود. این را بعداً در مثال متغیرها خواهیم دید. ایکسو ز.

    ما فایل را به عنوان data.csv ذخیره می کنیم و اولین تخمین ها را شروع می کنیم. ابتدا ضریب همبستگی بین مقادیر را محاسبه می کنیم. من کد را در مقاله وارد نکردم، در github من است. ما همبستگی را برای همه جفت های ممکن بدست می آوریم:

    می توان مشاهده کرد که برای وابسته به خطی ایکسو Yضریب همبستگی 1 است. اما برای ایکسو زبرابر 0.01 است، اگرچه ما وابستگی را به صراحت تنظیم می کنیم ز=ایکس*ایکس. واضح است که ما به معیاری نیاز داریم که وابستگی را بهتر «احساس» کند. اما قبل از رفتن به آزمون Chi-square، بیایید ببینیم که ماتریس اقتضایی چیست.

    برای ایجاد یک ماتریس اقتضایی، محدوده مقادیر متغیر را به فواصل زمانی تقسیم می کنیم (یا دسته بندی می کنیم). راه های زیادی برای چنین پارتیشن بندی وجود دارد، در حالی که هیچ روش جهانی وجود ندارد. برخی از آنها به فواصل تقسیم می شوند تا به همان تعداد متغیر در آنها قرار می گیرند، برخی دیگر به فواصل با طول مساوی تقسیم می شوند. من شخصاً دوست دارم این رویکردها را ترکیب کنم. تصمیم گرفتم از این روش استفاده کنم: امتیاز را از متغیر کم می کنم. انتظارات، سپس من دریافت شده را بر ارزیابی تقسیم می کنم انحراف معیار. به عبارت دیگر، متغیر تصادفی را مرکز و نرمال می کنم. مقدار حاصل در یک ضریب ضرب می شود (در این مثال برابر با 1 است)، پس از آن همه چیز به یک عدد صحیح گرد می شود. خروجی یک متغیر از نوع int است که شناسه کلاس است.

    پس بیایید نشانه هایمان را بگیریم ایکسو ز، ما آن را به روشی که در بالا توضیح دادیم طبقه بندی می کنیم و پس از آن تعداد و احتمال وقوع هر کلاس و احتمال وقوع جفت ویژگی را محاسبه می کنیم:

    این یک ماتریس بر اساس کمیت است. در اینجا در خطوط - تعداد وقوع کلاس های متغیر ایکس، در ستون ها - تعداد وقوع کلاس های متغیر ز، در سلول ها - تعداد وقوع جفت کلاس ها در همان زمان. به عنوان مثال، کلاس 0 865 بار برای یک متغیر رخ می دهد ایکس، 823 بار برای متغیر زو هرگز جفت نداشت (0,0). بیایید با تقسیم همه مقادیر بر 3000 به سمت احتمالات برویم ( تعداد کلمشاهدات):

    ماتریس اقتضایی که پس از دسته‌بندی ویژگی‌ها به‌دست می‌آید دریافت کرد. حالا وقت آن است که در مورد معیار فکر کنیم. طبق تعریف، متغیرهای تصادفی مستقل هستند اگر سیگما-جبرهای تولید شده توسط این متغیرهای تصادفی مستقل باشند. استقلال سیگما-جبرها حاکی از استقلال زوجی رویدادها از آنهاست. دو رویداد مستقل نامیده می شوند که احتمال وقوع مشترک آنها برابر با حاصل ضرب احتمالات این رویدادها باشد: پیج = پی*پیج. این فرمول است که برای ساختن معیار استفاده خواهیم کرد.

    فرضیه صفر: ویژگی های طبقه بندی شده ایکسو زمستقل. معادل آن: توزیع ماتریس اقتضایی صرفاً با احتمال وقوع کلاسهای متغیرها (احتمالات سطرها و ستونها) داده می شود. یا به این ترتیب: سلول های ماتریس حاصل ضرب احتمالات مربوط به سطرها و ستون ها هستند. ما از این فرمول فرضیه صفر برای ساخت استفاده خواهیم کرد قاعده تعیین کننده: اختلاف معنی دار بین پیجو Pi*Pjمبنای رد فرضیه صفر خواهد بود.

    اجازه دهید - احتمال وقوع کلاس 0 در متغیر ایکس. در کل داریم nکلاس ها ایکسو مترکلاس ها ز. معلوم می شود که برای تنظیم توزیع ماتریس، باید اینها را بدانیم nو متراحتمالات اما در واقع اگر بدانیم n-1احتمال برای ایکس، سپس دومی با تفریق مجموع بقیه از 1 به دست می آید. بنابراین، برای یافتن توزیع ماتریس اقتضایی، باید بدانیم l=(n-1)+(m-1)ارزش های. یا داریم ل- فضای پارامتریک بعدی، بردار که از آن توزیع مورد نظر ما را به ما می دهد. آمار کای دو به صورت زیر خواهد بود:

    و طبق قضیه فیشر، توزیع مجذور کای با n*m-l-1=(n-1)(m-1)درجه آزادی.

    سطح معنی داری را روی 0.95 قرار می دهیم (یا احتمال خطای نوع I 0.05 است). بیایید کمیت توزیع Chi-squared برای را پیدا کنیم سطح داده شدهاهمیت و درجه آزادی از مثال (n-1)(m-1)=4*3=12: 21.02606982. خود آمار کای دو برای متغیرها ایکسو زبرابر با 4088.006631 است. مشاهده می شود که فرضیه استقلال پذیرفته نمی شود. در نظر گرفتن نسبت آمار مربع کای به مقدار آستانه راحت است - در این مورد برابر است با Chi2Coeff=194.4256186. اگر این نسبت کمتر از 1 باشد، فرضیه استقلال پذیرفته می شود و اگر بزرگتر باشد، خیر. بیایید این نسبت را برای همه جفت ویژگی ها پیدا کنیم:

    اینجا فاکتور 1و عامل 2- نام ویژگی ها
    src_cnt1و src_cnt2- تعداد مقادیر منحصر به فرد ویژگی های اصلی
    mod_cnt1و mod_cnt2- تعداد مقادیر منحصر به فرد ویژگی پس از طبقه بندی
    chi2- آمار Chi-square
    chi2max- مقدار آستانه آمار کای دو برای سطح معنی داری 95/0
    chi2Coeff- نسبت آمار کای دو به مقدار آستانه
    تصحیح- ضریب همبستگی

    مشاهده می شود که آنها مستقل هستند (chi2coeff<1) получились следующие пары признаков - (X، T), (Y, T) و ( ز، تی) که منطقی است، زیرا متغیر است تیبه صورت تصادفی تولید می شود. متغیرها ایکسو زوابسته، اما کمتر از وابسته خطی ایکسو Y، که منطقی هم هست.

    کد ابزاری که این اندیکاتورها را محاسبه می کند را در همان محل فایل data.csv در github قرار دادم. این ابزار یک فایل csv را به عنوان ورودی می پذیرد و وابستگی ها را بین تمام جفت ستون ها محاسبه می کند: PtProject.Dependency.exe data.csv

    برنامه را در نظر بگیریدام‌اسبرتری داشتنآزمون کای دو پیرسون برای آزمون فرضیه های ساده.

    پس از دریافت داده های تجربی (یعنی زمانی که مقداری وجود دارد نمونه) معمولاً یک قانون توزیع انتخاب می شود که به بهترین وجه متغیر تصادفی نشان داده شده را توصیف می کند نمونه گیری. بررسی چگونگی توصیف داده های تجربی توسط قانون توزیع نظری انتخاب شده با استفاده از آن انجام می شود معیارهای رضایت. فرضیه صفر، معمولاً فرضیه برابری توزیع است متغیر تصادفیبرخی از قوانین نظری

    بیایید ابتدا به برنامه نگاه کنیم تست خوب بودن تناسب پیرسون X 2 (chi-square)در رابطه با فرضیه های ساده (فرض می شود که پارامترهای توزیع نظری مشخص باشد). سپس - ، زمانی که فقط فرم توزیع و پارامترهای این توزیع و مقدار مشخص شده است آمار X 2 بر اساس همان برآورد/محاسبه می شوند نمونه ها.

    توجه داشته باشید: در ادبیات انگلیسی زبان، رویه درخواست تست خوب بودن تناسب پیرسون X 2 نام دارد آزمون کای دو خوب بودن برازش.

    روش آزمایش فرضیه ها را به یاد بیاورید:

    • مستقر نمونه هاارزش محاسبه می شود آمار، که با نوع فرضیه مورد آزمایش مطابقت دارد. به عنوان مثال، برای استفاده تی-آمار(در صورت عدم شناخت)؛
    • تابع حقیقت فرضیه صفر، توزیع این آمارشناخته شده است و می تواند برای محاسبه احتمالات (مثلاً برای تی- آماراین هست )؛
    • بر اساس محاسبه می شود نمونه هامعنی آماردر مقایسه با مقدار بحرانی برای مقدار داده شده ();
    • فرضیه صفررد می شود اگر مقدار آماربزرگتر از بحرانی (یا اگر احتمال به دست آوردن این مقدار باشد آمار() کمتر سطح اهمیت، که رویکرد معادل است).

    خرج کنیم تست فرضیهبرای توزیع های مختلف

    مورد گسسته

    فرض کنید دو نفر در حال بازی تاس هستند. هر بازیکن مجموعه ای از تاس های خود را دارد. بازیکنان به نوبت 3 تاس می اندازند. هر دور توسط کسی برنده می‌شود که در هر زمان شش‌های بیشتری را بزند. نتایج ثبت می شود. یکی از بازیکنان پس از 100 دور مشکوک بود که استخوان های حریفش متقارن نیست، زیرا. او اغلب برنده می شود (اغلب شش پرتاب می کند). او تصمیم گرفت تا تحلیل کند که چنین تعدادی از نتایج حریف چقدر محتمل است.

    توجه داشته باشید: زیرا 3 تاس، سپس می توانید هر بار 0 تاس بیاندازید. یک 2 یا 3 شش، یعنی. متغیر تصادفی می تواند 4 مقدار داشته باشد.

    از نظریه احتمال می دانیم که اگر مکعب ها متقارن باشند، احتمال سقوط شش ها مطابقت دارد. بنابراین، پس از 100 دور، فرکانس شش ها را می توان با استفاده از فرمول محاسبه کرد
    =BINOM.DIST(A7,3,1/6,FALSE)*100

    فرمول فرض می کند که سلول A7 شامل تعداد متناظر شش های حذف شده در یک دور است.

    توجه داشته باشید: محاسبات ارائه شده است فایل نمونه در ورق گسسته.

    برای مقایسه مشاهده شده(مشاهده شده) و فرکانس های نظری(مورد انتظار) مناسب برای استفاده.

    با انحراف قابل توجهی از فرکانس های مشاهده شده از توزیع نظری، فرضیه صفردر مورد توزیع یک متغیر تصادفی طبق یک قانون نظری، باید رد شود. یعنی اگر تاس‌های حریف متقارن نباشند، فرکانس‌های مشاهده‌شده «به‌طور قابل‌توجهی متفاوت» خواهند بود. توزیع دو جمله ای.

    در مورد ما، در نگاه اول، فرکانس ها کاملا نزدیک هستند و نتیجه گیری بدون ابهام بدون محاسبات دشوار است. مناسب تست خوب بودن تناسب پیرسون X 2، به طوری که به جای گزاره ذهنی "به طور قابل توجهی متفاوت"، که می تواند بر اساس مقایسه انجام شود هیستوگرام ها، از یک عبارت ریاضی درست استفاده کنید.

    اجازه دهید از این واقعیت استفاده کنیم قانون اعداد بزرگفرکانس مشاهده شده (مشاهده شده) با افزایش حجم نمونه ها n تمایل به احتمال مربوط به قانون نظری دارد (در مورد ما، قانون دوجمله ای). در مورد ما، حجم نمونه n 100 است.

    معرفی کنیم تست آمارکه با X 2 نشان می دهیم:

    در جایی که O l بسامد مشاهده شده رویدادهایی است که متغیر تصادفی مقادیر قابل قبول خاصی را به خود اختصاص داده است، E l بسامد نظری مربوطه (مورد انتظار) است. L تعداد مقادیری است که یک متغیر تصادفی می تواند بگیرد (در مورد ما برابر با 4 است).

    همانطور که از فرمول مشخص است، این آماراندازه گیری نزدیکی فرکانس های مشاهده شده به فرکانس های نظری است، یعنی. می توان از آن برای تخمین "فاصله" بین این فرکانس ها استفاده کرد. اگر مجموع این "فاصله ها" "خیلی زیاد" باشد، پس این فرکانس ها "به طور قابل ملاحظه ای متفاوت هستند". واضح است که اگر مکعب ما متقارن باشد (یعنی قابل اجرا قانون دوجمله ای) پس احتمال اینکه مجموع "فاصله ها" "خیلی زیاد" باشد کم خواهد بود. برای محاسبه این احتمال، باید توزیع را بدانیم آمار X 2 ( آمار X 2 بر اساس تصادفی محاسبه شد نمونه ها، بنابراین یک متغیر تصادفی است و بنابراین متغییر خود را دارد توزیع احتمال).

    از یک آنالوگ چند بعدی قضیه انتگرال مویور-لاپلاسمشخص است که برای n->∞ متغیر تصادفی ما X 2 به طور مجانبی با L - 1 درجه آزادی است.

    بنابراین اگر مقدار محاسبه شده است آمار X 2 (مجموع "فاصله ها" بین فرکانس ها) بیش از یک مقدار حد معین خواهد بود، پس دلیلی برای رد کردن خواهیم داشت. فرضیه صفر. همانطور که در بررسی فرضیه های پارامتریک، مقدار حد از طریق تنظیم می شود سطح اهمیت. اگر احتمال اینکه آمار X 2 مقداری کمتر یا مساوی با محاسبه شده ( پ-معنی) کمتر خواهد شد سطح اهمیت، سپس فرضیه صفررا می توان رد کرد.

    در مورد ما، مقدار آماری 22.757 است. احتمال اینکه آمار X 2 مقداری بزرگتر یا مساوی 22.757 بگیرد بسیار کم است (0.000045) و با استفاده از فرمول ها قابل محاسبه است.
    =XI2.DIST.PX(22,757;4-1)یا
    =XI2.TEST(مشاهده شده؛ مورد انتظار)

    توجه داشته باشید: تابع ()CH2.TEST به طور خاص برای آزمایش رابطه بین دو متغیر طبقه بندی شده طراحی شده است (نگاه کنید به ).

    احتمال 0.000045 به طور قابل توجهی کمتر از حد معمول است سطح اهمیت 0.05. بنابراین، بازیکن دلایل زیادی دارد که به حریف خود به عدم صداقت مشکوک شود ( فرضیه صفرصداقت او رد شده است).

    هنگامی که اعمال می شود معیار X 2باید مراقب بود که حجم نمونه ها n به اندازه کافی بزرگ بود، در غیر این صورت تقریب توزیع نامعتبر خواهد بود آمار X 2. معمولاً در نظر گرفته می شود که برای این کار کافی است که فرکانس های مشاهده شده (مشاهده شده) بیشتر از 5 باشد. اگر اینطور نیست، فرکانس های پایین در یک فرکانس ترکیب می شوند یا به فرکانس های دیگر ملحق می شوند و احتمال کل به فرکانس اختصاص می یابد. ارزش ترکیبی و بر این اساس، تعداد درجات آزادی کاهش می یابد X 2 - توزیع.

    به منظور بهبود کیفیت برنامه معیار X 2()، لازم است فواصل پارتیشن بندی را کاهش دهید (L را افزایش دهید و بر این اساس تعداد را افزایش دهید درجه آزادی، با این حال، با محدودیت در تعداد مشاهداتی که در هر بازه قرار می گیرند (d.b.> 5) از این جلوگیری می شود.

    مورد مداوم

    تست تناسب خوب پیرسون X 2 می توان به همین ترتیب در مورد .

    برخی را در نظر بگیرید نمونه برداری، متشکل از 200 مقدار. فرضیه صفرکشورهایی که نمونهساخته شده از .

    توجه داشته باشید: متغیرهای تصادفی در فایل نمونه در ورق Continuousبا استفاده از فرمول تولید شده است =NORM.ST.INV(RAND()). بنابراین، ارزش های جدید نمونه هاهر بار که ورق دوباره محاسبه می شود، ایجاد می شود.

    اینکه آیا مجموعه داده های موجود کافی است یا نه، می توان به صورت بصری ارزیابی کرد.

    همانطور که از نمودار می بینید، مقادیر نمونه به خوبی در امتداد خط مستقیم قرار می گیرند. با این حال، همانطور که برای تست فرضیهمناسب تست خوب بودن تناسب پیرسون X 2.

    برای انجام این کار، محدوده تغییرات یک متغیر تصادفی را به فواصل با گام 0.5 تقسیم می کنیم. بیایید فرکانس های مشاهده شده و نظری را محاسبه کنیم. فرکانس های مشاهده شده را با استفاده از تابع FREQUENCY() و فرکانس های نظری را با استفاده از تابع NORM.ST.DIST محاسبه می کنیم.

    توجه داشته باشید: با توجه به مورد گسسته، اطمینان از آن ضروری است نمونهبسیار بزرگ بود و بیش از 5 مقدار در فاصله زمانی قرار گرفت.

    آمار X 2 را محاسبه کرده و آن را با مقدار بحرانی یک داده مقایسه کنید سطح اهمیت(0.05). زیرا ما دامنه تغییرات یک متغیر تصادفی را به 10 بازه تقسیم کردیم، سپس تعداد درجه آزادی 9 است. مقدار بحرانی را می توان با فرمول محاسبه کرد.
    \u003d XI2.INV.RH (0.05؛ 9) یا
    \u003d XI2.OBR (1-0.05؛ 9)

    نمودار بالا نشان می دهد که مقدار آماری 8.19 است که به طور قابل توجهی بالاتر است بحرانیفرضیه صفررد نمی شود.

    در زیر بر روی آن آمده است نمونهیک مقدار بعید در نظر گرفته شد و بر اساس شاخص رضایت پیرسون X 2فرضیه صفر رد شد (علیرغم اینکه مقادیر تصادفی با استفاده از فرمول ایجاد شده است. =NORM.ST.INV(RAND())فراهم آوردن نمونه برداریاز جانب توزیع نرمال استاندارد).

    فرضیه صفررد شد، اگرچه از نظر بصری داده ها کاملاً به یک خط مستقیم نزدیک هستند.

    به عنوان مثال، بیایید آن را نیز در نظر بگیریم نمونه برداریاز U(-3; 3). در این مورد، حتی از نمودار نیز مشخص است که فرضیه صفرباید رد شود.

    معیار رضایت پیرسون X 2نیز تایید می کند که فرضیه صفرباید رد شود.

    وزارت آموزش و پرورش و علوم فدراسیون روسیه

    آژانس فدرال آموزش شهر ایرکوتسک

    بایکال دانشگاه دولتیاقتصاد و حقوق

    گروه انفورماتیک و سایبرنتیک

    توزیع کای دو و کاربرد آن

    کلمیکووا آنا آندریونا

    دانشجوی سال دوم

    گروه IS-09-1

    برای پردازش داده های به دست آمده از آزمون کای اسکوئر استفاده می کنیم.

    برای انجام این کار، جدولی از توزیع فرکانس های تجربی می سازیم، یعنی. فرکانس هایی که مشاهده می کنیم:

    از نظر تئوری، ما انتظار داریم که فرکانس ها به طور مساوی توزیع شوند، یعنی. فرکانس به طور متناسب بین پسران و دختران توزیع خواهد شد. بیایید جدولی از فرکانس های نظری بسازیم. برای این کار، مجموع ردیف را در مجموع ستون ضرب کنید و عدد حاصل را بر آن تقسیم کنید مبلغ کل(ها).


    جدول حاصل برای محاسبات به صورت زیر خواهد بود:

    χ2 \u003d ∑ (E - T)² / T

    n = (R - 1)، که در آن R تعداد ردیف های جدول است.

    در مورد ما، خی دو = 4.21; n = 2.

    با توجه به جدول مقادیر بحرانی معیار، در n = 2 و سطح خطای 0.05، مقدار بحرانی χ2 = 5.99 در می یابیم.

    مقدار حاصل کمتر از مقدار بحرانی است، به این معنی که فرضیه صفر پذیرفته می شود.

    نتیجه گیری: معلمان هنگام نوشتن ویژگی های کودک به جنسیت او اهمیت نمی دهند.

    کاربرد

    نقاط توزیع بحرانی χ2

    میز 1

    نتیجه

    دانش آموزان تقریباً همه تخصص ها بخش "تئوری احتمالات و آمار ریاضی" را در پایان دوره ریاضیات عالی مطالعه می کنند، در واقع آنها فقط با برخی از مفاهیم و نتایج اولیه آشنا می شوند که به وضوح برای آنها کافی نیست. کار عملی. دانش‌آموزان با برخی از روش‌های ریاضی تحقیق در دروس ویژه (مثلاً «پیش‌بینی و برنامه‌ریزی امکان‌سنجی»، «تحلیل فنی و اقتصادی»، «کنترل کیفیت محصول»، «بازاریابی»، «کنترل»، « روش های ریاضیپیش بینی»، «آمار» و غیره – در مورد دانشجویان رشته های تخصصی اقتصادی) اما ارائه در اکثر موارد بسیار مختصر و نسخه ای است و در نتیجه متخصصان آمار کاربردی از دانش کافی برخوردار نیستند.

    از همین رو پراهمیتدارای درس "آمار کاربردی" در دانشگاه های فنی و در دانشگاه های اقتصادی - دوره "اقتصاد سنجی" است، زیرا همانطور که می دانید اقتصاد سنجی است، تحلیل آماریداده های اقتصادی خاص

    تئوری احتمال و آمار ریاضی دانش بنیادی را برای آمار کاربردی و اقتصاد سنجی فراهم می کند.

    آنها برای کار عملی برای متخصصان ضروری هستند.

    من یک مدل احتمالی پیوسته را در نظر گرفتم و سعی کردم قابلیت استفاده آن را با مثال هایی نشان دهم.

    کتابشناسی - فهرست کتب

    1. Orlov A.I. آمار کاربردی م.: انتشارات "امتحان"، 2004.

    2. Gmurman V.E. نظریه احتمالات و آمار ریاضی. م.: دانشکده تحصیلات تکمیلی، 1999. - 479p.

    3. آیووزیان س.ا. نظریه احتمالات و آمار کاربردی، ج.1. M.: وحدت، 2001. - 656s.

    4. Khamitov G.P., Vedernikova T.I. احتمالات و آمار. ایرکوتسک: BSUEP، 2006 - 272p.

    5. ژووا ال.ن. اقتصاد سنجی. ایرکوتسک: BSUEP، 2002. - 314p.

    6. Mosteller F. پنجاه مسئله احتمالی سرگرم کننده با راه حل. M.: Nauka، 1975. - 111p.

    7. Mosteller F. احتمال. م.: میر، 1969. - 428s.

    8. Yaglom A.M. احتمال و اطلاعات M.: Nauka، 1973. - 511p.

    9. چیستیاکوف وی.پی. دوره احتمال. M.: Nauka، 1982. - 256 ص.

    10. کرمر ن.ش. نظریه احتمالات و آمار ریاضی. M.: UNITI, 2000. - 543 p.

    11. دایره المعارف ریاضی، ج1. م.: دایره المعارف شوروی، 1976. - 655s.

    12. http://psystat.at.ua/ - آمار در روانشناسی و آموزش. آزمون مجذور کای مقاله.

    استفاده از این معیار مبتنی بر استفاده از چنین معیاری (آمار) از اختلاف نظری است. اف(ایکس) و توزیع تجربی اف* پ (ایکس) ، که تقریباً از قانون توزیع χ پیروی می کند 2 . فرضیه اچ 0 سازگاری توزیع ها با تجزیه و تحلیل توزیع این آمار بررسی می شود. استفاده از معیار مستلزم ساخت یک سری آماری است.

    بنابراین، اجازه دهید نمونه با یک ردیف آماری با تعداد ارقام نشان داده شود م. نرخ ضربه مشاهده شده در من- رتبه ام n من. مطابق با قانون توزیع نظری، فرکانس مورد انتظار بازدیدها در من-ام رقم است اف من. تفاوت بین فرکانس مشاهده شده و مورد انتظار مقدار ( n مناف من). برای یافتن درجه کلی اختلاف بین اف(ایکس) و اف* پ (ایکس) لازم است مجموع وزنی مجذور تفاوت ها برای تمام ارقام سری آماری محاسبه شود.

    مقدار χ 2 با بزرگنمایی نامحدود n دارای توزیع χ2 (به صورت مجانبی به صورت χ 2 توزیع می شود). این توزیع به تعداد درجات آزادی بستگی دارد ک، یعنی تعداد مقادیر مستقل عبارات در بیان (3.7). تعداد درجات آزادی برابر با عدد است yمنهای تعداد پیوندهای خطی اعمال شده بر روی نمونه. یک اتصال به این دلیل وجود دارد که هر فرکانس را می توان از مجموعه فرکانس های باقی مانده محاسبه کرد. م-1 رقم علاوه بر این، اگر پارامترهای توزیع از قبل شناخته نشده باشند، محدودیت دیگری به دلیل برازش توزیع با نمونه وجود دارد. اگر نمونه تعیین کند اس پارامترهای توزیع، سپس تعداد درجات آزادی خواهد بود ک= ماس–1.

    حوزه پذیرش فرضیه اچ 0 با شرط χ تعیین می شود 2 < χ 2 (ک; آ) ، جایی که χ 2 (ک; آ) نقطه بحرانی توزیع χ2 با سطح معنی داری است آ. احتمال خطا از نوع اول است آ، احتمال خطای نوع II را نمی توان به وضوح تعریف کرد، زیرا تعداد نامتناهی روش های مختلف برای عدم تطابق توزیع ها وجود دارد. قدرت آزمون به تعداد ارقام و حجم نمونه بستگی دارد. معیار برای n> 200، درخواست در مجاز است n> 40، در چنین شرایطی است که معیار سازگار است (به عنوان یک قاعده، فرضیه صفر نادرست را رد می کند).

    الگوریتم بررسی معیارها

    1. یک هیستوگرام را به روشی مشابه بسازید.

    2. با فرم هیستوگرام، یک فرضیه مطرح کنید

    اچ 0: f(ایکس) = f 0 (ایکس),

    اچ 1: f(ایکس) ¹ f 0 (ایکس),

    جایی که f 0 (ایکس) چگالی احتمال یک قانون توزیع فرضی است (به عنوان مثال، یکنواخت، نمایی، نرمال).

    اظهار نظر. فرضیه قانون توزیع نمایی را می توان در صورتی مطرح کرد که همه اعداد نمونه مثبت باشند.

    3. مقدار معیار را با استفاده از فرمول محاسبه کنید

    ,

    جایی که
    دفعات ضربه زدن من-مین فاصله؛

    پ من- احتمال نظری ضربه زدن به یک متغیر تصادفی در من- فاصله زمانی که فرضیه اچ 0 صحیح است.

    فرمول های محاسبه پ مندر مورد نمایی، یکنواخت و قوانین عادیبه ترتیب برابر هستند.

    قانون نمایی

    . (3.8)

    که در آن آ 1 = 0, ب متر = +¥.

    قانون یکسان

    قانون عادی

    . (3.10)

    که در آن آ 1 = -¥، B M = +¥.

    ملاحظات. پس از محاسبه همه احتمالات پ منبررسی کنید که آیا نسبت کنترل راضی است یا خیر

    تابع F( ایکس) عجیب است. Ф(+¥) = 1.

    4. از جدول "Chi-square" برنامه، یک مقدار انتخاب می شود
    ، که در آن a سطح معناداری داده شده است (a = 0.05 یا a = 0.01)، و ک- تعداد درجات آزادی که با فرمول تعیین می شود

    ک = م - 1 - اس.

    اینجا اس- تعداد پارامترهایی که فرضیه انتخاب شده به آنها بستگی دارد اچ 0 قانون توزیع ارزش های اسبرای قانون یکنواخت 2، برای نمایی - 1، برای عادی - 2 است.

    5. اگر
    ، سپس فرضیه اچ 0 رد می شود. در غیر این صورت دلیلی برای رد آن وجود ندارد: با احتمال 1 - b درست است و با احتمال - b نادرست است اما مقدار b مجهول است.

    مثال 3 . 1. با استفاده از معیار c 2، فرضیه ای در مورد قانون توزیع یک متغیر تصادفی مطرح و آزمایش کنید. ایکس, سری تغییرات، جداول فاصله و هیستوگرام توزیع آنها در مثال 1.2 آورده شده است. سطح معناداری a 0.05 است.

    راه حل . بر اساس نوع هیستوگرام، فرض می کنیم که متغیر تصادفی است ایکسطبق قانون عادی توزیع می شود:

    اچ 0: f(ایکس) = ن(متر، s)؛

    اچ 1: f(ایکس) ¹ ن(متر، س).

    مقدار معیار با فرمول محاسبه می شود:

    (3.11)

    همانطور که در بالا ذکر شد، هنگام آزمایش یک فرضیه، ترجیحاً از هیستوگرام همسان استفاده شود. در این مورد

    احتمالات نظری پ منما با فرمول (3.10) محاسبه می کنیم. در عین حال، ما این را فرض می کنیم

    پ 1 = 0.5 (F((-4.5245+1.7)/1.98)-F((-¥+1.7)/1.98)) = 0.5(F(-1.427) -Ф(-¥)) =

    0,5(-0,845+1) = 0,078.

    پ 2 = 0.5 (F((-3.8865+1.7)/1.98)-F((-4.5245+1.7)/1.98)) =

    0.5 (F(-1.104)+0.845) = 0.5 (-0.729+0.845) = 0.058.

    پ 3 = 0,094; پ 4 = 0,135; پ 5 = 0,118; پ 6 = 0,097; پ 7 = 0,073; پ 8 = 0,059; پ 9 = 0,174;

    پ 10 \u003d 0.5 (Ф ((+ ¥ + 1.7) / 1.98) - Ф ((0.6932 + 1.7) / 1.98)) \u003d 0.114.

    پس از آن، انجام رابطه کنترل را بررسی می کنیم

    100 × (0.0062 + 0.0304 + 0.0004 + 0.0091 + 0.0028 + 0.0001 + 0.0100 +

    0.0285 + 0.0315 + 0.0017) = 100 × 0.1207 = 12.07.

    پس از آن، از جدول "Chi - Square" مقدار بحرانی را انتخاب می کنیم

    .

    زیرا
    سپس فرضیه اچ 0 پذیرفته می شود (دلیلی برای رد آن وجود ندارد).

    توزیع کای دو یکی از پرکاربردترین توزیع‌ها در آمار برای آزمایش است فرضیه های آماری. بر اساس توزیع «خی دو»، یکی از قوی‌ترین آزمون‌های برازش، آزمون «خی‌دو» پیرسون ساخته شد.

    آزمون خوب بودن برازش معیاری برای آزمون فرضیه در مورد قانون پیشنهادی توزیع مجهول است.

    آزمون χ2 ("chi-square") برای آزمون فرضیه توزیع های مختلف استفاده می شود. این شایستگی اوست.

    فرمول محاسبه معیار برابر است با

    که در آن m و m به ترتیب فرکانس های تجربی و نظری هستند

    توزیع در حال بررسی؛

    n تعداد درجات آزادی است.

    برای راستی‌آزمایی، باید فرکانس‌های تجربی (مشاهده‌شده) و نظری (محاسبه‌شده با فرض توزیع نرمال) را با هم مقایسه کنیم.

    اگر فرکانس های تجربی کاملاً با فرکانس های محاسبه شده یا مورد انتظار منطبق باشند، S (E - T) = 0 و معیار χ2 نیز برابر با صفر خواهد بود. اگر S (E - T) برابر با صفر نباشد، این نشان دهنده اختلاف بین فرکانس های محاسبه شده و فرکانس های تجربی سری است. در چنین مواردی، ارزیابی اهمیت معیار χ2 ضروری است که از نظر تئوری می تواند از صفر تا بی نهایت متغیر باشد. این با مقایسه مقدار واقعی χ2ph با مقدار بحرانی آن (χ2st) انجام می‌شود.فرضیه صفر، یعنی این فرض که اختلاف بین فرکانس‌های تجربی و نظری یا مورد انتظار تصادفی است، اگر χ2ph بزرگتر یا مساوی باشد، رد می‌شود. به χ2 برای سطح معناداری پذیرفته شده (a) و تعداد درجات آزادی (n).

    توزیع مقادیر احتمالی متغیر تصادفی χ2 پیوسته و نامتقارن است. این به تعداد درجات آزادی (n) و رویکردها بستگی دارد توزیع نرمالبا افزایش تعداد مشاهدات بنابراین، استفاده از معیار χ2 در برآورد توزیع های گسستهبا برخی از خطاها همراه است که بر ارزش آن تأثیر می گذارد، به خصوص برای نمونه های کوچک. برای به دست آوردن تخمین های دقیق تر، نمونه توزیع شده در سری تغییرات باید حداقل 50 گزینه داشته باشد. استفاده صحیح از معیار χ2 همچنین مستلزم آن است که فرکانس انواع در کلاس های شدید نباید کمتر از 5 باشد. اگر تعداد آنها کمتر از 5 باشد، با فرکانس های کلاس های همسایه ترکیب می شوند تا مقدار کل بیشتر یا مساوی 5 باشد. با توجه به ترکیب فرکانس ها، تعداد کلاس ها (N) نیز کاهش می یابد. تعداد درجات آزادی بر اساس تعداد طبقات ثانویه با در نظر گرفتن تعداد محدودیت‌های آزادی تنوع تنظیم می‌شود.



    از آنجایی که دقت تعیین معیار χ2 تا حد زیادی به دقت محاسبه فرکانس های نظری (T) بستگی دارد، باید از فرکانس های نظری نامحدود برای به دست آوردن تفاوت بین فرکانس های تجربی و محاسبه شده استفاده شود.

    به عنوان مثال، بیایید مطالعه ای را در نظر بگیریم که در یک وب سایت اختصاص داده شده به کاربرد روش های آماری در علوم انسانی.

    آزمون Chi-square امکان مقایسه توزیع‌های فرکانس را فراهم می‌کند، چه توزیع‌های معمولی داشته باشند یا نه.

    فرکانس به تعداد وقوع یک رویداد اشاره دارد. معمولاً زمانی به فراوانی وقوع یک رویداد پرداخته می‌شود که متغیرها در مقیاس نام‌ها اندازه‌گیری می‌شوند و سایر ویژگی‌های آنها، به جز فراوانی، غیرممکن یا مشکل‌ساز است. به عبارت دیگر زمانی که متغیر دارای ویژگی های کیفی باشد. همچنین، بسیاری از محققان تمایل دارند نمرات آزمون را به سطوح (بالا، متوسط، پایین) ترجمه کنند و جداول توزیع امتیاز را برای یافتن تعداد افراد در این سطوح بسازند. برای اثبات اینکه در یکی از سطوح (در یکی از دسته ها) تعداد افراد واقعاً بیشتر (کمتر) است از ضریب کای دو نیز استفاده می شود.

    بیایید ساده ترین مثال را بررسی کنیم.

    آزمون عزت نفس در میان نوجوانان جوانتر انجام شد. نمرات آزمون به سه سطح بالا، متوسط، پایین ترجمه شد. فرکانس ها به شرح زیر توزیع شدند:

    بالا (H) 27 نفر.

    متوسط ​​(C) 12 نفر

    کم (H) 11 نفر.

    بدیهی است که اکثر کودکان دارای عزت نفس بالا هستند، اما این امر نیاز به اثبات آماری دارد. برای این کار از آزمون Chi-square استفاده می کنیم.

    وظیفه ما این است که بررسی کنیم آیا داده های تجربی به دست آمده با داده های نظری به همان اندازه محتمل متفاوت است یا خیر. برای انجام این کار، یافتن فرکانس های نظری ضروری است. در مورد ما، فرکانس‌های نظری فرکانس‌های هم‌احتمالی هستند که با جمع کردن همه فرکانس‌ها و تقسیم بر تعداد دسته‌ها پیدا می‌شوند.

    در مورد ما:

    (B + C + H) / 3 \u003d (27 + 12 + 11) / 3 \u003d 16.6

    فرمول محاسبه آزمون کای اسکوئر به صورت زیر است:

    χ2 = ∑(E - T)І / T

    ما یک جدول می سازیم:

    جمع آخرین ستون را پیدا کنید:

    اکنون باید مقدار بحرانی معیار را مطابق جدول مقادیر بحرانی (جدول 1 در پیوست) پیدا کنید. برای این کار به تعداد درجات آزادی (n) نیاز داریم.

    n = (R - 1) * (C - 1)

    که در آن R تعداد سطرهای جدول، C تعداد ستون ها است.

    در مورد ما، فقط یک ستون (به معنی فرکانس های تجربی اصلی) و سه ردیف (دسته ها) وجود دارد، بنابراین فرمول تغییر می کند - ما ستون ها را حذف می کنیم.

    n = (R - 1) = 3-1 = 2

    برای احتمال خطا p≤0.05 و n = 2، مقدار بحرانی χ2 = 5.99.

    مقدار تجربی به‌دست‌آمده بیشتر از مقدار بحرانی است - تفاوت‌های فرکانس معنی‌دار هستند (9.64=χ2؛ 0.05 p≤).

    همانطور که می بینید، محاسبه معیار بسیار ساده است و زمان زیادی نمی برد. ارزش عملی آزمون کای اسکوئر بسیار زیاد است. این روش بیشترین ارزش را در تحلیل پاسخ به پرسشنامه ها دارد.


    بیایید یک مثال پیچیده تر را در نظر بگیریم.

    به عنوان مثال، یک روانشناس می خواهد بداند که آیا این درست است که معلمان نسبت به پسران بیشتر از دختران تعصب دارند؟ آن ها بیشتر احتمال دارد از دختران تمجید کند. برای انجام این کار، روانشناس به تجزیه و تحلیل ویژگی های دانش آموزان نوشته شده توسط معلمان، با توجه به فراوانی وقوع سه کلمه: "فعال"، "کوشا"، "منضبط"، مترادف کلمات نیز شمارش شد. داده های فراوانی وقوع کلمات در جدول وارد شد:

    برای پردازش داده های به دست آمده از آزمون کای اسکوئر استفاده می کنیم.

    برای انجام این کار، جدولی از توزیع فرکانس های تجربی می سازیم، یعنی. فرکانس هایی که مشاهده می کنیم:

    از نظر تئوری، ما انتظار داریم که فرکانس ها به طور مساوی توزیع شوند، یعنی. فرکانس به طور متناسب بین پسران و دختران توزیع خواهد شد. بیایید جدولی از فرکانس های نظری بسازیم. برای انجام این کار، مجموع ردیف را در مجموع ستون ضرب کنید و عدد حاصل را بر مجموع کل (s) تقسیم کنید.

    جدول حاصل برای محاسبات به صورت زیر خواهد بود:

    χ2 = ∑(E - T)І / T

    n = (R - 1)، که در آن R تعداد ردیف های جدول است.

    در مورد ما، خی دو = 4.21; n = 2.

    با توجه به جدول مقادیر بحرانی معیار، در n = 2 و سطح خطای 0.05، مقدار بحرانی χ2 = 5.99 در می یابیم.

    مقدار حاصل کمتر از مقدار بحرانی است، به این معنی که فرضیه صفر پذیرفته می شود.

    نتیجه گیری: معلمان هنگام نوشتن ویژگی های کودک به جنسیت او اهمیت نمی دهند.


    نتیجه.

    K. Pearson سهم قابل توجهی در توسعه آمار ریاضی (تعداد زیادی از مفاهیم اساسی) داشت. موضع اصلی فلسفی پیرسون به این صورت است که: مفاهیم علم، ساخت‌های مصنوعی، ابزار توصیف و نظم دادن به تجربه حسی هستند. قواعد پیوند آنها با پیشنهادهای علمی توسط دستور زبان علم که فلسفه علم است مشخص شده است. پیوند مفاهیم و پدیده های ناهمگن امکان یک رشته جهانی - آمار کاربردی را فراهم می کند، اگرچه طبق نظر پیرسون آن نیز ذهنی است.

    بسیاری از ساخت و سازهای K. Pearson مستقیماً مرتبط هستند یا با استفاده از مواد مردم شناسی توسعه یافته اند. او روش‌های متعددی را برای طبقه‌بندی عددی و معیارهای آماری مورد استفاده در همه زمینه‌های علم ایجاد کرد.


    ادبیات.

    1. A. N. Bogolyubov، ریاضیات. مکانیک. راهنمای بیوگرافی. - کیف: ناوکوا دومکا، 1983.

    2. Kolmogorov A. N., Yushkevich A. P. (ed.). ریاضیات قرن نوزدهم. - م.: علم. - تی.آی.

    3. 3. Borovkov A.A. آمار ریاضی. مسکو: ناوکا، 1994.

    4. 8. فلر V. مقدمه ای بر نظریه احتمال و کاربردهای آن. - م.: میر، ت.2، 1984.

    5. 9. هارمن جی، مدرن تحلیل عاملی. - م.: آمار، 1972.

    با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

    بارگذاری...