فاصله اطمینان برای واریانس توزیع نرمال. فاصله اطمینان برای تخمین واریانس در MS EXCEL

ساخت یک فاصله اطمینان برای واریانس توزیع نرمال جمعیتبر اساس این واقعیت که متغیر تصادفی:

دارای c 2 - توزیع پیرسون c n= n-1 درجه آزادی تنظیم کنیم سطح اطمینان g و اعداد و از شرط را تعیین کنید

اعداد و ارضای این شرط را می توان به تعداد بی نهایت راه انتخاب کرد. یک راه به شرح زیر است

و .

مقادیر اعداد و از جداول توزیع پیرسون تعیین می شوند. پس از آن نابرابری را تشکیل می دهیم

در نتیجه بازه زیر را بدست می آوریم تخمین واریانس جمعیت عمومی:

. (3.25)

گاهی اوقات این عبارت به صورت نوشته می شود

, (3.26)

, (3.27)

که در آن برای ضرایب و تشکیل جداول خاص.

مثال 3.10.این کارخانه دارای خط اتوماتیک بسته بندی قهوه فوری در قوطی های 100 گرمی می باشد. اگر میانگین وزن قوطی های پر شده با وزن دقیق متفاوت باشد، خطوط برای تنظیم وزن متوسط ​​در حالت کار تنظیم می شوند. اگر پراکندگی جرم از مقدار مشخص شده بیشتر شود، خط باید برای تعمیر و تنظیم مجدد متوقف شود. گهگاه از قوطی های قهوه نمونه برداری می شود تا میانگین وزن و تنوع آن بررسی شود. فرض کنید که یک خط به طور تصادفی برای قوطی های قهوه انتخاب شده و واریانس تخمین زده می شود س 2=18.540. فاصله اطمینان 95% را برای واریانس کلی s 2 رسم کنید.

راه حل.با فرض اینکه جمعیت عمومی دارای توزیع نرمال است، از فرمول (3.26) استفاده می کنیم. با توجه به شرط مسئله، سطح معنی داری 05/0 a= و 025/0=a/2 است. طبق جداول c 2 - توزیع پیرسون با n= n-1=29 درجه آزادی پیدا می کنیم

و .

سپس فاصله اطمینان برای s 2 را می توان به صورت نوشتاری نوشت

,

.

برای انحراف معیار، پاسخ خواهد بود

. â

آزمون فرضیه های آماری

مفاهیم اساسی

اکثر مدل های اقتصادسنجی نیاز به بهبود و اصلاحات متعددی دارند. برای این کار، لازم است محاسبات مناسب مربوط به ایجاد امکان سنجی یا عدم امکان برخی پیش نیازها، تجزیه و تحلیل کیفیت برآوردهای یافت شده و قابلیت اطمینان نتایج به دست آمده انجام شود. بنابراین آگاهی از اصول اولیه آزمون فرضیه در اقتصاد سنجی الزامی است.



در بسیاری از موارد دانستن قانون توزیع جمعیت عمومی ضروری است. اگر قانون توزیع ناشناخته باشد، اما دلیلی وجود دارد که فرض کنیم شکل خاصی دارد، فرضیه ای مطرح می شود: جمعیت عمومی طبق این قانون توزیع می شود. به عنوان مثال، می توان فرض کرد که درآمد جمعیت، تعداد مشتریان روزانه در فروشگاه، اندازه قطعات ساخته شده دارای قانون توزیع نرمال است.

یک مورد زمانی امکان پذیر است که قانون توزیع شناخته شده باشد، اما پارامترهای آن مشخص نباشند. اگر دلیلی وجود دارد که فرض کنیم پارامتر مجهول q برابر با عدد مورد انتظار q 0 است، فرضیه ای را مطرح کنید: q=q 0. به عنوان مثال، می توان در مورد ارزش متوسط ​​درآمد جمعیت، متوسط ​​بازده مورد انتظار سهام، اسپرد درآمد و غیره مفروضاتی داشت.

زیر فرضیه آماریاچهر فرضی را در مورد جمعیت عمومی (متغیر تصادفی) که روی یک نمونه آزمایش شده است را درک کنید. این ممکن است یک فرض در مورد نوع توزیع جمعیت عمومی، در مورد برابری دو واریانس نمونه، در مورد استقلال نمونه ها، در مورد همگن بودن نمونه ها، یعنی. که قانون توزیع از نمونه ای به نمونه دیگر تغییر نمی کند و غیره.

فرضیه نامیده می شود سادهاگر به طور منحصر به فرد توزیع یا پارامتری را تعریف کند. در غیر این صورت فرضیه نامیده می شود دشوار. به عنوان مثال، یک فرضیه ساده این فرض است که متغیر تصادفی است ایکسطبق استاندارد توزیع می شود قانون عادی ن(0;1); اگر فرض شود که متغیر تصادفی است ایکستوزیع نرمال دارد ن(متر؛ 1)، کجا آ£ متر£ ب، پس این یک فرضیه دشوار است.

فرضیه مورد آزمایش نامیده می شود پایه اییا فرضیه صفرو با علامت نشان داده می شود اچ 0 . در کنار فرضیه اصلی، فرضیه ای را نیز مغایر با آن در نظر می گیرند که معمولاً به آن می گویند رقابتیا فرضیه جایگزینو نمادین هستند اچیکی . اگر فرضیه اصلی رد شود، فرضیه جایگزین صورت می گیرد. به عنوان مثال، اگر فرضیه برابری پارامتر q با مقدار داده شده q 0 در حال آزمایش باشد، به عنوان مثال. اچ 0:q=q 0، سپس یکی از فرضیه های زیر را می توان به عنوان فرضیه جایگزین در نظر گرفت: اچ 1:q>q0، اچ 2: q اچ 3:q¹q 0 , اچ 4:q=q 1. انتخاب یک فرضیه جایگزین با فرمول بندی خاص مسئله تعیین می شود.

فرضیه ارائه شده ممکن است صحیح یا نادرست باشد، بنابراین نیاز به آزمون آن وجود دارد. از آنجایی که تأیید با روش های آماری انجام می شود، در ارتباط با این، با درجه خاصی از احتمال، می توان تصمیم نادرستی گرفت. در اینجا دو نوع خطا قابل انجام است. خطای نوع I این است که فرضیه صحیح رد خواهد شد. احتمال خطای نوع اول با حرف a نشان داده می شود، یعنی.

خطای نوع دوماین است که فرضیه اشتباه پذیرفته خواهد شد. احتمال خطای نوع دوم با حرف b نشان داده می شود، یعنی.

عواقب این خطاها نابرابر است. اولی منجر به یک تصمیم محتاطانه تر و محافظه کارانه تر می شود، دومی منجر به ریسک غیر قابل توجیه می شود. اینکه چه بهتر یا بدتر است به فرمول خاص مسئله و محتوای فرضیه صفر بستگی دارد. به عنوان مثال، اگر اچ 0 عبارت است از اینکه محصولات شرکت با کیفیت شناخته شوند و اشتباهی از نوع اول انجام شود، سپس محصولات خوب رد می شوند. پس از ایجاد یک خطای نوع II، ما یک رد را برای مصرف کننده ارسال می کنیم. بدیهی است که عواقب این اشتباه از نظر وجهه شرکت و چشم‌انداز بلندمدت آن جدی‌تر است.

به دلیل محدود بودن نمونه، حذف خطاهای نوع اول و دوم غیرممکن است. بنابراین تلاش می‌کنند تا ضرر و زیان ناشی از این خطاها را به حداقل برسانند. توجه داشته باشید که کاهش همزمان احتمالات این خطاها غیرممکن است، زیرا وظایف کاهش آنها در حال رقابت است. و کاهش احتمال اعتراف به یکی از آنها مستلزم افزایش احتمال اعتراف به دیگری است. در بیشتر موارد، تنها راه کاهش هر دو احتمال، افزایش حجم نمونه است.

قاعده ای که بر اساس آن فرضیه اصلی پذیرفته یا رد می شود نامیده می شود معیار آماری . برای انجام این کار، یک متغیر تصادفی K انتخاب می شود که توزیع آن دقیقاً یا تقریباً مشخص است و به عنوان معیاری برای اختلاف بین مقادیر تجربی و فرضی عمل می کند.

برای آزمون فرضیه، با توجه به داده های نمونه، محاسبه می کنیم انتخابی(یا قابل مشاهده) مقدار معیار K obs. سپس مطابق با توزیع معیار انتخاب شده، الف منطقه بحرانیک کرت. این مجموعه ای از مقادیر معیار است که برای آن فرضیه صفر رد می شود. بقیه مقادیر ممکن نامیده می شوند حوزه پذیرش فرضیه. اگر روی منطقه بحرانی تمرکز کنید، ممکن است اشتباه کنید
از نوع 1 که احتمال آن از پیش تعیین شده و برابر با a است، نامیده می شود سطح اهمیتفرضیه ها این مستلزم نیاز زیر برای منطقه بحرانی K است کرت:

.



سطح اهمیت a "اندازه" منطقه بحرانی K را تعیین می کند کرت. با این حال، موقعیت آن در مجموعه مقادیر معیار به نوع فرضیه جایگزین بستگی دارد. به عنوان مثال، اگر فرضیه صفر آزمایش شود اچ 0:q=q 0 و فرضیه جایگزین این است اچ 1:q>q 0، سپس منطقه بحرانی از بازه (K 2، +¥) تشکیل می شود، که در آن نقطه K 2 از شرایط تعیین می شود. پ(K>K 2)=a ( منطقه بحرانی سمت راست اچ 2: q پ(ک منطقه بحرانی سمت چپ). اگر فرضیه جایگزین باشد اچ 3:q¹q 0، سپس منطقه بحرانی از دو بازه (–¥؛ K 1) و (K 2 , +¥) تشکیل می شود، که در آن نقاط K 1 و K 2 از شرایط تعیین می شوند: پ(K>K 2)=a/2 و پمنطقه بحرانی دو طرفه).

اصل اساسی آزمون فرضیه های آماری را می توان به صورت زیر فرموله کرد. اگر ک obsدر منطقه بحرانی قرار می گیرد، سپس فرضیه اچ 0 رد و قبول فرضیه اچیکی . با این حال، در انجام این کار، باید درک کرد که در اینجا می توانید یک خطای نوع 1 با احتمال a ایجاد کنید. اگر ک obsدر حوزه پذیرش فرضیه قرار می گیرد - پس دلیلی برای رد فرضیه صفر وجود ندارد اچ 0 . اما این اصلا به این معنی نیست اچ 0 تنها فرضیه معتبر است: فقط اختلاف بین داده های نمونه و فرضیه اچ 0 کوچک است؛ با این حال، فرضیه های دیگر ممکن است دارای همان ویژگی باشند.

با قدرت ملاکاحتمال رد فرضیه صفر در صورت درست بودن فرضیه جایگزین است. آن ها قدرت معیار 1-b است، جایی که b احتمال خطای نوع 2 است. اجازه دهید سطح معینی از اهمیت a برای آزمون فرضیه اتخاذ شود و نمونه اندازه ثابتی دارد. از آنجایی که در انتخاب منطقه بحرانی دلبخواهی خاصی وجود دارد، توصیه می شود آن را به گونه ای ساخته شود که قدرت معیار حداکثر باشد یا احتمال خطای نوع 2 حداقل باشد.

معیارهای مورد استفاده برای آزمون فرضیه ها در مورد پارامترهای توزیع نامیده می شوند معیارهای اهمیت. به طور خاص، ساخت منطقه بحرانی شبیه به ساخت فاصله اطمینان است. معیارهای مورد استفاده برای آزمون توافق بین توزیع نمونه و توزیع نظری فرضی نامیده می شوند معیارهای رضایت.

می توانید از این فرم جستجو برای یافتن کار مناسب استفاده کنید. اگر می دانید یک کلمه، یک عبارت از کار یا شماره آن را وارد کنید.


فقط در این بخش جستجو کنید


فواصل اطمینان: فهرست راه حل های مشکل

فواصل اطمینان: نظریه و مسائل

درک فواصل اطمینان

اجازه دهید به طور خلاصه مفهوم فاصله اطمینان را معرفی کنیم که
1) برخی از پارامترهای یک نمونه عددی را مستقیماً از داده های خود نمونه تخمین می زند.
2) مقدار این پارامتر را با احتمال γ پوشش می دهد.

فاصله اطمینانبرای پارامتر ایکس(با احتمال γ) فاصله ای از شکل نامیده می شود، به طوری که ، و مقادیر به نوعی از نمونه محاسبه می شوند.

معمولاً در مسائل کاربردی، احتمال اطمینان برابر با γ = 0.9 در نظر گرفته می شود. 0.95; 0.99.

نمونه ای از اندازه n را در نظر بگیرید که از جمعیت عمومی تهیه شده است و احتمالاً طبق قانون توزیع نرمال توزیع شده است. اجازه دهید نشان دهیم با چه فرمول هایی یافت می شود فواصل اطمینان برای پارامترهای توزیع- انتظار و پراکندگی ریاضی (انحراف معیار).

فاصله اطمینان برای انتظارات ریاضی

مورد 1واریانس توزیع شناخته شده و برابر است. سپس فاصله اطمینان برای پارامتر آبه نظر می رسد:
تیاز جدول توزیع لاپلاس با نسبت تعیین می شود

مورد 2واریانس توزیع ناشناخته است؛ یک برآورد نقطه ای از واریانس از نمونه محاسبه شد. سپس فاصله اطمینان برای پارامتر آبه نظر می رسد:
، جایی که میانگین نمونه از نمونه، پارامتر محاسبه می شود تیاز جدول توزیع دانش آموز تعیین می شود

مثال.بر اساس داده های 7 اندازه گیری با یک مقدار معین، میانگین نتایج اندازه گیری برابر با 30 و واریانس نمونه برابر با 36 به دست آمد. مرزهایی را که در آنها مقدار واقعی مقدار اندازه گیری شده وجود دارد با پایایی 0.99 بیابید. .

راه حل.بیایید پیدا کنیم . سپس محدودیت های اطمینان برای بازه حاوی مقدار واقعی مقدار اندازه گیری شده را می توان با فرمول پیدا کرد:
، جایی که میانگین نمونه است، واریانس نمونه است. با وصل کردن تمام مقادیر، دریافت می کنیم:

فاصله اطمینان برای واریانس

ما معتقدیم که، به طور کلی، انتظارات ریاضی ناشناخته است، و تنها یک تخمین بی‌طرفانه نقطه‌ای از واریانس شناخته شده است. سپس فاصله اطمینان به نظر می رسد:
، جایی که - کمیت های توزیع تعیین شده از جداول.

مثال.بر اساس داده های 7 کارآزمایی، مقدار برآورد برای انحراف معیار پیدا شد s=12. با احتمال 0.9 عرض فاصله اطمینان ساخته شده برای تخمین واریانس را بیابید.

راه حل. فاصله اطمینانبرای یک واریانس جمعیت ناشناخته را می توان با فرمول پیدا کرد:

جایگزین کنید و دریافت کنید:


سپس عرض فاصله اطمینان 465.589-71.708=393.881 است.

فاصله اطمینان برای احتمال (درصد)

مورد 1بگذارید حجم نمونه و کسر نمونه (فرکانس نسبی) در مسئله مشخص باشد. سپس فاصله اطمینان برای کسر عمومی (احتمال واقعی) برابر است با:
، جایی که پارامتر تیاز جدول توزیع لاپلاس با نسبت تعیین می شود.

مورد 2اگر مسئله علاوه بر این اندازه کل جامعه ای را که نمونه از آن گرفته شده است بداند، فاصله اطمینان برای کسر عمومی (احتمال واقعی) را می توان با استفاده از فرمول تنظیم شده پیدا کرد:
.

مثال.مشخص است که مرزهایی را که در آن سهم کلی با احتمال منعقد می شود، بیابید.

راه حل.ما از فرمول استفاده می کنیم:

بیایید پارامتر را از شرط پیدا کنیم ، جایگزین را در فرمول دریافت می کنیم:


می توانید نمونه های دیگری از مسائل مربوط به آمار ریاضی را در صفحه پیدا کنید

در آمار، دو نوع تخمین وجود دارد: نقطه ای و فاصله ای. تخمین نقطه اییک آماره نمونه است که برای تخمین پارامتر جامعه استفاده می شود. به عنوان مثال، میانگین نمونه یک تخمین نقطه ای از میانگین جامعه و واریانس نمونه است S2- برآورد نقطه ای واریانس جمعیت σ2. نشان داده شد که میانگین نمونه برآوردی بی طرفانه از انتظارات جامعه است. میانگین نمونه بی طرف نامیده می شود زیرا میانگین تمام نمونه ها به معنای (با حجم نمونه یکسان است n) برابر با انتظارات ریاضی عموم مردم است.

به منظور واریانس نمونه S2به یک برآوردگر بی طرفانه واریانس جمعیت تبدیل شد σ2، مخرج واریانس نمونه باید برابر باشد n – 1 ، اما نه n. به عبارت دیگر، واریانس جامعه، میانگین تمام واریانس های نمونه ممکن است.

هنگام تخمین پارامترهای جمعیت باید در نظر داشت که آمارهای نمونه مانند ، به نمونه های خاصی بستگی دارد. برای در نظر گرفتن این واقعیت، به دست آوردن تخمین فاصلهانتظارات ریاضی جمعیت عمومی توزیع میانگین های نمونه را تجزیه و تحلیل می کند (برای جزئیات بیشتر، نگاه کنید به). فاصله ساخته شده با یک سطح اطمینان مشخص مشخص می شود، که احتمال برآورد صحیح پارامتر واقعی جمعیت عمومی است. از فواصل اطمینان مشابهی می توان برای تخمین نسبت یک ویژگی استفاده کرد آرو توده اصلی توزیع شده از جمعیت عمومی.

دانلود یادداشت به صورت یا فرمت، نمونه ها در قالب

ساخت یک فاصله اطمینان برای انتظارات ریاضی جمعیت عمومی با یک انحراف معیار شناخته شده

ایجاد فاصله اطمینان برای نسبت یک صفت در جمعیت عمومی

در این بخش مفهوم فاصله اطمینان به داده های طبقه بندی شده تعمیم داده شده است. این به شما امکان می دهد سهم این صفت را در جمعیت عمومی تخمین بزنید آربا سهم نمونه آراس= X/n. همانطور که گفته شد، اگر مقادیر nآرو n(1 - p)از عدد 5 بیشتر شود، توزیع دوجمله ای را می توان با یک نرمال تقریب زد. بنابراین، برای تخمین سهم یک صفت در جمعیت عمومی آرمی توان بازه ای ساخت که سطح اطمینان آن برابر است (1 - α)x100%.


جایی که پاس- سهم نمونه از ویژگی، برابر با ایکس/n، یعنی تعداد موفقیت ها تقسیم بر حجم نمونه، آر- سهم این صفت در جمعیت عمومی، زارزش بحرانی استاندارد شده است توزیع نرمال, n- اندازهی نمونه.

مثال 3فرض کنید نمونه ای از سیستم اطلاعاتی استخراج شده است که شامل 100 فاکتور تکمیل شده در ماه گذشته است. فرض کنید 10 مورد از این فاکتورها نادرست است. به این ترتیب، آر= 10/100 = 0.1. سطح اطمینان 95% مربوط به مقدار بحرانی Z = 1.96 است.

بنابراین، 95 درصد احتمال دارد که بین 4.12 تا 15.88 درصد فاکتورها دارای خطا باشند.

برای یک حجم نمونه معین، به نظر می رسد فاصله اطمینان حاوی نسبت صفت در جامعه گسترده تر از یک نمونه پیوسته باشد. متغیر تصادفی. این به این دلیل است که اندازه گیری یک متغیر تصادفی پیوسته حاوی اطلاعات بیشتری نسبت به اندازه گیری داده های طبقه بندی است. به عبارت دیگر، داده‌های طبقه‌بندی که فقط دو مقدار می‌گیرند، حاوی اطلاعات کافی برای تخمین پارامترهای توزیع آنها نیستند.

ATمحاسبه برآوردهای حاصل از یک جمعیت محدود

برآورد انتظارات ریاضی.ضریب تصحیح برای جمعیت نهایی ( fpc) برای کاهش خطای استاندارد با ضریب استفاده شد. هنگام محاسبه فواصل اطمینان برای برآورد پارامترهای جمعیت، یک ضریب تصحیح در شرایطی که نمونه‌ها بدون جایگزینی کشیده می‌شوند، اعمال می‌شود. بنابراین، فاصله اطمینان برای انتظارات ریاضی، با داشتن سطح اطمینان برابر است (1 - α)x100%، با فرمول محاسبه می شود:

مثال 4برای نشان دادن کاربرد یک ضریب تصحیح برای یک جمعیت محدود، اجازه دهید به مسئله محاسبه فاصله اطمینان برای میانگین مقدار فاکتورهایی که در مثال 3 در بالا بحث شد، برگردیم. فرض کنید یک شرکت 5000 فاکتور در ماه صادر می کند، ایکس= 110.27 دلار، اس= 28.95 دلار ن = 5000, n = 100, α = 0.05، t99 = 1.9842. با توجه به فرمول (6) بدست می آوریم:

تخمین سهم ویژگیهنگام انتخاب بدون بازگشت، فاصله اطمینان برای نسبت ویژگی که دارای سطح اطمینان برابر است (1 - α)x100%، با فرمول محاسبه می شود:

فواصل اطمینان و مسائل اخلاقی

هنگام نمونه‌گیری از یک جامعه و فرمول‌بندی استنباط‌های آماری، اغلب مشکلات اخلاقی به وجود می‌آیند. نکته اصلی این است که فواصل اطمینان و تخمین نقطه ای آمار نمونه چگونه مطابقت دارند. تخمین های نقطه انتشار بدون تعیین فواصل اطمینان مناسب (معمولاً در سطح اطمینان 95٪) و حجم نمونه که از آن استخراج می شود، می تواند گمراه کننده باشد. این ممکن است به کاربر این تصور را بدهد که تخمین نقطه ای دقیقاً همان چیزی است که او برای پیش بینی ویژگی های کل جمعیت به آن نیاز دارد. بنابراین، درک این نکته ضروری است که در هر تحقیقی، تخمین های نه نقطه ای، بلکه فاصله ای باید در اولویت قرار گیرد. علاوه بر این، باید به انتخاب صحیح اندازه های نمونه توجه ویژه ای شود.

بیشتر اوقات، اهداف دستکاری های آماری نتایج بررسی های جامعه شناختی از جمعیت در مورد موضوعات مختلف سیاسی است. در همان زمان، نتایج نظرسنجی در صفحه اول روزنامه ها قرار می گیرد و خطای نمونه گیری و روش تجزیه و تحلیل آماری در جایی در وسط چاپ می شود. برای اثبات اعتبار برآوردهای نقطه‌ای به‌دست‌آمده، باید حجم نمونه بر اساس آن، مرزهای فاصله اطمینان و سطح معنی‌داری آن مشخص شود.

یادداشت بعدی

از مطالب کتاب لوین و همکاران آمار برای مدیران استفاده شده است. - م.: ویلیامز، 2004. - ص. 448-462

تئوری حد مرکزیبیان می کند که با توجه به حجم نمونه به اندازه کافی بزرگ، توزیع نمونه میانگین ها را می توان با یک توزیع نرمال تقریب زد. این ویژگی به نوع توزیع جمعیت بستگی ندارد.

در اینجا، میانگین به عنوان یک عدد ثابت شناخته شده در نظر گرفته می شود و واریانس به عنوان یک پارامتر مجهول عمل می کند. بگذاریم

از آنجا که --، دارای توزیع نرمال استاندارد است. بنابراین، تابع دارای یک توزیع - با درجات آزادی است که به هیچ وجه به پارامتر ناشناخته بستگی ندارد. نشان دادن از طریق چندک های این توزیع و تثبیت برخی، به گونه ای که ، به نابرابری می رسیم

که با احتمال تحقق می یابد . فاصله اطمینان را از کجا بدست آوریم:

فاصله اطمینان برای واریانس با میانگین مجهول

توجه داشته باشید که تابع به گونه ای تعریف شده است که برای یک نمونه معین، مقادیر آن فقط به پارامتر بستگی دارد. در مورد توزیع متغیر تصادفی ، سپس با قضیه فیشر (نگاه کنید به 8.3) این یک توزیع - با درجات آزادی است و بنابراین به پارامترهای مجهول بستگی ندارد. رفع به گونه ای که ، و با استدلال مانند (47)، به فاصله اطمینان زیر می رسیم:

که با استفاده از نماد (30) می توان آن را بازنویسی کرد

فاصله اطمینان برای میانگین با واریانس ناشناخته

همانطور که در پاراگراف قبل، هر دو پارامتر ناشناخته فرض می شوند، در حالی که یک پارامتر مزاحم هستند. طبق قضیه فیشر

و

مستقل هستند و به ترتیب دارای توزیع u-توزیع با درجات آزادی هستند. بنابراین، نسبت

دارای توزیع دانشجویی با درجه آزادی است. بیایید یک تابع را انتخاب کنیم برابر با سمت راست (48):

واریانس نمونه با فرمول (30) کجاست. تابع به طور واضح به پارامتر تداخلی بستگی ندارد. با نشان دادن چندک توزیع Student با درجه آزادی، نابرابری را دریافت می کنیم

با احتمال انجام شد از اینجا فاصله اطمینان برای:

از آنجایی که توزیع Student متقارن است، با گزاره 3.3

بنابراین، فاصله اطمینان را می توان به صورت زیر نوشت

بنابراین، میانگین نمونه وسط این بازه است.

مثال 8.2

بیایید به مثال 6.4 نگاه کنیم. فرض کنیدکه هر یک از نمونه ها از آن گرفته شده است طبیعیتوزیع با ناشناسپارامترها - و به ترتیب. (ما در مورد مبنایی که می توان بر اساس آن این فرض را انجام داد بعداً در 9.5 صحبت خواهیم کرد.)

هدف ما یافتن فواصل اطمینان برای و محتوای کربن نظری و استحکام کششی فولاد GS50 است. به یاد بیاورید که حجم هر یک از نمونه ها. فرض کنید یک احتمال اطمینان نزدیک به وحدت را ثابت کنیم. با توجه به جدول توزیع Student در صفحه، تقریباً آن را تعیین می کنیم. با یادآوری مقادیر موجود در مثال 6.5 در صفحه، ما محاسبه می کنیم

و با استفاده از فرمول (49)، فاصله اطمینان - درصد را بدست می آوریم محتوای کربن

و - فاصله اطمینان برای مقدار استحکام کششی

کار آزمایشگاهی №12. مبانی نظریه ارزیابی

آمارگیر با داده های موضوعی با تغییرات تصادفی سروکار دارد. رفتار آنها با قانون توزیع احتمال مشخص مشخص می شود. چنین قانونی، به عنوان یک قاعده، حاوی مقادیر ناشناخته است که به عنوان پارامترهای قانون در نظر گرفته می شود. با توجه به تنوع تصادفی داده های مشاهده شده، بر اساس آنها نمی توان مقدار کاملا دقیق پارامترها را نشان داد. ما باید فقط به مقادیر تقریبی بسنده کنیم. بنابراین، یک آماردان ریاضی با کمیت‌های زیر کار می‌کند: - یک متغیر تصادفی که هرگز مشاهده نمی‌کند، اما آن را «روح» داده‌هایی می‌داند که مطالعه می‌کند، دلیلی که آنها را به وجود آورده است. این مقدار توسط برخی از پارامترها تعیین می شود. - داده های مورد مطالعه که به عنوان تحقق یک متغیر تصادفی به دست می آیند. به عنوان مثال، متغیر تصادفی زمان دقیق است. پیاده سازی های آن قرائت ساعت در دسترس برای آمار هستند. وظیفه یک آمارشناس این است که با استفاده از قرائت های n ساعت t 1 ,...,t n , زمان را تا حد امکان دقیق تنظیم کند. علاوه بر این، او موظف است دقت مقدار تنظیم شده را مشخص کند. مقدار مورد نظر را به شکل t = t 0 + ξ(a, σ) ارزیابی می کند، که در آن t 0 زمان واقعی در زمان مطالعه است، ξ(a, σ) یک متغیر تصادفی است که انحراف از مقدار واقعی را مشخص می کند. مقدار، t 0، a، σ - پارامترها، مقدار ξ با قانون توزیع مشخص می شود، احتمالاتی که مقادیر متفاوتی را می گیرد. تخمین در آمار قاعده ای برای محاسبه مقدار تقریبی یک پارامتر بر اساس داده های مشاهده شده است. تخمین مقدار تقریبی یک پارامتر است که از داده های مشاهده شده یافت می شود. هنگام ساخت تخمین ها برای استفاده عملی، سه شرط اصلی برای برآورد وجود دارد:

    دقت، یعنی نزدیکی به مقدار واقعی پارامتر، در مثال ξ(a,σ) باید کوچک باشد.

    بی طرفی، یعنی شرطی که انتظار برآورد برابر با مقدار واقعی پارامتر باشد، در مثال ξ(a,σ) باید به طور متوسط ​​صفر باشد.

    سازگاری، یعنی این شرط که با افزایش تعداد مشاهدات، برآورد به احتمال زیاد به مقدار واقعی پارامتر همگرا شود. در مثال، برای تعداد زیادی ساعت n، مقدار ξ(a,σ) باید به سمت صفر با احتمال گرایش به یک گرایش داشته باشد.

بهترین تخمین از همه لحاظ وجود ندارد. به عنوان مثال، میانگین حسابی، یک تخمین به طور گسترده پذیرفته شده از میانگین یک متغیر تصادفی، دارای خاصیت بهینه برای داده های توزیع شده عادی است. با این حال، اگر در میان داده‌ها مقادیر پرت وجود داشته باشد، به خطا منجر می‌شود. چنین گازهای گلخانه ای در اقتصاد به دلیل اشتباهات فاحش در اندازه گیری ها یا اشتباهات تایپی ایجاد می شود که در آن نقطه بین روبل و کوپک می تواند ناپدید شود و دستمزدها صد برابر افزایش یابد. اجازه دهید یک فرآیند تصادفی مرتبط با تاریخچه ترسیم مرزهای دقیق دارایی های آن در سراسر جهان را در نقشه بریتانیا در نظر بگیریم. مشخص است که هر نقطه روی زمین با دو مختصات مشخص می شود - طول و عرض جغرافیایی. امروزه هر دانش آموزی در مورد ابزارهای ماهواره ای شنیده است که هر نقطه روی زمین را با دقت تا یک متر تنظیم می کند. با این حال، در آن روزها، حتی چنین ابزاری به ملوانان کمک نمی کرد، زیرا حتی یک ماهواره "مرجع" را در آسمان پیدا نمی کرد. عرض جغرافیایی مستقیماً از ارتفاع لامپ های بالای افق با استفاده از دستگاه "sextan"، شبیه به تئودولیت مدرن (spyglass به اضافه یک زاویه سنج) تعیین شد. طول جغرافیایی زاویه چرخش کره زمین است که در آن نصف النهار محلی و نصف النهار گرینویچ انتخاب شده به عنوان صفر مشروط با هم ترکیب می شوند. زمین تقریباً در یک روز 360 درجه می‌چرخد، یعنی در یک ساعت 15 درجه و در 4 دقیقه یک درجه می‌چرخد. برای تعیین طول جغرافیایی، باید دقیقا زمان محلی و گرینویچ را بدانید. اگر ناوبر به کاپیتان بگوید: "ظهر محلی، آقا" و کاپیتان زمان آن لحظه در گرینویچ را بداند، اختلاف زمانی تقسیم بر 4 دقیقه طول جغرافیایی منطقه را بر حسب درجه تعیین می کند. امروز، همه چیز ساده خواهد بود - با گرینویچ تماس بگیرید و زمان آنها را بدانید. اما در آن زمان رادیو هنوز اختراع نشده بود. اگر کشتی دارای یک ساعت کوارتز بود که کسری از دقیقه در سال حرکت می کرد، مشکلی نیز وجود نداشت، اما بهترین زمان سنج هایی که در آن زمان وجود داشتند، دقت لازم برای اندازه گیری طول جغرافیایی را ارائه نمی کردند. برای چندین ماه قایقرانی، آنها زمان دقیق را ده ها دقیقه ترک کردند. و هنگامی که در سال 1831، کشتی "بیگل" برای ترسیم نقشه ها به سفری دور دنیا رفت، ناخدای کشتی، فیتز روی، مردی روشنفکر و دانشمند، 24 (!) کرنومتر دریایی را با خود برد. هر کرنومتر "زمان گرینویچ" خود را نشان می داد. در این مطالعه، یک متغیر تصادفی لحظه ای است که ناوبر با استفاده از یک جرم آسمانی، زمان دقیق محلی را تعیین می کند. "روح" متغیر تصادفی اندازه گیری شده زمان واقعی در گرینویچ در آن لحظه است. این مقدار را با ξ نشان می دهیم. ارزش این مقدار هرگز مشخص نیست. مقادیر مشاهده شده از یک متغیر تصادفی، قرائت کرنومترهای (متفاوت) است. هر یک از آنها تا حدودی اشتباه می کردند، اما به طور کلی آنها از "روح" رایج پیروی می کردند و خطای تصادفی خود را به آن تحمیل می کردند. برآورد متغیر تصادفی GMT ​​است که کاپیتان از داده های مشاهده شده در نظر گرفته است. فرض کنید متغیرهای تصادفی x i , i = 1,...,n تحقق یک متغیر تصادفی ξ باشند، یعنی توزیع یکسانی دارند (یک "روح") و برای هر i میانگین مقدار قرائت ها برابر است. به همان عدد: Е( x i) = Е(ξ). معنای این عبارت چنین است: همه ساعت ها نمی توانند به اتفاق آرا به دلیل مشکلات طراحی عقب بیفتند یا عجله کنند. به طور متوسط، به همان اندازه احتمال دارد که عجله داشته باشند یا عقب باشند. همچنین اجازه دهید مستقل باشند. به عبارت دیگر، آنها هیچ نقطه اشتراکی در گروه ها ندارند. بنابراین، ملوانی که خوانش های ساعت را ضبط می کند، می تواند آنها را در یک دنباله ضبط کند. سپس آخرین قرائت ها یک دقیقه دیرتر از اول ضبط می شود. یا می توانند چندین ساعت در یک مکان گرم آویزان شوند و از گرما با هم عجله کنند. این فرض که چنین پدیده ای وجود ندارد با شرط استقلال نشانه ها در آزمایشات مختلف مطابقت دارد. ساده‌ترین مشکل تخمینی، تعیین احتمال وقوع یک رویداد است، برای مثال، اینکه یک سکه واقعی (نه لزوما درست) رو به پایین بیفتد. تقریباً هرگز نمی توان مستقیماً احتمال یک رویداد را تعیین کرد. هیچ روش جهانی وجود ندارد که به یک رویداد دلخواه اجازه دهد تا احتمال آن را نشان دهد. تخمین احتمال یک رویداد A ممکن است اگر امکان انجام آزمایش‌های مکرر مستقلی وجود داشته باشد که در طی آن این رویداد با احتمال ثابت رخ دهد. فرض کنید در هر یک از n کارآزمایی احتمال p=P(A) رویداد A بدون تغییر باقی بماند و نتیجه هر آزمایش مستقل از بقیه باشد. تعداد تصادفی از آن آزمایش‌ها را با m نشان می‌دهیم از مجموع n که رویداد A رخ داده است. می‌گویند m تعداد «موفقیت‌ها» در n آزمایش برنولی است. طبق تعریف آماری احتمال، برای n بزرگ، فرکانس نسبی m / n رویداد A تقریبا برابر با احتمال وقوع رویداد A است، یعنی m / n ~ p، جایی که p \u003d P (آ). اجازه دهید ثابت کنیم که این از بدیهیات کلموگروف نتیجه می گیرد. در تجزیه و تحلیل ریاضی، یک مفهوم دقیق از حد یک دنباله استفاده می شود: برای تعداد کافی از یک عضو دنباله، مقدار آن را می توان به طور دلخواه نزدیک به مقدار حدی ساخت. چنین تعریفی با زندگی واقعی مطابقت ندارد، جایی که رویدادهای کاملاً باورنکردنی به ندرت رخ می دهند. به عنوان مثال، از سوپ آشفته اولیه، یک باکتری ظاهر می شود که قادر به تولید مثل خود است. یا ماهی چیزی می آفریند که در ابتدا میلیون ها سال به آن نیازی ندارد (اما رشد می کند) و سپس تبدیل به بال می شود. یا کل شهر (یا کشور) زیر آب می رود. در نظریه احتمال، مفهوم حد به معنایی متفاوت از آنچه در آنالیز ریاضی به آن وارد می شود، تفسیر می شود. تعریف نظریه احتمال به زندگی نزدیکتر است. این واقعیت را منع نمی کند که در نقطه ای از دنباله عددی وجود داشته باشد که به شدت با بقیه متفاوت است. دنباله ای از متغیرهای تصادفی u n در احتمال به p همگرا می شود اگر برای هر عدد ε > 0 احتمال مدول اختلاف |u n - p| همانطور که n → ∞ کمتر از ε تمایل به وحدت دارد:

در نظریه احتمال، هیچ رویدادی قطعی نیست، بلکه رویداد: |u n - p| ≤ ε برای n به اندازه کافی بزرگ تقریباً قطعی است. اجازه دهید نابرابری چبیشف را ثابت کنیم. فرض کنید ξ یک متغیر تصادفی با انتظار ریاضی E(ξ) = a و واریانس D(ξ) = σ² باشد، ε عددی مثبت است. سپس احتمال یک رویداد متشکل از این واقعیت است که یک متغیر تصادفی متمرکز (E (ξ) - a) و نرمال شده از ε کمتر از ε-2 تجاوز کند:

در واقع، σ² = E(ξ - a)². هنگام محاسبه میانگین در سمت راست، دو محدوده از مقادیر ξ را انتخاب می کنیم. برای آنهایی که |ξ - a|< εσ, сумма (или интеграл) соответствующих произведений неотрицателен. Для тех ξ, у которых |ξ - а| >εσ، مجموع (یا انتگرال):

یک مورد خاص جالب: σ = 0. علاوه بر این، واضح است که |ξ - a| = 0، یعنی ξ = a. اجازه دهید قضیه چبیشف را اثبات کنیم. فرض کنید х 1 ,...,х n متغیرهای تصادفی مستقل با توزیع یکسان با انتظارات و واریانس ریاضی باشند. یعنی هر x i تحقق یک متغیر تصادفی ξ است و E(ξ) = E(x i) = a، D(ξ) = D(x i) = σ². سپس برای هر ε > 0:

اثبات پراکندگی میانگین حسابی:

یک متغیر تصادفی η n را در نظر بگیرید که میانگین حسابی n مشاهدات است. میانگین و واریانس آن . تحقق های مشاهده شده η n هستند. مطابق با نابرابری چبیشف برای متغیر تصادفی ηn، احتمال انحراف آن از مقدار میانگین به میزانی بیشتر از به صفر میل می کند:

احتمال رویداد مخالف برای n بزرگ به 1 تمایل دارد: P(|η n - a|) → 1. بنابراین، دنباله متغیرهای تصادفی n در احتمال به a همگرا می شود. بیایید به اندازه گیری زمان در بیگل برگردیم. قرائت هر کرنومتر x i , i = 1,...,n اندازه گیری مستقل از سایر ابزارها است. قابل درک است که طراحی کرنومتر به گونه ای است که هیچ خطای سیستماتیک در عملکرد آن وجود ندارد. این بدان معناست که برخی از نمونه‌های کرونومتر می‌توانند "پیش بروند"، برخی دیگر "عقب می‌افتند"، اما این خطاها تصادفی هستند و با ساخت این نمونه مرتبط هستند. از نظر ریاضی، این بدان معنی است که میانگین زمان درست است. کیفیت طراحی و تکنولوژی ساخت کرنومترها با میزان دقت حرکت همه محصولات به طور کلی مشخص می شود. از نظر ریاضی، این با گسترش خوانش ابزارهای فردی بیان می شود، یعنی. پراکندگی متغیرهای تصادفی x i. واریانس میانگین n = 24 برابر کوچکتر از واریانس یک کرنومتر منفرد است. بنابراین، "میانگین زمان" تعیین شده توسط 24 کرنومتر به طور متوسط ​​تقریباً 5 برابر از زمان هر کرنومتر منفرد به زمان واقعی نزدیکتر است.

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...