برآورد انتظارات ریاضی و واریانس برای نمونه. تخمین نقطه ای از انتظارات ریاضی

بگذارید یک متغیر تصادفی وجود داشته باشد ایکسبا انتظارات ریاضی مترو پراکندگی D، در حالی که هر دوی این پارامترها ناشناخته هستند. بیش از قدر ایکستولید شده نآزمایش های مستقل، که منجر به مجموعه ای از ننتایج عددی x 1، x 2، …، x N. به عنوان یک تخمین انتظارات ریاضیطبیعی است که میانگین حسابی مقادیر مشاهده شده را پیشنهاد کنیم

(1)

اینجا به عنوان x iمقادیر خاص (اعداد) به دست آمده در نتیجه نآزمایش. اگر دیگران را بگیریم (مستقل از موارد قبلی) نآزمایشات، پس بدیهی است که مقدار متفاوتی دریافت خواهیم کرد. اگر بیشتر مصرف کنید نآزمایش‌ها، یک مقدار جدید دیگر دریافت خواهیم کرد. با نشان دادن X iمتغیر تصادفی ناشی از منآزمایش، سپس تحقق X iاعداد به دست آمده در نتیجه این آزمایش ها خواهد بود. بدیهی است که متغیر تصادفی X iچگالی توزیع احتمال مشابه با متغیر تصادفی اصلی را خواهد داشت ایکس. ما همچنین فرض می کنیم که متغیرهای تصادفی هستند X iو Xjمستقل هستند در من، نا برابر j(آزمایش های مختلف مستقل نسبت به یکدیگر). بنابراین، فرمول (1) را به شکلی متفاوت (آماری) بازنویسی می کنیم:

(2)

اجازه دهید نشان دهیم که برآورد بی طرفانه است:

بنابراین، انتظار ریاضی از میانگین نمونه برابر است با انتظارات ریاضی واقعی متغیر تصادفی. متر. این یک واقعیت نسبتا قابل پیش بینی و قابل درک است. بنابراین، میانگین نمونه (2) را می توان به عنوان تخمینی از انتظارات ریاضی یک متغیر تصادفی در نظر گرفت. حال این سوال مطرح می‌شود: با افزایش تعداد آزمایش‌ها برای واریانس برآورد انتظارات چه اتفاقی می‌افتد؟ محاسبات تحلیلی نشان می دهد که

واریانس تخمین انتظار ریاضی (2) کجاست و D- واریانس واقعی متغیر تصادفی ایکس.

از مطالب فوق چنین بر می آید که با افزایش ن(تعداد آزمایش) واریانس تخمین کاهش می یابد، یعنی. هرچه بیشتر پیاده‌سازی‌های مستقل را خلاصه کنیم، به مقدار مورد انتظار نزدیک‌تر می‌شویم.


برآوردهای واریانس ریاضی

در نگاه اول، طبیعی ترین تخمین به نظر می رسد

(3)

که با فرمول (2) محاسبه می شود. بیایید بررسی کنیم که آیا برآورد بی طرفانه است یا خیر. فرمول (3) را می توان به صورت زیر نوشت:

عبارت (2) را با این فرمول جایگزین می کنیم:

بیایید انتظار ریاضی برآورد واریانس را پیدا کنیم:

(4)

از آنجایی که واریانس یک متغیر تصادفی به میزان انتظار ریاضی متغیر تصادفی بستگی ندارد، انتظار ریاضی را برابر با 0 می گیریم، یعنی. متر = 0.

(5)
در .(6)

یک متغیر تصادفی X وجود داشته باشد و پارامترهای آن انتظار ریاضی باشد آو واریانس ناشناخته است. بیش از مقدار X، آزمایش های مستقل انجام شد که نتایج x 1، x 2، x n را به دست آورد.

بدون کاهش کلیت استدلال، این مقادیر متغیر تصادفی را متفاوت در نظر می گیریم. ما مقادیر x 1، x 2، x n را به عنوان متغیرهای تصادفی مستقل و با توزیع یکسان X 1، X 2، X n در نظر خواهیم گرفت.

ساده ترین روشتخمین آماری - روش جایگزینی و قیاس - شامل این واقعیت است که به عنوان ارزیابی یک مشخصه عددی خاص (میانگین، واریانس و غیره) جمعیتمشخصه مربوط به توزیع نمونه - مشخصه نمونه را بگیرید.

با روش جایگزینی به عنوان تخمینی از انتظارات ریاضی آلازم است انتظارات ریاضی توزیع نمونه را در نظر بگیریم - میانگین نمونه. بنابراین، ما دریافت می کنیم

برای آزمایش بی طرفی و سازگاری میانگین نمونه به عنوان برآورد آ، این آمار را تابعی از بردار انتخابی (X 1, X 2, X n) در نظر بگیرید. با در نظر گرفتن اینکه هر یک از کمیت های X 1، X 2، X n قانون توزیع یکسانی با کمیت X دارند، نتیجه می گیریم که ویژگی های عددی این کمیت ها و کمیت X یکسان است: M(X من) = M(X) = آ، D(X من) = D(X) = , من = 1، 2، n , که در آن X i مجموعاً متغیرهای تصادفی مستقل هستند.

در نتیجه،

از این رو، طبق تعریف، به دست می آوریم که برآورد بی طرفانه است آو از آنجایی که D()®0 به عنوان n®¥ است، پس بر اساس قضیه پاراگراف قبلی یک برآورد ثابت از انتظار است آجمعیت عمومی

کارایی یا ناکارآمدی تخمین به شکل قانون توزیع متغیر تصادفی X بستگی دارد. می توان ثابت کرد که اگر مقدار X طبق قانون عادی توزیع شود، تخمین کارآمد است. برای سایر قوانین توزیع، ممکن است اینطور نباشد.

برآورد بی طرفانه از واریانس عمومیواریانس نمونه اصلاح شده است

,

زیرا ، واریانس کلی کجاست. واقعا،

تخمین s -- 2 برای واریانس کلی نیز سازگار است، اما کارآمد نیست. با این حال، در مورد توزیع نرمال، "به طور مجانبی کارآمد" است، یعنی، با افزایش n، نسبت واریانس آن به حداقل یک ممکن به طور نامحدود نزدیک می شود.

بنابراین، با توجه به یک نمونه از توزیع F( ایکس) متغیر تصادفی X با انتظار ریاضی ناشناخته آو پراکندگی، سپس برای محاسبه مقادیر این پارامترها، حق استفاده از فرمول های تقریبی زیر را داریم:

آ ,

.

اینجا x-i- - گزینه های نمونه برداری، گزینه های n-i-- فرکانس x i، - - اندازهی نمونه.
برای محاسبه واریانس نمونه اصلاح شده، فرمول راحت تر است


.

برای ساده کردن محاسبه، بهتر است به گزینه های مشروط بروید (همانطور که گرفتن آن سودمند است نسخه اصلی، در وسط فاصله قرار دارد سری تغییرات). سپس

, .

تخمین فاصله

در بالا، ما سوال تخمین یک پارامتر ناشناخته را در نظر گرفتیم آیک عدد. ما چنین برآوردهایی را تخمین نقطه ای نامیدیم. آنها این عیب را دارند که با حجم نمونه کوچک، می توانند به طور قابل توجهی با پارامترهای برآورد شده متفاوت باشند. بنابراین، برای دریافت ایده ای از نزدیکی بین یک پارامتر و برآورد آن، در آمار ریاضیبه اصطلاح تخمین های فاصله ای معرفی شده اند.

اجازه دهید یک تخمین نقطه ای q * در نمونه برای پارامتر q پیدا شود. معمولاً به محققان از قبل با احتمال کافی g (مثلاً 0.95؛ 0.99 یا 0.999) داده می شود، به طوری که یک رویداد با احتمال g را می توان عملاً قطعی در نظر گرفت، و آنها این سؤال را مطرح می کنند که چنین مقداری e> 0 را پیدا کنند. که

.

با اصلاح این برابری، دریافت می کنیم:

و در این صورت خواهیم گفت که فاصله ]q * - e; q * + e[ پارامتر تخمینی q را با احتمال g پوشش می دهد.

فاصله ]q * -e; q * +e [ نامیده می شود فاصله اطمینان .

احتمال g نامیده می شود قابلیت اطمینان (احتمال اطمینان) تخمین فاصله.

به پایان می رسد فاصله اطمینان، یعنی نقاط q * -e و q * +e نامیده می شوند مرزهای اعتماد .

عدد e نامیده می شود دقت ارزیابی .

به عنوان مثالی از مسئله تعیین حدود اطمینان، مسئله تخمین انتظار ریاضی یک متغیر تصادفی X را در نظر بگیرید که دارای قانون توزیع نرمال با پارامترها است. آو s، یعنی X = N( آ، س). انتظارات ریاضی در این مورد برابر است با آ. با توجه به مشاهدات X 1 , X 2 , X n میانگین را محاسبه کنید و ارزیابی پراکندگی s 2 .

به نظر می رسد که با توجه به داده های نمونه، می توان یک متغیر تصادفی ساخت

که دارای توزیع Student (یا توزیع t) با n = n -1 درجه آزادی است.

بیایید از جدول A.1.3 استفاده کنیم و برای احتمال داده شده g و عدد n عدد t g را پیدا کنیم به طوری که احتمال

P(|t(n)|< t g) = g,

.

پس از ایجاد تحولات آشکار، به دست می آوریم

روش اعمال معیار F به شرح زیر است:

1. فرضی در مورد توزیع نرمال جمعیت ها وجود دارد. در سطح معناداری معین a، فرضیه صفر H 0 فرموله می شود: s x 2 = s y 2 در مورد برابری واریانس های عمومی جمعیت های عادی تحت فرضیه رقیب H 1: s x 2 > s y 2 .

2. دو نمونه مستقل از جمعیت X و Y به ترتیب n x و n y به دست می آید.

3. مقادیر واریانس های نمونه تصحیح شده s x 2 و s y 2 را محاسبه کنید (روش های محاسبه در §13.4 بحث شده است). بزرگتر از پراکندگی (s x 2 یا s y 2) s 1 2 تعیین شده است، کوچکتر - s 2 2.

4. مقدار معیار F بر اساس فرمول F obs = s 1 2 / s 2 2 محاسبه می شود.

5. با توجه به جدول نقاط بحرانی توزیع فیشر - اسندکور، برای یک سطح اهمیت معین a و تعداد درجات آزادی n 1 \u003d n 1 - 1، n 2 \u003d n 2 - 1 (n 1 است تعداد درجات آزادی یک واریانس تصحیح شده بزرگتر)، نقطه بحرانی F cr (a, n 1, n 2) یافت می شود.

توجه داشته باشید که جدول A.1.7 مقادیر بحرانی معیار F یک طرفه را نشان می دهد. بنابراین، اگر یک معیار دو طرفه اعمال شود (H 1: s x 2 s y 2)، سپس سمت راست نقطه بحرانی F cr (a/2, n 1 , n 2) به دنبال سطح اهمیت a/2 (نصف مشخص شده) و تعداد درجات آزادی n 1 و n 2 (n 1 - تعداد درجات آزادی هستند. پراکندگی بیشتر). ممکن است نقطه بحرانی چپ دست پیدا نشود.

6. نتیجه می‌گیریم که اگر مقدار محاسبه‌شده معیار F بزرگ‌تر یا مساوی با بحرانی باشد (F obs ³ F cr)، آن‌گاه واریانس‌ها در سطح معنی‌داری معین به‌طور معنی‌داری متفاوت است. در غیر این صورت (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

وظیفه 15.1. مصرف مواد اولیه در هر واحد تولید با توجه به تکنولوژی قدیم عبارت بود از:

تکنولوژی جدید:

با فرض اینکه جمعیت های متناظر X و Y دارند توزیع های نرمال، بررسی کنید که مصرف مواد خام برای فناوری های جدید و قدیمی از نظر تغییرپذیری تفاوتی نداشته باشد، اگر سطح معنی داری a = 0.1 را در نظر بگیریم.

راه حل. ما به ترتیب ذکر شده در بالا عمل می کنیم.

1. متغیر بودن مصرف مواد خام برای فناوری های جدید و قدیمی را از نظر مقادیر پراکندگی قضاوت خواهیم کرد. بنابراین، فرضیه صفر به شکل H 0 است: s x 2 = s y 2 . به عنوان یک فرضیه رقیب، ما فرضیه H 1 را می پذیریم: s x 2 s y 2، زیرا از قبل مطمئن نیستیم که هر یک از واریانس های کلی بزرگتر از دیگری است.

2-3. واریانس های نمونه را پیدا کنید. برای ساده کردن محاسبات، اجازه دهید به گزینه های شرطی برویم:

u i = x i - 307، v i = y i - 304.

ما تمام محاسبات را در قالب جداول زیر ترتیب می دهیم:

تو من m i من تو من من تو من 2 m i (u i +1) 2 v i n من n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

کنترل: å m i u i 2 + 2å m i u i + m i = کنترل: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

واریانس های نمونه اصلاح شده را پیدا کنید:

4. واریانس ها را مقایسه کنید. نسبت واریانس اصلاح شده بزرگتر به کوچکتر را پیدا کنید:

.

5. بر اساس شرط، فرضیه رقیب به شکل s x 2 ¹ s y 2 است، بنابراین، منطقه بحرانی دو طرفه است و هنگام یافتن نقطه بحرانی، باید سطوح معناداری نصف داده شده را در نظر گرفت.

با توجه به جدول A.1.7، با سطح معناداری a/2 = 0.1/2 = 0.05 و تعداد درجات آزادی n 1 = n 1 - 1 = 12، n 2 = n 2 - 1 = 8، ما نقطه بحرانی F cr (0.05؛ 12؛ 8) = 3.28.

6. از آنجایی که F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и فناوری های نوینتایید کنید.

در بالا، هنگام آزمون فرضیه ها، فرض بر این بود که توزیع متغیرهای تصادفی مورد مطالعه نرمال است. با این حال، مطالعات ویژه نشان داده است که الگوریتم های پیشنهادی با توجه به انحراف از توزیع نرمال، بسیار پایدار هستند (به ویژه با حجم نمونه های بزرگ).

هدف از سخنرانی: معرفی مفهوم تخمین پارامتر توزیع ناشناخته و ارائه طبقه‌بندی از این تخمین‌گرها. تخمین نقطه ای و فاصله ای از انتظارات و واریانس ریاضی را بدست آورید.

در عمل، در بیشتر موارد، قانون توزیع یک متغیر تصادفی ناشناخته است و با توجه به نتایج مشاهدات
ارزیابی ویژگی های عددی (به عنوان مثال، انتظارات ریاضی، واریانس یا سایر لحظات) یا یک پارامتر ناشناخته ضروری است. ، که قانون توزیع را تعریف می کند (تراکم توزیع)
متغیر تصادفی مورد مطالعه بنابراین، برای توزیع نمایی یا پواسون، کافی است یک پارامتر را ارزیابی کنیم، و برای یک توزیع نرمال، دو پارامتر باید ارزیابی شوند - انتظارات ریاضی و واریانس.

انواع ارزیابی

مقدار تصادفی
چگالی احتمال دارد
، جایی که یک پارامتر توزیع ناشناخته است. در نتیجه آزمایش، مقادیر این متغیر تصادفی به دست آمد:
. انجام یک ارزیابی در اصل به این معنی است که مقادیر نمونه یک متغیر تصادفی باید با مقدار معینی از پارامتر مرتبط باشد. ، یعنی عملکردی از نتایج مشاهدات ایجاد کنید
، که ارزش آن به عنوان تخمین در نظر گرفته می شود پارامتر . فهرست مطالب تعداد آزمایش های انجام شده را نشان می دهد.

هر تابعی که به نتایج مشاهدات بستگی دارد نامیده می شود آمار. از آنجایی که نتایج مشاهدات متغیرهای تصادفی هستند، پس آمار نیز خواهد بود متغیر تصادفی. بنابراین، برآورد
پارامتر ناشناخته باید به عنوان یک متغیر تصادفی در نظر گرفته شود و مقدار آن از داده های تجربی بر حسب حجم محاسبه شود , – به عنوان یکی از مقادیر ممکن این متغیر تصادفی.

برآورد پارامترهای توزیع (مشخصات عددی یک متغیر تصادفی) به نقطه و فاصله تقسیم می شود. تخمین نقطه ایپارامتر با یک عدد تعیین می شود ، و دقت آن با واریانس برآورد مشخص می شود. تخمین فاصلهبرآورد نامیده می شود که با دو عدد تعیین می شود و - در انتهای بازه ای که پارامتر تخمین زده شده را پوشش می دهد با سطح اطمینان معین

طبقه بندی تخمین نقطه ای

برای تخمین نقطه ای یک پارامتر ناشناخته
از نظر دقت بهترین است، باید سازگار، بی‌طرفانه و کارآمد باشد.

ثروتمندنمره نامیده می شود
پارامتر ، اگر از نظر احتمال به پارامتر تخمینی همگرا شود، یعنی.

. (8.8)

بر اساس نابرابری چبیشف می توان نشان داد که شرایط کافیرابطه (8.8) برابری است

.

سازگاری یک مشخصه مجانبی از برآورد برای است
.

بی طرفانهنمره نامیده می شود
(تخمین بدون خطای سیستماتیک)، که انتظار ریاضی آن برابر با پارامتر برآورد شده است، یعنی.

. (8.9)

اگر برابری (8.9) برآورده نشود، آنگاه برآورد بایاس نامیده می شود. تفاوت
سوگیری یا سوگیری برآورد نامیده می شود. اگر برابری (8.9) فقط برای
، سپس برآورد مربوطه را مجانبی بی طرفانه می نامند.

لازم به ذکر است که اگر ثبات یک شرط تقریباً الزامی برای همه برآوردهای مورد استفاده در عمل باشد (تخمین ناسازگار به ندرت مورد استفاده قرار می گیرند)، پس خاصیت بی طرفی فقط مطلوب است. بسیاری از برآوردگرهای رایج دارای ویژگی بی طرفانه نیستند.

در حالت کلی، دقت برآورد یک پارامتر خاص بر اساس داده های تجربی به دست آمده است
، با میانگین مربعات خطا مشخص می شود

,

که می توان به فرم آورد

,

پراکندگی کجاست
مربع سوگیری برآورد است.

اگر برآورد بی طرفانه باشد، پس

در فینال تخمین ها ممکن است با مجذور میانگین خطا متفاوت باشند . به طور طبیعی، هر چه این خطا کوچکتر باشد، مقادیر ارزیابی نزدیکتر در اطراف پارامتر تخمین زده شده گروه بندی می شوند. بنابراین، همیشه مطلوب است که خطای تخمین تا حد امکان کوچک باشد، یعنی شرط

. (8.10)

تخمین زدن شرط رضایت بخش (8.10) تخمینی با حداقل مربعات خطا نامیده می شود.

کارآمدنمره نامیده می شود
، که برای آن میانگین مجذور خطا از میانگین مجذور خطای هر تخمین دیگری بیشتر نیست، یعنی.

جایی که - هر تخمین پارامتر دیگری .

مشخص است که واریانس هر تخمین بی طرفانه یک پارامتر نابرابری Cramer-Rao را برآورده می کند

,

جایی که
- چگالی توزیع احتمال شرطی مقادیر به دست آمده از یک متغیر تصادفی با مقدار واقعی پارامتر .

بنابراین برآوردگر بی طرف
، که برای آن نابرابری Cramer-Rao تبدیل به یک برابر می شود، موثر خواهد بود، یعنی چنین تخمینی دارای حداقل واریانس است.

تخمین نقطه ای انتظارات و واریانس ریاضی

اگر یک متغیر تصادفی در نظر بگیریم
، که انتظار ریاضی دارد و پراکندگی ، هر دوی این پارامترها ناشناخته فرض می شوند. بنابراین، بر روی یک متغیر تصادفی
تولید شده آزمایش‌های مستقلی که نتیجه می‌دهند:
. یافتن برآوردهای منسجم و بی طرفانه از پارامترهای ناشناخته ضروری است و .

طبق برآوردها و معمولاً میانگین آماری (نمونه) و واریانس آماری (نمونه) به ترتیب انتخاب می شوند:

; (8.11)

. (8.12)

برآورد انتظارات (8.11) مطابق قانون مطابقت دارد اعداد بزرگ(قضیه چبیشف):

.

انتظارات ریاضی از یک متغیر تصادفی

.

بنابراین، برآورد بی طرف است

پراکندگی برآورد انتظارات ریاضی:

اگر متغیر تصادفی
طبق قانون عادی توزیع می شود، سپس تخمین زده می شود نیز موثر است.

انتظارات ریاضی از برآورد واریانس

در همان زمان

.

زیرا
، آ
، سپس دریافت می کنیم

. (8.13)

به این ترتیب،
یک برآورد مغرضانه است، اگرچه سازگار و کارآمد است.

از فرمول (8.13) بر می آید که برای به دست آوردن یک برآورد بی طرفانه
واریانس نمونه (8.12) باید به صورت زیر اصلاح شود:

که "بهتر" از تخمین در نظر گرفته می شود (8.12)، اگرچه برای بزرگ این برآوردها تقریباً با یکدیگر برابر هستند.

روشهای بدست آوردن تخمین پارامترهای توزیع

اغلب در عمل، بر اساس تجزیه و تحلیل مکانیسم فیزیکی که یک متغیر تصادفی تولید می کند
، می توان در مورد قانون توزیع این متغیر تصادفی نتیجه گرفت. با این حال، پارامترهای این توزیع ناشناخته هستند، و آنها باید از نتایج آزمایش، معمولا به عنوان یک نمونه محدود، تخمین زده شوند.
. برای حل چنین مشکلی بیشتر از دو روش استفاده می شود: روش لحظه ها و روش حداکثر احتمال.

روش لحظه ها. این روش شامل معادل سازی گشتاورهای نظری با گشتاورهای تجربی مربوط به همان ترتیب است.

لحظات اولیه تجربی ترتیب با فرمول های زیر تعیین می شود:

,

و لحظات اولیه نظری مربوطه مرتبه - فرمول ها:

برای متغیرهای تصادفی گسسته،

برای متغیرهای تصادفی پیوسته،

جایی که پارامتر توزیع تخمین زده شده است.

برای به دست آوردن تخمین پارامترهای یک توزیع حاوی دو پارامتر ناشناخته و ، سیستم از دو معادله تشکیل شده است

جایی که و لحظات مرکزی نظری و تجربی مرتبه دوم هستند.

راه حل سیستم معادلات برآوردها است و پارامترهای توزیع ناشناخته و .

با معادل سازی لحظه های اولیه تجربی نظری مرتبه اول، با تخمین انتظار ریاضی یک متغیر تصادفی به این نتیجه می رسیم.
، که دارای توزیع دلخواه است، میانگین نمونه خواهد بود، i.e.
. سپس، با معادل سازی لحظه های مرکزی نظری و تجربی مرتبه دوم، به این نتیجه می رسیم که برآورد واریانس متغیر تصادفی
، که دارای توزیع دلخواه است، با فرمول تعیین می شود

.

به روشی مشابه می توان تخمین هایی از لحظه های نظری با هر مرتبه ای را یافت.

روش گشتاورها ساده است و نیازی به محاسبات پیچیده ندارد، اما برآوردهای به دست آمده با این روش اغلب ناکارآمد هستند.

روش حداکثر احتمال. روش حداکثر احتمال تخمین نقطه ای پارامترهای توزیع ناشناخته به یافتن حداکثر تابع یک یا چند پارامتر برآورد شده کاهش می یابد.

اجازه دهید
یک متغیر تصادفی پیوسته است که در نتیجه تست ها مقادیر را گرفتند
. برای به دست آوردن تخمینی از یک پارامتر ناشناخته باید ارزش را پیدا کرد ، که در آن احتمال تحقق نمونه به دست آمده حداکثر خواهد بود. زیرا
کمیت های مستقل از یکدیگر با چگالی احتمال یکسان هستند
، سپس تابع احتمالتابع آرگومان را فراخوانی کنید :

برآورد حداکثر احتمال پارامتر این مقدار نامیده می شود ، که در آن تابع درستنمایی به حداکثر خود می رسد، یعنی حل معادله است

,

که بدیهی است به نتایج آزمایش بستگی دارد
.

از آنجایی که توابع
و
در همان مقادیر به حداکثر برسد
سپس اغلب برای ساده کردن محاسبات از تابع درستنمایی لگاریتمی استفاده می کنند و به دنبال ریشه معادله مربوطه می گردند.

,

که نامیده می شود معادله احتمال.

اگر شما نیاز به ارزیابی چندین پارامتر دارید
توزیع
، سپس تابع احتمال به این پارامترها بستگی دارد. برای یافتن برآوردها
پارامترهای توزیع، برای حل سیستم ضروری است معادلات احتمال

.

روش حداکثر درستنمایی برآوردهای منسجم و مجانبی کارآمد می دهد. با این حال، تخمین‌های به‌دست‌آمده با روش حداکثر درست‌نمایی گاهی مغرضانه هستند، و علاوه بر این، برای یافتن تخمین‌ها، اغلب باید سیستم‌های نسبتاً پیچیده معادلات را حل کرد.

تخمین پارامترهای بازه ای

دقت برآوردهای نقطه ای با پراکندگی آنها مشخص می شود. در عین حال، هیچ اطلاعاتی در مورد نزدیک بودن تخمین های به دست آمده به مقادیر واقعی پارامترها وجود ندارد. در تعدادی از کارها، نه تنها برای یافتن پارامتر لازم است مقدار عددی مناسب، بلکه دقت و قابلیت اطمینان آن را نیز ارزیابی کنید. باید دریابید که جایگزینی پارامتر می تواند منجر به چه خطاهایی شود. تخمین نقطه ای آن و با چه درجه ای از اطمینان می توان انتظار داشت که این خطاها فراتر از محدوده های شناخته شده نباشند.

چنین مشکلاتی به ویژه برای تعداد کمی از آزمایش ها مرتبط است. زمانی که برآورد نقطه جایگزینی تا حد زیادی تصادفی و تقریبی بر روی می تواند منجر به خطاهای قابل توجهی شود.

کامل تر و راه قابل اعتمادتخمین پارامترهای توزیع شامل تعیین یک مقدار نقطه واحد نیست، بلکه فاصله ای است که با یک احتمال معین، مقدار واقعی پارامتر برآورد شده را پوشش می دهد.

اجازه دهید نتایج آزمایش ها، یک تخمین بی طرفانه به دست می آید
پارامتر . ارزیابی خطای احتمالی ضروری است. برخی از احتمالات به اندازه کافی بزرگ انتخاب شده است
(مثلاً) به گونه ای که رویدادی با این احتمال را می توان عملاً یک رویداد معین در نظر گرفت و چنین مقداری یافت می شود. ، برای کدام

. (8.15)

در این مورد، محدوده مقادیر عملا ممکن خطا که هنگام جایگزینی رخ می دهد بر روی ، خواهد بود
، و خطاهای مطلق بزرگ فقط با احتمال کمی ظاهر می شوند .

عبارت (8.15) یعنی با احتمال
مقدار پارامتر ناشناخته به فاصله می افتد

. (8.16)

احتمال
تماس گرفت سطح اطمینان، و فاصله پوشاندن با احتمال مقدار واقعی پارامتر فراخوانی می شود فاصله اطمینان. توجه داشته باشید که این اشتباه است که بگوییم مقدار پارامتر در فاصله اطمینان با احتمال قرار دارد . عبارت مورد استفاده (پوششها) به این معنی است که اگرچه پارامتر تخمین زده شده ناشناخته است، اما دارای مقدار ثابتی است و بنابراین دارای اسپرد نیست، زیرا یک متغیر تصادفی نیست.

برآورد انتظارات و واریانس ریاضی.

با مفهوم پارامترهای توزیع در نظریه احتمال آشنا شدیم. به عنوان مثال، در قانون عادیتوزیع داده شده توسط تابع چگالی احتمال

پارامترها هستند آ– انتظارات ریاضی و آ- میانگین انحراف معیار. در توزیع پواسون، پارامتر عدد است a = سابق

تعریف. تخمین آماری یک پارامتر ناشناخته از یک توزیع نظری، مقدار تقریبی آن است که به داده های نمونه بستگی دارد.(x 1، x 2، x 3،..., x k ; ص 1، ص 2، ص 3،..., p k)، یعنی تابعی از این مقادیر.

اینجا x 1، x 2، x 3،..., x k- مقادیر ویژگی، ص 1، ص 2، ص 3،..., p kفرکانس های مربوطه هستند. برآورد آماری یک متغیر تصادفی است.

با نشان دادن θ پارامتر تخمین زده شده است و از طریق θ * - خود ارزیابی آماری. ارزش | θ *–θ | تماس گرفت دقت ارزیابیکمتر | θ *–θ |، بهتر است، پارامتر ناشناخته با دقت بیشتری تعریف شود.

امتیاز گرفتن θ * اهمیت عملی داشت، نباید حاوی خطای سیستماتیک باشد و در عین حال دارای کمترین واریانس ممکن باشد. علاوه بر این، با افزایش حجم نمونه، احتمال انحرافات خودسرانه کوچک | θ *–θ | باید نزدیک به 1 باشد.

اجازه دهید تعاریف زیر را بیان کنیم.

1. یک تخمین پارامتر بدون تعصب نامیده می شود اگر انتظار ریاضی آن M باشد(θ *) برابر با پارامتر تخمینی θ, یعنی

م(θ *) = θ, (1)

و افست اگر

م(θ *) ≠ θ, (2)

2. تخمین θ* اگر برای هر δ> 0 باشد، سازگار نامیده می شود

(3)

برابری (3) به شرح زیر است: برآورد θ * در احتمال همگرا به θ .

3. تخمین θ* اگر برای یک n معین، کوچکترین واریانس را داشته باشد، موثر نامیده می شود.

قضیه 1.میانگین نمونه، Х В یک تخمین بی طرفانه و ثابت از انتظارات ریاضی است.

اثبات بگذارید نمونه نماینده باشد، یعنی همه عناصر جامعه عمومی فرصت یکسانی برای گنجاندن در نمونه داشته باشند. مقادیر ویژگی x 1، x 2، x 3،...، x nرا می توان به عنوان متغیرهای تصادفی مستقل در نظر گرفت X 1، X 2، X 3، ...، X nبا همان توزیع ها و ویژگی های عددی، از جمله آنهایی که انتظارات ریاضی برابر با آ،

از آنجایی که هر یک از مقادیر X 1، X 2، X 3، ...، X صپس توزیعی منطبق با توزیع جمعیت عمومی دارد م(ایکس)= a.از همین رو

از این رو نتیجه می شود که یک تخمین ثابت است م(ایکس).

با استفاده از قانون تحقیقات افراطی، می‌توانیم ثابت کنیم که این یک تخمین کارآمد نیز هست م(ایکس).

ویژگی های اساسی تخمین نقطه ای

برای اینکه ارزیابی ارزش عملی داشته باشد، باید دارای ویژگی های زیر باشد.

1. یک تخمین پارامتر بدون تعصب نامیده می شود اگر انتظار ریاضی آن با پارامتر تخمین زده شده برابر باشد.

اگر برابری (22.1) برآورده نشود، آنگاه تخمین می‌تواند مقدار (M>) را بیش از حد تخمین بزند یا آن را دست کم بگیرد (M)<) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.

2. تخمین یک پارامتر در صورتی سازگار نامیده می شود که از قانون اعداد بزرگ پیروی کند، یعنی. با افزایش نامحدود در تعداد آزمایش ها (مشاهدات) از نظر احتمال به پارامتر تخمینی همگرا می شود و بنابراین برابری زیر برآورده می شود:

که در آن > 0 یک عدد دلخواه کوچک است.

برای حفظ (22.2)، کافی است که واریانس تخمین به صفر گرایش داشته باشد، به عنوان مثال،

و علاوه بر این، برآوردگر بی طرف باشد. اگر از نابرابری چبیشف استفاده کنیم، عبور از فرمول (22.3) به (22.2) آسان است.

بنابراین، سازگاری تخمین به این معنی است که با تعداد کافی آزمایش و با قطعیت دلخواه بالا، انحراف برآورد از مقدار واقعی پارامتر کمتر از هر مقدار از پیش تعیین شده است. این افزایش حجم نمونه را توجیه می کند.

از آنجایی که یک متغیر تصادفی است که مقدار آن از نمونه ای به نمونه دیگر تغییر می کند، پس اندازه گیری پراکندگی آن حول انتظارات ریاضی با واریانس D مشخص می شود. M = و M = به ترتیب D و D و اگر D< D , то в качестве оценки принимают.

3. تخمین بی طرفانه ای که کمترین واریانس را در بین تمام تخمین های پارامترهای بی طرفانه ممکن محاسبه شده از نمونه هایی با اندازه یکسان داشته باشد، برآورد مؤثر نامیده می شود.

در عمل، هنگام تخمین پارامترها، همیشه نمی توان به طور همزمان الزامات 1، 2، 3 را برآورده کرد. با این حال، انتخاب یک تخمین همیشه باید با بررسی انتقادی آن از همه دیدگاه ها انجام شود. هنگام انتخاب روش های عملی برای پردازش داده های تجربی، لازم است که توسط ویژگی های فرمول بندی شده تخمین ها هدایت شود.

برآورد انتظارات ریاضی و واریانس برای نمونه

مهمترین ویژگی یک متغیر تصادفی انتظار و واریانس ریاضی است. این سوال را در نظر بگیرید که کدام ویژگی های نمونه، انتظارات ریاضی و واریانس را از نظر بی طرفی، کارایی و سازگاری بهتر تخمین می زند.

قضیه 23.1. میانگین حسابی محاسبه شده از n مشاهدات مستقل بر روی یک متغیر تصادفی که دارای انتظار ریاضی M = است، یک تخمین بی طرفانه از این پارامتر است.

اثبات

اجازه دهید - n مشاهدات مستقل روی یک متغیر تصادفی. با شرط M =، و از آنجا که متغیرهای تصادفی هستند و قانون توزیع یکسانی دارند. طبق تعریف، میانگین حسابی

انتظار ریاضی از میانگین حسابی را در نظر بگیرید. با استفاده از ویژگی انتظار ریاضی، داریم:

آن ها . به موجب (22.1) یک برآورد بی طرفانه است. ?

قضیه 23.2 . میانگین حسابی محاسبه شده از n مشاهدات مستقل روی یک متغیر تصادفی که دارای M = u است، تخمین ثابتی از این پارامتر است.

اثبات

اجازه دهید - n مشاهدات مستقل روی یک متغیر تصادفی. سپس، به موجب قضیه 23.1، M = داریم.

برای میانگین حسابی، نابرابری چبیشف را می نویسیم:

با استفاده از خواص پراکندگی 4.5 و (23.1)، داریم:

زیرا با توجه به قضیه

در نتیجه،

بنابراین، واریانس میانگین حسابی n برابر کمتر از واریانس متغیر تصادفی است. سپس

به این معنی که یک تخمین ثابت است.

اظهار نظر : 1 . ما بدون اثبات نتیجه ای را می پذیریم که برای تمرین بسیار مهم است. اگر N (a،)، پس برآورد بی طرفانه از انتظارات ریاضی آدارای حداقل واریانس برابر است، بنابراین تخمین موثری از پارامتر a است. ?

بیایید به تخمین واریانس برویم و آن را از نظر سازگاری و بی طرفی بررسی کنیم.

قضیه 23.3 . اگر یک نمونه تصادفی متشکل از n مشاهده مستقل روی یک متغیر تصادفی با

M = و D =، سپس واریانس نمونه

تخمین بی طرفانه ای از واریانس کلی D نیست.

اثبات

اجازه دهید - n مشاهدات مستقل روی یک متغیر تصادفی. مشروط و برای همه. ما فرمول (23.3) واریانس نمونه را تبدیل می کنیم:


بیایید بیان را ساده کنیم

با در نظر گرفتن (23.1)، از کجا

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...