नमूने के लिए गणितीय अपेक्षा और विचरण का अनुमान। गणितीय अपेक्षा के बिंदु अनुमान

एक यादृच्छिक चर होने दें एक्सगणितीय अपेक्षा के साथ एमऔर फैलाव डी, जबकि ये दोनों पैरामीटर अज्ञात हैं। परिमाण से अधिक एक्सप्रस्तुत एनस्वतंत्र प्रयोग, जिसके परिणामस्वरूप का एक सेट हुआ एनसंख्यात्मक परिणाम एक्स 1 , एक्स 2 ,…, एक्स एन. एक अनुमान के रूप में गणितीय अपेक्षाप्रेक्षित मूल्यों के अंकगणितीय माध्य का सुझाव देना स्वाभाविक है

(1)

यहाँ के रूप में एक्स मैंके परिणामस्वरूप प्राप्त विशिष्ट मान (संख्या) एनप्रयोग। अगर हम दूसरों को लेते हैं (पिछले वाले से स्वतंत्र) एनप्रयोग, तो, जाहिर है, हमें एक अलग मूल्य मिलेगा। यदि आप अधिक लेते हैं एनप्रयोग, हमें एक और नया मूल्य मिलेगा। द्वारा निरूपित करें एक्स मैंसे उत्पन्न यादृच्छिक चर मैंवें प्रयोग, फिर अहसास एक्स मैंइन प्रयोगों के परिणामस्वरूप प्राप्त संख्याएँ होंगी। यह स्पष्ट है कि यादृच्छिक चर एक्स मैंमूल यादृच्छिक चर के समान ही संभाव्यता वितरण घनत्व होगा एक्स. हम यह भी मानते हैं कि यादृच्छिक चर एक्स मैंतथा Xjपर स्वतंत्र हैं मैं, बराबर नहीं जे(एक दूसरे के प्रयोगों के सापेक्ष विभिन्न स्वतंत्र)। इसलिए, हम सूत्र (1) को एक अलग (सांख्यिकीय) रूप में फिर से लिखते हैं:

(2)

आइए हम दिखाते हैं कि अनुमान निष्पक्ष है:

इस प्रकार, नमूना माध्य की गणितीय अपेक्षा यादृच्छिक चर की वास्तविक गणितीय अपेक्षा के बराबर है एम. यह काफी अनुमानित और समझने योग्य तथ्य है। इसलिए, नमूना माध्य (2) को एक यादृच्छिक चर की गणितीय अपेक्षा के अनुमान के रूप में लिया जा सकता है। अब प्रश्न उठता है: जैसे-जैसे प्रयोगों की संख्या बढ़ती है, अपेक्षा अनुमान के विचरण का क्या होता है? विश्लेषणात्मक गणना दर्शाती है कि

गणितीय अपेक्षा के अनुमान का विचरण कहाँ है (2), और डी- यादृच्छिक चर का सही विचरण एक्स.

ऊपर से, यह इस प्रकार है कि वृद्धि के साथ एन(प्रयोगों की संख्या) अनुमान का विचरण कम हो जाता है, अर्थात। जितना अधिक हम स्वतंत्र कार्यान्वयन को संक्षेप में प्रस्तुत करते हैं, उतना ही अपेक्षित मूल्य के करीब हम अनुमान प्राप्त करते हैं।


गणितीय विचरण अनुमान

पहली नज़र में, सबसे स्वाभाविक अनुमान लगता है

(3)

जहां सूत्र (2) द्वारा गणना की जाती है। आइए देखें कि क्या अनुमान निष्पक्ष है। सूत्र (3) को इस प्रकार लिखा जा सकता है:

हम इस सूत्र में व्यंजक (2) को प्रतिस्थापित करते हैं:

आइए विचरण अनुमान की गणितीय अपेक्षा का पता लगाएं:

(4)

चूँकि एक यादृच्छिक चर का प्रसरण इस बात पर निर्भर नहीं करता है कि यादृच्छिक चर की गणितीय अपेक्षा क्या है, हम गणितीय अपेक्षा को 0 के बराबर लेंगे, अर्थात। एम = 0.

(5)
पर ।(6)

मान लीजिए कि एक यादृच्छिक चर X है, और इसके पैरामीटर गणितीय अपेक्षाएं हैं एकऔर भिन्नता अज्ञात है। X के मान पर, स्वतंत्र प्रयोग किए गए, जिसके परिणाम x 1, x 2, x n मिले।

तर्क की व्यापकता को कम किए बिना, हम यादृच्छिक चर के इन मूल्यों को अलग मानेंगे। हम मान x 1, x 2, x n को स्वतंत्र, समान रूप से वितरित यादृच्छिक चर X 1, X 2, X n के रूप में मानेंगे।

सबसे आसान तरीकासांख्यिकीय अनुमान - प्रतिस्थापन और सादृश्य की विधि - इस तथ्य में शामिल है कि एक विशेष संख्यात्मक विशेषता (औसत, विचरण, आदि) के मूल्यांकन के रूप में आबादीनमूने के वितरण की संगत विशेषता लें - नमूना विशेषता।

गणितीय अपेक्षा के अनुमान के रूप में प्रतिस्थापन विधि द्वारा एकनमूने के वितरण की गणितीय अपेक्षा को लेना आवश्यक है - नमूना माध्य। इस प्रकार, हम प्राप्त करते हैं

नमूने के निष्पक्षता और निरंतरता का परीक्षण करने के लिए अनुमान के रूप में मतलब है एक, इस आंकड़े को चुने हुए वेक्टर (X 1, X 2, X n) के एक फलन के रूप में मानें। यह ध्यान में रखते हुए कि प्रत्येक मात्रा X 1, X 2, X n का वितरण नियम मात्रा X के समान है, हम यह निष्कर्ष निकालते हैं कि इन मात्राओं की संख्यात्मक विशेषताएँ और मात्रा X समान हैं: M(X मैं) = एम (एक्स) = एक, डी (एक्स मैं) = डी (एक्स) = , मैं = 1, 2, नहीं , जहाँ X, सामूहिक रूप से स्वतंत्र यादृच्छिक चर हैं।

फलस्वरूप,

इसलिए, परिभाषा के अनुसार, हम प्राप्त करते हैं कि यह निष्पक्ष अनुमान है एक, और चूंकि D()®0 n®¥ के रूप में है, तो पिछले पैराग्राफ के प्रमेय के आधार पर उम्मीद का एक सुसंगत अनुमान है एकसामान्य जनसंख्या।

अनुमान की दक्षता या अक्षमता यादृच्छिक चर X के वितरण नियम के रूप पर निर्भर करती है। यह सिद्ध किया जा सकता है कि यदि मान X को सामान्य नियम के अनुसार वितरित किया जाता है, तो अनुमान कुशल है। अन्य वितरण कानूनों के लिए, यह मामला नहीं हो सकता है।

सामान्य विचरण का निष्पक्ष अनुमानसही नमूना विचरण है

,

इसलिये , जहां सामान्य विचरण है। सचमुच,

सामान्य विचरण के लिए अनुमान s - 2 भी सुसंगत है, लेकिन कुशल नहीं है। हालांकि, एक सामान्य वितरण के मामले में, यह "एसिम्प्टोटिक रूप से कुशल" है, अर्थात, जैसे-जैसे n बढ़ता है, इसके विचरण का न्यूनतम संभव अनुपात अनिश्चित काल तक पहुंचता है।

तो, वितरण F से एक नमूना दिया गया है ( एक्स) अज्ञात गणितीय अपेक्षा के साथ यादृच्छिक चर X एकऔर फैलाव, फिर इन मापदंडों के मूल्यों की गणना करने के लिए, हमें निम्नलिखित अनुमानित सूत्रों का उपयोग करने का अधिकार है:

एक ,

.

यहाँ x-i- - नमूना विकल्प, n- i - - आवृत्ति विकल्प x i , - - नमूने का आकार।
सही नमूना विचरण की गणना करने के लिए, सूत्र अधिक सुविधाजनक है


.

गणना को सरल बनाने के लिए, सशर्त विकल्पों पर स्विच करना उचित है (जैसा कि इसके साथ लेना फायदेमंद है मूल संस्करण, अंतराल के बीच में स्थित विविधता श्रृंखला) फिर

, .

अंतराल अनुमान

ऊपर, हमने एक अज्ञात पैरामीटर के आकलन के प्रश्न पर विचार किया एकएक संख्या। हम ऐसे अनुमानों को बिंदु अनुमान कहते हैं। उनका नुकसान यह है कि, एक छोटे नमूने के आकार के साथ, वे अनुमानित मापदंडों से काफी भिन्न हो सकते हैं। इसलिए, एक पैरामीटर और उसके अनुमान के बीच निकटता का अंदाजा लगाने के लिए, in गणितीय सांख्यिकीतथाकथित अंतराल अनुमान पेश किए जाते हैं।

मान लीजिए कि पैरामीटर q के नमूने में एक बिंदु अनुमान q * पाया जाता है। आमतौर पर, शोधकर्ताओं को कुछ पर्याप्त रूप से बड़ी प्रायिकता g (उदाहरण के लिए, 0.95; 0.99 या 0.999) द्वारा अग्रिम रूप से दिया जाता है, जैसे कि प्रायिकता g वाली एक घटना को व्यावहारिक रूप से निश्चित माना जा सकता है, और वे इस तरह के मान को खोजने का सवाल उठाते हैं e> 0 के लिए कौन सा

.

इस समानता को संशोधित करते हुए, हम प्राप्त करते हैं:

और इस मामले में हम कहेंगे कि अंतराल ]q * - e; q * + e[ अनुमानित पैरामीटर q को प्रायिकता g के साथ कवर करता है।

अंतराल] क्यू * -ई; क्यू * +ई [ कहा जाता है विश्वास अंतराल .

संभावना जी कहा जाता है विश्वसनीयता (विश्वास संभावना) अंतराल अनुमान।

समाप्त होता है विश्वास अंतराल, अर्थात। अंक q * -e और q * +e कहलाते हैं विश्वास की सीमाएं .

संख्या ई कहा जाता है मूल्यांकन सटीकता .

आत्मविश्वास की सीमा निर्धारित करने की समस्या के एक उदाहरण के रूप में, एक यादृच्छिक चर X की गणितीय अपेक्षा का अनुमान लगाने के प्रश्न पर विचार करें, जिसमें मापदंडों के साथ एक सामान्य वितरण कानून है एकऔर एस, यानी। एक्स = एन ( एक, एस)। इस मामले में गणितीय अपेक्षा बराबर है एक. प्रेक्षणों के अनुसार X 1 , X 2 , X n औसत की गणना करें और मूल्यांकन फैलाव 2 .

यह पता चला है कि नमूना डेटा के अनुसार, एक यादृच्छिक चर का निर्माण संभव है

जिसमें n = n -1 डिग्री स्वतंत्रता के साथ छात्र का वितरण (या t-वितरण) है।

आइए तालिका A.1.3 का उपयोग करें और दी गई प्रायिकता g और संख्या n संख्या t g इस प्रकार ज्ञात करें कि प्रायिकता

पी(|टी(एन)|< t g) = g,

.

स्पष्ट परिवर्तन करने के बाद, हम प्राप्त करते हैं

एफ-मानदंड लागू करने की प्रक्रिया इस प्रकार है:

1. जनसंख्या के सामान्य वितरण के बारे में एक धारणा बनाई जाती है। एक दिए गए महत्व स्तर पर, शून्य परिकल्पना एच 0 तैयार की जाती है: एस एक्स 2 = एस वाई 2 प्रतिस्पर्धी परिकल्पना एच 1: एस एक्स 2> एस वाई 2 के तहत सामान्य आबादी के सामान्य भिन्नताओं की समानता के बारे में।

2. दो स्वतंत्र नमूने क्रमशः n x और n y की X और Y समष्टि से प्राप्त किए जाते हैं।

3. सही नमूना प्रसरणों के मानों की गणना करें s x 2 और s y 2 (गणना विधियों की चर्चा §13.4) में की गई है। फैलाव का बड़ा (s x 2 या s y 2) को s 1 2, छोटा - s 2 2 नामित किया गया है।

4. F-मानदंड के मान की गणना सूत्र F ob = s 1 2 / s 2 2 के अनुसार की जाती है।

5. फिशर के महत्वपूर्ण बिंदुओं की तालिका के अनुसार - स्नेडेकोर वितरण, किसी दिए गए महत्व स्तर के लिए और स्वतंत्रता की डिग्री की संख्या n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 है एक बड़े संशोधित विचरण की स्वतंत्रता की डिग्री की संख्या), महत्वपूर्ण बिंदु F cr (a, n 1, n 2) पाया जाता है।

ध्यान दें कि तालिका A.1.7 एक-पूंछ वाले F-मानदंड के महत्वपूर्ण मान दिखाती है। इसलिए, यदि दो तरफा मानदंड लागू किया जाता है (एच 1: एस एक्स 2 ¹ एस वाई 2), तो दाएं तरफ महत्वपूर्ण बिंदु F cr (a/2, n 1 , n 2) महत्व के स्तर की तलाश कर रहे हैं a/2 (आधा निर्दिष्ट) और स्वतंत्रता की डिग्री की संख्या n 1 और n 2 (n 1 - स्वतंत्रता की डिग्री की संख्या) अधिक फैलाव)। बाएं हाथ का महत्वपूर्ण बिंदु नहीं मिल सकता है।

6. यह निष्कर्ष निकाला गया है कि यदि F-मानदंड का परिकलित मान महत्वपूर्ण एक (F obs F cr) से अधिक या उसके बराबर है, तो दिए गए महत्व स्तर पर भिन्नताएं महत्वपूर्ण रूप से भिन्न होती हैं। अन्यथा (एफ अवलोकन< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

कार्य 15.1. पुरानी तकनीक के अनुसार उत्पादन की प्रति इकाई कच्चे माल की खपत थी:

नई तकनीक:

यह मानते हुए कि संगत समष्टि X और Y के पास है सामान्य वितरण, जाँच करें कि नई और पुरानी प्रौद्योगिकियों के लिए कच्चे माल की खपत परिवर्तनशीलता में भिन्न नहीं है, यदि हम महत्व स्तर a = 0.1 लेते हैं।

समाधान. हम ऊपर बताए गए क्रम में कार्य करते हैं।

1. हम फैलाव मूल्यों के संदर्भ में नई और पुरानी प्रौद्योगिकियों के लिए कच्चे माल की खपत की परिवर्तनशीलता का न्याय करेंगे। इस प्रकार, शून्य परिकल्पना का रूप H 0: s x 2 = s y 2 है। एक प्रतिस्पर्धी परिकल्पना के रूप में, हम परिकल्पना H 1: s x 2 s y 2 को स्वीकार करते हैं, क्योंकि हम पहले से सुनिश्चित नहीं हैं कि कोई भी सामान्य प्रसरण दूसरे से बड़ा है।

2-3। नमूना भिन्नता खोजें। गणनाओं को सरल बनाने के लिए, आइए सशर्त विकल्पों पर चलते हैं:

यू मैं = एक्स मैं - 307, वी मैं = वाई मैं - 304।

हम सभी गणनाओं को निम्नलिखित तालिकाओं के रूप में व्यवस्थित करेंगे:

आप मैं मैं मैं मैं तुम मैं हो मैं तुम मैं 2 मी मैं (यू मैं +1) 2 वी मैं मैं एन आई वी आई एन मैं वी मैं 2 एन मैं (वी मैं +1) 2
-3 -3 -1 -2
å -
å -

नियंत्रण: m i u i 2 + 2å m i u i + m i = नियंत्रण: n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

सही नमूना प्रसरण खोजें:

4. प्रसरणों की तुलना करें। बड़े संशोधित विचरण का छोटे से अनुपात ज्ञात कीजिए:

.

5. शर्त के अनुसार, प्रतिस्पर्धी परिकल्पना का रूप s x 2 s y 2 है, इसलिए, महत्वपूर्ण क्षेत्र दो तरफा है, और महत्वपूर्ण बिंदु खोजने पर, किसी को महत्व स्तर लेना चाहिए जो दिए गए आधे से कम हो।

तालिका A.1.7 के अनुसार, महत्व स्तर a/2 = 0.1/2 = 0.05 और स्वतंत्रता की डिग्री की संख्या n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8 के अनुसार, हम पाते हैं महत्वपूर्ण बिंदु एफ करोड़ (0.05; 12; 8) = 3.28।

6. चूंकि एफ ओब।< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и नई तकनीकेंमानना।

ऊपर, परिकल्पनाओं का परीक्षण करते समय, यह माना गया कि अध्ययन के तहत यादृच्छिक चर का वितरण सामान्य था। हालांकि, विशेष अध्ययनों से पता चला है कि सामान्य वितरण से विचलन के संबंध में प्रस्तावित एल्गोरिदम बहुत स्थिर हैं (विशेषकर बड़े नमूना आकार के साथ)।

व्याख्यान का उद्देश्य: अज्ञात वितरण पैरामीटर का अनुमान लगाने की अवधारणा को पेश करना और ऐसे अनुमानकों का वर्गीकरण देना; गणितीय अपेक्षा और विचरण के बिंदु और अंतराल अनुमान प्राप्त करें।

व्यवहार में, ज्यादातर मामलों में, यादृच्छिक चर के वितरण का नियम अज्ञात है, और टिप्पणियों के परिणामों के अनुसार
संख्यात्मक विशेषताओं का मूल्यांकन करना आवश्यक है (उदाहरण के लिए, गणितीय अपेक्षा, विचरण या अन्य क्षण) या एक अज्ञात पैरामीटर , जो वितरण कानून (वितरण घनत्व) को परिभाषित करता है
अध्ययन के तहत यादृच्छिक चर। तो, एक घातांक या पॉइसन वितरण के लिए, यह एक पैरामीटर का मूल्यांकन करने के लिए पर्याप्त है, और एक सामान्य वितरण के लिए, दो मापदंडों का मूल्यांकन पहले से ही किया जाना है - गणितीय अपेक्षा और विचरण।

आकलन के प्रकार

यादृच्छिक मूल्य
एक संभावना घनत्व है
, कहाँ पे एक अज्ञात वितरण पैरामीटर है। प्रयोग के परिणामस्वरूप, इस यादृच्छिक चर के मान प्राप्त हुए:
. संक्षेप में मूल्यांकन करने का अर्थ है कि यादृच्छिक चर के नमूना मान पैरामीटर के एक निश्चित मान से जुड़े होने चाहिए , अर्थात प्रेक्षणों के परिणामों का कुछ फलन बनाएँ
, जिसका मूल्य अनुमान के रूप में लिया जाता है पैरामीटर . अनुक्रमणिका किए गए प्रयोगों की संख्या को इंगित करता है।

कोई भी फलन जो प्रेक्षणों के परिणामों पर निर्भर करता है, कहलाता है आंकड़े. चूँकि प्रेक्षणों के परिणाम यादृच्छिक चर हैं, तो आँकड़े भी होंगे अनियमित चर. इसलिए, अनुमान
अज्ञात पैरामीटर एक यादृच्छिक चर के रूप में माना जाना चाहिए, और इसके मूल्य की गणना प्रयोगात्मक डेटा से मात्रा द्वारा की जाती है , - इस यादृच्छिक चर के संभावित मूल्यों में से एक के रूप में।

वितरण मापदंडों के अनुमान (यादृच्छिक चर की संख्यात्मक विशेषताओं) को बिंदु और अंतराल में विभाजित किया गया है। बिंदु अनुमानपैरामीटर एक संख्या द्वारा निर्धारित , और इसकी सटीकता अनुमान के विचरण की विशेषता है। अंतराल अनुमानएक अनुमान कहा जाता है, जो दो संख्याओं द्वारा निर्धारित किया जाता है, तथा - अनुमानित पैरामीटर को कवर करने वाले अंतराल के अंत तक दिए गए आत्मविश्वास के स्तर के साथ।

बिंदु अनुमानों का वर्गीकरण

किसी अज्ञात पैरामीटर का बिंदु अनुमान लगाने के लिए
सटीकता के मामले में सबसे अच्छा है, इसे सुसंगत, निष्पक्ष और कुशल होने की आवश्यकता है।

धनवानस्कोर कहा जाता है
पैरामीटर , यदि यह संभाव्यता में अनुमानित पैरामीटर में परिवर्तित हो जाता है, अर्थात

. (8.8)

चेबीशेव असमानता के आधार पर, यह दिखाया जा सकता है कि पर्याप्त स्थितिसंबंध (8.8) समानता है

.

संगति के लिए अनुमान की एक स्पर्शोन्मुख विशेषता है
.

निष्पक्षस्कोर कहा जाता है
(व्यवस्थित त्रुटि के बिना अनुमान), जिसकी गणितीय अपेक्षा अनुमानित पैरामीटर के बराबर है, अर्थात।

. (8.9)

यदि समानता (8.9) संतुष्ट नहीं है, तो अनुमान को पक्षपाती कहा जाता है। अंतर
अनुमान का पूर्वाग्रह या पूर्वाग्रह कहा जाता है। यदि समानता (8.9) केवल के लिए संतुष्ट है
, तो संबंधित अनुमान को स्पर्शोन्मुख रूप से निष्पक्ष कहा जाता है।

यह ध्यान दिया जाना चाहिए कि यदि व्यवहार में उपयोग किए जाने वाले सभी अनुमानों के लिए स्थिरता लगभग अनिवार्य शर्त है (असंगत अनुमानों का उपयोग बहुत ही कम किया जाता है), तो निष्पक्षता की संपत्ति केवल वांछनीय है। आमतौर पर इस्तेमाल किए जाने वाले कई अनुमानकों के पास निष्पक्ष संपत्ति नहीं होती है।

सामान्य स्थिति में, एक निश्चित पैरामीटर का अनुमान लगाने की सटीकता प्रयोगात्मक डेटा के आधार पर प्राप्त
, माध्य वर्ग त्रुटि की विशेषता है

,

जिसे फॉर्म में लाया जा सकता है

,

फैलाव कहाँ है,
अनुमान पूर्वाग्रह का वर्ग है।

यदि अनुमान निष्पक्ष है, तो

फाइनल में अनुमान त्रुटि के माध्य वर्ग से भिन्न हो सकते हैं . स्वाभाविक रूप से, यह त्रुटि जितनी छोटी होगी, मूल्यांकन मान उतने ही बारीकी से अनुमानित पैरामीटर के आसपास समूहीकृत होंगे। इसलिए, यह हमेशा वांछनीय है कि अनुमान त्रुटि यथासंभव छोटी हो, अर्थात स्थिति

. (8.10)

आकलन संतोषजनक स्थिति (8.10) को न्यूनतम चुकता त्रुटि वाला अनुमान कहा जाता है।

दक्षस्कोर कहा जाता है
, जिसके लिए माध्य चुकता त्रुटि किसी अन्य अनुमान की माध्य चुकता त्रुटि से अधिक नहीं है, अर्थात।

कहाँ पे - कोई अन्य पैरामीटर अनुमान .

यह ज्ञात है कि एक पैरामीटर के किसी भी निष्पक्ष अनुमान का विचरण क्रैमर-राव असमानता को संतुष्ट करता है

,

कहाँ पे
- पैरामीटर के सही मूल्य के साथ यादृच्छिक चर के प्राप्त मूल्यों की सशर्त संभाव्यता वितरण घनत्व .

तो निष्पक्ष अनुमानक
, जिसके लिए क्रैमर-राव असमानता एक समानता बन जाती है, प्रभावी होगी, अर्थात, इस तरह के अनुमान का न्यूनतम विचरण होता है।

गणितीय अपेक्षा और विचरण के बिंदु अनुमान

यदि हम एक यादृच्छिक चर पर विचार करें
, जिसकी गणितीय अपेक्षा है और फैलाव , इन दोनों मापदंडों को अज्ञात माना जाता है। इसलिए, एक यादृच्छिक चर पर
प्रस्तुत स्वतंत्र प्रयोग जो परिणाम देते हैं:
. अज्ञात मापदंडों के सुसंगत और निष्पक्ष अनुमानों को खोजना आवश्यक है तथा .

अनुमान के अनुसार तथा आमतौर पर, सांख्यिकीय (नमूना) माध्य और सांख्यिकीय (नमूना) विचरण को क्रमशः चुना जाता है:

; (8.11)

. (8.12)

अपेक्षा अनुमान (8.11) कानून के अनुरूप है बड़ी संख्या(चेबीशेव का प्रमेय):

.

यादृच्छिक चर की गणितीय अपेक्षा

.

इसलिए, अनुमान निष्पक्ष है।

गणितीय अपेक्षा के अनुमान का फैलाव:

यदि यादृच्छिक चर
सामान्य कानून के अनुसार वितरित, तो अनुमान प्रभावी भी है।

विचरण अनुमान की गणितीय अपेक्षा

एक ही समय में

.

इसलिये
, एक
, तो हमें मिलता है

. (8.13)

इस तरह,
एक पक्षपाती अनुमान है, हालांकि यह सुसंगत और कुशल है।

यह सूत्र (8.13) से निम्नानुसार है कि निष्पक्ष अनुमान प्राप्त करने के लिए
नमूना विचरण (8.12) को निम्नानुसार संशोधित किया जाना चाहिए:

जिसे अनुमान (8.12) से "बेहतर" माना जाता है, हालांकि बड़े के लिए ये अनुमान लगभग एक दूसरे के बराबर हैं।

वितरण मापदंडों के अनुमान प्राप्त करने के तरीके

अक्सर व्यवहार में, एक यादृच्छिक चर उत्पन्न करने वाले भौतिक तंत्र के विश्लेषण के आधार पर
, हम इस यादृच्छिक चर के वितरण के नियम के बारे में निष्कर्ष निकाल सकते हैं। हालांकि, इस वितरण के पैरामीटर अज्ञात हैं, और उन्हें प्रयोग के परिणामों से अनुमान लगाया जाना चाहिए, आमतौर पर एक सीमित नमूने के रूप में प्रस्तुत किया जाता है।
. ऐसी समस्या को हल करने के लिए, दो विधियों का सबसे अधिक बार उपयोग किया जाता है: क्षणों की विधि और अधिकतम संभावना विधि।

पलों का तरीका. विधि में सैद्धांतिक क्षणों को उसी क्रम के संबंधित अनुभवजन्य क्षणों के साथ समान करना शामिल है।

अनुभवजन्य प्रारंभिक क्षण वें क्रम सूत्रों द्वारा निर्धारित किया जाता है:

,

और इसी सैद्धांतिक प्रारंभिक क्षण वें क्रम - सूत्र:

असतत यादृच्छिक चर के लिए,

निरंतर यादृच्छिक चर के लिए,

कहाँ पे अनुमानित वितरण पैरामीटर है।

दो अज्ञात मापदंडों वाले वितरण के मापदंडों का अनुमान प्राप्त करने के लिए तथा , प्रणाली दो समीकरणों से बना है

कहाँ पे तथा दूसरे क्रम के सैद्धांतिक और अनुभवजन्य केंद्रीय क्षण हैं।

समीकरणों की प्रणाली का समाधान अनुमान है तथा अज्ञात वितरण पैरामीटर तथा .

पहले क्रम के सैद्धांतिक अनुभवजन्य प्रारंभिक क्षणों की तुलना करते हुए, हम प्राप्त करते हैं कि एक यादृच्छिक चर की गणितीय अपेक्षा का अनुमान लगाकर
, जिसका एक मनमाना वितरण है, नमूना माध्य होगा, अर्थात।
. फिर, दूसरे क्रम के सैद्धांतिक और अनुभवजन्य केंद्रीय क्षणों की बराबरी करते हुए, हम प्राप्त करते हैं कि यादृच्छिक चर के विचरण का अनुमान
, जिसका एक मनमाना वितरण है, सूत्र द्वारा निर्धारित किया जाता है

.

इसी प्रकार किसी भी क्रम के सैद्धान्तिक आघूर्णों का अनुमान लगाया जा सकता है।

क्षणों की विधि सरल है और जटिल गणनाओं की आवश्यकता नहीं होती है, लेकिन इस पद्धति द्वारा प्राप्त अनुमान अक्सर अक्षम होते हैं।

अधिकतम संभावना विधि. अज्ञात वितरण मापदंडों के बिंदु अनुमान की अधिकतम संभावना विधि एक या अधिक अनुमानित मापदंडों के अधिकतम कार्य को खोजने के लिए कम हो जाती है।

होने देना
एक सतत यादृच्छिक चर है, जिसके परिणामस्वरूप परीक्षणों ने मान लिया
. अज्ञात पैरामीटर का अनुमान प्राप्त करने के लिए मूल्य खोजने की जरूरत है , जिस पर प्राप्त नमूने के प्राप्त होने की संभावना अधिकतम होगी। इसलिये
समान प्रायिकता घनत्व वाली परस्पर स्वतंत्र मात्राएँ हैं
, फिर संभावना समारोहतर्क समारोह को बुलाओ :

पैरामीटर की अधिकतम संभावना अनुमान इस मान को कहा जाता है , जिस पर प्रायिकता फलन अपने अधिकतम तक पहुँच जाता है, अर्थात्, समीकरण का एक हल है

,

जो स्पष्ट रूप से परीक्षा परिणामों पर निर्भर करता है
.

कार्यों के बाद से
तथा
समान मूल्यों पर अधिकतम तक पहुंचें
, तो अक्सर, गणना को सरल बनाने के लिए, वे लॉगरिदमिक संभावना फ़ंक्शन का उपयोग करते हैं और संबंधित समीकरण की जड़ की तलाश करते हैं

,

जिसे कहा जाता है संभावना समीकरण.

यदि आपको कई मापदंडों का मूल्यांकन करने की आवश्यकता है
वितरण
, तो प्रायिकता फलन इन मापदंडों पर निर्भर करेगा। अनुमान खोजने के लिए
वितरण पैरामीटर, सिस्टम को हल करना आवश्यक है संभावना समीकरण

.

अधिकतम संभावना विधि सुसंगत और असंबद्ध रूप से कुशल अनुमान देती है। हालांकि, अधिकतम संभावना विधि द्वारा प्राप्त अनुमान कभी-कभी पक्षपाती होते हैं, और इसके अलावा, अनुमानों को खोजने के लिए, अक्सर समीकरणों की जटिल प्रणालियों को हल करना पड़ता है।

अंतराल पैरामीटर अनुमान

बिंदु अनुमानों की सटीकता उनके फैलाव की विशेषता है। इसी समय, इस बारे में कोई जानकारी नहीं है कि प्राप्त अनुमान मापदंडों के वास्तविक मूल्यों के कितने करीब हैं। कई कार्यों में, न केवल पैरामीटर खोजने की आवश्यकता होती है उपयुक्त संख्यात्मक मान, लेकिन इसकी सटीकता और विश्वसनीयता का मूल्यांकन भी करते हैं। यह पता लगाना आवश्यक है कि पैरामीटर प्रतिस्थापन से कौन सी त्रुटियां हो सकती हैं। इसका बिंदु अनुमान और हम किस हद तक विश्वास के साथ उम्मीद कर सकते हैं कि ये त्रुटियां ज्ञात सीमाओं से आगे नहीं बढ़ेंगी।

ऐसी समस्याएं कम संख्या में प्रयोगों के लिए विशेष रूप से प्रासंगिक हैं। जब बिंदु अनुमान बड़े पैमाने पर यादृच्छिक और अनुमानित प्रतिस्थापन पर महत्वपूर्ण त्रुटियां हो सकती हैं।

अधिक पूर्ण और विश्वसनीय तरीकावितरण मापदंडों के अनुमान में एक बिंदु मान नहीं, बल्कि एक अंतराल निर्धारित होता है, जो किसी दी गई संभावना के साथ अनुमानित पैरामीटर के सही मूल्य को कवर करता है।

चलो परिणाम प्रयोग, एक निष्पक्ष अनुमान प्राप्त होता है
पैरामीटर . संभावित त्रुटि का मूल्यांकन करना आवश्यक है। कुछ पर्याप्त रूप से बड़ी संभावना को चुना जाता है
(उदाहरण के लिए), जैसे कि इस संभावना वाली घटना को व्यावहारिक रूप से एक निश्चित घटना माना जा सकता है, और ऐसा मूल्य पाया जाता है , जिसके लिए

. (8.15)

इस मामले में, त्रुटि के व्यावहारिक रूप से संभावित मूल्यों की सीमा जो प्रतिस्थापित करते समय होती है पर , होगा
, और बड़ी निरपेक्ष त्रुटियां केवल एक छोटी संभावना के साथ दिखाई देंगी .

व्यंजक (8.15) का अर्थ है कि प्रायिकता के साथ
अज्ञात पैरामीटर मान अंतराल में पड़ता है

. (8.16)

संभावना
बुलाया आत्मविश्वास का स्तर, और अंतराल संभावना के साथ कवर पैरामीटर का सही मान कहा जाता है विश्वास अंतराल. ध्यान दें कि यह कहना गलत है कि पैरामीटर मान प्रायिकता के साथ विश्वास अंतराल के भीतर है . प्रयुक्त शब्द (कवर) का अर्थ है कि हालांकि अनुमानित पैरामीटर अज्ञात है, इसका एक स्थिर मूल्य है और इसलिए इसका कोई प्रसार नहीं है, क्योंकि यह एक यादृच्छिक चर नहीं है।

गणितीय अपेक्षा और विचरण का अनुमान।

हम संभाव्यता सिद्धांत में वितरण मापदंडों की अवधारणा से परिचित हुए। उदाहरण के लिए, में सामान्य कानूनसंभाव्यता घनत्व फ़ंक्शन द्वारा दिया गया वितरण

पैरामीटर हैं एक- गणितीय अपेक्षा और एक- औसत मानक विचलन. पॉसों वितरण में, पैरामीटर संख्या है ए = पूर्व।

परिभाषा। सैद्धांतिक वितरण के अज्ञात पैरामीटर का एक सांख्यिकीय अनुमान इसका अनुमानित मूल्य है, जो नमूना डेटा पर निर्भर करता है(एक्स 1, एक्स 2, एक्स 3,..., एक्स कश्मीर; पी 1, पी 2, पी 3,..., पी के), यानी, इन मात्राओं के कुछ कार्य।

यहां एक्स 1, एक्स 2, एक्स 3,..., एक्स के- विशेषता मान, पी 1, पी 2, पी 3,..., पी केसंगत आवृत्तियाँ हैं। सांख्यिकीय अनुमान एक यादृच्छिक चर है।

द्वारा निरूपित करें θ अनुमानित पैरामीटर है, और के माध्यम से θ * - उसके सांख्यिकीय मूल्यांकन. मूल्य | θ *–θ | बुलाया मूल्यांकन सटीकता।कम | θ *–θ |, बेहतर, अज्ञात पैरामीटर अधिक सटीक रूप से परिभाषित है।

स्कोर करने के लिए θ * व्यावहारिक महत्व का था, इसमें व्यवस्थित त्रुटि नहीं होनी चाहिए और साथ ही साथ सबसे छोटा संभव विचरण भी होना चाहिए। इसके अलावा, नमूना आकार में वृद्धि के साथ, मनमाने ढंग से छोटे विचलन की संभावना | θ *–θ | 1 के करीब होना चाहिए।

आइए निम्नलिखित परिभाषाएँ तैयार करें।

1. एक पैरामीटर अनुमान को निष्पक्ष कहा जाता है यदि इसकी गणितीय अपेक्षा M . है(θ *) अनुमानित पैरामीटर के बराबर, अर्थात।

एम(θ *) = θ, (1)

और ऑफसेट अगर

एम(θ *) ≠ θ, (2)

2. एक अनुमान θ* को संगत कहा जाता है यदि किसी δ > 0 . के लिए

(3)

समानता (3) इस प्रकार है: अनुमान θ * प्रायिकता में अभिसरण करता है θ .

3. एक अनुमान * को प्रभावी कहा जाता है, यदि किसी दिए गए n के लिए, इसका सबसे छोटा विचरण हो।

प्रमेय 1.नमूना माध्य गणितीय अपेक्षा का एक निष्पक्ष और सुसंगत अनुमान है।

सबूत। प्रतिदर्श को प्रतिनिधि होने दें, अर्थात सामान्य जनसंख्या के सभी तत्वों को प्रतिदर्श में सम्मिलित होने का समान अवसर प्राप्त है। फ़ीचर मान एक्स 1 , एक्स 2 , एक्स 3 ,..., एक्स एनस्वतंत्र यादृच्छिक चर के रूप में लिया जा सकता है एक्स 1, एक्स 2, एक्स 3, ..., एक्स एनसमान वितरण के साथ और संख्यात्मक विशेषताएं, जिनमें समान गणितीय अपेक्षाएं शामिल हैं एक,

चूंकि प्रत्येक मात्रा एक्स 1, एक्स 2, एक्स 3, ..., एक्स पीसामान्य जनसंख्या के वितरण के साथ मेल खाता है, तो एम(एक्स)= ए.इसीलिए

जहां से यह इस प्रकार है कि एक सुसंगत अनुमान है एम(एक्स).

चरम अनुसंधान नियम का उपयोग करके, हम यह साबित कर सकते हैं कि यह एक कुशल अनुमान भी है एम(एक्स).

बिंदु अनुमानों के मूल गुण

मूल्यांकन के व्यावहारिक मूल्य के होने के लिए, इसमें निम्नलिखित गुण होने चाहिए।

1. एक पैरामीटर अनुमान को निष्पक्ष कहा जाता है यदि इसकी गणितीय अपेक्षा अनुमानित पैरामीटर के बराबर है, अर्थात।

यदि समानता (22.1) संतुष्ट नहीं है, तो अनुमान या तो मूल्य (एम>) को कम करके आंका जा सकता है या इसे कम करके आंका जा सकता है (एम)<) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.

2. एक प्राचल का अनुमान संगत कहलाता है यदि वह बड़ी संख्याओं के नियम का पालन करता है, अर्थात्। प्रयोगों (अवलोकनों) की संख्या में असीमित वृद्धि के साथ अनुमानित पैरामीटर की संभावना में अभिसरण करता है और इसलिए, निम्नलिखित समानता संतुष्ट होती है:

जहाँ > 0 एक मनमाना छोटी संख्या है।

(22.2) धारण करने के लिए, यह पर्याप्त है कि अनुमान का विचरण शून्य हो जाता है, अर्थात,

और इसके अलावा, कि अनुमानक निष्पक्ष हो। यदि हम चेबीशेव की असमानता का उपयोग करते हैं तो सूत्र (22.3) से (22.2) तक जाना आसान है।

तो, अनुमान की संगति का अर्थ है कि पर्याप्त रूप से बड़ी संख्या में प्रयोगों के साथ और मनमाने ढंग से उच्च निश्चितता के साथ, पैरामीटर के वास्तविक मूल्य से अनुमान का विचलन किसी भी पूर्व निर्धारित मूल्य से कम है। यह नमूना आकार में वृद्धि को सही ठहराता है।

चूँकि एक यादृच्छिक चर है जिसका मान नमूने से नमूने में बदलता है, तो गणितीय अपेक्षा के आसपास इसके फैलाव का माप विचरण डी द्वारा विशेषता होगा। मान लीजिए और पैरामीटर के दो निष्पक्ष अनुमान हैं, अर्थात। एम = और एम =, क्रमशः डी और डी और, यदि डी< D , то в качестве оценки принимают.

3. एक निष्पक्ष अनुमान जिसमें एक ही आकार के नमूनों से गणना किए गए सभी संभावित निष्पक्ष पैरामीटर अनुमानों में सबसे छोटा अंतर होता है, एक प्रभावी अनुमान कहलाता है।

व्यवहार में, मापदंडों का आकलन करते समय, आवश्यकताओं 1, 2, 3 को एक साथ पूरा करना हमेशा संभव नहीं होता है। हालांकि, एक अनुमान का चुनाव हमेशा सभी दृष्टिकोणों से इसकी महत्वपूर्ण परीक्षा से पहले होना चाहिए। प्रायोगिक डेटा को संसाधित करने के लिए व्यावहारिक तरीके चुनते समय, अनुमानों के तैयार गुणों द्वारा निर्देशित होना आवश्यक है।

नमूने के लिए गणितीय अपेक्षा और विचरण का अनुमान

एक यादृच्छिक चर की सबसे महत्वपूर्ण विशेषताएं गणितीय अपेक्षा और विचरण हैं। इस सवाल पर विचार करें कि निष्पक्षता, दक्षता और स्थिरता के संदर्भ में कौन सी नमूना विशेषताएं गणितीय अपेक्षा और भिन्नता का सबसे अच्छा अनुमान लगाती हैं।

प्रमेय 23.1. गणितीय अपेक्षा M = वाले यादृच्छिक चर पर n स्वतंत्र प्रेक्षणों से परिकलित अंकगणितीय माध्य इस पैरामीटर का एक निष्पक्ष अनुमान है।

सबूत।

मान लीजिए - एक यादृच्छिक चर पर स्वतंत्र अवलोकन। शर्त के अनुसार M = , और चूँकि यादृच्छिक चर हैं और फिर समान वितरण कानून हैं। परिभाषा के अनुसार, अंकगणितीय माध्य

अंकगणित माध्य की गणितीय अपेक्षा पर विचार करें। गणितीय अपेक्षा की संपत्ति का उपयोग करते हुए, हमारे पास है:

वे। . (22.1) के आधार पर एक निष्पक्ष अनुमान है। ?

प्रमेय 23.2 . एक यादृच्छिक चर पर n स्वतंत्र टिप्पणियों से गणना की गई अंकगणितीय माध्य जिसमें M = u है, इस पैरामीटर का एक सुसंगत अनुमान है।

सबूत।

मान लीजिए - एक यादृच्छिक चर पर स्वतंत्र अवलोकन। तब, प्रमेय 23.1 के आधार पर, हमें M = प्राप्त होता है।

अंकगणित माध्य के लिए, हम चेबीशेव असमानता लिखते हैं:

फैलाव गुण 4.5 और (23.1) का उपयोग करते हुए, हमारे पास है:

इसलिये प्रमेय के अनुसार।

फलस्वरूप,

अतः, समांतर माध्य का प्रसरण यादृच्छिक चर के प्रसरण से n गुना कम है। फिर

जिसका अर्थ है कि यह एक सुसंगत अनुमान है।

टिप्पणी : 1 . हम बिना प्रमाण के एक परिणाम स्वीकार करते हैं जो अभ्यास के लिए बहुत महत्वपूर्ण है। यदि N (a,), तो गणितीय अपेक्षा का निष्पक्ष अनुमान एकन्यूनतम विचरण के बराबर है, इसलिए, पैरामीटर ए का एक प्रभावी अनुमान है। ?

आइए विचरण के अनुमान पर चलते हैं और इसकी स्थिरता और निष्पक्षता के लिए जाँच करते हैं।

प्रमेय 23.3 . यदि एक यादृच्छिक नमूने में एक यादृच्छिक चर पर n स्वतंत्र अवलोकन होते हैं

एम = और डी = , तो नमूना विचरण

डी - सामान्य विचरण का निष्पक्ष अनुमान नहीं है।

सबूत।

मान लीजिए - एक यादृच्छिक चर पर स्वतंत्र अवलोकन। सशर्त और सभी के लिए। हम नमूना विचरण के सूत्र (23.3) को रूपांतरित करते हैं:


आइए अभिव्यक्ति को सरल बनाएं

(23.1) को ध्यान में रखते हुए, कहाँ से

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...