गणित और सूचना विज्ञान। पाठ्यक्रम के दौरान अध्ययन गाइड

अक्सर मूल्यांकक को उस खंड के अचल संपत्ति बाजार का विश्लेषण करना पड़ता है जिसमें मूल्यांकन वस्तु स्थित है। यदि बाजार विकसित है, तो प्रस्तुत वस्तुओं के पूरे सेट का विश्लेषण करना मुश्किल हो सकता है, इसलिए विश्लेषण के लिए वस्तुओं का एक नमूना उपयोग किया जाता है। यह नमूना हमेशा सजातीय नहीं होता है, कभी-कभी इसे चरम सीमाओं से मुक्त करने की आवश्यकता होती है - बहुत अधिक या बहुत कम बाजार ऑफ़र। इसी उद्देश्य से इसे लागू किया जाता है विश्वास अंतराल. लक्ष्य ये पढाई- कॉन्फिडेंस इंटरवल की गणना के लिए दो तरीकों का तुलनात्मक विश्लेषण करें और एस्टीमेटिका.प्रो सिस्टम में विभिन्न नमूनों के साथ काम करते समय सर्वश्रेष्ठ गणना विकल्प चुनें।

विश्वास अंतराल - एक नमूने के आधार पर गणना की गई विशेषता मानों का अंतराल, जिसमें एक ज्ञात संभावना के साथ अनुमानित पैरामीटर होता है आबादी.

कॉन्फ़िडेंस इंटरवल की गणना करने का अर्थ नमूना डेटा के आधार पर एक ऐसा इंटरवल बनाना है, ताकि दी गई प्रायिकता के साथ यह दावा किया जा सके कि अनुमानित पैरामीटर का मान इस अंतराल में है। दूसरे शब्दों में, एक निश्चित संभावना के साथ विश्वास अंतराल में अनुमानित मात्रा का अज्ञात मान होता है। अंतराल जितना व्यापक होगा, अशुद्धि उतनी ही अधिक होगी।

कॉन्फिडेंस इंटरवल निर्धारित करने के लिए अलग-अलग तरीके हैं। इस लेख में, हम 2 तरीकों पर विचार करेंगे:

  • माध्यिका और मानक विचलन के माध्यम से;
  • टी-सांख्यिकीय (छात्र के गुणांक) के महत्वपूर्ण मूल्य के माध्यम से।

चरणों तुलनात्मक विश्लेषण विभिन्न तरीकेसीआई गणना:

1. एक डेटा नमूना तैयार करें;

2. इसे प्रोसेस करें सांख्यिकीय पद्धतियां: माध्य, माध्यिका, विचरण आदि की गणना करें;

3. हम कॉन्फिडेंस इंटरवल की गणना दो तरह से करते हैं;

4. साफ किए गए नमूनों और प्राप्त विश्वास अंतराल का विश्लेषण करें।

चरण 1. डेटा नमूनाकरण

नमूना estmatica.pro सिस्टम का उपयोग करके बनाया गया था। नमूने में "ख्रुश्चेव" योजना के प्रकार के साथ तीसरे मूल्य क्षेत्र में 1-कमरे वाले अपार्टमेंट की बिक्री के लिए 91 प्रस्ताव शामिल थे।

तालिका 1 प्रारंभिक नमूना

1 sq.m., c.u. की कीमत

चित्र एक। प्रारंभिक नमूना



स्टेज 2. प्रारंभिक नमूने का प्रसंस्करण

सांख्यिकीय विधियों द्वारा नमूना प्रसंस्करण के लिए निम्नलिखित मूल्यों की गणना की आवश्यकता होती है:

1. अंकगणित माध्य

2. माध्यिका - एक संख्या जो नमूने की विशेषता है: नमूना तत्वों का ठीक आधा माध्यिका से अधिक है, अन्य आधा माध्यिका से कम है

(मानों की विषम संख्या वाले नमूने के लिए)

3. रेंज - नमूने में अधिकतम और न्यूनतम मूल्यों के बीच का अंतर

4. भिन्नता - डेटा में भिन्नता का अधिक सटीक अनुमान लगाने के लिए उपयोग किया जाता है

5. नमूने के लिए मानक विचलन (बाद में आरएमएस के रूप में संदर्भित) अंकगणित माध्य के आसपास समायोजन मूल्यों के फैलाव का सबसे आम संकेतक है।

6. भिन्नता का गुणांक - समायोजन मूल्यों के फैलाव की डिग्री को दर्शाता है

7. दोलन गुणांक - औसत के आसपास के नमूने में कीमतों के चरम मूल्यों के सापेक्ष उतार-चढ़ाव को दर्शाता है

तालिका 2. मूल नमूने के सांख्यिकीय संकेतक

भिन्नता का गुणांक, जो डेटा की एकरूपता की विशेषता है, 12.29% है, लेकिन दोलन का गुणांक बहुत बड़ा है। इस प्रकार, हम कह सकते हैं कि मूल नमूना सजातीय नहीं है, तो चलिए विश्वास अंतराल की गणना करने के लिए आगे बढ़ते हैं।

स्टेज 3. विश्वास अंतराल की गणना

विधि 1. माध्यिका और मानक विचलन के माध्यम से गणना।

विश्वास अंतराल निम्नानुसार निर्धारित किया जाता है: न्यूनतम मान - मानक विचलन माध्यिका से घटाया जाता है; अधिकतम मान - माध्यिका में मानक विचलन जोड़ा जाता है।

इस प्रकार, कॉन्फिडेंस इंटरवल (47179 CU; 60689 CU)

चावल। 2. कॉन्फिडेंस इंटरवल 1 के भीतर मान।



विधि 2. टी-सांख्यिकी (छात्र के गुणांक) के महत्वपूर्ण मूल्य के माध्यम से एक विश्वास अंतराल का निर्माण

एस.वी. पुस्तक में ग्रिबोव्स्की " गणितीय तरीकेसंपत्ति मूल्य मूल्यांकन" बताता है कि छात्र के गुणांक के माध्यम से विश्वास अंतराल की गणना कैसे करें। इस पद्धति से गणना करते समय, अनुमानक को स्वयं महत्व स्तर ∝ सेट करना चाहिए, जो उस संभावना को निर्धारित करता है जिसके साथ विश्वास अंतराल बनाया जाएगा। 0.1 का महत्व स्तर आमतौर पर उपयोग किया जाता है; 0.05 और 0.01। वे 0.9 की विश्वास संभावनाओं के अनुरूप हैं; 0.95 और 0.99। इस पद्धति से, सच्चे मूल्यों की गणना की जाती है गणितीय अपेक्षाऔर विचरण व्यावहारिक रूप से अज्ञात हैं (जो हल करते समय लगभग हमेशा सत्य होता है व्यावहारिक कार्यरेटिंग)।

विश्वास अंतराल सूत्र:

एन - नमूना आकार;

महत्व स्तर ∝ के साथ टी-सांख्यिकी (छात्रों का वितरण) का महत्वपूर्ण मूल्य, स्वतंत्रता की डिग्री एन-1 की संख्या, जो विशेष सांख्यिकीय तालिकाओं द्वारा या एमएस एक्सेल (→"सांख्यिकीय"→ STUDRASPOBR) का उपयोग करके निर्धारित की जाती है;

∝ - सार्थकता स्तर, हम ∝=0.01 लेते हैं।

चावल। 2. विश्वास अंतराल के भीतर मान 2.

चरण 4. कॉन्फ़िडेंस इंटरवल की गणना करने के विभिन्न तरीकों का विश्लेषण

कॉन्फिडेंस इंटरवल की गणना करने के दो तरीके - माध्यिका और छात्र के गुणांक के माध्यम से - का नेतृत्व किया विभिन्न मूल्यअंतराल। तदनुसार, दो अलग-अलग शुद्ध नमूने प्राप्त किए गए थे।

तालिका 3. तीन नमूनों के लिए सांख्यिकीय संकेतक।

अनुक्रमणिका

प्रारंभिक नमूना

1 विकल्प

विकल्प 2

अर्थ

फैलाव

कोफ। विविधताओं

कोफ। दोलनों

सेवानिवृत्त वस्तुओं की संख्या, पीसी।

प्रदर्शन की गई गणनाओं के आधार पर, हम कह सकते हैं कि विभिन्न विधियों द्वारा प्राप्त विश्वास अंतराल के मान प्रतिच्छेद करते हैं, इसलिए आप मूल्यांकक के विवेक पर गणना के किसी भी तरीके का उपयोग कर सकते हैं।

हालांकि, हम मानते हैं कि एस्टिमेटिका.प्रो सिस्टम में काम करते समय, बाजार के विकास की डिग्री के आधार पर विश्वास अंतराल की गणना के लिए एक विधि चुनने की सलाह दी जाती है:

  • यदि बाजार विकसित नहीं है, तो औसत और मानक विचलन के माध्यम से गणना की विधि लागू करें, क्योंकि इस मामले में सेवानिवृत्त वस्तुओं की संख्या कम है;
  • यदि बाजार विकसित है, तो गणना को टी-सांख्यिकी (छात्र के गुणांक) के महत्वपूर्ण मूल्य के माध्यम से लागू करें, क्योंकि एक बड़ा प्रारंभिक नमूना बनाना संभव है।

लेख तैयार करने में इस्तेमाल किया गया:

1. ग्रिबोव्स्की एस.वी., सिवेट्स एस.ए., लेविकिना आई.ए. संपत्ति के मूल्य का आकलन करने के लिए गणितीय तरीके। मास्को, 2014

2. एस्टीमेटिका.प्रो सिस्टम से डेटा

और अन्य। वे सभी अपने सैद्धांतिक समकक्षों के अनुमान हैं, जिन्हें प्राप्त किया जा सकता है यदि कोई नमूना नहीं था, लेकिन सामान्य जनसंख्या। लेकिन अफसोस, आम जनता बहुत महंगी है और अक्सर अनुपलब्ध रहती है।

अंतराल अनुमान की अवधारणा

किसी भी नमूने के अनुमान में कुछ बिखराव होता है, क्योंकि एक विशेष नमूने में मूल्यों के आधार पर एक यादृच्छिक चर है। इसलिए, अधिक विश्वसनीय सांख्यिकीय निष्कर्षों के लिए, न केवल जानना चाहिए बिंदु लागत, लेकिन एक अंतराल भी, जिसकी उच्च संभावना है γ (गामा) अनुमानित संकेतक को कवर करता है θ (थीटा)।

औपचारिक रूप से, ये दो ऐसे मूल्य हैं (आँकड़े) टी1(एक्स)तथा टी2(एक्स), क्या टी 1< T 2 , जिसके लिए संभाव्यता के दिए गए स्तर पर γ शर्त पूरी होती है:

संक्षेप में, संभावना है γ या अधिक सही मान बिंदुओं के बीच है टी1(एक्स)तथा टी2(एक्स), जिन्हें निचला और ऊपरी सीमा कहा जाता है विश्वास अंतराल.

विश्वास अंतराल के निर्माण की शर्तों में से एक इसकी अधिकतम संकीर्णता है, अर्थात। यह जितना संभव हो उतना छोटा होना चाहिए। इच्छा काफी स्वाभाविक है, क्योंकि। शोधकर्ता वांछित पैरामीटर की खोज को अधिक सटीक रूप से स्थानीयकृत करने का प्रयास करता है।

यह इस प्रकार है कि विश्वास अंतराल को वितरण की अधिकतम संभावनाओं को कवर करना चाहिए। और स्कोर ही केंद्र में हो।

अर्थात्, विचलन की संभावना (अनुमान से सही संकेतक की) ऊपर की ओर विचलन की संभावना के बराबर है। यह भी ध्यान दिया जाना चाहिए कि विषम वितरणों के लिए, दाईं ओर का अंतराल बाईं ओर के अंतराल के बराबर नहीं है।

ऊपर दिया गया आंकड़ा स्पष्ट रूप से दिखाता है कि आत्मविश्वास का स्तर जितना अधिक होगा, अंतराल उतना ही व्यापक होगा - एक सीधा संबंध।

यह अज्ञात पैरामीटरों के अंतराल अनुमान के सिद्धांत का एक छोटा सा परिचय था। आइए गणितीय अपेक्षा के लिए विश्वास सीमा खोजने की ओर बढ़ते हैं।

गणितीय अपेक्षा के लिए विश्वास अंतराल

यदि मूल डेटा को वितरित किया जाता है, तो औसत एक सामान्य मान होगा। यह इस नियम से चलता है कि सामान्य मूल्यों के रैखिक संयोजन का भी सामान्य वितरण होता है। इसलिए, संभावनाओं की गणना करने के लिए, हम सामान्य वितरण कानून के गणितीय उपकरण का उपयोग कर सकते हैं।

हालाँकि, इसके लिए दो मापदंडों के ज्ञान की आवश्यकता होगी - अपेक्षित मूल्य और विचरण, जो आमतौर पर ज्ञात नहीं होते हैं। बेशक, आप मापदंडों (अंकगणितीय माध्य और ) के बजाय अनुमानों का उपयोग कर सकते हैं, लेकिन तब माध्य का वितरण बिल्कुल सामान्य नहीं होगा, यह थोड़ा चपटा हो जाएगा। आयरलैंड के नागरिक विलियम गॉसेट ने इस तथ्य को कुशलतापूर्वक नोट किया जब उन्होंने बॉयोमीट्रिका के मार्च 1908 के अंक में अपनी खोज प्रकाशित की। गोपनीयता उद्देश्यों के लिए, गॉसेट ने छात्र के साथ हस्ताक्षर किए। इस तरह छात्र का टी-वितरण दिखाई दिया।

हालांकि, खगोलीय प्रेक्षणों में त्रुटियों के विश्लेषण में के. गॉस द्वारा उपयोग किए गए डेटा का सामान्य वितरण, स्थलीय जीवन में अत्यंत दुर्लभ है और इसे स्थापित करना काफी कठिन है (उच्च सटीकता के लिए लगभग 2 हजार प्रेक्षणों की आवश्यकता होती है)। इसलिए, सामान्यता की धारणा को छोड़ना और उन विधियों का उपयोग करना सबसे अच्छा है जो मूल डेटा के वितरण पर निर्भर नहीं करते हैं।

प्रश्न उठता है: अज्ञात वितरण के डेटा से गणना की जाने पर अंकगणितीय माध्य का वितरण क्या होता है? इसका उत्तर संभाव्यता सिद्धांत में प्रसिद्ध द्वारा दिया गया है केंद्रीय सीमा प्रमेय(सीपीटी)। गणित में, इसके कई संस्करण हैं (वर्षों में योगों को परिष्कृत किया गया है), लेकिन वे सभी, मोटे तौर पर बोलते हुए, इस कथन पर उतरते हैं कि बड़ी संख्या में स्वतंत्र यादृच्छिक चर का योग पालन करता है सामान्य कानूनवितरण।

अंकगणितीय माध्य की गणना करते समय, यादृच्छिक चर के योग का उपयोग किया जाता है। इससे यह पता चलता है कि अंकगणित माध्य का एक सामान्य वितरण है, जिसमें अपेक्षित मूल्य प्रारंभिक डेटा का अपेक्षित मूल्य है, और विचरण है।

स्मार्ट लोग CLT को सिद्ध करना जानते हैं, लेकिन हम इसे Excel में किए गए एक प्रयोग की सहायता से सत्यापित करेंगे। आइए 50 समान रूप से वितरित यादृच्छिक चर के नमूने का अनुकरण करें (उपयोग करके एक्सेल कार्य करता हैयादृच्छिक)। फिर हम ऐसे 1000 नमूने बनाएंगे और प्रत्येक के लिए अंकगणितीय माध्य की गणना करेंगे। आइए उनके वितरण को देखें।

यह देखा जा सकता है कि औसत का वितरण सामान्य कानून के करीब है। यदि नमूनों की मात्रा और उनकी संख्या को और भी बड़ा कर दिया जाए, तो समानता और भी बेहतर होगी।

अब जब हमने स्वयं सीएलटी की वैधता को देख लिया है, तो हम अंकगणितीय माध्य के लिए विश्वास अंतराल की गणना कर सकते हैं, जो किसी दिए गए प्रायिकता के साथ सही माध्य या गणितीय अपेक्षा को कवर करता है।

ऊपरी और निचली सीमा निर्धारित करने के लिए, आपको मापदंडों को जानना होगा सामान्य वितरण. एक नियम के रूप में, वे नहीं हैं, इसलिए अनुमानों का उपयोग किया जाता है: अंकगणित औसततथा नमूना विचरण. फिर, यह विधि केवल बड़े नमूनों के लिए एक अच्छा सन्निकटन देती है। जब नमूने छोटे होते हैं, तो अक्सर छात्र के वितरण का उपयोग करने की अनुशंसा की जाती है। विश्वास मत करो! माध्य के लिए छात्र का वितरण तभी होता है जब मूल डेटा का सामान्य वितरण होता है, यानी लगभग कभी नहीं। इसलिए, आवश्यक डेटा की मात्रा के लिए तुरंत न्यूनतम बार सेट करना और विषम रूप से सही तरीकों का उपयोग करना बेहतर है। वे कहते हैं कि 30 अवलोकन पर्याप्त हैं। 50 लो - तुम गलत नहीं हो सकते।

टी 1.2कॉन्फिडेंस इंटरवल की निचली और ऊपरी सीमाएं हैं

- नमूना अंकगणितीय माध्य

s0- नमूना मानक विचलन (निष्पक्ष)

एन - नमूने का आकार

γ - आत्मविश्वास का स्तर (आमतौर पर 0.9, 0.95 या 0.99 के बराबर)

सी γ =Φ -1 ((1+γ)/2)मानक सामान्य बंटन फलन का व्युत्क्रम है। सरल शब्दों में, यह अंकगणित माध्य से निचली या ऊपरी सीमा तक मानक त्रुटियों की संख्या है (संकेतित तीन संभावनाएं 1.64, 1.96 और 2.58 के मूल्यों के अनुरूप हैं)।

सूत्र का सार यह है कि अंकगणित माध्य लिया जाता है और फिर उसमें से एक निश्चित राशि अलग रखी जाती है ( जी के साथ) मानक त्रुटियां ( एस 0 / √एन). सब कुछ मालूम है, लो और गिन लो।

पीसी के बड़े पैमाने पर उपयोग से पहले, सामान्य वितरण फ़ंक्शन और इसके व्युत्क्रम के मान प्राप्त करने के लिए, वे उपयोग करते थे। वे अभी भी उपयोग किए जा रहे हैं, लेकिन रेडी-मेड की ओर मुड़ना अधिक कुशल है एक्सेल सूत्र. उपरोक्त सूत्र ( , और ) से सभी तत्वों की आसानी से एक्सेल में गणना की जा सकती है। लेकिन कॉन्फिडेंस इंटरवल की गणना के लिए एक रेडीमेड फॉर्मूला भी है - कॉन्फिडेंस नॉर्म. इसका सिंटैक्स निम्न है।

विश्वास मानदंड (अल्फा, मानक_देव, आकार)

अल्फा– सार्थकता स्तर या विश्वास स्तर, जो उपरोक्त संकेतन में 1-γ के बराबर है, अर्थात संभावना है कि गणितीयउम्मीद विश्वास अंतराल के बाहर होगी। पर आत्मविश्वास का स्तर 0.95, अल्फा 0.05 है, और इसी तरह।

मानक बंदनमूना डेटा का मानक विचलन है। आपको मानक त्रुटि की गणना करने की आवश्यकता नहीं है, एक्सेल एन की जड़ से विभाजित होगा।

आकार- नमूना आकार (एन)।

कॉन्फिडेंस.नॉर्म फ़ंक्शन का परिणाम कॉन्फिडेंस इंटरवल की गणना के लिए सूत्र से दूसरा शब्द है, अर्थात। आधा अंतराल। तदनुसार, निचले और ऊपरी बिंदु औसत ± प्राप्त मूल्य हैं।

इस प्रकार, अंकगणित माध्य के लिए विश्वास अंतराल की गणना के लिए एक सार्वभौमिक एल्गोरिथ्म का निर्माण संभव है, जो प्रारंभिक डेटा के वितरण पर निर्भर नहीं करता है। सार्वभौमिकता की कीमत इसकी स्पर्शोन्मुख प्रकृति है, अर्थात। अपेक्षाकृत बड़े नमूनों का उपयोग करने की आवश्यकता। हालाँकि, सदी में आधुनिक प्रौद्योगिकियांसही मात्रा में डेटा एकत्र करना आमतौर पर मुश्किल नहीं होता है।

कॉन्फिडेंस इंटरवल का उपयोग करके सांख्यिकीय परिकल्पनाओं का परीक्षण करना

(मॉड्यूल 111)

आँकड़ों में हल की गई मुख्य समस्याओं में से एक है। संक्षेप में इसका सार यही है। उदाहरण के लिए, एक धारणा बनाई जाती है कि सामान्य आबादी की अपेक्षा कुछ मूल्य के बराबर होती है। फिर नमूना साधनों का वितरण निर्मित होता है, जिसे एक निश्चित अपेक्षा के साथ देखा जा सकता है। अगला, हम देखते हैं कि इस सशर्त वितरण में वास्तविक औसत कहाँ स्थित है। यदि यह स्वीकार्य सीमाओं से परे चला जाता है, तो इस तरह के औसत की उपस्थिति बहुत ही असंभव है, और प्रयोग की एक पुनरावृत्ति के साथ यह लगभग असंभव है, जो परिकल्पना के विपरीत है, जिसे सफलतापूर्वक खारिज कर दिया गया है। यदि औसत महत्वपूर्ण स्तर से आगे नहीं जाता है, तो परिकल्पना को अस्वीकार नहीं किया जाता है (लेकिन यह सिद्ध भी नहीं होता है!)।

तो, विश्वास अंतराल की मदद से, हमारे मामले में अपेक्षा के लिए, आप कुछ परिकल्पनाओं का परीक्षण भी कर सकते हैं। यह करना बहुत आसान है। मान लीजिए कि कुछ नमूने के लिए अंकगणितीय माध्य 100 है। परिकल्पना का परीक्षण किया जा रहा है कि अपेक्षा 90 है। यानी, अगर हम प्रश्न को आदिम रूप से रखते हैं, तो यह इस तरह लगता है: क्या ऐसा हो सकता है, के सही मूल्य के साथ औसत 90 के बराबर, मनाया गया औसत 100 था?

इस प्रश्न का उत्तर देने के लिए मानक विचलन और नमूना आकार पर अतिरिक्त जानकारी की आवश्यकता होगी। मान लीजिए कि मानक विचलन 30 है, और अवलोकनों की संख्या 64 है (आसानी से रूट निकालने के लिए)। तब माध्य की मानक त्रुटि 30/8 या 3.75 होती है। 95% कॉन्फिडेंस इंटरवल की गणना करने के लिए, आपको माध्य के दोनों पक्षों पर दो मानक त्रुटियों को अलग रखना होगा (अधिक सटीक रूप से, 1.96)। कॉन्फ़िडेंस इंटरवल लगभग 100 ± 7.5 या 92.5 से 107.5 होगा।

आगे तर्क इस प्रकार है। यदि परीक्षण मूल्य विश्वास अंतराल के भीतर आता है, तो यह परिकल्पना का खंडन नहीं करता है, क्योंकि यादृच्छिक उतार-चढ़ाव (95% की संभावना के साथ) की सीमा के भीतर फिट बैठता है। यदि परीक्षण बिंदु विश्वास अंतराल के बाहर है, तो ऐसी घटना की संभावना बहुत कम है, किसी भी मामले में स्वीकार्य स्तर से नीचे। इसलिए, परिकल्पना को देखे गए डेटा के विपरीत होने के कारण खारिज कर दिया जाता है। हमारे मामले में, अपेक्षा परिकल्पना विश्वास अंतराल के बाहर है (90 का परीक्षण मूल्य 100±7.5 के अंतराल में शामिल नहीं है), इसलिए इसे अस्वीकार कर दिया जाना चाहिए। उपरोक्त आदिम प्रश्न का उत्तर देते हुए, किसी को यह कहना चाहिए: नहीं, यह किसी भी मामले में बहुत कम ही होता है। अक्सर, यह परिकल्पना (पी-स्तर) की गलत अस्वीकृति की एक विशिष्ट संभावना को इंगित करता है, न कि किसी दिए गए स्तर के अनुसार, जिसके अनुसार विश्वास अंतराल बनाया गया था, लेकिन उस समय और अधिक।

जैसा कि आप देख सकते हैं, माध्य (या गणितीय अपेक्षा) के लिए विश्वास अंतराल बनाना मुश्किल नहीं है। मुख्य बात सार को पकड़ना है, और फिर चीजें चली जाएंगी। व्यवहार में, अधिकांश 95% विश्वास अंतराल का उपयोग करते हैं, जो कि माध्य के दोनों ओर लगभग दो मानक त्रुटियाँ हैं।

अभी के लिए इतना ही। शुभकामनाएं!

कानून के अधीन सामान्य आबादी से एक नमूना बनाया जाए सामान्यवितरण एक्सएन( एम; ). गणितीय आँकड़ों की यह मूल धारणा केंद्रीय सीमा प्रमेय पर आधारित है। सामान्य मानक विचलन ज्ञात होने दें , लेकिन सैद्धांतिक वितरण की गणितीय अपेक्षा अज्ञात है एम(अर्थ )।

इस मामले में, नमूना मतलब है , प्रयोग के दौरान प्राप्त (अनुभाग 3.4.2), एक यादृच्छिक चर भी होगा एम;
). फिर "सामान्यीकृत" विचलन
N(0;1) एक मानक सामान्य यादृच्छिक चर है।

समस्या के लिए अंतराल अनुमान ढूंढना है एम. आइए हम इसके लिए दो तरफा विश्वास अंतराल का निर्माण करें एम ताकि सही गणितीय अपेक्षा दी गई संभावना (विश्वसनीयता) के साथ उससे संबंधित हो .

मान के लिए ऐसा अंतराल सेट करें
का अर्थ है इस मात्रा का अधिकतम मान ज्ञात करना
और न्यूनतम
, जो महत्वपूर्ण क्षेत्र की सीमाएँ हैं:
.

इसलिये यह संभावना है
, तो इस समीकरण की जड़
लाप्लास फ़ंक्शन (तालिका 3, परिशिष्ट 1) की तालिकाओं का उपयोग करके पाया जा सकता है।

फिर संभावना के साथ यह तर्क दिया जा सकता है कि यादृच्छिक चर
, अर्थात वांछित सामान्य माध्य अंतराल से संबंधित है
. (3.13)

मूल्य
(3.14)

बुलाया शुद्धताअनुमान।

संख्या
मात्रासामान्य वितरण - लैपलेस फ़ंक्शन (तालिका 3, परिशिष्ट 1) के एक तर्क के रूप में पाया जा सकता है, अनुपात 2Ф( यू)=, अर्थात। एफ( यू)=
.

इसके विपरीत, निर्दिष्ट विचलन मूल्य के अनुसार यह ज्ञात करना संभव है कि किस संभाव्यता के साथ अज्ञात सामान्य माध्य अंतराल से संबंधित है
. ऐसा करने के लिए, आपको गणना करने की आवश्यकता है

. (3.15)

पुन: चयन की विधि द्वारा सामान्य जनसंख्या से एक यादृच्छिक नमूना लिया जाए। समीकरण से
पाया जा सकता है न्यूनतमपुनर्नमूना मात्रा एनयह सुनिश्चित करने के लिए आवश्यक है कि दी गई विश्वसनीयता के साथ विश्वास अंतराल पूर्व निर्धारित मान से अधिक न हो . सूत्र का उपयोग करके आवश्यक नमूना आकार का अनुमान लगाया गया है:

. (3.16)

तलाश अनुमान सटीकता
:

1) बढ़ते नमूने के आकार के साथ एनआकार कम हो जाती है, और इसलिए अनुमान की सटीकता बढ़ती है.

2) सी बढ़ोतरीअनुमानों की विश्वसनीयता तर्क का मान बढ़ा है यू(इसलिये एफ(यू) नीरस रूप से बढ़ता है) और इसलिए बढ़ती है . इस मामले में, विश्वसनीयता में वृद्धि कम कर देता हैइसके मूल्यांकन की सटीकता .

आकलन
(3.17)

बुलाया क्लासिक(कहाँ पे टीएक पैरामीटर है जिस पर निर्भर करता है तथा एन), इसलिये यह सबसे अधिक बार सामना किए जाने वाले वितरण कानूनों की विशेषता है।

3.5.3 एक अज्ञात मानक विचलन के साथ एक सामान्य वितरण की अपेक्षा का अनुमान लगाने के लिए विश्वास अंतराल 

बता दें कि सामान्य आबादी सामान्य वितरण के कानून के अधीन है एक्सएन( एम;), जहां मूल्य वर्गमूल औसत का वर्गविचलन अनजान।

सामान्य माध्य का अनुमान लगाने के लिए एक विश्वास अंतराल बनाने के लिए, इस मामले में, सांख्यिकी का उपयोग किया जाता है
, जिसके पास विद्यार्थी का वितरण है = एनस्वतंत्रता की -1 डिग्री। यह इस तथ्य से अनुसरण करता है कि N(0;1) (आइटम 3.5.2 देखें), और
(खंड 3.5.3 देखें) और छात्र के वितरण की परिभाषा से (भाग 1. खंड 2.11.2)।

आइए हम छात्र के वितरण के शास्त्रीय अनुमान की सटीकता का पता लगाएं: अर्थात पाना टीसूत्र (3.17) से। असमानता को पूरा करने की संभावना दें
विश्वसनीयता द्वारा दिया गया :

. (3.18)

क्यों कि टीSt( एन-1), यह स्पष्ट है कि टीनिर्भर करता है तथा एन, इसलिए हम आमतौर पर लिखते हैं
.

(3.19)

कहाँ पे
छात्र का वितरण समारोह है एनस्वतंत्रता की -1 डिग्री।

के लिए इस समीकरण को हल करना एम, हमें अंतराल मिलता है
जो विश्वसनीयता के साथ  अज्ञात पैरामीटर को कवर करता है एम.

मूल्य टी , एन-1, कॉन्फ़िडेंस इंटरवल निर्धारित करने के लिए उपयोग किया जाता है अनियमित चर टी(एन-1), के साथ छात्र द्वारा वितरित किया गया एनस्वतंत्रता की -1 डिग्री कहलाती है छात्र का गुणांक. यह दिए गए मूल्यों से पाया जाना चाहिए एनऔर  तालिकाओं से " महत्वपूर्ण बिंदुछात्र वितरण। (तालिका 6, परिशिष्ट 1), जो समीकरण (3.19) के समाधान हैं।

परिणामस्वरूप, हमें निम्नलिखित अभिव्यक्ति मिलती है शुद्धता विचरण अज्ञात है, तो गणितीय अपेक्षा (सामान्य मतलब) का अनुमान लगाने के लिए विश्वास अंतराल:

(3.20)

इस प्रकार, सामान्य जनसंख्या की गणितीय अपेक्षा के लिए विश्वास अंतराल के निर्माण के लिए एक सामान्य सूत्र है:

विश्वास अंतराल की सटीकता कहां है ज्ञात अथवा अज्ञात के आधार पर क्रमशः 3.16 सूत्र के अनुसार प्रसरण पाया जाता है। और 3.20।

टास्क 10।कुछ परीक्षण किए गए, जिनके परिणाम तालिका में सूचीबद्ध हैं:

एक्स मैं

यह ज्ञात है कि वे सामान्य वितरण नियम का पालन करते हैं
. एक अनुमान खोजें एम* गणितीय अपेक्षा के लिए एम, इसके लिए 90% कॉन्फिडेंस इंटरवल बनाएं।

समाधान:

इसलिए, एम(2.53;5.47).

टास्क 11।समुद्र की गहराई को एक ऐसे उपकरण द्वारा मापा जाता है जिसकी व्यवस्थित त्रुटि 0 है, और यादृच्छिक त्रुटियों को सामान्य कानून के अनुसार मानक विचलन के साथ वितरित किया जाता है। =15मी. 90% के विश्वास स्तर के साथ 5 मीटर से अधिक की त्रुटियों के साथ गहराई निर्धारित करने के लिए कितने स्वतंत्र माप किए जाने चाहिए?

समाधान:

समस्या की स्थिति से, हमारे पास है एक्सएन( एम; ), कहाँ पे =15मी, =5मी, =0.9। आइए वॉल्यूम खोजें एन.

1) दी गई विश्वसनीयता के साथ = 0.9, हम तालिका 3 (परिशिष्ट 1) से लाप्लास फ़ंक्शन का तर्क पाते हैं यू = 1.65.

2) दिए गए अनुमान सटीकता को जानना =यू= 5, खोजें
. हमारे पास है

. इसलिए, परीक्षणों की संख्या एन25.

टास्क 12।तापमान नमूनाकरण टीजनवरी के पहले 6 दिनों के लिए तालिका में प्रस्तुत किया गया है:

अपेक्षा के लिए कॉन्फिडेंस इंटरवल खोजें एमआत्मविश्वास की संभावना के साथ सामान्य जनसंख्या
और सामान्य का आकलन करें मानक विचलन एस.

समाधान:


तथा
.

2) निष्पक्ष अनुमान सूत्र द्वारा खोजें
:

=-175

=234.84

;
;

=-192

=116


.

3) चूंकि सामान्य भिन्नता अज्ञात है, लेकिन इसका अनुमान ज्ञात है, फिर गणितीय अपेक्षा का अनुमान लगाना एमहम छात्र वितरण (तालिका 6, अनुबंध 1) और सूत्र (3.20) का उपयोग करते हैं।

इसलिये एन 1 =एन 2 = 6, तब,
, एस 1 =6.85 हमारे पास:
, इसलिए -29.2-4.1<एम 1 < -29.2+4.1.

इसलिए -33.3<एम 1 <-25.1.

इसी तरह, हमारे पास है
, एस 2 = 4.8, इसलिए

–34.9< एम 2 < -29.1. Тогда доверительные интервалы примут вид: एम 1 (-33.3;-25.1) और एम 2 (-34.9;-29.1).

अनुप्रयुक्त विज्ञानों में, उदाहरण के लिए, निर्माण विषयों में, कॉन्फिडेंस इंटरवल्स की तालिकाओं का उपयोग वस्तुओं की सटीकता का आकलन करने के लिए किया जाता है, जो प्रासंगिक संदर्भ साहित्य में दिए गए हैं।

दोस्तों के साथ साझा करें या अपने लिए बचाएं:

लोड हो रहा है...