सामान्य औसत का अनुमान लगाने के लिए विश्वास सूत्र। बार-बार और गैर-दोहराए गए नमूनों की माध्य वर्ग त्रुटि और सामान्य माध्य के लिए एक विश्वास अंतराल का निर्माण

सांख्यिकीय अवलोकन के कार्यक्रम के अनुसार पंजीकृत नमूना इकाइयों की विशेषताओं के मूल्यों के आधार पर, नमूना विशेषताओं के सामान्यीकरण की गणना की जाती है: नमूना माध्य() तथा नमूना शेयरइकाइयाँ जिनमें शोधकर्ताओं के लिए उनकी कुल संख्या में रुचि के कुछ लक्षण हैं ( वू).

नमूने के संकेतकों और सामान्य जनसंख्या के बीच के अंतर को कहा जाता है नमूनाकरण त्रुटि.

नमूनाकरण त्रुटियां, किसी अन्य प्रकार के सांख्यिकीय अवलोकन की त्रुटियों की तरह, पंजीकरण त्रुटियों और प्रतिनिधित्व त्रुटियों में विभाजित हैं। नमूनाकरण विधि का मुख्य कार्य प्रतिनिधित्व की यादृच्छिक त्रुटियों का अध्ययन और माप करना है।

नमूना माध्य और नमूना हिस्सा यादृच्छिक चर हैं जो ले सकते हैं विभिन्न अर्थइस पर निर्भर करता है कि नमूने में जनसंख्या की किन इकाइयों को शामिल किया गया था। इसलिए, नमूनाकरण त्रुटियां भी हैं यादृच्छिक चर हैंऔर विभिन्न मूल्यों को ग्रहण कर सकते हैं। इसलिए, संभावित त्रुटियों का औसत निर्धारित किया जाता है।

औसत नमूना त्रुटि (µ - एमयू) के बराबर है:

बीच के लिए ; शेयर के लिए ,

कहाँ पे आर- सामान्य आबादी में एक निश्चित विशेषता का हिस्सा।

इन सूत्रों में एक्स 2तथा आर(1-आर) सामान्य जनसंख्या की विशेषताएं हैं, जो, जब चयनात्मक अवलोकनअनजान। व्यवहार में, उन्हें कानून के आधार पर नमूने की समान विशेषताओं द्वारा प्रतिस्थापित किया जाता है बड़ी संख्या, जिसके अनुसार पर्याप्त मात्रा में नमूना जनसंख्या सामान्य जनसंख्या की विशेषताओं को सटीक रूप से पुन: पेश करती है। औसत के लिए औसत नमूनाकरण त्रुटियों की गणना के लिए और बार-बार और गैर-दोहराए गए चयनों में हिस्सेदारी के लिए तरीके तालिका में दिए गए हैं। 6.1.

तालिका 6.1.

माध्य और हिस्से के लिए माध्य नमूना त्रुटि की गणना के लिए सूत्र

मान हमेशा एक से कम होता है, इसलिए गैर-दोहराव वाले चयन के साथ औसत नमूनाकरण त्रुटि का मान बार-बार चयन से कम होता है। ऐसे मामलों में जहां नमूना अंश महत्वहीन है और कारक एकता के करीब है, सुधार की उपेक्षा की जा सकती है।

दावा है कि जनरल औसत मूल्यसंकेतक या सामान्य हिस्सा औसत नमूनाकरण त्रुटि की सीमाओं से परे नहीं जाएगा केवल एक निश्चित डिग्री की संभावना के साथ संभव है। इसलिए, नमूना त्रुटि को चिह्नित करने के लिए, औसत त्रुटि के अलावा, हम गणना करते हैं सीमांत नमूना त्रुटि(Δ), जो इसकी गारंटी देने वाले प्रायिकता के स्तर से संबंधित है।

संभाव्यता स्तर ( आर) सामान्यीकृत विचलन का मान निर्धारित करता है ( टी), और इसके विपरीत। मूल्यों टीतालिकाओं में दिया गया सामान्य वितरणसंभावनाएं सबसे अधिक इस्तेमाल किया जाने वाला संयोजन टीतथा आरतालिका में दिए गए हैं। 6.2.


तालिका 6.2

मानक विचलन मान टीसंभाव्यता स्तरों के संगत मूल्यों के साथ आर

टी 1,0 1,5 2,0 2,5 3,0 3,5
आर 0,683 0,866 0,954 0,988 0,997 0,999

टीएक आत्मविश्वास कारक है जो उस संभावना पर निर्भर करता है जिसके साथ यह गारंटी दी जा सकती है कि सीमांत त्रुटि अधिक नहीं होगी टीबार माध्य त्रुटि। यह दर्शाता है कि सीमांत त्रुटि में कितनी औसत त्रुटियां निहित हैं।. तो अगर टी= 1, तो 0.683 की संभावना के साथ यह तर्क दिया जा सकता है कि नमूना और सामान्य संकेतकों के बीच का अंतर एक औसत त्रुटि से अधिक नहीं होगा।

सीमांत नमूनाकरण त्रुटियों की गणना के लिए सूत्र तालिका में दिए गए हैं। 6.3.

तालिका 6.3।

माध्य और हिस्से के लिए सीमांत नमूनाकरण त्रुटि की गणना के लिए सूत्र

नमूने की सीमांत त्रुटियों की गणना करने के बाद, कोई पाता है सामान्य संकेतकों के लिए विश्वास अंतराल. नमूना विशेषता की त्रुटि की गणना करते समय जिस संभावना को ध्यान में रखा जाता है उसे आत्मविश्वास का स्तर कहा जाता है। 0.95 की संभाव्यता के विश्वास स्तर का अर्थ है कि 100 में से केवल 5 मामलों में त्रुटि स्थापित सीमा से आगे जा सकती है; 0.954 की संभावनाएं - 1000 में से 46 मामलों में, और 0.999 पर - 1000 में से 1 मामले में।

सामान्य औसत के लिए, प्रतिनिधित्व की सीमांत त्रुटि को ध्यान में रखते हुए, सबसे संभावित सीमाएं जिसमें यह होगी, इस तरह दिखेगी:

.

सबसे संभावित सीमाएँ जिनमें सामान्य हिस्सा स्थित होगा, वे इस तरह दिखेंगी:

.

यहाँ से, सामान्य औसत , सामान्य हिस्सा .

तालिका में दिया गया है। 6.3. वास्तविक यादृच्छिक और यांत्रिक विधियों द्वारा किए गए नमूनाकरण त्रुटियों को निर्धारित करने में सूत्रों का उपयोग किया जाता है।

स्तरीकृत चयन के साथ, सभी समूहों के प्रतिनिधि अनिवार्य रूप से नमूने में आते हैं, और आमतौर पर सामान्य जनसंख्या के समान अनुपात में। इसलिए, इस मामले में नमूनाकरण त्रुटि मुख्य रूप से इंट्राग्रुप भिन्नताओं के औसत पर निर्भर करती है। प्रसरण जोड़ने के नियम के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि स्तरीकृत चयन के लिए नमूना त्रुटि हमेशा उचित यादृच्छिक चयन के लिए कम होगी।

सीरियल (नेस्टेड) ​​चयन के साथ, अस्थिरता का माप होगा अंतरसमूह विचरण.

नमूना जनसंख्या के संकेतक और सामान्य जनसंख्या के वांछित संकेतक (पैरामीटर) के बीच, एक नियम के रूप में, कुछ असहमति हैं, जिन्हें कहा जाता है नमूनाकरण त्रुटियां।कुल नमूनाकरण त्रुटि में दो प्रकार की त्रुटियां होती हैं: पंजीकरण त्रुटियाँ और प्रतिनिधित्व त्रुटियाँ।

पंजीकरण त्रुटियां किसी के लिए भी आम हैं सांख्यिकीय अवलोकनऔर उनकी उपस्थिति रजिस्ट्रार की असावधानी, गलत गणना, माप उपकरणों की अपूर्णता आदि के कारण हो सकती है।

प्रतिनिधित्व त्रुटियाँ केवल नमूना अवलोकन में निहित हैं और इसकी प्रकृति के कारण हैं, क्योंकि इकाइयों का चयन कितनी सावधानी से और सही ढंग से किया जाता है, नमूना आबादी के औसत और सापेक्ष संकेतक हमेशा संबंधित संकेतकों से कुछ हद तक भिन्न होंगे। सामान्य आबादी का।

प्रतिनिधित्व की व्यवस्थित और यादृच्छिक त्रुटियों के बीच भेद। व्यवस्थित प्रतिनिधित्व त्रुटियाँ अशुद्धियाँ हैं जो नमूना आबादी में इकाइयों के चयन के लिए शर्तों का अनुपालन न करने के परिणामस्वरूप उत्पन्न होती हैं, जो सामान्य आबादी की प्रत्येक इकाई को नमूने में आने के लिए समान अवसर प्रदान नहीं करती हैं। यादृच्छिक प्रतिनिधित्व त्रुटियाँ ऐसी त्रुटियाँ हैं जो इस तथ्य के कारण उत्पन्न होती हैं कि नमूना सर्वेक्षण की असंतत प्रकृति के कारण सामान्य जनसंख्या (माध्य, अनुपात, विचरण, आदि) की विशेषताओं को सटीक रूप से पुन: पेश नहीं करता है।

यादृच्छिक चयन के सिद्धांत के अधीन, नमूना त्रुटि का आकार मुख्य रूप से नमूने के आकार पर निर्भर करता है। कैसे अधिक ताकतनमूनाकरण, ceteris paribus, नमूनाकरण त्रुटि जितनी छोटी होगी। एक बड़े नमूना आकार के साथ, बड़ी संख्या के कानून का संचालन अधिक स्पष्ट रूप से प्रकट होता है, जिसके अनुसार: एक के करीब मनमाने ढंग से संभावना के साथ, यह तर्क दिया जा सकता है कि पर्याप्त रूप से बड़े नमूना आकार और सीमित भिन्नता के साथ, नमूना विशेषताओं ( औसत हिस्सा) संबंधित सामान्य विशेषताओं से मनमाने ढंग से थोड़ा भिन्न होगा।

नमूना त्रुटि का आकार भी अध्ययन के तहत विशेषता की भिन्नता की डिग्री से सीधे संबंधित है, और भिन्नता की डिग्री, जैसा कि ऊपर उल्लेख किया गया है, आंकड़ों में भिन्नता के आकार (बिखरने) की विशेषता है: विचरण जितना छोटा होगा, नमूनाकरण त्रुटि जितनी छोटी होगी, सांख्यिकीय निष्कर्ष उतने ही विश्वसनीय होंगे। इसलिए, व्यवहार में, विचरण को नमूना त्रुटि के साथ पहचाना जाता है।

चूंकि सामान्य जनसंख्या का पैरामीटर वांछित मूल्य है और यह अज्ञात है, इसलिए किसी विशिष्ट त्रुटि पर नहीं, बल्कि सभी संभावित नमूनों के औसत पर ध्यान देना आवश्यक है।

यदि सामान्य जनसंख्या में से कई नमूना सेट चुने जाते हैं, तो प्रत्येक परिणामी नमूना देगा अलग अर्थविशिष्ट त्रुटि।

मध्यम वर्ग मूल्य /तथाविशिष्ट त्रुटियों (;) के सभी संभावित मूल्यों से गणना की जाएगी:

जहाँ * और - नमूना का अर्थ है; x - सामान्य औसत;)] - 1 \u003d ~ si - x के संदर्भ में नमूनों की संख्या।

औसत मानक विचलनसामान्य माध्य से प्रतिदर्श माध्य को माध्य प्रतिचयन त्रुटि कहते हैं।

नमूनाकरण त्रुटि के आकार की संख्या और विशेषता की भिन्नता की डिग्री पर निर्भरता औसत नमूना त्रुटि / यू के सूत्र में व्यक्त की जाती है।

माध्य त्रुटि का वर्ग (नमूना माध्य का विचरण) प्रसरण के सीधे समानुपाती होता हैएक सौ और नमूना आकार n के व्युत्क्रमानुपाती:

सामान्य जनसंख्या में सुविधा का विचरण कहाँ है।

इसलिए औसत त्रुटि सामान्य दृष्टि सेसूत्र द्वारा निर्धारित:

इसलिए, नमूने से मानक विचलन निर्धारित करने के बाद, हम औसत नमूना त्रुटि का मान निर्धारित कर सकते हैं, जिसका मान, जैसा कि सूत्र से निम्नानुसार है, अधिक है, यादृच्छिक चर की भिन्नता जितनी अधिक होगी और उतनी ही छोटी होगी। नमूना आकार बड़ा।

इसलिए, जैसे-जैसे नमूना आकार बढ़ता है, माध्य त्रुटि का आकार घटता जाता है। यदि, उदाहरण के लिए, औसत नमूना त्रुटि को आधा करना आवश्यक है, तो नमूना आकार चार गुना बढ़ाया जाना चाहिए; यदि नमूना त्रुटि को तीन के कारक से कम करना आवश्यक है, तो नमूना आकार बढ़ाया जाना चाहिए नौ बार, आदि।

व्यावहारिक गणना में, औसत नमूनाकरण त्रुटि के लिए दो सूत्र माध्य और हिस्से के लिए उपयोग किए जाते हैं।

औसत के चयनात्मक अध्ययन में, औसत त्रुटि का सूत्र है:

पढ़ाई करते समय सापेक्ष संकेतक(आंशिक संकेत) औसत त्रुटि के सूत्र का रूप है:

कहाँ पेजी - सामान्य आबादी में विशेषता का हिस्सा।

उपरोक्त माध्य त्रुटि सूत्रों का अनुप्रयोग मानता है कि सामान्य विचरण और सामान्य अनुपात ज्ञात हैं। हालांकि, वास्तव में, ये संकेतक अज्ञात हैं और सामान्य आबादी पर डेटा की कमी के कारण उनकी गणना करना असंभव है। इसलिए, सामान्य विचरण और सामान्य हिस्से को उनके करीब के अन्य मूल्यों के साथ बदलने की आवश्यकता है।

पर गणितीय सांख्यिकीयह साबित हो गया है कि नमूना भिन्नता (ओं) और नमूना अंश (सह) ऐसी मात्रा हो सकती है।

इसे ध्यान में रखते हुए, माध्य त्रुटि सूत्र निम्नानुसार लिखे जा सकते हैं:

ये सूत्र औसत पुन: नमूनाकरण त्रुटि को निर्धारित करना संभव बनाते हैं। सरल यादृच्छिक के अनुप्रयोग resamplingव्यवहार में सीमित है। सबसे पहले, समान इकाइयों का पुन: सर्वेक्षण करना अव्यावहारिक और कभी-कभी असंभव है। बार-बार चयन के बजाय गैर-दोहराव चयन का उपयोग भी नमूने की सटीकता और विश्वसनीयता की डिग्री बढ़ाने की आवश्यकता से तय होता है। इसलिए, व्यवहार में, गैर-दोहराव यादृच्छिक चयन की विधि अधिक बार उपयोग की जाती है। चयन की इस पद्धति के अनुसार, नमूने में चयनित जनसंख्या की इकाई आगे के चयन में भाग नहीं लेती है। पहले से चयनित इकाइयों की संख्या से घटाकर, जनसंख्या से इकाइयों का चयन किया जाता है। इसलिए, प्रत्येक चयन के बाद सामान्य जनसंख्या के आकार में परिवर्तन और शेष इकाइयों के लिए चयन की संभावना के संबंध में, औसत नमूना त्रुटि के लिए सूत्रों में एक सुधार कारक पेश किया जाता है

जहाँ N सामान्य जनसंख्या का आकार है; पी- नमूने का आकार। जब पर्याप्त बहुत महत्वहर में इकाई द्वारा N की उपेक्षा की जा सकती है। फिर

इसलिए, माध्य और हिस्से के लिए गैर-दोहराव चयन के लिए माध्य नमूना त्रुटि के सूत्र क्रमशः हैं:

क्यों कि पीहमेशा M से कम होता है, तो अतिरिक्त गुणनखंड हमेशा एक से कम होता है। इसलिए, गैर-दोहराव चयन के साथ नमूना त्रुटि का निरपेक्ष मान हमेशा बार-बार चयन से कम होगा।

यदि नमूना आकार काफी बड़ा है, तो 1 ^ का मान एकता के करीब है, और इसलिए इसे उपेक्षित किया जा सकता है। फिर यादृच्छिक गैर-दोहराव चयन की औसत त्रुटि स्व-यादृच्छिक पुन: नमूनाकरण के सूत्र द्वारा निर्धारित की जाती है।

हमारे उदाहरण के लिए, हम उपज के लिए औसत त्रुटि और 25 सेंटीमीटर प्रति हेक्टेयर या उससे अधिक की उपज वाले भूखंडों के अनुपात की गणना करते हैं।

औसत नमूना त्रुटि

क) जौ की औसत उपज

सामान्य जनसंख्या में जौ की औसत उपज x -जी^\u003d 25.1 ± 0.12 c / ha, यानी यह 24.98 से 25.22 c / ha की सीमा में है।

सामान्य जनसंख्या में 25 c/ha और अधिक उपज वाले भूखंडों का हिस्सा р

टी- ^ टी = 0.80 ± 0.07, यानी। 73 से 87% के बीच है।

औसत नमूना त्रुटि सामान्य जनसंख्या की विशेषताओं से नमूना जनसंख्या की विशेषताओं के संभावित विचलन को दर्शाती है। उसी समय, नमूनाकरण करते समय, शोधकर्ता अक्सर न केवल औसत त्रुटि की गणना करने के कार्य का सामना करते हैं, बल्कि अधिकतम संभव नमूनाकरण त्रुटि का निर्धारण भी करते हैं। औसत त्रुटि को जानकर, उन सीमाओं को निर्धारित करना संभव है जिनके आगे नमूना त्रुटि का मूल्य नहीं जाएगा। हालांकि, यह दावा करना संभव है कि ये विचलन किसी दिए गए मान से अधिक नहीं होंगे, पूर्ण निश्चितता के साथ नहीं, बल्कि केवल एक निश्चित डिग्री की संभावना के साथ। संभाव्यता का वह स्तर जो संभावित सीमाओं को निर्धारित करने में स्वीकार किया जाता है, जिसमें सामान्य जनसंख्या के मापदंडों के मान शामिल होते हैं, प्रायिकता का आत्मविश्वास स्तर कहलाता है।

आत्मविश्वास की संभावना- यह एक उच्च और ऐसा है कि इसे व्यावहारिक रूप से प्रत्येक विशिष्ट मामले में किया जाता है, संभावना जो विश्वसनीय सांख्यिकीय निष्कर्ष की गारंटी देती है। आइए इसे द्वारा निरूपित करें जीऔर इस स्तर को पार करने की संभावना है एक। इसलिए,एक =1 - आर संभावनाएक महत्व का स्तर कहा जाता है(भौतिकता), जो विशेषता है सापेक्ष संख्यानिष्कर्षों की कुल संख्या में गलत निष्कर्ष और एक और विश्वास संभावना के बीच अंतर के रूप में परिभाषित किया गया है, जिसे स्वीकार किया जाता है।

स्तर आत्मविश्वास का स्तरजिम्मेदारी की डिग्री और हल किए जा रहे कार्यों की प्रकृति के आधार पर शोधकर्ता को स्थापित करता है। पर सांख्यिकीय अध्ययनअर्थशास्त्र में, सबसे अधिक इस्तेमाल किया जाने वाला आत्मविश्वास का स्तर है जी = 0.95; पी = 0.99 (क्रमशः, महत्व स्तरएक = 0,05; एक = 0.01) कम बारजी = 0.999। उदाहरण के लिए, आत्मविश्वास का स्तरजी = 0.99 का अर्थ है कि 100 में से 99 मामलों में अनुमान त्रुटि स्थापित मूल्य से अधिक नहीं होगी और 100 में से केवल एक मामले में यह गणना मूल्य तक पहुंच सकता है या इससे अधिक हो सकता है।

विश्वसनीय संभाव्यता की एक निश्चित डिग्री के साथ गणना की गई नमूना त्रुटि को कहा जाता हैसीमांत नमूना त्रुटि एर.

आइए विचार करें कि संभावित सीमांत नमूनाकरण त्रुटि का मूल्य कैसे स्थापित किया जाता है। मूल्यईपी सामान्यीकृत विचलन u से संबंधित है, जिसे सीमांत नमूना त्रुटि के अनुपात के रूप में परिभाषित किया गया हैईपी औसत त्रुटि के लिएतथा:

गणना की सुविधा के लिए, एक यादृच्छिक चर का उसके माध्य मान से विचलन आमतौर पर मानक विचलन की इकाइयों में व्यक्त किया जाता है। अभिव्यक्ति

बुलायामानक विचलन। में सांख्यिकीय साहित्य मेंतथा बुलायाआत्मविश्वास कारक, या माध्य नमूना त्रुटि की बहुलता।

तो, नमूना माध्य का सामान्यीकृत विचलन सूत्र द्वारा निर्धारित किया जा सकता है:

और _є_r_

अभिव्यक्ति से 1 कोई संभावित सीमांत नमूनाकरण त्रुटि पा सकता है

ईपी = मैं / एल।

के बजाय प्रतिस्थापनडी। इसके मूल्य में, हम औसत के लिए सीमांत नमूनाकरण त्रुटियों और गैर-दोहराए गए यादृच्छिक चयन के अनुपात के लिए सूत्र प्रस्तुत करते हैं:

इसलिए, सीमांत नमूनाकरण त्रुटि माध्य त्रुटि और सामान्यीकृत विचलन के मूल्य पर निर्भर करती है और माध्य नमूना त्रुटियों की संख्या के ± एक गुणक के बराबर होती है।

माध्य और सीमांत नमूनाकरण त्रुटियों को मात्रा कहा जाता है और समान इकाइयों में अंकगणित माध्य और मानक विचलन के रूप में व्यक्त किया जाता है।

सामान्यीकृत विचलन कार्यात्मक रूप से संभाव्यता से संबंधित है। मूल्यों को खोजने के लिएतथा विशेष तालिकाओं को संकलित किया गया है (जोड़ें 2), जिसके द्वारा आप मूल्य पा सकते हैंतथाआत्मविश्वास के एक निश्चित स्तर पर संभाव्यता और ज्ञात पर संभाव्यता मूल्य और।

हम मूल्यों को प्रस्तुत करते हैंतथा और आकार के साथ नमूनों के लिए उनकी संबंधित संभावनाएंएन> 30, जिसका उपयोग अक्सर व्यावहारिक गणनाओं में किया जाता है:

इसलिए, अतऔर = 1 एकल औसत नमूना त्रुटि के मान से सामान्य विशेषताओं से नमूना विशेषताओं के विचलन की संभावना 0.6827 है। इसका मतलब यह है कि, औसतन, प्रत्येक 1000 नमूनों में से, 683 सामान्यीकृत विशेषताएँ देंगे जो सामान्य सामान्यीकृत विशेषताओं से एक से अधिक माध्य त्रुटि से भिन्न नहीं होंगी। यू = 2 के लिए, संभावना 0.9545 है। में इसका अर्थ है कि प्रत्येक से 1000 नमूने 954 सामान्यीकृत विशेषताएं देंगे जो सामान्य सामान्यीकृत विशेषताओं से औसत नमूना त्रुटि के दो गुना से अधिक नहीं होगी, और इसी तरह।

हालांकि, इस तथ्य के कारण कि, एक नियम के रूप में, केवल एक नमूना लिया जाता है, हम कहते हैं कि, उदाहरण के लिए, 0.9545 की संभावना के साथ, यह गारंटी दी जा सकती है कि सीमांत त्रुटि का आकार औसत नमूने के दो गुना से अधिक नहीं होगा। गलती।

यह गणितीय रूप से सिद्ध हो चुका है कि नमूना त्रुटि और औसत त्रुटि का अनुपात, एक नियम के रूप में, से अधिक नहीं हैपर्याप्त रूप से बड़ी संख्या में n के लिए ± 3d, इस तथ्य के बावजूद कि नमूना त्रुटि किसी भी मूल्य को प्राप्त कर सकती है। दूसरे शब्दों में, हम कह सकते हैं कि निर्णय की पर्याप्त उच्च संभावना (पी = 0.9973) के साथ, सीमांत नमूनाकरण त्रुटि, एक नियम के रूप में, तीन औसत नमूना त्रुटियों से अधिक नहीं होती है। इसलिए, संभावित नमूनाकरण त्रुटि की सीमा के रूप में मान Ep = 3d लिया जा सकता है।

हमारे उदाहरण के लिए, आइए औसत उपज के लिए सीमांत नमूना त्रुटि और 25 q/ha या अधिक की उपज वाले भूखंडों का अनुपात निर्धारित करें। हम प्रायिकता का विश्वास स्तर Р = 0.9545 के बराबर लेते हैं। में तालिका के अनुसार (एप्लिकेशन।.2) मूल्यों का पता लगाएं और = 2. उपज के लिए औसत नमूनाकरण त्रुटियां और 25 सी / हेक्टेयर और अधिक की उपज वाले भूखंडों का अनुपात पहले पाया गया था और क्रमशः थे: सी~= ±0.12 क्यू / हेक्टेयर;एमआर = ± 0.07।

जौ की औसत उपज की सीमांत त्रुटि:

तो, नमूना औसत उपज और सामान्य औसत के बीच का अंतर 0.24 सी / हेक्टेयर से अधिक नहीं होगा। सामान्य जनसंख्या में औसत उपज की सीमाएँ: x = x ± हाँ ~ = 25.1 + 0.24, यानी 24.86 से 25.34 q/ha तक।

25 सेंटीमीटर प्रति हेक्टेयर या उससे अधिक की उपज वाले भूखंडों के हिस्से की सीमांत त्रुटि:

नतीजतन, 25 सी / हेक्टेयर की उपज के साथ भूखंडों के अनुपात को निर्धारित करने में मामूली त्रुटि और अब 14% से अधिक नहीं है, यानी सामान्य आबादी में संकेतित उपज वाले भूखंडों का अनुपात भीतर है: जी= ए> ± एपी = 0.80 ± 0.14, यानी 66 से 94% तक।

नमूनाकरण त्रुटि- यह नमूने की विशेषताओं और सामान्य आबादी के बीच एक उद्देश्यपूर्ण रूप से उत्पन्न होने वाली विसंगति है। यह कई कारकों पर निर्भर करता है: अध्ययन के तहत विशेषता की भिन्नता की डिग्री, नमूने का आकार, नमूने में इकाइयों के चयन की विधि, शोध परिणाम की विश्वसनीयता का स्वीकृत स्तर।

नमूने की प्रतिनिधित्वशीलता के लिए, चयन की यादृच्छिकता सुनिश्चित करना महत्वपूर्ण है, ताकि सामान्य आबादी में सभी वस्तुओं के नमूने में शामिल होने की समान संभावनाएं हों। नमूने की प्रतिनिधित्वशीलता सुनिश्चित करने के लिए, निम्नलिखित चयन विधियों का उपयोग किया जाता है:

· उचित यादृच्छिक(सरल यादृच्छिक) नमूनाकरण (पहली यादृच्छिक वस्तु क्रमिक रूप से चुनी जाती है);

· यांत्रिक(व्यवस्थित) नमूनाकरण;

· ठेठ(स्तरीकृत, स्तरीकृत) नमूना (वस्तुओं का चयन सामान्य जनसंख्या में विभिन्न प्रकार की वस्तुओं के प्रतिनिधित्व के अनुपात में किया जाता है);

· धारावाहिक(नेस्टेड) ​​नमूना।

नमूना सेट में इकाइयों का चयन दोहराया या गैर-दोहराया जा सकता है। पर पुन: चयननमूना इकाई परीक्षा के अधीन है, अर्थात। इसकी विशेषताओं के मूल्यों को दर्ज करते हुए, सामान्य आबादी को वापस कर दिया जाता है और अन्य इकाइयों के साथ, आगे की चयन प्रक्रिया में भाग लेता है। पर नो-सिलेक्शननमूना इकाई परीक्षा के अधीन है और आगे की चयन प्रक्रिया में भाग नहीं लेती है

चयनात्मक अवलोकन हमेशा एक त्रुटि से जुड़ा होता है, क्योंकि चयनित इकाइयों की संख्या मूल (सामान्य) जनसंख्या के बराबर नहीं होती है। यादृच्छिक नमूनाकरण त्रुटियां यादृच्छिक कारकों की कार्रवाई के कारण होती हैं जिनमें गणना की गई नमूना विशेषताओं पर प्रभाव की दिशा में स्थिरता के कोई तत्व नहीं होते हैं। यहां तक ​​​​कि नमूना आबादी बनाने के सभी सिद्धांतों के सख्त पालन के साथ, नमूना और सामान्य विशेषताएं कुछ हद तक भिन्न होंगी। इसलिए, परिणामी यादृच्छिक त्रुटियों को सांख्यिकीय रूप से अनुमानित किया जाना चाहिए और नमूना अवलोकन के परिणामों को पूरी आबादी तक विस्तारित करते समय ध्यान में रखा जाना चाहिए। ऐसी त्रुटियों का अनुमान चयनात्मक अवलोकन के सिद्धांत में हल की जाने वाली मुख्य समस्या है। प्रतिलोम समस्या नमूना जनसंख्या की ऐसी न्यूनतम आवश्यक संख्या निर्धारित करना है, जिसमें त्रुटि किसी दिए गए मान से अधिक न हो। इस खंड की सामग्री का उद्देश्य इन समस्याओं को हल करने में कौशल विकसित करना है।

स्व-यादृच्छिक नमूनाकरण. इसका सार सामान्य आबादी से इकाइयों के चयन में निहित है, इसे समूहों, उपसमूहों या व्यक्तिगत इकाइयों की एक श्रृंखला में विभाजित किए बिना। इस मामले में, इकाइयों को एक यादृच्छिक क्रम में चुना जाता है, जो या तो कुल में इकाइयों के अनुक्रम पर या उनकी विशेषताओं के मूल्यों पर निर्भर नहीं करता है।

यादृच्छिकता के सिद्धांत को लागू करने वाले या तालिका के आधार पर एल्गोरिदम में से किसी एक का उपयोग करके चयन के बाद यादृच्छिक संख्या, सामान्य विशेषताओं की सीमाएँ निर्धारित की जाती हैं। इसके लिए, माध्य और सीमांत नमूनाकरण त्रुटियों की गणना की जाती है।

बार-बार यादृच्छिक नमूने लेने की औसत त्रुटिसूत्र द्वारा निर्धारित किया जाता है

जहां अध्ययन के तहत विशेषता का मानक विचलन है;

n नमूना जनसंख्या का आयतन (इकाइयों की संख्या) है।

सीमांत नमूना त्रुटिसंभाव्यता के एक निश्चित स्तर के साथ जुड़ा हुआ है। नीचे प्रस्तुत समस्याओं को हल करते समय, अपेक्षित प्रायिकता 0.954 (t = 2) या 0.997 (t = 3) है। प्रायिकता के चुने हुए स्तर और उसके अनुरूप t के मान को ध्यान में रखते हुए, सीमांत नमूनाकरण त्रुटि होगी:

तब यह तर्क दिया जा सकता है कि किसी दी गई संभावना के लिए, सामान्य औसत निम्नलिखित सीमाओं के भीतर होगा:

सीमाओं को परिभाषित करते समय सामान्य हिस्साऔसत नमूना त्रुटि की गणना करते समय, वैकल्पिक विशेषता के विचरण का उपयोग किया जाता है, जिसकी गणना निम्न सूत्र द्वारा की जाती है:

जहां डब्ल्यू नमूना हिस्सा है, यानी, उन इकाइयों का अनुपात जिनके पास अध्ययन के तहत विशेषता के एक निश्चित प्रकार या प्रकार हैं।

व्यक्तिगत समस्याओं को हल करते समय, यह ध्यान में रखा जाना चाहिए कि वैकल्पिक सुविधा के अज्ञात भिन्नता के साथ, आप इसके अधिकतम संभव मान 0.25 के बराबर उपयोग कर सकते हैं।

उदाहरण. बेरोजगार आबादी के एक नमूना सर्वेक्षण के परिणामस्वरूप, नौकरी खोजने वालापर आधारित स्व-यादृच्छिक पुन: नमूनाकरणतालिका में दिखाया गया डेटा प्राप्त किया। 1.14.

तालिका 1.14

बेरोजगार आबादी के एक नमूना सर्वेक्षण के परिणाम

0.954 की संभावना के साथ सीमाएँ निर्धारित करें:

क) बेरोजगार आबादी की औसत आयु;

बी) कुल बेरोजगार आबादी में 25 वर्ष से कम आयु के व्यक्तियों का हिस्सा (अनुपात)।

समाधान।औसत नमूना त्रुटि निर्धारित करने के लिए, सबसे पहले, अध्ययन के तहत नमूना माध्य और विशेषता के विचरण को निर्धारित करना आवश्यक है। ऐसा करने के लिए, गणना की एक मैनुअल विधि के साथ, तालिका 1.15 बनाने की सलाह दी जाती है।

तालिका 1.15

बेरोजगार आबादी और फैलाव की औसत आयु की गणना

तालिका में डेटा के आधार पर, आवश्यक संकेतकों की गणना की जाती है:

चयनात्मक औसत मूल्य:

;

भिन्नता:

मानक विचलन:

.

औसत नमूनाकरण त्रुटि होगी:

वर्ष का।

हम 0.954 की संभावना के साथ निर्धारित करते हैं ( टी= 2) सीमांत नमूनाकरण त्रुटि:

वर्ष का।

सामान्य औसत की सीमाएँ निर्धारित करें: (41.2 - 1.6) (41.2 + 1.6) या:

इस प्रकार, 0.954 की संभावना के साथ किए गए नमूना सर्वेक्षण के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि औसत उम्रकाम की तलाश में बेरोजगार आबादी की संख्या 40 से 43 वर्ष के बीच है।

इस उदाहरण के पैराग्राफ "बी" में पूछे गए प्रश्न का उत्तर देने के लिए, नमूना डेटा का उपयोग करके, हम 25 वर्ष से कम आयु के लोगों के अनुपात का निर्धारण करते हैं और शेयर के फैलाव की गणना करते हैं:

औसत नमूना त्रुटि की गणना करें:

सीमांत नमूना त्रुटि के साथ दी गई संभावनाहोगा:

आइए सामान्य हिस्से की सीमाओं को परिभाषित करें:

इसलिए, 0.954 की संभावना के साथ, यह तर्क दिया जा सकता है कि कुल बेरोजगार आबादी में 25 वर्ष से कम आयु के लोगों का अनुपात 3.9 से 1.9% के बीच है।

माध्य त्रुटि की गणना करते समय वास्तव में यादृच्छिक गैर-दोहरावनमूनाकरण, चयन की गैर-पुनरावृत्ति के लिए सुधार को ध्यान में रखना आवश्यक है:

जहाँ N सामान्य जनसंख्या का आयतन (इकाइयों की संख्या) है /

स्व-यादृच्छिक पुन: नमूनाकरण की आवश्यक मात्रासूत्र द्वारा निर्धारित किया जाता है:

यदि चयन गैर-दोहराव है, तो सूत्र निम्नलिखित रूप लेता है:

इन सूत्रों का उपयोग करके प्राप्त परिणाम को हमेशा निकटतम पूर्ण संख्या तक पूर्णांकित किया जाता है।

उदाहरण। 2 सेमी की मामूली त्रुटि के साथ पहले ग्रेडर की औसत ऊंचाई की सीमाओं को निर्धारित करने के लिए यह निर्धारित करना आवश्यक है कि जिले के स्कूलों के पहले ग्रेड में कितने छात्रों को यादृच्छिक गैर-दोहराए गए नमूने के क्रम में चुना जाना चाहिए 0.997 की संभावना के साथ। दूसरे जिले में इसी तरह के सर्वेक्षण के परिणामों के अनुसार, यह 24 था।

समाधान। 0.997 के प्रायिकता स्तर पर आवश्यक नमूना आकार ( टी= 3) होगा:

इस प्रकार, दी गई सटीकता के साथ प्रथम-ग्रेडर की औसत ऊंचाई पर डेटा प्राप्त करने के लिए, 52 स्कूली बच्चों की जांच करना आवश्यक है।

यांत्रिक नमूनाकरण. इस नमूने में स्थापित चयन प्रतिशत के अनुसार नियमित अंतराल पर सामान्य जनसंख्या की इकाइयों की सामान्य सूची से इकाइयों का चयन होता है। एक यांत्रिक नमूने की औसत त्रुटि, साथ ही इसकी आवश्यक संख्या को निर्धारित करने के लिए समस्याओं को हल करते समय, उचित यादृच्छिक गैर-दोहराव चयन में उपयोग किए गए उपरोक्त सूत्रों का उपयोग करना चाहिए।

इसलिए, 2% नमूने के साथ, प्रत्येक 50वीं इकाई (1:0.02), 5% नमूने के साथ, प्रत्येक 20वीं इकाई (1:0.05), आदि का चयन किया जाता है।

इस प्रकार, चयन के स्वीकृत अनुपात के अनुसार, सामान्य जनसंख्या, जैसा कि वह थी, यंत्रवत् समान समूहों में विभाजित है। नमूने में प्रत्येक समूह से केवल एक इकाई का चयन किया जाता है।

यांत्रिक नमूने की एक महत्वपूर्ण विशेषता यह है कि एक नमूना आबादी का गठन लिस्टिंग का सहारा लिए बिना किया जा सकता है। व्यवहार में, जिस क्रम में जनसंख्या इकाइयाँ वास्तव में रखी जाती हैं, उसका उपयोग अक्सर किया जाता है। उदाहरण के लिए, एक कन्वेयर या उत्पादन लाइन से तैयार उत्पादों के उत्पादन का क्रम, वह क्रम जिसमें माल के एक बैच की इकाइयों को भंडारण, परिवहन, बिक्री आदि के दौरान रखा जाता है।

विशिष्ट नमूना।इस नमूने का उपयोग तब किया जाता है जब सामान्य जनसंख्या की इकाइयों को कई बड़े विशिष्ट समूहों में जोड़ा जाता है। नमूने में इकाइयों का चयन उचित यादृच्छिक या यांत्रिक नमूने के उपयोग के आधार पर उनके आकार के अनुपात में इन समूहों के भीतर किया जाता है (यदि आवश्यक जानकारी उपलब्ध है, तो चयन भी विशेषता की भिन्नता के अनुपात में किया जा सकता है) समूहों में अध्ययन के तहत)।

विशिष्ट नमूनाकरण आमतौर पर जटिल सांख्यिकीय आबादी के अध्ययन में उपयोग किया जाता है। उदाहरण के लिए, योग्यता के अनुसार अलग-अलग समूहों से मिलकर व्यापार श्रमिकों की श्रम उत्पादकता के एक नमूना सर्वेक्षण में।

एक विशिष्ट नमूने की एक महत्वपूर्ण विशेषता यह है कि यह एक नमूने में इकाइयों के चयन के अन्य तरीकों की तुलना में अधिक सटीक परिणाम देता है।

एक विशिष्ट नमूने की औसत त्रुटि सूत्रों द्वारा निर्धारित की जाती है:

(पुन: चयन);

(गैर-दोहराव चयन),

इंट्राग्रुप वेरिएंस का औसत कहां है।

उदाहरण. क्षेत्र के तीन जिलों में जनसंख्या की आय का अध्ययन करने के लिए, इन जिलों की जनसंख्या के अनुपात में 2% नमूना बनाया गया था। प्राप्त परिणाम तालिका में प्रस्तुत किए गए हैं। 16.

तालिका 16

घरेलू आय के एक नमूना सर्वेक्षण के परिणाम

0.997 के संभाव्यता स्तर पर पूरे क्षेत्र में जनसंख्या की औसत प्रति व्यक्ति आय की सीमाओं को निर्धारित करना आवश्यक है।

समाधान।इंट्राग्रुप फैलाव के औसत की गणना करें:

कहाँ पे एन आई- मात्रा मैं-और समूह;

n, - नमूना आकार /-समूह से।

सीरियल सैंपलिंग. इस नमूने का उपयोग तब किया जाता है जब अध्ययन की गई जनसंख्या की इकाइयों को छोटे समान आकार के समूहों या श्रृंखलाओं में बांटा जाता है। इस मामले में चयन की इकाई श्रृंखला है। उचित यादृच्छिक या यांत्रिक नमूने का उपयोग करके श्रृंखला का चयन किया जाता है, और चयनित श्रृंखला के भीतर, बिना किसी अपवाद के सभी इकाइयों की जांच की जाती है।

एक सीरियल नमूने की औसत त्रुटि की गणना इंटरग्रुप विचरण पर आधारित है:

(पुन: चयन);

(गैर-दोहराव चयन),

कहाँ पे एक्स मैं- चयनित की संख्या मैं- श्रृंखला;

आर - कुल गणनाश्रृंखला।

समान समूहों के लिए अंतरसमूह विचरण की गणना निम्नानुसार की जाती है:

कहाँ पे एक्स मैं- औसत मैं सीरीज;

एक्सपूरे नमूने के लिए समग्र औसत है।

उदाहरण. प्रत्येक में 20 उत्पादों के 50 बक्से में पैक किए गए उत्पादों के एक बैच से घटकों की गुणवत्ता को नियंत्रित करने के लिए, 10% सीरियल नमूना बनाया गया था। नमूने में शामिल बक्से के लिए, मानक से उत्पाद मापदंडों का औसत विचलन क्रमशः 9 मिमी, 11, 12, 8 और 14 मिमी था। 0.954 की संभावना के साथ, पूरे बैच के लिए मापदंडों के औसत विचलन को समग्र रूप से निर्धारित करें।

समाधान।नमूना माध्य:

मिमी

इंटरग्रुप फैलाव का मूल्य:

स्थापित संभावना को देखते हुए आर = 0,954 (टी= 2) सीमांत नमूनाकरण त्रुटि होगी:

मिमी

की गई गणना हमें यह निष्कर्ष निकालने की अनुमति देती है कि आदर्श से सभी उत्पादों के मापदंडों का औसत विचलन निम्नलिखित सीमाओं के भीतर है:

किसी सीमांत त्रुटि के लिए सीरियल नमूने की आवश्यक मात्रा निर्धारित करने के लिए निम्नलिखित सूत्रों का उपयोग किया जाता है:

(पुन: चयन);

(गैर-दोहराव चयन)।

आइए हम एक नमूना आबादी बनाने की उपरोक्त विधियों और इस मामले में उत्पन्न होने वाली प्रतिनिधित्व त्रुटियों पर विस्तार से विचार करें।

स्व-यादृच्छिक नमूनाकरण सामान्य जनसंख्या से बिना किसी स्थिरता के तत्वों के यादृच्छिक रूप से इकाइयों के चयन पर आधारित है। तकनीकी रूप से, लॉट (उदाहरण के लिए, लॉटरी) या यादृच्छिक संख्याओं की तालिका द्वारा उचित यादृच्छिक चयन किया जाता है।

वास्तव में-यादृच्छिक चयन "अपने शुद्ध रूप में" चयनात्मक अवलोकन के अभ्यास में शायद ही कभी उपयोग किया जाता है, लेकिन यह अन्य प्रकार के चयन के बीच प्रारंभिक है, यह चयनात्मक अवलोकन के मूल सिद्धांतों को लागू करता है। आइए हम एक साधारण यादृच्छिक नमूने के लिए नमूनाकरण विधि के सिद्धांत और त्रुटि सूत्र के कुछ प्रश्नों पर विचार करें।

नमूनाकरण त्रुटि सामान्य जनसंख्या में एक पैरामीटर के मूल्य और नमूना अवलोकन के परिणामों से गणना की गई इसके मूल्य के बीच का अंतर है। औसत मात्रात्मक विशेषता के लिए, नमूना त्रुटि का निर्धारण द्वारा किया जाता है

संकेतक को सीमांत नमूनाकरण त्रुटि कहा जाता है।

नमूना माध्य एक यादृच्छिक चर है जो नमूने में कौन सी इकाइयाँ हैं, इसके आधार पर विभिन्न मान ले सकता है। इसलिए, नमूनाकरण त्रुटियां भी यादृच्छिक चर हैं और विभिन्न मूल्यों पर ले जा सकती हैं। इसलिए, संभावित त्रुटियों का औसत निर्धारित किया जाता है - औसत नमूनाकरण त्रुटि, जो इस पर निर्भर करती है:

  • 1) नमूना आकार: संख्या जितनी बड़ी होगी, औसत त्रुटि उतनी ही कम होगी;
  • 2) अध्ययन की गई विशेषता में परिवर्तन की डिग्री: विशेषता की भिन्नता जितनी छोटी होगी, और, परिणामस्वरूप, विचरण, औसत नमूनाकरण त्रुटि उतनी ही कम होगी।

यादृच्छिक पुन: नमूनाकरण के लिए, माध्य त्रुटि की गणना की जाती है

व्यवहार में, सामान्य विचरण का ठीक-ठीक पता नहीं होता है, लेकिन प्रायिकता सिद्धांत में यह सिद्ध हो चुका है कि

चूंकि पर्याप्त रूप से बड़े n का मान 1 के करीब है, इसलिए हम यह मान सकते हैं। तब माध्य नमूना त्रुटि की गणना की जा सकती है:

लेकिन एक छोटे नमूने (n30 के लिए) के मामलों में, गुणांक को ध्यान में रखा जाना चाहिए, और एक छोटे नमूने की औसत त्रुटि की गणना सूत्र का उपयोग करके की जानी चाहिए।

यादृच्छिक गैर-दोहराव नमूनाकरण के मामले में, उपरोक्त सूत्रों को मान द्वारा सही किया जाता है। तब गैर-नमूनाकरण की औसत त्रुटि है:

इसलिये हमेशा कम होता है, तो कारक () हमेशा 1 से कम होता है। इसका मतलब है कि गैर-दोहराए गए चयन के साथ औसत त्रुटि हमेशा बार-बार चयन से कम होती है।

यांत्रिक नमूने का उपयोग तब किया जाता है जब जनसंख्या को किसी तरह से व्यवस्थित किया जाता है (उदाहरण के लिए, वर्णानुक्रम में मतदाता सूची, दूरभाष संख्या, घरों, अपार्टमेंटों की संख्या)। इकाइयों का चयन एक निश्चित अंतराल पर किया जाता है, जो नमूने के प्रतिशत के व्युत्क्रम के बराबर होता है। तो, 2% नमूने के साथ, प्रत्येक 50 इकाई = 1/0.02 का चयन किया जाता है, 5% के साथ, सामान्य जनसंख्या की प्रत्येक 1/0.05 = 20 इकाई।

संदर्भ बिंदु चयन योग्य विभिन्न तरीके: बेतरतीब ढंग से, अंतराल के बीच से, मूल में परिवर्तन के साथ। मुख्य बात व्यवस्थित त्रुटि से बचना है। उदाहरण के लिए, 5% नमूने के साथ, यदि 13वीं को पहली इकाई के रूप में चुना जाता है, तो अगली 33, 53, 73, आदि।

सटीकता के संदर्भ में, यांत्रिक चयन उचित यादृच्छिक नमूने के करीब है। इसलिए, यांत्रिक नमूने की औसत त्रुटि निर्धारित करने के लिए, उचित यादृच्छिक चयन के सूत्रों का उपयोग किया जाता है।

विशिष्ट चयन में, जांच की जा रही जनसंख्या को प्रारंभिक रूप से सजातीय, समान-प्रकार के समूहों में विभाजित किया जाता है। उदाहरण के लिए, उद्यमों का सर्वेक्षण करते समय, ये उद्योग, उप-क्षेत्र हो सकते हैं, जनसंख्या का अध्ययन करते समय - क्षेत्र, सामाजिक या आयु वर्ग। फिर प्रत्येक समूह से यांत्रिक या उचित यादृच्छिक तरीके से एक स्वतंत्र चयन किया जाता है।

विशिष्ट नमूनाकरण अन्य विधियों की तुलना में अधिक सटीक परिणाम देता है। सामान्य जनसंख्या का टंकण नमूने में प्रत्येक टाइपोलॉजिकल समूह का प्रतिनिधित्व सुनिश्चित करता है, जिससे औसत नमूना त्रुटि पर अंतरसमूह विचरण के प्रभाव को बाहर करना संभव हो जाता है। इसलिए, जब प्रसरणों के योग के नियम के अनुसार एक विशिष्ट नमूने की त्रुटि का पता लगाया जाता है, तो केवल समूह प्रसरणों के औसत को ध्यान में रखना आवश्यक है। तब माध्य नमूना त्रुटि है:

पुन: चयन में

गैर-आवर्ती चयन के साथ

नमूने में अंतर-समूह प्रसरण का माध्य कहाँ है।

सीरियल (या नेस्टेड) ​​​​नमूना का उपयोग तब किया जाता है जब नमूना सर्वेक्षण शुरू होने से पहले जनसंख्या को श्रृंखला या समूहों में विभाजित किया जाता है। ये श्रृंखला तैयार उत्पादों, छात्र समूहों, टीमों के पैकेज हो सकते हैं। परीक्षा के लिए श्रृंखला को यंत्रवत् या यादृच्छिक रूप से चुना जाता है, और श्रृंखला के भीतर इकाइयों का एक पूरा सर्वेक्षण किया जाता है। इसलिए, औसत नमूनाकरण त्रुटि केवल इंटरग्रुप (इंटरसीरीज) विचरण पर निर्भर करती है, जिसकी गणना सूत्र द्वारा की जाती है:

जहाँ r चयनित श्रृंखला की संख्या है;

औसत i-वें शृंखला।

औसत सीरियल सैंपलिंग त्रुटि की गणना की जाती है:

पुन: चयन में

गैर-आवर्ती चयन के साथ

जहां R श्रृंखला की कुल संख्या है।

संयुक्त चयन माना चयन विधियों का एक संयोजन है।

किसी भी चयन विधि के लिए औसत नमूना त्रुटि मुख्य रूप से नमूने के पूर्ण आकार पर और कुछ हद तक नमूने के प्रतिशत पर निर्भर करती है। मान लीजिए कि पहले मामले में 4,500 इकाइयों की आबादी में से 225 अवलोकन किए गए हैं और दूसरे मामले में, 225,000 इकाइयों में से। दोनों मामलों में प्रसरण 25 के बराबर है। फिर, पहले मामले में, 5% चयन के साथ, नमूनाकरण त्रुटि होगी:

दूसरे मामले में, 0.1% चयन के साथ, यह इसके बराबर होगा:

इस प्रकार, नमूना प्रतिशत में 50 गुना की कमी के साथ, नमूना त्रुटि थोड़ी बढ़ गई, क्योंकि नमूना आकार नहीं बदला।

मान लें कि नमूना आकार बढ़ाकर 625 अवलोकन कर दिया गया है। इस मामले में, नमूना त्रुटि है:

सामान्य जनसंख्या के समान आकार के साथ नमूने में 2.8 गुना की वृद्धि, नमूना त्रुटि के आकार को 1.6 गुना से अधिक कम कर देती है।

माध्य और सीमांत नमूनाकरण त्रुटियाँ

नमूनाकरण का मुख्य लाभ, दूसरों के बीच, यादृच्छिक नमूनाकरण त्रुटि की गणना करने की क्षमता है।

नमूनाकरण त्रुटियां या तो व्यवस्थित या यादृच्छिक होती हैं।

व्यवस्थित- इस घटना में कि नमूनाकरण के मूल सिद्धांत - यादृच्छिकता - का उल्लंघन किया जाता है। यादृच्छिक रूप से- आमतौर पर इस तथ्य के कारण उत्पन्न होता है कि नमूना जनसंख्या की संरचना हमेशा सामान्य जनसंख्या की संरचना से भिन्न होती है, चाहे चयन कितना भी सही हो, अर्थात जनसंख्या इकाइयों के यादृच्छिक चयन के सिद्धांत के बावजूद, अभी भी विसंगतियां हैं नमूने और सामान्य जनसंख्या की विशेषताओं के बीच। प्रतिनिधित्व की यादृच्छिक त्रुटियों का अध्ययन और माप नमूनाकरण विधि का मुख्य कार्य है।

एक नियम के रूप में, माध्य की त्रुटि और अनुपात की त्रुटि की गणना सबसे अधिक बार की जाती है। निम्नलिखित सम्मेलनों का उपयोग गणना में किया जाता है:

सामान्य जनसंख्या के भीतर गणना की गई औसत;

नमूना आबादी के भीतर गणना की गई औसत;

आर- सामान्य आबादी में इस समूह का हिस्सा;

वू- नमूना आबादी में इस समूह का हिस्सा।

का उपयोग करते हुए कन्वेंशनों, माध्य और अनुपात के लिए नमूनाकरण त्रुटियों को निम्नानुसार लिखा जा सकता है:

नमूना माध्य और नमूना अनुपात यादृच्छिक चर हैं जो नमूने में जनसंख्या की इकाइयों को शामिल करने के आधार पर किसी भी मूल्य पर ले सकते हैं। इसलिए, नमूनाकरण त्रुटियां भी यादृच्छिक चर हैं और विभिन्न मूल्यों पर ले जा सकती हैं। इसलिए, संभावित त्रुटियों का औसत μ .

व्यवस्थित के विपरीत, गणितीय आँकड़ों में मानी जाने वाली सीमा प्रमेयों के अनुसार, नमूना लेने से पहले, यादृच्छिक त्रुटि को अग्रिम रूप से निर्धारित किया जा सकता है।

औसत त्रुटि 0.683 की संभावना के साथ निर्धारित की जाती है। एक अलग संभावना के मामले में, एक मामूली त्रुटि की बात करता है।

माध्य और भिन्न के लिए माध्य नमूना त्रुटि को निम्नानुसार परिभाषित किया गया है:


इन सूत्रों में, एक विशेषता का प्रसरण सामान्य जनसंख्या की एक विशेषता है, जो चयनात्मक अवलोकन के दौरान अज्ञात है। व्यवहार में, उन्हें बड़ी संख्या के कानून के आधार पर नमूना आबादी की समान विशेषताओं द्वारा प्रतिस्थापित किया जाता है, जिसके अनुसार बड़ी मात्रा में नमूना आबादी सामान्य आबादी की विशेषताओं को सटीक रूप से पुन: पेश करती है।

औसत त्रुटि के निर्धारण के लिए सूत्र अलग तरीकाचयन:

चयन विधि दोहराया गया न दोहराई
मतलब त्रुटि शेयर त्रुटि मतलब त्रुटि शेयर त्रुटि
स्व-यादृच्छिक और यांत्रिक
ठेठ
धारावाहिक

μ - औसत त्रुटि;

- सीमांत त्रुटि;

पी -नमूने का आकार;

एन-सामान्य जनसंख्या का आकार;

कुल विचरण;

डब्ल्यूकुल नमूना आकार में इस श्रेणी का हिस्सा:

समूह के भीतर विचरण का औसत;

Δ 2 - अंतरसमूह फैलाव;

आर-नमूने में श्रृंखला की संख्या;

आरएपिसोड की कुल संख्या है।


सीमांत त्रुटिसभी चयन विधियों के लिए औसत नमूना त्रुटि से संबंधित है:

कहाँ पे टी- आत्मविश्वास का गुणांक, कार्यात्मक रूप से उस संभावना से संबंधित है जिसके साथ सीमांत त्रुटि का मूल्य प्रदान किया जाता है। प्रायिकता के आधार पर, विश्वास गुणांक t लेता है निम्नलिखित मान:

टी पी
0,683
1,5 0,866
2,0 0,954
2,5 0,988
3,0 0,997
4,0 0,9999

उदाहरण के लिए, त्रुटि संभावना 0.683 है। इसका अर्थ यह है कि सामान्य माध्य नमूना माध्य से निरपेक्ष मान में से अधिक नहीं होता है μ 0.683 की प्रायिकता के साथ, यदि नमूना माध्य है, सामान्य माध्य है, तो साथसंभावना 0.683।

यदि हम अनुमान की अधिक संभावना प्रदान करना चाहते हैं, तो हम इस प्रकार यादृच्छिक त्रुटि की सीमा बढ़ाते हैं।

इस प्रकार, सीमांत त्रुटि का मान निम्नलिखित मात्राओं पर निर्भर करता है:

संकेत का उतार-चढ़ाव (प्रत्यक्ष संबंध), जो फैलाव के परिमाण की विशेषता है;

नमूना आकार (प्रतिक्रिया);

आत्मविश्वास की संभावना (प्रत्यक्ष संबंध);

चयन विधि।

माध्य की त्रुटि और शेयर की त्रुटि की गणना का एक उदाहरण।

एक परिवार में बच्चों की औसत संख्या निर्धारित करने के लिए, यादृच्छिक गैर-दोहराव नमूनाकरण द्वारा 1000 परिवारों में से 100 परिवारों का चयन किया गया था। परिणाम तालिका में दिखाए गए हैं:

परिभाषित करना:.

- 0.997 की संभावना के साथ, सीमांत नमूनाकरण त्रुटि और सीमाएं जिसके भीतर एक परिवार में बच्चों की औसत संख्या स्थित है;

- 0.954 की संभावना के साथ, वे सीमाएँ जिनमें दो बच्चों वाले परिवारों का अनुपात स्थित है।

1. 0.977 की प्रायिकता के साथ माध्य की सीमांत त्रुटि ज्ञात कीजिए। गणना को सरल बनाने के लिए, हम क्षणों की विधि का उपयोग करते हैं:

पी = 0,997 टी= 3

माध्य की औसत त्रुटि, 0.116 - सीमांत त्रुटि

2,12 – 0,116 ≤ ≤ 2,12+ 0,116

2,004 ≤ ≤ 2,236

नतीजतन, 0.997 की संभावना के साथ, सामान्य आबादी में एक परिवार में बच्चों की औसत संख्या, यानी 1000 परिवारों के बीच, 2.004 - 2.236 की सीमा में है।

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...