एमएस एक्सेल में विचरण आकलन के लिए कॉन्फिडेंस इंटरवल। ज्ञात माध्य के साथ विचरण के लिए विश्वास अंतराल

यहां, माध्य को एक ज्ञात निश्चित संख्या माना जाता है, और विचरण एक अज्ञात पैरामीटर के रूप में कार्य करता है। चलो रखो

चूंकि --, इसका मानक सामान्य वितरण है। इस प्रकार, फ़ंक्शन में स्वतंत्रता की डिग्री के साथ -वितरण होता है, जो किसी भी तरह से अज्ञात पैरामीटर पर निर्भर नहीं करता है। इस वितरण की मात्राओं के माध्यम से निरूपित करना और कुछ को ठीक करना, जैसे कि , हम असमानता पर पहुंचते हैं

जो संभावना के साथ पूरा होता है। हमें इसके लिए कॉन्फिडेंस इंटरवल कहां मिलता है:

अज्ञात माध्य के साथ विचरण के लिए विश्वास अंतराल

ध्यान दें कि फ़ंक्शन को इस तरह से परिभाषित किया गया है कि किसी दिए गए नमूने के लिए, इसके मान केवल पैरामीटर पर निर्भर करते हैं। यादृच्छिक चर के वितरण के संबंध में , तो फिशर के प्रमेय (8.3 देखें) द्वारा यह स्वतंत्रता की डिग्री के साथ एक -वितरण है और इसलिए, अज्ञात मापदंडों पर निर्भर नहीं करता है। फिक्सिंग ऐसा कि , और (47) के अनुसार बहस करते हुए, हम निम्नलिखित के लिए विश्वास अंतराल पर पहुंचते हैं:

जिसे, संकेतन (30) का उपयोग करके, के रूप में फिर से लिखा जा सकता है

अज्ञात विचरण के साथ माध्य के लिए विश्वास अंतराल

जैसा कि पिछले पैराग्राफ में है, दोनों मापदंडों को अज्ञात माना जाता है, जबकि एक उपद्रव पैरामीटर है। फिशर के प्रमेय के अनुसार

तथा

स्वतंत्र हैं और क्रमशः स्वतंत्रता की डिग्री के साथ वितरण यू-वितरण है। इसलिए, अनुपात

स्वतंत्रता की एक डिग्री के साथ एक छात्र का वितरण है। आइए एक फ़ंक्शन चुनें दाईं ओर के बराबर (48):

सूत्र (30) द्वारा परिभाषित नमूना विचरण कहाँ है। फ़ंक्शन स्पष्ट रूप से हस्तक्षेप करने वाले पैरामीटर पर निर्भर नहीं करता है। स्वतंत्रता की डिग्री के साथ छात्र वितरण की मात्रा को निरूपित करते हुए, हम पाते हैं कि असमानता

संभावना के साथ किया गया। यहाँ से हमें इसके लिए कॉन्फिडेंस इंटरवल मिलता है:

चूँकि विद्यार्थी वितरण सममित है, इसलिए प्रस्ताव 3.3 . के अनुसार

इसलिए, विश्वास अंतराल के रूप में लिखा जा सकता है

इस प्रकार, प्रतिदर्श माध्य इस अंतराल का मध्य होता है।

उदाहरण 8.2

आइए उदाहरण 6.4 देखें। मान लीजिएकि प्रत्येक नमूने से लिया गया है सामान्यके साथ वितरण अनजानपैरामीटर - और, क्रमशः। (हम उस आधार के बारे में बात करेंगे जिसके आधार पर यह धारणा बाद में 9.5 में की जा सकती है।)

हमारा लक्ष्य जीएस 50 स्टील की सैद्धांतिक कार्बन सामग्री और तन्य शक्ति के लिए आत्मविश्वास अंतराल खोजना है। याद रखें कि प्रत्येक नमूने का आयतन। आइए हम एकता के करीब एक आत्मविश्वास की संभावना को ठीक करें, कहते हैं। पी पर छात्र की वितरण तालिका के अनुसार, हम लगभग निर्धारित करते हैं। पी पर उदाहरण 6.5 में पाए गए मानों को याद करते हुए, हम गणना करते हैं

और, सूत्र (49) का उपयोग करके, हम प्रतिशत के लिए -विश्वास अंतराल प्राप्त करते हैं कार्बन सामग्री

और - मूल्य के लिए विश्वास अंतराल तन्यता ताकत

प्रयोगशाला कार्य 12। मूल्यांकन के सिद्धांत की मूल बातें

सांख्यिकीविद यादृच्छिक भिन्नता के अधीन डेटा से संबंधित है। उनका व्यवहार एक निश्चित संभाव्यता वितरण कानून द्वारा विशेषता है। इस तरह के कानून में, एक नियम के रूप में, अज्ञात मात्राएं होती हैं, जिन्हें कानून के पैरामीटर माना जाता है। देखे गए डेटा की यादृच्छिक परिवर्तनशीलता के कारण, उनके आधार पर, मापदंडों के पूरी तरह से सटीक मूल्य को इंगित करना असंभव है। हमें केवल अनुमानित मूल्यों से ही संतुष्ट रहना होगा। तो, एक गणितीय सांख्यिकीविद् निम्नलिखित मात्राओं के साथ काम करता है: - एक यादृच्छिक चर, जिसे वह कभी नहीं देखता है, लेकिन वह जिस डेटा का अध्ययन करता है उसकी "आत्मा" मानता है, वह कारण जिसने उन्हें जन्म दिया। यह मान कुछ मापदंडों द्वारा निर्धारित किया जाता है; - अध्ययन किए गए डेटा, जो कार्यान्वयन के रूप में प्राप्त किए जाते हैं अनियमित चर. उदाहरण के लिए, यादृच्छिक चर सटीक समय है। इसका कार्यान्वयन आँकड़ों के लिए उपलब्ध घड़ी की रीडिंग है। एक सांख्यिकीविद् का कार्य n घड़ियों t 1 ,...,t n की रीडिंग का उपयोग करके यथासंभव सटीक समय निर्धारित करना है। इसके अलावा, वह निर्धारित मूल्य की सटीकता को चिह्नित करने के लिए बाध्य है। यह टी = टी 0 + ξ (ए, σ) के रूप में वांछित मूल्य का मूल्यांकन करता है, जहां टी 0 अध्ययन के समय सही समय है, ξ (ए, σ) एक यादृच्छिक चर है जो सत्य से विचलन को दर्शाता है मान, t 0 , a, - पैरामीटर, मान ξ वितरण कानून द्वारा विशेषता है, संभावना है कि यह अलग-अलग मान लेता है। आँकड़ों में अनुमान प्रेक्षित डेटा के आधार पर एक पैरामीटर के अनुमानित मूल्य की गणना के लिए एक नियम है। एक अनुमान प्रेक्षित डेटा से प्राप्त पैरामीटर का अनुमानित मान है। व्यावहारिक उपयोग के लिए अनुमानों का निर्माण करते समय, अनुमानों के लिए तीन मुख्य आवश्यकताएं होती हैं:

    सटीकता, अर्थात्, पैरामीटर के वास्तविक मान से निकटता, उदाहरण में ξ(a,σ) छोटा होना चाहिए;

    निष्पक्षता, यानी आवश्यकता है कि अनुमान की गणितीय अपेक्षा पैरामीटर के सही मान के बराबर हो, उदाहरण में ξ(a,σ) औसतन शून्य के बराबर होना चाहिए;

    संगति, यानी आवश्यकता है कि अवलोकनों की संख्या में वृद्धि के साथ, अनुमान पैरामीटर के सही मूल्य की संभावना में परिवर्तित हो जाता है। उदाहरण के साथ बड़ी संख्याघंटे n, मान (a,σ) को शून्य की ओर प्रवृत्त होना चाहिए, जिसमें एक की प्रायिकता होती है।

सभी मामलों में कोई सर्वोत्तम अनुमान नहीं हैं। उदाहरण के लिए, अंकगणितीय माध्य, एक यादृच्छिक चर के माध्य का व्यापक रूप से स्वीकृत अनुमान, सामान्य रूप से वितरित डेटा के लिए इष्टतमता गुण रखता है। हालाँकि, यह त्रुटियों की ओर जाता है यदि डेटा के बीच आउटलेयर, यानी आउटलेयर हैं। अर्थव्यवस्था में ऐसे उत्सर्जन उत्पन्न होते हैं भूलोंमाप या टाइपो में, जिसमें रूबल और कोप्पेक के बीच की बिंदी गायब हो सकती है और वेतन सौ गुना बढ़ जाएगा। आइए हम ग्रेट ब्रिटेन के नक्शे पर ड्राइंग के इतिहास से जुड़ी एक यादृच्छिक प्रक्रिया पर विचार करें, जो पूरी दुनिया में बिखरी हुई अपनी संपत्ति की सटीक सीमाएं हैं। यह ज्ञात है कि पृथ्वी पर किसी भी बिंदु की विशेषता दो निर्देशांक हैं - अक्षांश और देशांतर। आज, किसी भी स्कूली बच्चे ने उपग्रह उपकरणों के बारे में सुना है जो पृथ्वी पर किसी भी बिंदु को मीटर तक की सटीकता के साथ सेट करते हैं। हालांकि, उन दिनों में, इस तरह के एक उपकरण ने भी नाविकों की मदद नहीं की होगी, क्योंकि इसे आकाश में एक भी "संदर्भ" उपग्रह नहीं मिला होगा। आधुनिक थियोडोलाइट (स्पाईग्लास प्लस एंगल गेज) के समान एक "सेक्स्टन" डिवाइस का उपयोग करके क्षितिज के ऊपर के प्रकाशकों की ऊंचाई से अक्षांश सीधे निर्धारित किया गया था। देशांतर ग्लोब के घूर्णन का कोण है, जिस पर स्थानीय मेरिडियन और ग्रीनविच मेरिडियन को सशर्त शून्य के रूप में चुना जाता है। पृथ्वी लगभग एक दिन में 360° चक्कर लगाती है, यानी एक घंटे में 15° और 4 मिनट में 1° चक्कर लगाती है। देशांतर निर्धारित करने के लिए, आपको वास्तव में स्थानीय और ग्रीनविच समय जानने की जरूरत है। यदि नाविक कप्तान से कहता है: "स्थानीय दोपहर, सर", और कप्तान ग्रीनविच में उस समय का समय जानता है, तो समय अंतर, 4 मिनट से विभाजित, क्षेत्र के देशांतर को डिग्री में निर्धारित करता है। आज, सब कुछ सरल होगा - ग्रीनविच को कॉल करें और उनका समय पता करें। लेकिन तब तक रेडियो का आविष्कार नहीं हुआ था। यदि जहाज में क्वार्ट्ज घड़ी होती जो साल में एक मिनट का एक अंश जाती है, तो कोई समस्या नहीं होगी, लेकिन उस समय मौजूद सबसे अच्छे क्रोनोमीटर देशांतर को मापने के लिए आवश्यक सटीकता प्रदान नहीं करते थे। नौकायन के कई महीनों के लिए, उन्होंने सटीक समय को दसियों मिनट तक छोड़ दिया। और जब, 1831 में, जहाज "बीगल" नक्शे बनाने के लिए दुनिया भर की यात्रा पर गया, जहाज के कप्तान, एक प्रबुद्ध व्यक्ति और एक वैज्ञानिक, फिट्ज रॉय, अपने साथ 24 (!) समुद्री क्रोनोमीटर ले गए। . प्रत्येक कालक्रम ने अपना "ग्रीनविच समय" दिखाया। पर ये पढाईयादृच्छिक चर - वह क्षण जब नाविक ने किसी खगोलीय पिंड का उपयोग करके सटीक स्थानीय समय निर्धारित किया। मापा यादृच्छिक चर की "आत्मा" उस समय ग्रीनविच में सही समय है। हम इस मात्रा को से निरूपित करते हैं। इस मात्रा का मूल्य कभी ज्ञात नहीं होता है। एक यादृच्छिक चर के देखे गए मान (अलग) कालक्रम की रीडिंग हैं। उनमें से प्रत्येक कुछ हद तक गलत था, लेकिन सामान्य तौर पर वे सामान्य "आत्मा" का अनुसरण करते थे, उस पर अपनी यादृच्छिक त्रुटि थोपते थे। यादृच्छिक चर का अनुमान जीएमटी है जिसे कप्तान ने देखे गए डेटा से ग्रहण किया था। मान लीजिए यादृच्छिक चर x i , i = 1,...,n, एक यादृच्छिक चर की प्राप्ति है, अर्थात, उनका वितरण समान है (एक "आत्मा"), और किसी भी i के लिए रीडिंग का औसत मान बराबर है उसी संख्या के लिए: Е(x i) = (ξ)। इस कथन का अर्थ इस प्रकार है: सभी घड़ियाँ डिज़ाइन की समस्याओं के कारण सर्वसम्मति से पीछे या जल्दी नहीं हो सकती हैं। औसतन, यह समान रूप से संभावना है कि वे जल्दी या पीछे हैं। साथ ही, उन्हें स्वतंत्र होने दें। दूसरे शब्दों में, उनके पास समूहों में कुछ भी समान नहीं है। इस प्रकार, घड़ी की रीडिंग रिकॉर्ड करने वाला एक नाविक उन्हें एक क्रम में रिकॉर्ड कर सकता है। फिर अंतिम रीडिंग पहले की तुलना में एक मिनट बाद दर्ज की जाएगी। या वे कई घंटों तक गर्म स्थान पर लटक सकते हैं और गर्म होने से एक साथ भाग सकते हैं। यह धारणा कि ऐसी कोई घटना नहीं है, विभिन्न परीक्षणों में संकेतों की स्वतंत्रता की स्थिति से मेल खाती है। सबसे सरल अनुमान समस्या किसी घटना की संभावना का निर्धारण करना है, उदाहरण के लिए, कि एक वास्तविक (जरूरी नहीं कि सही) सिक्का नीचे की ओर गिरेगा। किसी घटना की संभावना को सीधे निर्धारित करना लगभग संभव नहीं है। कोई सार्वभौमिक तरीका नहीं है जो एक मनमानी घटना को इसकी संभावना को इंगित करने की अनुमति देगा। एक घटना ए की संभावना का अनुमान लगाना संभव है यदि स्वतंत्र दोहराया परीक्षण करना संभव है जिसके दौरान यह घटना निरंतर संभावना के साथ होती है। मान लीजिए कि प्रत्येक n परीक्षणों में घटना A की प्रायिकता p = P(A) अपरिवर्तित रहती है और प्रत्येक परीक्षण का परिणाम दूसरों से स्वतंत्र होता है। m . द्वारा निरूपित करें यादृच्छिक संख्याउन परीक्षणों से कुल गणना n किस घटना में A हुआ। ऐसा कहा जाता है कि n बर्नौली परीक्षणों में m "सफलताओं" की संख्या है। प्रायिकता की सांख्यिकीय परिभाषा के अनुसार, बड़े n के लिए, घटना A की सापेक्ष आवृत्ति m/n घटना A के घटित होने की प्रायिकता के लगभग बराबर होती है, अर्थात m/n ~ p, जहाँ p = P(A) . आइए हम साबित करें कि यह कोलमोगोरोव के स्वयंसिद्ध सिद्धांतों से अनुसरण करता है। गणितीय विश्लेषण में, अनुक्रम की सीमा की एक सख्त अवधारणा का उपयोग किया जाता है: पर्याप्त रूप से बड़ा कमराअनुक्रम सदस्य, इसके मूल्य को मनमाने ढंग से सीमा मूल्य के करीब बनाया जा सकता है। यह परिभाषा फिट नहीं है वास्तविक जीवनजहां बिल्कुल अविश्वसनीय घटनाएं शायद ही कभी होती हैं। उदाहरण के लिए, प्राइमर्डियल अराजक सूप से, एक जीवाणु खुद को पुन: उत्पन्न करने में सक्षम होता है। या कोई मछली कुछ ऐसा बनाती है जिसकी पहले तो लाखों वर्षों तक आवश्यकता नहीं होती (लेकिन विकसित होती है), और फिर एक पंख बन जाती है। या पूरा शहर (या देश) बाढ़ में डूबा हुआ है। संभाव्यता सिद्धांत में, एक सीमा की अवधारणा की व्याख्या उस अर्थ से भिन्न अर्थ में की जाती है, जिसे गणितीय विश्लेषण में इसमें रखा गया है। संभाव्यता सिद्धांत की परिभाषा जीवन के करीब है। यह इस तथ्य पर रोक नहीं लगाता है कि अनुक्रम में किसी बिंदु पर एक संख्या होगी जो दूसरों से बहुत अलग होगी। यादृच्छिक चरों का एक क्रम u n प्रायिकता में p में परिवर्तित हो जाता है यदि, किसी संख्या ε > 0 के लिए, प्रायिकता कि अंतर का मापांक |u n - p| क्योंकि n → से कम एकता की ओर प्रवृत्त होता है:

संभाव्यता सिद्धांत में, कोई भी घटना निश्चित नहीं है, लेकिन घटना: |u n - p| पर्याप्त रूप से बड़े n के लिए लगभग निश्चित है। आइए हम चेबीशेव असमानता को साबित करें। मान लीजिए ξ गणितीय अपेक्षा वाला एक यादृच्छिक चर है E(ξ) = a और प्रसरण D(ξ) = , एक धनात्मक संख्या है। फिर एक घटना की प्रायिकता इस तथ्य में शामिल है कि एक केंद्रित (ई (ξ) - ए) और सामान्यीकृत यादृच्छिक चर -2 से कम ε से अधिक है:

दरअसल, = ई(ξ - ए)²। दाईं ओर औसत की गणना करते समय, हम मानों की दो श्रेणियों का चयन करते हैं। उन के लिए जिनके लिए |ξ - a|< εσ, сумма (или интеграл) соответствующих произведений неотрицателен. Для тех ξ, у которых |ξ - а| >, योग (या अभिन्न):

एक दिलचस्प विशेष मामला: = 0. इसके अलावा, यह स्पष्ट है कि |ξ - a| = 0, यानी = ए। आइए हम चेबीशेव प्रमेय को सिद्ध करें। मान लीजिए 1 ,...,х n स्वतंत्र रूप से समान रूप से वितरित यादृच्छिक चर हैं जिनमें गणितीय अपेक्षा और प्रसरण है। अर्थात्, प्रत्येक x i एक यादृच्छिक चर का बोध है, और E(ξ) = E(x i) = a, D(ξ) = D(x i) = । फिर किसी > 0 के लिए:

सबूत। अंकगणित माध्य फैलाव:

एक यादृच्छिक चर n पर विचार करें, जो n प्रेक्षणों का अंकगणितीय माध्य है। इसका माध्य और विचरण . n के देखे गए अहसास हैं। एक यादृच्छिक चर n के लिए चेबीशेव की असमानता के अनुसार, औसत मूल्य से इसके विचलन की संभावना शून्य से अधिक राशि से अधिक होती है:

बड़े n: P(|η n - a|) → 1 के लिए विपरीत घटना की संभावना 1 हो जाती है। इसलिए, यादृच्छिक चर n का क्रम संभाव्यता में परिवर्तित होता है। आइए बीगल पर समय मापने पर वापस जाएं। प्रत्येक कालक्रम x i, i = 1,...,n का पठन अन्य उपकरणों से स्वतंत्र एक माप है। यह समझा जाता है कि क्रोनोमीटर का डिज़ाइन ऐसा है कि इसके संचालन में कोई व्यवस्थित त्रुटि नहीं है। इसका मतलब यह है कि कालक्रम के कुछ उदाहरण "आगे बढ़ सकते हैं", अन्य "पीछे" हो सकते हैं, लेकिन ये त्रुटियां यादृच्छिक हैं, जो इस नमूने के निर्माण से जुड़ी हैं। गणितीय रूप से, इसका अर्थ है कि औसत समय सत्य है। क्रोनोमीटर के डिजाइन और निर्माण तकनीक की गुणवत्ता की विशेषता है कि समग्र रूप से सभी उत्पादों की गति की सटीकता कितनी समान है। गणितीय रूप से, यह अलग-अलग उपकरणों के रीडिंग के प्रसार द्वारा व्यक्त किया जाता है, अर्थात। यादृच्छिक चर x i का फैलाव। औसत का प्रसरण एक व्यक्तिगत कालक्रम के विचरण से n = 24 गुना छोटा है। इसलिए, 24 कालक्रमों द्वारा निर्धारित "औसत समय" किसी भी व्यक्तिगत कालक्रम के समय की तुलना में औसतन वास्तविक समय के लगभग 5 गुना अधिक है।

आइए हम सामान्य नियम के अनुसार वितरित एक यादृच्छिक चर के विचरण का अनुमान लगाने के लिए एक विश्वास अंतराल का निर्माण करें,एमएसएक्सेल.

इमारत विश्वास अंतरालमूल्यांकन के लिए लेख में दिया गया है। निर्माण प्रक्रिया विश्वास अंतरालमूल्यांकन के लिए मूल्यांकन की प्रक्रिया के साथ बहुत कुछ समान है मध्यमइसलिए, इस लेख में इसे निर्दिष्ट लेख की तुलना में कम विस्तार से बताया गया है।

कार्य सूत्रीकरण।आइए मान लें कि . से आबादी अज्ञात के साथ होना औसतμ और अज्ञात फैलावσ 2 लिया जाता है नमूनाआकार एन. इसके आधार पर आवश्यक नमूनेआकलन वितरण विचरणऔर निर्माण विश्वास अंतराल.

टिप्पणी: विचलन के प्रति अपेक्षाकृत असंवेदनशील प्लॉट आबादीसे । लेकिन निर्माण करते समय आकलन के लिए विश्वास अंतरालमांग साधारण अवस्थासख्त है।

सलाह: भवन निर्माण के लिए विश्वास अंतरालहमें निम्नलिखित अवधारणाओं को जानने की जरूरत है:

जैसा वितरण विचरण का एक बिंदु अनुमान,किस से नमूना, उपयोग नमूना विचरणएस 2 .

इसके अलावा, पहले परिकल्पना परीक्षण प्रक्रिया, शोधकर्ता आवश्यक एक सेट करता है - यह इस कार्य के लिए अनुमेय है पहली तरह की त्रुटि, अर्थात। अस्वीकृति की संभावना शून्य परिकल्पनाजब यह सच है सार्थक तलअक्षर α (अल्फा) द्वारा निरूपित और अक्सर 0.1 के बराबर चुना जाता है; 0.05 या 0.01)

. के बारे में एक लेख में ची2 वितरणयह दिखाया गया है कि y=(n-1) एस 2 /σ 2 है ची2 वितरणस्वतंत्रता की n-1 डिग्री के साथ।

आइए इस संपत्ति का उपयोग करें और निर्माण करें दो तरफा विश्वास अंतरालदर के लिए फैलाव.

जनसंख्या माध्य के लिए विश्वास अंतराल की सीमाओं का पता लगाने के लिए, आपको निम्नलिखित कार्य करने होंगे:

1) प्राप्त मात्रा के नमूने के अनुसार एनअंकगणित माध्य और अंकगणित माध्य की मानक त्रुटि की गणना करें सूत्र के अनुसार:

;

2) कॉन्फिडेंस प्रायिकता 1 सेट करें - α अध्ययन के उद्देश्य के आधार पर;

3) तालिका के अनुसार टी-छात्र का वितरण (परिशिष्ट 4) सीमा मान ज्ञात करें टी α महत्व स्तर के आधार पर α और स्वतंत्रता की डिग्री की संख्या = एन – 1;

4) सूत्र द्वारा विश्वास अंतराल की सीमाएँ ज्ञात कीजिए:

.

टिप्पणी: प्रयोग में वैज्ञानिक अनुसंधान, जब एक छोटी नमूना आबादी के वितरण का कानून (एन < 30) неизвестен или отличен от нормального, пользуются вышеприведенной формулой для अनुमानितविश्वास अंतराल अनुमान।

कॉन्फिडेंस इंटरवल at एन 30 निम्न सूत्र द्वारा ज्ञात किया जाता है:

,

कहाँ पे तुम- सामान्यीकृत सामान्य वितरण के प्रतिशत अंक, जो तालिका 5.1 में हैं।

8. वी चरण में काम का क्रम

1. छोटे (n .) के वितरण की सामान्यता की जाँच करें< 30) выборку, составленную из разностей парных значений результатов измерений исходного показателя скоростных качеств у «спортсменов» (эти результаты обозначены индексом В) и показателя, достигнутого после двухмесячных тренировок (эти результаты обозначены индексом Г).

2. एक मानदंड का चयन करें और "एथलीटों" में गति गुणों के विकास में तेजी लाने के लिए उपयोग की जाने वाली प्रशिक्षण पद्धति की प्रभावशीलता का मूल्यांकन करें।

खेल के पांचवें चरण में काम पर रिपोर्ट (नमूना)

विषय:प्रशिक्षण पद्धति की प्रभावशीलता का मूल्यांकन।

लक्ष्य:

    सुविधाओं की जाँच करें सामान्य कानूनपरीक्षण के परिणामों का वितरण।

    सामान्यता के लिए नमूना वितरण के परीक्षण में कौशल हासिल करें।

    प्रशिक्षण विधियों की प्रभावशीलता का मूल्यांकन करने के लिए कौशल प्राप्त करें।

    छोटे नमूनों के सामान्य अंकगणितीय साधनों के लिए विश्वास अंतराल की गणना और निर्माण करना सीखें।

प्रशन:

    प्रशिक्षण पद्धति की प्रभावशीलता के मूल्यांकन के लिए विधि का सार।

    सामान्य वितरण कानून। सार, अर्थ।

    सामान्य वितरण वक्र के मूल गुण।

    तीन सिग्मा नियम और इसका व्यावहारिक अनुप्रयोग।

    एक छोटे नमूने के वितरण की सामान्यता का अनुमान।

    जोड़ीवार निर्भर नमूनों के साधनों की तुलना करने के लिए किन मानदंडों और किन मामलों में उपयोग किया जाता है?

    कॉन्फिडेंस इंटरवल की क्या विशेषता है? इसके निर्धारण की विधि।

विकल्प 1: पैरामीट्रिक मानदंड

टिप्पणी: एक उदाहरण के रूप में, आइए तालिका 5.2 में दिए गए प्रशिक्षण की शुरुआत से पहले एथलीटों के गति गुणों को मापने के परिणाम लें (वे सूचकांक बी द्वारा इंगित किए गए हैं, उन्हें माप के परिणामस्वरूप प्राप्त किया गया था)मैंव्यापार खेल का चरण) और दो महीने के प्रशिक्षण के बाद (वे सूचकांक डी द्वारा इंगित किए जाते हैं)।

नमूने सी और डी से, चलो युग्मित मूल्यों के अंतर से बने नमूने पर चलते हैं डी मैं = एन मैं जी एन मैं परऔर इन अंतरों के वर्ग निर्धारित करें। हम गणना तालिका 5.2 में डेटा दर्ज करेंगे।

तालिका 5.2 - मानों के युग्म के अनुसार अंतरों के वर्गों की गणना डी मैं 2

एन मैं पर, हराना

एन मैं जी, हराना

डी मैं = एन मैं जीएन मैं पर, हराना

डी मैं 2 , हरा 2

तालिका 5.2 का उपयोग करते हुए, हम युग्मित अंतरों का अंकगणितीय माध्य पाते हैं:

धड़कता है

अगला, हम वर्ग विचलन के योग की गणना करते हैं डी मैंसे सूत्र के अनुसार:

नमूने के लिए विचरण निर्धारित करें डी मैं :

धड़कता है 2

हम परिकल्पनाओं को सामने रखते हैं:

- शून्य - एच 0: कि युग्मित अंतरों का सामान्य सेट डी मैंएक सामान्य वितरण है;

- प्रतिस्पर्धा - एच 1: कि जोड़ीदार अंतर की जनसंख्या का वितरण डी मैंसामान्य से अलग।

हम महत्व के स्तर पर परीक्षण करते हैं = 0,05.

ऐसा करने के लिए, हम गणना तालिका 5.3 संकलित करेंगे।

तालिका 5.3 - शापिरो और विल्क मानदंड का परिकलन डेटा वू ओ बीएसयुग्मित मानों के अंतर से बने नमूने के लिए डी मैं

डी मैं, हराना

डी एन - के + 1 -डी =

एक एनके

×ए एनके

17 – (–2) = 19

तालिका 5.3 में भरने का क्रम:

    पहले कॉलम में हम संख्याओं को क्रम से लिखते हैं।

    दूसरे में - युग्मित मूल्यों का अंतर डी मैंघटते क्रम में।

    तीसरे में - क्रम में संख्या जोड़ी मतभेद। चूंकि हमारे मामले में एन= 10, तब 1 से में परिवर्तन एन/2 = 5.

4. चौथे में - मतभेद , जो हम इस प्रकार पाते हैं:

- बहुत से काफी महत्व की डी 10 सबसे छोटा घटाएं डी 1 = 1,

- से डी 9 घटाना डी 2 और परिणामी मान को लाइन में लिखें = 2 आदि।

    पांचवें में - हम गुणांकों के मान लिखते हैं एक एनके, शापिरो और विल्क परीक्षण की गणना के लिए आंकड़ों में प्रयुक्त तालिका से लिया गया ( वू) वितरण की सामान्यता की जाँच करना (परिशिष्ट 2) एन= 10.

    छठे भाव में - कार्य × एक एनकेऔर इन उत्पादों का योग ज्ञात कीजिए:

.

मनाया मानदंड मूल्य वू ओ बीएससूत्र द्वारा ज्ञात कीजिए:

.

आइए हम शापिरो और विल्क मानदंड की गणना की शुद्धता की जांच करें ( वू ओ बीएस) प्रोग्राम "सांख्यिकी" का उपयोग करके कंप्यूटर पर इसकी गणना द्वारा।

शापिरो और विल्क मानदंड की गणना ( वू ओ बीएस) कंप्यूटर पर यह स्थापित करना संभव हो गया:

.

इसके अलावा, शापिरो और विल्क मानदंड (परिशिष्ट 3) के महत्वपूर्ण मूल्यों की तालिका के अनुसार, हम देखते हैं वू क्रेतेके लिये एन= 10. हम पाते हैं कि वू क्रेते= 0.842। मात्राओं की तुलना करें वू क्रेतेतथा वू ओ बीएस .

करते हुए निष्कर्ष: इसलिये वू ओ बीएस (0,874) > वू क्रेते(0.842), जनसंख्या के सामान्य वितरण की शून्य परिकल्पना को स्वीकार किया जाना चाहिए डी मैं. इसलिए, गति गुणों के विकास के लिए लागू पद्धति की प्रभावशीलता का आकलन करने के लिए, किसी को पैरामीट्रिक का उपयोग करना चाहिए टी- छात्र की कसौटी।

आँकड़ों में, अनुमान दो प्रकार के होते हैं: बिंदु और अंतराल। बिंदु अनुमानएक एकल नमूना आँकड़ा है जिसका उपयोग जनसंख्या पैरामीटर का अनुमान लगाने के लिए किया जाता है। उदाहरण के लिए, नमूना माध्य एक बिंदु अनुमान है गणितीय अपेक्षासामान्य जनसंख्या, और नमूना विचरण एस 2- जनसंख्या विचरण का बिंदु अनुमान 2. यह दिखाया गया कि नमूना माध्य जनसंख्या अपेक्षा का एक निष्पक्ष अनुमान है। नमूना माध्य को निष्पक्ष कहा जाता है क्योंकि सभी नमूने का मतलब (समान नमूना आकार के साथ) एन) सामान्य जनसंख्या की गणितीय अपेक्षा के बराबर है।

नमूना विचरण के क्रम में एस 2जनसंख्या भिन्नता का एक निष्पक्ष अनुमानक बन गया 2, नमूना विचरण के हर के बराबर सेट किया जाना चाहिए एन – 1 , लेकिन नहीं एन. दूसरे शब्दों में, जनसंख्या विचरण सभी संभावित नमूना प्रसरणों का औसत है।

जनसंख्या मापदंडों का आकलन करते समय, यह ध्यान में रखा जाना चाहिए कि नमूना आँकड़े जैसे , विशिष्ट नमूनों पर निर्भर करते हैं। इस तथ्य को ध्यान में रखते हुए, प्राप्त करने के लिए अंतराल अनुमानसामान्य जनसंख्या की गणितीय अपेक्षा नमूना साधनों के वितरण का विश्लेषण करती है (अधिक विवरण के लिए, देखें)। निर्मित अंतराल एक निश्चित आत्मविश्वास स्तर की विशेषता है, जो कि संभावना है कि सामान्य आबादी के सही पैरामीटर का सही अनुमान लगाया गया है। किसी विशेषता के अनुपात का अनुमान लगाने के लिए समान विश्वास अंतराल का उपयोग किया जा सकता है आरऔर सामान्य आबादी का मुख्य वितरित द्रव्यमान।

नोट या प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण

एक ज्ञात मानक विचलन के साथ सामान्य जनसंख्या की गणितीय अपेक्षा के लिए एक विश्वास अंतराल का निर्माण

सामान्य जनसंख्या में एक विशेषता के अनुपात के लिए एक विश्वास अंतराल का निर्माण

इस खंड में, एक विश्वास अंतराल की अवधारणा को श्रेणीबद्ध डेटा तक बढ़ाया गया है। यह आपको सामान्य आबादी में विशेषता के हिस्से का अनुमान लगाने की अनुमति देता है आरएक नमूना शेयर के साथ आरएस= एक्स/एन. जैसा कि उल्लेख किया गया है, यदि मान एनआरतथा एन(1 - पी)संख्या 5 से अधिक, द्विपद वितरणसामान्य के रूप में अनुमानित किया जा सकता है। इसलिए, सामान्य जनसंख्या में एक विशेषता के हिस्से का अनुमान लगाने के लिए आरएक अंतराल का निर्माण करना संभव है जिसका आत्मविश्वास स्तर बराबर है (1 - α)x100%.


कहाँ पे पीएस- सुविधा का नमूना हिस्सा, के बराबर एक्स/एन, अर्थात। नमूना आकार से विभाजित सफलताओं की संख्या, आर- सामान्य आबादी में विशेषता का हिस्सा, जेडमानकीकृत सामान्य वितरण का महत्वपूर्ण मूल्य है, एन- नमूने का आकार।

उदाहरण 3आइए मान लें कि . से सूचना प्रणालीपिछले महीने के भीतर पूरे किए गए 100 चालानों का एक नमूना प्राप्त किया। मान लें कि इनमें से 10 चालान गलत हैं। इस तरह, आर= 10/100 = 0.1. 95% आत्मविश्वास का स्तर महत्वपूर्ण मान Z = 1.96 से मेल खाता है।

इस प्रकार, 95% संभावना है कि 4.12% और 15.88% के बीच चालान में त्रुटियां हैं।

किसी दिए गए नमूने के आकार के लिए, सामान्य जनसंख्या में विशेषता के अनुपात वाले विश्वास अंतराल एक सतत यादृच्छिक चर की तुलना में व्यापक प्रतीत होता है। ऐसा इसलिए है क्योंकि एक सतत यादृच्छिक चर के माप में श्रेणीबद्ध डेटा के मापन की तुलना में अधिक जानकारी होती है। दूसरे शब्दों में, केवल दो मान लेने वाले श्रेणीबद्ध डेटा में उनके वितरण के मापदंडों का अनुमान लगाने के लिए अपर्याप्त जानकारी होती है।

परपरिमित जनसंख्या से प्राप्त अनुमानों की गणना

गणितीय अपेक्षा का अनुमान।अंतिम जनसंख्या के लिए सुधार कारक ( पांचवें वेतन आयोग) का उपयोग मानक त्रुटि को एक कारक द्वारा कम करने के लिए किया गया था। जनसंख्या पैरामीटर अनुमानों के लिए विश्वास अंतराल की गणना करते समय, उन स्थितियों में एक सुधार कारक लागू किया जाता है जहां नमूने बिना प्रतिस्थापन के लिए जाते हैं। इस प्रकार, गणितीय अपेक्षा के लिए कॉन्फिडेंस इंटरवल, जिसका कॉन्फिडेंस लेवल के बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

उदाहरण 4एक सीमित आबादी के लिए एक सुधार कारक के आवेदन को स्पष्ट करने के लिए, आइए हम ऊपर उदाहरण 3 में चर्चा की गई चालानों की औसत राशि के लिए विश्वास अंतराल की गणना करने की समस्या पर लौटते हैं। मान लीजिए कि एक कंपनी प्रति माह 5,000 चालान जारी करती है, और एक्स=110.27 अमरीकी डालर, एस= $28.95 एन = 5000, एन = 100, α = 0.05, t99 = 1.9842। सूत्र (6) के अनुसार हम प्राप्त करते हैं:

सुविधा के हिस्से का अनुमान।नो रिटर्न चुनते समय, कॉन्फिडेंस इंटरवल उस फीचर के अनुपात के लिए होता है जिसका कॉन्फिडेंस लेवल के बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

विश्वास अंतराल और नैतिक मुद्दे

जनसंख्या का नमूना लेते समय और सांख्यिकीय निष्कर्ष तैयार करते समय, नैतिक समस्याएं अक्सर उत्पन्न होती हैं। मुख्य बात यह है कि विश्वास अंतराल और बिंदु अनुमान कैसे सहमत होते हैं। नमूना आँकड़े. प्रकाशन बिंदु अनुमानउपयुक्त आत्मविश्वास अंतराल (आमतौर पर 95% आत्मविश्वास स्तर वाले) और नमूना आकार, जिससे वे प्राप्त होते हैं, को निर्दिष्ट नहीं करना भ्रामक हो सकता है। इससे उपयोगकर्ता को यह आभास हो सकता है कि एक बिंदु अनुमान ठीक वही है जो उसे पूरी आबादी के गुणों की भविष्यवाणी करने के लिए चाहिए। इस प्रकार, यह समझना आवश्यक है कि किसी भी शोध में बिंदु नहीं, बल्कि अंतराल अनुमान. इसके अलावा, विशेष ध्यान दिया जाना चाहिए सही पसंदनमूना आकार।

सबसे अधिक बार, सांख्यिकीय जोड़तोड़ की वस्तुएं विभिन्न राजनीतिक मुद्दों पर जनसंख्या के समाजशास्त्रीय सर्वेक्षण के परिणाम हैं। साथ ही सर्वेक्षण के परिणामों को समाचार पत्रों के पहले पन्ने पर रखा जाता है, और नमूना त्रुटि और कार्यप्रणाली सांख्यिकीय विश्लेषणबीच में कहीं प्रिंट करें। प्राप्त बिंदु अनुमानों की वैधता को साबित करने के लिए, नमूना आकार को इंगित करना आवश्यक है जिसके आधार पर उन्हें प्राप्त किया गया था, विश्वास अंतराल की सीमाएं और इसका महत्व स्तर।

अगला नोट

लेविन एट अल पुस्तक से सामग्री प्रबंधकों के लिए सांख्यिकी का उपयोग किया जाता है। - एम .: विलियम्स, 2004. - पी। 448-462

केंद्रीय सीमा प्रमेयबताता है कि, पर्याप्त रूप से बड़े नमूने के आकार को देखते हुए, साधनों के नमूना वितरण का अनुमान लगाया जा सकता है सामान्य वितरण. यह संपत्ति जनसंख्या वितरण के प्रकार पर निर्भर नहीं करती है।

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...