कॉन्फिडेंस इंटरवल दिखाता है। विश्वास अंतराल

"कैटरेन-स्टाइल" कॉन्स्टेंटिन क्रावचिक के चक्र के बारे में प्रकाशन जारी रखता है चिकित्सा सांख्यिकी. पिछले दो लेखों में, लेखक ने और जैसी अवधारणाओं की व्याख्या को छुआ था।

कॉन्स्टेंटिन क्रावचिको

गणितज्ञ-विश्लेषक। क्षेत्र में विशेषज्ञ सांख्यिकीय अध्ययनचिकित्सा और मानविकी में

मास्को शहर

बहुत बार नैदानिक ​​​​परीक्षणों पर लेखों में आप एक रहस्यमय वाक्यांश पा सकते हैं: "आत्मविश्वास अंतराल" (95% सीआई या 95% सीआई - आत्मविश्वास अंतराल)। उदाहरण के लिए, एक लेख कह सकता है: "विद्यार्थियों के टी-टेस्ट का उपयोग मतभेदों के महत्व का आकलन करने के लिए किया गया था, जिसमें 95% विश्वास अंतराल की गणना की गई थी।"

"95% विश्वास अंतराल" का मान क्या है और इसकी गणना क्यों करें?

कॉन्फिडेंस इंटरवल क्या है? - यह वह सीमा है जिसमें जनसंख्या में वास्तविक माध्य मान गिरते हैं। और क्या, "असत्य" औसत हैं? एक मायने में, हाँ, वे करते हैं। में हमने समझाया कि पूरी आबादी में रुचि के पैरामीटर को मापना असंभव है, इसलिए शोधकर्ता सीमित नमूने से संतुष्ट हैं। इस नमूने में (उदाहरण के लिए, शरीर के वजन से) एक औसत मूल्य (एक निश्चित वजन) होता है, जिसके द्वारा हम पूरी सामान्य आबादी में औसत मूल्य का न्याय करते हैं। हालांकि, यह संभावना नहीं है कि नमूने में औसत वजन (विशेषकर एक छोटा) सामान्य आबादी में औसत वजन के साथ मेल खाएगा। इसलिए, सामान्य जनसंख्या के औसत मूल्यों की सीमा की गणना और उपयोग करना अधिक सही है।

उदाहरण के लिए, मान लें कि हीमोग्लोबिन के लिए 95% विश्वास अंतराल (95% CI) 110 और 122 g/L के बीच है। इसका मतलब यह है कि 95 % संभावना के साथ, सामान्य आबादी में हीमोग्लोबिन के लिए सही औसत मूल्य 110 से 122 ग्राम / एल की सीमा में होगा। दूसरे शब्दों में, हम नहीं जानते औसतसामान्य आबादी में हीमोग्लोबिन, लेकिन हम 95% संभावना के साथ इस सुविधा के लिए मूल्यों की सीमा का संकेत दे सकते हैं।

विश्वास अंतराल विशेष रूप से समूहों के बीच के साधनों में अंतर के लिए प्रासंगिक हैं, या जिसे प्रभाव आकार कहा जाता है।

मान लीजिए हमने दो लोहे की तैयारियों की प्रभावशीलता की तुलना की: एक जो लंबे समय से बाजार में है और एक जो अभी पंजीकृत है। चिकित्सा के दौरान, अध्ययन किए गए रोगियों के समूहों में हीमोग्लोबिन की एकाग्रता का आकलन किया गया था, और सांख्यिकीय कार्यक्रम ने हमारे लिए गणना की कि 95% की संभावना वाले दो समूहों के औसत मूल्यों के बीच का अंतर सीमा में है 1.72 से 14.36 ग्राम/ली (तालिका 1)।

टैब। 1. स्वतंत्र नमूनों के लिए मानदंड
(समूहों की तुलना हीमोग्लोबिन स्तर से की जाती है)

इसकी व्याख्या इस प्रकार की जानी चाहिए: सामान्य आबादी में रोगियों के हिस्से में जो लेता है नई दवा, पहले से ज्ञात दवा लेने वालों की तुलना में हीमोग्लोबिन औसतन 1.72-14.36 g / l अधिक होगा।

दूसरे शब्दों में, सामान्य आबादी में, 95% संभावना वाले समूहों में हीमोग्लोबिन के औसत मूल्यों में अंतर इन सीमाओं के भीतर है। यह शोधकर्ता पर निर्भर करेगा कि वह यह तय करे कि यह बहुत है या थोड़ा। इस सबका सार यह है कि हम एक औसत मूल्य के साथ काम नहीं कर रहे हैं, बल्कि कई मूल्यों के साथ काम कर रहे हैं, इसलिए, हम समूहों के बीच एक पैरामीटर में अंतर का अधिक मज़बूती से अनुमान लगाते हैं।

सांख्यिकीय पैकेज में, शोधकर्ता के विवेक पर, कोई भी स्वतंत्र रूप से विश्वास अंतराल की सीमाओं को संकीर्ण या विस्तारित कर सकता है। विश्वास अंतराल की संभावनाओं को कम करके, हम साधनों की सीमा को कम करते हैं। उदाहरण के लिए, 90% CI पर, साधनों की सीमा (या माध्य अंतर) 95% CI से कम होगी।

इसके विपरीत, प्रायिकता को 99% तक बढ़ाने से मानों की सीमा बढ़ जाती है। समूहों की तुलना करते समय, सीआई की निचली सीमा शून्य के निशान को पार कर सकती है। उदाहरण के लिए, यदि हमने कॉन्फिडेंस इंटरवल की सीमाओं को 99 % तक बढ़ा दिया है, तो इंटरवल की सीमाएं -1 से 16 g/L तक होती हैं। इसका मतलब यह है कि सामान्य आबादी में ऐसे समूह होते हैं, जिनके बीच औसत के बीच का अंतर अध्ययन की गई विशेषता के लिए 0 (एम = 0) है।

सांख्यिकीय परिकल्पनाओं का परीक्षण करने के लिए विश्वास अंतराल का उपयोग किया जा सकता है। यदि विश्वास अंतराल शून्य मान को पार कर जाता है, तो शून्य परिकल्पना, जो मानती है कि समूह अध्ययन किए गए पैरामीटर में भिन्न नहीं हैं, सत्य है। एक उदाहरण ऊपर वर्णित किया गया है, जब हमने सीमाओं को 99% तक विस्तारित किया। सामान्य आबादी में कहीं न कहीं हमें ऐसे समूह मिले जो किसी भी तरह से भिन्न नहीं थे।

हीमोग्लोबिन में अंतर का 95% विश्वास अंतराल, (g/l)


यह आंकड़ा एक रेखा के रूप में दो समूहों के बीच माध्य हीमोग्लोबिन अंतर के 95% विश्वास अंतराल को दर्शाता है। रेखा शून्य चिह्न से गुजरती है, इसलिए, शून्य के बराबर साधनों के बीच एक अंतर है, जो शून्य परिकल्पना की पुष्टि करता है कि समूह भिन्न नहीं हैं। समूहों के बीच का अंतर -2 से 5 ग्राम / लीटर तक होता है, जिसका अर्थ है कि हीमोग्लोबिन या तो 2 ग्राम / लीटर कम हो सकता है या 5 ग्राम / लीटर बढ़ सकता है।

आत्मविश्वास अंतराल एक बहुत ही महत्वपूर्ण संकेतक है। इसके लिए धन्यवाद, आप देख सकते हैं कि क्या समूहों में अंतर वास्तव में साधनों में अंतर के कारण था या एक बड़े नमूने के कारण, क्योंकि एक बड़े नमूने के साथ, अंतर खोजने की संभावना एक छोटे से अधिक होती है।

व्यवहार में, यह ऐसा दिख सकता है। हमने 1000 लोगों का नमूना लिया, हीमोग्लोबिन के स्तर को मापा और पाया कि अंतर के लिए आत्मविश्वास अंतराल 1.2 से 1.5 ग्राम/ली तक है। स्तर आंकड़ों की महत्ताजबकि पी

हम देखते हैं कि हीमोग्लोबिन की सांद्रता में वृद्धि हुई है, लेकिन लगभग अगोचर रूप से, इसलिए, नमूना आकार के कारण सांख्यिकीय महत्व ठीक दिखाई दिया।

विश्वास अंतराल की गणना न केवल औसत के लिए की जा सकती है, बल्कि अनुपात (और जोखिम अनुपात) के लिए भी की जा सकती है। उदाहरण के लिए, हम उन रोगियों के अनुपात के विश्वास अंतराल में रुचि रखते हैं जिन्होंने विकसित दवा लेते समय छूट प्राप्त की थी। मान लें कि अनुपात के लिए 95% सीआई, यानी ऐसे रोगियों के अनुपात के लिए, 0.60–0.80 की सीमा में है। इस प्रकार, हम कह सकते हैं कि 60 से 80% मामलों में हमारी दवा का चिकित्सीय प्रभाव होता है।

कोई भी नमूना सामान्य जनसंख्या का केवल एक अनुमानित विचार देता है, और सभी नमूना सांख्यिकीय विशेषताओं (माध्य, मोड, विचरण ...) सामान्य जनसंख्या की दुर्गमता (चित्र 20)।

चित्र 20. नमूनाकरण त्रुटि

लेकिन आप उस अंतराल को निर्दिष्ट कर सकते हैं जिसमें, एक निश्चित डिग्री की संभावना के साथ, सांख्यिकीय विशेषता का सही (सामान्य) मान निहित है। इस अंतराल को कहा जाता है डी आत्मविश्वास अंतराल (सीआई)।

तो 95% की संभावना के साथ सामान्य औसत के भीतर है

से, (20)

कहाँ पे टी - के लिए छात्र की कसौटी का सारणीबद्ध मान α = 0.05 और एफ= एन-1

पाया जा सकता है और 99% सीआई, इस मामले में टी के लिए चुना गया α =0,01.

विश्वास अंतराल का व्यावहारिक महत्व क्या है?

    एक विस्तृत विश्वास अंतराल इंगित करता है कि नमूना माध्य जनसंख्या माध्य को सटीक रूप से नहीं दर्शाता है। यह आमतौर पर अपर्याप्त नमूना आकार, या इसकी विविधता के कारण होता है, अर्थात। बड़ा फैलाव। दोनों माध्य में एक बड़ी त्रुटि देते हैं और, तदनुसार, एक व्यापक CI। और यही कारण है कि अनुसंधान योजना चरण में लौटने का।

    ऊपरी और निचली सीआई सीमाएं यह आकलन करती हैं कि क्या परिणाम चिकित्सकीय रूप से महत्वपूर्ण होंगे

आइए हम समूह गुणों के अध्ययन के परिणामों के सांख्यिकीय और नैदानिक ​​​​महत्व के प्रश्न पर अधिक विस्तार से ध्यान दें। याद रखें कि आँकड़ों का कार्य नमूना डेटा के आधार पर सामान्य आबादी में कम से कम कुछ अंतरों का पता लगाना है। ऐसे (कोई नहीं) अंतर को खोजना चिकित्सक का कार्य है जो निदान या उपचार में मदद करेगा। और हमेशा सांख्यिकीय निष्कर्ष नैदानिक ​​​​निष्कर्षों का आधार नहीं होते हैं। इस प्रकार, हीमोग्लोबिन में 3 ग्राम/ली की सांख्यिकीय रूप से महत्वपूर्ण कमी चिंता का कारण नहीं है। और, इसके विपरीत, यदि मानव शरीर में किसी समस्या का संपूर्ण जनसंख्या के स्तर पर जन चरित्र नहीं है, तो यह इस समस्या से निपटने का कोई कारण नहीं है।

हम इस स्थिति पर विचार करेंगे उदाहरण.

शोधकर्ताओं ने सोचा कि क्या जिन लड़कों को किसी प्रकार की संक्रामक बीमारी थी, वे विकास में अपने साथियों से पिछड़ रहे थे। इस उद्देश्य के लिए एक चयनात्मक अध्ययन किया गया, जिसमें इस रोग से ग्रस्त 10 लड़कों ने भाग लिया। परिणाम तालिका 23 में प्रस्तुत किए गए हैं।

तालिका 23. सांख्यिकीय परिणाम

निचली सीमा

ऊपरी सीमा

निर्दिष्टीकरण (सेमी)

मध्यम

इन गणनाओं से, यह इस प्रकार है कि 10 वर्षीय लड़कों की चुनिंदा औसत ऊंचाई, जिन्हें किसी प्रकार की संक्रामक बीमारी है, सामान्य (132.5 सेमी) के करीब है। हालांकि, आत्मविश्वास अंतराल (126.6 सेमी) की निचली सीमा इंगित करती है कि 95% संभावना है कि इन बच्चों की वास्तविक औसत ऊंचाई "छोटे कद" की अवधारणा से मेल खाती है, अर्थात। ये बच्चे बौने हैं।

इस उदाहरण में, विश्वास अंतराल गणना के परिणाम चिकित्सकीय रूप से महत्वपूर्ण हैं।

और अन्य। वे सभी अपने सैद्धांतिक समकक्षों के अनुमान हैं, जो एक नमूना नहीं होने पर प्राप्त किया जा सकता है, लेकिन आबादी. लेकिन अफसोस, आम जनता बहुत महंगी है और अक्सर अनुपलब्ध रहती है।

अंतराल अनुमान की अवधारणा

किसी भी नमूना अनुमान में कुछ बिखराव होता है, क्योंकि एक विशेष नमूने में मूल्यों के आधार पर एक यादृच्छिक चर है। इसलिए, अधिक विश्वसनीय सांख्यिकीय निष्कर्षों के लिए, किसी को न केवल पता होना चाहिए बिंदु लागत, लेकिन एक अंतराल भी, जिसकी उच्च संभावना है γ (गामा) अनुमानित संकेतक को कवर करता है θ (थीटा)।

औपचारिक रूप से, ये दो ऐसे मान (आँकड़े) हैं टी 1 (एक्स)तथा टी 2 (एक्स), क्या टी1< T 2 , जिसके लिए संभाव्यता के एक निश्चित स्तर पर γ शर्त पूरी होती है:

संक्षेप में, इसकी संभावना है γ या अधिक सही मान बिंदुओं के बीच है टी 1 (एक्स)तथा टी 2 (एक्स), जिन्हें निचली और ऊपरी सीमा कहा जाता है विश्वास अंतराल.

आत्मविश्वास अंतराल के निर्माण की शर्तों में से एक इसकी अधिकतम संकीर्णता है, अर्थात। यह यथासंभव छोटा होना चाहिए। इच्छा बिलकुल स्वाभाविक है, क्योंकि। शोधकर्ता वांछित पैरामीटर की खोज को अधिक सटीक रूप से स्थानीयकृत करने का प्रयास करता है।

यह इस प्रकार है कि विश्वास अंतराल को वितरण की अधिकतम संभावनाओं को कवर करना चाहिए। और स्कोर ही केंद्र में हो।

यानी ऊपर की ओर विचलन (अनुमान से सही संकेतक की) की संभावना नीचे की ओर विचलन की संभावना के बराबर है। यह भी ध्यान दिया जाना चाहिए कि विषम वितरण के लिए, दाईं ओर का अंतराल बाईं ओर के अंतराल के बराबर नहीं है।

ऊपर दिया गया आंकड़ा स्पष्ट रूप से दिखाता है कि आत्मविश्वास का स्तर जितना अधिक होगा, अंतराल उतना ही व्यापक होगा - एक सीधा संबंध।

यह अज्ञात मापदंडों के अंतराल आकलन के सिद्धांत का एक छोटा सा परिचय था। आइए इसके लिए आत्मविश्वास की सीमा खोजने के लिए आगे बढ़ते हैं गणितीय अपेक्षा.

गणितीय अपेक्षा के लिए विश्वास अंतराल

यदि मूल डेटा को वितरित किया जाता है, तो औसत सामान्य मान होगा। यह इस नियम से चलता है कि सामान्य मूल्यों के रैखिक संयोजन का भी सामान्य वितरण होता है। इसलिए, संभावनाओं की गणना करने के लिए, हम सामान्य वितरण कानून के गणितीय तंत्र का उपयोग कर सकते हैं।

हालांकि, इसके लिए दो मापदंडों के ज्ञान की आवश्यकता होगी - अपेक्षित मूल्य और विचरण, जो आमतौर पर ज्ञात नहीं होते हैं। बेशक, आप मापदंडों (अंकगणित माध्य और) के बजाय अनुमानों का उपयोग कर सकते हैं, लेकिन तब माध्य का वितरण बिल्कुल सामान्य नहीं होगा, यह थोड़ा चपटा हो जाएगा। आयरलैंड के नागरिक विलियम गॉसेट ने इस तथ्य को बखूबी नोट किया जब उन्होंने बायोमेट्रिका के मार्च 1908 के अंक में अपनी खोज प्रकाशित की। गोपनीयता के उद्देश्य से, गॉसेट ने छात्र के साथ हस्ताक्षर किए। इस प्रकार विद्यार्थी का t-वितरण प्रकट हुआ।

हालांकि, खगोलीय प्रेक्षणों में त्रुटियों के विश्लेषण में के. गॉस द्वारा उपयोग किए गए डेटा का सामान्य वितरण, स्थलीय जीवन में अत्यंत दुर्लभ है और इसे स्थापित करना काफी कठिन है (उच्च सटीकता के लिए, लगभग 2 हजार टिप्पणियों की आवश्यकता होती है)। इसलिए, सामान्यता की धारणा को छोड़ना और उन तरीकों का उपयोग करना सबसे अच्छा है जो मूल डेटा के वितरण पर निर्भर नहीं करते हैं।

प्रश्न उठता है: यदि किसी अज्ञात वितरण के डेटा से गणना की जाती है तो अंकगणितीय माध्य का वितरण क्या होता है? उत्तर सुप्रसिद्ध प्रायिकता सिद्धांत द्वारा दिया गया है केंद्रीय सीमा प्रमेय(सीपीटी)। गणित में, इसके कई संस्करण हैं (वर्षों में फॉर्मूलेशन को परिष्कृत किया गया है), लेकिन उनमें से सभी मोटे तौर पर इस दावे को उबालते हैं कि बड़ी संख्या में स्वतंत्र यादृच्छिक चर का योग पालन करता है सामान्य कानूनवितरण।

अंकगणित माध्य की गणना करते समय, यादृच्छिक चर के योग का उपयोग किया जाता है। इससे यह पता चलता है कि अंकगणितीय माध्य का एक सामान्य वितरण होता है, जिसमें अपेक्षित मूल्य प्रारंभिक डेटा का अपेक्षित मूल्य होता है, और विचरण होता है।

स्मार्ट लोगसीएलटी को साबित करना जानते हैं, लेकिन हम इसे एक्सेल में किए गए एक प्रयोग की मदद से सत्यापित करेंगे। आइए 50 समान रूप से वितरित यादृच्छिक चर के नमूने का अनुकरण करें (का उपयोग करके एक्सेल फ़ंक्शनरैंडमबेटवीन)। फिर हम ऐसे 1000 नमूने बनाएंगे और प्रत्येक के लिए अंकगणितीय माध्य की गणना करेंगे। आइए उनके वितरण को देखें।

यह देखा जा सकता है कि औसत का वितरण सामान्य कानून के करीब है। यदि नमूनों की मात्रा और उनकी संख्या को और भी बड़ा कर दिया जाए, तो समानता और भी बेहतर हो जाएगी।

अब जब हमने अपने लिए सीएलटी की वैधता देख ली है, तो हम अंकगणितीय माध्य के लिए विश्वास अंतराल की गणना कर सकते हैं, जिसका उपयोग करके, दी गई संभावनावास्तविक माध्य या अपेक्षित मूल्य को कवर करें।

ऊपरी और निचली सीमा निर्धारित करने के लिए, आपको मापदंडों को जानना होगा सामान्य वितरण. एक नियम के रूप में, वे नहीं हैं, इसलिए अनुमानों का उपयोग किया जाता है: अंकगणित औसततथा नमूना विचरण. फिर से, यह विधि केवल बड़े नमूनों के लिए एक अच्छा सन्निकटन देती है। जब नमूने छोटे होते हैं, तो अक्सर छात्र के वितरण का उपयोग करने की सिफारिश की जाती है। विश्वास मत करो! माध्य के लिए विद्यार्थी का वितरण तभी होता है जब मूल डेटा का सामान्य वितरण होता है, यानी लगभग कभी नहीं। इसलिए, आवश्यक डेटा की मात्रा के लिए न्यूनतम बार तुरंत सेट करना और विषम रूप से सही तरीकों का उपयोग करना बेहतर है। वे कहते हैं कि 30 अवलोकन पर्याप्त हैं। 50 लो - तुम गलत नहीं हो सकते।

टी 1.2विश्वास अंतराल की निचली और ऊपरी सीमाएँ हैं

- नमूना अंकगणित माध्य

एस0- नमूना मानक विचलन (निष्पक्ष)

एन - नमूने का आकार

γ - आत्मविश्वास का स्तर (आमतौर पर 0.9, 0.95 या 0.99) के बराबर

सी γ =Φ -1 ((1+γ)/2)मानक सामान्य वितरण फ़ंक्शन का पारस्परिक है। सरल शब्दों में, यह अंकगणित माध्य से निचली या ऊपरी सीमा तक मानक त्रुटियों की संख्या है (संकेतित तीन संभावनाएं 1.64, 1.96 और 2.58 के मानों के अनुरूप हैं)।

सूत्र का सार यह है कि अंकगणित माध्य लिया जाता है और फिर उसमें से एक निश्चित राशि अलग कर दी जाती है ( . के साथ) मानक त्रुटियां ( एस 0 /√n) सब कुछ ज्ञात है, इसे लो और गिनें।

पीसी के बड़े पैमाने पर उपयोग से पहले, सामान्य वितरण फ़ंक्शन और इसके व्युत्क्रम के मूल्यों को प्राप्त करने के लिए, उन्होंने . उनका अभी भी उपयोग किया जा रहा है, लेकिन रेडी-मेड की ओर मुड़ना अधिक कुशल है एक्सेल सूत्र. उपरोक्त सूत्र ( , और ) के सभी तत्वों की गणना एक्सेल में आसानी से की जा सकती है। लेकिन कॉन्फिडेंस इंटरवल की गणना के लिए एक रेडीमेड फॉर्मूला भी है - विश्वास मानदंड. इसका सिंटैक्स निम्न है।

विश्वास मानदंड (अल्फा, मानक_देव, आकार)

अल्फा- महत्व स्तर या आत्मविश्वास का स्तर, जो उपरोक्त संकेतन में 1-γ के बराबर है, अर्थात। संभावना है कि गणितीयउम्मीद विश्वास अंतराल के बाहर होगी। पर आत्मविश्वास का स्तर 0.95, अल्फा 0.05 है, और इसी तरह।

मानक_ऑफनमूना डेटा का मानक विचलन है। आपको मानक त्रुटि की गणना करने की आवश्यकता नहीं है, एक्सेल n की जड़ से विभाजित होगा।

आकार- नमूना आकार (एन)।

CONFIDENCE.NORM फ़ंक्शन का परिणाम विश्वास अंतराल की गणना के लिए सूत्र से दूसरा शब्द है, अर्थात। आधा अंतराल। तदनुसार, निचले और ऊपरी बिंदु औसत ± प्राप्त मूल्य हैं।

इस प्रकार, अंकगणित माध्य के लिए विश्वास अंतराल की गणना के लिए एक सार्वभौमिक एल्गोरिथ्म बनाना संभव है, जो प्रारंभिक डेटा के वितरण पर निर्भर नहीं करता है। सार्वभौमिकता की कीमत इसकी स्पर्शोन्मुख प्रकृति है, अर्थात। अपेक्षाकृत बड़े नमूनों का उपयोग करने की आवश्यकता। हालांकि, सदी में आधुनिक तकनीकसही मात्रा में डेटा एकत्र करना आमतौर पर मुश्किल नहीं होता है।

एक विश्वास अंतराल का उपयोग करके सांख्यिकीय परिकल्पना का परीक्षण करना

(मॉड्यूल 111)

सांख्यिकी में हल की जाने वाली मुख्य समस्याओं में से एक है। संक्षेप में इसका सार यही है। उदाहरण के लिए, एक धारणा बनाई जाती है कि सामान्य जनसंख्या की अपेक्षा कुछ मूल्य के बराबर होती है। फिर नमूना साधनों के वितरण का निर्माण किया जाता है, जिसे एक निश्चित अपेक्षा के साथ देखा जा सकता है। इसके बाद, हम देखते हैं कि इस सशर्त वितरण में वास्तविक औसत कहाँ स्थित है। यदि यह स्वीकार्य सीमा से अधिक हो जाता है, तो इस तरह के औसत की उपस्थिति बहुत ही असंभव है, और प्रयोग की एक पुनरावृत्ति के साथ यह लगभग असंभव है, जो कि परिकल्पना के विपरीत है, जिसे सफलतापूर्वक खारिज कर दिया गया है। यदि औसत महत्वपूर्ण स्तर से आगे नहीं जाता है, तो परिकल्पना को खारिज नहीं किया जाता है (लेकिन यह भी साबित नहीं होता है!)

तो, विश्वास अंतराल की सहायता से, हमारे मामले में अपेक्षा के लिए, आप कुछ परिकल्पनाओं का परीक्षण भी कर सकते हैं। यह करना बहुत आसान है। मान लीजिए कि किसी नमूने के लिए अंकगणितीय माध्य 100 है। परिकल्पना का परीक्षण किया जा रहा है कि अपेक्षित मान, मान लीजिए, 90 है। अर्थात, यदि हम प्रश्न को मूल रूप से रखते हैं, तो ऐसा लगता है: क्या यह हो सकता है कि वास्तविक मूल्य के साथ औसत 90 के बराबर, देखा गया औसत 100 था?

इस प्रश्न का उत्तर देने के लिए, मानक विचलन और नमूना आकार पर अतिरिक्त जानकारी की आवश्यकता होगी। मान लें कि मानक विचलन 30 है, और अवलोकनों की संख्या 64 है (मूल को आसानी से निकालने के लिए)। तब माध्य की मानक त्रुटि 30/8 या 3.75 है। 95% विश्वास अंतराल की गणना करने के लिए, आपको माध्य के दोनों किनारों पर दो मानक त्रुटियों को अलग रखना होगा (अधिक सटीक रूप से, 1.96)। विश्वास अंतराल लगभग 100 ± 7.5, या 92.5 से 107.5 तक होगा।

आगे तर्क इस प्रकार है। यदि परीक्षण किया गया मान विश्वास अंतराल के भीतर आता है, तो यह परिकल्पना का खंडन नहीं करता है, क्योंकि यादृच्छिक उतार-चढ़ाव की सीमा के भीतर फिट बैठता है (95% की संभावना के साथ)। यदि परीक्षण बिंदु विश्वास अंतराल के बाहर है, तो ऐसी घटना की संभावना बहुत कम है, किसी भी मामले में स्वीकार्य स्तर से नीचे। अतः परिकल्पना को प्रेक्षित आँकड़ों के विपरीत बताते हुए अस्वीकृत किया जाता है। हमारे मामले में, उम्मीद की परिकल्पना विश्वास अंतराल के बाहर है (90 का परीक्षण मूल्य 100 ± 7.5 के अंतराल में शामिल नहीं है), इसलिए इसे अस्वीकार कर दिया जाना चाहिए। उपरोक्त आदिम प्रश्न का उत्तर देते हुए, किसी को कहना चाहिए: नहीं, यह किसी भी मामले में नहीं हो सकता है, ऐसा बहुत कम होता है। अक्सर, यह परिकल्पना (पी-स्तर) की गलत अस्वीकृति की एक विशिष्ट संभावना को इंगित करता है, न कि किसी दिए गए स्तर के अनुसार, जिसके अनुसार आत्मविश्वास अंतराल बनाया गया था, लेकिन उस पर एक और समय।

जैसा कि आप देख सकते हैं, माध्य (या गणितीय अपेक्षा) के लिए एक विश्वास अंतराल बनाना मुश्किल नहीं है। मुख्य बात सार को पकड़ना है, और फिर चीजें चली जाएंगी। व्यवहार में, अधिकांश 95% विश्वास अंतराल का उपयोग करते हैं, जो कि माध्य के दोनों ओर लगभग दो मानक त्रुटियां हैं।

अभी के लिए इतना ही। शुभकामनाएं!

विश्वास अंतराल(सीआई; अंग्रेजी में, आत्मविश्वास अंतराल - सीआई) नमूने पर अध्ययन में प्राप्त ऐसे सभी रोगियों (सामान्य जनसंख्या) की आबादी के बारे में निष्कर्ष निकालने के लिए, अध्ययन के परिणामों की सटीकता (या अनिश्चितता) का एक माप देता है। ) 95% CI की सही परिभाषा निम्नानुसार तैयार की जा सकती है: ऐसे अंतरालों के 95% में जनसंख्या में सही मान होगा। यह व्याख्या कुछ हद तक कम सटीक है: सीआई मूल्यों की श्रेणी है जिसके भीतर आप 95% सुनिश्चित हो सकते हैं कि इसमें सही मूल्य है। सीआई का उपयोग करते समय, पी मान के विपरीत मात्रात्मक प्रभाव को निर्धारित करने पर जोर दिया जाता है, जो सांख्यिकीय महत्व के परीक्षण के परिणामस्वरूप प्राप्त होता है। पी मान किसी भी राशि का मूल्यांकन नहीं करता है, बल्कि "कोई प्रभाव नहीं" की शून्य परिकल्पना के खिलाफ सबूत की ताकत के एक उपाय के रूप में कार्य करता है। P का मान अपने आप में अंतर के परिमाण के बारे में या उसकी दिशा के बारे में भी कुछ नहीं बताता है। इसलिए, पी के स्वतंत्र मूल्य लेखों या सार में बिल्कुल जानकारीपूर्ण नहीं हैं। इसके विपरीत, सीआई तत्काल ब्याज के प्रभाव की मात्रा, जैसे उपचार की उपयोगिता और साक्ष्य की ताकत दोनों को इंगित करता है। इसलिए डीआई का सीधा संबंध डीएम की प्रैक्टिस से है।

के लिए मूल्यांकन दृष्टिकोण सांख्यिकीय विश्लेषण, सीआई द्वारा सचित्र, का उद्देश्य ब्याज के प्रभाव की मात्रा (नैदानिक ​​​​परीक्षण की संवेदनशीलता, अनुमानित मामलों की दर, उपचार के साथ सापेक्ष जोखिम में कमी, आदि) को मापने के साथ-साथ इस प्रभाव में अनिश्चितता को मापने के लिए है। अक्सर, सीआई अनुमान के दोनों ओर मूल्यों की श्रेणी है जिसमें वास्तविक मूल्य निहित होने की संभावना है, और आप इसके बारे में 95% सुनिश्चित हो सकते हैं। 95% प्रायिकता का उपयोग करने की परंपरा मनमाना है, साथ ही P . का मान भी है<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

सीआई इस विचार पर आधारित है कि रोगियों के विभिन्न समूहों पर किया गया एक ही अध्ययन समान परिणाम नहीं देगा, लेकिन यह कि उनके परिणाम सही लेकिन अज्ञात मूल्य के आसपास वितरित किए जाएंगे। दूसरे शब्दों में, सीआई इसे "नमूना-निर्भर परिवर्तनशीलता" के रूप में वर्णित करता है। सीआई अन्य कारणों से अतिरिक्त अनिश्चितता को नहीं दर्शाता है; विशेष रूप से, इसमें ट्रैकिंग पर रोगियों के चुनिंदा नुकसान के प्रभाव, खराब अनुपालन या गलत परिणाम माप, अंधापन की कमी आदि शामिल नहीं हैं। इस प्रकार CI हमेशा अनिश्चितता की कुल मात्रा को कम करके आंकता है।

विश्वास अंतराल गणना

तालिका ए1.1। कुछ नैदानिक ​​मापों के लिए मानक त्रुटियां और आत्मविश्वास अंतराल

आम तौर पर, सीआई की गणना मात्रात्मक माप के एक अनुमानित अनुमान से की जाती है, जैसे कि अंतर (डी) दो अनुपातों के बीच, और उस अंतर के अनुमान में मानक त्रुटि (एसई)। इस प्रकार प्राप्त अनुमानित 95% CI d ± 1.96 SE है। परिणाम माप की प्रकृति और सीआई के कवरेज के अनुसार सूत्र बदलता है। उदाहरण के लिए, अकोशिकीय पर्टुसिस वैक्सीन के एक यादृच्छिक, प्लेसीबो-नियंत्रित परीक्षण में, 1670 (4.3%) शिशुओं में से 72 में काली खांसी विकसित हुई, जिन्होंने टीका प्राप्त किया और नियंत्रण समूह में 1665 में से 240 (14.4%)। प्रतिशत अंतर, जिसे पूर्ण जोखिम में कमी के रूप में जाना जाता है, 10.1% है। इस अंतर का SE 0.99% है। तदनुसार, 95% चक्रवृद्धि ब्याज 10.1% + 1.96 x 0.99% है, अर्थात। 8.2 से 12.0 तक।

विभिन्न दार्शनिक दृष्टिकोणों के बावजूद, सीआई और सांख्यिकीय महत्व के परीक्षण गणितीय रूप से निकट से संबंधित हैं।

इस प्रकार, P का मान "महत्वपूर्ण" है, अर्थात। आर<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

सीआई में व्यक्त अनुमान की अनिश्चितता (अशुद्धि), काफी हद तक नमूना आकार के वर्गमूल से संबंधित है। छोटे नमूने बड़े नमूनों की तुलना में कम जानकारी प्रदान करते हैं, और सीआई छोटे नमूनों में तदनुसार व्यापक होते हैं। उदाहरण के लिए, हेलिकोबैक्टर पाइलोरी संक्रमण का निदान करने के लिए इस्तेमाल किए गए तीन परीक्षणों के प्रदर्शन की तुलना करने वाले एक लेख ने यूरिया सांस परीक्षण संवेदनशीलता 95.8% (95% सीआई 75-100) की सूचना दी। जबकि 95.8% का आंकड़ा प्रभावशाली दिखता है, 24 वयस्क एच। पाइलोरी रोगियों के छोटे नमूने के आकार का मतलब है कि इस अनुमान में महत्वपूर्ण अनिश्चितता है, जैसा कि विस्तृत सीआई द्वारा दिखाया गया है। दरअसल, 75% की निचली सीमा 95.8% अनुमान से काफी कम है। यदि 240 लोगों के नमूने में समान संवेदनशीलता देखी गई, तो 95% सीआई 92.5-98.0 होगा, यह अधिक आश्वासन देता है कि परीक्षण अत्यधिक संवेदनशील है।

यादृच्छिक नियंत्रित परीक्षणों (आरसीटी) में, गैर-महत्वपूर्ण परिणाम (यानी पी> 0.05 वाले) विशेष रूप से गलत व्याख्या के लिए अतिसंवेदनशील होते हैं। सीआई यहां विशेष रूप से उपयोगी है क्योंकि यह इंगित करता है कि परिणाम चिकित्सकीय रूप से उपयोगी सच्चे प्रभाव के साथ कितने अनुकूल हैं। उदाहरण के लिए, बृहदान्त्र में सिवनी और स्टेपल सम्मिलन की तुलना करने वाले आरसीटी में, घाव संक्रमण क्रमशः 10.9% और 13.5% रोगियों में विकसित हुआ, (पी = 0.30)। इस अंतर के लिए 95% CI 2.6% (-2 से +8) है। इस अध्ययन में भी, जिसमें 652 रोगी शामिल थे, यह संभावना बनी हुई है कि दो प्रक्रियाओं के परिणामस्वरूप संक्रमण की घटनाओं में मामूली अंतर है। अध्ययन जितना छोटा होगा, अनिश्चितता उतनी ही अधिक होगी। सुंग एट अल। 100 रोगियों में तीव्र वैरिकाज़ रक्तस्राव के लिए आपातकालीन स्क्लेरोथेरेपी के साथ ऑक्टेरोटाइड जलसेक की तुलना करने के लिए एक आरसीटी का प्रदर्शन किया। ऑक्टेरोटाइड समूह में, रक्तस्राव की गिरफ्तारी दर 84% थी; स्क्लेरोथेरेपी समूह में - 90%, जो P = 0.56 देता है। ध्यान दें कि निरंतर रक्तस्राव की दर उल्लिखित अध्ययन में घाव के संक्रमण के समान है। इस मामले में, हालांकि, हस्तक्षेपों में अंतर के लिए 95% सीआई 6% (-7 से +19) है। नैदानिक ​​रुचि के 5% अंतर की तुलना में यह सीमा काफी विस्तृत है। यह स्पष्ट है कि अध्ययन प्रभावकारिता में महत्वपूर्ण अंतर से इंकार नहीं करता है। इसलिए, लेखकों का निष्कर्ष "ऑक्टेरोटाइड जलसेक और स्क्लेरोथेरेपी वैरिकाज़ से रक्तस्राव के उपचार में समान रूप से प्रभावी हैं" निश्चित रूप से मान्य नहीं है। इस तरह के मामलों में जहां पूर्ण जोखिम में कमी (एआरआर) के लिए 95% सीआई में शून्य शामिल है, जैसा कि यहां, एनएनटी के लिए सीआई (इलाज के लिए आवश्यक संख्या) की व्याख्या करना मुश्किल है। एनएलपी और इसका सीआई एसीपी के व्युत्क्रम से प्राप्त किया जाता है (यदि इन मानों को प्रतिशत के रूप में दिया जाता है तो उन्हें 100 से गुणा करें)। यहां हमें एनपीपी = 100: 6 = 16.6 प्राप्त होता है, जिसमें 95% सीआई -14.3 से 5.3 तक होता है। जैसा कि तालिका में फुटनोट "डी" से देखा जा सकता है। A1.1, इस CI में NTPP के लिए 5.3 से अनंत तक और NTLP के 14.3 से अनंत तक के मान शामिल हैं।

सीआई का निर्माण सबसे अधिक इस्तेमाल किए जाने वाले सांख्यिकीय अनुमानों या तुलनाओं के लिए किया जा सकता है। आरसीटी के लिए, इसमें औसत अनुपात, सापेक्ष जोखिम, अंतर अनुपात और एनआरआर के बीच का अंतर शामिल है। इसी तरह, नैदानिक ​​​​परीक्षण सटीकता के अध्ययन में किए गए सभी प्रमुख अनुमानों के लिए सीआई प्राप्त किए जा सकते हैं- संवेदनशीलता, विशिष्टता, सकारात्मक भविष्य कहनेवाला मूल्य (जिनमें से सभी सरल अनुपात हैं), और संभावना अनुपात- मेटा-विश्लेषण और तुलना-से-नियंत्रण में प्राप्त अनुमान अध्ययन करते हैं। एक पर्सनल कंप्यूटर प्रोग्राम जो DI के इन उपयोगों में से कई को कवर करता है, सांख्यिकी के दूसरे संस्करण के साथ कॉन्फिडेंस के साथ उपलब्ध है। अनुपात के लिए सीआई की गणना के लिए मैक्रोज़ एक्सेल और सांख्यिकीय कार्यक्रमों एसपीएसएस और मिनिटैब के लिए http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm पर स्वतंत्र रूप से उपलब्ध हैं।

उपचार प्रभाव के एकाधिक मूल्यांकन

जबकि प्राथमिक अध्ययन परिणामों के लिए सीआई का निर्माण वांछनीय है, वे सभी परिणामों के लिए आवश्यक नहीं हैं। सीआई चिकित्सकीय रूप से महत्वपूर्ण तुलनाओं की चिंता करता है। उदाहरण के लिए, दो समूहों की तुलना करते समय, सही CI वह है जो समूहों के बीच अंतर के लिए बनाया गया है, जैसा कि ऊपर के उदाहरणों में दिखाया गया है, न कि CI जिसे प्रत्येक समूह में अनुमान के लिए बनाया जा सकता है। न केवल प्रत्येक समूह में अंकों के लिए अलग-अलग सीआई देना बेकार है, यह प्रस्तुति भ्रामक हो सकती है। इसी तरह, विभिन्न उपसमूहों में उपचार प्रभावकारिता की तुलना करते समय सही दृष्टिकोण दो (या अधिक) उपसमूहों की सीधे तुलना करना है। यह मान लेना गलत है कि उपचार केवल एक उपसमूह में प्रभावी है यदि इसका सीआई बिना किसी प्रभाव के मान को बाहर कर देता है, जबकि अन्य नहीं करते हैं। कई उपसमूहों में परिणामों की तुलना करते समय सीआई भी उपयोगी होते हैं। अंजीर पर। A1.1 मैग्नीशियम सल्फेट के प्लेसबो-नियंत्रित आरसीटी से महिलाओं के उपसमूहों में प्रीक्लेम्पसिया वाली महिलाओं में एक्लम्पसिया के सापेक्ष जोखिम को दर्शाता है।

चावल। ए1.2. फॉरेस्ट ग्राफ डायरिया की रोकथाम बनाम प्लेसीबो के लिए गोजातीय रोटावायरस वैक्सीन के 11 यादृच्छिक नैदानिक ​​​​परीक्षणों के परिणाम दिखाता है। दस्त के सापेक्ष जोखिम का अनुमान लगाने के लिए 95% विश्वास अंतराल का उपयोग किया गया था। काले वर्ग का आकार सूचना की मात्रा के समानुपाती होता है। इसके अलावा, उपचार प्रभावकारिता का एक सारांश अनुमान और एक 95% विश्वास अंतराल (एक हीरे द्वारा इंगित) दिखाया गया है। मेटा-विश्लेषण ने एक यादृच्छिक-प्रभाव मॉडल का उपयोग किया जो कुछ पूर्व-स्थापित मॉडल से अधिक है; उदाहरण के लिए, यह नमूना आकार की गणना में उपयोग किया जाने वाला आकार हो सकता है। अधिक कड़े मानदंड के तहत, सीआई की पूरी श्रृंखला को एक पूर्व निर्धारित न्यूनतम से अधिक लाभ दिखाना चाहिए।

हम पहले ही सांख्यिकीय महत्व की अनुपस्थिति को एक संकेत के रूप में लेने की भ्रांति पर चर्चा कर चुके हैं कि दो उपचार समान रूप से प्रभावी हैं। नैदानिक ​​​​महत्व के साथ सांख्यिकीय महत्व की बराबरी नहीं करना भी उतना ही महत्वपूर्ण है। नैदानिक ​​​​महत्व को तब माना जा सकता है जब परिणाम सांख्यिकीय रूप से महत्वपूर्ण हो और उपचार प्रतिक्रिया का परिमाण हो

अध्ययन दिखा सकते हैं कि क्या परिणाम सांख्यिकीय रूप से महत्वपूर्ण हैं और कौन से चिकित्सकीय रूप से महत्वपूर्ण हैं और कौन से नहीं हैं। अंजीर पर। A1.2 चार परीक्षणों के परिणाम दिखाता है जिसके लिए संपूर्ण CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

विश्वास अंतरालएक सांख्यिकीय मात्रा के सीमित मूल्य हैं, जो किसी दिए गए आत्मविश्वास की संभावना के साथ, इस अंतराल में एक बड़े नमूना आकार के साथ होंगे। P(θ - के रूप में निरूपित। व्यवहार में, आत्मविश्वास की संभावना को γ = 0.9 , γ = 0.95 , = 0.99 मानों से चुना जाता है जो एकता के पर्याप्त रूप से करीब है।

सेवा असाइनमेंट. यह सेवा परिभाषित करती है:

  • सामान्य माध्य के लिए विश्वास अंतराल, विचरण के लिए विश्वास अंतराल;
  • मानक विचलन के लिए विश्वास अंतराल, सामान्य अंश के लिए विश्वास अंतराल;
परिणामी समाधान Word फ़ाइल में सहेजा जाता है (उदाहरण देखें)। प्रारंभिक डेटा कैसे भरें, इस पर एक वीडियो निर्देश नीचे दिया गया है।

उदाहरण 1। एक सामूहिक फार्म पर, 1,000 भेड़ों के कुल झुंड में से, 100 भेड़ों को चयनात्मक नियंत्रण कतरनी के अधीन किया गया था। नतीजतन, प्रति भेड़ 4.2 किलोग्राम की औसत ऊन कतरनी स्थापित की गई थी। प्रति भेड़ औसत ऊन कतरनी निर्धारित करने में नमूने की मानक त्रुटि 0.99 की संभावना के साथ निर्धारित करें और सीमा जिसमें कतरनी मूल्य निहित है यदि भिन्नता 2.5 है। नमूना गैर-दोहराव है।
उदाहरण # 2। मास्को उत्तरी सीमा शुल्क के पद पर आयातित उत्पादों के बैच से, उत्पाद "ए" के 20 नमूने यादृच्छिक पुन: नमूने के क्रम में लिए गए थे। जांच के परिणामस्वरूप, नमूने में उत्पाद "ए" की औसत नमी की मात्रा स्थापित की गई, जो 1% के मानक विचलन के साथ 6% निकली।
आयातित उत्पादों के पूरे बैच में उत्पाद की औसत नमी सामग्री की सीमा 0.683 की संभावना के साथ निर्धारित करें।
उदाहरण #3। 36 छात्रों के एक सर्वेक्षण से पता चला है कि प्रति शैक्षणिक वर्ष में उनके द्वारा पढ़ी गई पाठ्यपुस्तकों की औसत संख्या 6 थी। यह मानते हुए कि प्रति सेमेस्टर एक छात्र द्वारा पढ़ी गई पाठ्यपुस्तकों की संख्या में 6 के बराबर मानक विचलन के साथ एक सामान्य वितरण कानून है, खोजें : ए) इस यादृच्छिक चर की गणितीय अपेक्षा के लिए 0.99 अंतराल अनुमान की विश्वसनीयता के साथ; बी) किस संभावना के साथ यह तर्क दिया जा सकता है कि प्रति सेमेस्टर एक छात्र द्वारा पढ़ी गई पाठ्यपुस्तकों की औसत संख्या, इस नमूने के लिए गणना की गई, गणितीय अपेक्षा से निरपेक्ष मूल्य में 2 से अधिक नहीं है।

विश्वास अंतराल का वर्गीकरण

मूल्यांकन किए जा रहे पैरामीटर के प्रकार से:

नमूना प्रकार से:

  1. अनंत नमूने के लिए विश्वास अंतराल;
  2. अंतिम नमूने के लिए विश्वास अंतराल;
सैंपलिंग को री-सैंपलिंग कहा जाता है, यदि चयनित वस्तु अगले एक को चुनने से पहले सामान्य आबादी को वापस कर दी जाती है। नमूने को गैर-दोहराव कहा जाता है।यदि चयनित वस्तु सामान्य जनसंख्या को वापस नहीं की जाती है। व्यवहार में, कोई आमतौर पर गैर-दोहराए जाने वाले नमूनों से निपटता है।

यादृच्छिक चयन के लिए माध्य नमूना त्रुटि की गणना

नमूने से प्राप्त संकेतकों के मूल्यों और सामान्य जनसंख्या के संबंधित मापदंडों के बीच विसंगति को कहा जाता है प्रतिनिधित्व त्रुटि.
सामान्य और नमूना आबादी के मुख्य मापदंडों के पदनाम।
नमूना माध्य त्रुटि सूत्र
पुनर्चयनगैर-दोहराव चयन
बीच के लिएशेयर के लिएबीच के लिएशेयर के लिए
कुछ संभावना के साथ गारंटीकृत नमूना त्रुटि सीमा (Δ) के बीच का अनुपात पी (टी),और औसत नमूना त्रुटि का रूप है: या = t μ, जहां टी- इंटीग्रल लैपलेस फ़ंक्शन की तालिका के अनुसार प्रायिकता P(t) के स्तर के आधार पर निर्धारित आत्मविश्वास गुणांक।

एक उचित यादृच्छिक चयन पद्धति के साथ नमूना आकार की गणना के लिए सूत्र

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...