विविधता श्रृंखला के प्रकार। परिवर्तनशील श्रृंखला का विश्लेषण
एक वितरण श्रृंखला के गठन में अंतर्निहित विशेषता के आधार पर, वहाँ हैं विशेषता और भिन्नता वितरण श्रृंखला.
एक सामान्य विशेषता की उपस्थिति एक सांख्यिकीय आबादी के गठन का आधार है, जो एक विवरण या माप का परिणाम है आम सुविधाएंअनुसंधान वस्तुओं।
आंकड़ों में अध्ययन का विषय बदल रहा है (अलग-अलग) विशेषताएं या सांख्यिकीय विशेषताएं।
सांख्यिकीय विशेषताओं के प्रकार.
वितरण श्रृंखला को विशेषता श्रृंखला कहा जाता है।गुणवत्ता के आधार पर बनाया गया है। ठहराव- यह एक संकेत है जिसका एक नाम है (उदाहरण के लिए, एक पेशा: एक सीमस्ट्रेस, शिक्षक, आदि)।
वितरण श्रृंखला को तालिकाओं के रूप में व्यवस्थित करने की प्रथा है। तालिका में। 2.8 वितरण की एक विशेषता श्रृंखला दिखाता है।
तालिका 2.8 - रूसी संघ के किसी एक क्षेत्र के नागरिकों को वकीलों द्वारा प्रदान की जाने वाली कानूनी सहायता के प्रकारों का वितरण।
विविधता श्रृंखला वितरण श्रृंखला हैंमात्रात्मक आधार पर बनाया गया है। किसी भी परिवर्तनशील श्रृंखला में दो तत्व होते हैं: रूपांतर और आवृत्तियाँ।
वैरिएंट एक विशेषता के व्यक्तिगत मूल्य हैं जो इसे एक भिन्नता श्रृंखला में लेते हैं।
फ़्रीक्वेंसी अलग-अलग वेरिएंट या प्रत्येक समूह की संख्या होती है विविधता श्रृंखला, अर्थात। ये संख्याएँ दर्शाती हैं कि वितरण श्रृंखला में कुछ निश्चित विकल्प कितनी बार आते हैं। सभी आवृत्तियों का योग संपूर्ण जनसंख्या का आकार, उसका आयतन निर्धारित करता है।
फ़्रीक्वेंसी को फ़्रीक्वेंसी कहा जाता है, जिसे एक इकाई के अंशों में या कुल के प्रतिशत के रूप में व्यक्त किया जाता है। तदनुसार, आवृत्तियों का योग 1 या 100% के बराबर है। परिवर्तनशील श्रृंखला हमें वास्तविक डेटा के आधार पर वितरण कानून के रूप का मूल्यांकन करने की अनुमति देती है।
विशेषता की भिन्नता की प्रकृति के आधार पर, वहाँ हैं असतत और अंतराल भिन्नता श्रृंखला.
असतत परिवर्तनशील श्रृंखला का एक उदाहरण तालिका में दिया गया है। 2.9.
तालिका 2.9 - रूसी संघ में 1989 में व्यक्तिगत अपार्टमेंट में रहने वाले कमरों की संख्या से परिवारों का वितरण।
विविधता श्रृंखला
पर आबादीकुछ मात्रात्मक विशेषता की जांच की जा रही है। आयतन का एक नमूना उसमें से यादृच्छिक रूप से निकाला जाता है एन, अर्थात् नमूने में तत्वों की संख्या है एन. पहले चरण में सांख्यिकीय प्रसंस्करणउत्पाद लेकरनमूने, यानी नंबर ऑर्डरिंग एक्स 1 , एक्स 2 ,…, एक्स एनआरोही। प्रत्येक मनाया मूल्य एक्स मैंबुलाया विकल्प. आवृत्ति मैं मैंमूल्य के अवलोकनों की संख्या है एक्स मैंनमूने में। सापेक्ष आवृत्ति (आवृत्ति) मैंआवृत्ति अनुपात है मैं मैंनमूना आकार के लिए एन: .एक परिवर्तनशील श्रृंखला का अध्ययन करते समय, संचयी आवृत्ति और संचयी आवृत्ति की अवधारणाओं का भी उपयोग किया जाता है। होने देना एक्सकुछ संख्या। फिर विकल्पों की संख्या , जिनका मान कम है एक्स, संचित आवृत्ति कहलाती है: x i . के लिए
एक विशेषता को असतत रूप से चर कहा जाता है यदि उसके व्यक्तिगत मान (वेरिएंट) एक दूसरे से कुछ परिमित राशि (आमतौर पर एक पूर्णांक) से भिन्न होते हैं। ऐसी विशेषता की एक परिवर्तनशील श्रृंखला को असतत परिवर्तनशील श्रृंखला कहा जाता है।
तालिका 1. आवृत्तियों की असतत परिवर्तनशील श्रृंखला का सामान्य दृश्य
फ़ीचर मान | एक्स मैं | एक्स 1 | x2 | … | एक्स एन |
आवृत्तियों | मैं मैं | एम 1 | एम2 | … | मैं नहीं |
एक विशेषता को लगातार अलग-अलग कहा जाता है यदि उसके मान एक दूसरे से मनमाने ढंग से छोटी राशि से भिन्न होते हैं, अर्थात। संकेत एक निश्चित अंतराल में कोई भी मान ले सकता है। ऐसे लक्षण के लिए एक सतत भिन्नता श्रृंखला को अंतराल श्रृंखला कहा जाता है।
तालिका 2. आवृत्तियों की अंतराल भिन्नता श्रृंखला का सामान्य दृश्य
तालिका 3. भिन्नता श्रृंखला की ग्राफिक छवियां
पंक्ति | बहुभुज या हिस्टोग्राम | अनुभवजन्य वितरण समारोह | |
अलग | |||
मध्यान्तर |
विविधता श्रृंखला के ग्राफिक प्रतिनिधित्व के लिए, बहुभुज, हिस्टोग्राम, संचयी वक्र और अनुभवजन्य वितरण फ़ंक्शन का अक्सर उपयोग किया जाता है।
तालिका में। 2.3 (अप्रैल 1994 में औसत प्रति व्यक्ति आय के आकार के अनुसार रूस की जनसंख्या का समूहन) प्रस्तुत किया गया है अंतराल भिन्नता श्रृंखला.
चित्रमय प्रतिनिधित्व का उपयोग करके वितरण श्रृंखला का विश्लेषण करना सुविधाजनक है, जिससे वितरण के आकार का न्याय करना भी संभव हो जाता है। परिवर्तनशील श्रृंखला की आवृत्तियों में परिवर्तन की प्रकृति का एक दृश्य प्रतिनिधित्व द्वारा दिया गया है बहुभुज और हिस्टोग्राम.
असतत परिवर्तनशील श्रृंखला प्रदर्शित करते समय बहुभुज का उपयोग किया जाता है.
आइए, उदाहरण के लिए, अपार्टमेंट के प्रकार द्वारा आवास स्टॉक के वितरण को ग्राफिक रूप से चित्रित करें (सारणी 2.10)।
तालिका 2.10 - अपार्टमेंट के प्रकार (सशर्त आंकड़े) द्वारा शहरी क्षेत्र के आवास स्टॉक का वितरण।
चावल। आवास वितरण बहुभुज
y-अक्ष पर, न केवल आवृत्तियों के मान, बल्कि भिन्नता श्रृंखला की आवृत्तियों को भी प्लॉट किया जा सकता है।
अंतराल भिन्नता श्रृंखला प्रदर्शित करने के लिए हिस्टोग्राम लिया जाता है. हिस्टोग्राम का निर्माण करते समय, अंतराल के मूल्यों को एब्सिस्सा अक्ष पर प्लॉट किया जाता है, और आवृत्तियों को संबंधित अंतराल पर निर्मित आयतों द्वारा दर्शाया जाता है। समान अंतराल की स्थिति में स्तंभों की ऊंचाई बारंबारताओं के समानुपाती होनी चाहिए। एक हिस्टोग्राम एक ग्राफ है जिसमें एक श्रृंखला को एक दूसरे से सटे बार के रूप में दिखाया जाता है।
आइए तालिका में दी गई अंतराल वितरण श्रृंखला को आलेखीय रूप से चित्रित करें। 2.11.
तालिका 2.11 - प्रति व्यक्ति रहने की जगह के आकार से परिवारों का वितरण (सशर्त आंकड़े)।
एन पी / पी | प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों के समूह | रहने की जगह के दिए गए आकार वाले परिवारों की संख्या | परिवारों की संचित संख्या |
1 | 3 – 5 | 10 | 10 |
2 | 5 – 7 | 20 | 30 |
3 | 7 – 9 | 40 | 70 |
4 | 9 – 11 | 30 | 100 |
5 | 11 – 13 | 15 | 115 |
कुल | 115 | ---- |
चावल। 2.2. प्रति व्यक्ति रहने की जगह के आकार से परिवारों के वितरण का हिस्टोग्राम
संचित श्रृंखला (तालिका 2.11) के डेटा का उपयोग करके, हम निर्माण करते हैं वितरण संचयी।
चावल। 2.3. प्रति व्यक्ति रहने की जगह के आकार से परिवारों का संचयी वितरण
एक संचयी के रूप में एक परिवर्तनशील श्रृंखला का प्रतिनिधित्व विशेष रूप से परिवर्तनशील श्रृंखला के लिए प्रभावी होता है, जिसकी आवृत्तियों को श्रृंखला की आवृत्तियों के योग के अंश या प्रतिशत के रूप में व्यक्त किया जाता है।
यदि हम परिवर्तनशील श्रृंखला के ग्राफिक निरूपण में कुल्हाड़ियों को एक संचयी के रूप में बदलते हैं, तो हम प्राप्त करते हैं ओगिवु. अंजीर पर। 2.4 तालिका में आँकड़ों के आधार पर निर्मित तोरण को दर्शाता है। 2.11.
आयतों की भुजाओं के मध्य बिंदुओं को ढूंढकर और फिर इन बिंदुओं को सीधी रेखाओं से जोड़कर एक हिस्टोग्राम को वितरण बहुभुज में परिवर्तित किया जा सकता है। परिणामी वितरण बहुभुज अंजीर में दिखाया गया है। 2.2 बिंदीदार रेखा।
असमान अंतराल के साथ एक परिवर्तनशील श्रृंखला के वितरण के हिस्टोग्राम का निर्माण करते समय, समन्वय अक्ष के साथ, आवृत्तियों को लागू नहीं किया जाता है, लेकिन इसी अंतराल में सुविधा का वितरण घनत्व लागू होता है।
वितरण घनत्व प्रति इकाई अंतराल चौड़ाई की गणना की गई आवृत्ति है, अर्थात। प्रत्येक समूह में कितनी इकाइयाँ प्रति इकाई अंतराल मान हैं। वितरण घनत्व की गणना का एक उदाहरण तालिका में प्रस्तुत किया गया है। 2.12.
तालिका 2.12 - कर्मचारियों की संख्या से उद्यमों का वितरण (आंकड़े सशर्त हैं)
एन पी / पी | कर्मचारियों की संख्या से उद्यमों के समूह, प्रति। | उद्यमों की संख्या | अंतराल आकार, प्रति। | वितरण घनत्व |
लेकिन | 1 | 2 | 3=1/2 | |
1 | 20 तक | 15 | 20 | 0,75 |
2 | 20 – 80 | 27 | 60 | 0,25 |
3 | 80 – 150 | 35 | 70 | 0,5 |
4 | 150 – 300 | 60 | 150 | 0,4 |
5 | 300 – 500 | 10 | 200 | 0,05 |
कुल | 147 | ---- | ---- |
भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए भी इस्तेमाल किया जा सकता है संचयी वक्र. संचयी (राशि का वक्र) की सहायता से संचित आवृत्तियों की एक श्रृंखला प्रदर्शित होती है। संचित आवृत्तियों को समूहों द्वारा आवृत्तियों को क्रमिक रूप से जोड़कर निर्धारित किया जाता है और यह दर्शाता है कि जनसंख्या की कितनी इकाइयों में विशेषता मान माने गए मान से अधिक नहीं हैं।
चावल। 2.4. प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों का ओगिवा वितरण
अंतराल भिन्नता श्रृंखला के संचयी का निर्माण करते समय, श्रृंखला के रूपों को एब्सिस्सा अक्ष के साथ और संचित आवृत्तियों को कोटि अक्ष के साथ प्लॉट किया जाता है।
भिन्नता निर्धारित करती हैएक ही अवधि (समय में बिंदु) में दी गई जनसंख्या की विभिन्न इकाइयों में किसी विशेषता के मूल्यों में अंतर। भिन्नता का कारण जनसंख्या की विभिन्न इकाइयों के अस्तित्व के लिए अलग-अलग परिस्थितियाँ हैं। उदाहरण के लिए, जीवन की प्रक्रिया में जुड़वाँ भी ऊंचाई, वजन, साथ ही शिक्षा के स्तर, आय, बच्चों की संख्या आदि जैसे संकेतों में अंतर प्राप्त करते हैं।
भिन्नता इस तथ्य के परिणामस्वरूप उत्पन्न होती है कि विशेषता के मूल्य स्वयं विभिन्न परिस्थितियों के कुल प्रभाव के तहत बनते हैं जो प्रत्येक व्यक्तिगत मामले में अलग-अलग तरीकों से संयुक्त होते हैं। इस प्रकार, किसी भी विकल्प का मूल्य वस्तुनिष्ठ होता है।
विविधता विशेषता हैप्रकृति और समाज की सभी घटनाओं के लिए, बिना किसी अपवाद के, व्यक्तिगत सामाजिक विशेषताओं के विधायी रूप से निर्धारित मानक मूल्यों को छोड़कर। आंकड़ों में भिन्नता के अध्ययन का बहुत महत्व है, वे अध्ययन के तहत घटना के सार को समझने में मदद करते हैं। भिन्नता का पता लगाना, उसके कारणों को स्पष्ट करना, व्यक्तिगत कारकों के प्रभाव की पहचान करना, साक्ष्य-आधारित प्रबंधन निर्णयों के कार्यान्वयन के लिए महत्वपूर्ण जानकारी प्रदान करता है।
औसत मूल्य जनसंख्या की विशेषता की एक सामान्यीकृत विशेषता देता है, लेकिन यह इसकी संरचना को प्रकट नहीं करता है। औसत मूल्य यह नहीं दिखाता है कि औसत विशेषता के प्रकार इसके आसपास कैसे स्थित हैं, चाहे वे औसत के पास वितरित हों या इससे विचलित हों। दो सेटों में औसत समान हो सकता है, लेकिन एक संस्करण में सभी व्यक्तिगत मूल्य इससे थोड़े भिन्न होते हैं, और दूसरे में, ये अंतर बड़े होते हैं, अर्थात। पहले मामले में, विशेषता की भिन्नता छोटी है, और दूसरे मामले में, यह बड़ी है; औसत मूल्य के महत्व को दर्शाने के लिए यह बहुत महत्वपूर्ण है।
संगठन के प्रमुख, प्रबंधक, शोधकर्ता के लिए भिन्नता का अध्ययन करने और इसे प्रबंधित करने में सक्षम होने के लिए, सांख्यिकी ने भिन्नता (संकेतकों की एक प्रणाली) के अध्ययन के लिए विशेष तरीके विकसित किए हैं। उनकी सहायता से भिन्नता पाई जाती है, उसके गुणों का पता चलता है। भिन्नता के संकेतक हैं : भिन्नता की सीमा, माध्य रैखिक विचलन, भिन्नता का गुणांक।
विविधता श्रृंखला और इसके रूप
विविधता श्रृंखला- यह विशेषता के मूल्यों में वृद्धि (कम अक्सर घटती) और विशेषता के एक या दूसरे मूल्य के साथ इकाइयों की संख्या की गणना करके जनसंख्या की इकाइयों का एक क्रमबद्ध वितरण है। जब जनसंख्या इकाइयों की संख्या अधिक होती है, तो क्रमित श्रृंखला बोझिल हो जाती है, इसके निर्माण में लंबा समय लगता है। ऐसी स्थिति में, अध्ययनाधीन विशेषता के मूल्यों के अनुसार जनसंख्या इकाइयों को समूहीकृत करके एक परिवर्तनशील श्रृंखला का निर्माण किया जाता है।
निम्नलिखित हैं विविधता श्रृंखला रूप :
- रैंक की गई पंक्तिअध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है।
- असतत भिन्नता श्रृंखला - यह एक तालिका है जिसमें दो पंक्तियाँ या एक ग्राफ़ होता है: चर विशेषता x के विशिष्ट मान और दिए गए मान f के साथ जनसंख्या में इकाइयों की संख्या - आवृत्तियों की विशेषता। यह तब बनाया जाता है जब विशेषता सबसे बड़ी संख्या में मान लेती है।
- अंतराल श्रृंखला.
भिन्नता की सीमा निर्धारित की जाती हैविशेषता के अधिकतम और न्यूनतम मूल्यों (विकल्प) के बीच अंतर के निरपेक्ष मूल्य के रूप में:
विविधता का दायरा दिखाता है विशेषता का केवल चरम विचलन और श्रृंखला में सभी प्रकार के व्यक्तिगत विचलन को प्रतिबिंबित नहीं करता है। यह एक चर विशेषता के परिवर्तन की सीमा की विशेषता है और दो चरम विकल्पों के उतार-चढ़ाव पर निर्भर है और भिन्नता श्रृंखला में आवृत्तियों से बिल्कुल संबंधित नहीं है, अर्थात वितरण की प्रकृति के लिए, जो इस मान को एक यादृच्छिक देता है चरित्र। भिन्नता का विश्लेषण करने के लिए, आपको एक संकेतक की आवश्यकता होती है जो एक भिन्नता विशेषता के सभी उतार-चढ़ाव को दर्शाता है और एक सामान्य विशेषता देता है। इस प्रकार का सबसे सरल संकेतक औसत रैखिक विचलन है।
विविधता श्रृंखला - यह किसी भी मात्रात्मक विशेषता के मूल्य के अनुसार अध्ययन के तहत घटना के वितरण को दर्शाने वाली एक सांख्यिकीय श्रृंखला है। उदाहरण के लिए, आयु के अनुसार रोगी, उपचार की अवधि, वजन के अनुसार नवजात शिशु आदि।
विकल्प - विशेषता के व्यक्तिगत मूल्य जिसके द्वारा समूहीकरण किया जाता है (निरूपित वी ) .
आवृत्ति- एक संख्या यह दर्शाती है कि एक या कोई अन्य प्रकार कितनी बार होता है (निरूपित पी ) . सभी आवृत्तियों का योग दिखाता है कुल गणना अवलोकन और निरूपित है एन . विविधता श्रृंखला के सबसे बड़े और सबसे छोटे संस्करण के बीच के अंतर को कहा जाता है दायरा या आयाम .
विविधता श्रृंखला हैं:
1. असंतत (असतत) और निरंतर।
श्रृंखला को निरंतर माना जाता है यदि समूहीकरण विशेषता को भिन्नात्मक मानों (वजन, ऊंचाई, आदि) में व्यक्त किया जा सकता है, तो असंतत यदि समूहीकरण विशेषता को केवल एक पूर्णांक (विकलांगता के दिन, दिल की धड़कन की संख्या, आदि) के रूप में व्यक्त किया जाता है।
2. सरल और भारित।
एक साधारण परिवर्तनशील श्रृंखला एक श्रृंखला है जिसमें एक चर विशेषता का मात्रात्मक मान एक बार होता है। एक भारित विविधता श्रृंखला में, एक अलग विशेषता के मात्रात्मक मूल्यों को एक निश्चित आवृत्ति के साथ दोहराया जाता है।
3. समूहीकृत (अंतराल) और अवर्गीकृत।
एक समूहीकृत श्रृंखला में समूहों में संयुक्त विकल्प होते हैं जो उन्हें एक निश्चित अंतराल के भीतर आकार में एकजुट करते हैं। एक अवर्गीकृत श्रृंखला में, प्रत्येक अलग-अलग प्रकार एक निश्चित आवृत्ति से मेल खाता है।
4. सम और विषम।
सम परिवर्ती श्रेणी में, बारंबारताओं का योग या प्रेक्षणों की कुल संख्या को सम संख्या के रूप में, विषम परिवर्ती श्रेणी में विषम संख्या के रूप में व्यक्त किया जाता है।
5. सममित और विषम।
एक सममित भिन्नता श्रृंखला में, सभी प्रकार के औसत मेल खाते हैं या बहुत करीब हैं (मोड, माध्यिका, अंकगणितीय माध्य)।
अध्ययन की जा रही घटना की प्रकृति के आधार पर, सांख्यिकीय अध्ययन के विशिष्ट कार्यों और उद्देश्यों के साथ-साथ स्रोत सामग्री की सामग्री पर, स्वच्छता सांख्यिकी में निम्न प्रकार के औसत का उपयोग किया जाता है:
संरचनात्मक औसत (मोड, माध्यिका);
अंकगणित औसत;
औसत हार्मोनिक;
जियोमेट्रिक माध्य;
मध्यम प्रगतिशील।
फैशन (एम के बारे में ) - चर विशेषता का मान, जो अध्ययन की गई जनसंख्या में अधिक सामान्य है, अर्थात। उच्चतम आवृत्ति के अनुरूप विकल्प। यह किसी भी गणना का सहारा लिए बिना, भिन्नता श्रृंखला की संरचना द्वारा सीधे पाया जाता है। यह आमतौर पर अंकगणितीय माध्य के बहुत करीब का मान होता है और व्यवहार में बहुत सुविधाजनक होता है।
माध्यिका (एम इ ) - भिन्नता श्रृंखला (रैंकिंग, यानी विकल्प के मूल्यों को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है) को दो बराबर हिस्सों में विभाजित करना। माध्यिका की गणना तथाकथित विषम श्रृंखला का उपयोग करके की जाती है, जिसे क्रमिक रूप से आवृत्तियों को जोड़कर प्राप्त किया जाता है। यदि आवृत्तियों का योग एक सम संख्या से मेल खाता है, तो माध्य को पारंपरिक रूप से दो औसत मानों के अंकगणितीय माध्य के रूप में लिया जाता है।
बहुलक और माध्यिका खुली जनसंख्या के मामले में लागू होते हैं, अर्थात्। जब सबसे बड़े या सबसे छोटे विकल्पों में सटीक मात्रात्मक विशेषता नहीं होती है (उदाहरण के लिए, 15 वर्ष से कम, 50 वर्ष और अधिक आयु, आदि)। इस मामले में, अंकगणितीय माध्य (पैरामीट्रिक विशेषताओं) की गणना नहीं की जा सकती है।
औसत मैं अंकगणित - सबसे आम मूल्य। अंकगणित माध्य को आमतौर पर द्वारा दर्शाया जाता है एम.
सरल अंकगणितीय माध्य और भारित माध्य में अंतर स्पष्ट कीजिए।
सरल अंकगणित माध्य परिकलित:
- उन मामलों में जब प्रत्येक इकाई के लिए एक विशेषता के ज्ञान की एक साधारण सूची द्वारा समग्रता का प्रतिनिधित्व किया जाता है;
— यदि प्रत्येक प्रकार के दोहराव की संख्या निर्धारित नहीं की जा सकती है;
— यदि प्रत्येक प्रकार के दोहराव की संख्या एक दूसरे के करीब है।
सरल अंकगणितीय माध्य की गणना सूत्र द्वारा की जाती है:
जहां वी - विशेषता के व्यक्तिगत मूल्य; n व्यक्तिगत मूल्यों की संख्या है;
- योग का संकेत।
इस प्रकार, साधारण औसत वैरिएंट के योग का प्रेक्षणों की संख्या का अनुपात है।
उदाहरण: निमोनिया के 10 रोगियों के लिए बिस्तर पर रहने की औसत अवधि निर्धारित करें:
16 दिन - 1 रोगी; 17-1; 18-1; 19-1; 20-1; 21-1; 22-1; 23-1; 26-1; 31-1.
बिस्तर-दिन।
अंकगणित भारित औसत उन मामलों में गणना की जाती है जहां विशेषता के व्यक्तिगत मूल्यों को दोहराया जाता है। इसकी गणना दो तरह से की जा सकती है:
1. सीधे (अंकगणित माध्य या प्रत्यक्ष विधि) सूत्र के अनुसार:
,
जहाँ P प्रत्येक विकल्प के प्रेक्षणों की बारंबारता (मामलों की संख्या) है।
इस प्रकार, भारित अंकगणितीय माध्य प्रेक्षणों की संख्या की आवृत्ति से भिन्न के उत्पादों के योग का अनुपात है।
2. सशर्त औसत से विचलन की गणना करके (क्षणों की विधि के अनुसार)।
भारित समांतर माध्य की गणना का आधार है:
- मात्रात्मक विशेषता के प्रकार के अनुसार समूहीकृत सामग्री;
— सभी विकल्पों को विशेषता मान (रैंक की गई श्रृंखला) के आरोही या अवरोही क्रम में व्यवस्थित किया जाना चाहिए।
क्षणों की विधि द्वारा गणना करने के लिए, पूर्वापेक्षा सभी अंतरालों के समान आकार की है।
क्षणों की विधि के अनुसार, अंकगणितीय माध्य की गणना सूत्र द्वारा की जाती है:
,
जहां एम ओ सशर्त औसत है, जिसे अक्सर उच्चतम आवृत्ति के अनुरूप सुविधा के मूल्य के रूप में लिया जाता है, यानी। जिसे अधिक बार दोहराया जाता है (मोड)।
मैं - अंतराल मूल्य।
ए - औसत की शर्तों से सशर्त विचलन, जो एक बड़े सशर्त औसत विकल्प के लिए + चिह्न के साथ संख्याओं (1, 2, आदि) की अनुक्रमिक श्रृंखला है और - (-1, -2, आदि) के साथ। एक विकल्प के लिए साइन इन करें, जो औसत से नीचे हैं। सशर्त औसत के रूप में लिए गए प्रकार से सशर्त विचलन 0 है।
पी - आवृत्तियों।
- प्रेक्षणों की कुल संख्या या n.
उदाहरण: सीधे 8 वर्षीय लड़कों की औसत ऊंचाई निर्धारित करें (तालिका 1)।
तालिका एक
सेमी . में ऊँचाई |
लड़कों पी |
केंद्रीय विकल्प वी | |
केंद्रीय संस्करण, अंतराल के बीच में, दो आसन्न समूहों के प्रारंभिक मूल्यों के अर्ध-योग के रूप में परिभाषित किया गया है:
;
आदि।
वीपी उत्पाद केंद्रीय वेरिएंट को आवृत्तियों से गुणा करके प्राप्त किया जाता है
;
आदि। फिर परिणामी उत्पादों को जोड़ा जाता है और प्राप्त किया जाता है
, जिसे अवलोकनों की संख्या (100) से विभाजित किया जाता है और भारित अंकगणितीय माध्य प्राप्त होता है।
सेमी।
हम क्षणों की विधि का उपयोग करके उसी समस्या को हल करेंगे, जिसके लिए निम्न तालिका 2 संकलित की गई है:
तालिका 2
सेमी (वी) में ऊंचाई |
लड़कों पी | ||
एन = 100
हम 122 को M o के रूप में लेते हैं, क्योंकि 100 अवलोकनों में से 33 लोगों की ऊंचाई 122 सेमी थी। हम उपरोक्त के अनुसार सशर्त विचलन (ए) को सशर्त औसत से पाते हैं। फिर हम आवृत्तियों (एपी) द्वारा सशर्त विचलन का उत्पाद प्राप्त करते हैं और प्राप्त मूल्यों को सारांशित करते हैं (
) परिणाम 17 होगा। अंत में, हम डेटा को सूत्र में प्रतिस्थापित करते हैं:
एक चर विशेषता का अध्ययन करते समय, केवल औसत मूल्यों की गणना तक ही सीमित नहीं होना चाहिए। अध्ययन की गई विशेषताओं की विविधता की डिग्री को दर्शाने वाले संकेतकों की गणना करना भी आवश्यक है। सांख्यिकीय जनसंख्या की सभी इकाइयों के लिए एक या किसी अन्य मात्रात्मक विशेषता का मान समान नहीं होता है।
भिन्नता श्रृंखला की विशेषता मानक विचलन है ( ), जो अंकगणित माध्य के सापेक्ष अध्ययन की गई विशेषताओं के बिखराव (बिखरने) को दर्शाता है, अर्थात। विविधता श्रृंखला के उतार-चढ़ाव की विशेषता है। इसे सीधे सूत्र द्वारा निर्धारित किया जा सकता है:
मानक विचलन अंकगणितीय माध्य (V-M) 2 से प्रत्येक विकल्प के वर्ग विचलन के गुणनफल के योग के वर्गमूल के बराबर होता है, जिसे इसकी आवृत्तियों को आवृत्तियों के योग से विभाजित किया जाता है (
).
गणना उदाहरण: प्रति दिन क्लिनिक में जारी किए गए बीमार पत्तों की औसत संख्या निर्धारित करें (तालिका 3)।
टेबल तीन
बीमार दिनों की संख्या जारी किए गए पत्रक डॉक्टर प्रति दिन (वी) |
डॉक्टरों की संख्या (पी) | ||||
;
हर में, जब प्रेक्षणों की संख्या 30 से कम हो, तो यह आवश्यक है
एक इकाई ले लो।
यदि श्रृंखला को समान अंतराल पर समूहीकृत किया जाता है, तो मानक विचलन को आघूर्णों की विधि द्वारा निर्धारित किया जा सकता है:
,
जहां i अंतराल का मान है;
- सशर्त औसत से सशर्त विचलन;
पी - इसी अंतराल के आवृत्ति संस्करण;
अवलोकनों की कुल संख्या है।
गणना उदाहरण : चिकित्सीय बिस्तर में रोगियों के रहने की औसत अवधि निर्धारित करें (क्षणों की विधि के अनुसार) (तालिका 4):
तालिका 4
दिनों की संख्या बेड स्टे (वी) |
बीमार (पी) | |||
;
बेल्जियम के सांख्यिकीविद् ए। क्वेटलेट ने पाया कि बड़े पैमाने पर होने वाली घटनाएँ त्रुटि वितरण कानून का पालन करती हैं, जिसे के। गॉस और पी। लाप्लास द्वारा लगभग एक साथ खोजा गया था। इस वितरण का प्रतिनिधित्व करने वाले वक्र में घंटी का आकार होता है। सामान्य वितरण कानून के अनुसार, विशेषता के व्यक्तिगत मूल्यों की परिवर्तनशीलता के भीतर है
, जो जनसंख्या में सभी इकाइयों का 99.73 प्रतिशत शामिल है।
यह गणना की जाती है कि यदि आप अंकगणितीय माध्य में 2 जोड़ते और घटाते हैं , तो भिन्नता श्रृंखला के सभी सदस्यों में से 95.45% प्राप्त मूल्यों के भीतर हैं, और अंत में, यदि हम अंकगणितीय माध्य में 1 जोड़ते और घटाते हैं , तो इस परिवर्तनशील श्रृंखला के सभी सदस्यों में से 68.27% प्राप्त मूल्यों के भीतर होंगे। परिमाण के साथ चिकित्सा में
1आदर्श की अवधारणा के साथ जुड़ा हुआ है। समांतर माध्य से विचलन 1 . से अधिक है , लेकिन 2 . से कम असामान्य है और विचलन 2 . से अधिक है असामान्य (सामान्य से ऊपर या नीचे)।
सैनिटरी सांख्यिकी में, थ्री-सिग्मा नियम का उपयोग शारीरिक विकास के अध्ययन, स्वास्थ्य देखभाल संस्थानों की गतिविधियों के आकलन और सार्वजनिक स्वास्थ्य के आकलन में किया जाता है। मानक निर्धारित करते समय राष्ट्रीय अर्थव्यवस्था में समान नियम का व्यापक रूप से उपयोग किया जाता है।
इस प्रकार, मानक विचलन कार्य करता है:
- एक परिवर्तनशील श्रृंखला के फैलाव का मापन;
- विशेषताओं की विविधता की डिग्री की विशेषताएं, जो भिन्नता के गुणांक द्वारा निर्धारित की जाती हैं:
यदि भिन्नता का गुणांक 20% से अधिक है - मजबूत विविधता, 20 से 10% तक - मध्यम, 10% से कम - वर्णों की कमजोर विविधता। भिन्नता का गुणांक, एक निश्चित सीमा तक, अंकगणितीय माध्य की विश्वसनीयता के लिए एक मानदंड है।
विविधता श्रृंखलाएक विशेषता के संख्यात्मक मूल्यों की एक श्रृंखला है।
विविधता श्रृंखला की मुख्य विशेषताएं: वी - संस्करण, पी - इसकी घटना की आवृत्ति।
विविधता श्रृंखला के प्रकार:
वेरिएंट की आवृत्ति के अनुसार: सरल - वेरिएंट एक बार होता है, भारित - वेरिएंट दो या अधिक बार होता है;
स्थान के अनुसार विकल्प: रैंक - विकल्पों को अवरोही और आरोही क्रम में व्यवस्थित किया जाता है, बिना रैंक के - विकल्प किसी विशेष क्रम में नहीं लिखे जाते हैं;
विकल्प को समूहों में समूहित करके: समूहीकृत - विकल्प समूहों में संयुक्त होते हैं, असमूहीकृत - विकल्प समूहीकृत नहीं होते हैं;
मूल्य विकल्पों द्वारा: निरंतर - विकल्प एक पूर्णांक और एक भिन्नात्मक संख्या के रूप में व्यक्त किए जाते हैं, असतत - विकल्प एक पूर्णांक के रूप में व्यक्त किए जाते हैं, जटिल - विकल्प एक सापेक्ष या औसत मूल्य द्वारा दर्शाए जाते हैं।
औसत मूल्यों की गणना के लिए एक विविधता श्रृंखला संकलित और तैयार की जाती है।
विविधता श्रृंखला संकेतन प्रपत्र:
8. औसत मूल्य, प्रकार, गणना पद्धति, स्वास्थ्य देखभाल में आवेदन
औसत मान- मात्रात्मक विशेषताओं की कुल सामान्यीकरण विशेषता। औसत का अनुप्रयोग:
1. चिकित्सा संस्थानों के काम के संगठन को चिह्नित करना और उनकी गतिविधियों का मूल्यांकन करना:
ए) पॉलीक्लिनिक में: डॉक्टरों के कार्यभार के संकेतक, यात्राओं की औसत संख्या, क्षेत्र में निवासियों की औसत संख्या;
बी) एक अस्पताल में: प्रति वर्ष बिस्तर के दिनों की औसत संख्या; अस्पताल में रहने की औसत अवधि;
ग) स्वच्छता, महामारी विज्ञान और सार्वजनिक स्वास्थ्य के केंद्र में: प्रति व्यक्ति औसत क्षेत्र (या घन क्षमता), औसत पोषण मानक (प्रोटीन, वसा, कार्बोहाइड्रेट, विटामिन, खनिज लवण, कैलोरी), स्वच्छता मानदंड और मानक, आदि। ;
2. शारीरिक विकास को चिह्नित करने के लिए (रूपात्मक और कार्यात्मक की मुख्य मानवशास्त्रीय विशेषताएं);
3. नैदानिक और प्रायोगिक अध्ययनों में सामान्य और रोग स्थितियों में शरीर के चिकित्सा और शारीरिक मापदंडों का निर्धारण करना।
4. विशेष वैज्ञानिक अनुसंधान में।
औसत मूल्यों और संकेतकों के बीच का अंतर:
1. गुणांक एक वैकल्पिक विशेषता की विशेषता है जो केवल सांख्यिकीय टीम के कुछ हिस्से में होती है, जो हो भी सकती है और नहीं भी।
औसत मूल्य टीम के सभी सदस्यों में निहित संकेतों को कवर करते हैं, लेकिन अलग-अलग डिग्री (वजन, ऊंचाई, अस्पताल में उपचार के दिन) तक।
2. गुणात्मक विशेषताओं को मापने के लिए गुणांक का उपयोग किया जाता है। औसत मूल्य अलग-अलग मात्रात्मक लक्षणों के लिए हैं।
औसत के प्रकार:
समांतर माध्य, इसकी विशेषताएँ - मानक विचलन और औसत त्रुटि
मोड और माध्यिका। फैशन (मो)- इस आबादी में सबसे अधिक बार पाए जाने वाले गुण के मूल्य से मेल खाती है। माध्यिका (मी)- विशेषता का मूल्य, जो इस आबादी में औसत मूल्य रखता है। यह प्रेक्षणों की संख्या के अनुसार श्रृंखला को 2 बराबर भागों में विभाजित करता है। अंकगणित माध्य मान (एम)- बहुलक और माध्यिका के विपरीत, यह किए गए सभी अवलोकनों पर निर्भर करता है, इसलिए यह संपूर्ण वितरण के लिए एक महत्वपूर्ण विशेषता है।
अन्य प्रकार के औसत जो विशेष अध्ययनों में उपयोग किए जाते हैं: मूल माध्य वर्ग, घन, हार्मोनिक, ज्यामितीय, प्रगतिशील।
अंकगणित औसतसांख्यिकीय जनसंख्या के औसत स्तर की विशेषता है।
एक साधारण श्रृंखला के लिए जहाँ
v - योग विकल्प,
n प्रेक्षणों की संख्या है।
भारित श्रृंखला के लिए, जहां
vr प्रत्येक विकल्प के गुणनफल और उसके घटित होने की आवृत्ति का योग है
n प्रेक्षणों की संख्या है।
मानक विचलनअंकगणित माध्य या सिग्मा (σ) विशेषता की विविधता को दर्शाता है
- एक साधारण पंक्ति के लिए
d 2 - अंकगणित माध्य और प्रत्येक विकल्प के बीच अंतर के वर्गों का योग (d = M-V│)
n प्रेक्षणों की संख्या है
- भारित श्रृंखला के लिए
d 2 p अंकगणित माध्य और प्रत्येक विकल्प के बीच के अंतर के वर्गों के गुणनफल और इसके घटित होने की आवृत्ति का योग है,
n प्रेक्षणों की संख्या है।
विविधता की डिग्री को भिन्नता के गुणांक के मूल्य से आंका जा सकता है
. 20% से अधिक - मजबूत विविधता, 10-20% - मध्यम विविधता, 10% से कम - कमजोर विविधता।
यदि एक सिग्मा (एम ± 1σ) को अंकगणित माध्य में जोड़ा और घटाया जाता है, तो सामान्य वितरण के साथ, सभी प्रकार (अवलोकन) का कम से कम 68.3% इन सीमाओं के भीतर होगा, जिसे अध्ययन के तहत घटना के लिए आदर्श माना जाता है। . यदि k 2 ± 2σ, तो सभी प्रेक्षणों का 95.5% इन सीमाओं के भीतर होगा, और यदि k M ± 3σ, तो सभी प्रेक्षणों का 99.7% इन सीमाओं के भीतर होगा। इस प्रकार, मानक विचलन मानक विचलन है, जो अध्ययन के तहत विशेषता के ऐसे मूल्य की घटना की संभावना की भविष्यवाणी करना संभव बनाता है, जो निर्दिष्ट सीमा के भीतर है।
अंकगणित माध्य की औसत त्रुटिया प्रतिनिधित्व त्रुटि। सरल, भारित श्रृंखला के लिए और क्षणों के नियम के अनुसार:
.
औसत मूल्यों की गणना करने के लिए, यह आवश्यक है: सामग्री की एकरूपता, पर्याप्त संख्या में अवलोकन। यदि प्रेक्षणों की संख्या 30 से कम है, तो और m की गणना के लिए सूत्रों में n-1 का उपयोग किया जाता है।
औसत त्रुटि के आकार से प्राप्त परिणाम का मूल्यांकन करते समय, एक आत्मविश्वास गुणांक का उपयोग किया जाता है, जो एक सही उत्तर की संभावना को निर्धारित करना संभव बनाता है, अर्थात यह इंगित करता है कि परिणामी नमूना त्रुटि वास्तविक त्रुटि से अधिक नहीं होगी निरंतर अवलोकन के परिणामस्वरूप किया गया। नतीजतन, आत्मविश्वास की संभावना में वृद्धि के साथ, विश्वास अंतराल की चौड़ाई बढ़ जाती है, जो बदले में, निर्णय के विश्वास को बढ़ाता है, प्राप्त परिणाम का समर्थन करता है।
परिवर्तन संबंधीमात्रात्मक आधार पर निर्मित वितरण श्रृंखला कहलाती है। जनसंख्या की व्यक्तिगत इकाइयों में मात्रात्मक विशेषताओं के मूल्य स्थिर नहीं होते हैं, कमोबेश एक दूसरे से भिन्न होते हैं।
उतार-चढ़ाव- उतार-चढ़ाव, जनसंख्या की इकाइयों में विशेषता के मूल्य की परिवर्तनशीलता। अध्ययन की गई जनसंख्या में होने वाले लक्षण के पृथक संख्यात्मक मान कहलाते हैं विकल्पमूल्य। जनसंख्या के पूर्ण लक्षण वर्णन के लिए औसत मूल्य की अपर्याप्तता औसत मूल्यों को संकेतकों के साथ पूरक करना आवश्यक बनाती है जो अध्ययन के तहत विशेषता के उतार-चढ़ाव (भिन्नता) को मापकर इन औसतों की विशिष्टता का आकलन करना संभव बनाता है।
भिन्नता की उपस्थिति विशेषता स्तर के गठन पर बड़ी संख्या में कारकों के प्रभाव के कारण होती है। ये कारक असमान बल के साथ और विभिन्न दिशाओं में कार्य करते हैं। विशेषता परिवर्तनशीलता के माप का वर्णन करने के लिए विविधता संकेतकों का उपयोग किया जाता है।
भिन्नता के सांख्यिकीय अध्ययन के कार्य:
- 1) जनसंख्या की अलग-अलग इकाइयों में संकेतों की भिन्नता की प्रकृति और डिग्री का अध्ययन;
- 2) जनसंख्या की कुछ विशेषताओं की भिन्नता में व्यक्तिगत कारकों या उनके समूहों की भूमिका का निर्धारण।
आंकड़ों में, संकेतकों की एक प्रणाली के उपयोग के आधार पर भिन्नता का अध्ययन करने के लिए विशेष विधियों का उपयोग किया जाता है, साथजिसके द्वारा भिन्नता को मापा जाता है।
भिन्नता का अध्ययन आवश्यक है। नमूना अवलोकन, सहसंबंध और विचरण विश्लेषण आदि करते समय विविधताओं का मापन आवश्यक है। एर्मोलेव ओ.यू. मनोवैज्ञानिकों के लिए गणितीय आँकड़े: पाठ्यपुस्तक [पाठ] / O.Yu. एर्मोलेव। - एम .: मॉस्को साइकोलॉजिकल एंड सोशल इंस्टीट्यूट, 2012 का फ्लिंट पब्लिशिंग हाउस। - 335p।
भिन्नता की डिग्री के अनुसार, कोई जनसंख्या की एकरूपता, विशेषताओं के व्यक्तिगत मूल्यों की स्थिरता और औसत की विशिष्टता का न्याय कर सकता है। उनके आधार पर, संकेतों के बीच संबंध की निकटता के संकेतक विकसित किए जाते हैं, चयनात्मक अवलोकन की सटीकता का आकलन करने के लिए संकेतक विकसित किए जाते हैं।
स्थान में भिन्नता है और समय में भिन्नता है।
अंतरिक्ष में भिन्नता को अलग-अलग क्षेत्रों का प्रतिनिधित्व करने वाली जनसंख्या की इकाइयों में एक विशेषता के मूल्यों के उतार-चढ़ाव के रूप में समझा जाता है। समय में परिवर्तन के तहत विभिन्न अवधियों में विशेषता के मूल्यों में परिवर्तन का मतलब है।
वितरण श्रृंखला में भिन्नता का अध्ययन करने के लिए, विशेषता मानों के सभी प्रकारों को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। इस प्रक्रिया को श्रृंखला रैंकिंग कहा जाता है।
भिन्नता के सबसे सरल संकेत हैं न्यूनतम और अधिकतम- समुच्चय में विशेषता का सबसे छोटा और सबसे बड़ा मूल्य। फीचर वैल्यू के अलग-अलग वेरिएंट की पुनरावृत्ति की संख्या को पुनरावृत्ति की आवृत्ति (फाई) कहा जाता है। आवृत्तियों के साथ आवृत्तियों को प्रतिस्थापित करना सुविधाजनक है - वाई। आवृत्ति - आवृत्ति का एक सापेक्ष संकेतक, जिसे एक इकाई या प्रतिशत के अंशों में व्यक्त किया जा सकता है और आपको भिन्नता श्रृंखला की तुलना विभिन्न टिप्पणियों के साथ करने की अनुमति देता है। सूत्र द्वारा व्यक्त किया गया:
जहाँ Xmax, Xmin - समुच्चय में विशेषता का अधिकतम और न्यूनतम मान; n समूहों की संख्या है।
एक विशेषता की भिन्नता को मापने के लिए, विभिन्न निरपेक्ष और सापेक्ष संकेतकों का उपयोग किया जाता है। भिन्नता के निरपेक्ष संकेतकों में भिन्नता की सीमा, औसत रैखिक विचलन, विचरण, मानक विचलन शामिल हैं। उतार-चढ़ाव के सापेक्ष संकेतकों में दोलन का गुणांक, सापेक्ष रैखिक विचलन, भिन्नता का गुणांक शामिल है।
विविधता श्रृंखला खोजने का एक उदाहरण
व्यायाम।इस नमूने के लिए:
- ए) एक भिन्नता श्रृंखला खोजें;
- बी) वितरण समारोह का निर्माण;
संख्या = 42। नमूना आइटम:
1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2
समाधान।
- ए) एक क्रमबद्ध विविधता श्रृंखला का निर्माण:
- 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
- बी) एक असतत परिवर्तनशील श्रृंखला का निर्माण।
आइए स्टर्गेस सूत्र का उपयोग करके विविधता श्रृंखला में समूहों की संख्या की गणना करें:
आइए 7 के बराबर समूहों की संख्या लें।
समूहों की संख्या जानने के बाद, हम अंतराल के मूल्य की गणना करते हैं:
तालिका बनाने की सुविधा के लिए हम 8 के बराबर समूहों की संख्या लेंगे, अंतराल 1 होगा।
चावल। एक एक निश्चित अवधि के लिए स्टोर द्वारा माल की बिक्री की मात्रा