विविधता श्रृंखला के प्रकार। परिवर्तनशील श्रृंखला का विश्लेषण

सांख्यिकीय श्रृंखलावितरण- यह एक निश्चित भिन्न विशेषता के अनुसार समूहों में जनसंख्या इकाइयों का एक क्रमबद्ध वितरण है।
एक वितरण श्रृंखला के गठन में अंतर्निहित विशेषता के आधार पर, वहाँ हैं विशेषता और भिन्नता वितरण श्रृंखला.

एक सामान्य विशेषता की उपस्थिति एक सांख्यिकीय आबादी के गठन का आधार है, जो एक विवरण या माप का परिणाम है आम सुविधाएंअनुसंधान वस्तुओं।

आंकड़ों में अध्ययन का विषय बदल रहा है (अलग-अलग) विशेषताएं या सांख्यिकीय विशेषताएं।

सांख्यिकीय विशेषताओं के प्रकार.

वितरण श्रृंखला को विशेषता श्रृंखला कहा जाता है।गुणवत्ता के आधार पर बनाया गया है। ठहराव- यह एक संकेत है जिसका एक नाम है (उदाहरण के लिए, एक पेशा: एक सीमस्ट्रेस, शिक्षक, आदि)।
वितरण श्रृंखला को तालिकाओं के रूप में व्यवस्थित करने की प्रथा है। तालिका में। 2.8 वितरण की एक विशेषता श्रृंखला दिखाता है।
तालिका 2.8 - रूसी संघ के किसी एक क्षेत्र के नागरिकों को वकीलों द्वारा प्रदान की जाने वाली कानूनी सहायता के प्रकारों का वितरण।

विविधता श्रृंखलाविशेषता मान (या मानों की श्रेणी) और उनकी आवृत्तियाँ हैं।
विविधता श्रृंखला वितरण श्रृंखला हैंमात्रात्मक आधार पर बनाया गया है। किसी भी परिवर्तनशील श्रृंखला में दो तत्व होते हैं: रूपांतर और आवृत्तियाँ।
वैरिएंट एक विशेषता के व्यक्तिगत मूल्य हैं जो इसे एक भिन्नता श्रृंखला में लेते हैं।
फ़्रीक्वेंसी अलग-अलग वेरिएंट या प्रत्येक समूह की संख्या होती है विविधता श्रृंखला, अर्थात। ये संख्याएँ दर्शाती हैं कि वितरण श्रृंखला में कुछ निश्चित विकल्प कितनी बार आते हैं। सभी आवृत्तियों का योग संपूर्ण जनसंख्या का आकार, उसका आयतन निर्धारित करता है।
फ़्रीक्वेंसी को फ़्रीक्वेंसी कहा जाता है, जिसे एक इकाई के अंशों में या कुल के प्रतिशत के रूप में व्यक्त किया जाता है। तदनुसार, आवृत्तियों का योग 1 या 100% के बराबर है। परिवर्तनशील श्रृंखला हमें वास्तविक डेटा के आधार पर वितरण कानून के रूप का मूल्यांकन करने की अनुमति देती है।

विशेषता की भिन्नता की प्रकृति के आधार पर, वहाँ हैं असतत और अंतराल भिन्नता श्रृंखला.
असतत परिवर्तनशील श्रृंखला का एक उदाहरण तालिका में दिया गया है। 2.9.
तालिका 2.9 - रूसी संघ में 1989 में व्यक्तिगत अपार्टमेंट में रहने वाले कमरों की संख्या से परिवारों का वितरण।

तालिका का पहला स्तंभ एक असतत परिवर्तनशील श्रृंखला के रूप प्रस्तुत करता है, दूसरे स्तंभ में परिवर्तनशील श्रृंखला की आवृत्तियाँ होती हैं, और तीसरे स्तंभ में आवृत्ति संकेतक होते हैं।

विविधता श्रृंखला

पर आबादीकुछ मात्रात्मक विशेषता की जांच की जा रही है। आयतन का एक नमूना उसमें से यादृच्छिक रूप से निकाला जाता है एन, अर्थात् नमूने में तत्वों की संख्या है एन. पहले चरण में सांख्यिकीय प्रसंस्करणउत्पाद लेकरनमूने, यानी नंबर ऑर्डरिंग एक्स 1 , एक्स 2 ,…, एक्स एनआरोही। प्रत्येक मनाया मूल्य एक्स मैंबुलाया विकल्प. आवृत्ति मैं मैंमूल्य के अवलोकनों की संख्या है एक्स मैंनमूने में। सापेक्ष आवृत्ति (आवृत्ति) मैंआवृत्ति अनुपात है मैं मैंनमूना आकार के लिए एन: .
एक परिवर्तनशील श्रृंखला का अध्ययन करते समय, संचयी आवृत्ति और संचयी आवृत्ति की अवधारणाओं का भी उपयोग किया जाता है। होने देना एक्सकुछ संख्या। फिर विकल्पों की संख्या , जिनका मान कम है एक्स, संचित आवृत्ति कहलाती है: x i . के लिए एनसंचित आवृत्ति w i मैक्स कहा जाता है।
एक विशेषता को असतत रूप से चर कहा जाता है यदि उसके व्यक्तिगत मान (वेरिएंट) एक दूसरे से कुछ परिमित राशि (आमतौर पर एक पूर्णांक) से भिन्न होते हैं। ऐसी विशेषता की एक परिवर्तनशील श्रृंखला को असतत परिवर्तनशील श्रृंखला कहा जाता है।

तालिका 1. आवृत्तियों की असतत परिवर्तनशील श्रृंखला का सामान्य दृश्य

फ़ीचर मानएक्स मैं एक्स 1 x2 एक्स एन
आवृत्तियोंमैं मैं एम 1 एम2 मैं नहीं

एक विशेषता को लगातार अलग-अलग कहा जाता है यदि उसके मान एक दूसरे से मनमाने ढंग से छोटी राशि से भिन्न होते हैं, अर्थात। संकेत एक निश्चित अंतराल में कोई भी मान ले सकता है। ऐसे लक्षण के लिए एक सतत भिन्नता श्रृंखला को अंतराल श्रृंखला कहा जाता है।

तालिका 2. आवृत्तियों की अंतराल भिन्नता श्रृंखला का सामान्य दृश्य

तालिका 3. भिन्नता श्रृंखला की ग्राफिक छवियां

पंक्तिबहुभुज या हिस्टोग्रामअनुभवजन्य वितरण समारोह
अलग
मध्यान्तर
टिप्पणियों के परिणामों को देखते हुए, यह निर्धारित किया जाता है कि प्रत्येक विशिष्ट अंतराल में वेरिएंट के कितने मूल्य गिरे। यह माना जाता है कि प्रत्येक अंतराल इसके किसी एक छोर से संबंधित है: या तो सभी मामलों में बाएं (अधिक बार), या सभी मामलों में दाएं, और आवृत्तियों या आवृत्तियों में संकेतित सीमाओं में निहित विकल्पों की संख्या दिखाई देती है। मतभेद एक मैं - एक मैं +1आंशिक अंतराल कहलाते हैं। बाद की गणनाओं को सरल बनाने के लिए, अंतराल भिन्नता श्रृंखला को सशर्त असतत द्वारा प्रतिस्थापित किया जा सकता है। इस मामले में, माध्य मान मैं-वें अंतराल को एक विकल्प के रूप में लिया जाता है एक्स मैं, और इसी अंतराल आवृत्ति मैं मैं- इस अंतराल की आवृत्ति के लिए।
विविधता श्रृंखला के ग्राफिक प्रतिनिधित्व के लिए, बहुभुज, हिस्टोग्राम, संचयी वक्र और अनुभवजन्य वितरण फ़ंक्शन का अक्सर उपयोग किया जाता है।

तालिका में। 2.3 (अप्रैल 1994 में औसत प्रति व्यक्ति आय के आकार के अनुसार रूस की जनसंख्या का समूहन) प्रस्तुत किया गया है अंतराल भिन्नता श्रृंखला.
चित्रमय प्रतिनिधित्व का उपयोग करके वितरण श्रृंखला का विश्लेषण करना सुविधाजनक है, जिससे वितरण के आकार का न्याय करना भी संभव हो जाता है। परिवर्तनशील श्रृंखला की आवृत्तियों में परिवर्तन की प्रकृति का एक दृश्य प्रतिनिधित्व द्वारा दिया गया है बहुभुज और हिस्टोग्राम.
असतत परिवर्तनशील श्रृंखला प्रदर्शित करते समय बहुभुज का उपयोग किया जाता है.
आइए, उदाहरण के लिए, अपार्टमेंट के प्रकार द्वारा आवास स्टॉक के वितरण को ग्राफिक रूप से चित्रित करें (सारणी 2.10)।
तालिका 2.10 - अपार्टमेंट के प्रकार (सशर्त आंकड़े) द्वारा शहरी क्षेत्र के आवास स्टॉक का वितरण।


चावल। आवास वितरण बहुभुज


y-अक्ष पर, न केवल आवृत्तियों के मान, बल्कि भिन्नता श्रृंखला की आवृत्तियों को भी प्लॉट किया जा सकता है।
अंतराल भिन्नता श्रृंखला प्रदर्शित करने के लिए हिस्टोग्राम लिया जाता है. हिस्टोग्राम का निर्माण करते समय, अंतराल के मूल्यों को एब्सिस्सा अक्ष पर प्लॉट किया जाता है, और आवृत्तियों को संबंधित अंतराल पर निर्मित आयतों द्वारा दर्शाया जाता है। समान अंतराल की स्थिति में स्तंभों की ऊंचाई बारंबारताओं के समानुपाती होनी चाहिए। एक हिस्टोग्राम एक ग्राफ है जिसमें एक श्रृंखला को एक दूसरे से सटे बार के रूप में दिखाया जाता है।
आइए तालिका में दी गई अंतराल वितरण श्रृंखला को आलेखीय रूप से चित्रित करें। 2.11.
तालिका 2.11 - प्रति व्यक्ति रहने की जगह के आकार से परिवारों का वितरण (सशर्त आंकड़े)।
एन पी / पी प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों के समूह रहने की जगह के दिए गए आकार वाले परिवारों की संख्या परिवारों की संचित संख्या
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
कुल 115 ----


चावल। 2.2. प्रति व्यक्ति रहने की जगह के आकार से परिवारों के वितरण का हिस्टोग्राम


संचित श्रृंखला (तालिका 2.11) के डेटा का उपयोग करके, हम निर्माण करते हैं वितरण संचयी।


चावल। 2.3. प्रति व्यक्ति रहने की जगह के आकार से परिवारों का संचयी वितरण


एक संचयी के रूप में एक परिवर्तनशील श्रृंखला का प्रतिनिधित्व विशेष रूप से परिवर्तनशील श्रृंखला के लिए प्रभावी होता है, जिसकी आवृत्तियों को श्रृंखला की आवृत्तियों के योग के अंश या प्रतिशत के रूप में व्यक्त किया जाता है।
यदि हम परिवर्तनशील श्रृंखला के ग्राफिक निरूपण में कुल्हाड़ियों को एक संचयी के रूप में बदलते हैं, तो हम प्राप्त करते हैं ओगिवु. अंजीर पर। 2.4 तालिका में आँकड़ों के आधार पर निर्मित तोरण को दर्शाता है। 2.11.
आयतों की भुजाओं के मध्य बिंदुओं को ढूंढकर और फिर इन बिंदुओं को सीधी रेखाओं से जोड़कर एक हिस्टोग्राम को वितरण बहुभुज में परिवर्तित किया जा सकता है। परिणामी वितरण बहुभुज अंजीर में दिखाया गया है। 2.2 बिंदीदार रेखा।
असमान अंतराल के साथ एक परिवर्तनशील श्रृंखला के वितरण के हिस्टोग्राम का निर्माण करते समय, समन्वय अक्ष के साथ, आवृत्तियों को लागू नहीं किया जाता है, लेकिन इसी अंतराल में सुविधा का वितरण घनत्व लागू होता है।
वितरण घनत्व प्रति इकाई अंतराल चौड़ाई की गणना की गई आवृत्ति है, अर्थात। प्रत्येक समूह में कितनी इकाइयाँ प्रति इकाई अंतराल मान हैं। वितरण घनत्व की गणना का एक उदाहरण तालिका में प्रस्तुत किया गया है। 2.12.
तालिका 2.12 - कर्मचारियों की संख्या से उद्यमों का वितरण (आंकड़े सशर्त हैं)
एन पी / पी कर्मचारियों की संख्या से उद्यमों के समूह, प्रति। उद्यमों की संख्या अंतराल आकार, प्रति। वितरण घनत्व
लेकिन 1 2 3=1/2
1 20 तक 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
कुल 147 ---- ----

भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए भी इस्तेमाल किया जा सकता है संचयी वक्र. संचयी (राशि का वक्र) की सहायता से संचित आवृत्तियों की एक श्रृंखला प्रदर्शित होती है। संचित आवृत्तियों को समूहों द्वारा आवृत्तियों को क्रमिक रूप से जोड़कर निर्धारित किया जाता है और यह दर्शाता है कि जनसंख्या की कितनी इकाइयों में विशेषता मान माने गए मान से अधिक नहीं हैं।


चावल। 2.4. प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों का ओगिवा वितरण

अंतराल भिन्नता श्रृंखला के संचयी का निर्माण करते समय, श्रृंखला के रूपों को एब्सिस्सा अक्ष के साथ और संचित आवृत्तियों को कोटि अक्ष के साथ प्लॉट किया जाता है।

भिन्नता निर्धारित करती हैएक ही अवधि (समय में बिंदु) में दी गई जनसंख्या की विभिन्न इकाइयों में किसी विशेषता के मूल्यों में अंतर। भिन्नता का कारण जनसंख्या की विभिन्न इकाइयों के अस्तित्व के लिए अलग-अलग परिस्थितियाँ हैं। उदाहरण के लिए, जीवन की प्रक्रिया में जुड़वाँ भी ऊंचाई, वजन, साथ ही शिक्षा के स्तर, आय, बच्चों की संख्या आदि जैसे संकेतों में अंतर प्राप्त करते हैं।

भिन्नता इस तथ्य के परिणामस्वरूप उत्पन्न होती है कि विशेषता के मूल्य स्वयं विभिन्न परिस्थितियों के कुल प्रभाव के तहत बनते हैं जो प्रत्येक व्यक्तिगत मामले में अलग-अलग तरीकों से संयुक्त होते हैं। इस प्रकार, किसी भी विकल्प का मूल्य वस्तुनिष्ठ होता है।

विविधता विशेषता हैप्रकृति और समाज की सभी घटनाओं के लिए, बिना किसी अपवाद के, व्यक्तिगत सामाजिक विशेषताओं के विधायी रूप से निर्धारित मानक मूल्यों को छोड़कर। आंकड़ों में भिन्नता के अध्ययन का बहुत महत्व है, वे अध्ययन के तहत घटना के सार को समझने में मदद करते हैं। भिन्नता का पता लगाना, उसके कारणों को स्पष्ट करना, व्यक्तिगत कारकों के प्रभाव की पहचान करना, साक्ष्य-आधारित प्रबंधन निर्णयों के कार्यान्वयन के लिए महत्वपूर्ण जानकारी प्रदान करता है।

औसत मूल्य जनसंख्या की विशेषता की एक सामान्यीकृत विशेषता देता है, लेकिन यह इसकी संरचना को प्रकट नहीं करता है। औसत मूल्य यह नहीं दिखाता है कि औसत विशेषता के प्रकार इसके आसपास कैसे स्थित हैं, चाहे वे औसत के पास वितरित हों या इससे विचलित हों। दो सेटों में औसत समान हो सकता है, लेकिन एक संस्करण में सभी व्यक्तिगत मूल्य इससे थोड़े भिन्न होते हैं, और दूसरे में, ये अंतर बड़े होते हैं, अर्थात। पहले मामले में, विशेषता की भिन्नता छोटी है, और दूसरे मामले में, यह बड़ी है; औसत मूल्य के महत्व को दर्शाने के लिए यह बहुत महत्वपूर्ण है।

संगठन के प्रमुख, प्रबंधक, शोधकर्ता के लिए भिन्नता का अध्ययन करने और इसे प्रबंधित करने में सक्षम होने के लिए, सांख्यिकी ने भिन्नता (संकेतकों की एक प्रणाली) के अध्ययन के लिए विशेष तरीके विकसित किए हैं। उनकी सहायता से भिन्नता पाई जाती है, उसके गुणों का पता चलता है। भिन्नता के संकेतक हैं : भिन्नता की सीमा, माध्य रैखिक विचलन, भिन्नता का गुणांक।

विविधता श्रृंखला और इसके रूप

विविधता श्रृंखला- यह विशेषता के मूल्यों में वृद्धि (कम अक्सर घटती) और विशेषता के एक या दूसरे मूल्य के साथ इकाइयों की संख्या की गणना करके जनसंख्या की इकाइयों का एक क्रमबद्ध वितरण है। जब जनसंख्या इकाइयों की संख्या अधिक होती है, तो क्रमित श्रृंखला बोझिल हो जाती है, इसके निर्माण में लंबा समय लगता है। ऐसी स्थिति में, अध्ययनाधीन विशेषता के मूल्यों के अनुसार जनसंख्या इकाइयों को समूहीकृत करके एक परिवर्तनशील श्रृंखला का निर्माण किया जाता है।

निम्नलिखित हैं विविधता श्रृंखला रूप :

  1. रैंक की गई पंक्तिअध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है।
  2. असतत भिन्नता श्रृंखला - यह एक तालिका है जिसमें दो पंक्तियाँ या एक ग्राफ़ होता है: चर विशेषता x के विशिष्ट मान और दिए गए मान f के साथ जनसंख्या में इकाइयों की संख्या - आवृत्तियों की विशेषता। यह तब बनाया जाता है जब विशेषता सबसे बड़ी संख्या में मान लेती है।
  3. अंतराल श्रृंखला.

भिन्नता की सीमा निर्धारित की जाती हैविशेषता के अधिकतम और न्यूनतम मूल्यों (विकल्प) के बीच अंतर के निरपेक्ष मूल्य के रूप में:

विविधता का दायरा दिखाता है विशेषता का केवल चरम विचलन और श्रृंखला में सभी प्रकार के व्यक्तिगत विचलन को प्रतिबिंबित नहीं करता है। यह एक चर विशेषता के परिवर्तन की सीमा की विशेषता है और दो चरम विकल्पों के उतार-चढ़ाव पर निर्भर है और भिन्नता श्रृंखला में आवृत्तियों से बिल्कुल संबंधित नहीं है, अर्थात वितरण की प्रकृति के लिए, जो इस मान को एक यादृच्छिक देता है चरित्र। भिन्नता का विश्लेषण करने के लिए, आपको एक संकेतक की आवश्यकता होती है जो एक भिन्नता विशेषता के सभी उतार-चढ़ाव को दर्शाता है और एक सामान्य विशेषता देता है। इस प्रकार का सबसे सरल संकेतक औसत रैखिक विचलन है।

विविधता श्रृंखला - यह किसी भी मात्रात्मक विशेषता के मूल्य के अनुसार अध्ययन के तहत घटना के वितरण को दर्शाने वाली एक सांख्यिकीय श्रृंखला है। उदाहरण के लिए, आयु के अनुसार रोगी, उपचार की अवधि, वजन के अनुसार नवजात शिशु आदि।

विकल्प - विशेषता के व्यक्तिगत मूल्य जिसके द्वारा समूहीकरण किया जाता है (निरूपित वी ) .

आवृत्ति- एक संख्या यह दर्शाती है कि एक या कोई अन्य प्रकार कितनी बार होता है (निरूपित पी ) . सभी आवृत्तियों का योग दिखाता है कुल गणना अवलोकन और निरूपित है एन . विविधता श्रृंखला के सबसे बड़े और सबसे छोटे संस्करण के बीच के अंतर को कहा जाता है दायरा या आयाम .

विविधता श्रृंखला हैं:

1. असंतत (असतत) और निरंतर।

श्रृंखला को निरंतर माना जाता है यदि समूहीकरण विशेषता को भिन्नात्मक मानों (वजन, ऊंचाई, आदि) में व्यक्त किया जा सकता है, तो असंतत यदि समूहीकरण विशेषता को केवल एक पूर्णांक (विकलांगता के दिन, दिल की धड़कन की संख्या, आदि) के रूप में व्यक्त किया जाता है।

2. सरल और भारित।

एक साधारण परिवर्तनशील श्रृंखला एक श्रृंखला है जिसमें एक चर विशेषता का मात्रात्मक मान एक बार होता है। एक भारित विविधता श्रृंखला में, एक अलग विशेषता के मात्रात्मक मूल्यों को एक निश्चित आवृत्ति के साथ दोहराया जाता है।

3. समूहीकृत (अंतराल) और अवर्गीकृत।

एक समूहीकृत श्रृंखला में समूहों में संयुक्त विकल्प होते हैं जो उन्हें एक निश्चित अंतराल के भीतर आकार में एकजुट करते हैं। एक अवर्गीकृत श्रृंखला में, प्रत्येक अलग-अलग प्रकार एक निश्चित आवृत्ति से मेल खाता है।

4. सम और विषम।

सम परिवर्ती श्रेणी में, बारंबारताओं का योग या प्रेक्षणों की कुल संख्या को सम संख्या के रूप में, विषम परिवर्ती श्रेणी में विषम संख्या के रूप में व्यक्त किया जाता है।

5. सममित और विषम।

एक सममित भिन्नता श्रृंखला में, सभी प्रकार के औसत मेल खाते हैं या बहुत करीब हैं (मोड, माध्यिका, अंकगणितीय माध्य)।

अध्ययन की जा रही घटना की प्रकृति के आधार पर, सांख्यिकीय अध्ययन के विशिष्ट कार्यों और उद्देश्यों के साथ-साथ स्रोत सामग्री की सामग्री पर, स्वच्छता सांख्यिकी में निम्न प्रकार के औसत का उपयोग किया जाता है:

संरचनात्मक औसत (मोड, माध्यिका);

अंकगणित औसत;

औसत हार्मोनिक;

जियोमेट्रिक माध्य;

मध्यम प्रगतिशील।

फैशन (एम के बारे में ) - चर विशेषता का मान, जो अध्ययन की गई जनसंख्या में अधिक सामान्य है, अर्थात। उच्चतम आवृत्ति के अनुरूप विकल्प। यह किसी भी गणना का सहारा लिए बिना, भिन्नता श्रृंखला की संरचना द्वारा सीधे पाया जाता है। यह आमतौर पर अंकगणितीय माध्य के बहुत करीब का मान होता है और व्यवहार में बहुत सुविधाजनक होता है।

माध्यिका (एम ) - भिन्नता श्रृंखला (रैंकिंग, यानी विकल्प के मूल्यों को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है) को दो बराबर हिस्सों में विभाजित करना। माध्यिका की गणना तथाकथित विषम श्रृंखला का उपयोग करके की जाती है, जिसे क्रमिक रूप से आवृत्तियों को जोड़कर प्राप्त किया जाता है। यदि आवृत्तियों का योग एक सम संख्या से मेल खाता है, तो माध्य को पारंपरिक रूप से दो औसत मानों के अंकगणितीय माध्य के रूप में लिया जाता है।

बहुलक और माध्यिका खुली जनसंख्या के मामले में लागू होते हैं, अर्थात्। जब सबसे बड़े या सबसे छोटे विकल्पों में सटीक मात्रात्मक विशेषता नहीं होती है (उदाहरण के लिए, 15 वर्ष से कम, 50 वर्ष और अधिक आयु, आदि)। इस मामले में, अंकगणितीय माध्य (पैरामीट्रिक विशेषताओं) की गणना नहीं की जा सकती है।

औसत मैं अंकगणित - सबसे आम मूल्य। अंकगणित माध्य को आमतौर पर द्वारा दर्शाया जाता है एम.

सरल अंकगणितीय माध्य और भारित माध्य में अंतर स्पष्ट कीजिए।

सरल अंकगणित माध्य परिकलित:

- उन मामलों में जब प्रत्येक इकाई के लिए एक विशेषता के ज्ञान की एक साधारण सूची द्वारा समग्रता का प्रतिनिधित्व किया जाता है;

— यदि प्रत्येक प्रकार के दोहराव की संख्या निर्धारित नहीं की जा सकती है;

— यदि प्रत्येक प्रकार के दोहराव की संख्या एक दूसरे के करीब है।

सरल अंकगणितीय माध्य की गणना सूत्र द्वारा की जाती है:

जहां वी - विशेषता के व्यक्तिगत मूल्य; n व्यक्तिगत मूल्यों की संख्या है;
- योग का संकेत।

इस प्रकार, साधारण औसत वैरिएंट के योग का प्रेक्षणों की संख्या का अनुपात है।

उदाहरण: निमोनिया के 10 रोगियों के लिए बिस्तर पर रहने की औसत अवधि निर्धारित करें:

16 दिन - 1 रोगी; 17-1; 18-1; 19-1; 20-1; 21-1; 22-1; 23-1; 26-1; 31-1.

बिस्तर-दिन।

अंकगणित भारित औसत उन मामलों में गणना की जाती है जहां विशेषता के व्यक्तिगत मूल्यों को दोहराया जाता है। इसकी गणना दो तरह से की जा सकती है:

1. सीधे (अंकगणित माध्य या प्रत्यक्ष विधि) सूत्र के अनुसार:

,

जहाँ P प्रत्येक विकल्प के प्रेक्षणों की बारंबारता (मामलों की संख्या) है।

इस प्रकार, भारित अंकगणितीय माध्य प्रेक्षणों की संख्या की आवृत्ति से भिन्न के उत्पादों के योग का अनुपात है।

2. सशर्त औसत से विचलन की गणना करके (क्षणों की विधि के अनुसार)।

भारित समांतर माध्य की गणना का आधार है:

- मात्रात्मक विशेषता के प्रकार के अनुसार समूहीकृत सामग्री;

— सभी विकल्पों को विशेषता मान (रैंक की गई श्रृंखला) के आरोही या अवरोही क्रम में व्यवस्थित किया जाना चाहिए।

क्षणों की विधि द्वारा गणना करने के लिए, पूर्वापेक्षा सभी अंतरालों के समान आकार की है।

क्षणों की विधि के अनुसार, अंकगणितीय माध्य की गणना सूत्र द्वारा की जाती है:

,

जहां एम ओ सशर्त औसत है, जिसे अक्सर उच्चतम आवृत्ति के अनुरूप सुविधा के मूल्य के रूप में लिया जाता है, यानी। जिसे अधिक बार दोहराया जाता है (मोड)।

मैं - अंतराल मूल्य।

ए - औसत की शर्तों से सशर्त विचलन, जो एक बड़े सशर्त औसत विकल्प के लिए + चिह्न के साथ संख्याओं (1, 2, आदि) की अनुक्रमिक श्रृंखला है और - (-1, -2, आदि) के साथ। एक विकल्प के लिए साइन इन करें, जो औसत से नीचे हैं। सशर्त औसत के रूप में लिए गए प्रकार से सशर्त विचलन 0 है।

पी - आवृत्तियों।

- प्रेक्षणों की कुल संख्या या n.

उदाहरण: सीधे 8 वर्षीय लड़कों की औसत ऊंचाई निर्धारित करें (तालिका 1)।

तालिका एक

सेमी . में ऊँचाई

लड़कों पी

केंद्रीय

विकल्प वी

केंद्रीय संस्करण, अंतराल के बीच में, दो आसन्न समूहों के प्रारंभिक मूल्यों के अर्ध-योग के रूप में परिभाषित किया गया है:

;
आदि।

वीपी उत्पाद केंद्रीय वेरिएंट को आवृत्तियों से गुणा करके प्राप्त किया जाता है
;
आदि। फिर परिणामी उत्पादों को जोड़ा जाता है और प्राप्त किया जाता है
, जिसे अवलोकनों की संख्या (100) से विभाजित किया जाता है और भारित अंकगणितीय माध्य प्राप्त होता है।

सेमी।

हम क्षणों की विधि का उपयोग करके उसी समस्या को हल करेंगे, जिसके लिए निम्न तालिका 2 संकलित की गई है:

तालिका 2

सेमी (वी) में ऊंचाई

लड़कों पी

एन = 100

हम 122 को M o के रूप में लेते हैं, क्योंकि 100 अवलोकनों में से 33 लोगों की ऊंचाई 122 सेमी थी। हम उपरोक्त के अनुसार सशर्त विचलन (ए) को सशर्त औसत से पाते हैं। फिर हम आवृत्तियों (एपी) द्वारा सशर्त विचलन का उत्पाद प्राप्त करते हैं और प्राप्त मूल्यों को सारांशित करते हैं (
) परिणाम 17 होगा। अंत में, हम डेटा को सूत्र में प्रतिस्थापित करते हैं:

एक चर विशेषता का अध्ययन करते समय, केवल औसत मूल्यों की गणना तक ही सीमित नहीं होना चाहिए। अध्ययन की गई विशेषताओं की विविधता की डिग्री को दर्शाने वाले संकेतकों की गणना करना भी आवश्यक है। सांख्यिकीय जनसंख्या की सभी इकाइयों के लिए एक या किसी अन्य मात्रात्मक विशेषता का मान समान नहीं होता है।

भिन्नता श्रृंखला की विशेषता मानक विचलन है ( ), जो अंकगणित माध्य के सापेक्ष अध्ययन की गई विशेषताओं के बिखराव (बिखरने) को दर्शाता है, अर्थात। विविधता श्रृंखला के उतार-चढ़ाव की विशेषता है। इसे सीधे सूत्र द्वारा निर्धारित किया जा सकता है:

मानक विचलन अंकगणितीय माध्य (V-M) 2 से प्रत्येक विकल्प के वर्ग विचलन के गुणनफल के योग के वर्गमूल के बराबर होता है, जिसे इसकी आवृत्तियों को आवृत्तियों के योग से विभाजित किया जाता है (
).

गणना उदाहरण: प्रति दिन क्लिनिक में जारी किए गए बीमार पत्तों की औसत संख्या निर्धारित करें (तालिका 3)।

टेबल तीन

बीमार दिनों की संख्या

जारी किए गए पत्रक

डॉक्टर प्रति दिन (वी)

डॉक्टरों की संख्या (पी)

;

हर में, जब प्रेक्षणों की संख्या 30 से कम हो, तो यह आवश्यक है
एक इकाई ले लो।

यदि श्रृंखला को समान अंतराल पर समूहीकृत किया जाता है, तो मानक विचलन को आघूर्णों की विधि द्वारा निर्धारित किया जा सकता है:

,

जहां i अंतराल का मान है;

- सशर्त औसत से सशर्त विचलन;

पी - इसी अंतराल के आवृत्ति संस्करण;

अवलोकनों की कुल संख्या है।

गणना उदाहरण : चिकित्सीय बिस्तर में रोगियों के रहने की औसत अवधि निर्धारित करें (क्षणों की विधि के अनुसार) (तालिका 4):

तालिका 4

दिनों की संख्या

बेड स्टे (वी)

बीमार (पी)

;

बेल्जियम के सांख्यिकीविद् ए। क्वेटलेट ने पाया कि बड़े पैमाने पर होने वाली घटनाएँ त्रुटि वितरण कानून का पालन करती हैं, जिसे के। गॉस और पी। लाप्लास द्वारा लगभग एक साथ खोजा गया था। इस वितरण का प्रतिनिधित्व करने वाले वक्र में घंटी का आकार होता है। सामान्य वितरण कानून के अनुसार, विशेषता के व्यक्तिगत मूल्यों की परिवर्तनशीलता के भीतर है
, जो जनसंख्या में सभी इकाइयों का 99.73 प्रतिशत शामिल है।

यह गणना की जाती है कि यदि आप अंकगणितीय माध्य में 2 जोड़ते और घटाते हैं , तो भिन्नता श्रृंखला के सभी सदस्यों में से 95.45% प्राप्त मूल्यों के भीतर हैं, और अंत में, यदि हम अंकगणितीय माध्य में 1 जोड़ते और घटाते हैं , तो इस परिवर्तनशील श्रृंखला के सभी सदस्यों में से 68.27% प्राप्त मूल्यों के भीतर होंगे। परिमाण के साथ चिकित्सा में
1आदर्श की अवधारणा के साथ जुड़ा हुआ है। समांतर माध्य से विचलन 1 . से अधिक है , लेकिन 2 . से कम असामान्य है और विचलन 2 . से अधिक है असामान्य (सामान्य से ऊपर या नीचे)।

सैनिटरी सांख्यिकी में, थ्री-सिग्मा नियम का उपयोग शारीरिक विकास के अध्ययन, स्वास्थ्य देखभाल संस्थानों की गतिविधियों के आकलन और सार्वजनिक स्वास्थ्य के आकलन में किया जाता है। मानक निर्धारित करते समय राष्ट्रीय अर्थव्यवस्था में समान नियम का व्यापक रूप से उपयोग किया जाता है।

इस प्रकार, मानक विचलन कार्य करता है:

- एक परिवर्तनशील श्रृंखला के फैलाव का मापन;

- विशेषताओं की विविधता की डिग्री की विशेषताएं, जो भिन्नता के गुणांक द्वारा निर्धारित की जाती हैं:

यदि भिन्नता का गुणांक 20% से अधिक है - मजबूत विविधता, 20 से 10% तक - मध्यम, 10% से कम - वर्णों की कमजोर विविधता। भिन्नता का गुणांक, एक निश्चित सीमा तक, अंकगणितीय माध्य की विश्वसनीयता के लिए एक मानदंड है।

विविधता श्रृंखलाएक विशेषता के संख्यात्मक मूल्यों की एक श्रृंखला है।

विविधता श्रृंखला की मुख्य विशेषताएं: वी - संस्करण, पी - इसकी घटना की आवृत्ति।

विविधता श्रृंखला के प्रकार:

    वेरिएंट की आवृत्ति के अनुसार: सरल - वेरिएंट एक बार होता है, भारित - वेरिएंट दो या अधिक बार होता है;

    स्थान के अनुसार विकल्प: रैंक - विकल्पों को अवरोही और आरोही क्रम में व्यवस्थित किया जाता है, बिना रैंक के - विकल्प किसी विशेष क्रम में नहीं लिखे जाते हैं;

    विकल्प को समूहों में समूहित करके: समूहीकृत - विकल्प समूहों में संयुक्त होते हैं, असमूहीकृत - विकल्प समूहीकृत नहीं होते हैं;

    मूल्य विकल्पों द्वारा: निरंतर - विकल्प एक पूर्णांक और एक भिन्नात्मक संख्या के रूप में व्यक्त किए जाते हैं, असतत - विकल्प एक पूर्णांक के रूप में व्यक्त किए जाते हैं, जटिल - विकल्प एक सापेक्ष या औसत मूल्य द्वारा दर्शाए जाते हैं।

औसत मूल्यों की गणना के लिए एक विविधता श्रृंखला संकलित और तैयार की जाती है।

विविधता श्रृंखला संकेतन प्रपत्र:

8. औसत मूल्य, प्रकार, गणना पद्धति, स्वास्थ्य देखभाल में आवेदन

औसत मान- मात्रात्मक विशेषताओं की कुल सामान्यीकरण विशेषता। औसत का अनुप्रयोग:

1. चिकित्सा संस्थानों के काम के संगठन को चिह्नित करना और उनकी गतिविधियों का मूल्यांकन करना:

ए) पॉलीक्लिनिक में: डॉक्टरों के कार्यभार के संकेतक, यात्राओं की औसत संख्या, क्षेत्र में निवासियों की औसत संख्या;

बी) एक अस्पताल में: प्रति वर्ष बिस्तर के दिनों की औसत संख्या; अस्पताल में रहने की औसत अवधि;

ग) स्वच्छता, महामारी विज्ञान और सार्वजनिक स्वास्थ्य के केंद्र में: प्रति व्यक्ति औसत क्षेत्र (या घन क्षमता), औसत पोषण मानक (प्रोटीन, वसा, कार्बोहाइड्रेट, विटामिन, खनिज लवण, कैलोरी), स्वच्छता मानदंड और मानक, आदि। ;

2. शारीरिक विकास को चिह्नित करने के लिए (रूपात्मक और कार्यात्मक की मुख्य मानवशास्त्रीय विशेषताएं);

3. नैदानिक ​​और प्रायोगिक अध्ययनों में सामान्य और रोग स्थितियों में शरीर के चिकित्सा और शारीरिक मापदंडों का निर्धारण करना।

4. विशेष वैज्ञानिक अनुसंधान में।

औसत मूल्यों और संकेतकों के बीच का अंतर:

1. गुणांक एक वैकल्पिक विशेषता की विशेषता है जो केवल सांख्यिकीय टीम के कुछ हिस्से में होती है, जो हो भी सकती है और नहीं भी।

औसत मूल्य टीम के सभी सदस्यों में निहित संकेतों को कवर करते हैं, लेकिन अलग-अलग डिग्री (वजन, ऊंचाई, अस्पताल में उपचार के दिन) तक।

2. गुणात्मक विशेषताओं को मापने के लिए गुणांक का उपयोग किया जाता है। औसत मूल्य अलग-अलग मात्रात्मक लक्षणों के लिए हैं।

औसत के प्रकार:

    समांतर माध्य, इसकी विशेषताएँ - मानक विचलन और औसत त्रुटि

    मोड और माध्यिका। फैशन (मो)- इस आबादी में सबसे अधिक बार पाए जाने वाले गुण के मूल्य से मेल खाती है। माध्यिका (मी)- विशेषता का मूल्य, जो इस आबादी में औसत मूल्य रखता है। यह प्रेक्षणों की संख्या के अनुसार श्रृंखला को 2 बराबर भागों में विभाजित करता है। अंकगणित माध्य मान (एम)- बहुलक और माध्यिका के विपरीत, यह किए गए सभी अवलोकनों पर निर्भर करता है, इसलिए यह संपूर्ण वितरण के लिए एक महत्वपूर्ण विशेषता है।

    अन्य प्रकार के औसत जो विशेष अध्ययनों में उपयोग किए जाते हैं: मूल माध्य वर्ग, घन, हार्मोनिक, ज्यामितीय, प्रगतिशील।

अंकगणित औसतसांख्यिकीय जनसंख्या के औसत स्तर की विशेषता है।

एक साधारण श्रृंखला के लिए जहाँ

v - योग विकल्प,

n प्रेक्षणों की संख्या है।

भारित श्रृंखला के लिए, जहां

vr प्रत्येक विकल्प के गुणनफल और उसके घटित होने की आवृत्ति का योग है

n प्रेक्षणों की संख्या है।

मानक विचलनअंकगणित माध्य या सिग्मा (σ) विशेषता की विविधता को दर्शाता है

- एक साधारण पंक्ति के लिए

d 2 - अंकगणित माध्य और प्रत्येक विकल्प के बीच अंतर के वर्गों का योग (d = M-V│)

n प्रेक्षणों की संख्या है

- भारित श्रृंखला के लिए

d 2 p अंकगणित माध्य और प्रत्येक विकल्प के बीच के अंतर के वर्गों के गुणनफल और इसके घटित होने की आवृत्ति का योग है,

n प्रेक्षणों की संख्या है।

विविधता की डिग्री को भिन्नता के गुणांक के मूल्य से आंका जा सकता है
. 20% से अधिक - मजबूत विविधता, 10-20% - मध्यम विविधता, 10% से कम - कमजोर विविधता।

यदि एक सिग्मा (एम ± 1σ) को अंकगणित माध्य में जोड़ा और घटाया जाता है, तो सामान्य वितरण के साथ, सभी प्रकार (अवलोकन) का कम से कम 68.3% इन सीमाओं के भीतर होगा, जिसे अध्ययन के तहत घटना के लिए आदर्श माना जाता है। . यदि k 2 ± 2σ, तो सभी प्रेक्षणों का 95.5% इन सीमाओं के भीतर होगा, और यदि k M ± 3σ, तो सभी प्रेक्षणों का 99.7% इन सीमाओं के भीतर होगा। इस प्रकार, मानक विचलन मानक विचलन है, जो अध्ययन के तहत विशेषता के ऐसे मूल्य की घटना की संभावना की भविष्यवाणी करना संभव बनाता है, जो निर्दिष्ट सीमा के भीतर है।

अंकगणित माध्य की औसत त्रुटिया प्रतिनिधित्व त्रुटि। सरल, भारित श्रृंखला के लिए और क्षणों के नियम के अनुसार:

.

औसत मूल्यों की गणना करने के लिए, यह आवश्यक है: सामग्री की एकरूपता, पर्याप्त संख्या में अवलोकन। यदि प्रेक्षणों की संख्या 30 से कम है, तो और m की गणना के लिए सूत्रों में n-1 का उपयोग किया जाता है।

औसत त्रुटि के आकार से प्राप्त परिणाम का मूल्यांकन करते समय, एक आत्मविश्वास गुणांक का उपयोग किया जाता है, जो एक सही उत्तर की संभावना को निर्धारित करना संभव बनाता है, अर्थात यह इंगित करता है कि परिणामी नमूना त्रुटि वास्तविक त्रुटि से अधिक नहीं होगी निरंतर अवलोकन के परिणामस्वरूप किया गया। नतीजतन, आत्मविश्वास की संभावना में वृद्धि के साथ, विश्वास अंतराल की चौड़ाई बढ़ जाती है, जो बदले में, निर्णय के विश्वास को बढ़ाता है, प्राप्त परिणाम का समर्थन करता है।

परिवर्तन संबंधीमात्रात्मक आधार पर निर्मित वितरण श्रृंखला कहलाती है। जनसंख्या की व्यक्तिगत इकाइयों में मात्रात्मक विशेषताओं के मूल्य स्थिर नहीं होते हैं, कमोबेश एक दूसरे से भिन्न होते हैं।

उतार-चढ़ाव- उतार-चढ़ाव, जनसंख्या की इकाइयों में विशेषता के मूल्य की परिवर्तनशीलता। अध्ययन की गई जनसंख्या में होने वाले लक्षण के पृथक संख्यात्मक मान कहलाते हैं विकल्पमूल्य। जनसंख्या के पूर्ण लक्षण वर्णन के लिए औसत मूल्य की अपर्याप्तता औसत मूल्यों को संकेतकों के साथ पूरक करना आवश्यक बनाती है जो अध्ययन के तहत विशेषता के उतार-चढ़ाव (भिन्नता) को मापकर इन औसतों की विशिष्टता का आकलन करना संभव बनाता है।

भिन्नता की उपस्थिति विशेषता स्तर के गठन पर बड़ी संख्या में कारकों के प्रभाव के कारण होती है। ये कारक असमान बल के साथ और विभिन्न दिशाओं में कार्य करते हैं। विशेषता परिवर्तनशीलता के माप का वर्णन करने के लिए विविधता संकेतकों का उपयोग किया जाता है।

भिन्नता के सांख्यिकीय अध्ययन के कार्य:

  • 1) जनसंख्या की अलग-अलग इकाइयों में संकेतों की भिन्नता की प्रकृति और डिग्री का अध्ययन;
  • 2) जनसंख्या की कुछ विशेषताओं की भिन्नता में व्यक्तिगत कारकों या उनके समूहों की भूमिका का निर्धारण।

आंकड़ों में, संकेतकों की एक प्रणाली के उपयोग के आधार पर भिन्नता का अध्ययन करने के लिए विशेष विधियों का उपयोग किया जाता है, साथजिसके द्वारा भिन्नता को मापा जाता है।

भिन्नता का अध्ययन आवश्यक है। नमूना अवलोकन, सहसंबंध और विचरण विश्लेषण आदि करते समय विविधताओं का मापन आवश्यक है। एर्मोलेव ओ.यू. मनोवैज्ञानिकों के लिए गणितीय आँकड़े: पाठ्यपुस्तक [पाठ] / O.Yu. एर्मोलेव। - एम .: मॉस्को साइकोलॉजिकल एंड सोशल इंस्टीट्यूट, 2012 का फ्लिंट पब्लिशिंग हाउस। - 335p।

भिन्नता की डिग्री के अनुसार, कोई जनसंख्या की एकरूपता, विशेषताओं के व्यक्तिगत मूल्यों की स्थिरता और औसत की विशिष्टता का न्याय कर सकता है। उनके आधार पर, संकेतों के बीच संबंध की निकटता के संकेतक विकसित किए जाते हैं, चयनात्मक अवलोकन की सटीकता का आकलन करने के लिए संकेतक विकसित किए जाते हैं।

स्थान में भिन्नता है और समय में भिन्नता है।

अंतरिक्ष में भिन्नता को अलग-अलग क्षेत्रों का प्रतिनिधित्व करने वाली जनसंख्या की इकाइयों में एक विशेषता के मूल्यों के उतार-चढ़ाव के रूप में समझा जाता है। समय में परिवर्तन के तहत विभिन्न अवधियों में विशेषता के मूल्यों में परिवर्तन का मतलब है।

वितरण श्रृंखला में भिन्नता का अध्ययन करने के लिए, विशेषता मानों के सभी प्रकारों को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। इस प्रक्रिया को श्रृंखला रैंकिंग कहा जाता है।

भिन्नता के सबसे सरल संकेत हैं न्यूनतम और अधिकतम- समुच्चय में विशेषता का सबसे छोटा और सबसे बड़ा मूल्य। फीचर वैल्यू के अलग-अलग वेरिएंट की पुनरावृत्ति की संख्या को पुनरावृत्ति की आवृत्ति (फाई) कहा जाता है। आवृत्तियों के साथ आवृत्तियों को प्रतिस्थापित करना सुविधाजनक है - वाई। आवृत्ति - आवृत्ति का एक सापेक्ष संकेतक, जिसे एक इकाई या प्रतिशत के अंशों में व्यक्त किया जा सकता है और आपको भिन्नता श्रृंखला की तुलना विभिन्न टिप्पणियों के साथ करने की अनुमति देता है। सूत्र द्वारा व्यक्त किया गया:

जहाँ Xmax, Xmin - समुच्चय में विशेषता का अधिकतम और न्यूनतम मान; n समूहों की संख्या है।

एक विशेषता की भिन्नता को मापने के लिए, विभिन्न निरपेक्ष और सापेक्ष संकेतकों का उपयोग किया जाता है। भिन्नता के निरपेक्ष संकेतकों में भिन्नता की सीमा, औसत रैखिक विचलन, विचरण, मानक विचलन शामिल हैं। उतार-चढ़ाव के सापेक्ष संकेतकों में दोलन का गुणांक, सापेक्ष रैखिक विचलन, भिन्नता का गुणांक शामिल है।

विविधता श्रृंखला खोजने का एक उदाहरण

व्यायाम।इस नमूने के लिए:

  • ए) एक भिन्नता श्रृंखला खोजें;
  • बी) वितरण समारोह का निर्माण;

संख्या = 42। नमूना आइटम:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

समाधान।

  • ए) एक क्रमबद्ध विविधता श्रृंखला का निर्माण:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • बी) एक असतत परिवर्तनशील श्रृंखला का निर्माण।

आइए स्टर्गेस सूत्र का उपयोग करके विविधता श्रृंखला में समूहों की संख्या की गणना करें:

आइए 7 के बराबर समूहों की संख्या लें।

समूहों की संख्या जानने के बाद, हम अंतराल के मूल्य की गणना करते हैं:

तालिका बनाने की सुविधा के लिए हम 8 के बराबर समूहों की संख्या लेंगे, अंतराल 1 होगा।

चावल। एक एक निश्चित अवधि के लिए स्टोर द्वारा माल की बिक्री की मात्रा

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...