सांख्यिकीय सारांश और समूहन। सांख्यिकीय वितरण श्रृंखला

सबसे महत्वपूर्ण हिस्सा सांख्यिकीय विश्लेषणहाइलाइट करने के लिए वितरण श्रृंखला (संरचनात्मक समूहीकरण) का निर्माण है विशेषता गुणऔर अध्ययन की गई आबादी की नियमितता। डेटा समूहीकरण के आधार के रूप में किस चिन्ह (मात्रात्मक या गुणात्मक) को आधार के रूप में लिया जाता है, इसके आधार पर वितरण श्रृंखला के प्रकारों को तदनुसार प्रतिष्ठित किया जाता है।

यदि किसी गुणात्मक गुण को समूहीकरण के आधार के रूप में लिया जाता है, तो ऐसी वितरण श्रृंखला कहलाती है ठहराव(काम के प्रकार, लिंग, पेशे, धर्म, राष्ट्रीयता, आदि द्वारा वितरण)।

यदि वितरण श्रृंखला मात्रात्मक आधार पर बनाई जाती है, तो ऐसी श्रृंखला कहलाती है परिवर्तन संबंधी. एक परिवर्तनशील श्रृंखला बनाने का अर्थ है विशेषता के मूल्यों के अनुसार जनसंख्या इकाइयों के मात्रात्मक वितरण का आदेश देना, और फिर इन मूल्यों के साथ जनसंख्या इकाइयों की संख्या की गणना करना (एक समूह तालिका बनाना)।

परिवर्तनशील श्रृंखला के तीन रूप हैं: क्रमबद्ध श्रृंखला, असतत श्रृंखला और अंतराल श्रृंखला।

रैंक की गई पंक्ति- यह अध्ययन के तहत विशेषता के आरोही या अवरोही क्रम में जनसंख्या की व्यक्तिगत इकाइयों का वितरण है। रैंकिंग मात्रात्मक डेटा को समूहों में विभाजित करना आसान बनाती है, तुरंत सबसे छोटे का पता लगाती है और सबसे बड़ा मूल्यफ़ीचर, उन मानों को हाइलाइट करें जिन्हें सबसे अधिक बार दोहराया जाता है।

विविधता श्रृंखला के अन्य रूप अध्ययन के तहत विशेषता के मूल्यों में भिन्नता की प्रकृति के अनुसार संकलित समूह सारणी हैं। भिन्नता की प्रकृति से, असतत (असंतत) और निरंतर संकेत प्रतिष्ठित हैं।

असतत श्रृंखला- यह एक ऐसी परिवर्तनशील श्रृंखला है, जिसका निर्माण एक असंतत परिवर्तन (असतत संकेत) वाले संकेतों पर आधारित है। उत्तरार्द्ध में टैरिफ श्रेणी, परिवार में बच्चों की संख्या, उद्यम में कर्मचारियों की संख्या आदि शामिल हैं। ये संकेत केवल कुछ निश्चित मानों की सीमित संख्या ले सकते हैं।

एक असतत विविधता श्रृंखला एक तालिका है जिसमें दो कॉलम होते हैं। पहला कॉलम विशेषता के विशिष्ट मूल्य को इंगित करता है, और दूसरा - विशेषता के विशिष्ट मूल्य के साथ जनसंख्या इकाइयों की संख्या।

यदि एक संकेत में निरंतर परिवर्तन होता है (आय की राशि, कार्य अनुभव, उद्यम की अचल संपत्तियों की लागत, आदि, जो कुछ सीमाओं के भीतर कोई भी मूल्य ले सकता है), तो इस संकेत के लिए आपको निर्माण करने की आवश्यकता है अंतराल भिन्नता श्रृंखला.

यहां समूह तालिका में भी दो स्तंभ हैं। पहला अंतराल "से - से" (विकल्प) में सुविधा के मूल्य को इंगित करता है, दूसरा - अंतराल (आवृत्ति) में शामिल इकाइयों की संख्या।

आवृत्ति (पुनरावृत्ति आवृत्ति) - विशेषता मानों के एक विशेष प्रकार के दोहराव की संख्या, निरूपित फाई, और अध्ययन की गई आबादी के आयतन के बराबर आवृत्तियों का योग, निरूपित

जहां k फीचर वैल्यू के लिए विकल्पों की संख्या है

बहुत बार, तालिका को एक स्तंभ के साथ पूरक किया जाता है जिसमें संचित आवृत्तियों एस की गणना की जाती है, जो दर्शाती है कि जनसंख्या की कितनी इकाइयों का एक विशेषता मान इस मान से अधिक नहीं है।

श्रृंखला f की आवृत्तियों को के रूप में व्यक्त की गई आवृत्तियों द्वारा प्रतिस्थापित किया जा सकता है सापेक्ष संख्या(शेयर या प्रतिशत)। वे प्रत्येक अंतराल की आवृत्तियों का अनुपात उनके कुल राशि, अर्थात।:

अंतराल मानों के साथ एक परिवर्तनशील श्रृंखला का निर्माण करते समय, सबसे पहले, अंतराल i के मान को स्थापित करना आवश्यक है, जिसे भिन्नता रेंज R के अनुपात के रूप में समूहों की संख्या m के रूप में परिभाषित किया गया है:

जहां आर = एक्समैक्स - एक्समिन; एम = 1 + 3.322 एलजीएन (स्टर्गेस फॉर्मूला); एन- कुल गणनाकुल इकाइयाँ।

जनसंख्या की संरचना का निर्धारण करने के लिए, विशेष औसत का उपयोग किया जाता है, जिसमें माध्यिका और मोड, या तथाकथित संरचनात्मक औसत शामिल होते हैं। यदि अंकगणितीय माध्य की गणना विशेषता मानों के सभी प्रकारों के उपयोग के आधार पर की जाती है, तो माध्यिका और बहुलक उस वैरिएंट के मान की विशेषता बताते हैं जो रैंक में एक निश्चित औसत स्थान रखता है। विविधता श्रृंखला.

माध्यिका (मी)वह मान है जो रैंक की गई शृंखला के मध्य में वैरिएंट से मेल खाता है।

व्यक्तिगत मानों की विषम संख्या वाली श्रेणीबद्ध श्रृंखला के लिए (उदाहरण के लिए, 1, 2, 3, 3, 6, 7, 9, 9, 10), माध्यिका के केंद्र में स्थित मान होगा। श्रृंखला, अर्थात्। पाँचवाँ परिमाण।

व्यक्तिगत मानों की एक समान संख्या वाली श्रेणीबद्ध श्रृंखला के लिए (उदाहरण के लिए, 1, 5, 7, 10, 11, 14), माध्य अंकगणितीय माध्य मान होगा, जिसकी गणना दो आसन्न मानों से की जाती है।

अर्थात्, माध्यिका ज्ञात करने के लिए, आपको पहले सूत्र का उपयोग करके इसकी क्रमिक संख्या (रैंकिंग श्रृंखला में इसकी स्थिति) निर्धारित करने की आवश्यकता है

जहाँ n जनसंख्या में इकाइयों की संख्या है।

माध्यिका का संख्यात्मक मान एक असतत परिवर्तनशील श्रृंखला में संचित आवृत्तियों द्वारा निर्धारित किया जाता है। ऐसा करने के लिए, आपको पहले वितरण की अंतराल श्रृंखला में माध्यिका ज्ञात करने के लिए अंतराल निर्दिष्ट करना होगा। माध्यिका पहला अंतराल है जहाँ संचित आवृत्तियों का योग प्रेक्षणों की कुल संख्या के आधे से अधिक हो जाता है।

माध्यिका का संख्यात्मक मान

जहां xMe माध्यिका अंतराल की निचली सीमा है; मैं - अंतराल का मूल्य; S-1 - अंतराल की संचित आवृत्ति जो माध्यिका से पहले होती है; f माध्यिका अंतराल की आवृत्ति है।

फैशन (मो)उस विशेषता के मूल्य का नाम बताइए जो जनसंख्या की इकाइयों में सबसे अधिक बार होता है। असतत श्रृंखला के लिए, मोड उच्चतम आवृत्ति वाला संस्करण होगा। अंतराल श्रृंखला का बहुलक ज्ञात करने के लिए पहले बहुलक अंतराल (उच्चतम आवृत्ति वाला अंतराल) निर्धारित किया जाता है। फिर, इस अंतराल के भीतर, सुविधा का मूल्य पाया जाता है, जो एक मोड हो सकता है।

एक विशिष्ट मोड मान खोजने के लिए, आपको सूत्र का उपयोग करना चाहिए

जहां xMo मोडल अंतराल की निचली सीमा है; iMo - मोडल अंतराल का मान; fMo मोडल अंतराल की आवृत्ति है; fMo-1 - मोडल से पहले के अंतराल की आवृत्ति; fMo+1 - मोडल के बाद अंतराल की आवृत्ति।

फैशन का व्यापक रूप से उपभोक्ता मांग के अध्ययन में विपणन गतिविधियों में उपयोग किया जाता है, विशेष रूप से उन कपड़ों और जूतों के आकार का निर्धारण करने में जो मूल्य निर्धारण नीति को विनियमित करते हुए सबसे अधिक मांग में हैं।

परिवर्तनशील श्रृंखला के विश्लेषण का मुख्य उद्देश्य किसी दिए गए वितरण के लिए यादृच्छिक कारकों के प्रभाव को छोड़कर, वितरण के पैटर्न की पहचान करना है। यह अध्ययन की गई जनसंख्या की मात्रा को बढ़ाकर और साथ ही श्रृंखला के अंतराल को कम करके प्राप्त किया जा सकता है। जब हम इस डेटा को ग्राफिक रूप से प्रदर्शित करने का प्रयास करते हैं, तो हमें कुछ चिकनी घुमावदार रेखा मिलती है, जो आवृत्ति बहुभुज के लिए एक निश्चित सीमा होगी। इस रेखा को वितरण वक्र कहते हैं।

दूसरे शब्दों में, वितरण वक्रएक परिवर्तनशील श्रृंखला में आवृत्ति परिवर्तन की एक सतत रेखा के रूप में एक ग्राफिक प्रतिनिधित्व होता है, जो कार्यात्मक रूप से संस्करण में परिवर्तन से संबंधित होता है। वितरण वक्र यादृच्छिक कारकों की अनुपस्थिति में आवृत्ति परिवर्तन के पैटर्न को दर्शाता है। ग्राफिक प्रतिनिधित्व वितरण श्रृंखला के विश्लेषण की सुविधा प्रदान करता है।

वितरण वक्रों के बहुत सारे रूप ज्ञात हैं, जिनके साथ एक परिवर्तनशील श्रृंखला को संरेखित किया जा सकता है, लेकिन सांख्यिकीय अनुसंधान के अभ्यास में, सामान्य वितरण और पॉइसन वितरण जैसे रूपों का सबसे अधिक उपयोग किया जाता है।

सामान्य वितरण दो मापदंडों पर निर्भर करता है: अंकगणितीय माध्य और मानक विचलन। इसका वक्र समीकरण द्वारा व्यक्त किया जाता है

जहाँ y वक्र की कोटि है सामान्य वितरण; - मानकीकृत विचलन; ई और गणितीय स्थिरांक हैं; एक्स - विविधता श्रृंखला के प्रकार; - उन्हें औसत मूल्य; - औसत मानक विचलन.

यदि आपको सामान्य वितरण वक्र के साथ भिन्नता श्रृंखला को संरेखित करते समय सैद्धांतिक आवृत्तियों f "प्राप्त करने की आवश्यकता है, तो आप सूत्र का उपयोग कर सकते हैं

विविधता श्रृंखला के सभी अनुभवजन्य आवृत्तियों का योग कहां है; एच - समूहों में अंतराल का आकार; - माध्य वर्ग विचलन; - अंकगणित माध्य से विकल्पों का सामान्यीकृत विचलन; अन्य सभी मात्राओं की गणना विशेष तालिकाओं का उपयोग करके आसानी से की जाती है।

इस सूत्र से हमें प्राप्त होता है सैद्धांतिक (संभाव्यता) वितरण, उनकी जगह अनुभवजन्य (वास्तविक) वितरण, वे चरित्र में एक दूसरे से भिन्न नहीं होने चाहिए।

हालांकि, कुछ मामलों में, यदि भिन्नता श्रृंखला एक असतत विशेषता के अनुसार एक वितरण है, जहां विशेषता x के मूल्यों में वृद्धि के रूप में, आवृत्तियों में तेजी से कमी होने लगती है, और अंकगणितीय माध्य, बदले में या के बराबर होता है। विचरण () के मूल्य के करीब, ऐसी श्रृंखला पॉसों वक्र के साथ संरेखित होती है।

पॉइसन वक्रके रूप में व्यक्त किया जा सकता है

जहाँ Px व्यक्तिगत x मानों के घटित होने की प्रायिकता है; श्रृंखला का अंकगणितीय माध्य है।

अनुभवजन्य डेटा को समतल करते समय, सैद्धांतिक आवृत्तियों को सूत्र द्वारा निर्धारित किया जा सकता है

जहाँ f" - सैद्धांतिक आवृत्तियाँ; N - श्रृंखला की इकाइयों की कुल संख्या।

सैद्धांतिक आवृत्तियों के प्राप्त मूल्यों की तुलना f "अनुभवजन्य (वास्तविक) आवृत्तियों f के साथ, हम आश्वस्त हैं कि उनकी विसंगतियां बहुत छोटी हो सकती हैं।

सैद्धांतिक और अनुभवजन्य आवृत्तियों के बीच पत्राचार की एक उद्देश्य विशेषता विशेष सांख्यिकीय संकेतकों का उपयोग करके प्राप्त की जा सकती है, जिन्हें अच्छाई-की-फिट मानदंड कहा जाता है।

अनुभवजन्य और सैद्धांतिक आवृत्तियों की निकटता का आकलन करने के लिए, पियर्सन की अच्छाई-की-फिट परीक्षा, रोमानोव्स्की की अच्छाई-की-फिट परीक्षण, और कोलमोगोरोव की अच्छाई-की-फिट परीक्षण का उपयोग किया जाता है।

सबसे आम है के. पियर्सन की अच्छाई-की-फिट मानदंड, जिसे सैद्धांतिक आवृत्तियों के लिए f" और f के बीच वर्ग अंतर के अनुपात के योग के रूप में दर्शाया जा सकता है:

मानदंड के परिकलित मान की तुलना सारणीबद्ध (महत्वपूर्ण) मान से की जानी चाहिए। सारणीबद्ध मान एक विशेष तालिका के अनुसार निर्धारित किया जाता है, यह स्वीकृत संभावना पी और स्वतंत्रता की डिग्री की संख्या पर निर्भर करता है k (इस मामले में, k \u003d m - 3, जहां m वितरण श्रृंखला में समूहों की संख्या है सामान्य वितरण)। पियर्सन की अच्छाई-की-फिट मानदंड की गणना करते समय, निम्नलिखित शर्त देखी जानी चाहिए: अवलोकनों की संख्या पर्याप्त रूप से बड़ी (एन 50) होनी चाहिए, जबकि कुछ अंतरालों में सैद्धांतिक आवृत्तियों< 5, то интервалы объединяют для условия > 5.

यदि , तो अनुभवजन्य और सैद्धांतिक वितरण आवृत्तियों के बीच विसंगतियां यादृच्छिक हो सकती हैं और यह धारणा कि अनुभवजन्य वितरण सामान्य के करीब है, को खारिज नहीं किया जा सकता है।

इस घटना में कि सैद्धांतिक और अनुभवजन्य आवृत्तियों के बीच विसंगति की यादृच्छिकता का आकलन करने के लिए कोई तालिका नहीं है, कोई इसका उपयोग कर सकता है सहमति की कसौटी रोमानोव्स्कीक्रॉम, जिन्होंने मूल्य का उपयोग करते हुए, अनुपात का उपयोग करके सामान्य वितरण वक्र के अनुभवजन्य वितरण की निकटता का मूल्यांकन करने का प्रस्ताव रखा।

जहाँ m समूहों की संख्या है; के = (एम - 3) - सामान्य वितरण की आवृत्तियों की गणना में स्वतंत्रता की डिग्री की संख्या।

यदि उपरोक्त संबंध< 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение >3, तो विसंगतियां काफी महत्वपूर्ण हो सकती हैं और सामान्य वितरण की परिकल्पना को खारिज कर दिया जाना चाहिए।

एक। Kolmogorovसूत्र द्वारा गणना की गई अनुभवजन्य और सैद्धांतिक वितरण की आवृत्तियों के बीच अधिकतम विसंगति का निर्धारण करने में उपयोग किया जाता है

जहां डी संचित अनुभवजन्य और सैद्धांतिक आवृत्तियों के बीच अंतर का अधिकतम मूल्य है; - अनुभवजन्य आवृत्तियों का योग।

-मानदंड के संभाव्यता मूल्यों की तालिका के अनुसार, कोई प्रायिकता के अनुरूप मान पा सकता है। यदि संभाव्यता मान पाया गया मान के संबंध में महत्वपूर्ण है, तो यह माना जा सकता है कि सैद्धांतिक के बीच की विसंगतियां और अनुभवजन्य वितरण महत्वहीन हैं।

Kolmogorov अच्छाई-की-फिट परीक्षण का उपयोग करने के लिए एक आवश्यक शर्त पर्याप्त है बड़ी संख्याअवलोकन (सौ से कम नहीं)।

भिन्नता के सांख्यिकीय अध्ययन में पहला कदम निर्माण है विविधता श्रृंखला - विशेषता के मूल्यों में वृद्धि (अधिक बार) या घटते (कम अक्सर) के अनुसार जनसंख्या की इकाइयों के वितरण का आदेश दिया और विशेषता के एक या दूसरे मूल्य के साथ इकाइयों की संख्या की गणना की।

एक विविधता श्रृंखला के तीन रूप हैं: एक श्रेणीबद्ध श्रृंखला, एक असतत श्रृंखला, एक अंतराल श्रृंखला। विविधता श्रृंखला को अक्सर कहा जाता है वितरण के निकट।इस शब्द का प्रयोग मात्रात्मक और गैर-मात्रात्मक दोनों लक्षणों में भिन्नता के अध्ययन में किया जाता है। वितरण श्रृंखला है संरचनात्मक समूहन(अध्याय 6 देखें)।

रैंक की गई पंक्ति -यह अध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है।

तालिका 1 एक क्रमबद्ध श्रृंखला के उदाहरण के रूप में काम कर सकती है। 5.5.

तालिका 5.5

सेंट पीटर्सबर्ग के बड़े किनारे, आकार के अनुसार क्रमबद्ध01.07.96 . तक अपनी पूंजी

यदि जनसंख्या इकाइयों की संख्या काफी बड़ी है, तो क्रमबद्ध श्रृंखला बोझिल हो जाती है, और इसका निर्माण, यहां तक ​​कि कंप्यूटर की सहायता से भी, लंबे समय तक. ऐसे मामलों में, अध्ययन के तहत विशेषता के मूल्यों के अनुसार जनसंख्या की इकाइयों को समूहीकृत करके भिन्नता श्रृंखला का निर्माण किया जाता है।

यदि विशेषता कम संख्या में मान लेती है, तो एक असतत परिवर्तनशील श्रृंखला बनाई जाती है। इस तरह की श्रृंखला का एक उदाहरण फुटबॉल मैचों का स्कोर किए गए गोलों की संख्या से वितरण है (तालिका 5.1)। असतत भिन्नता श्रृंखला -यह एक तालिका है जिसमें दो पंक्तियाँ या एक ग्राफ़ होता है: एक चर विशेषता के विशिष्ट मान एक्समैंऔर सुविधा के दिए गए मान के साथ जनसंख्या इकाइयों की संख्या फाईआवृत्तियों (f अंग्रेजी शब्द आवृत्ति का प्रारंभिक अक्षर है)।

समूहों की संख्या का निर्धारण

असतत भिन्नता श्रृंखला में समूहों की संख्या चर विशेषता के वास्तव में मौजूदा मूल्यों की संख्या से निर्धारित होती है। यदि विशेषता असतत मान ले सकती है, लेकिन उनकी संख्या बहुत बड़ी है (उदाहरण के लिए, विभिन्न कृषि उद्यमों में वर्ष के 1 जनवरी को पशुधन की संख्या शून्य से दसियों हज़ार सिर तक हो सकती है), तो अंतराल भिन्नता श्रृंखला है बनाना। एक अंतराल भिन्नता श्रृंखला का निर्माण उन विशेषताओं का अध्ययन करने के लिए भी किया जाता है जो अपने अस्तित्व के क्षेत्र में किसी भी, दोनों पूर्णांक और भिन्नात्मक मूल्यों को ले सकते हैं। ये हैं, उदाहरण के लिए, बेचे गए उत्पादों की लाभप्रदता, उत्पादन की एक इकाई की लागत, शहर के प्रति 1 निवासी आय, लोगों का हिस्सा उच्च शिक्षाविभिन्न क्षेत्रों की आबादी के बीच और, सामान्य तौर पर, सभी माध्यमिक विशेषताओं, जिनमें से मूल्यों की गणना एक प्राथमिक विशेषता के मूल्य को दूसरे के मूल्य से विभाजित करके की जाती है (अध्याय 3 देखें)।

अंतराल भिन्नता श्रृंखलाएक तालिका है (दो स्तंभों (या रेखाओं से मिलकर) - विशेषता के अंतराल, जिसकी भिन्नता का अध्ययन किया जा रहा है, और इस अंतराल (आवृत्तियों) में गिरने वाली जनसंख्या की इकाइयों की संख्या, या इस संख्या का अनुपात कुल जनसंख्या (आवृत्ति)।

अंतराल भिन्नता श्रृंखला का निर्माण करते समय, समूहों की इष्टतम संख्या (चरित्र अंतराल) चुनना और अंतराल की लंबाई निर्धारित करना आवश्यक है। चूंकि एक परिवर्तनशील श्रृंखला का विश्लेषण करते समय, विभिन्न अंतरालों में आवृत्तियों की तुलना की जाती है, इसलिए यह आवश्यक है कि अंतराल का मान स्थिर हो। समूहों की इष्टतम संख्या इस तरह से चुनी जाती है कि समुच्चय में विशेषता मूल्यों की विविधता पर्याप्त रूप से परिलक्षित होती है और साथ ही, वितरण की नियमितता, इसका आकार यादृच्छिक आवृत्ति उतार-चढ़ाव से विकृत नहीं होता है। यदि बहुत कम समूह हैं, तो भिन्नता का कोई पैटर्न नहीं होगा; यदि बहुत अधिक समूह हैं, तो यादृच्छिक आवृत्ति छलांग वितरण के आकार को विकृत कर देगी।

अक्सर, परिवर्तनशील श्रृंखला में समूहों की संख्या अमेरिकी सांख्यिकीविद् स्टर्गेस द्वारा अनुशंसित सूत्र का पालन करके निर्धारित की जाती है। (स्टर्गेस):

कहाँ पे - समूहों की संख्या; एन- जनसंख्या का आकार।

यह सूत्र दर्शाता है कि समूहों की संख्या डेटा की मात्रा का एक फलन है।

मान लीजिए कि एक निश्चित वर्ष के लिए अनाज फसलों की उपज के अनुसार क्षेत्र में उद्यमों के वितरण की एक भिन्न श्रृंखला बनाना आवश्यक है। अनाज फसलों वाले कृषि उद्यमों की संख्या 143 थी; न्यूनतम उपज मूल्य 10.7 c/ha है, उच्चतम 53.1 c/ha है। हमारे पास है:

चूंकि समूहों की संख्या पूर्णांक है, इसलिए 8 या 9 समूह बनाने की अनुशंसा की जाती है।

अंतराल के आकार का निर्धारण

समूहों की संख्या जानने के बाद, अंतराल के मूल्य की गणना करें:

हमारे उदाहरण में, अंतराल मान है:

क) 8 समूहों के साथ

बी) 9 समूहों के साथ

एक श्रृंखला बनाने और भिन्नता का विश्लेषण करने के लिए, यदि संभव हो तो अंतराल के आकार और उसकी सीमाओं के गोल मान होना बेहतर है। इसलिए, सबसे अच्छा समाधान यह होगा कि 5 q/ha के अंतराल के साथ 9 समूहों के साथ एक विविधता श्रृंखला बनाई जाए। यह भिन्नता श्रृंखला तालिका में दी गई है। 5.6, और इसका ग्राफिक प्रतिनिधित्व अंजीर में दिया गया है। 5.1.

अंतराल की सीमाओं को अलग-अलग तरीकों से निर्दिष्ट किया जा सकता है: पिछले अंतराल की ऊपरी सीमा अगले की निचली सीमा को दोहराती है, जैसा कि तालिका में दिखाया गया है। 5.6, या दोहराना नहीं है।

बाद के मामले में, दूसरे अंतराल को 15.1-20, तीसरे को 20.1-25, आदि के रूप में नामित किया जाएगा, अर्थात। यह माना जाता है कि सभी उपज मूल्यों को आवश्यक रूप से एक दसवें तक गोल किया जाता है। इसके अलावा, अंतराल 15.1-20 के मध्य के साथ एक अवांछनीय जटिलता उत्पन्न होती है, जो कड़ाई से बोलते हुए, पहले से ही 17.5 के बराबर नहीं, बल्कि 17.55 के बराबर होगी; तदनुसार, जब गोल अंतराल 40-60 को 40.1-6.0 से प्रतिस्थापित किया जाता है, तो इसके मध्य 50 के गोल मान के बजाय, हमें 50.5 मिलता है। इसलिए, अंतराल को दोहराए जाने वाले गोल सीमा के साथ छोड़ना बेहतर है और सहमत हैं कि जनसंख्या इकाइयाँ अंतराल की सीमा के बराबर एक विशेषता मान है, अंतराल में शामिल है जहां सही मूल्यपहली बार संकेत दिया। इस प्रकार, पहले समूह में 15 सेंटीमीटर प्रति हेक्टेयर की उपज वाला एक खेत शामिल है, दूसरे में 20 सेंटीमीटर प्रति हेक्टेयर का मूल्य शामिल है, और इसी तरह।

चावल। 5.1. उपज द्वारा खेतों का वितरण

तालिका 5.6

अनाज फसलों की उपज के अनुसार क्षेत्र में खेतों का वितरण

उपज द्वारा खेतों के समूह,

ग/हे एक्सजे

खेतों की संख्या

अंतराल के बीच

ग/हे एक्सजे"

संचित आवृत्ति f'j

विविधता श्रृंखला का ग्राफिक प्रतिनिधित्व

परिवर्तनशील श्रृंखला और उसके गुणों के विश्लेषण में महत्वपूर्ण सहायता एक चित्रमय प्रतिनिधित्व द्वारा प्रदान की जाती है। अंतराल श्रृंखलाएक बार ग्राफ द्वारा दर्शाया गया है, जिसमें एब्सिस्सा अक्ष पर स्थित सलाखों के आधार अलग-अलग विशेषता के मूल्यों के अंतराल हैं, और सलाखों की ऊंचाई वाई-अक्ष के साथ पैमाने के अनुरूप आवृत्तियां हैं . अनाज की फसल की पैदावार के संदर्भ में क्षेत्र में खेतों के वितरण का एक ग्राफिक प्रतिनिधित्व अंजीर में दिखाया गया है। 5.1. इस तरह के आरेख को अक्सर कहा जाता है हिस्टोग्राम(ग्रीक शब्द "हिस्टोस" से - ऊतक, संरचना)।

तालिका डेटा। 5.5 और अंजीर। 5.1 कई संकेतों की वितरण विशेषता का रूप दिखाएं: संकेत के औसत अंतराल के मान अधिक सामान्य हैं, कम अक्सर - चरम; सुविधा के छोटे और बड़े मूल्य। इस वितरण का रूप पाठ्यक्रम में विचार किए जाने के करीब है गणितीय सांख्यिकीसामान्य वितरण का नियम। महान रूसी गणितज्ञ ए.एम. ल्यपुनोव (1857 - 1918) ने साबित किया कि एक सामान्य वितरण बनता है यदि एक चर चर बड़ी संख्या में कारकों से प्रभावित होता है, जिनमें से किसी का भी प्रमुख प्रभाव नहीं होता है। अनाज फसलों की पैदावार में भिन्नता को प्रभावित करने वाले कई लगभग समान कारकों का एक यादृच्छिक संयोजन, दोनों प्राकृतिक और कृषि-तकनीकी, आर्थिक, करीब बनाता है सामान्य कानूनउत्पादकता द्वारा क्षेत्र में खेतों का वितरण वितरण।

यदि कोई असतत परिवर्तनशील श्रृंखला है या अंतराल के मध्य बिंदुओं का उपयोग किया जाता है, तो ऐसी परिवर्तनशील श्रृंखला के चित्रमय प्रतिनिधित्व को कहा जाता है बहुभुज(ग्रीक शब्दों से - एक बहुभुज)। आप में से प्रत्येक निर्देशांक के साथ बिंदुओं को सीधी रेखाओं से जोड़कर आसानी से इस ग्राफ का निर्माण कर सकता है एक्स,तथा /।

लगभग 5:8 के अनुपात में किसी बहुभुज या चार्ट की ऊंचाई और उसके आधार के अनुपात की अनुशंसा की जाती है।

आवृत्ति की अवधारणा

यदि तालिका में 5.6 उत्पादकता के एक विशेष स्तर के साथ खेतों की संख्या को कुल के प्रतिशत के रूप में व्यक्त करें, खेतों की पूरी संख्या (143) को 100% के रूप में लेते हुए, औसत उपज की गणना निम्नानुसार की जा सकती है:

कहाँ पे वू- विविधता श्रृंखला की 7 वीं श्रेणी की आवृत्ति;

संचयी बटवारा

विविधता श्रृंखला का रूपांतरित रूप है संचित आवृत्तियों की एक संख्या,तालिका में दिया गया। 5.6, कॉलम 5। यह आबादी में इकाइयों की संख्या के लिए मूल्यों की एक श्रृंखला है जो विशेषता के संबंधित अंतराल मूल्यों की निचली सीमा से कम और बराबर है। ऐसी श्रृंखला कहलाती है संचयी।आप संचयी वितरण "से कम नहीं" बना सकते हैं, या आप "इससे अधिक" बना सकते हैं। पहले मामले में, संचयी वितरण प्लॉट को कहा जाता है संचय करना,क्षण में - औजाइव(चित्र 5.2)।

घनत्व, वितरण

अगर आपको निपटना है परिवर्तनशील श्रृंखलाअसमान अंतराल के साथ, तो तुलना के लिए आवृत्ति या आवृत्ति को एक इकाई अंतराल में कम करना आवश्यक है। परिणामी अनुपात कहलाता है वितरण घनत्व:

वितरण घनत्व का उपयोग सामान्यीकरण संकेतकों की गणना के लिए और दोनों के लिए किया जाता है ग्राफिक छविअसमान अंतराल के साथ भिन्नता श्रृंखला।

चावल। 5.2. ओजिवा और संचयी उपज वितरण

5.7. विविधता की संरचनात्मक विशेषताएं पंक्ति

वितरण माध्यिका

भिन्नता का अध्ययन करते समय, परिवर्तनशील श्रृंखला की ऐसी विशेषताओं का उपयोग किया जाता है जो मात्रात्मक रूप से इसकी संरचना, संरचना का वर्णन करती हैं। ऐसा है, उदाहरण के लिए, माध्यिका-जनसंख्या को दो समान भागों में विभाजित करने वाली चर विशेषता का मान ~ माध्यिका से कम विशेषता मान और माध्यिका से अधिक विशेषता मानों के साथ (तालिका 5.5 में पाँच का तीसरा बैंक, अर्थात 196 बिलियन रूबल)।

तालिका के उदाहरण पर। 5.5 देखा मूलभूत अंतरमाध्यिका और माध्य के बीच। माध्यिका श्रेणीबद्ध श्रृंखला के किनारों पर विशेषता मानों पर निर्भर नहीं करती है। भले ही सेंट पीटर्सबर्ग में सबसे बड़े बैंक की राजधानी दस गुना बड़ी हो, लेकिन औसत मूल्य नहीं बदलेगा। इसलिए, माध्य का उपयोग अक्सर अंकगणित माध्य की तुलना में किसी विशेषता के विशिष्ट मूल्य के अधिक विश्वसनीय संकेतक के रूप में किया जाता है, यदि मानों की श्रृंखला विषम है, तो माध्य से तेज विचलन शामिल हैं। पर यह पंक्तिइक्विटी पूंजी का औसत मूल्य, 269 बिलियन रूबल के बराबर, सबसे बड़े विकल्प के मजबूत प्रभाव के तहत बनाया गया था। 80% बैंकों के पास औसत से कम पूंजी है और केवल 20% के पास अधिक है। यह संभावना नहीं है कि इस तरह के औसत को एक विशिष्ट मूल्य माना जा सकता है। जनसंख्या इकाइयों की एक समान संख्या के साथ, माध्यिका को दो केंद्रीय विकल्पों के अंकगणितीय औसत के रूप में लिया जाता है, उदाहरण के लिए, विशेषता के दस मानों के साथ, क्रमबद्ध श्रृंखला में पांचवें और छठे मूल्यों का औसत।

अंतराल परिवर्तनशील श्रृंखला में माध्यिका ज्ञात करने के लिए सूत्र (5.14) का प्रयोग किया जाता है।

जहाँ मैं माध्यिका हूँ;

एक्स 0 -अंतराल की निचली सीमा जिसमें माध्यिका स्थित है;

एफएम ई-1 - माध्यिका से पहले के अंतराल में संचित आवृत्ति;

एफ मी- मध्य अंतराल में आवृत्ति;

मैं- अंतराल मूल्य;

- समूहों की संख्या।

तालिका में। 5.6 माध्यिका 143 मानों का औसत है, अर्थात। उत्पादकता की श्रृंखला मूल्य की शुरुआत से बहत्तर सेकंड। जैसा कि संचित आवृत्तियों की संख्या से देखा जा सकता है, यह चौथे अंतराल में है। फिर

जनसंख्या इकाइयों की एक विषम संख्या के साथ, माध्यिका संख्या, जैसा कि हम देखते हैं, not . के बराबर है , सूत्र (5.14), a . के रूप में , लेकिन यह अंतर महत्वपूर्ण नहीं है और आमतौर पर व्यवहार में इसे नजरअंदाज कर दिया जाता है।

एक असतत परिवर्तनशील श्रृंखला में, माध्यिका को उस समूह में विशेषता का मान माना जाना चाहिए जिसमें संचित आवृत्ति;

आधी से अधिक आबादी। उदाहरण के लिए, तालिका में डेटा के लिए। 5.1 प्रति गेम बनाए गए गोलों की औसत संख्या 2 होगी।

वितरण चतुर्थक

इसी तरह, माध्यिका के समान, विशेषता के मूल्यों की गणना की जाती है, जनसंख्या को इकाइयों की संख्या के बराबर चार भागों में विभाजित किया जाता है। इन राशियों को कहा जाता है चतुर्थकोंऔर एक राजधानी लैटिन "अक्षर" द्वारा निरूपित किया जाता है क्यूएक हस्ताक्षरित चतुर्थक संख्या बैज के साथ। यह स्पष्ट है कि क्यू 2 मुझसे मेल खाता है। पहले और तीसरे चतुर्थक के लिए, हम तालिका के अनुसार सूत्र और गणना प्रस्तुत करते हैं। 5.6.

इसलिये क्यू 2 = Me = 29.5 c/ha, यह देखा जा सकता है कि प्रथम चतुर्थक और माध्यिका के बीच का अंतर माध्यिका और तृतीय चतुर्थक के बीच की तुलना में कम है। यह तथ्य वितरण के मध्य क्षेत्र में कुछ विषमता की उपस्थिति को इंगित करता है, जो अंजीर में भी ध्यान देने योग्य है। 5.1.

श्रृंखला को पांच बराबर भागों में विभाजित करने वाले विशेषता मान कहलाते हैं Quintilesदस भागों में दशमांश,एक सौ भाग शतमक।चूंकि इन विशेषताओं का उपयोग केवल तभी किया जाता है जब परिवर्तनशील श्रृंखला की संरचना का विस्तार से अध्ययन करना आवश्यक हो, हम उनके सूत्र और गणना नहीं देंगे।

वितरण मोड

निश्चित रूप से महत्त्वविशेषता का ऐसा मूल्य है जो अध्ययन की गई श्रृंखला में, कुल मिलाकर सबसे अधिक बार होता है। इस मात्रा को कहा जाता है फ़ैशनऔर मो. एक असतत श्रृंखला में, उच्चतम आवृत्ति वाले फीचर के मूल्य के रूप में गणना के बिना मोड निर्धारित किया जाता है। उदाहरण के लिए, तालिका के अनुसार। 5.1 सबसे अधिक बार एक फुटबॉल मैच में 2 गोल किए गए - 71 बार। मोड संख्या 2 है। आमतौर पर विशेषता के एक मोडल मान वाली पंक्तियाँ होती हैं। यदि किसी विशेषता के दो या अधिक समान (और यहां तक ​​कि कई भिन्न, लेकिन पड़ोसी से अधिक) मान भिन्नता श्रृंखला में मौजूद हैं, तो इसे क्रमशः बिमोडल ("ऊंट जैसा") या मल्टीमॉडल माना जाता है। यह सेट की विविधता को इंगित करता है, संभवतः विभिन्न मोड के साथ कई सेटों के कुल का प्रतिनिधित्व करता है।

तो यहां से आए पर्यटकों की भीड़ में विभिन्न देश, स्थानीय लोगों के बीच प्रचलित एक फैशनेबल कपड़ों के बजाय, आप दुनिया के विभिन्न लोगों द्वारा अपनाए गए विभिन्न "फैशन" का मिश्रण पा सकते हैं।

एक अंतराल भिन्नता श्रृंखला में, विशेष रूप से एक विशेषता की निरंतर भिन्नता के साथ, कड़ाई से बोलते हुए, सुविधा का प्रत्येक मान केवल एक बार होता है। मोडल अंतराल उच्चतम आवृत्ति वाला अंतराल है। इस अंतराल के भीतर, विशेषता का सशर्त मान पाया जाता है, जिसके पास वितरण घनत्व, यानी। एक चर विशेषता की माप की प्रति इकाई जनसंख्या इकाइयों की संख्या अधिकतम तक पहुंच जाती है। यह एक सशर्त मान है और माना जाता है डॉट फैशन।यह मान लेना तर्कसंगत है कि ऐसा बिंदु मोड अंतराल की सीमाओं के करीब स्थित है, जिसके आगे पड़ोसी अंतराल में आवृत्ति मोडल अंतराल की अन्य सीमा से परे अंतराल में आवृत्ति से अधिक है। इसलिए हमारे पास आमतौर पर इस्तेमाल किया जाने वाला सूत्र (5.15) है:

कहाँ पे एक्स 0 - मोडल अंतराल की निचली सीमा;

एफएमओ - मोडल अंतराल में आवृत्ति;

एफएमओ -1 - पिछले अंतराल में आवृत्ति;

एफएमओ +1 - मोडल के बाद अगले अंतराल में आवृत्ति;

मैं - अंतराल मूल्य।

तालिका के अनुसार। 5.6 फैशन की गणना करें:

अंतराल श्रृंखला में बहुलक की गणना बल्कि सशर्त है। लगभग Mo को आलेखीय रूप से निर्धारित किया जा सकता है (देखिए आकृति 5.1)।

अंकगणित माध्य मान भी परिवर्तनशील श्रृंखला की संरचना के अध्ययन के लिए प्रासंगिक है, हालांकि इस सामान्यीकरण संकेतक का मुख्य मूल्य अलग है। उपज द्वारा खेतों की वितरण श्रृंखला में (तालिका 5.6), औसत उपज की गणना अंतराल के आवृत्ति-भारित मध्य के रूप में की जाती है एक्स(सूत्र द्वारा (5.2)):

माध्य, माध्यिका और बहुलक के बीच संबंध

इस बंटन में अंकगणित माध्य, माध्यिका और बहुलक के बीच का अंतर छोटा है। यदि आकार में वितरण सामान्य नियम के करीब है, तो माध्य बहुलक और माध्य मान के बीच होता है, और बहुलक की तुलना में माध्य के अधिक निकट होता है।

दाएं तरफा विषमता के साथ एक्स̅ > मैं > मो;

बाएं तरफा विषमता के साथ एक्स̅ < मैं< Mo.

मध्यम विषम वितरण के लिए, समानता सत्य है:

5.8. आकार और तीव्रता के उपाय विविधताओं

भिन्नता के पूर्ण माध्य आकार

समुच्चय में विशेषता की भिन्नता के अध्ययन में अगला चरण बल की विशेषताओं का मापन, भिन्नता का परिमाण है। उनमें से सबसे सरल हो सकता है दायराया भिन्नता आयाम -मूल्यों के अध्ययन किए गए सेट में उपलब्ध मूल्यों से किसी विशेषता के अधिकतम और न्यूनतम मूल्यों के बीच पूर्ण अंतर। इस प्रकार, भिन्नता की सीमा की गणना सूत्र द्वारा की जाती है

चूंकि सीमा का परिमाण विशेषता के मूल्यों में केवल अधिकतम अंतर को दर्शाता है, यह पूरी आबादी में इसकी भिन्नता की नियमित ताकत को माप नहीं सकता है। इस उद्देश्य के लिए अभिप्रेत संकेतक को बिना किसी अपवाद के, कुल में विशेषता के मूल्यों में सभी अंतरों को ध्यान में रखना चाहिए और सामान्य करना चाहिए। ऐसे अंतरों की संख्या जनसंख्या की सभी इकाइयों में से दो के संयोजनों की संख्या के बराबर होती है; तालिका के अनुसार। 5.6 यह होगा: सी ^= 10 153. हालांकि, सभी विचलनों पर विचार करने, गणना करने और औसत करने की कोई आवश्यकता नहीं है। माध्य से व्यक्तिगत विशेषता मूल्यों के विचलन के औसत का उपयोग करना आसान है अंकगणितीय मानविशेषता, और उनमें से केवल 143 हैं लेकिन बाद की प्रसिद्ध संपत्ति के अनुसार, अंकगणितीय औसत मूल्य से विशेषता मूल्यों का औसत विचलन शून्य है। इसलिए, भिन्नता की ताकत का संकेतक विचलन का बीजगणितीय औसत नहीं है, लेकिन विचलन का औसत मापांक:

तालिका के अनुसार। 5.6 मध्य मॉड्यूल, या औसत रैखिक विचलन,निरपेक्ष मान में एक आवृत्ति-भारित विचलन मॉड्यूलो के रूप में गणना की जाती है, अंकगणितीय माध्य से अंतराल के मध्य बिंदु, अर्थात। सूत्र के अनुसार

इसका मतलब यह है कि, औसतन, खेतों के अध्ययन किए गए सेट में उपज क्षेत्र में औसत उपज से 6.85 c/ha से विचलित होती है। गणना और व्याख्या में आसानी मेकअप सकारात्मक पक्षहालांकि, इस सूचक के मॉड्यूल के गणितीय गुण "खराब" हैं: उन्हेंसामान्य वितरण सहित किसी भी संभाव्य कानून के अनुरूप नहीं लाया जा सकता है, जिसका पैरामीटर औसत विचलन मॉड्यूल नहीं है, लेकिन मानक विचलन(अंग्रेजी कंप्यूटर प्रोग्राम में "मानक विचलन" कहा जाता है, संक्षेप में "s.d." या बस « एस», रूसी भाषी में - एनकेओ)। सांख्यिकीय साहित्य में, माध्य मान से मानक विचलन को आमतौर पर एक छोटे (लोअरकेस) द्वारा दर्शाया जाता है ग्रीक अक्षरसिग्मा (सेंट) or एस(अध्याय 7 देखें):

रैंकिंग श्रृंखला के लिए

अंतराल श्रृंखला के लिए

तालिका के अनुसार। 5.6 अनाज की उपज का मानक विचलन था:

यह ध्यान दिया जाना चाहिए कि औसत मूल्य और अंतराल के मध्य बिंदुओं के कुछ गोलाई, उदाहरण के लिए, पूर्णांक वाले के लिए, σ के मूल्य पर बहुत कम प्रभाव पड़ता है, जो तब 8.55 सी / हेक्टेयर होगा।

वास्तविक आबादी में परिमाण में मानक विचलन हमेशा औसत विचलन मॉड्यूल से अधिक होता है। अनुपात (पर: एकसमुच्चय में तेज, प्रमुख विचलन की उपस्थिति पर निर्भर करता है और मुख्य द्रव्यमान के साथ विषम तत्वों के साथ समुच्चय के "संदूषण" के संकेतक के रूप में काम कर सकता है: यह अनुपात जितना बड़ा होगा, उतना ही मजबूत "संदूषण" होगा। सामान्य वितरण कानून के लिए : ए = 1,2.

फैलाव की अवधारणा

मानक विचलन का वर्ग मान देता है फैलाव 2 .फैलाव सूत्र:

सरल (अवर्गीकृत डेटा के लिए):

भारित (समूहीकृत डेटा के लिए):

गणितीय आँकड़ों की लगभग सभी विधियाँ परिक्षेपण पर आधारित होती हैं। प्रसरणों को जोड़ने का नियम बहुत व्यावहारिक महत्व का है (अध्याय 6 देखें)।

भिन्नता के अन्य उपाय

भिन्नता की ताकत का एक और संकेतक, जो इसे पूरी आबादी में नहीं, बल्कि केवल इसके मध्य भाग में दर्शाता है औसत तिमाही दूरी,वे। चतुर्थक के बीच अंतर का औसत मूल्य, नीचे दर्शाया गया है क्यू:

तालिका में उपज द्वारा कृषि उद्यमों के वितरण के लिए। 5.2

क्यू\u003d (36.25 - 25.09): 2 \u003d 5.58 किग्रा / हेक्टेयर। जनसंख्या के मध्य भाग में भिन्नता की ताकत, एक नियम के रूप में, पूरी आबादी की तुलना में कम है। विचलन के माध्य मॉड्यूल और माध्य त्रैमासिक विचलन के बीच का अनुपात भी भिन्नता की संरचना का अध्ययन करने के लिए कार्य करता है: बहुत महत्वऐसा अनुपात एक कमजोर रूप से भिन्न "कोर" की उपस्थिति और इस कोर के चारों ओर एक दृढ़ता से बिखरे हुए वातावरण या अध्ययन की गई आबादी में "हेलो" की उपस्थिति को इंगित करता है। तालिका में डेटा के लिए। 5.6 अनुपात ए: क्यू= 1.23, जो जनसंख्या के मध्य भाग और उसकी परिधि में भिन्नता की ताकत में एक छोटे से अंतर को दर्शाता है।

भिन्नता की तीव्रता का आकलन करने के लिए और विभिन्न आबादी में इसकी तुलना करने के लिए, और इससे भी अधिक विभिन्न लक्षणों के लिए, यह आवश्यक है सापेक्ष प्रदर्शनविविधताएं।उनकी गणना अनुपात के रूप में की जाती है निरपेक्ष संकेतकपहले चर्चा की गई भिन्नता की ताकत, सुविधा के अंकगणितीय माध्य मान के लिए। हमें निम्नलिखित संकेतक मिलते हैं:

1) भिन्नता की सापेक्ष सीमा p:

2) सापेक्ष विचलन मोडुलो टी:

3) सापेक्ष वर्ग विचलन के रूप में भिन्नता का गुणांक वी:

4) सापेक्ष तिमाही दूरी डी:

कहाँ पे क्यू - माध्य चतुर्थक दूरी।

तालिका के अनुसार उपज को अलग करने के लिए। 5.6 ये संकेतक हैं:

ρ = 42.4: 30.3 = 1.4, या 140%;

टी= 6.85: 30.3 = 0.226, या 22.6%;

वी = 8.44: 30.3 = 0.279, या 27.9%;

डी= 5.58: 30.3 = 0.184, या 18.4%।

भिन्नता की तीव्रता की डिग्री का आकलन केवल एक निश्चित संरचना की आबादी की प्रत्येक व्यक्तिगत विशेषता के लिए संभव है। तो, कृषि उद्यमों के एक समूह के लिए, एक ही प्राकृतिक क्षेत्र में उपज में भिन्नता का आकलन कमजोर के रूप में किया जा सकता है यदि वी < 10%, умеренная при 10% < वी < 25% и сильная при वी > 25%.

इसके विपरीत, पहले से ही 7% ​​के गुणांक पर वयस्क पुरुषों या महिलाओं की आबादी में ऊंचाई में भिन्नता का आकलन किया जाना चाहिए और लोगों द्वारा इसे मजबूत माना जाना चाहिए। इस प्रकार, भिन्नता की तीव्रता के आकलन में प्रेक्षित भिन्नता की तुलना इसकी कुछ सामान्य तीव्रता के साथ की जाती है, जिसे मानक के रूप में लिया जाता है। हम इस तथ्य के आदी हैं कि उत्पादकता, आय या प्रति व्यक्ति आय, एक इमारत में रहने वाले कमरों की संख्या कई या दस गुना भिन्न हो सकती है, लेकिन लोगों की ऊंचाई में कम से कम डेढ़ गुना का अंतर पहले से ही माना जाता है बहुत ताकतवर।

विभिन्न शक्ति, तीव्रता भिन्नता के कारण उद्देश्य कारण. उदाहरण के लिए, 24 जनवरी, 1997 को सेंट पीटर्सबर्ग में वाणिज्यिक बैंकों में अमेरिकी डॉलर की बिक्री मूल्य 5675 से 5640 रूबल तक भिन्न था। पर औसत मूल्य 5664 रगड़। भिन्नता की सापेक्ष सीमा ρ = 35:5664 = 0.6%। इस तरह की एक छोटी सी भिन्नता इस तथ्य के कारण है कि डॉलर विनिमय दर में महत्वपूर्ण अंतर के साथ, "महंगे" बैंक से "सस्ता" लोगों के लिए खरीदारों का बहिर्वाह तुरंत होगा। इसके विपरीत, रूस के विभिन्न क्षेत्रों में एक किलोग्राम आलू या गोमांस की कीमत बहुत भिन्न होती है - दसियों प्रतिशत या उससे अधिक। यह उत्पादक क्षेत्र से उपभोक्ता क्षेत्र तक माल की डिलीवरी के लिए अलग-अलग लागतों के कारण है, अर्थात। कहावत "विदेश में एक बछिया आधा है, लेकिन एक रूबल ले जाया जाता है।"

5.9. वितरण और संकेतक के क्षण इसके रूप

वितरण केंद्रीय क्षण

भिन्नता की प्रकृति के आगे के अध्ययन के लिए, इसके अंकगणितीय माध्य मान से एक विशेषता के अलग-अलग मूल्यों के विचलन के विभिन्न डिग्री के औसत मूल्यों का उपयोग किया जाता है। इन संकेतकों को कहा जाता है केंद्रीय क्षणउस शक्ति के अनुरूप क्रम का वितरण जिससे विचलन उठाया जाता है (तालिका 5.7), या केवल क्षण (गैर-केंद्रीय क्षण शायद ही कभी उपयोग किए जाते हैं और यहां पर विचार नहीं किया जाएगा)। तीसरे क्षण ts- का मान, इसके चिन्ह की तरह, ऋणात्मक घनों पर विचलन के धनात्मक घनों की प्रबलता पर या इसके विपरीत पर निर्भर करता है। सामान्य और किसी भी अन्य सख्ती से सममित वितरण के तहत, सकारात्मक घनों का योग ऋणात्मक घनों के योग के बराबर होता है।

विषमता संकेतक

तीसरे क्रम के क्षण के आधार पर, वितरण की विषमता की डिग्री को दर्शाने वाले एक संकेतक का निर्माण करना संभव है:

जैसाबुलाया विषमता कारक।इसकी गणना समूहीकृत और अवर्गीकृत दोनों प्रकार के आंकड़ों से की जा सकती है। तालिका के अनुसार। 5.6 विषमता सूचकांक था:

वे। विषमता मामूली है। अंग्रेजी सांख्यिकीविद् के. पियर्सन ने औसत मूल्य और बहुलक के बीच के अंतर के आधार पर विषमता का एक और संकेतक प्रस्तावित किया

तालिका 5.7

केंद्रीय क्षण

तालिका के अनुसार। 5.6 पियर्सन का सूचकांक था:

पियर्सन सूचकांक वितरण श्रृंखला के मध्य भाग में विषमता की डिग्री पर निर्भर करता है, और विषमता सूचकांक, तीसरे क्रम के क्षण के आधार पर, विशेषता के चरम मूल्यों पर निर्भर करता है। इस प्रकार, हमारे उदाहरण में, वितरण के मध्य भाग में, विषमता अधिक महत्वपूर्ण है, जिसे ग्राफ से भी देखा जा सकता है (चित्र 5.1)। मजबूत दाएं तरफा और बाएं तरफा (सकारात्मक और नकारात्मक) विषमता वाले वितरण अंजीर में दिखाए गए हैं। 5.3.

वितरण के कर्टोसिस की विशेषता

चौथे क्रम के आघूर्ण की सहायता से, विषमता की तुलना में वितरण श्रृंखला का और भी अधिक जटिल गुण कहलाता है कर्टोसिस


चावल। 5.3. विषमता, वितरण

कुर्टोसिस संकेतक की गणना सूत्र द्वारा की जाती है

(5.30)

अक्सर कर्टोसिस की व्याख्या वितरण की "स्थिरता" के रूप में की जाती है, लेकिन यह सटीक और अपूर्ण है। वितरण ग्राफ विशेषता की भिन्नता की ताकत के आधार पर मनमाने ढंग से खड़ी दिख सकता है: कमजोर भिन्नता, किसी दिए गए पैमाने पर वितरण वक्र तेज होता है। इस तथ्य का उल्लेख नहीं करने के लिए कि एब्सिस्सा और कोर्डिनेट के साथ तराजू को बदलकर, किसी भी वितरण को कृत्रिम रूप से "खड़ी" और "ढलान" बनाया जा सकता है। यह दिखाने के लिए कि वितरण का कर्टोसिस क्या है और इसकी सही व्याख्या करने के लिए, आपको श्रृंखला की तुलना भिन्नता की समान शक्ति (σ का समान मान) और विभिन्न कर्टोसिस संकेतकों के साथ करने की आवश्यकता है। कर्टोसिस को तिरछापन के साथ भ्रमित न करने के लिए, सभी तुलना की गई पंक्तियों को सममित होना चाहिए। ऐसी तुलना अंजीर में दिखाई गई है। 5.4.

चित्र 5.4। वितरण कुर्टोसिस

एक सामान्य वितरण के साथ एक परिवर्तनशील श्रृंखला के लिए, मान मैं कुर्टोसिस संकेतक, सूत्र (5.30) द्वारा परिकलित, j तीन के बराबर है।

हालांकि, ऐसे संकेतक को "कुर्टोसिस" शब्द नहीं कहा जाना चाहिए, जिसका अर्थ अनुवाद में "अतिरिक्त" है। शब्द "कुर्टोसिस" को सूत्र (5.30) के अनुसार अनुपात में ही लागू नहीं किया जाना चाहिए, लेकिन सामान्य वितरण के दिए गए अनुपात के मूल्य के साथ अध्ययन के तहत वितरण के लिए इस तरह के अनुपात की तुलना करने के लिए, अर्थात। 3 के मान के साथ। इसलिए कर्टोसिस इंडिकेटर के लिए अंतिम सूत्र, अर्थात। भिन्नता की समान शक्ति के साथ सामान्य वितरण की तुलना में अधिकता का रूप है:

रैंकिंग श्रृंखला के लिए

अंतराल और असतत भिन्नता श्रृंखला के लिए

एक सकारात्मक कुर्टोसिस की उपस्थिति, साथ ही एक छोटी त्रैमासिक दूरी और एक बड़े मानक विचलन के बीच पहले से उल्लेखनीय महत्वपूर्ण अंतर का मतलब है कि घटना के अध्ययन किए गए द्रव्यमान में एक "कोर" होता है जो इस विशेषता में थोड़ा भिन्न होता है, जो एक से घिरा होता है बिखरा हुआ "प्रभामंडल"। एक महत्वपूर्ण नकारात्मक कुर्टोसिस के साथ, ऐसा कोई "कोर" बिल्कुल नहीं है।

वितरण के तिरछापन और कर्टोसिस के संकेतकों के मूल्यों से, कोई वितरण की निकटता को सामान्य से आंक सकता है, जो सहसंबंध और प्रतिगमन विश्लेषण के परिणामों का मूल्यांकन करने के लिए आवश्यक है, पूर्वानुमानों के संभाव्य मूल्यांकन की संभावनाएं ( अध्याय 7,8,9 देखें)। वितरण को सामान्य माना जा सकता है, या अधिक सटीक रूप से, सामान्य वितरण के साथ वास्तविक वितरण की समानता की परिकल्पना को अस्वीकार नहीं किया जा सकता है यदि तिरछापन और कुर्टोसिस संकेतक उनके दो गुना मानक विचलन सेमी से अधिक नहीं हैं। इन मानक विचलन की गणना सूत्रों द्वारा की जाती है:

5.10. अधिकतम संभव मान भिन्नता संकेतक और उनका अनुप्रयोग

किसी भी प्रकार के सांख्यिकीय संकेतकों को लागू करते समय, यह जानना उपयोगी होता है कि अध्ययन के तहत सिस्टम के लिए दिए गए संकेतक के अधिकतम संभव मूल्य क्या हैं और वास्तव में देखे गए मूल्यों का अधिकतम संभव अनुपात क्या है। वॉल्यूम संकेतकों की भिन्नता का अध्ययन करते समय यह समस्या विशेष रूप से प्रासंगिक है, जैसे कि एक निश्चित प्रकार के उत्पाद के उत्पादन की मात्रा, कुछ संसाधनों की उपलब्धता, पूंजी निवेश का वितरण, आय और लाभ। आइए हम सैद्धांतिक और व्यावहारिक रूप से इस मुद्दे पर क्षेत्र में कृषि उद्यमों के बीच सब्जी उत्पादन के वितरण के उदाहरण पर विचार करें।

यह स्पष्ट है कि भिन्नता संकेतकों का न्यूनतम संभव मूल्य जनसंख्या की सभी इकाइयों के बीच मात्रा विशेषता के कड़ाई से समान वितरण के साथ प्राप्त किया जाता है, अर्थात, प्रत्येक कृषि उद्यम में उत्पादन की समान मात्रा के साथ। इस तरह के एक सीमित (बेशक, व्यवहार में बहुत ही असंभव) वितरण में, कोई भिन्नता नहीं है और सभी संकेतक, विविधताएं शून्य के बराबर हैं।

विविधता संकेतकों का अधिकतम संभव मूल्य जनसंख्या में मात्रा विशेषता के इस तरह के वितरण के साथ प्राप्त किया जाता है, जिसमें इसकी पूरी मात्रा जनसंख्या की एक इकाई में केंद्रित होती है; उदाहरण के लिए, सब्जी उत्पादन की पूरी मात्रा - जिले के एक कृषि उद्यम में अन्य खेतों में उनके उत्पादन के अभाव में। जनसंख्या की एक इकाई में किसी विशेषता के आयतन की इतनी संभव सांद्रता की संभावना इतनी कम नहीं है; किसी भी मामले में, यह कड़ाई से समान वितरण की संभावना से बहुत अधिक है।

इसके अधिकतम के संकेतित सीमित मामले के लिए भिन्नता घातांक पर विचार करें। आइए हम जनसंख्या इकाइयों की संख्या को निरूपित करें पी,विशेषता का औसत मूल्य एक्स̅ , तो कुल में सुविधा की कुल मात्रा के रूप में व्यक्त किया जाएगा एक्स̅ पी।यह सारा आयतन जनसंख्या की एक इकाई में केंद्रित है, ताकि एक्समैक्स= एक्स̅ पी. एक्समिनट = 0, यह इस प्रकार है कि आयाम का अधिकतम मान (भिन्नता की सीमा) के बराबर है:

माध्य मोडुलो और द्विघात विचलन के अधिकतम मूल्यों की गणना करने के लिए, हम विचलन की एक तालिका (तालिका 5.8) का निर्माण करेंगे।

तालिका 5.8

औसत से विचलन के मॉड्यूल और वर्ग अधिकतमसंभावित भिन्नता

जनसंख्या इकाई संख्या

फ़ीचर मान

माध्य से विचलन

एक्स मैं - एक्स̅

विचलन मॉड्यूल

|एक्स मैं - एक्स̅|

विचलन वर्ग

(एक्समैं- एक्स̅ ) 2

एक्स̅ पी

एक्स̅ (पी - 1)

-एक्स̅

-एक्स̅

-एक्स̅

एक्स̅ (पी - 1)

एक्स̅

एक्स̅

एक्स̅

एक्स̅ 2 (पी - 1) 2

एक्स̅ 2

एक्स̅ 2

एक्स̅ 2

एक्स̅ पी

2एक्स̅ (पी - 1)

एक्स̅ 2 [(पी - 1) 2 +(एन-1)]

तालिका की अंतिम पंक्ति में भावों के आधार पर। 5.8, हम भिन्नता संकेतकों के निम्नलिखित अधिकतम संभव मान प्राप्त करते हैं।

विचलन का औसत मॉड्यूल, या औसत रैखिक विचलन:

मानक विचलन:

सापेक्ष मॉड्यूलर (रैखिक) विचलन:

भिन्नता का गुणांक:

त्रैमासिक दूरी के लिए, अधिकतम संभव भिन्नता वाले सिस्टम में सुविधा वितरण की एक पतित संरचना होती है, जिसमें संरचना की कोई ("काम न करें") विशेषताएं नहीं होती हैं: माध्यिका, चतुर्थक, और इसी तरह।

भिन्नता के मुख्य संकेतकों के अधिकतम संभव मूल्यों के लिए प्राप्त सूत्रों के आधार पर, निष्कर्ष जनसंख्या की मात्रा पर इन मूल्यों की निर्भरता के बारे में है। पी।इस निर्भरता को तालिका में संक्षेपित किया गया है। 5.9.

परिवर्तन की सबसे संकीर्ण सीमाएँ और जनसंख्या के आकार पर एक कमजोर निर्भरता औसत मापांक और सापेक्ष रैखिक विचलन को प्रकट करती है। इसके विपरीत, मानक विचलन और भिन्नता का गुणांक जनसंख्या इकाइयों की संख्या पर बहुत अधिक निर्भर करता है। विभिन्न आकारों की आबादी में भिन्नता की तीव्रता की तुलना करते समय इस निर्भरता को ध्यान में रखा जाना चाहिए। यदि छह उद्यमों के योग में उत्पादन की मात्रा में भिन्नता का गुणांक 0.58 था, और कुल 20 उद्यमों में यह 0.72 था, तो क्या यह निष्कर्ष निकालना उचित है कि दूसरी आबादी में उत्पादन की मात्रा अधिक असमान है? दरअसल, पहले, छोटे वाले में, यह अधिकतम संभव का 0.58: 2.24 = 25.9% था, यानी। सीमा, छह में से एक उद्यम में उत्पादन की एकाग्रता का स्तर, और दूसरे, बड़े सेट में, भिन्नता का मनाया गया गुणांक अधिकतम संभव का केवल 0.72: 4.36 = 16.5% था।

तालिका 5.9

जनसंख्या के विभिन्न आकारों के लिए वॉल्यूमेट्रिक विशेषता की भिन्नता के संकेतकों के मूल्यों को सीमित करना

जनगणना

संकेतकों का अधिकतम मान

एक्स̅

एक्स̅

1,5एक्स̅

1,73एक्स̅

1,67एक्स̅

2,24एक्स̅

1,80एक्स̅

3एक्स̅

1,90एक्स̅

4,36एक्स̅

1,96एक्स̅

7एक्स̅

1,98एक्स̅

9,95एक्स̅

2एक्स̅

व्यावहारिक महत्व का ऐसा संकेतक है जो वास्तविक औसत विचलन मॉड्यूल के अनुपात को अधिकतम संभव बनाता है। इस प्रकार, कुल छह उद्यमों के लिए, यह अनुपात था: 0.47: 1.67 = 0.281, या 28.1%। प्राप्त संकेतक की व्याख्या इस प्रकार है: उद्यमों के बीच उत्पादन के देखे गए वितरण से संक्रमण के लिए वर्दी वितरणपुनर्वितरण की आवश्यकता होगी

, या कुल उत्पादन का 23.4%। यदि उत्पादन की वास्तविक एकाग्रता की डिग्री (σ या . का वास्तविक मूल्य) वी) एक उद्यम में उत्पादन के एकाधिकार के मामले में सीमांत मूल्य का एक निश्चित अंश है, तो वास्तविक संकेतक का सीमांत अनुपात उत्पादन की एकाग्रता (या एकाधिकार) की डिग्री को चिह्नित कर सकता है।

संरचना में परिवर्तन या परिवर्तन के संकेतकों के वास्तविक मूल्यों के अनुपात को अधिकतम संभव के लिए संरचनात्मक बदलावों के विश्लेषण में भी उपयोग किया जाता है (अध्याय 11 देखें)।

1. जेनी के.औसत मान। - एम .: सांख्यिकी, 1970।

2. क्रिवेनकोवा एल.एन., युज़बाशेव एम.एम.भिन्नता संकेतकों के अस्तित्व का क्षेत्र और उसका अनुप्रयोग // सांख्यिकी का बुलेटिन। - 1991. - नंबर 6। - एस 66-70।

3. पास्खावर आई. एस.आंकड़ों में औसत मूल्य। - एम .: सांख्यिकी। 1979.

4. शूराकोव वी। वी।, दयातबेगोव डी। एम। और अन्य।स्वचालित कार्यस्थलसांख्यिकीय डेटा प्रोसेसिंग (अध्याय 4. प्रारंभिक सांख्यिकीय प्रसंस्करणजानकारी)। - एम .: वित्त और सांख्यिकी, 1990।

सामाजिक-आर्थिक घटनाओं और प्रक्रियाओं के अध्ययन में सबसे महत्वपूर्ण कदम प्राथमिक डेटा का व्यवस्थितकरण है और इस आधार पर, सामान्यीकरण संकेतकों का उपयोग करके संपूर्ण वस्तु की सारांश विशेषता प्राप्त करना, जो प्राथमिक सांख्यिकीय सामग्री को सारांशित और समूहित करके प्राप्त किया जाता है।

सांख्यिकीय सारांश - यह विशिष्ट एकल तथ्यों को सामान्य बनाने के लिए अनुक्रमिक संचालन का एक जटिल है जो एक पूरे के रूप में अध्ययन के तहत घटना में निहित विशिष्ट विशेषताओं और पैटर्न की पहचान करने के लिए एक सेट बनाते हैं। एक सांख्यिकीय सारांश के संचालन में निम्नलिखित चरण शामिल हैं: :

  • समूहीकरण सुविधा का विकल्प;
  • समूहों के गठन के क्रम का निर्धारण;
  • समूहों और वस्तु को समग्र रूप से चिह्नित करने के लिए सांख्यिकीय संकेतकों की एक प्रणाली का विकास;
  • सारांश परिणाम प्रस्तुत करने के लिए सांख्यिकीय तालिकाओं के लेआउट का विकास।

सांख्यिकीय समूहन अध्ययन की गई जनसंख्या की इकाइयों का कुछ विशेषताओं के अनुसार सजातीय समूहों में विभाजन कहा जाता है जो उनके लिए आवश्यक हैं। समूह सांख्यिकीय आंकड़ों को सारांशित करने की सबसे महत्वपूर्ण सांख्यिकीय पद्धति है, जो सांख्यिकीय संकेतकों की सही गणना का आधार है।

निम्नलिखित प्रकार के समूह हैं: टाइपोलॉजिकल, संरचनात्मक, विश्लेषणात्मक। ये सभी समूह इस तथ्य से एकजुट हैं कि वस्तु की इकाइयों को किसी न किसी विशेषता के अनुसार समूहों में विभाजित किया जाता है।

समूह चिन्ह वह चिन्ह कहलाता है जिसके द्वारा जनसंख्या की इकाइयों को अलग-अलग समूहों में विभाजित किया जाता है। से सही पसंदसमूहीकरण विशेषता सांख्यिकीय अध्ययन के निष्कर्षों पर निर्भर करती है। समूहीकरण के आधार के रूप में, महत्वपूर्ण, सैद्धांतिक रूप से प्रमाणित सुविधाओं (मात्रात्मक या गुणात्मक) का उपयोग करना आवश्यक है।

समूहीकरण के मात्रात्मक संकेत एक संख्यात्मक अभिव्यक्ति है (व्यापारिक मात्रा, एक व्यक्ति की आयु, पारिवारिक आय, आदि), और समूहीकरण की गुणात्मक विशेषताएं जनसंख्या इकाई की स्थिति को दर्शाते हैं (लिंग, वैवाहिक स्थिति, उद्यम की उद्योग संबद्धता, उसके स्वामित्व का रूप, आदि)।

समूहीकरण का आधार निर्धारित होने के बाद अध्ययन जनसंख्या को कितने समूहों में विभाजित किया जाए, इस प्रश्न का निर्णय किया जाना चाहिए। समूहों की संख्या अध्ययन के उद्देश्यों और समूह में अंतर्निहित संकेतक के प्रकार, जनसंख्या की मात्रा, विशेषता की भिन्नता की डिग्री पर निर्भर करती है।

उदाहरण के लिए, स्वामित्व के रूपों के अनुसार उद्यमों का समूह नगरपालिका, संघीय और संघ के विषयों की संपत्ति को ध्यान में रखता है। यदि समूहीकरण एक मात्रात्मक विशेषता के अनुसार किया जाता है, तो अध्ययन के तहत वस्तु की इकाइयों की संख्या और समूहन विशेषता के उतार-चढ़ाव की डिग्री पर विशेष ध्यान देना आवश्यक है।

जब समूहों की संख्या निर्धारित की जाती है, तो समूह अंतराल निर्धारित किया जाना चाहिए। मध्यान्तर - ये एक चर विशेषता के मूल्य हैं जो कुछ सीमाओं के भीतर हैं। प्रत्येक अंतराल का अपना मान, ऊपरी और निचली सीमाएँ, या उनमें से कम से कम एक होता है।

अंतराल की निचली सीमा अंतराल में विशेषता का सबसे छोटा मान कहलाता है, और ऊपरी सीमा - अंतराल में विशेषता का सबसे बड़ा मूल्य। अंतराल मान ऊपरी और निचली सीमाओं के बीच का अंतर है।

समूह अंतराल, उनके आकार के आधार पर, हैं: समान और असमान। यदि विशेषता की भिन्नता अपेक्षाकृत संकीर्ण सीमाओं में प्रकट होती है और वितरण समान है, तो समान अंतराल के साथ एक समूह बनाया जाता है। एक समान अंतराल का मान निम्न सूत्र द्वारा निर्धारित किया जाता है: :

जहाँ Xmax, Xmin - समुच्चय में विशेषता का अधिकतम और न्यूनतम मान; n समूहों की संख्या है।

सबसे सरल समूह, जिसमें प्रत्येक चयनित समूह को एक संकेतक द्वारा दर्शाया जाता है, एक वितरण श्रृंखला है।

सांख्यिकीय श्रृंखलावितरण - यह एक निश्चित विशेषता के अनुसार समूहों में जनसंख्या इकाइयों का एक क्रमबद्ध वितरण है। वितरण श्रृंखला के गठन में अंतर्निहित विशेषता के आधार पर, विशेषता और भिन्नता वितरण श्रृंखला को प्रतिष्ठित किया जाता है।

ठहराव वे गुणात्मक विशेषताओं के अनुसार निर्मित वितरण श्रृंखला कहते हैं, अर्थात्, ऐसे संकेत जिनकी कोई संख्यात्मक अभिव्यक्ति नहीं होती है (श्रम के प्रकार, लिंग द्वारा, पेशे से, आदि)। विशेषता वितरण श्रृंखला एक या किसी अन्य आवश्यक विशेषता के अनुसार जनसंख्या की संरचना की विशेषता है। कई अवधियों में लिया गया, ये डेटा हमें संरचना में परिवर्तन का अध्ययन करने की अनुमति देता है।

विविधता पंक्तियाँ मात्रात्मक आधार पर निर्मित वितरण श्रृंखला कहलाती है। किसी भी परिवर्तनशील श्रृंखला में दो तत्व होते हैं: रूपांतर और आवृत्तियाँ। विकल्प वेरिएशन सीरीज में जो एट्रीब्यूट लेता है, उसके अलग-अलग वैल्यूज कहलाते हैं, यानी वेरिएबल एट्रीब्यूट का स्पेसिफिक वैल्यू।

आवृत्तियों अलग-अलग प्रकार या विविधता श्रृंखला के प्रत्येक समूह की संख्या कहलाती है, यानी ये वे संख्याएं हैं जो दर्शाती हैं कि वितरण श्रृंखला में कितनी बार कुछ प्रकार होते हैं। सभी आवृत्तियों का योग संपूर्ण जनसंख्या का आकार, उसका आयतन निर्धारित करता है। आवृत्तियों आवृत्तियों को एक इकाई के अंशों में या कुल के प्रतिशत के रूप में व्यक्त किया जाता है। तदनुसार, आवृत्तियों का योग 1 या 100% के बराबर है।

विशेषता की भिन्नता की प्रकृति के आधार पर, भिन्नता श्रृंखला के तीन रूपों को प्रतिष्ठित किया जाता है: एक क्रमबद्ध श्रृंखला, एक असतत श्रृंखला और एक अंतराल श्रृंखला।

रैंक की गई विविधता श्रृंखला - यह अध्ययन के तहत विशेषता के आरोही या अवरोही क्रम में जनसंख्या की व्यक्तिगत इकाइयों का वितरण है। रैंकिंग मात्रात्मक डेटा को समूहों में विभाजित करना आसान बनाता है, तुरंत एक विशेषता के सबसे छोटे और सबसे बड़े मूल्यों का पता लगाता है, उन मूल्यों को उजागर करता है जो सबसे अधिक बार दोहराए जाते हैं।

असतत भिन्नता श्रृंखला एक असतत विशेषता के अनुसार जनसंख्या इकाइयों के वितरण की विशेषता है जो केवल पूर्णांक मान लेता है। उदाहरण के लिए, टैरिफ श्रेणी, परिवार में बच्चों की संख्या, उद्यम में कर्मचारियों की संख्या आदि।

यदि किसी संकेत में निरंतर परिवर्तन होता है, जो कुछ सीमाओं के भीतर किसी भी मान ("से - से") पर ले जा सकता है, तो इस संकेत के लिए आपको निर्माण करने की आवश्यकता है अंतराल भिन्नता श्रृंखला . उदाहरण के लिए, आय की राशि, कार्य अनुभव, उद्यम की अचल संपत्तियों की लागत आदि।

"सांख्यिकीय सारांश और समूहीकरण" विषय पर समस्याओं को हल करने के उदाहरण

कार्य 1 . पिछले शैक्षणिक वर्ष के लिए सदस्यता द्वारा छात्रों को प्राप्त पुस्तकों की संख्या के बारे में जानकारी है।

श्रृंखला के तत्वों को दर्शाते हुए एक विस्तृत और असतत परिवर्तनशील वितरण श्रृंखला बनाएं।

समाधान

यह सेट छात्रों को प्राप्त होने वाली पुस्तकों की संख्या के लिए विकल्पों का एक सेट है। आइए हम ऐसे प्रकारों की संख्या गिनें और उन्हें एक भिन्न श्रेणीबद्ध और परिवर्तनशील असतत वितरण श्रृंखला के रूप में व्यवस्थित करें।

टास्क 2 . 50 उद्यमों, हजार रूबल के लिए अचल संपत्तियों के मूल्य पर डेटा है।

उद्यमों के 5 समूहों (समान अंतराल पर) को हाइलाइट करते हुए एक वितरण श्रृंखला बनाएं।

समाधान

समाधान के लिए, हम उद्यमों की अचल संपत्तियों की लागत का सबसे बड़ा और सबसे छोटा मूल्य चुनते हैं। ये 30.0 और 10.2 हजार रूबल हैं।

अंतराल का आकार ज्ञात करें: ज \u003d (30.0-10.2): 5 \u003d 3.96 हजार रूबल।

फिर पहले समूह में उद्यम शामिल होंगे, जिनकी अचल संपत्ति की राशि 10.2 हजार रूबल से है। 10.2 + 3.96 = 14.16 हजार रूबल तक। ऐसे 9 उद्यम होंगे दूसरे समूह में उद्यम शामिल होंगे, जिनकी अचल संपत्तियों की राशि 14.16 हजार रूबल से होगी। 14.16 + 3.96 = 18.12 हजार रूबल तक। ऐसे 16 उद्यम होंगे। इसी तरह, हम तीसरे, चौथे और पांचवें समूहों में शामिल उद्यमों की संख्या पाते हैं।

परिणामी वितरण श्रृंखला को तालिका में रखा गया है।

टास्क 3 . कई उद्यमों के लिए प्रकाश उद्योगनिम्नलिखित डेटा प्राप्त किया:

श्रमिकों की संख्या के अनुसार उद्यमों का एक समूह बनाना, समान अंतराल पर 6 समूह बनाना। प्रत्येक समूह के लिए गणना करें:

1. उद्यमों की संख्या
2. श्रमिकों की संख्या
3. प्रति वर्ष निर्मित उत्पादों की मात्रा
4. प्रति कार्यकर्ता औसत वास्तविक उत्पादन
5. अचल संपत्तियों की राशि
6. एक उद्यम की अचल संपत्तियों का औसत आकार
7. एक उद्यम द्वारा निर्मित उत्पादों का औसत मूल्य

गणना के परिणामों को तालिकाओं में रिकॉर्ड करें। अपने निष्कर्ष निकालें।

समाधान

समाधान के लिए, हम उद्यम में श्रमिकों की औसत संख्या का सबसे बड़ा और सबसे छोटा मान चुनते हैं। ये 43 और 256 हैं।

अंतराल का आकार ज्ञात कीजिए: h = (256-43): 6 = 35.5

फिर पहले समूह में 43 से 43 + 35.5 = 78.5 लोगों की औसत संख्या वाले उद्यम शामिल होंगे। ऐसे 5 उद्यम होंगे।दूसरे समूह में उद्यम शामिल होंगे, जिसमें श्रमिकों की औसत संख्या 78.5 से 78.5 + 35.5 = 114 लोग होंगे। ऐसे 12 उद्यम होंगे। इसी तरह, हम तीसरे, चौथे, पांचवें और छठे समूहों में शामिल उद्यमों की संख्या पाते हैं।

हम परिणामी वितरण श्रृंखला को एक तालिका में रखते हैं और प्रत्येक समूह के लिए आवश्यक संकेतकों की गणना करते हैं:

निष्कर्ष : जैसा कि तालिका से देखा जा सकता है, उद्यमों का दूसरा समूह सबसे अधिक है। इसमें 12 उद्यम शामिल हैं। सबसे छोटा पाँचवाँ और छठा समूह है (प्रत्येक में दो उद्यम)। ये सबसे बड़े उद्यम हैं (श्रमिकों की संख्या के मामले में)।

चूंकि दूसरा समूह सबसे अधिक है, इस समूह के उद्यमों द्वारा प्रति वर्ष उत्पादन की मात्रा और अचल संपत्तियों की मात्रा दूसरों की तुलना में बहुत अधिक है। इसी समय, इस समूह के उद्यमों में एक कर्मचारी का औसत वास्तविक उत्पादन उच्चतम नहीं है। चौथे समूह के उद्यम यहां अग्रणी हैं। यह समूह काफी बड़ी मात्रा में अचल संपत्तियों के लिए भी जिम्मेदार है।

निष्कर्ष में, हम ध्यान दें कि अचल संपत्तियों का औसत आकार और एक उद्यम के उत्पादन का औसत मूल्य सीधे उद्यम के आकार (श्रमिकों की संख्या के संदर्भ में) के समानुपाती होता है।

भिन्नता के सांख्यिकीय अध्ययन में पहला कदम एक भिन्नता श्रृंखला का निर्माण है - एक विशेषता के बढ़ते (अधिक बार) या घटते (कम अक्सर) मूल्यों के अनुसार जनसंख्या इकाइयों का एक क्रमबद्ध वितरण और एक के साथ इकाइयों की संख्या की गणना करना या विशेषता का एक और मूल्य।

विविधता श्रृंखला के तीन रूप हैं: श्रेणीबद्ध, असतत, अंतराल। एक परिवर्तनशील श्रृंखला को अक्सर वितरण श्रृंखला कहा जाता है। मात्रात्मक और गैर-मात्रात्मक दोनों लक्षणों की भिन्नता का अध्ययन करते समय इस शब्द का उपयोग किया जाता है। वितरण श्रृंखला एक संरचनात्मक समूह है (अध्याय 6)।

एक क्रमबद्ध श्रृंखला अध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है।

निम्नलिखित के बारे में जानकारी है: बड़े बैंकपीटर्सबर्ग, इक्विटी पूंजी द्वारा 01.10.1999 . के रूप में रैंक किया गया

बैंक का नाम इक्विटी पूंजी, मिलियन रूबल बाल्टोनेक्सिम बैंक 169

बैंक सेंट पीटर्सबर्ग 237

पेत्रोव्स्की 268

बाल्टिक 290

प्रोमस्ट्रॉयबैंक 1007

यदि जनसंख्या इकाइयों की संख्या काफी बड़ी है, तो रैंक की गई श्रृंखला बोझिल हो जाती है, और इसके निर्माण में, यहां तक ​​​​कि कंप्यूटर की मदद से भी, एक लंबा समय लगता है। ऐसे मामलों में, अध्ययन के तहत विशेषता के मूल्यों के अनुसार जनसंख्या की इकाइयों को समूहीकृत करके भिन्नता श्रृंखला का निर्माण किया जाता है।


समूहों की संख्या का निर्धारण

असतत भिन्नता श्रृंखला में समूहों की संख्या चर विशेषता के वास्तव में मौजूदा मूल्यों की संख्या से निर्धारित होती है। यदि विशेषता असतत मान लेती है, लेकिन उनकी संख्या बहुत बड़ी है (उदाहरण के लिए, विभिन्न कृषि उद्यमों में वर्ष के 1 जनवरी को पशुधन की संख्या शून्य से लेकर दसियों हज़ार सिर तक हो सकती है), तो एक अंतराल भिन्नता श्रृंखला बनाई जाती है . एक अंतराल भिन्नता श्रृंखला का निर्माण उन विशेषताओं का अध्ययन करने के लिए भी किया जाता है जो पूर्णांक और भिन्नात्मक मान दोनों में ले सकते हैं

इसके अस्तित्व के क्षेत्र। उदाहरण के लिए, बेचे गए उत्पादों की लाभप्रदता, उत्पादन की एक इकाई की लागत, प्रति शहर निवासी आय, विभिन्न क्षेत्रों की आबादी के बीच उच्च शिक्षा वाले लोगों का अनुपात, और सामान्य तौर पर सभी माध्यमिक विशेषताओं, मूल्य हैं जिनमें से एक प्राथमिक विशेषता के मूल्य को दूसरे के मूल्य से विभाजित करके गणना की जाती है (अध्याय 3 देखें)।

अंतराल भिन्नता श्रृंखला दो स्तंभों (या पंक्तियों) से युक्त एक तालिका है - विशेषता के अंतराल, जिसकी भिन्नता का अध्ययन किया जा रहा है, और इस अंतराल (आवृत्तियों) में आने वाली जनसंख्या की इकाइयों की संख्या, या का अनुपात कुल जनसंख्या (आवृत्तियों) से यह संख्या।

दो प्रकार के अंतराल भिन्नता श्रृंखला का सबसे अधिक उपयोग किया जाता है: समान-अंतराल और समान-आवृत्ति। समान-अंतराल श्रृंखला का उपयोग किया जाता है यदि विशेषता की भिन्नता बहुत मजबूत नहीं है, अर्थात। एक सजातीय आबादी के लिए, जिसका वितरण किसी दिए गए गुण के अनुसार सामान्य कानून के करीब है। (ऐसी श्रृंखला तालिका 5.6 में प्रस्तुत की गई है।) एक समान आवृत्ति श्रृंखला का उपयोग किया जाता है यदि विशेषता भिन्नता बहुत मजबूत है, लेकिन वितरण सामान्य नहीं है, लेकिन, उदाहरण के लिए, अतिशयोक्तिपूर्ण (तालिका 5.5)।

एक समान-अंतराल श्रृंखला का निर्माण करते समय, समूहों की संख्या को चुना जाता है ताकि समुच्चय में विशेषता मूल्यों की विविधता पर्याप्त रूप से परिलक्षित हो और साथ ही, वितरण की नियमितता, इसका आकार यादृच्छिक रूप से विकृत न हो आवृत्ति में उतार-चढ़ाव। यदि बहुत कम समूह हैं, तो भिन्नता का कोई पैटर्न नहीं होगा; यदि बहुत अधिक समूह हैं, तो यादृच्छिक आवृत्ति छलांग वितरण के आकार को विकृत कर देगी।



अंतराल की सीमाओं को अलग-अलग तरीकों से निर्दिष्ट किया जा सकता है: पिछले अंतराल की ऊपरी सीमा अगले की निचली सीमा को दोहराती है, जैसा कि तालिका में दिखाया गया है। 5.5, या दोहराना नहीं है।

बाद के मामले में, दूसरा अंतराल 15.1-20, तीसरा - 20.1-25, आदि के रूप में नामित किया जाएगा, अर्थात। यह माना जाता है कि सभी उपज मूल्यों को आवश्यक रूप से एक दसवें तक गोल किया जाता है। इसके अलावा, अंतराल 15.1-20 के मध्य के साथ एक अवांछनीय जटिलता उत्पन्न होती है, जो कड़ाई से बोलते हुए, पहले से ही 17.5 के बराबर नहीं, बल्कि 17.55 के बराबर होगी; तदनुसार, जब गोल अंतराल 40-60 को 40.1-60 के साथ प्रतिस्थापित किया जाता है, तो इसके मध्य 50 के गोल मान के बजाय, हमें 50.5 मिलता है। इसलिए, अंतरालों को दोहराई जाने वाली गोल सीमा के साथ छोड़ना बेहतर है और सहमत हैं कि जनसंख्या इकाइयाँ जिनका अंतराल सीमा के बराबर एक विशिष्ट मान है, उस अंतराल में शामिल हैं जहाँ यह सटीक मान पहली बार रिपोर्ट किया गया है। इस प्रकार 15 सेंटीमीटर प्रति हेक्टेयर उपज वाला खेत पहले समूह में शामिल है, मूल्य 20 सेंटीमीटर प्रति हेक्टेयर है

दूसरे में, आदि।

एक समान-आवृत्ति भिन्नता श्रृंखला एक विशेषता के बहुत मजबूत भिन्नता के साथ आवश्यक है, क्योंकि समान-अंतराल वितरण के साथ, अधिकांश जनसंख्या इकाइयाँ निकल जाती हैं


तालिका 5.5

01.01.2000 के अनुसार संपत्ति के शेष मूल्यांकन के अनुसार 100 रूसी बैंकों का वितरण


समान वितरण के लिए अंतराल की सीमाएं बैंकों पर पहले, दसवें, ग्यारहवें, बीसवें आदि की संपत्ति के वास्तविक मूल्य हैं।

विविधता श्रृंखला का ग्राफिक प्रतिनिधित्व

परिवर्तनशील श्रृंखला और उसके गुणों के विश्लेषण में महत्वपूर्ण सहायता एक चित्रमय प्रतिनिधित्व द्वारा प्रदान की जाती है। अंतराल श्रृंखला को एक बार ग्राफ द्वारा दर्शाया जाता है, जिसमें एब्सिस्सा अक्ष पर स्थित सलाखों के आधार अलग-अलग विशेषता के मूल्यों के अंतराल होते हैं, और सलाखों की ऊंचाई पैमाने के अनुरूप आवृत्तियां होती हैं वाई-अक्ष। अनाज की फसल की पैदावार के संदर्भ में क्षेत्र में खेतों के वितरण का एक ग्राफिक प्रतिनिधित्व अंजीर में दिखाया गया है।

5.1. इस प्रकार के आरेख को अक्सर हिस्टोग्राम (जीआर हिस्टोस - ऊतक) कहा जाता है।

तालिका डेटा। 5.6 और अंजीर। 5.1 कई लक्षणों के वितरण विशेषता का रूप दिखाते हैं: विशेषता के औसत अंतराल के मूल्य अधिक सामान्य होते हैं, कम अक्सर विशेषता के चरम, छोटे और बड़े मूल्य। इस वितरण का रूप गणितीय आँकड़ों के दौरान माना जाने वाले सामान्य वितरण के कानून के करीब है। महान रूसी गणितज्ञ ए.एम. ल्यपुनोव (1857-1918) ने साबित किया कि सामान्य

तालिका 5.6 अनाज की फसल की उपज द्वारा क्षेत्र में खेतों का वितरण


एक छोटा वितरण तब बनता है जब एक चर बड़ी संख्या में कारकों से प्रभावित होता है, जिनमें से किसी का भी प्रमुख प्रभाव नहीं होता है। अनाज फसलों की उपज विविधताओं को प्रभावित करने वाले कई लगभग समान कारकों का एक यादृच्छिक संयोजन, दोनों प्राकृतिक और कृषि तकनीकी, आर्थिक, सामान्य वितरण कानून के करीब उपज द्वारा क्षेत्र के खेतों का वितरण बनाता है।


चावल। 5.2. द्वारा खेतों का संचयी और तोरण वितरण

उत्पादकता

ऐसी श्रृंखला को संचयी कहा जाता है। आप संचयी वितरण "से कम नहीं" बना सकते हैं, या आप कर सकते हैं

"इससे अधिक"। पहले मामले में, संचयी वितरण के ग्राफ को संचयी कहा जाता है, दूसरे में - तोरण (चित्र। 5.2)।

वितरण घनत्व

यदि आपको असमान अंतरालों वाली एक परिवर्तनशील श्रृंखला से निपटना है, तो तुलनात्मकता के लिए आपको अंतराल की इकाई में आवृत्ति, या आवृत्ति लाने की आवश्यकता है। परिणामी अनुपात को वितरण घनत्व कहा जाता है:


वितरण घनत्व का उपयोग सामान्यीकरण संकेतकों की गणना के लिए और असमान अंतराल के साथ भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए किया जाता है।

उन्हें वितरण श्रृंखला के रूप में प्रस्तुत किया जाता है और प्रारूपित किया जाता है।

एक वितरण श्रृंखला एक प्रकार का समूहन है।

वितरण रेंज- एक निश्चित भिन्न विशेषता के अनुसार समूहों में अध्ययन की गई आबादी की इकाइयों के क्रमबद्ध वितरण का प्रतिनिधित्व करता है।

एक वितरण श्रृंखला के गठन में अंतर्निहित विशेषता के आधार पर, वहाँ हैं गुणकारी और परिवर्तनशीलवितरण रैंक:

  • ठहराव- गुणात्मक आधार पर निर्मित वितरण श्रृंखला को बुलाओ।
  • मात्रात्मक विशेषता के मूल्यों के आरोही या अवरोही क्रम में निर्मित वितरण श्रृंखला कहलाती है परिवर्तन संबंधी.
वितरण की विविधता श्रृंखला में दो कॉलम होते हैं:

पहले कॉलम में चर विशेषता के मात्रात्मक मान होते हैं, जिन्हें कहा जाता है विकल्पऔर अंकित हैं। असतत संस्करण - एक पूर्णांक के रूप में व्यक्त किया गया। अंतराल विकल्प से और तक की सीमा में है। प्रकार के प्रकार के आधार पर, एक असतत या अंतराल परिवर्तनशील श्रृंखला का निर्माण संभव है।
दूसरे कॉलम में शामिल हैं विशिष्ट विकल्प की संख्या, आवृत्तियों या आवृत्तियों के संदर्भ में व्यक्त किया गया:

आवृत्तियों- ये है निरपेक्ष संख्या, यह दर्शाता है कि सुविधा का दिया गया मान कितनी बार होता है, जो दर्शाता है। सभी आवृत्तियों का योग संपूर्ण जनसंख्या की इकाइयों की संख्या के बराबर होना चाहिए।

आवृत्तियों() कुल के प्रतिशत के रूप में व्यक्त की जाने वाली आवृत्तियाँ हैं। प्रतिशत के रूप में व्यक्त सभी आवृत्तियों का योग एक के अंशों में 100% के बराबर होना चाहिए।

वितरण श्रृंखला का चित्रमय प्रतिनिधित्व

ग्राफिक छवियों का उपयोग करके वितरण श्रृंखला की कल्पना की जाती है।

वितरण श्रृंखला को इस प्रकार प्रदर्शित किया जाता है:
  • बहुभुज
  • हिस्टोग्राम
  • संचयी
  • तोरण

बहुभुज

बहुभुज का निर्माण करते समय, क्षैतिज अक्ष (एब्सिस्सा) पर चर विशेषता के मान प्लॉट किए जाते हैं, और ऊर्ध्वाधर अक्ष (ऑर्डिनेट) पर - आवृत्तियाँ या आवृत्तियाँ।

अंजीर में बहुभुज। 6.1 1994 में रूस की जनसंख्या की सूक्ष्म जनगणना के अनुसार बनाया गया था।

6.1. आकार के अनुसार घरों का वितरण

स्थि‍ति: टैरिफ श्रेणियों द्वारा उद्यमों में से एक के 25 कर्मचारियों के वितरण पर डेटा दिया गया है:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
एक कार्य: एक असतत परिवर्तनशील श्रृंखला बनाएं और इसे एक वितरण बहुभुज के रूप में आलेखीय रूप से चित्रित करें।
समाधान:
इस उदाहरण में, विकल्प कर्मचारी की मजदूरी श्रेणी है। आवृत्तियों को निर्धारित करने के लिए, उपयुक्त वेतन श्रेणी वाले कर्मचारियों की संख्या की गणना करना आवश्यक है।

बहुभुज का उपयोग असतत भिन्नता श्रृंखला के लिए किया जाता है।

एब्सिस्सा (एक्स) के साथ एक वितरण बहुभुज (छवि 1) बनाने के लिए, हम अलग-अलग विशेषता के मात्रात्मक मूल्यों को प्लॉट करते हैं - वेरिएंट, और ऑर्डिनेट - आवृत्तियों या आवृत्तियों के साथ।

यदि अभिलक्षणिक मानों को अंतराल के रूप में व्यक्त किया जाता है, तो ऐसी श्रृंखला को अंतराल श्रृंखला कहा जाता है।
अंतराल श्रृंखलावितरणों को चित्रमय रूप से हिस्टोग्राम, संचयी या तोरण के रूप में दिखाया जाता है।

सांख्यिकीय तालिका

स्थि‍ति: जमाराशियों के आकार पर डेटा 20 दिया गया है व्यक्तियोंएक बैंक में (हजार रूबल) 60; 25; 12; दस; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; अठारह; 7; 42.
एक कार्य: समान अंतरालों वाली एक अंतराल भिन्नता श्रृंखला बनाएं।
समाधान:

  1. प्रारंभिक जनसंख्या में 20 इकाइयाँ (N = 20) हैं।
  2. स्टर्गेस सूत्र का उपयोग करते हुए, हम परिभाषित करते हैं आवश्यक राशिप्रयुक्त समूह: n=1+3.322*lg20=5
  3. आइए बराबर अंतराल के मान की गणना करें: i=(152 - 2) /5 = 30 हजार रूबल
  4. हम प्रारंभिक आबादी को 30 हजार रूबल के अंतराल के साथ 5 समूहों में विभाजित करते हैं।
  5. समूहीकरण के परिणाम तालिका में प्रस्तुत किए गए हैं:

एक सतत विशेषता की ऐसी रिकॉर्डिंग के साथ, जब एक ही मान दो बार होता है (एक अंतराल की ऊपरी सीमा और दूसरे अंतराल की निचली सीमा के रूप में), तो यह मान उस समूह से संबंधित होता है जहां यह मान ऊपरी सीमा के रूप में कार्य करता है।

बार चार्ट

भुज के साथ एक हिस्टोग्राम बनाने के लिए, अंतराल की सीमाओं के मूल्यों को इंगित करें और उनके आधार पर आयतों का निर्माण करें जिनकी ऊंचाई आवृत्तियों (या आवृत्तियों) के समानुपाती होती है।

अंजीर पर। 6.2. 1997 में आयु समूहों द्वारा रूस की जनसंख्या के वितरण का हिस्टोग्राम दिखाया गया है।

चावल। 6.2. आयु समूहों द्वारा रूस की जनसंख्या का वितरण

स्थि‍ति: कंपनी के 30 कर्मचारियों को मासिक वेतन के आकार के अनुसार वितरण दिया जाता है

एक कार्य: अंतराल भिन्नता श्रृंखला को हिस्टोग्राम के रूप में ग्राफिक रूप से प्रदर्शित करें और संचयी करें।
समाधान:

  1. खुले (पहले) अंतराल की अज्ञात सीमा दूसरे अंतराल के मूल्य से निर्धारित होती है: 7000 - 5000 = 2000 रूबल। उसी मूल्य के साथ, हम पहले अंतराल की निचली सीमा पाते हैं: 5000 - 2000 = 3000 रूबल।
  2. एक आयताकार समन्वय प्रणाली में एक हिस्टोग्राम का निर्माण करने के लिए, एब्सिस्सा अक्ष के साथ, हम उन खंडों को अलग करते हैं जिनके मान भिन्न पंक्ति के अंतराल के अनुरूप होते हैं।
    ये खंड निचले आधार के रूप में कार्य करते हैं, और संबंधित आवृत्ति (आवृत्ति) गठित आयतों की ऊंचाई के रूप में कार्य करती है।
  3. आइए एक हिस्टोग्राम बनाएं:

संचयी के निर्माण के लिए, संचित आवृत्तियों (आवृत्तियों) की गणना करना आवश्यक है। वे पिछले अंतरालों की आवृत्तियों (आवृत्तियों) के क्रमिक योग द्वारा निर्धारित किए जाते हैं और एस द्वारा निरूपित होते हैं। संचित आवृत्तियों से पता चलता है कि जनसंख्या की कितनी इकाइयों का एक विशेषता मान विचाराधीन से अधिक नहीं है।

संचयी

संचित आवृत्तियों (आवृत्तियों) के अनुसार एक परिवर्तनशील श्रृंखला में एक विशेषता के वितरण को संचयी का उपयोग करके दर्शाया गया है।

संचयीया संचयी वक्र, बहुभुज के विपरीत, संचित आवृत्तियों या आवृत्तियों पर निर्मित होता है। इसी समय, फीचर के मूल्यों को एब्सिस्सा अक्ष पर रखा जाता है, और संचित आवृत्तियों या आवृत्तियों को ऑर्डिनेट अक्ष (चित्र। 6.3) पर रखा जाता है।

चावल। 6.3. आकार के अनुसार घरों का संचयी वितरण

4. संचित आवृत्तियों की गणना करें:
पहले अंतराल की घुटने की आवृत्ति की गणना निम्नानुसार की जाती है: 0 + 4 = 4, दूसरे के लिए: 4 + 12 = 16; तीसरे के लिए: 4 + 12 + 8 = 24, आदि।

संचयी का निर्माण करते समय, संबंधित अंतराल की संचित आवृत्ति (आवृत्ति) को इसकी ऊपरी सीमा को सौंपा जाता है:

ओगिवा

ओगिवासंचयी के समान ही इस अंतर के साथ बनाया गया है कि संचित आवृत्तियों को एब्सिस्सा अक्ष पर रखा जाता है, और सुविधा मान को ऑर्डिनेट अक्ष पर रखा जाता है।

संचयी का एक रूपांतर सांद्रता वक्र या लोरेंज प्लॉट है। एकाग्रता वक्र को प्लॉट करने के लिए, आयताकार समन्वय प्रणाली के दोनों अक्षों को 0 से 100 के प्रतिशत के रूप में बढ़ाया जाता है। इस मामले में, एब्सिस्सा कुल्हाड़ियों संचित आवृत्तियों को इंगित करती हैं, और कोर्डिनेट कुल्हाड़ियों शेयर के संचित मूल्यों को दर्शाती हैं (में) प्रतिशत) सुविधा की मात्रा से।

चिन्ह का एकसमान वितरण ग्राफ पर वर्ग के विकर्ण से मेल खाता है (चित्र 6.4)। असमान वितरण के साथ, ग्राफ एक अवतल वक्र है जो विशेषता के एकाग्रता स्तर पर निर्भर करता है।

6.4. एकाग्रता वक्र
दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...