वितरण रैंक। रैंक, अंतराल और संचयी श्रृंखला का निर्माण

एक परिवर्तनशील श्रृंखला एक निश्चित क्रम में प्रत्येक सांख्यिकीय इकाई की एक विशेषता के मूल्यों की व्यवस्था है। इस मामले में, किसी विशेषता के अलग-अलग मूल्यों को आमतौर पर एक प्रकार (संस्करण) कहा जाता है। . विविधता श्रृंखला (संस्करण) के प्रत्येक सदस्य को एक क्रमिक आँकड़ा कहा जाता है, और विविधताओं की संख्या को आँकड़ों का रैंक (क्रम) कहा जाता है।

परिवर्तनशील श्रृंखला की सबसे महत्वपूर्ण विशेषताएं इसके चरम रूपांतर (X 1 =Xmin; X n =Xmax) और भिन्नता की सीमा (Rx = Xn - X 1) हैं।

इसके परिणामस्वरूप प्राप्त सांख्यिकीय जानकारी के प्राथमिक प्रसंस्करण में विविधता श्रृंखला का व्यापक रूप से उपयोग किया जाता है सांख्यिकीय अवलोकन. वे सांख्यिकीय आबादी में सांख्यिकीय इकाइयों के एक अनुभवजन्य वितरण समारोह के निर्माण के लिए एक आधार के रूप में कार्य करते हैं। इसलिए, परिवर्तनशील श्रृंखला कहलाती है वितरण की पंक्तियाँ.

आँकड़ों में, वह निम्न प्रकार की परिवर्तनशील श्रृंखलाओं को अलग करता है: रैंक, असतत, अंतराल।

रैंक (लैटिन रंग - रैंक से) श्रृंखला- यह सांख्यिकीय जनसंख्या की इकाइयों के वितरण की एक श्रृंखला है, जिसमें विशेषता के रूप आरोही या अवरोही क्रम में हैं। किसी भी रैंक की गई श्रृंखला में रैंकिंग नंबर (1 से n) और उनके संबंधित संस्करण होते हैं। एक आवश्यक विशेषता के अनुसार गठित एक क्रमबद्ध श्रृंखला में विकल्पों की संख्या आमतौर पर सांख्यिकीय आबादी में इकाइयों की संख्या के बराबर होती है।

किसी दी गई विशेषता के अनुसार एक क्रमबद्ध श्रृंखला बनाने के लिए (उदाहरण के लिए, 100 कृषि उद्यमों में पशुधन श्रमिकों की संख्या से), आप लेआउट तालिका का उपयोग कर सकते हैं। 5.1.

टी ए बी एल ई 5.1। एक क्रमबद्ध श्रृंखला के गठन का क्रम

काम का अंत -

यह विषय संबंधित है:

आंकड़े

और बेलारूस गणराज्य का भोजन .. शिक्षा, विज्ञान और कार्मिक विभाग ..

अगर आपको चाहिये अतिरिक्त सामग्रीइस विषय पर, या आपको वह नहीं मिला जिसकी आप तलाश कर रहे थे, हम अपने काम के डेटाबेस में खोज का उपयोग करने की सलाह देते हैं:

प्राप्त सामग्री का हम क्या करेंगे:

यदि यह सामग्री आपके लिए उपयोगी साबित हुई, तो आप इसे सामाजिक नेटवर्क पर अपने पेज पर सहेज सकते हैं:

इस खंड के सभी विषय:

शुंडलोव बी.एम.
सांख्यिकी का सामान्य सिद्धांत। ट्यूटोरियलउच्च कृषि शिक्षण संस्थानों की आर्थिक विशिष्टताओं के लिए। के साथ अध्ययन गाइड

सांख्यिकी का विषय
शब्द "सांख्यिकी" लैटिन "स्थिति" (स्थिति) से आया है, जिसका अर्थ है राज्य, मामलों की स्थिति। इससे सैद्धांतिक संज्ञानात्मक सार पर जोर देना संभव हो जाता है

सांख्यिकीय अवलोकन का सार
कोई भी सांख्यिकीय अनुसंधान, जैसा कि ऊपर उल्लेख किया गया है (विषय 1), हमेशा सांख्यिकीय आबादी की प्रत्येक इकाई के बारे में प्राथमिक (प्रारंभिक) जानकारी के संग्रह से शुरू होता है। हालांकि, हर कोई नहीं

सांख्यिकीय निगरानी कार्यक्रम
पहले अध्याय में, इस तथ्य पर ध्यान आकर्षित किया गया था कि प्रत्येक सांख्यिकीय इकाई, समग्र रूप से एक वस्तु के रूप में, कई अलग-अलग गुण, गुण, विशिष्ट विशेषताएं होती हैं, जिन्हें आमतौर पर कहा जाता है

अवलोकन प्रक्रिया के दौरान दर्ज की गई विशेषताओं की सूची को आमतौर पर सांख्यिकीय अवलोकन का कार्यक्रम कहा जाता है।
कार्यक्रम विकास सांख्यिकीय अवलोकन के सबसे महत्वपूर्ण सैद्धांतिक और व्यावहारिक मुद्दों में से एक है। कार्यक्रम की गुणवत्ता काफी हद तक गुणवत्ता निर्धारित करती है एकत्रित सामग्री, इसकी विश्वसनीयता और

सांख्यिकीय अवलोकन के रूप
सांख्यिकीय टिप्पणियों की पूरी विविधता दो रूपों में घट जाती है: सांख्यिकीय रिपोर्टिंग और विशेष रूप से संगठित सांख्यिकीय अवलोकन। सांख्यिकीय रिपोर्टिंग

सांख्यिकीय रूप
सांख्यिकीय रूप एक बैंक है जिसमें सांख्यिकीय सर्वेक्षण कार्यक्रम के प्रश्न और उनके उत्तर देने का स्थान होता है। प्रपत्र परिणाम के रूप में प्राप्त सांख्यिकीय जानकारी का वाहक है

सांख्यिकीय अवलोकन के प्रकार
सांख्यिकीय अवलोकनों को प्रकारों में वर्गीकृत किया जाता है, जो विभिन्न सिद्धांतों के अनुसार भिन्न हो सकते हैं। तो, अध्ययन के तहत वस्तु के कवरेज की डिग्री के आधार पर, सांख्यिकीय अवलोकन उप-विभाजित कर सकते हैं

सांख्यिकीय अवलोकन करने के तरीके
सांख्यिकीय अवलोकन विभिन्न तरीकों से किए जा सकते हैं, जिनमें से अक्सर निम्नलिखित पाए जाते हैं: रिपोर्टिंग, अभियान, स्व-गणना, स्व-पंजीकरण, प्रश्नावली, संवाददाता।

सांख्यिकीय टिप्पणियों का स्थान, तिथियां और अवधि
किसी भी सांख्यिकीय प्रेक्षण की योजना में इस प्रेक्षण के स्थान को स्पष्ट रूप से परिभाषित किया जाना चाहिए, अर्थात्। वह स्थान जहाँ एकत्रित जानकारी दर्ज की जाती है, सांख्यिकीय रूप से भरी जाती है

सांख्यिकीय अवलोकन की त्रुटियां और उनका मुकाबला करने के उपाय
सांख्यिकीय अवलोकन के परिणामों के लिए सबसे महत्वपूर्ण आवश्यकताओं में से एक उनकी सटीकता है, जिसे सांख्यिकीय ज्ञान की अनुरूपता के माप के रूप में समझा जाता है,

प्राथमिक सांख्यिकीय सारांश
सांख्यिकीय अवलोकन के परिणामों में जनसंख्या या वस्तु की प्रत्येक इकाई के बारे में बहुमुखी जानकारी होती है और आमतौर पर अव्यवस्थित होती है। यह स्रोत सामग्री पहले आवश्यक है

सापेक्ष सांख्यिकीय संकेतकों का सार और महत्व
सापेक्ष स्कोर हैं आंकड़े, विशेषता के निरपेक्ष मूल्यों के मात्रात्मक अनुपात के माप को व्यक्त करना और घटनाओं और प्रक्रियाओं के सापेक्ष आकार को प्रदर्शित करना। हे

सापेक्ष संकेतकों के प्रकार। गतिकी के सापेक्ष संकेतक
सापेक्ष मूल्यों की सहायता से हल किए गए कार्यों के आधार पर, निम्न प्रकार के सापेक्ष संकेतक प्रतिष्ठित हैं: गतिशीलता, संरचना, समन्वय, तीव्रता, तुलना, आदेश पूर्ति,

संरचना के सापेक्ष संकेतक
सभी घटनाओं की सबसे महत्वपूर्ण विशेषताओं में से एक उनकी जटिलता है। आसुत जल का एक अणु भी हाइड्रोजन और ऑक्सीजन परमाणुओं से बना होता है। प्रकृति, समाज, मानव की कई घटनाएं

समन्वय के सापेक्ष संकेतक
समन्वय के सापेक्ष संकेतक एक दूसरे के लिए पूर्ण आकार के अनुपात हैं घटक भागकुछ निरपेक्ष रूप में। इन संकेतकों की गणना करने के लिए, घटकों में से एक

सापेक्ष तीव्रता संकेतक
तीव्रता (डिग्री) के सापेक्ष संकेतक दो गुणात्मक रूप से भिन्न, लेकिन सांख्यिकीय स्कूप में परस्पर संबंधित विशेषताओं के पूर्ण आकार का अनुपात हैं

सापेक्ष तुलना संकेतक
तुलना (तुलना) के सापेक्ष संकेतक एक ही नाम के अनुपात से प्राप्त होते हैं निरपेक्ष संकेतकविभिन्न सांख्यिकीय इकाइयों से संबंधित, क्योंकि

सापेक्ष आदेश पूर्ति दर
एक आदेश (कार्य, योजना) के सापेक्ष प्रदर्शन संकेतक एक निश्चित अवधि के लिए या के रूप में पूर्ण, वास्तव में प्राप्त संकेतकों का अनुपात हैं

आर्थिक विकास के स्तर के सापेक्ष संकेतक
स्तर के सापेक्ष संकेतक आर्थिक विकासदो गुणात्मक रूप से भिन्न (विपरीत), लेकिन परस्पर जुड़ी विशेषताओं के निरपेक्ष आकारों का अनुपात कहा जाता है। एक ही समय पर

चित्रमय विधि का सार और अर्थ
सांख्यिकीय टिप्पणियों के परिणामस्वरूप प्राप्त निरपेक्ष सांख्यिकीय संकेतक, और इस आधार पर गणना की गई विभिन्न सापेक्ष प्रदर्शनबेहतर, गहरा, अधिक सुलभ हो सकता है

निर्देशांक आरेखों के निर्माण के लिए बुनियादी आवश्यकताएं
सबसे आम और सुविधाजनक तरीका ग्राफिक छविगतिकी के निरपेक्ष और सापेक्ष संकेतक, तुलना के संकेतक, आदि, एक समन्वय आरेख पर विचार किया जाता है।

गतिशीलता और संरचना के संकेतकों के ग्राफिक प्रतिनिधित्व के तरीके
कई मामलों में, एक ही समन्वय आरेख पर एक नहीं, बल्कि कई पंक्तियों को प्रतिबिंबित करने की आवश्यकता होती है जो विभिन्न निरपेक्ष या सापेक्ष संकेतकों की गतिशीलता को दर्शाती हैं, या

तुलना संकेतकों के चित्रमय प्रतिनिधित्व के तरीके
व्यापक अर्थों में, संकेतकों की तुलना समय और स्थान दोनों में की जाती है, अर्थात। तुलना के तरीके गतिशीलता, संरचना और क्षेत्रीय वस्तुओं को कवर कर सकते हैं। इसलिए, प्रो

कार्टोग्राम और कार्टोग्राम का सार और अर्थ
कई मामलों में, विशाल प्रादेशिक वस्तुओं की विशेषता वाले सबसे महत्वपूर्ण विशेषताओं को ग्राफिक रूप से चित्रित करने की आवश्यकता होती है। कृषि-औद्योगिक जटिल प्रणाली में, ये बस्तियां, कृषि हो सकती हैं

विषय 4 के लिए प्रश्नों को नियंत्रित करें
1. ग्राफिक विधि क्या है और यह किस पर आधारित है? 2. किस मुख्य उद्देश्य के लिए ग्राफिकल विधि का उपयोग किया जाता है। 3. उन्हें कैसे वर्गीकृत किया जाता है

भिन्नता का सार। भिन्नता संकेतों के प्रकार
भिन्नता (लैटिन चर से - परिवर्तन) एक सांख्यिकीय आबादी में एक विशेषता (संस्करण) में परिवर्तन है, अर्थात। जनसंख्या की इकाइयों या उनके विभिन्न ज्ञान के समूहों द्वारा स्वीकृति को मान्यता दी जाती है

पशुधन श्रमिकों की संख्या से
रैंक संख्या (#) के अनुरूप विकल्प की रैंक संख्या (#) पशुधन श्रमिकों की प्रतीक संख्या

असतत वितरण रेंज
एक असतत (पृथक) श्रृंखला एक परिवर्तनशील श्रृंखला है जिसमें इसके समूह एक विशेषता के अनुसार बनते हैं जो लगातार बदलता रहता है, अर्थात। के माध्यम से निश्चित संख्याएक

पशुधन श्रमिक
सं। वेरिएंट वेरिएंट (साइन वैल्यू), Х फ़्रीक्वेंसी साइन्स लोकल फ़्रीक्वेंसी, fl संचयी फ़्रीक्वेंसी, fн

अंतराल वितरण श्रृंखला
कई मामलों में, इस सांख्यिकीय सेट में एक बड़ा या उससे भी अधिक, अनंत संख्या में विकल्प शामिल होते हैं, जो अक्सर निरंतर भिन्नता के साथ होता है, व्यावहारिक रूप से असंभव और अनुपयुक्त है।

औसत का सार
विविधता श्रृंखला विभिन्न प्रकार की घटनाओं और प्रक्रियाओं को दर्शाती है जो हमारी वास्तविकता का सार बनाती हैं। हमारे आसपास की दुनिया की घटनाओं और प्रक्रियाओं के अधिक संपूर्ण, गहन अध्ययन के लिए

अंकगणित औसत
यदि हम सूत्र 6.2 में K = 1 के मान को प्रतिस्थापित करते हैं, तो हमें अंकगणित माध्य मान प्राप्त होता है, अर्थात्। .

रैंक वितरण में
रैंक №№ प्रकार (चरित्र मान) प्रतीक फसल क्षेत्र, हेक्टेयर

पंक्ति वितरण
नहीं, पीपी प्रकार स्थानीय आवृत्तियों भारित औसत प्रकार प्रतीक उपज

अंकगणित माध्य के मूल गुण
अंकगणित माध्य में कई गणितीय गुण होते हैं जो इसकी गणना में गणितीय रूप से महत्वपूर्ण होते हैं। इन गुणों का ज्ञान सही और सटीक को नियंत्रित करने में मदद करता है

औसत कालानुक्रमिक मूल्य
अंकगणित माध्य की किस्मों में से एक कालानुक्रमिक माध्य है। अलग-अलग क्षणों में या अलग-अलग अवधियों के लिए विशेषता के मूल्यों की समग्रता के आधार पर परिकलित औसत मूल्य

आरएमएस
सूत्र 6.2 में K=2 का मान निर्धारित करने की शर्त के अंतर्गत। हमें माध्य वर्ग मान मिलता है। एक क्रमांकित श्रृंखला में, माध्य वर्ग मान की गणना बिना भारित (pr .) से की जाती है

जियोमेट्रिक माध्य
यदि हम मान K = 0 को सूत्र 6.2 में प्रतिस्थापित करते हैं, तो परिणामस्वरूप हमें ज्यामितीय माध्य प्राप्त होता है, जिसका एक सरल (बिना भारित) और भारित रूप होता है। ज्यामितीय माध्य सरल है

औसत हार्मोनिक मूल्य
सामान्य सूत्र 6.2 में प्रतिस्थापन की स्थिति के तहत, K \u003d -1 का मान, आप औसत हार्मोनिक मान प्राप्त कर सकते हैं, जिसका एक सरल और भारित रूप है। मध्य अकॉर्डियन नाम

संरचनात्मक माध्य। फैशन का सार और अर्थ
कुछ मामलों में, किसी भी विशेषता के लिए सांख्यिकीय आबादी की सामान्यीकरण विशेषता प्राप्त करने के लिए, किसी को तथाकथित का उपयोग करना पड़ता है। संरचनात्मक औसत। वे सम्मिलित करते हैं

माध्यिका का सार और अर्थ
माध्यिका - वे विकल्प जो भिन्नता श्रृंखला के मध्य में होते हैं। क्रमित श्रृंखला में माध्यिका इस प्रकार है। सबसे पहले, विकल्पों के माध्यिका की संख्या की गणना करें:

भिन्नता के सरलतम संकेतकों की अवधारणा
पाठ्यपुस्तक के अध्याय 5 में भिन्नता के सार पर विचार किया गया था, जहां यह नोट किया गया था कि भिन्नता अस्थिरता है, एक सांख्यिकीय आबादी में एक विशेषता के मूल्य में परिवर्तन, अर्थात। इकाइयों द्वारा स्वीकृति

मानक विचलन
मानक विचलन की गणना औसत के आधार पर की जाती है द्विघात मान. यह गैर-भारित (सरल) और भारित रूपों में प्रकट होता है। रैंक पी . के लिए

भिन्नता का गुणांक
भिन्नता का गुणांक एक सापेक्ष संकेतक है जिसे निम्न सूत्र का उपयोग करके परिकलित किया जा सकता है:

विषय 6 . के लिए नियंत्रण प्रश्न
1. औसत मूल्य क्या है और यह क्या व्यक्त करता है? 2. जनसंख्या की परिभाषित करने वाली संपत्ति क्या है और इसका उपयोग आंकड़ों में क्यों किया जाता है? 3. माध्यम के मुख्य प्रकार क्या हैं

सामान्य और नमूना जनसंख्या का सार
आंकड़ों में, एक सतत प्रकार का अवलोकन अपेक्षाकृत दुर्लभ है, उदाहरण के लिए, एक सामान्य जनसंख्या जनगणना। फिर भी, असंतत टिप्पणियों का उपयोग करना अक्सर आवश्यक होता है, जो

एक स्टोकेस्टिक आबादी की अवधारणा
वास्तविक परिस्थितियों में, सामान्य जनसंख्या के साथ सांख्यिकीय कार्य के मामले अपेक्षाकृत दुर्लभ होते हैं और इसलिए, मुख्य सांख्यिकीय विशेषताओं को प्राप्त करना हमेशा संभव नहीं होता है।

चयनात्मक रूपक का सार
ज्यादातर मामलों में सांख्यिकीय कार्य किसी न किसी तरह नमूना पद्धति को लागू करने के परिणामस्वरूप प्राप्त आंकड़ों से जुड़ा होता है। के उपयोग के बिना कई अध्ययन असंभव होंगे

नमूनाकरण विधि के फायदे और नुकसान
निरंतर अवलोकन की तुलना में नमूनाकरण विधि के कई फायदे हैं। सबसे पहले, चयनात्मक अवलोकन इसके कार्यान्वयन के लिए श्रम, धन और समय को महत्वपूर्ण रूप से बचा सकता है। उल्लू

चयन के तरीके, उनके फायदे और नुकसान
सामान्य जनसंख्या से सांख्यिकीय इकाइयों का चयन विभिन्न तरीकों से किया जा सकता है और यह कई स्थितियों पर निर्भर करता है। नमूनाकरण विधि में सांख्यिकीय इकाइयों के चयन के लिए निम्नलिखित विधियाँ शामिल हैं:

प्रतिनिधित्व त्रुटियों का सार और उनकी गणना की प्रक्रिया
केंद्रीय प्रश्नों में से एक नमूनाकरण विधिइसे मुख्य सांख्यिकीय विशेषताओं की सैद्धांतिक गणना माना जाता है और, सबसे बढ़कर, सामान्य सांख्यिकीय स्कूप में एक संकेत का औसत मूल्य

एक छोटे से नमूने की अवधारणा। मुख्य सांख्यिकीय विशेषताओं का बिंदु अनुमान
नमूनाकरण विधि का उपयोग सैद्धांतिक रूप से सामान्य जनसंख्या से किसी भी संख्या में सांख्यिकीय इकाइयों के चयन पर आधारित हो सकता है। यह गणितीय रूप से सिद्ध हो चुका है कि नमूना आबादी हो सकती है

सीमांत नमूनाकरण त्रुटि। मुख्य सांख्यिकीय विशेषताओं का अंतराल अनुमान
सीमांत त्रुटिनमूना नमूना और सामान्य जनसंख्या में प्राप्त सांख्यिकीय विशेषताओं के बीच विसंगति है जैसा कि ऊपर दिखाया गया है (सूत्र

चयन के विभिन्न तरीकों के लिए नमूने के आकार की गणना के तरीके
के लिए प्रारंभिक कार्य चयनात्मक अवलोकनसीधे आवश्यक नमूना आकार के निर्धारण से संबंधित है, जो चयन की विधि और सामान्य में इकाइयों की संख्या पर निर्भर करता है

एक माध्यमिक (जटिल) सांख्यिकीय सारांश की अवधारणा
एक साधारण सारांश के परिणाम, जिसकी सामग्री पर विषय 2 में चर्चा की गई है, हमेशा शोधकर्ता को संतुष्ट नहीं कर सकता है, क्योंकि वे केवल अध्ययन के तहत वस्तु का एक सामान्य विचार देते हैं, अर्थात। आँकड़ों से

विशिष्ट समूह
टाइपोलॉजिकल ग्रुपिंग सांख्यिकीय आबादी का अनिवार्य रूप से समान गुणवत्ता वाले टाइपोलॉजिकल समूहों में एक विभाजन है। विशिष्ट समूहन

संरचनात्मक समूह
स्ट्रक्चरल ग्रुपिंग में सांख्यिकीय इकाइयों के सजातीय और गुणात्मक रूप से सेट को समूहों में विभाजित करना शामिल है जो एक जटिल वस्तु की संरचना की विशेषता है। संरचनात्मक के माध्यम से

एक सरल और विश्लेषणात्मक समूह बनाने का सार और प्रक्रिया
विश्लेषणात्मक समूह, जिसमें सांख्यिकीय जनसंख्या को किसी एक कारक विशेषता के अनुसार सजातीय समूहों में विभाजित किया जाता है, सरल कहलाता है।

विश्लेषणात्मक समूहन
नहीं, पीपी समूहों फार्मउर्वरकों की खुराक से, टी / हेक्टेयर। समूहों में आवृत्ति संकेत (समूह में जनसंख्या इकाइयों की संख्या)

आलू उगाने में प्रदर्शन संकेतक
नहीं, पीपी संकेतक उर्वरकों की खुराक पर खेतों के समूह, टी / हेक्टेयर कुल (औसत) 10-20

सांख्यिकीय तालिकाओं का सार और अर्थ
विभिन्न सांख्यिकीय विधियों (सारांश, सापेक्ष, औसत मान, संरचना, भिन्नता श्रृंखला, भिन्नता संकेतक, विश्लेषणात्मक) का उपयोग करके अवलोकन डेटा को संसाधित करने के परिणाम

सांख्यिकीय तालिकाओं की प्राथमिक संरचना
एकीकृत सांख्यिकीय प्रसंस्करणअवलोकन परिणाम आमतौर पर कई तालिकाओं के उपयोग से जुड़े होते हैं। इसलिए, प्रत्येक तालिका को एक व्यक्तिगत संख्या सौंपी जाती है।

सांख्यिकीय तालिकाओं के प्रकार और रूप
सारणीबद्ध विषय की संरचना के आधार पर, निम्न प्रकार की सांख्यिकीय सारणी प्रतिष्ठित हैं: सरल, समूह और संयोजन। सरल सांख्यिकीय तालिका - हरा

सहायक और परिणामी सांख्यिकीय सारणी
सांख्यिकीय तालिकाएँ विभिन्न कार्यात्मक भूमिकाएँ निभा सकती हैं। उनमें से कुछ, उदाहरण के लिए, सांख्यिकीय अवलोकन के परिणामों को संक्षेप में प्रस्तुत करने और प्राथमिक के कार्य के प्रदर्शन में योगदान करने के लिए कार्य करते हैं

उत्पादन परिणाम, 2003
(संयोजन तालिका) नहीं। पीपी। प्रति 1 ट्रैक्टर पर कृषि भूमि के भार के अनुसार खेतों के समूह, भार द्वारा खेतों के उपसमूह

2003 में कृषि-औद्योगिक परिसर के सन प्रसंस्करण उद्यम
(वर्कशीट) नहीं। पीपी। वार्षिक प्रसंस्करण मात्रा पर भरोसा करें, कर्मचारियों की संख्या, क्षमता वहन करने वाले व्यक्ति a

सांख्यिकीय तालिकाओं का पंजीकरण
सारणीबद्ध पद्धति का उपयोग करके निर्धारित लक्ष्यों को प्राप्त करना उन मामलों में संभव है जहां सांख्यिकीय तालिकाओं के डिजाइन के लिए आवश्यक आवश्यकताएं पूरी होती हैं। आम तौर पर, सभी तालिकाओं में होना चाहिए

फैलाव विधि की अवधारणा
विधि का नाम व्यापक उपयोग के कारण है विभिन्न प्रकारफैलाव, सार और गणना के तरीकों को पाठ्यपुस्तक के छठे विषय में माना जाता है। यह ध्यान देने योग्य है कि राशि में भिन्नता

परिणाम-चिह्न
№ पी / एन व्यक्तिगत विकल्प रैखिक विचलन व्यक्तिगत। रैखिक विचलन के माध्य वर्गों से भिन्न

किसान खेत
सं. उपज, q/ha औसत से व्यक्तिगत उपज का रैखिक विचलन, q/ha उपज के रैखिक विचलन के वर्ग

लेट ब्लाइट, आलू की उपज पर
सं। खेती की गई फसलों के हिस्से से खेतों के समूह, समूह में खेतों की संख्या% उपचारित फसलों का औसत हिस्सा,

परिणाम-चिह्न
समूह संख्या कारक संकेतक द्वारा अंतराल स्थानीय आवृत्ति परिणामी संकेतक प्रकार का औसत

फैलाव के प्रकार। प्रसरण जोड़ नियम
में विचरण (माध्य वर्ग विचलन) की गणना का सिद्धांत सामान्य दृष्टि सेविषय 6 में चर्चा की गई है। फैलाव विधि के संबंध में, इसका मतलब है कि प्रत्येक प्रकार की भिन्नता एक निश्चित से मेल खाती है

आलू की पैदावार (पहला समूह)
नहीं, पीपी उपज, c/हेक्टेयर औसत समूह उपज से रैखिक विचलन रैखिक विचलन के वर्ग

आर फिशर की कसौटी की अवधारणा
फैलाव विधि में सही विचरण के अनुपात का आकलन करना शामिल है, जो अध्ययन किए गए प्रभावी गुण के समूह औसत मूल्यों के व्यवस्थित उतार-चढ़ाव को सही फैलाव के लिए दर्शाता है।

दो-कारक फैलाव परिसर
इस परिसर का समाधान एक या अधिक प्रभावी संकेतों पर दो कारक संकेतों के प्रभाव के दो कारक संकेतों के गुणात्मक प्रभाव का अध्ययन करने के उद्देश्य से है। दो-कारक परिसर

अनाज की फसलें
उपसमूह संख्या उपसमूह में खेतों की संख्या प्रति हेक्टेयर औसत उपज उपसमूह में उपज के रैखिक विचलन से

बहुकारक फैलाव परिसर की विशेषताएं
संचार की गुणवत्ता का अध्ययन, अर्थात्। पर कई (तीन, चार या अधिक) कारक विशेषताओं के प्रभाव का महत्व प्रदर्शन संकेतक, अनिवार्य रूप से संयुक्त लेने की अवधि है

अनाज फसलों की पैदावार
नहीं, पीपी भिन्नता के तत्व प्रतीक कुल भिन्नता व्यवस्थित भिन्नता अवशिष्ट भिन्नता

सार और सहसंबंध के प्रकार
पिछले अध्याय में, यह दिखाया गया था कि सांख्यिकीय आबादी में कारक और परिणाम विशेषताओं के बीच संबंध की गुणवत्ता (महत्व) फैलाव का उपयोग करके निर्धारित और मूल्यांकन किया जाता है

सुविधाओं के बीच सहसंबंध के मुख्य रूप
संकेतों के बीच संबंध के रूप की पहचान उनके बीच कारण संबंध के निर्धारण से पहले होती है। सहसंबंध विधि के सही उपयोग के लिए यह सबसे महत्वपूर्ण और महत्वपूर्ण बिंदु है। द्वारा

सहसंबंधों की जकड़न के संकेतक। सहसंबंध संबंध
सहसंबंध विधि की मदद से हल किए गए केंद्रीय मुद्दों में से एक कारक और परिणामी विशेषताओं के बीच संबंध की निकटता के मात्रात्मक माप की परिभाषा और मूल्यांकन है। पर

सीधी जोड़ी सहसंबंध गुणांक
यदि अध्ययन की गई जोड़ी की विशेषताओं के बीच संबंध को एक सीधी रेखा के करीब के रूप में व्यक्त किया जाता है, तो इन विशेषताओं के बीच संबंध की निकटता की डिग्री की गणना गुणांक पीआर का उपयोग करके की जा सकती है।

रैंक सहसंबंध गुणांक
मामलों में मुख्य सांख्यिकीय विशेषताएं जहां सामान्य जनसंख्या, जिसमें से नमूना लिया जाता है, सामान्य के मापदंडों के बाहर या वितरण कानून के करीब निकलता है

एकाधिक सहसंबंध गुणांक
कई तथ्यात्मक और प्रभावी विशेषताओं के बीच संबंध की निकटता का अध्ययन करते समय, संचयी गुणांक की गणना की जाती है एकाधिक सहसंबंध. तो, कुल m . का निर्धारण करते समय

निर्धारण के संकेतक
लक्षणों के मात्रात्मक प्रभाव का अध्ययन करते समय - परिणामों पर कारक, यह निर्धारित करना महत्वपूर्ण है कि परिणामी विशेषता के उतार-चढ़ाव का कौन सा हिस्सा सीधे भिन्नता के प्रभाव के कारण होता है।

प्रतिगमन समीकरणों का सार, प्रकार और अर्थ
प्रतिगमन को संकेतों के उतार-चढ़ाव के प्रभाव में प्रभावी संकेतों में परिवर्तन की निर्भरता का वर्णन करने के लिए डिज़ाइन किए गए फ़ंक्शन के रूप में समझा जाता है - कारक। प्रतिगमन की अवधारणा को सांख्यिकीय में पेश किया गया था

सीधी रेखा प्रतिगमन समीकरण
एक सीधी रेखा के करीब एक रूप में सहसंबंध को एक सीधी रेखा समीकरण के रूप में दर्शाया जा सकता है:

अतिपरवलयिक प्रतिगमन समीकरण
यदि सुविधा-कारक और सुविधा-परिणाम के बीच संबंध का रूप, समन्वय आरेख (सहसंबंध क्षेत्र) का उपयोग करके पहचाना जाता है, हाइपरबोलिक तक पहुंचता है, तो समीकरण बनाना और हल करना आवश्यक है

प्रतिगमन
नहीं, पीपी फ़ीचर-फ़ैक्टर फ़ीचर-रिज़ल्ट, फ़ीचर-फ़ैक्टर का व्युत्क्रम मान व्युत्क्रम मान का वर्ग

अतिपरवलयिक प्रतिगमन
नहीं, पीपी मटर की उपज, डीटी / हेक्टेयर एक्स मटर की लागत, हजार रूबल / डीटी वाई अनुमानित मूल्य

परवलयिक प्रतिगमन समीकरण
कुछ मामलों में, सांख्यिकीय आबादी के अनुभवजन्य डेटा, एक समन्वय आरेख का उपयोग करके कल्पना की जाती है, यह दर्शाता है कि कारक में वृद्धि के साथ-साथ रेस में भी वृद्धि हुई है।

परवलयिक प्रतिगमन
नहीं, पीपी XY XY X2 X2Y X4

परवलयिक प्रतिगमन
नहीं, पीपी आलू की फसलों का विशिष्ट भार, आलू की उपज, हजार सी. मूल्य गणना

एकाधिक प्रतिगमन समीकरण
एक विशेषता की निर्भरता का अध्ययन करने में सहसंबंध विधि का उपयोग - कई कारक विशेषताओं का परिणाम एक साधारण (जोड़ी) सहसंबंध के समान योजना के अनुसार बनता है। में से एक

लोच गुणांक
परिणामों के सार्थक और सुलभ विवरण (व्याख्या) के लिए, विभिन्न प्रतिगमन समीकरणों के माध्यम से संकेतों के बीच सहसंबंध-प्रतिगमन निर्भरता को दर्शाते हुए, आमतौर पर इसका उपयोग किया जाता है

समय श्रृंखला का सार
आसपास की दुनिया की सभी घटनाएं समय में निरंतर परिवर्तन से गुजरती हैं; समय के साथ, अर्थात्। उनकी मात्रा, स्तर, संरचना, संरचना, आदि गतिशीलता में परिवर्तन। यह नोट करना उचित है कि

कृषि उद्यम
(वर्ष की शुरुआत में; हजार भौतिक इकाइयां) संकेतक 2000 2001 2002 2003

गतिशील श्रृंखला के मुख्य संकेतक
गतिशील श्रृंखला का एक व्यापक विश्लेषण इन घटनाओं के विकास में प्रवृत्तियों और विशेषताओं की पहचान करने के लिए, घटनाओं के विकास के विभिन्न चरणों में खुद को प्रकट करने वाले पैटर्न को प्रकट करना और चिह्नित करना संभव बनाता है। यथानुपात में

निरपेक्ष स्तर का लाभ
गतिकी के विकास के सबसे सरल संकेतकों में से एक स्तर में पूर्ण वृद्धि है। निरपेक्ष वृद्धि गतिशील रेंज के दो स्तरों के बीच का अंतर है

स्तर की वृद्धि दर
परिवर्तन की सापेक्ष दर को चिह्नित करने के लिए, विकास दर संकेतक। विकास दर- यह गतिशील श्रृंखला के एक स्तर का दूसरे से अनुपात है, जिसे तुलना के आधार के रूप में लिया जाता है। विकास दर हो सकती है

स्तर की वृद्धि दर
यदि गतिशील श्रृंखला के स्तरों में वृद्धि की निरपेक्ष दर को निरपेक्ष वृद्धि के परिमाण की विशेषता है, तो सापेक्ष गतिविकास दर - विकास दर। टेम्पो एट

एक प्रतिशत वृद्धि का निरपेक्ष मूल्य
समय श्रृंखला का विश्लेषण करते समय, कार्य को अक्सर प्रस्तुत किया जाता है: यह पता लगाने के लिए कि कौन से निरपेक्ष मान स्तरों में 1% वृद्धि (कमी) व्यक्त करते हैं, क्योंकि कई मामलों में, कमी (मंदी) के साथ

1999-2003 के लिए
वर्ष उत्पादकता, c/ha पूर्ण उपज वृद्धि, c/ha विकास दर,% विकास दर,%

गतिशील श्रृंखला संरेखण तकनीक
अस्थायी पैटर्न की पहचान करने के लिए, एक नियम के रूप में, पर्याप्त होना चाहिए बड़ी संख्यास्तर, गतिशील श्रृंखला। यदि गतिशील श्रृंखला में सीमित संख्या में स्तर होते हैं, तो इसका संरेखण

विश्लेषणात्मक समय श्रृंखला संरेखण के लिए तरीके
गतिशील श्रृंखला के स्तरों के विकास में सामान्य प्रवृत्ति की पहचान विश्लेषणात्मक संरेखण के विभिन्न तरीकों का उपयोग करके की जा सकती है, जिसे अक्सर किया जाता है

घातीय वक्र के लिए विश्लेषणात्मक संरेखण
कुछ मामलों में, उदाहरण के लिए, नए को चालू करने और विकसित करने की प्रक्रिया में उत्पादन क्षमता, गतिशील श्रृंखला को स्तरों में तेजी से बढ़ते परिवर्तन की विशेषता हो सकती है, अर्थात। जंजीर वाले

विश्लेषणात्मक दूसरे क्रम परवलयिक संरेखण
यदि अध्ययन के तहत गतिशील श्रृंखला को स्तरों के विकास के त्वरण के साथ सकारात्मक निरपेक्ष वृद्धि की विशेषता है, तो श्रृंखला के संरेखण को दूसरे क्रम के परवलय के अनुसार किया जा सकता है।

अतिपरवलय समीकरण के अनुसार विश्लेषणात्मक संरेखण
यदि गतिशील श्रृंखला को स्तरों में निरपेक्ष कमी (उदाहरण के लिए, उत्पादों की श्रम तीव्रता की गतिशीलता, कृषि में उत्पादन की श्रम आपूर्ति, आदि) की विशेषता है, तो

समय श्रृंखला के स्तरों के प्रक्षेप और एक्सट्रपलेशन की अवधारणा
कुछ मामलों में, समय श्रृंखला के लापता मध्यवर्ती स्तरों के मूल्यों को इसके ज्ञात मूल्यों के आधार पर खोजना आवश्यक है। ऐसे मामलों में, प्रक्षेप का उपयोग किया जा सकता है

आलू उत्पादन सांख्यिकीय रैंकिंग

तालिका 2 में संकेतकों के आधार पर, हम प्रति 100 हेक्टेयर कृषि योग्य भूमि में आलू के उत्पादन के लिए क्रमबद्ध पंक्तियों को संकलित करते हैं; आलू की उपज पर; लागत पर। इन संकेतकों के बीच संबंध को ग्राफिक रूप से दर्शाया गया है।

भिन्नता के सांख्यिकीय अध्ययन में पहला कदम एक भिन्नता श्रृंखला का निर्माण है - एक विशेषता के मूल्यों में वृद्धि (अधिक बार) या घटते (कम अक्सर) के अनुसार जनसंख्या इकाइयों का एक क्रमबद्ध वितरण।

एक विविधता श्रृंखला के तीन रूप हैं: एक श्रेणीबद्ध श्रृंखला, एक असतत श्रृंखला, एक अंतराल श्रृंखला। एक परिवर्तनशील श्रृंखला को अक्सर वितरण श्रृंखला कहा जाता है।

एक क्रमबद्ध श्रृंखला अध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है

रैंकिंग अध्ययन की वस्तुओं को क्रमबद्ध करने की एक प्रक्रिया है, जो वरीयता के आधार पर की जाती है। भिन्नता की सीमा दर्शाती है कि जनसंख्या की इकाइयों के बीच का अंतर कितना बड़ा है।

रैंक उनके मूल्यों के आरोही या अवरोही क्रम में व्यवस्थित विशेषता मानों की क्रमिक संख्या है। यदि विशेषता मान समान है मात्रा का ठहराव, तो इन सभी मानों की रैंक निर्धारित करने वाले स्थानों की संगत संख्याओं के अंकगणितीय माध्य के बराबर ली जाती है। इन रैंकों को कनेक्टेड कहा जाता है।

आँकड़ों में रेखांकन ज्यामितीय आकृतियों और संकेतों, रेखाचित्रों या योजनाबद्ध मानचित्रों के रूप में सांख्यिकीय संकेतकों को देखने का एक तरीका है। एक दृश्य छवि सूचना की धारणा की सुविधा प्रदान करती है, आपको इंटरकनेक्शन में संकेतकों के एक सेट को कवर करने, विकास के रुझान और संकेतकों के विशिष्ट अनुपात की पहचान करने की अनुमति देती है।

डायनामिक्स संकेतक प्रदर्शित करने के लिए, इसका उपयोग करना उचित है रेखा रेखांकनया बार चार्ट। ग्राफ दृश्य, समझने योग्य, पढ़ने में आसान और यदि संभव हो तो कलात्मक रूप से डिजाइन किया जाना चाहिए, जो इस पर ध्यान आकर्षित करेगा।

स्कैटर प्लॉट का निर्माण करते समय, बिंदुओं के एक सेट का उपयोग ग्राफिक नमूने के रूप में किया जाता है; रैखिक - रेखाओं का निर्माण करते समय। चार्टिंग हमेशा एक रचनात्मक प्रक्रिया है। यहां कुछ खोज की जरूरत है। कई मसौदा संस्करणों को संकलित और तुलना करने के बाद ही, ग्राफ की सही संरचना का निर्धारण करना संभव है, ग्राफ फ़ील्ड पर पैमाने और संकेतों का स्थान निर्धारित करना संभव है।

प्रति 100 हेक्टेयर कृषि योग्य भूमि में आलू के उत्पादन के लिए क्रमबद्ध श्रृंखला से, हम यह निष्कर्ष निकाल सकते हैं कि सबसे कम उत्पादन बालगांस्की जिले में मनाया जाता है, और अंगार्स्की जिले को 100 हेक्टेयर कृषि योग्य भूमि से आलू की उच्चतम उत्पादकता से अलग किया जाता है।

सबसे कम उपज काचुगस्की जिले में थी - 10 सेंटीमीटर / हेक्टेयर, और उसोल्स्की में सबसे ज्यादा - 195.5 सेंटीमीटर / हेक्टेयर।

चुनस्की जिले में, प्रति 100 हेक्टेयर कृषि योग्य भूमि में उच्च आलू उत्पादन के साथ, 1 सी की सबसे कम लागत। अधिकतम लागत निज़ने-इलिम्स्क क्षेत्र में देखी जाती है। एक सेंटीमीटर आलू की कीमत में भिन्नता की सीमा बहुत बड़ी है और 1161.01 रूबल के बराबर है।

अन्य प्रकाशन

उद्यम की आर्थिक गतिविधि का विश्लेषण
एक बाजार अर्थव्यवस्था में संक्रमण के लिए उद्यम को आर्थिक प्रबंधन और उत्पादन प्रबंधन के प्रभावी रूपों, वैज्ञानिक और तकनीकी प्रगति की उपलब्धियों, और की सक्रियता के माध्यम से उत्पादन की दक्षता, उत्पादों और सेवाओं की प्रतिस्पर्धात्मकता बढ़ाने की आवश्यकता होती है ...

JSC TransContainer की वित्तीय और आर्थिक गतिविधियों का विश्लेषण
वित्तीय विश्लेषण भविष्य की स्थितियों और प्रदर्शन का आकलन करने के लिए उद्यम की वित्तीय स्थिति और अतीत में उसकी गतिविधियों के परिणामों पर डेटा के अध्ययन पर आधारित एक प्रक्रिया है। इस प्रकार, मुख्य कार्य वित्तीय विश्लेषणयावल...

सामाजिक-आर्थिक घटनाओं और प्रक्रियाओं के अध्ययन में सबसे महत्वपूर्ण चरण प्राथमिक डेटा का व्यवस्थितकरण है और इस आधार पर, सामान्यीकरण संकेतकों का उपयोग करके संपूर्ण वस्तु की सारांश विशेषता प्राप्त करना, जो प्राथमिक सांख्यिकीय सामग्री को सारांशित और समूहित करके प्राप्त किया जाता है।

सांख्यिकीय सारांश - यह विशिष्ट एकल तथ्यों को सामान्य बनाने के लिए अनुक्रमिक संचालन का एक जटिल है जो एक पूरे के रूप में अध्ययन के तहत घटना में निहित विशिष्ट विशेषताओं और पैटर्न की पहचान करने के लिए एक सेट बनाते हैं। एक सांख्यिकीय सारांश के संचालन में निम्नलिखित चरण शामिल हैं: :

  • समूहीकरण सुविधा का विकल्प;
  • समूहों के गठन के क्रम का निर्धारण;
  • समूहों और वस्तु को समग्र रूप से चिह्नित करने के लिए सांख्यिकीय संकेतकों की एक प्रणाली का विकास;
  • सारांश परिणाम प्रस्तुत करने के लिए सांख्यिकीय तालिकाओं के लेआउट का विकास।

सांख्यिकीय समूहन अध्ययन की गई जनसंख्या की इकाइयों को उनके लिए आवश्यक कुछ विशेषताओं के अनुसार सजातीय समूहों में विभाजित करना कहा जाता है। समूह सांख्यिकीय आंकड़ों को सारांशित करने की सबसे महत्वपूर्ण सांख्यिकीय पद्धति है, जो सांख्यिकीय संकेतकों की सही गणना का आधार है।

निम्नलिखित प्रकार के समूह हैं: टाइपोलॉजिकल, संरचनात्मक, विश्लेषणात्मक। ये सभी समूह इस तथ्य से एकजुट हैं कि वस्तु की इकाइयों को किसी न किसी विशेषता के अनुसार समूहों में विभाजित किया जाता है।

समूह चिन्ह वह चिन्ह कहलाता है जिसके द्वारा जनसंख्या की इकाइयों को अलग-अलग समूहों में विभाजित किया जाता है। से सही पसंदसमूहीकरण विशेषता निष्कर्षों पर निर्भर करती है सांख्यिकीय अनुसंधान. समूहीकरण के आधार के रूप में, महत्वपूर्ण, सैद्धांतिक रूप से प्रमाणित सुविधाओं (मात्रात्मक या गुणात्मक) का उपयोग करना आवश्यक है।

समूहीकरण के मात्रात्मक संकेत एक संख्यात्मक अभिव्यक्ति है (व्यापारिक मात्रा, एक व्यक्ति की आयु, पारिवारिक आय, आदि), और समूहीकरण की गुणात्मक विशेषताएं जनसंख्या इकाई की स्थिति (लिंग, वैवाहिक स्थिति, उद्यम की उद्योग संबद्धता, इसके स्वामित्व का रूप, आदि) को दर्शाती है।

समूहीकरण का आधार निर्धारित होने के बाद अध्ययन जनसंख्या को कितने समूहों में विभाजित किया जाए, इस प्रश्न का निर्णय किया जाना चाहिए। समूहों की संख्या अध्ययन के उद्देश्यों और समूह में अंतर्निहित संकेतक के प्रकार, जनसंख्या की मात्रा, विशेषता की भिन्नता की डिग्री पर निर्भर करती है।

उदाहरण के लिए, स्वामित्व के रूपों के अनुसार उद्यमों का समूह नगरपालिका, संघीय और संघ के विषयों की संपत्ति को ध्यान में रखता है। यदि समूहीकरण एक मात्रात्मक विशेषता के अनुसार किया जाता है, तो अध्ययन के तहत वस्तु की इकाइयों की संख्या और समूहन विशेषता के उतार-चढ़ाव की डिग्री पर विशेष ध्यान देना आवश्यक है।

जब समूहों की संख्या निर्धारित की जाती है, तो समूह अंतराल निर्धारित किया जाना चाहिए। मध्यान्तर - ये एक चर विशेषता के मूल्य हैं जो कुछ सीमाओं के भीतर हैं। प्रत्येक अंतराल का अपना मान, ऊपरी और निचली सीमाएँ, या उनमें से कम से कम एक होता है।

अंतराल की निचली सीमा अंतराल में विशेषता का सबसे छोटा मान कहलाता है, और ऊपरी सीमा - अंतराल में विशेषता का सबसे बड़ा मूल्य। अंतराल मान ऊपरी और निचली सीमाओं के बीच का अंतर है।

समूह अंतराल, उनके आकार के आधार पर, हैं: समान और असमान। यदि लक्षण की भिन्नता अपेक्षाकृत संकीर्ण सीमाओं में प्रकट होती है और वितरण समान है, तो समान अंतराल के साथ एक समूह बनाया जाता है। एक समान अंतराल का मान निम्न सूत्र द्वारा निर्धारित किया जाता है: :

जहाँ Xmax, Xmin - समुच्चय में विशेषता का अधिकतम और न्यूनतम मान; n समूहों की संख्या है।

सबसे सरल समूह, जिसमें प्रत्येक चयनित समूह को एक संकेतक द्वारा दर्शाया जाता है, एक वितरण श्रृंखला है।

सांख्यिकीय वितरण श्रृंखला - यह एक निश्चित विशेषता के अनुसार समूहों में जनसंख्या इकाइयों का एक क्रमबद्ध वितरण है। वितरण श्रृंखला के गठन में अंतर्निहित विशेषता के आधार पर, विशेषता और भिन्नता वितरण श्रृंखला को प्रतिष्ठित किया जाता है।

ठहराव वे गुणात्मक विशेषताओं के अनुसार निर्मित वितरण श्रृंखला कहते हैं, अर्थात्, ऐसे संकेत जिनकी कोई संख्यात्मक अभिव्यक्ति नहीं होती है (श्रम के प्रकार, लिंग द्वारा, पेशे से, आदि)। विशेषता वितरण श्रृंखला एक या किसी अन्य आवश्यक विशेषता के अनुसार जनसंख्या की संरचना की विशेषता है। कई अवधियों में लिया गया, ये डेटा हमें संरचना में परिवर्तन का अध्ययन करने की अनुमति देता है।

विविधता पंक्तियाँ मात्रात्मक आधार पर निर्मित वितरण श्रृंखला कहलाती है। किसी भी परिवर्तनशील श्रृंखला में दो तत्व होते हैं: रूपांतर और आवृत्तियाँ। विकल्प वेरिएशन सीरीज में जो एट्रीब्यूट लेता है, उसके अलग-अलग वैल्यूज कहलाते हैं, यानी वेरिएबल एट्रीब्यूट का स्पेसिफिक वैल्यू।

आवृत्तियों अलग-अलग प्रकार या विविधता श्रृंखला के प्रत्येक समूह की संख्या कहलाती है, यानी ये वे संख्याएं हैं जो दर्शाती हैं कि वितरण श्रृंखला में कितनी बार कुछ प्रकार होते हैं। सभी आवृत्तियों का योग संपूर्ण जनसंख्या का आकार, उसका आयतन निर्धारित करता है। आवृत्तियों आवृत्तियों को एक इकाई के अंशों में या कुल के प्रतिशत के रूप में व्यक्त किया जाता है। तदनुसार, आवृत्तियों का योग 1 या 100% के बराबर है।

विशेषता की भिन्नता की प्रकृति के आधार पर, भिन्नता श्रृंखला के तीन रूपों को प्रतिष्ठित किया जाता है: एक क्रमबद्ध श्रृंखला, एक असतत श्रृंखला और एक अंतराल श्रृंखला।

रैंक की गई विविधता श्रृंखला - यह अध्ययन के तहत विशेषता के आरोही या अवरोही क्रम में जनसंख्या की व्यक्तिगत इकाइयों का वितरण है। रैंकिंग मात्रात्मक डेटा को समूहों में विभाजित करना आसान बनाता है, तुरंत एक विशेषता के सबसे छोटे और सबसे बड़े मूल्यों का पता लगाता है, और सबसे अधिक बार दोहराए जाने वाले मूल्यों को उजागर करता है।

असतत भिन्नता श्रृंखला एक असतत विशेषता के अनुसार जनसंख्या इकाइयों के वितरण की विशेषता है जो केवल पूर्णांक मान लेता है। उदाहरण के लिए, टैरिफ श्रेणी, परिवार में बच्चों की संख्या, उद्यम में कर्मचारियों की संख्या आदि।

यदि किसी संकेत में निरंतर परिवर्तन होता है, जो कुछ सीमाओं के भीतर किसी भी मान ("से - से") पर ले जा सकता है, तो इस संकेत के लिए आपको निर्माण करने की आवश्यकता है अंतराल भिन्नता श्रृंखला . उदाहरण के लिए, आय की राशि, कार्य अनुभव, उद्यम की अचल संपत्तियों की लागत आदि।

"सांख्यिकीय सारांश और समूहीकरण" विषय पर समस्याओं को हल करने के उदाहरण

कार्य 1 . पिछले शैक्षणिक वर्ष के लिए सदस्यता द्वारा छात्रों को प्राप्त पुस्तकों की संख्या के बारे में जानकारी है।

श्रृंखला के तत्वों को दर्शाते हुए एक विस्तृत और असतत परिवर्तनशील वितरण श्रृंखला बनाएं।

समाधान

यह सेट छात्रों को प्राप्त होने वाली पुस्तकों की संख्या के लिए विकल्पों का एक सेट है। आइए हम ऐसे प्रकारों की संख्या गिनें और उन्हें एक भिन्न श्रेणीबद्ध और परिवर्तनशील असतत वितरण श्रृंखला के रूप में व्यवस्थित करें।

टास्क 2 . 50 उद्यमों, हजार रूबल के लिए अचल संपत्तियों के मूल्य पर डेटा है।

उद्यमों के 5 समूहों (समान अंतराल पर) को हाइलाइट करते हुए एक वितरण श्रृंखला बनाएं।

समाधान

समाधान के लिए, हम उद्यमों की अचल संपत्तियों की लागत का सबसे बड़ा और सबसे छोटा मूल्य चुनते हैं। ये 30.0 और 10.2 हजार रूबल हैं।

अंतराल का आकार ज्ञात करें: ज \u003d (30.0-10.2): 5 \u003d 3.96 हजार रूबल।

फिर पहले समूह में उद्यम शामिल होंगे, जिनकी अचल संपत्ति की राशि 10.2 हजार रूबल से है। 10.2 + 3.96 = 14.16 हजार रूबल तक। ऐसे 9 उद्यम होंगे दूसरे समूह में उद्यम शामिल होंगे, जिनकी अचल संपत्तियों की राशि 14.16 हजार रूबल से होगी। 14.16 + 3.96 = 18.12 हजार रूबल तक। ऐसे 16 उद्यम होंगे। इसी तरह, हम तीसरे, चौथे और पांचवें समूहों में शामिल उद्यमों की संख्या पाते हैं।

परिणामी वितरण श्रृंखला को तालिका में रखा गया है।

टास्क 3 . कई उद्यमों के लिए प्रकाश उद्योगनिम्नलिखित डेटा प्राप्त किया:

श्रमिकों की संख्या के अनुसार उद्यमों का एक समूह बनाना, समान अंतराल पर 6 समूह बनाना। प्रत्येक समूह के लिए गणना करें:

1. उद्यमों की संख्या
2. श्रमिकों की संख्या
3. प्रति वर्ष निर्मित उत्पादों की मात्रा
4. प्रति कार्यकर्ता औसत वास्तविक उत्पादन
5. अचल संपत्तियों की राशि
6. एक उद्यम की अचल संपत्तियों का औसत आकार
7. एक उद्यम द्वारा निर्मित उत्पादों का औसत मूल्य

गणना के परिणामों को तालिकाओं में रिकॉर्ड करें। अपने निष्कर्ष निकालें।

समाधान

समाधान के लिए, हम उद्यम में श्रमिकों की औसत संख्या का सबसे बड़ा और सबसे छोटा मान चुनते हैं। ये 43 और 256 हैं।

अंतराल का आकार ज्ञात कीजिए: h = (256-43): 6 = 35.5

फिर पहले समूह में 43 से 43 + 35.5 = 78.5 लोगों की औसत संख्या वाले उद्यम शामिल होंगे। ऐसे 5 उद्यम होंगे।दूसरे समूह में उद्यम शामिल होंगे, जिनमें श्रमिकों की औसत संख्या 78.5 से 78.5 + 35.5 = 114 लोग होंगे। ऐसे 12 उद्यम होंगे। इसी तरह, हम तीसरे, चौथे, पांचवें और छठे समूहों में शामिल उद्यमों की संख्या पाते हैं।

हम परिणामी वितरण श्रृंखला को एक तालिका में रखते हैं और प्रत्येक समूह के लिए आवश्यक संकेतकों की गणना करते हैं:

निष्कर्ष : जैसा कि तालिका से देखा जा सकता है, उद्यमों का दूसरा समूह सबसे अधिक है। इसमें 12 उद्यम शामिल हैं। सबसे छोटा पाँचवाँ और छठा समूह (प्रत्येक में दो उद्यम) हैं। ये सबसे बड़े उद्यम हैं (श्रमिकों की संख्या के मामले में)।

चूंकि दूसरा समूह सबसे अधिक है, इस समूह के उद्यमों द्वारा प्रति वर्ष उत्पादन की मात्रा और अचल संपत्तियों की मात्रा दूसरों की तुलना में बहुत अधिक है। इसी समय, इस समूह के उद्यमों में एक कर्मचारी का औसत वास्तविक उत्पादन उच्चतम नहीं है। चौथे समूह के उद्यम यहां अग्रणी हैं। यह समूह काफी बड़ी मात्रा में अचल संपत्तियों के लिए भी जिम्मेदार है।

निष्कर्ष में, हम ध्यान दें कि अचल संपत्तियों का औसत आकार और एक उद्यम के उत्पादन का औसत मूल्य सीधे उद्यम के आकार (श्रमिकों की संख्या के संदर्भ में) के समानुपाती होता है।

भिन्नता के सांख्यिकीय अध्ययन में पहला कदम एक भिन्नता श्रृंखला का निर्माण है - एक विशेषता के बढ़ते (अधिक बार) या घटते (कम अक्सर) मूल्यों के अनुसार जनसंख्या इकाइयों का एक क्रमबद्ध वितरण और एक के साथ इकाइयों की संख्या की गणना करना या विशेषता का एक और मूल्य।

विविधता श्रृंखला के तीन रूप हैं: श्रेणीबद्ध, असतत, अंतराल। एक परिवर्तनशील श्रृंखला को अक्सर वितरण श्रृंखला कहा जाता है। मात्रात्मक और गैर-मात्रात्मक दोनों लक्षणों की भिन्नता का अध्ययन करते समय इस शब्द का उपयोग किया जाता है। वितरण श्रृंखला एक संरचनात्मक समूह है (अध्याय 6)।

एक क्रमबद्ध श्रृंखला अध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है।

नीचे सेंट पीटर्सबर्ग के बड़े बैंकों के बारे में जानकारी दी गई है, जिन्हें इक्विटी पूंजी द्वारा 01.10.1999 के रूप में स्थान दिया गया है।

बैंक का नाम इक्विटी पूंजी, मिलियन रूबल बाल्टोनेक्सिम बैंक 169

बैंक सेंट पीटर्सबर्ग 237

पेत्रोव्स्की 268

बाल्टिक 290

प्रोमस्ट्रॉयबैंक 1007

यदि जनसंख्या इकाइयों की संख्या काफी बड़ी है, तो क्रमबद्ध श्रृंखला बोझिल हो जाती है, और इसका निर्माण, यहां तक ​​कि कंप्यूटर की सहायता से भी, लंबे समय तक. ऐसे मामलों में, अध्ययन के तहत विशेषता के मूल्यों के अनुसार जनसंख्या की इकाइयों को समूहीकृत करके भिन्नता श्रृंखला का निर्माण किया जाता है।


समूहों की संख्या का निर्धारण

असतत भिन्नता श्रृंखला में समूहों की संख्या चर विशेषता के वास्तव में मौजूदा मूल्यों की संख्या से निर्धारित होती है। यदि विशेषता असतत मान लेती है, लेकिन उनकी संख्या बहुत बड़ी है (उदाहरण के लिए, विभिन्न कृषि उद्यमों में वर्ष के 1 जनवरी को पशुधन की संख्या शून्य से लेकर दसियों हज़ार सिर तक हो सकती है), तो एक अंतराल भिन्नता श्रृंखला बनाई जाती है . एक अंतराल भिन्नता श्रृंखला का निर्माण उन विशेषताओं का अध्ययन करने के लिए भी किया जाता है जो पूर्णांक और भिन्नात्मक मान दोनों में ले सकते हैं

इसके अस्तित्व के क्षेत्र। ये हैं, उदाहरण के लिए, बेचे गए उत्पादों की लाभप्रदता, उत्पादन की एक इकाई की लागत, शहर के प्रति निवासी आय, लोगों का अनुपात उच्च शिक्षाविभिन्न क्षेत्रों की आबादी के बीच और, सामान्य तौर पर, सभी माध्यमिक विशेषताओं, जिनमें से मूल्यों की गणना एक प्राथमिक विशेषता के मूल्य को दूसरे के मूल्य से विभाजित करके की जाती है (अध्याय 3 देखें)।

अंतराल भिन्नता श्रृंखला दो स्तंभों (या पंक्तियों) से युक्त एक तालिका है - विशेषता के अंतराल, जिसकी भिन्नता का अध्ययन किया जा रहा है, और इस अंतराल (आवृत्तियों) में आने वाली जनसंख्या की इकाइयों की संख्या, या का अनुपात कुल जनसंख्या (आवृत्तियों) से यह संख्या।

दो प्रकार के अंतराल भिन्नता श्रृंखला का सबसे अधिक उपयोग किया जाता है: समान-अंतराल और समान-आवृत्ति। समान-अंतराल श्रृंखला का उपयोग किया जाता है यदि विशेषता की भिन्नता बहुत मजबूत नहीं है, अर्थात। एक सजातीय आबादी के लिए, जिसका वितरण किसी दिए गए गुण के अनुसार सामान्य कानून के करीब है। (ऐसी श्रृंखला तालिका 5.6 में प्रस्तुत की गई है।) एक समान आवृत्ति श्रृंखला का उपयोग किया जाता है यदि विशेषता भिन्नता बहुत मजबूत है, लेकिन वितरण सामान्य नहीं है, लेकिन, उदाहरण के लिए, अतिशयोक्तिपूर्ण (तालिका 5.5)।

एक समान-अंतराल श्रृंखला का निर्माण करते समय, समूहों की संख्या को चुना जाता है ताकि समुच्चय में विशेषता मूल्यों की विविधता पर्याप्त रूप से परिलक्षित हो और साथ ही, वितरण की नियमितता, इसका आकार यादृच्छिक रूप से विकृत न हो आवृत्ति में उतार-चढ़ाव। यदि बहुत कम समूह हैं, तो भिन्नता का कोई पैटर्न नहीं होगा; यदि बहुत अधिक समूह हैं, तो यादृच्छिक आवृत्ति छलांग वितरण के आकार को विकृत कर देगी।



अंतराल की सीमाओं को अलग-अलग तरीकों से निर्दिष्ट किया जा सकता है: पिछले अंतराल की ऊपरी सीमा अगले एक की निचली सीमा को दोहराती है, जैसा कि तालिका में दिखाया गया है। 5.5, या दोहराना नहीं है।

बाद के मामले में, दूसरा अंतराल 15.1-20, तीसरा - 20.1-25, आदि के रूप में नामित किया जाएगा, अर्थात। यह माना जाता है कि सभी उपज मूल्यों को आवश्यक रूप से एक दसवें तक गोल किया जाता है। इसके अलावा, अंतराल 15.1-20 के मध्य के साथ एक अवांछनीय जटिलता उत्पन्न होती है, जो कड़ाई से बोलते हुए, पहले से ही 17.5 के बराबर नहीं, बल्कि 17.55 के बराबर होगी; तदनुसार, जब गोल अंतराल 40-60 को 40.1-60 के साथ प्रतिस्थापित किया जाता है, तो इसके मध्य 50 के गोल मान के बजाय, हमें 50.5 मिलता है। इसलिए, अंतरालों को दोहराई जाने वाली गोल सीमा के साथ छोड़ना बेहतर है और सहमत हैं कि जनसंख्या इकाइयाँ जिनका अंतराल सीमा के बराबर एक विशिष्ट मान है, उस अंतराल में शामिल हैं जहाँ यह सटीक मान पहली बार रिपोर्ट किया गया है। इस प्रकार 15 सेन्टर प्रति हेक्टेयर उपज वाला खेत पहले समूह में सम्मिलित है, मूल्य 20 सेन्टर प्रति हेक्टेयर है।

दूसरे में, आदि।

एक विशेषता के बहुत मजबूत बदलाव के साथ एक समान-आवृत्ति भिन्नता श्रृंखला आवश्यक है, क्योंकि समान-अंतराल वितरण के साथ, अधिकांश जनसंख्या इकाइयाँ निकल जाती हैं


तालिका 5.5

01.01.2000 के अनुसार संपत्ति के शेष मूल्यांकन के अनुसार 100 रूसी बैंकों का वितरण


समान वितरण के लिए अंतराल की सीमाएं बैंकों पर पहले, दसवें, ग्यारहवें, बीसवें आदि की संपत्ति के वास्तविक मूल्य हैं।

विविधता श्रृंखला का ग्राफिक प्रतिनिधित्व

परिवर्तनशील श्रृंखला और उसके गुणों के विश्लेषण में महत्वपूर्ण सहायता एक चित्रमय प्रतिनिधित्व द्वारा प्रदान की जाती है। अंतराल श्रृंखला को एक बार ग्राफ द्वारा दर्शाया जाता है, जिसमें एब्सिस्सा अक्ष पर स्थित सलाखों के आधार अलग-अलग विशेषता के मूल्यों के अंतराल होते हैं, और सलाखों की ऊंचाई पैमाने के अनुरूप आवृत्तियां होती हैं वाई-अक्ष। अनाज की फसल की पैदावार के संदर्भ में क्षेत्र में खेतों के वितरण का एक ग्राफिक प्रतिनिधित्व अंजीर में दिखाया गया है।

5.1. इस प्रकार के आरेख को अक्सर हिस्टोग्राम (जीआर हिस्टोस - ऊतक) कहा जाता है।

तालिका डेटा। 5.6 और अंजीर। 5.1 कई लक्षणों के वितरण विशेषता का रूप दिखाते हैं: विशेषता के औसत अंतराल के मूल्य अधिक सामान्य होते हैं, कम अक्सर विशेषता के चरम, छोटे और बड़े मूल्य। इस वितरण का रूप पाठ्यक्रम में विचार किए जाने के करीब है गणितीय सांख्यिकीसामान्य वितरण का नियम। महान रूसी गणितज्ञ ए.एम. ल्यपुनोव (1857-1918) ने साबित किया कि सामान्य

तालिका 5.6 अनाज की फसल की उपज द्वारा क्षेत्र में खेतों का वितरण


एक छोटा वितरण तब बनता है जब एक चर बड़ी संख्या में कारकों से प्रभावित होता है, जिनमें से किसी का भी प्रमुख प्रभाव नहीं होता है। अनाज फसलों की उपज विविधताओं को प्रभावित करने वाले कई लगभग समान कारकों का एक यादृच्छिक संयोजन, दोनों प्राकृतिक और कृषि तकनीकी, आर्थिक, सामान्य वितरण कानून के करीब उपज द्वारा क्षेत्र के खेतों का वितरण बनाता है।


चावल। 5.2. खेतों का संचयन और वितरण द्वारा

उत्पादकता

ऐसी श्रृंखला को संचयी कहा जाता है। आप संचयी वितरण "से कम नहीं" बना सकते हैं, या आप कर सकते हैं

"इससे अधिक"। पहले मामले में, संचयी वितरण के ग्राफ को संचयी कहा जाता है, दूसरे में - तोरण (चित्र। 5.2)।

वितरण घनत्व

यदि आपको असमान अंतराल के साथ एक परिवर्तनशील श्रृंखला से निपटना है, तो तुलनीयता के लिए आपको अंतराल की इकाई में आवृत्ति, या आवृत्ति लाने की आवश्यकता है। परिणामी अनुपात को वितरण घनत्व कहा जाता है:


वितरण घनत्व का उपयोग सामान्यीकरण संकेतकों की गणना के लिए और असमान अंतरालों के साथ भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए किया जाता है।

भिन्नता के सांख्यिकीय अध्ययन में पहला कदम निर्माण है विविधता श्रृंखला - विशेषता के मूल्यों में वृद्धि (अधिक बार) या घटते (कम अक्सर) के अनुसार जनसंख्या की इकाइयों के वितरण का आदेश दिया और विशेषता के एक या दूसरे मूल्य के साथ इकाइयों की संख्या की गणना की।

एक विविधता श्रृंखला के तीन रूप हैं: एक श्रेणीबद्ध श्रृंखला, एक असतत श्रृंखला, एक अंतराल श्रृंखला। विविधता श्रृंखला को अक्सर कहा जाता है वितरण के निकट।इस शब्द का प्रयोग मात्रात्मक और गैर-मात्रात्मक दोनों लक्षणों में भिन्नता के अध्ययन में किया जाता है। वितरण श्रृंखला है संरचनात्मक समूहन(अध्याय 6 देखें)।

रैंक की गई पंक्ति -यह अध्ययन के तहत विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची है।

तालिका 1 एक क्रमबद्ध श्रृंखला के उदाहरण के रूप में काम कर सकती है। 5.5.

तालिका 5.5

सेंट पीटर्सबर्ग के बड़े किनारे, आकार के अनुसार क्रमबद्ध01.07.96 . तक अपनी पूंजी

यदि जनसंख्या इकाइयों की संख्या काफी बड़ी है, तो रैंक की गई श्रृंखला बोझिल हो जाती है, और इसके निर्माण में, यहां तक ​​​​कि कंप्यूटर की मदद से भी, एक लंबा समय लगता है। ऐसे मामलों में, अध्ययन के तहत विशेषता के मूल्यों के अनुसार जनसंख्या की इकाइयों को समूहीकृत करके भिन्नता श्रृंखला का निर्माण किया जाता है।

यदि विशेषता कम संख्या में मान लेती है, तो एक असतत परिवर्तनशील श्रृंखला बनाई जाती है। इस तरह की श्रृंखला का एक उदाहरण फुटबॉल मैचों का स्कोर किए गए गोलों की संख्या से वितरण है (तालिका 5.1)। असतत भिन्नता श्रृंखला -यह एक तालिका है जिसमें दो पंक्तियाँ या एक ग्राफ़ होता है: एक चर विशेषता के विशिष्ट मान एक्समैंऔर सुविधा के दिए गए मान के साथ जनसंख्या इकाइयों की संख्या फाईआवृत्तियों (f अंग्रेजी शब्द आवृत्ति का प्रारंभिक अक्षर है)।

समूहों की संख्या का निर्धारण

असतत भिन्नता श्रृंखला में समूहों की संख्या चर विशेषता के वास्तव में मौजूदा मूल्यों की संख्या से निर्धारित होती है। यदि विशेषता असतत मान ले सकती है, लेकिन उनकी संख्या बहुत बड़ी है (उदाहरण के लिए, विभिन्न कृषि उद्यमों में वर्ष के 1 जनवरी को पशुधन की संख्या शून्य से दसियों हज़ार सिर तक हो सकती है), तो अंतराल भिन्नता श्रृंखला है बनाना। एक अंतराल परिवर्तनशील श्रृंखला का निर्माण उन विशेषताओं का अध्ययन करने के लिए भी किया जाता है जो अपने अस्तित्व के क्षेत्र में किसी भी, दोनों पूर्णांक और भिन्नात्मक मूल्यों को ले सकते हैं। इस तरह, उदाहरण के लिए, बेचे गए उत्पादों की लाभप्रदता, उत्पादन की एक इकाई की लागत, एक शहर के प्रति 1 निवासी की आय, विभिन्न क्षेत्रों की आबादी के बीच उच्च शिक्षा वाले लोगों का अनुपात और सामान्य तौर पर सभी माध्यमिक विशेषताएं हैं। जिनमें से मूल्यों की गणना एक प्राथमिक विशेषता के मूल्य को दूसरे के मूल्य से विभाजित करके की जाती है (अध्याय 3 देखें)।

अंतराल भिन्नता श्रृंखलाएक तालिका है (दो स्तंभों (या रेखाओं से मिलकर) - विशेषता के अंतराल, जिसकी भिन्नता का अध्ययन किया जा रहा है, और इस अंतराल (आवृत्तियों) में गिरने वाली जनसंख्या की इकाइयों की संख्या, या इस संख्या का अनुपात कुल जनसंख्या (आवृत्ति)।

अंतराल भिन्नता श्रृंखला का निर्माण करते समय, समूहों की इष्टतम संख्या (चरित्र अंतराल) चुनना और अंतराल की लंबाई निर्धारित करना आवश्यक है। चूंकि एक परिवर्तनशील श्रृंखला का विश्लेषण करते समय, विभिन्न अंतरालों में आवृत्तियों की तुलना की जाती है, इसलिए यह आवश्यक है कि अंतराल का मान स्थिर हो। समूहों की इष्टतम संख्या इस तरह से चुनी जाती है कि समुच्चय में विशेषता मूल्यों की विविधता पर्याप्त रूप से परिलक्षित होती है और साथ ही, वितरण की नियमितता, इसका आकार यादृच्छिक आवृत्ति उतार-चढ़ाव से विकृत नहीं होता है। यदि बहुत कम समूह हैं, तो भिन्नता का कोई पैटर्न नहीं होगा; यदि बहुत अधिक समूह हैं, तो यादृच्छिक आवृत्ति छलांग वितरण के आकार को विकृत कर देगी।

अक्सर, परिवर्तनशील श्रृंखला में समूहों की संख्या अमेरिकी सांख्यिकीविद् स्टर्गेस द्वारा अनुशंसित सूत्र का पालन करके निर्धारित की जाती है। (स्टर्गेस):

कहाँ पे - समूहों की संख्या; एन- जनसंख्या का आकार।

यह सूत्र दर्शाता है कि समूहों की संख्या डेटा की मात्रा का एक फलन है।

मान लीजिए कि एक निश्चित वर्ष के लिए अनाज फसलों की उपज के अनुसार क्षेत्र में उद्यमों के वितरण की एक भिन्न श्रृंखला बनाना आवश्यक है। अनाज फसलों वाले कृषि उद्यमों की संख्या 143 थी; न्यूनतम उपज मूल्य 10.7 c/ha है, उच्चतम 53.1 c/ha है। हमारे पास है:

चूंकि समूहों की संख्या पूर्णांक है, इसलिए 8 या 9 समूह बनाने की अनुशंसा की जाती है।

अंतराल के आकार का निर्धारण

समूहों की संख्या जानने के बाद, अंतराल के मूल्य की गणना करें:

हमारे उदाहरण में, अंतराल मान है:

क) 8 समूहों के साथ

बी) 9 समूहों के साथ

एक श्रृंखला बनाने और भिन्नता का विश्लेषण करने के लिए, यदि संभव हो तो अंतराल के आकार और उसकी सीमाओं के गोल मान होना बेहतर है। इसलिए, सबसे अच्छा समाधान यह होगा कि 5 q/ha के अंतराल के साथ 9 समूहों के साथ एक विविधता श्रृंखला बनाई जाए। यह भिन्नता श्रृंखला तालिका में दी गई है। 5.6, और इसका ग्राफिक प्रतिनिधित्व अंजीर में दिया गया है। 5.1.

अंतराल की सीमाओं को अलग-अलग तरीकों से निर्दिष्ट किया जा सकता है: पिछले अंतराल की ऊपरी सीमा अगले एक की निचली सीमा को दोहराती है, जैसा कि तालिका में दिखाया गया है। 5.6, या दोहराना नहीं है।

बाद के मामले में, दूसरे अंतराल को 15.1-20, तीसरे को 20.1-25, आदि के रूप में नामित किया जाएगा, अर्थात। यह माना जाता है कि सभी उपज मूल्यों को आवश्यक रूप से एक दसवें तक गोल किया जाता है। इसके अलावा, अंतराल 15.1-20 के मध्य के साथ एक अवांछनीय जटिलता उत्पन्न होती है, जो कड़ाई से बोलते हुए, पहले से ही 17.5 के बराबर नहीं, बल्कि 17.55 के बराबर होगी; तदनुसार, जब गोल अंतराल 40-60 को 40.1-6.0 से प्रतिस्थापित किया जाता है, तो इसके मध्य 50 के गोल मान के बजाय, हमें 50.5 मिलता है। इसलिए, अंतराल को दोहराए जाने वाले गोल सीमा के साथ छोड़ना बेहतर है और सहमत हैं कि जनसंख्या इकाइयाँ अंतराल की सीमा के बराबर एक विशेषता मान है, अंतराल में शामिल हैं जहां यह सटीक मान पहली बार रिपोर्ट किया गया है। इस प्रकार, पहले समूह में 15 सेंटीमीटर प्रति हेक्टेयर की उपज वाला एक खेत शामिल है, दूसरे में 20 सेंटीमीटर प्रति हेक्टेयर का मूल्य शामिल है, और इसी तरह।

चावल। 5.1. उपज द्वारा खेतों का वितरण

तालिका 5.6

अनाज फसलों की उपज के अनुसार क्षेत्र में खेतों का वितरण

उपज द्वारा खेतों के समूह,

ग/हे एक्सजे

खेतों की संख्या

अंतराल के बीच

ग/हे एक्सजे"

संचित आवृत्ति f'j

विविधता श्रृंखला का ग्राफिक प्रतिनिधित्व

परिवर्तनशील श्रृंखला और उसके गुणों के विश्लेषण में महत्वपूर्ण सहायता एक चित्रमय प्रतिनिधित्व द्वारा प्रदान की जाती है। अंतराल श्रृंखला को एक बार ग्राफ द्वारा दर्शाया जाता है, जिसमें एब्सिस्सा अक्ष पर स्थित सलाखों के आधार अलग-अलग विशेषता के मूल्यों के अंतराल होते हैं, और सलाखों की ऊंचाई पैमाने के अनुरूप आवृत्तियां होती हैं वाई-अक्ष। अनाज की फसल की पैदावार के संदर्भ में क्षेत्र में खेतों के वितरण का एक ग्राफिक प्रतिनिधित्व अंजीर में दिखाया गया है। 5.1. इस तरह के आरेख को अक्सर कहा जाता है हिस्टोग्राम(ग्रीक शब्द "हिस्टोस" से - ऊतक, संरचना)।

तालिका डेटा। 5.5 और अंजीर। 5.1 कई संकेतों के वितरण विशेषता के रूप को दिखाएं: संकेत के औसत अंतराल के मान अधिक सामान्य हैं, कम अक्सर - चरम; सुविधा के छोटे और बड़े मूल्य। इस वितरण का रूप गणितीय आँकड़ों के दौरान माना जाने वाले सामान्य वितरण के कानून के करीब है। महान रूसी गणितज्ञ ए.एम. ल्यपुनोव (1857 - 1918) ने साबित किया कि एक सामान्य वितरण बनता है यदि एक चर चर बड़ी संख्या में कारकों से प्रभावित होता है, जिनमें से किसी का भी प्रमुख प्रभाव नहीं होता है। अनाज फसलों की उपज में भिन्नता को प्रभावित करने वाले कई लगभग समान कारकों का एक यादृच्छिक संयोजन, प्राकृतिक और कृषि तकनीकी, आर्थिक, सामान्य वितरण कानून के करीब उपज के संदर्भ में क्षेत्र के खेतों का वितरण बनाता है।

यदि कोई असतत परिवर्तनशील श्रृंखला है या अंतराल के मध्य बिंदुओं का उपयोग किया जाता है, तो ऐसी परिवर्तनशील श्रृंखला के चित्रमय प्रतिनिधित्व को कहा जाता है बहुभुज(ग्रीक शब्दों से - एक बहुभुज)। आप में से प्रत्येक निर्देशांक के साथ बिंदुओं को सीधी रेखाओं से जोड़कर आसानी से इस ग्राफ का निर्माण कर सकता है एक्स,तथा /।

लगभग 5:8 के अनुपात में किसी बहुभुज या चार्ट की ऊंचाई और उसके आधार के अनुपात की अनुशंसा की जाती है।

आवृत्ति की अवधारणा

यदि तालिका में 5.6 कुल के प्रतिशत के रूप में उत्पादकता के एक या दूसरे स्तर के साथ खेतों की संख्या व्यक्त करें, खेतों की पूरी संख्या (143) को 100% के रूप में लेते हुए, औसत उपज की गणना निम्नानुसार की जा सकती है:

कहाँ पे वू- विविधता श्रृंखला की 7 वीं श्रेणी की आवृत्ति;

संचयी बटवारा

विविधता श्रृंखला का रूपांतरित रूप है संचित आवृत्तियों की एक संख्या,तालिका में दिया गया। 5.6, कॉलम 5। यह आबादी में इकाइयों की संख्या के लिए मूल्यों की एक श्रृंखला है जो विशेषता के संबंधित अंतराल मूल्यों की निचली सीमा से कम और बराबर है। ऐसी श्रंखला कहलाती है संचयी।आप संचयी वितरण "से कम नहीं" बना सकते हैं, या आप "इससे अधिक" बना सकते हैं। पहले मामले में, संचयी वितरण प्लॉट को कहा जाता है संचय करना,क्षण में - औजाइव(चित्र 5.2)।

घनत्व, वितरण

यदि आपको असमान अंतरालों वाली एक परिवर्तनशील श्रृंखला से निपटना है, तो तुलनीयता के लिए आपको अंतराल की इकाई में आवृत्ति या आवृत्ति लाने की आवश्यकता है। परिणामी अनुपात कहलाता है वितरण घनत्व:

वितरण घनत्व का उपयोग सामान्यीकरण संकेतकों की गणना के लिए और असमान अंतरालों के साथ भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए किया जाता है।

चावल। 5.2. ओजिवा और संचयी उपज वितरण

5.7. विविधता की संरचनात्मक विशेषताएं पंक्ति

वितरण माध्यिका

भिन्नता का अध्ययन करते समय, परिवर्तनशील श्रृंखला की ऐसी विशेषताओं का उपयोग किया जाता है जो मात्रात्मक रूप से इसकी संरचना, संरचना का वर्णन करती हैं। ऐसा है, उदाहरण के लिए, माध्यिका-जनसंख्या को दो समान भागों में विभाजित करने वाले चर विशेषता का मान ~ माध्यिका से कम विशेषता मान और माध्यिका से अधिक विशेषता मानों के साथ (तालिका 5.5 में पाँच का तीसरा बैंक, अर्थात 196 बिलियन रूबल)।

तालिका के उदाहरण पर। 5.5 देखा मूलभूत अंतरमाध्यिका और माध्य के बीच। माध्यिका श्रेणीबद्ध श्रृंखला के किनारों पर विशेषता मानों पर निर्भर नहीं करती है। भले ही सेंट पीटर्सबर्ग में सबसे बड़े बैंक की राजधानी दस गुना बड़ी हो, लेकिन औसत मूल्य नहीं बदलेगा। इसलिए, माध्य का उपयोग अक्सर अंकगणित माध्य की तुलना में किसी विशेषता के विशिष्ट मूल्य के अधिक विश्वसनीय संकेतक के रूप में किया जाता है, यदि मानों की श्रृंखला विषम है, तो माध्य से तेज विचलन शामिल हैं। इस श्रृंखला में, इक्विटी का औसत मूल्य, 269 बिलियन रूबल के बराबर, सबसे बड़े विकल्प के मजबूत प्रभाव के तहत बनाया गया था। 80% बैंकों के पास औसत से कम पूंजी है और केवल 20% के पास अधिक है। यह संभावना नहीं है कि इस तरह के औसत को एक विशिष्ट मूल्य माना जा सकता है। जनसंख्या इकाइयों की एक समान संख्या के साथ, माध्यिका को दो केंद्रीय विकल्पों के अंकगणितीय औसत के रूप में लिया जाता है, उदाहरण के लिए, विशेषता के दस मानों के साथ, क्रमबद्ध श्रृंखला में पांचवें और छठे मूल्यों का औसत।

अंतराल परिवर्तनशील श्रृंखला में माध्यिका ज्ञात करने के लिए सूत्र (5.14) का प्रयोग किया जाता है।

जहाँ मैं माध्यिका हूँ;

एक्स 0 -अंतराल की निचली सीमा जिसमें माध्यिका स्थित है;

एफएम ई-1 - माध्यिका से पहले के अंतराल में संचित आवृत्ति;

एफ मी- मध्य अंतराल में आवृत्ति;

मैं- अंतराल मूल्य;

- समूहों की संख्या।

तालिका में। 5.6 माध्यिका 143 मानों का औसत है, अर्थात। उत्पादकता की श्रृंखला मूल्य की शुरुआत से बहत्तर सेकंड। जैसा कि संचित आवृत्तियों की संख्या से देखा जा सकता है, यह चौथे अंतराल में है। फिर

जनसंख्या इकाइयों की एक विषम संख्या के साथ, माध्यिका संख्या, जैसा कि हम देखते हैं, not . के बराबर है , सूत्र (5.14), a . के रूप में , लेकिन यह अंतर महत्वपूर्ण नहीं है और आमतौर पर व्यवहार में इसे नजरअंदाज कर दिया जाता है।

एक असतत परिवर्तनशील श्रृंखला में, माध्यिका को उस समूह में विशेषता का मान माना जाना चाहिए जिसमें संचित आवृत्ति;

आधी से अधिक आबादी। उदाहरण के लिए, तालिका में डेटा के लिए। 5.1 प्रति गेम बनाए गए गोलों की औसत संख्या 2 होगी।

वितरण चतुर्थक

इसी तरह, माध्यिका के समान, विशेषता के मूल्यों की गणना की जाती है, जनसंख्या को इकाइयों की संख्या के बराबर चार भागों में विभाजित किया जाता है। इन राशियों को कहा जाता है चतुर्थकोंऔर एक राजधानी लैटिन "अक्षर" द्वारा निरूपित किया जाता है क्यूएक हस्ताक्षरित चतुर्थक संख्या बैज के साथ। यह स्पष्ट है कि क्यू 2 मुझसे मेल खाता है। पहले और तीसरे चतुर्थक के लिए, हम तालिका के अनुसार सूत्र और गणना प्रस्तुत करते हैं। 5.6.

इसलिये क्यू 2 = Me = 29.5 c/ha, यह देखा जा सकता है कि प्रथम चतुर्थक और माध्यिका के बीच का अंतर माध्यिका और तृतीय चतुर्थक के बीच की तुलना में कम है। यह तथ्य वितरण के मध्य क्षेत्र में कुछ विषमता की उपस्थिति को इंगित करता है, जो अंजीर में भी ध्यान देने योग्य है। 5.1.

श्रृंखला को पांच बराबर भागों में विभाजित करने वाले विशेषता मान कहलाते हैं Quintilesदस भागों में दशमांश,एक सौ भाग शतमक।चूंकि इन विशेषताओं का उपयोग केवल तभी किया जाता है जब परिवर्तनशील श्रृंखला की संरचना का विस्तार से अध्ययन करना आवश्यक हो, हम उनके सूत्र और गणना नहीं देंगे।

वितरण मोड

निश्चित रूप से महत्त्वविशेषता का ऐसा मूल्य है जो अध्ययन की गई श्रृंखला में, कुल मिलाकर सबसे अधिक बार होता है। इस मात्रा को कहा जाता है फ़ैशनऔर मो. एक असतत श्रृंखला में, उच्चतम आवृत्ति वाले फीचर के मूल्य के रूप में गणना के बिना मोड निर्धारित किया जाता है। उदाहरण के लिए, तालिका के अनुसार। 5.1 सबसे अधिक बार एक फुटबॉल मैच में 2 गोल किए गए - 71 बार। मोड संख्या 2 है। आमतौर पर विशेषता के एक मोडल मान वाली पंक्तियाँ होती हैं। यदि किसी विशेषता के दो या अधिक समान (और यहां तक ​​कि कई भिन्न, लेकिन पड़ोसी से अधिक) मान भिन्नता श्रृंखला में मौजूद हैं, तो इसे क्रमशः बिमोडल ("ऊंट जैसा") या मल्टीमॉडल माना जाता है। यह सेट की विविधता को इंगित करता है, संभवतः विभिन्न मोड के साथ कई सेटों के कुल का प्रतिनिधित्व करता है।

तो यहां से आए पर्यटकों की भीड़ में विभिन्न देश, स्थानीय निवासियों के बीच प्रचलित एक फैशनेबल कपड़ों के बजाय, आप द्वारा अपनाए गए विभिन्न "फैशन" का मिश्रण पा सकते हैं अलग-अलग लोगशांति।

एक अंतराल भिन्नता श्रृंखला में, विशेष रूप से एक विशेषता की निरंतर भिन्नता के साथ, कड़ाई से बोलते हुए, सुविधा का प्रत्येक मान केवल एक बार होता है। मोडल अंतराल उच्चतम आवृत्ति वाला अंतराल है। इस अंतराल के भीतर, विशेषता का सशर्त मान पाया जाता है, जिसके पास वितरण घनत्व, यानी। एक चर विशेषता की माप की प्रति इकाई जनसंख्या इकाइयों की संख्या अधिकतम तक पहुंच जाती है। यह एक सशर्त मान है और माना जाता है डॉट फैशन।यह मान लेना तर्कसंगत है कि ऐसा बिंदु मोड अंतराल की सीमाओं के करीब स्थित है, जिसके आगे पड़ोसी अंतराल में आवृत्ति मोडल अंतराल की अन्य सीमा से परे अंतराल में आवृत्ति से अधिक है। इसलिए हमारे पास आमतौर पर इस्तेमाल किया जाने वाला सूत्र (5.15) है:

कहाँ पे एक्स 0 - मोडल अंतराल की निचली सीमा;

च मो - मोडल अंतराल में आवृत्ति;

च मो -1 - पिछले अंतराल में आवृत्ति;

च मो +1 - मोडल के बाद अगले अंतराल में आवृत्ति;

मैं - अंतराल मूल्य।

तालिका के अनुसार। 5.6 फैशन की गणना करें:

मोड गणना अंतराल श्रृंखलाबहुत सशर्त। लगभग Mo को आलेखीय रूप से निर्धारित किया जा सकता है (देखिए आकृति 5.1)।

अंकगणित माध्य मान भी परिवर्तनशील श्रृंखला की संरचना के अध्ययन के लिए प्रासंगिक है, हालांकि इस सामान्यीकरण संकेतक का मुख्य मूल्य अलग है। उपज द्वारा खेतों की वितरण श्रृंखला में (तालिका 5.6), औसत उपज की गणना अंतराल के आवृत्ति-भारित मध्य के रूप में की जाती है एक्स(सूत्र द्वारा (5.2)):

माध्य, माध्यिका और बहुलक के बीच संबंध

इस बंटन में अंकगणित माध्य, माध्यिका और बहुलक के बीच का अंतर छोटा है। यदि आकार में वितरण सामान्य नियम के करीब है, तो माध्य बहुलक और माध्य मान के बीच होता है, और बहुलक की तुलना में माध्य के अधिक निकट होता है।

दाएं तरफा विषमता के साथ एक्स̅ > मैं > मो;

बाएं तरफा विषमता के साथ एक्स̅ < मैं< Mo.

मध्यम विषम वितरण के लिए, समानता सत्य है:

5.8. आकार और तीव्रता के उपाय विविधताओं

भिन्नता के पूर्ण माध्य आकार

समुच्चय में विशेषता की भिन्नता के अध्ययन में अगला चरण बल की विशेषताओं का मापन, भिन्नता का परिमाण है। उनमें से सबसे सरल हो सकता है दायराया भिन्नता आयाम -मूल्यों के अध्ययन किए गए सेट में उपलब्ध मूल्यों से किसी विशेषता के अधिकतम और न्यूनतम मूल्यों के बीच पूर्ण अंतर। इस प्रकार, भिन्नता की सीमा की गणना सूत्र द्वारा की जाती है

चूंकि सीमा का परिमाण विशेषता के मूल्यों में केवल अधिकतम अंतर को दर्शाता है, यह पूरी आबादी में इसकी भिन्नता की नियमित ताकत को माप नहीं सकता है। इस उद्देश्य के लिए अभिप्रेत संकेतक को बिना किसी अपवाद के, कुल में विशेषता के मूल्यों में सभी अंतरों को ध्यान में रखना चाहिए और सामान्य करना चाहिए। ऐसे अंतरों की संख्या जनसंख्या की सभी इकाइयों में से दो के संयोजनों की संख्या के बराबर होती है; तालिका के अनुसार। 5.6 यह होगा: सी ^= 10 153. हालांकि, सभी विचलनों पर विचार करने, गणना करने और औसत करने की कोई आवश्यकता नहीं है। विशेषता के अंकगणितीय माध्य मान से व्यक्तिगत विशेषता मानों के विचलन के औसत का उपयोग करना आसान है, और उनमें से केवल 143 हैं। लेकिन अंकगणित माध्य मान से विशेषता मानों का औसत विचलन, के अनुसार उत्तरार्द्ध की प्रसिद्ध संपत्ति के लिए, शून्य है। इसलिए, भिन्नता की ताकत का एक संकेतक बीजीय नहीं है औसत विचलन, एक विचलन का औसत मापांक:

तालिका के अनुसार। 5.6 मध्य मॉड्यूल, या औसत रैखिक विचलन,निरपेक्ष मान में एक आवृत्ति-भारित विचलन मॉड्यूलो के रूप में गणना की जाती है, अंकगणितीय माध्य से अंतराल के मध्य बिंदु, अर्थात। सूत्र के अनुसार

इसका मतलब यह है कि, औसतन, खेतों के अध्ययन किए गए सेट में उपज क्षेत्र में औसत उपज से 6.85 c/ha से विचलित होती है। गणना और व्याख्या की सरलता इस सूचक के सकारात्मक पहलू हैं, हालांकि, मॉड्यूल के गणितीय गुण "खराब" हैं: उन्हेंकिसी भी संभावित कानून के अनुरूप नहीं लाया जा सकता, जिसमें शामिल हैं सामान्य वितरण, जिसका पैरामीटर विचलन का औसत मॉड्यूल नहीं है, लेकिन मानक विचलन(अंग्रेजी कंप्यूटर प्रोग्राम में "मानक विचलन" कहा जाता है, संक्षेप में "s.d." या बस « एस», रूसी भाषी में - एनकेओ)। सांख्यिकीय साहित्य में, माध्य मान से मानक विचलन को आमतौर पर एक छोटे (लोअरकेस) द्वारा दर्शाया जाता है ग्रीक अक्षरसिग्मा (सेंट) or एस(अध्याय 7 देखें):

रैंकिंग श्रृंखला के लिए

अंतराल श्रृंखला के लिए

तालिका के अनुसार। 5.6 अनाज की उपज का मानक विचलन था:

यह ध्यान दिया जाना चाहिए कि औसत मूल्य और अंतराल के मध्य बिंदुओं के कुछ गोलाई, उदाहरण के लिए, पूर्णांक वाले के लिए, σ के मूल्य पर बहुत कम प्रभाव पड़ता है, जो तब 8.55 सी / हेक्टेयर होगा।

वास्तविक आबादी में परिमाण में मानक विचलन हमेशा औसत विचलन मॉड्यूल से अधिक होता है। अनुपात (पर: एकसमुच्चय में तेज, प्रमुख विचलन की उपस्थिति पर निर्भर करता है और मुख्य द्रव्यमान के साथ विषम तत्वों के साथ समुच्चय के "संदूषण" के संकेतक के रूप में काम कर सकता है: यह अनुपात जितना बड़ा होगा, उतना ही मजबूत "संदूषण" होगा। के लिये सामान्य कानूनवितरण : ए = 1,2.

फैलाव की अवधारणा

मानक विचलन का वर्ग मान देता है फैलाव 2 .फैलाव सूत्र:

सरल (अवर्गीकृत डेटा के लिए):

भारित (समूहीकृत डेटा के लिए):

गणितीय आँकड़ों की लगभग सभी विधियाँ परिक्षेपण पर आधारित होती हैं। प्रसरणों को जोड़ने का नियम बहुत व्यावहारिक महत्व का है (अध्याय 6 देखें)।

भिन्नता के अन्य उपाय

भिन्नता की ताकत का एक और संकेतक, जो इसे पूरी आबादी में नहीं, बल्कि केवल इसके मध्य भाग में दर्शाता है औसत तिमाही दूरी,वे। चतुर्थक के बीच अंतर का औसत मूल्य, नीचे दर्शाया गया है क्यू:

तालिका में उपज द्वारा कृषि उद्यमों के वितरण के लिए। 5.2

क्यू\u003d (36.25 - 25.09): 2 \u003d 5.58 किग्रा / हेक्टेयर। जनसंख्या के मध्य भाग में भिन्नता की ताकत, एक नियम के रूप में, पूरी आबादी की तुलना में कम है। विचलन के औसत मॉड्यूल और औसत त्रैमासिक विचलन के बीच का अनुपात भी भिन्नता की संरचना का अध्ययन करने के लिए कार्य करता है: इस अनुपात का एक बड़ा मूल्य कमजोर रूप से भिन्न "कोर" और इस कोर के चारों ओर एक जोरदार बिखरे हुए वातावरण की उपस्थिति को इंगित करता है, या "प्रभामंडल "अध्ययनित आबादी में। तालिका में डेटा के लिए। 5.6 अनुपात ए: क्यू= 1.23, जो जनसंख्या के मध्य भाग और उसकी परिधि में भिन्नता की ताकत में एक छोटे से अंतर को दर्शाता है।

भिन्नता की तीव्रता का आकलन करने के लिए और विभिन्न आबादी में इसकी तुलना करने के लिए, और इससे भी अधिक विभिन्न लक्षणों के लिए, यह आवश्यक है भिन्नता के सापेक्ष संकेतक।उनकी गणना भिन्नता की ताकत के निरपेक्ष संकेतकों के अनुपात के रूप में की जाती है, जिसकी चर्चा पहले की गई थी, विशेषता के अंकगणितीय माध्य मान से। हमें निम्नलिखित संकेतक मिलते हैं:

1) भिन्नता की सापेक्ष सीमा p:

2) सापेक्ष विचलन मोडुलो टी:

3) सापेक्ष वर्ग विचलन के रूप में भिन्नता का गुणांक वी:

4) सापेक्ष तिमाही दूरी डी:

कहाँ पे क्यू - माध्य चतुर्थक दूरी।

तालिका के अनुसार उपज को अलग करने के लिए। 5.6 ये संकेतक हैं:

ρ = 42.4: 30.3 = 1.4, या 140%;

टी= 6.85: 30.3 = 0.226, या 22.6%;

वी = 8.44: 30.3 = 0.279, या 27.9%;

डी= 5.58: 30.3 = 0.184, या 18.4%।

भिन्नता की तीव्रता की डिग्री का आकलन केवल एक निश्चित संरचना की आबादी की प्रत्येक व्यक्तिगत विशेषता के लिए संभव है। तो, कृषि उद्यमों के एक समूह के लिए, एक ही प्राकृतिक क्षेत्र में उपज में भिन्नता का आकलन कमजोर के रूप में किया जा सकता है यदि वी < 10%, умеренная при 10% < वी < 25% и сильная при वी > 25%.

इसके विपरीत, पहले से ही 7% ​​के गुणांक पर वयस्क पुरुषों या महिलाओं की आबादी में ऊंचाई में भिन्नता का आकलन किया जाना चाहिए और लोगों द्वारा इसे मजबूत माना जाना चाहिए। इस प्रकार, भिन्नता की तीव्रता के आकलन में प्रेक्षित भिन्नता की तुलना इसकी कुछ सामान्य तीव्रता के साथ की जाती है, जिसे मानक के रूप में लिया जाता है। हम इस तथ्य के आदी हैं कि उत्पादकता, आय या प्रति व्यक्ति आय, एक इमारत में रहने वाले कमरों की संख्या कई या दस गुना भिन्न हो सकती है, लेकिन लोगों की ऊंचाई में कम से कम डेढ़ गुना का अंतर पहले से ही माना जाता है बहुत ताकतवर।

विभिन्न शक्ति, तीव्रता भिन्नता के कारण उद्देश्य कारण. उदाहरण के लिए, 24 जनवरी, 1997 को सेंट पीटर्सबर्ग में वाणिज्यिक बैंकों में अमेरिकी डॉलर की बिक्री मूल्य 5675 से 5640 रूबल तक भिन्न था। 5664 रूबल की औसत कीमत पर। भिन्नता की सापेक्ष सीमा ρ = 35:5664 = 0.6%। इस तरह की एक छोटी सी भिन्नता इस तथ्य के कारण है कि डॉलर विनिमय दर में महत्वपूर्ण अंतर के साथ, "महंगे" बैंक से "सस्ता" लोगों के लिए खरीदारों का बहिर्वाह तुरंत होगा। इसके विपरीत, रूस के विभिन्न क्षेत्रों में एक किलोग्राम आलू या गोमांस की कीमत बहुत भिन्न होती है - दसियों प्रतिशत या उससे अधिक। यह उत्पादक क्षेत्र से उपभोक्ता क्षेत्र तक माल की डिलीवरी के लिए अलग-अलग लागतों के कारण है, अर्थात। कहावत "विदेश में एक बछिया आधा है, लेकिन एक रूबल ले जाया जाता है।"

5.9. वितरण और संकेतक के क्षण इसके रूप

वितरण केंद्रीय क्षण

भिन्नता की प्रकृति के आगे के अध्ययन के लिए, इसके अंकगणितीय माध्य मान से एक विशेषता के अलग-अलग मूल्यों के विचलन के विभिन्न डिग्री के औसत मूल्यों का उपयोग किया जाता है। इन संकेतकों को कहा जाता है केंद्रीय क्षणउस शक्ति के अनुरूप क्रम का वितरण जिससे विचलन उठाया जाता है (तालिका 5.7), या केवल क्षण (गैर-केंद्रीय क्षण शायद ही कभी उपयोग किए जाते हैं और यहां पर विचार नहीं किया जाएगा)। तीसरे क्षण ts- का मान, इसके चिन्ह की तरह, ऋणात्मक घनों पर विचलन के धनात्मक घनों की प्रबलता पर या इसके विपरीत पर निर्भर करता है। सामान्य और किसी भी अन्य सख्ती से सममित वितरण के तहत, सकारात्मक घनों का योग ऋणात्मक घनों के योग के बराबर होता है।

विषमता संकेतक

तीसरे क्रम के क्षण के आधार पर, वितरण की विषमता की डिग्री को दर्शाने वाले एक संकेतक का निर्माण करना संभव है:

जैसाबुलाया विषमता गुणांक।इसकी गणना समूहीकृत और अवर्गीकृत दोनों प्रकार के आंकड़ों से की जा सकती है। तालिका के अनुसार। 5.6 विषमता सूचकांक था:

वे। विषमता मामूली है। अंग्रेजी सांख्यिकीविद् के. पियर्सन ने औसत मूल्य और बहुलक के बीच के अंतर के आधार पर विषमता का एक और संकेतक प्रस्तावित किया

तालिका 5.7

केंद्रीय क्षण

तालिका के अनुसार। 5.6 पियर्सन का सूचकांक था:

पियर्सन सूचकांक वितरण श्रृंखला के मध्य भाग में विषमता की डिग्री पर निर्भर करता है, और विषमता सूचकांक, तीसरे क्रम के क्षण के आधार पर, विशेषता के चरम मूल्यों पर निर्भर करता है। इस प्रकार, हमारे उदाहरण में, वितरण के मध्य भाग में, विषमता अधिक महत्वपूर्ण है, जिसे ग्राफ से भी देखा जा सकता है (चित्र 5.1)। मजबूत दाएं तरफा और बाएं तरफा (सकारात्मक और नकारात्मक) विषमता वाले वितरण अंजीर में दिखाए गए हैं। 5.3.

वितरण के कर्टोसिस की विशेषता

चौथे क्रम के क्षण की मदद से, वितरण श्रृंखला की विषमता से भी अधिक जटिल संपत्ति, कहा जाता है कर्टोसिस


चावल। 5.3. विषमता, वितरण

कुर्टोसिस संकेतक की गणना सूत्र द्वारा की जाती है

(5.30)

अक्सर कर्टोसिस की व्याख्या वितरण की "स्थिरता" के रूप में की जाती है, लेकिन यह सटीक और अपूर्ण है। वितरण ग्राफ विशेषता भिन्नता की ताकत के आधार पर मनमाने ढंग से खड़ी दिख सकता है: कमजोर भिन्नता, किसी दिए गए पैमाने पर वितरण वक्र तेज होता है। इस तथ्य का उल्लेख नहीं करने के लिए कि एब्सिस्सा और कोर्डिनेट के साथ तराजू को बदलकर, किसी भी वितरण को कृत्रिम रूप से "खड़ी" और "ढलान" बनाया जा सकता है। यह दिखाने के लिए कि वितरण का कर्टोसिस क्या है और इसकी सही व्याख्या करने के लिए, आपको श्रृंखला की तुलना भिन्नता की समान शक्ति (σ का समान मान) और विभिन्न कर्टोसिस संकेतकों के साथ करने की आवश्यकता है। कर्टोसिस को तिरछापन के साथ भ्रमित न करने के लिए, सभी तुलना की गई पंक्तियों को सममित होना चाहिए। ऐसी तुलना अंजीर में दिखाई गई है। 5.4.

चित्र 5.4। वितरण कुर्टोसिस

एक सामान्य वितरण के साथ एक परिवर्तनशील श्रृंखला के लिए, मान मैं कुर्टोसिस संकेतक, सूत्र (5.30) द्वारा परिकलित, j तीन के बराबर है।

हालांकि, ऐसे संकेतक को "कुर्टोसिस" शब्द नहीं कहा जाना चाहिए, जिसका अर्थ अनुवाद में "अतिरिक्त" है। शब्द "कुर्टोसिस" को सूत्र (5.30) के अनुसार अनुपात में ही लागू नहीं किया जाना चाहिए, लेकिन सामान्य वितरण के दिए गए अनुपात के मूल्य के साथ अध्ययन के तहत वितरण के लिए इस तरह के अनुपात की तुलना करने के लिए, अर्थात। 3 के मान के साथ। इसलिए कर्टोसिस इंडिकेटर के लिए अंतिम सूत्र, अर्थात। भिन्नता की समान शक्ति के साथ सामान्य वितरण की तुलना में अधिकता का रूप है:

रैंकिंग श्रृंखला के लिए

अंतराल और असतत भिन्नता श्रृंखला के लिए

एक सकारात्मक कुर्टोसिस की उपस्थिति, साथ ही एक छोटी त्रैमासिक दूरी और एक बड़े मानक विचलन के बीच पहले से उल्लेखनीय महत्वपूर्ण अंतर का मतलब है कि घटना के अध्ययन किए गए द्रव्यमान में एक "कोर" होता है जो इस विशेषता में थोड़ा भिन्न होता है, जो एक से घिरा होता है बिखरा हुआ "प्रभामंडल"। एक महत्वपूर्ण नकारात्मक कुर्टोसिस के साथ, ऐसा कोई "कोर" बिल्कुल नहीं है।

वितरण के तिरछापन और कर्टोसिस के संकेतकों के मूल्यों से, कोई वितरण की निकटता को सामान्य से आंक सकता है, जो सहसंबंध के परिणामों के मूल्यांकन के लिए आवश्यक हो सकता है और प्रतिगमन विश्लेषण, पूर्वानुमानों के संभाव्य मूल्यांकन की संभावनाएं (अध्याय 7,8,9 देखें)। वितरण को सामान्य माना जा सकता है, या अधिक सटीक रूप से, सामान्य वितरण के साथ वास्तविक वितरण की समानता की परिकल्पना को अस्वीकार नहीं किया जा सकता है यदि तिरछापन और कुर्टोसिस संकेतक उनके दो गुना मानक विचलन सेमी से अधिक नहीं हैं। इन मानक विचलन की गणना सूत्रों द्वारा की जाती है:

5.10. अधिकतम संभव मान भिन्नता संकेतक और उनका अनुप्रयोग

किसी भी प्रकार के सांख्यिकीय संकेतकों को लागू करते समय, यह जानना उपयोगी होता है कि अध्ययन के तहत सिस्टम के लिए दिए गए संकेतक के अधिकतम संभव मूल्य क्या हैं और वास्तव में देखे गए मूल्यों का अधिकतम संभव अनुपात क्या है। मात्रा संकेतकों की भिन्नता का अध्ययन करते समय यह समस्या विशेष रूप से प्रासंगिक है, जैसे कि एक निश्चित प्रकार के उत्पाद के उत्पादन की मात्रा, कुछ संसाधनों की उपलब्धता, पूंजी निवेश का वितरण, आय और लाभ। आइए हम सैद्धांतिक और व्यावहारिक रूप से इस मुद्दे पर क्षेत्र में कृषि उद्यमों के बीच सब्जी उत्पादन के वितरण के उदाहरण पर विचार करें।

यह स्पष्ट है कि भिन्नता संकेतकों का न्यूनतम संभव मूल्य जनसंख्या की सभी इकाइयों के बीच मात्रा विशेषता के कड़ाई से समान वितरण के साथ प्राप्त किया जाता है, अर्थात, प्रत्येक कृषि उद्यम में उत्पादन की समान मात्रा के साथ। इस तरह के एक सीमित (बेशक, व्यवहार में बहुत ही असंभव) वितरण में, कोई भिन्नता नहीं है और सभी संकेतक, विविधताएं शून्य के बराबर हैं।

विविधता संकेतकों का अधिकतम संभव मूल्य जनसंख्या में मात्रा विशेषता के इस तरह के वितरण के साथ प्राप्त किया जाता है, जिसमें इसकी पूरी मात्रा जनसंख्या की एक इकाई में केंद्रित होती है; उदाहरण के लिए, सब्जी उत्पादन की पूरी मात्रा - जिले के एक कृषि उद्यम में अन्य खेतों में उनके उत्पादन के अभाव में। जनसंख्या की एक इकाई में किसी विशेषता के आयतन के इस तरह के एक अत्यंत संभावित एकाग्रता की संभावना इतनी कम नहीं है; किसी भी मामले में, यह कड़ाई से समान वितरण की संभावना से बहुत अधिक है।

इसके अधिकतम के संकेतित सीमित मामले के लिए भिन्नता घातांक पर विचार करें। आइए हम जनसंख्या इकाइयों की संख्या को निरूपित करें पी,विशेषता का औसत मूल्य एक्स̅ , तो कुल में सुविधा की कुल मात्रा के रूप में व्यक्त किया जाएगा एक्स̅ पी।यह सारा आयतन जनसंख्या की एक इकाई में केंद्रित है, ताकि एक्समैक्स= एक्स̅ पी. एक्समिनट = 0, यह इस प्रकार है कि आयाम का अधिकतम मान (भिन्नता की सीमा) के बराबर है:

माध्य मॉड्यूलो और द्विघात विचलन के अधिकतम मूल्यों की गणना करने के लिए, हम विचलन की एक तालिका (तालिका 5.8) का निर्माण करेंगे।

तालिका 5.8

औसत से विचलन के मॉड्यूल और वर्ग अधिकतमसंभावित भिन्नता

जनसंख्या इकाई संख्या

फ़ीचर मान

माध्य से विचलन

एक्स मैं - एक्स̅

विचलन मॉड्यूल

|एक्स मैं - एक्स̅|

विचलन वर्ग

(एक्समैं- एक्स̅ ) 2

एक्स̅ पी

एक्स̅ (पी - 1)

-एक्स̅

-एक्स̅

-एक्स̅

एक्स̅ (पी - 1)

एक्स̅

एक्स̅

एक्स̅

एक्स̅ 2 (पी - 1) 2

एक्स̅ 2

एक्स̅ 2

एक्स̅ 2

एक्स̅ पी

2एक्स̅ (पी - 1)

एक्स̅ 2 [(पी - 1) 2 +(एन-1)]

तालिका की अंतिम पंक्ति में भावों के आधार पर। 5.8, हम भिन्नता संकेतकों के निम्नलिखित अधिकतम संभव मान प्राप्त करते हैं।

विचलन का औसत मॉड्यूल, या औसत रैखिक विचलन:

मानक विचलन:

सापेक्ष मॉड्यूलर (रैखिक) विचलन:

भिन्नता का गुणांक:

त्रैमासिक दूरी के लिए, अधिकतम संभव भिन्नता वाले सिस्टम में सुविधा वितरण की एक पतित संरचना होती है, जिसमें संरचना की कोई ("काम न करें") विशेषताएं नहीं होती हैं: माध्यिका, चतुर्थक, और इसी तरह।

भिन्नता के मुख्य संकेतकों के अधिकतम संभव मूल्यों के लिए प्राप्त सूत्रों के आधार पर, निष्कर्ष जनसंख्या की मात्रा पर इन मूल्यों की निर्भरता के बारे में है। पी।इस निर्भरता को तालिका में संक्षेपित किया गया है। 5.9.

परिवर्तन की सबसे कम सीमा और जनसंख्या के आकार पर कमजोर निर्भरता औसत मापांक और सापेक्ष रैखिक विचलन को प्रकट करती है। इसके विपरीत, मानक विचलन और भिन्नता का गुणांक जनसंख्या इकाइयों की संख्या पर बहुत अधिक निर्भर करता है। विभिन्न आकारों की आबादी में भिन्नता की तीव्रता की तुलना करते समय इस निर्भरता को ध्यान में रखा जाना चाहिए। यदि छह उद्यमों के योग में उत्पादन की मात्रा में भिन्नता का गुणांक 0.58 था, और कुल 20 उद्यमों में यह 0.72 था, तो क्या यह निष्कर्ष निकालना उचित है कि दूसरी आबादी में उत्पादन की मात्रा अधिक असमान है? दरअसल, पहले, छोटे में, यह अधिकतम संभव का 0.58: 2.24 = 25.9% था, यानी। सीमा, छह में से एक उद्यम में उत्पादन की एकाग्रता का स्तर, और दूसरे, बड़े सेट में, भिन्नता का मनाया गया गुणांक अधिकतम संभव का केवल 0.72: 4.36 = 16.5% था।

तालिका 5.9

जनसंख्या के विभिन्न आकारों के लिए वॉल्यूमेट्रिक विशेषता की भिन्नता के संकेतकों के मूल्यों को सीमित करें

जनगणना

संकेतकों का अधिकतम मान

एक्स̅

एक्स̅

1,5एक्स̅

1,73एक्स̅

1,67एक्स̅

2,24एक्स̅

1,80एक्स̅

3एक्स̅

1,90एक्स̅

4,36एक्स̅

1,96एक्स̅

7एक्स̅

1,98एक्स̅

9,95एक्स̅

2एक्स̅

व्यावहारिक महत्व का ऐसा संकेतक है जो वास्तविक औसत विचलन मॉड्यूल के अनुपात को अधिकतम संभव बनाता है। इस प्रकार, कुल छह उद्यमों के लिए यह अनुपात था: 0.47: 1.67 = 0.281, या 28.1%। प्राप्त संकेतक की व्याख्या इस प्रकार है: उद्यमों के बीच उत्पादन के देखे गए वितरण से एक समान वितरण में जाने के लिए, पुनर्वितरण करना आवश्यक होगा

, या कुल उत्पादन का 23.4%। यदि उत्पादन की वास्तविक सांद्रता की डिग्री (σ या . का वास्तविक मूल्य) वी) एक उद्यम में उत्पादन के एकाधिकार के मामले में सीमांत मूल्य का एक निश्चित अंश है, तो वास्तविक संकेतक का सीमांत से अनुपात उत्पादन की एकाग्रता (या एकाधिकार) की डिग्री को चिह्नित कर सकता है।

संरचना में परिवर्तन या परिवर्तन के संकेतकों के वास्तविक मूल्यों के अनुपात को अधिकतम संभव के लिए संरचनात्मक बदलावों के विश्लेषण में भी उपयोग किया जाता है (अध्याय 11 देखें)।

1. जेनी के.औसत मान। - एम .: सांख्यिकी, 1970।

2. क्रिवेनकोवा एल.एन., युज़बाशेव एम.एम.विविधता संकेतकों के अस्तित्व का क्षेत्र और उसका अनुप्रयोग // सांख्यिकी का बुलेटिन। - 1991. - नंबर 6। - एस 66-70।

3. पास्खावर आई. एस.आंकड़ों में औसत मूल्य। - एम .: सांख्यिकी। 1979.

4. शूराकोव वी। वी।, दयातबेगोव डी। एम। और अन्य।स्वचालित कार्यस्थलसांख्यिकीय डाटा प्रोसेसिंग (अध्याय 4. प्रारंभिक सांख्यिकीय डाटा प्रोसेसिंग)। - एम .: वित्त और सांख्यिकी, 1990।

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...