सहसंबंध के महत्व के लिए विद्यार्थी का परीक्षण। प्रतिगमन और सहसंबंध पैरामीटर का सांख्यिकीय महत्व

पियर्सन का सहसंबंध परीक्षण एक पैरामीट्रिक सांख्यिकी पद्धति है जो आपको दो मात्रात्मक संकेतकों के बीच एक रैखिक संबंध की उपस्थिति या अनुपस्थिति को निर्धारित करने के साथ-साथ इसकी निकटता और सांख्यिकीय महत्व का मूल्यांकन करने की अनुमति देती है। दूसरे शब्दों में, पियर्सन सहसंबंध परीक्षण आपको यह निर्धारित करने की अनुमति देता है कि दो चर के मूल्यों में परिवर्तन के बीच एक रैखिक संबंध है या नहीं। सांख्यिकीय गणना और अनुमानों में, सहसंबंध गुणांक को आमतौर पर दर्शाया जाता है आरएक्सवाईया Rxy.

1. सहसंबंध मानदंड के विकास का इतिहास

पियर्सन सहसंबंध परीक्षण किसके नेतृत्व में ब्रिटिश वैज्ञानिकों की एक टीम द्वारा विकसित किया गया था? कार्ल पियर्सन(1857-1936) 19वीं सदी के 90 के दशक में, दो यादृच्छिक चर के सहप्रसरण के विश्लेषण को सरल बनाने के लिए। कार्ल पियर्सन के अलावा, पियर्सन के सहसंबंध परीक्षण पर भी काम किया गया था फ्रांसिस एडगेवर्थतथा राफेल वेल्डन.

2. पियर्सन सहसंबंध परीक्षण किसके लिए प्रयोग किया जाता है?

पियर्सन सहसंबंध मानदंड आपको यह निर्धारित करने की अनुमति देता है कि मात्रात्मक पैमाने पर मापे गए दो संकेतकों के बीच सहसंबंध की निकटता (या ताकत) क्या है। अतिरिक्त गणनाओं की सहायता से, आप यह भी निर्धारित कर सकते हैं कि पहचाना गया संबंध सांख्यिकीय रूप से कितना महत्वपूर्ण है।

उदाहरण के लिए, पियर्सन सहसंबंध मानदंड का उपयोग करके, कोई इस प्रश्न का उत्तर दे सकता है कि क्या तीव्र श्वसन संक्रमण में शरीर के तापमान और रक्त में ल्यूकोसाइट्स की सामग्री के बीच, रोगी की ऊंचाई और वजन के बीच, सामग्री के बीच संबंध है या नहीं पेय जलफ्लोराइड और जनसंख्या में क्षरण की घटना।

3. पियर्सन के ची-स्क्वायर टेस्ट के उपयोग पर शर्तें और प्रतिबंध

  1. तुलनीय संकेतकों को मापा जाना चाहिए मात्रात्मक पैमाने(उदाहरण के लिए, हृदय गति, शरीर का तापमान, प्रति 1 मिलीलीटर रक्त में ल्यूकोसाइट गिनती, सिस्टोलिक रक्तचाप)।
  2. पियर्सन सहसंबंध मानदंड के माध्यम से, केवल यह निर्धारित करना संभव है एक रैखिक संबंध की उपस्थिति और ताकतमात्राओं के बीच। संबंध की अन्य विशेषताएं, जिसमें दिशा (प्रत्यक्ष या उल्टा), परिवर्तनों की प्रकृति (रेक्टिलिनियर या कर्विलिनियर), साथ ही साथ एक चर की दूसरे पर निर्भरता, प्रतिगमन विश्लेषण का उपयोग करके निर्धारित की जाती है।
  3. तुलना किए जाने वाले मानों की संख्या दो के बराबर होनी चाहिए। तीन या अधिक मापदंडों के संबंध का विश्लेषण करने के मामले में, आपको विधि का उपयोग करना चाहिए कारक विश्लेषण.
  4. पियर्सन का सहसंबंध मानदंड है पैरामीट्रिक, जिसके संबंध में इसके आवेदन की शर्त है सामान्य वितरणमिलान चर। यदि आवश्यक है सहसंबंध विश्लेषणसंकेतक, जिनका वितरण सामान्य से भिन्न होता है, जिसमें एक क्रमिक पैमाने पर मापा जाता है, स्पीयरमैन के रैंक सहसंबंध गुणांक का उपयोग किया जाना चाहिए।
  5. निर्भरता और सहसंबंध की अवधारणाओं के बीच स्पष्ट रूप से अंतर करना आवश्यक है। मूल्यों की निर्भरता उनके बीच संबंध की उपस्थिति को निर्धारित करती है, लेकिन इसके विपरीत नहीं।

उदाहरण के लिए, एक बच्चे की वृद्धि उसकी उम्र पर निर्भर करती है, अर्थात क्या बड़ा बच्चा, यह जितना ऊंचा है। अगर हम दो बच्चे लेते हैं अलग अलग उम्र, तो उच्च स्तर की संभावना के साथ बड़े बच्चे की वृद्धि छोटे बच्चे की तुलना में अधिक होगी। यह घटनाऔर बुलाया लत, संकेतकों के बीच एक कारण संबंध लागू करना। बेशक, वहाँ भी हैं सह - संबंध, जिसका अर्थ है कि एक संकेतक में परिवर्तन दूसरे संकेतक में परिवर्तन के साथ होता है।

एक अन्य स्थिति में, बच्चे की वृद्धि और हृदय गति (एचआर) के बीच संबंध पर विचार करें। जैसा कि आप जानते हैं, ये दोनों मूल्य सीधे उम्र पर निर्भर हैं, इसलिए, ज्यादातर मामलों में, अधिक ऊंचाई वाले बच्चों (और इसलिए बड़ी उम्र के) में हृदय गति का मान कम होगा। वह है, सह - संबंधमनाया जाएगा और इसमें पर्याप्त रूप से उच्च जकड़न हो सकती है। हालाँकि, अगर हम बच्चों को लेते हैं समान आयु, लेकिन अलग ऊंचाई, तो, सबसे अधिक संभावना है, उनकी हृदय गति में मामूली अंतर होगा, जिसके संबंध में हम यह निष्कर्ष निकाल सकते हैं आजादीवृद्धि से हृदय गति।

उपरोक्त उदाहरण से पता चलता है कि आँकड़ों में मूलभूत अवधारणाओं के बीच अंतर करना कितना महत्वपूर्ण है सम्बन्धतथा निर्भरतासही निष्कर्ष निकालने के लिए संकेतक।

4. पियर्सन सहसंबंध गुणांक की गणना कैसे करें?

पियर्सन के सहसंबंध गुणांक की गणना निम्न सूत्र का उपयोग करके की जाती है:

5. पियर्सन सहसंबंध गुणांक के मूल्य की व्याख्या कैसे करें?

पियर्सन सहसंबंध गुणांक के मूल्यों की व्याख्या इसके निरपेक्ष मूल्यों के आधार पर की जाती है। सहसंबंध गुणांक के संभावित मान 0 से ±1 तक भिन्न होते हैं। r xy का निरपेक्ष मान जितना अधिक होगा, दो राशियों के बीच संबंध की निकटता उतनी ही अधिक होगी। r xy = 0 कनेक्शन के पूर्ण अभाव को इंगित करता है। r xy = 1 - एक निरपेक्ष (कार्यात्मक) कनेक्शन की उपस्थिति को इंगित करता है। यदि पियर्सन सहसंबंध मानदंड का मान 1 से अधिक या -1 से कम निकला, तो गणना में एक त्रुटि की गई थी।

सहसंबंध की निकटता, या ताकत का आकलन करने के लिए, आम तौर पर स्वीकृत मानदंडों का उपयोग किया जाता है, जिसके अनुसार r xy के निरपेक्ष मान< 0.3 свидетельствуют о कमज़ोरकनेक्शन, r xy मान 0.3 से 0.7 तक - कनेक्शन के बारे में मध्यमजकड़न, r xy मान > 0.7 - o बलवानसम्बन्ध।

सहसंबंध की ताकत का अधिक सटीक अनुमान का उपयोग करके प्राप्त किया जा सकता है चाडॉक टेबल:

श्रेणी आंकड़ों की महत्तासहसंबंध गुणांक r xy t-परीक्षण का उपयोग करके किया जाता है, जिसकी गणना निम्न सूत्र द्वारा की जाती है:

प्राप्त मूल्य t r की तुलना एक निश्चित स्तर के महत्व और स्वतंत्रता की डिग्री n-2 पर महत्वपूर्ण मूल्य के साथ की जाती है। यदि टी आर टी क्रिट से अधिक है, तो पहचाने गए सहसंबंध के सांख्यिकीय महत्व के बारे में एक निष्कर्ष निकाला जाता है।

6. पियर्सन सहसंबंध गुणांक की गणना का एक उदाहरण

अध्ययन का उद्देश्य दो मात्रात्मक संकेतकों के बीच सहसंबंध की मजबूती और सांख्यिकीय महत्व की पहचान करना, निर्धारित करना था: रक्त में टेस्टोस्टेरोन का स्तर (एक्स) और प्रतिशत मांसपेशियोंशरीर में (वाई)। तालिका में 5 विषयों (एन = 5) के नमूने के प्रारंभिक डेटा को संक्षेप में प्रस्तुत किया गया है।


परिचय। 2

1. छात्र के f-परीक्षण का उपयोग करते हुए प्रतिगमन और सहसंबंध गुणांक के महत्व का मूल्यांकन। 3

2. छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व की गणना। 6

निष्कर्ष। पंद्रह

प्रतिगमन समीकरण के निर्माण के बाद, इसके महत्व की जांच करना आवश्यक है: विशेष मानदंडों का उपयोग करके, यह निर्धारित करें कि क्या परिणामी निर्भरता है समीकरण द्वारा व्यक्त किया गयाप्रतिगमन, यादृच्छिक, अर्थात्। क्या इसका उपयोग भविष्य कहनेवाला उद्देश्यों और कारक विश्लेषण के लिए किया जा सकता है। आँकड़ों में, प्रतिगमन गुणांक के महत्व के कठोर परीक्षण के लिए विधियों का विकास किया गया है भिन्नता का विश्लेषणऔर विशेष मानदंड की गणना (उदाहरण के लिए, एफ-मानदंड)। औसत सापेक्ष रैखिक विचलन (ई) की गणना करके एक गैर-सख्त परीक्षण किया जा सकता है, जिसे कहा जाता है औसत त्रुटिसन्निकटन:

अब आइए प्रतिगमन गुणांक bj के महत्व का आकलन करने के लिए आगे बढ़ते हैं और प्रतिगमन मॉडल Py (J=l,2,..., p) के मापदंडों के लिए एक विश्वास अंतराल का निर्माण करते हैं।

ब्लॉक 5 - छात्र के टी-टेस्ट के मूल्य से प्रतिगमन गुणांक के महत्व का आकलन। टा के परिकलित मानों की तुलना स्वीकार्य मान से की जाती है

खंड 5 - ^-मानदंड के मान द्वारा प्रतिगमन गुणांकों के महत्व का आकलन। t0n के परिकलित मानों की तुलना अनुमेय मान 4,/ से की जाती है, जो t की तालिका से निर्धारित होता है - के लिए वितरण दी गई संभावनात्रुटियां (ए) और स्वतंत्रता की डिग्री (/) की संख्या।

संपूर्ण मॉडल के महत्व का परीक्षण करने के अलावा, छात्र के /-परीक्षण का उपयोग करके प्रतिगमन गुणांक के महत्व का परीक्षण करना आवश्यक है। प्रतिगमन गुणांक bg का न्यूनतम मान स्थिति bifob- ^t के अनुरूप होना चाहिए, जहां bi प्राकृतिक पैमाने में i-th कारक विशेषता के साथ प्रतिगमन समीकरण के गुणांक का मान है; एबी - औसत द्विघात त्रुटिप्रत्येक गुणांक। गुणांक डी के उनके महत्व के संदर्भ में आपस में असंगति;

आगे सांख्यिकीय विश्लेषण प्रतिगमन गुणांक के महत्व का परीक्षण करने से संबंधित है। ऐसा करने के लिए, हम प्रतिगमन गुणांक के लिए ^-मानदंड का मान पाते हैं। उनकी तुलना के परिणामस्वरूप, सबसे छोटा टी-मानदंड निर्धारित किया जाता है। वह कारक जिसका गुणांक सबसे छोटे ^-मानदंड से मेल खाता है, को आगे के विश्लेषण से बाहर रखा गया है।

प्रतिगमन और सहसंबंध गुणांक के सांख्यिकीय महत्व का आकलन करने के लिए, छात्र का टी-परीक्षण और विश्वास अंतरालसंकेतकों में से प्रत्येक। परिकल्पना लेकिन संकेतकों की यादृच्छिक प्रकृति के बारे में सामने रखा गया है, अर्थात। शून्य से उनके महत्वहीन अंतर के बारे में। छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन उनके मूल्यों की तुलना यादृच्छिक त्रुटि के परिमाण के साथ किया जाता है:

शुद्ध प्रतिगमन के गुणांकों के महत्व का आकलन /-छात्र मानदंड का उपयोग करके मूल्य की गणना के लिए घटाया जाता है

श्रम की गुणवत्ता एक विशेष श्रम की विशेषता है, जो अर्थव्यवस्था के विकास के लिए इसकी जटिलता, तनाव (तीव्रता), परिस्थितियों और महत्व की डिग्री को दर्शाती है। के.टी. द्वारा मापा टैरिफ प्रणाली, देश की अर्थव्यवस्था के विकास के लिए योग्यता के स्तर (श्रम की जटिलता), परिस्थितियों, श्रम की गंभीरता और इसकी तीव्रता के साथ-साथ व्यक्तिगत उद्योगों और उद्योगों, क्षेत्रों, क्षेत्रों के महत्व के आधार पर मजदूरी में अंतर करने की अनुमति देता है। के.टी. में अभिव्यक्ति पाता है वेतनश्रम आपूर्ति और मांग (विशिष्ट प्रकार के श्रम) के प्रभाव में श्रम बाजार में उभरने वाले श्रमिक। के.टी. - जटिल संरचना

परियोजना कार्यान्वयन के व्यक्तिगत आर्थिक, सामाजिक और पर्यावरणीय परिणामों के सापेक्ष महत्व के लिए प्राप्त अंक आगे एक परियोजना के "सामाजिक और पर्यावरणीय-आर्थिक दक्षता के जटिल स्कोरिंग आयाम रहित मानदंड" का उपयोग करके वैकल्पिक परियोजनाओं और उनके विकल्पों की तुलना करने के लिए एक आधार प्रदान करते हैं। गणना (औसत महत्व स्कोर में) सूत्र के अनुसार

अंतर-उद्योग विनियमन उद्योग की किसी दी गई शाखा में श्रमिकों के लिए मजदूरी में अंतर प्रदान करता है, जो इस उद्योग में व्यक्तिगत प्रकार के उत्पादन के महत्व पर निर्भर करता है, काम की जटिलता और शर्तों पर, और उपयोग की जाने वाली मजदूरी के रूपों पर भी।

व्यक्तिगत संकेतकों के महत्व को ध्यान में रखे बिना मानक उद्यम के संबंध में विश्लेषण किए गए उद्यम का प्राप्त रेटिंग स्कोर तुलनात्मक है। कई उद्यमों की रेटिंग की तुलना करते समय, उच्चतम रेटिंग प्राप्त तुलनात्मक मूल्यांकन के न्यूनतम मूल्य के साथ उद्यम की होती है।

किसी उत्पाद की गुणवत्ता को उसकी उपयोगिता के माप के रूप में समझना उसके माप के बारे में एक व्यावहारिक रूप से महत्वपूर्ण प्रश्न उठाता है। इसका समाधान एक विशिष्ट आवश्यकता को पूरा करने में व्यक्तिगत गुणों के महत्व का अध्ययन करके प्राप्त किया जाता है। उत्पाद की खपत की स्थितियों के आधार पर समान संपत्ति का महत्व भी भिन्न हो सकता है। नतीजतन, इसके उपयोग की विभिन्न परिस्थितियों में माल की उपयोगिता अलग-अलग होती है।

काम का दूसरा चरण सांख्यिकीय डेटा का अध्ययन और संकेतकों के संबंध और बातचीत की पहचान, व्यक्तिगत कारकों के महत्व का निर्धारण और परिवर्तन के कारणों का निर्धारण है। समग्र संकेतक.

विचाराधीन सभी संकेतकों को इस तरह से एक साथ लाया जाता है कि परिणाम उद्यम की गतिविधियों के सभी विश्लेषण किए गए पहलुओं का एक व्यापक मूल्यांकन है, इसकी गतिविधि की स्थितियों को ध्यान में रखते हुए, विभिन्न के लिए व्यक्तिगत संकेतकों के महत्व की डिग्री को ध्यान में रखते हुए निवेशकों के प्रकार:

प्रतिगमन गुणांक प्रदर्शन संकेतक पर कारकों के प्रभाव की तीव्रता को दर्शाता है। यदि भाज्य संकेतकों का प्रारंभिक मानकीकरण किया जाता है, तो b0 औसत मान के बराबर होता है कार्यनिष्पादन संकेतककुल मिलाकर। गुणांक बी, बी 2 ..... बी दिखाते हैं कि प्रभावी संकेतक का स्तर कितनी इकाइयों को अपने औसत मूल्य से विचलित करता है यदि कारक संकेतक के मान औसत से शून्य के बराबर एक से विचलित हो जाते हैं मानक विचलन. इस प्रकार, प्रतिगमन गुणांक प्रभावी संकेतक के स्तर को बढ़ाने के लिए व्यक्तिगत कारकों के महत्व की डिग्री की विशेषता है। प्रतिगमन गुणांक के विशिष्ट मान विधि के अनुसार अनुभवजन्य डेटा से निर्धारित किए जाते हैं कम से कम वर्गों(सिस्टम को हल करने के परिणामस्वरूप सामान्य समीकरण).

2. छात्र के f-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व की गणना

आइए हम बहुक्रियात्मक संबंधों के रैखिक रूप को न केवल सबसे सरल, बल्कि पीसी के लिए एप्लिकेशन पैकेज द्वारा प्रदान किए गए फॉर्म के रूप में भी देखें। यदि परिणामी विशेषता के साथ एक व्यक्तिगत कारक का कनेक्शन रैखिक नहीं है, तो कारक विशेषता के मूल्य को बदलकर या बदलकर समीकरण को रैखिक किया जाता है।

सामान्य फ़ॉर्मबहुक्रियात्मक प्रतिगमन समीकरण का रूप है:


जहाँ k गुणनखंडों की संख्या है।

समीकरण (8.32) के मापदंडों की गणना के लिए आवश्यक कम से कम वर्ग समीकरणों की प्रणाली को सरल बनाने के लिए, आमतौर पर इन सुविधाओं के औसत मूल्यों से सभी विशेषताओं के व्यक्तिगत मूल्यों के विचलन का परिचय दिया जाता है।

हमें k कम से कम वर्ग समीकरणों की एक प्रणाली मिलती है:

इस प्रणाली को हल करते हुए, हम सशर्त रूप से शुद्ध प्रतिगमन गुणांक b के मान प्राप्त करते हैं। समीकरण के मुक्त पद की गणना सूत्र द्वारा की जाती है


शब्द "सशर्त-शुद्ध प्रतिगमन गुणांक" का अर्थ है कि प्रत्येक मान bj इसके परिणामी विशेषता के जनसंख्या औसत विचलन को मापता है मध्यम आकारजब यह कारक xj अपने माप की प्रति इकाई औसत मूल्य से विचलित हो जाता है और बशर्ते कि प्रतिगमन समीकरण में शामिल अन्य सभी कारक औसत मूल्यों पर तय हो जाएं, न बदलें, भिन्न न हों।

इस प्रकार, जोड़ीदार प्रतिगमन गुणांक के विपरीत, सशर्त रूप से शुद्ध प्रतिगमन गुणांक एक कारक के प्रभाव को मापता है, जो इस कारक की भिन्नता और अन्य कारकों की भिन्नता के बीच के संबंध से अलग होता है। यदि प्रतिगमन समीकरण में परिणामी विशेषता की भिन्नता को प्रभावित करने वाले सभी कारकों को शामिल करना संभव होगा, तो मान bj. कारकों के शुद्ध प्रभाव के उपाय माने जा सकते हैं। लेकिन चूंकि समीकरण में सभी कारकों को शामिल करना वास्तव में असंभव है, इसलिए गुणांक bj. समीकरण में शामिल नहीं किए गए कारकों के प्रभाव के मिश्रण से मुक्त नहीं।

प्रतिगमन समीकरण में सभी कारकों को तीन कारणों में से एक के लिए या उन सभी के लिए एक साथ शामिल करना असंभव है, क्योंकि:

1) कुछ कारक अज्ञात हो सकते हैं आधुनिक विज्ञान, किसी भी प्रक्रिया का ज्ञान हमेशा अधूरा होता है;

2) ज्ञात सैद्धांतिक कारकों के बारे में कोई जानकारी नहीं है या यह अविश्वसनीय है;

3) अध्ययन की गई जनसंख्या (नमूना) का आकार सीमित है, जो प्रतिगमन समीकरण में सीमित संख्या में कारकों को शामिल करने की अनुमति देता है।

सशर्त शुद्ध प्रतिगमन के गुणांक बीजे। नामित संख्याएँ हैं, जो माप की विभिन्न इकाइयों में व्यक्त की जाती हैं, और इसलिए एक दूसरे के साथ अतुलनीय हैं। उन्हें तुलनीय में बदलने के लिए सापेक्ष प्रदर्शनयुग्म सहसंबंध गुणांक प्राप्त करने के लिए समान परिवर्तन लागू किया जाता है। परिणामी मान कहलाता है मानकीकृत गुणांकप्रतिगमन या?-गुणांक।


गुणनखंड xj पर गुणांक प्रभावी गुण y की भिन्नता पर गुणनखंड xj की भिन्नता के प्रभाव के माप को निर्धारित करता है जब प्रतिगमन समीकरण में शामिल अन्य कारकों को सहवर्ती भिन्नता से दूर ले जाया जाता है।

संचार के सापेक्ष तुलनीय संकेतक, लोच गुणांक के रूप में सशर्त रूप से शुद्ध प्रतिगमन के गुणांक को व्यक्त करना उपयोगी है:

गुणनखंड xj की लोच का गुणांक इंगित करता है कि यदि इस कारक का मान अपने औसत मान से 1% तक विचलित होता है और यदि समीकरण में शामिल अन्य कारकों को सहवर्ती विचलन से दूर ले जाया जाता है, तो परिणामी विशेषता इसके औसत मूल्य से विचलन करेगी y से ej प्रतिशत। अधिक बार, लोच गुणांक को गतिशीलता के संदर्भ में व्याख्या और लागू किया जाता है: कारक x में इसके औसत मूल्य के 1% की वृद्धि के साथ, परिणामी विशेषता इसके औसत मूल्य के ई। प्रतिशत में वृद्धि होगी।

उन्हीं 16 फार्मों के उदाहरण पर बहुभिन्नरूपी समाश्रयण समीकरण की गणना और व्याख्या पर विचार करें (सारणी 8.1)। प्रभावी विशेषता सकल आय का स्तर है और इसे प्रभावित करने वाले तीन कारक तालिका में प्रस्तुत किए गए हैं। 8.7.

एक बार फिर याद करें कि विश्वसनीय और पर्याप्त रूप से सटीक सहसंबंध संकेतक प्राप्त करने के लिए, एक बड़ी आबादी की आवश्यकता होती है।


तालिका 8.7

सकल आय स्तर और इसके कारक

फार्म नंबर

सकल आय, रगड़./ra

श्रम लागत, मानव-दिन/हेक्टेयर X1

कृषि योग्य भूमि का हिस्सा

प्रति गाय दुग्ध उत्पादन,


तालिका 8.8 प्रतीपगमन समीकरण के संकेतक


आश्रित चर: y

प्रतिगमन गुणांक

लगातार-240,112905

कक्षा अनुमान की त्रुटि = 79.243276


पीसी के लिए "माइक्रोस्टैट" कार्यक्रम का उपयोग करके समाधान किया गया था। यहाँ प्रिंटआउट से तालिकाएँ हैं: टैब। 8.7 औसत और औसत देता है मानक विचलनसभी संकेत। टैब। 8.8 में प्रतिगमन गुणांक और उनके संभाव्य अनुमान शामिल हैं:

पहला कॉलम "var" - चर, यानी कारक; दूसरा कॉलम "रिग्रेशन गुणांक" - सशर्त रूप से शुद्ध प्रतिगमन बीजे के गुणांक; तीसरा कॉलम "std. त्रुटि" - प्रतिगमन गुणांक के अनुमानों की औसत त्रुटियां; चौथा कॉलम - भिन्नता की स्वतंत्रता के 12 डिग्री पर छात्र के टी-टेस्ट का मान; पाँचवाँ कॉलम "प्रोब" - प्रतिगमन गुणांक के संबंध में अशक्त परिकल्पना की संभावना;

छठा स्तंभ "आंशिक r2" - निर्धारण के आंशिक गुणांक। कॉलम 3-6 में संकेतकों की गणना के लिए सामग्री और कार्यप्रणाली पर अध्याय 8 में आगे चर्चा की गई है। "स्थिर" - प्रतिगमन समीकरण का एक मुक्त शब्द a; "एसटीडी। अनुमान की त्रुटि।" - प्रतिगमन समीकरण के अनुसार प्रभावी विशेषता के मूल्यांकन की मूल-माध्य-वर्ग त्रुटि। समीकरण प्राप्त किया गया था एकाधिक प्रतिगमन:


वाई \u003d 2.26x1 - 4.31x2 + 0.166x3 - 240।


इसका मतलब है कि सकल आय का मूल्य प्रति 1 हेक्टेयर कृषि भूमि में औसतन 2.26 रूबल की वृद्धि हुई। श्रम लागत में 1 घंटे / हेक्टेयर की वृद्धि के साथ; औसतन 4.31 रूबल की कमी। कृषि योग्य भूमि के हिस्से में 1% की वृद्धि और 0.166 रूबल की वृद्धि के साथ। प्रति गाय दूध उत्पादन में 1 . की वृद्धि के साथ किलोग्राम। मुक्त अवधि का नकारात्मक मूल्य काफी स्वाभाविक है, और, जैसा कि पहले ही पैराग्राफ 8.2 में उल्लेख किया गया है, प्रभावी विशेषता - सकल आय कारकों के शून्य मूल्यों तक पहुंचने से बहुत पहले शून्य हो जाती है, जो उत्पादन में असंभव है।

नकारात्मक अर्थ^ पर गुणांक अध्ययन किए गए खेतों की अर्थव्यवस्था में महत्वपूर्ण परेशानी का संकेत है, जहां फसल उत्पादन लाभहीन है, और केवल पशुधन ही लाभदायक है। प्रबंधन के तर्कसंगत तरीकों के साथ कृषिऔर सभी उद्योगों के उत्पादों के लिए सामान्य मूल्य (संतुलन या उनके करीब), आय में कमी नहीं होनी चाहिए, लेकिन कृषि भूमि - कृषि योग्य भूमि में सबसे उपजाऊ हिस्से में वृद्धि के साथ वृद्धि होनी चाहिए।

तालिका की अंतिम दो पंक्तियों के आंकड़ों के आधार पर। 8.7 और टैब। 8.8 सूत्रों (8.34) और (8.35) के अनुसार पी-गुणांक और लोच गुणांक की गणना करें।

आय के स्तर में भिन्नता और गतिशीलता में इसके संभावित परिवर्तन दोनों कारक x3 - गायों की उत्पादकता, और सबसे कमजोर - x2 - कृषि योग्य भूमि के हिस्से से सबसे अधिक प्रभावित होते हैं। 2/ के मान भविष्य में उपयोग किए जाएंगे (तालिका 8.9);


तालिका 8.9 आय स्तर पर कारकों का तुलनात्मक प्रभाव

कारक xj


तो, हमने प्राप्त किया है कि कारक xj का ?-गुणांक इस कारक की लोच के गुणांक से संबंधित है, क्योंकि कारक की भिन्नता का गुणांक प्रभावी विशेषता की भिन्नता के गुणांक के लिए है। चूंकि, जैसा कि तालिका की अंतिम पंक्ति से देखा जा सकता है। 8.7, सभी कारकों की भिन्नता के गुणांक परिणामी विशेषता की भिन्नता के गुणांक से कम हैं; सभी ?-गुणांक लोच गुणांक से कम होते हैं।

कारक -с के उदाहरण पर युग्मित और सशर्त रूप से शुद्ध प्रतिगमन गुणांक के बीच संबंध पर विचार करें। युग्मित रेखीय समीकरण y और x के बीच संबंध का रूप है:


वाई = 3.886x1 - 243.2


सशर्त रूप से शुद्ध प्रतिगमन गुणांक X1 पर युग्मित गुणांक का केवल 58% है। शेष 42% इस तथ्य के कारण हैं कि x1 भिन्नता x2 x3 कारक भिन्नता के साथ है, जो बदले में परिणामी विशेषता को प्रभावित करती है। सभी विशेषताओं के लिंक और उनके जोड़ीदार प्रतिगमन गुणांक लिंक ग्राफ (चित्र। 8.2) में प्रस्तुत किए गए हैं।

यदि हम y पर x1 भिन्नता के प्रत्यक्ष और अप्रत्यक्ष प्रभाव के अनुमानों को जोड़ते हैं, अर्थात, सभी "पथ" (चित्र। 8.2) के लिए युग्मित प्रतिगमन गुणांक का उत्पाद, तो हमें मिलता है: 2.26 + 12.55 0.166 + (-0.00128) ) (-4.31) + (-0.00128) 17.00 0.166 = 4.344।

यह मान और भी अधिक है जोड़ी गुणांक X1 को y से जोड़ता है। इसलिए, समीकरण में शामिल नहीं किए गए संकेतों-कारकों के माध्यम से एक्स 1 भिन्नता का अप्रत्यक्ष प्रभाव विपरीत है, कुल मिलाकर:


1 अयवज़्यान एस.ए., मखितरन वी.एस. एप्लाइड सांख्यिकी और अर्थमिति के मूल सिद्धांत। हाई स्कूल के लिए पाठ्यपुस्तक। - एम .: यूनिटी, 2008, - 311s।

2 जॉनसन जे। अर्थमितीय तरीके। - एम .: सांख्यिकी, 1980,। - 282s।

3 डफ़र्टी के। अर्थमिति का परिचय। - एम.: इंफ्रा-एम, 2004, - 354 पी।

4 ड्रेयर एन।, स्मिथ जी।, एप्लाइड प्रतिगमन विश्लेषण. - एम .: वित्त और सांख्यिकी, 2006, - 191s।

5 मैग्नस या.आर., कार्तशेव पी.के., पेरेसेट्स्की ए.ए. अर्थमिति। प्रारंभिक पाठ्यक्रम।-एम .: डेलो, 2006, - 259पी।

अर्थमिति / एड पर 6 कार्यशाला। आई.आई.एलीसेवा।- एम .: वित्त और सांख्यिकी, 2004, - 248पी।

7 अर्थमिति / एड। आई.आई.एलीसेवा।- एम .: वित्त और सांख्यिकी, 2004, - 541पी।

8 क्रेमर एन।, पुटको बी। अर्थमिति।- एम .: यूनिटी-दाना, 200, - 281 पी।



ट्यूशन

किसी विषय को सीखने में मदद चाहिए?

हमारे विशेषज्ञ आपकी रुचि के विषयों पर सलाह देंगे या शिक्षण सेवाएं प्रदान करेंगे।
प्राथना पत्र जमा करनापरामर्श प्राप्त करने की संभावना के बारे में पता लगाने के लिए अभी विषय का संकेत देना।

इस नोट का पूर्ण संस्करण (सूत्रों और तालिकाओं के साथ) इस पृष्ठ से पीडीएफ प्रारूप में डाउनलोड किया जा सकता है। पृष्ठ पर ही पाठ है सारांशइस नोट की सामग्री और सबसे महत्वपूर्ण निष्कर्ष।

आँकड़ों से आशावादियों को समर्पित

सहसंबंध गुणांक (CC) सबसे सरल और सबसे अधिक में से एक है लोकप्रिय आँकड़ेयादृच्छिक चर के बीच संबंध की विशेषता। साथ ही, क्यूसी इसकी सहायता से किए गए गलत और सरल अर्थहीन निष्कर्षों की संख्या में अग्रणी है। यह स्थिति सहसम्बन्ध और सहसम्बन्ध निर्भरता से संबंधित सामग्री प्रस्तुत करने की स्थापित प्रथा के कारण है।

बड़े, छोटे और "मध्यवर्ती" QC मान

सहसंबंध पर विचार करते समय, "मजबूत" (लगभग एकल) और "कमजोर" (लगभग शून्य) सहसंबंध की अवधारणा पर विस्तार से चर्चा की जाती है, लेकिन व्यवहार में, न तो कभी एक और न ही दूसरे का सामना करना पड़ता है। नतीजतन, क्यूसी के "मध्यवर्ती" मूल्यों की उचित व्याख्या का प्रश्न जो व्यवहार में सामान्य है, अस्पष्ट रहता है। सहसंबंध गुणांक के बराबर 0.9 या 0.8 , एक नौसिखिया आशावादी होता है, और छोटे मूल्य उसे भ्रमित करते हैं।

जैसे-जैसे अनुभव प्राप्त होता है, आशावाद बढ़ता है, और अब QC, बराबर 0.7 या 0.6 शोधकर्ता को प्रसन्न करता है, और आशावाद मूल्यों से प्रेरित होता है 0.5 तथा 0.4 . यदि शोधकर्ता परीक्षण के तरीकों से परिचित है सांख्यिकीय परिकल्पना, तो "अच्छे" क्यूसी मूल्यों की दहलीज गिर जाती है 0.3 या 0.2 .

वास्तव में, कौन से QC मान पहले से ही "काफी बड़े" माने जा सकते हैं, और जो "बहुत छोटे" रहते हैं? इस प्रश्न के दो परस्पर विरोधी उत्तर हैं - आशावादी और निराशावादी। पहले आशावादी (सबसे लोकप्रिय) उत्तर पर विचार करें।

सहसंबंध गुणांक का महत्व

यह उत्तर विकल्प हमें शास्त्रीय सांख्यिकी द्वारा दिया गया है और यह अवधारणा से जुड़ा है आंकड़ों की महत्ताक्यूसी. हम यहां केवल उस स्थिति पर विचार करेंगे जब एक सकारात्मक सहसंबंध रुचि का हो (एक नकारात्मक सहसंबंध का मामला पूरी तरह से अनुरूप है)। एक अधिक जटिल मामला, जब संकेत को ध्यान में रखे बिना केवल सहसंबंध की उपस्थिति की जांच की जाती है, व्यवहार में अपेक्षाकृत दुर्लभ है।

यदि QC . के लिए आरअसमानता आर > आर ई (एन), तो हम कहते हैं कि KK आंकड़ों की दृष्टि से महत्वपूर्णमहत्व के स्तर पर . यहां पुन (एन)- मात्रा, जिसके संबंध में हम केवल इस तथ्य में रुचि लेंगे कि, महत्व के एक निश्चित स्तर पर, इसका मूल्य बढ़ती लंबाई के साथ शून्य हो जाता है एननमूने। यह पता चला है कि डेटा सरणी को बढ़ाकर, बहुत कम मूल्यों पर भी क्यूसी के सांख्यिकीय महत्व को प्राप्त करना संभव है। नतीजतन, पर्याप्त रूप से बड़े नमूने को देखते हुए, अस्तित्व को पहचानने का प्रलोभन होता है QC के मामले में, बराबर, उदाहरण के लिए, 0.06 . बहरहाल, व्यावहारिक बुद्धिसे पता चलता है कि एक महत्वपूर्ण सहसंबंध की उपस्थिति के बारे में निष्कर्ष आर = 0.06किसी भी नमूने के आकार के लिए सत्य नहीं हो सकता। यह त्रुटि की प्रकृति को समझना बाकी है। ऐसा करने के लिए, सांख्यिकीय महत्व की अवधारणा पर अधिक विस्तार से विचार करें।

हमेशा की तरह, सांख्यिकीय परिकल्पनाओं का परीक्षण करते समय, प्रदर्शन की गई गणनाओं का अर्थ शून्य परिकल्पना और वैकल्पिक परिकल्पना के चुनाव में निहित है। क्यूसी के महत्व का परीक्षण करते समय, शून्य परिकल्पना को धारणा के रूप में लिया जाता है (आर = 0)वैकल्पिक परिकल्पना के तहत (आर> 0)(याद रखें कि हम यहां केवल उस स्थिति पर विचार कर रहे हैं जब एक सकारात्मक सहसंबंध रुचि का हो)। महत्व का मनमाने ढंग से चुना गया स्तर तथाकथित की संभावना निर्धारित करता है। टाइप I त्रुटियां जब शून्य परिकल्पना सत्य होती है ( आर = 0), लेकिन सांख्यिकीय परीक्षण द्वारा खारिज कर दिया जाता है (यानी, परीक्षण गलती से एक महत्वपूर्ण सहसंबंध के अस्तित्व को पहचानता है)। महत्व के स्तर को चुनकर, हम इस तरह की त्रुटि की एक छोटी संभावना की गारंटी देते हैं, अर्थात। हम इस तथ्य से लगभग प्रतिरक्षित हैं कि स्वतंत्र नमूनों के लिए ( आर = 0) गलती से एक सहसंबंध की उपस्थिति को पहचानते हैं ( आर > 0) मोटे तौर पर बोल, सहसंबंध गुणांक का महत्व केवल इतना है कि इसके शून्य से भिन्न होने की अत्यधिक संभावना है.

यही कारण है कि नमूना आकार और क्यूसी का परिमाण एक दूसरे को रद्द कर देता है - बड़े नमूने बस अपने नमूना अनुमान से एक छोटे क्यूसी के स्थानीयकरण में अधिक सटीकता की अनुमति देते हैं।

यह स्पष्ट है कि महत्व की अवधारणा क्यूसी के मूल्यों के संबंध में "बड़ा/छोटा" श्रेणियों को समझने के मूल प्रश्न का उत्तर नहीं देती है। महत्व परीक्षण द्वारा दिया गया उत्तर हमें सहसंबंध के गुणों के बारे में कुछ नहीं बताता है, लेकिन केवल हमें यह सत्यापित करने की अनुमति देता है कि असमानता उच्च संभावना से संतुष्ट है आर > 0. उसी समय, CC मान में ही सहसंबंध के गुणों के बारे में बहुत अधिक महत्वपूर्ण जानकारी होती है। वास्तव में, समान रूप से महत्वपूर्ण QCs . के बराबर है 0.1 तथा 0.9 , संबंधित सहसंबंध की गंभीरता की डिग्री और QC . के महत्व के बारे में बयान में काफी भिन्नता है आर = 0.06अभ्यास के लिए, यह बिल्कुल बेकार है, क्योंकि किसी भी नमूने के आकार के लिए, यहां किसी भी सहसंबंध के बारे में बात करने की आवश्यकता नहीं है।

अंत में, हम कह सकते हैं कि व्यवहार में, सहसंबंध संबंध के किसी भी गुण और यहां तक ​​कि इसके अस्तित्व का भी सहसंबंध गुणांक के महत्व से पालन नहीं होता है। अभ्यास के दृष्टिकोण से, क्यूसी के महत्व के परीक्षण में प्रयुक्त वैकल्पिक परिकल्पना का चयन त्रुटिपूर्ण है, क्योंकि मामले आर = 0तथा आर>0छोटे पर आरव्यावहारिक रूप से अप्रभेद्य।

वास्तव में, जब से क्यूसी का महत्वअनुमान अस्तित्व महत्वपूर्ण सहसंबंध, "महत्व" शब्द की अर्थ संबंधी अस्पष्टता के आधार पर अवधारणाओं का पूरी तरह से बेशर्म प्रतिस्थापन उत्पन्न करते हैं। क्यूसी (एक स्पष्ट रूप से परिभाषित अवधारणा) का महत्व भ्रामक रूप से "महत्वपूर्ण सहसंबंध" में बदल गया है, और यह वाक्यांश, जिसकी सख्त परिभाषा नहीं है, को "स्पष्ट सहसंबंध" के पर्याय के रूप में व्याख्या किया गया है।

फैलाव विभाजन

आइए हम QC के "छोटे" और "बड़े" मूल्यों के बारे में प्रश्न के उत्तर के दूसरे संस्करण पर विचार करें। यह उत्तर विकल्प QC के प्रतिगमन अर्थ के स्पष्टीकरण से जुड़ा है और अभ्यास के लिए बहुत उपयोगी साबित होता है, हालांकि यह QC के महत्व के मानदंडों की तुलना में बहुत कम आशावादी है।

दिलचस्प बात यह है कि सीसी के प्रतिगमन अर्थ की चर्चा अक्सर एक उपदेशात्मक (बल्कि मनोवैज्ञानिक) प्रकृति की कठिनाइयों में चलती है। आइए उन पर संक्षेप में टिप्पणी करें। QC के औपचारिक परिचय और "मजबूत" और "कमजोर" सहसंबंधों के अर्थ के स्पष्टीकरण के बाद, सहसंबंधों और कारण-और-प्रभाव संबंधों के बीच संबंधों के दार्शनिक मुद्दों की चर्चा में तल्लीन होना आवश्यक माना जाता है। साथ ही, सहसंबंध को कारण के रूप में व्याख्या करने के (काल्पनिक!) प्रयास को अस्वीकार करने के लिए ऊर्जावान प्रयास किए जा रहे हैं। इस पृष्ठभूमि में, उपलब्धता के बारे में चर्चा कार्यात्मक निर्भरता(प्रतिगमन सहित) सहसंबंधित मूल्यों के बीच बस ईशनिंदा लगने लगता है। आखिरकार, कार्यात्मक निर्भरता से कार्य-कारण तक केवल एक कदम है! नतीजतन, QC के प्रतिगमन अर्थ के प्रश्न को आम तौर पर दरकिनार कर दिया जाता है, साथ ही रैखिक प्रतिगमन के सहसंबंध गुणों का प्रश्न भी।

वास्तव में, यहाँ सब कुछ सरल है। यदि सामान्यीकृत (अर्थात शून्य माध्य और इकाई विचरण) के लिए यादृच्छिक चर एक्सतथा यूएक अनुपात है

वाई = ए + बीएक्स + एन,

कहाँ पे एनशून्य माध्य (योगात्मक शोर) के साथ कुछ यादृच्छिक चर है, यह देखना आसान है कि ए = 0तथा बी = आर. यह यादृच्छिक चर के बीच का अनुपात है एक्सतथा यूरैखिक समाश्रयण समीकरण कहलाता है।

एक यादृच्छिक चर के प्रसरण की गणना यूनिम्नलिखित अभिव्यक्ति प्राप्त करना आसान है:

डी [वाई] = बी 2 डी [एक्स] + डी [एन]।

अंतिम व्यंजक में, पहला पद यादृच्छिक चर के योगदान को निर्धारित करता है एक्सफैलाव में यू, और दूसरा शब्द शोर योगदान है एनफैलाव में यू. पैरामीटर के लिए उपरोक्त अभिव्यक्ति का उपयोग करना बी, यादृच्छिक चर के योगदान को व्यक्त करना आसान है एक्सतथा एनमूल्य के माध्यम से आर =आर(याद रखें कि हम मात्राओं पर विचार करते हैं एक्सतथा यूसामान्यीकृत, अर्थात्। डी [एक्स] = डी [वाई] = 1):

बी 2 डी [एक्स] = आर 2

डी [एन] = 1 - r2

प्राप्त सूत्रों को ध्यान में रखते हुए, यह अक्सर कहा जाता है कि यादृच्छिक चर के लिए एक्सतथा यूसम्बंधित प्रतिगमन समीकरण, मूल्य r2एक यादृच्छिक चर के विचरण के अनुपात को निर्धारित करता है यू, यादृच्छिक चर में परिवर्तन द्वारा रैखिक रूप से निर्धारित किया जाता है एक्स. तो, यादृच्छिक चर का कुल प्रसरण यूफैलाव में टूट जाता है रैखिक रूप से वातानुकूलितएक प्रतिगमन संबंध की उपस्थिति और अवशिष्ट फैलाव एडिटिव शोर की उपस्थिति के कारण।


द्वि-आयामी यादृच्छिक चर के स्कैटरप्लॉट पर विचार करें (एक्स, वाई). छोटे पर डी [एन]स्कैटरप्लॉट यादृच्छिक चर के बीच एक रैखिक संबंध में पतित हो जाता है, योगात्मक शोर से थोड़ा विकृत होता है (यानी स्कैटरप्लॉट पर बिंदु ज्यादातर सीधी रेखा के पास केंद्रित होंगे एक्स = वाई) ऐसा मामला मूल्यों के लिए होता है आरएकता के मापांक के करीब। क्यूसी मूल्य की कमी (पूर्ण मूल्य में) के साथ, शोर घटक का फैलाव एनमात्रा के फैलाव में एक बढ़ता हुआ योगदान देना शुरू कर देता है यूऔर छोटे के लिए आरस्कैटरप्लॉट पूरी तरह से एक सीधी रेखा से अपनी समानता खो देता है। इस मामले में, हमारे पास बिंदुओं का एक बादल है, जिसका प्रकीर्णन मुख्य रूप से शोर के कारण होता है। यह ऐसा मामला है जिसे महत्वपूर्ण, लेकिन निरपेक्ष मूल्य में छोटा, QC के मूल्यों पर महसूस किया जाता है। स्पष्ट है कि इस मामले में किसी सहसम्बन्ध की बात करने की आवश्यकता नहीं है।

अब देखते हैं कि सीसी के "बड़े" और "छोटे" मूल्यों के बारे में प्रश्न का उत्तर हमें सीसी के प्रतिगमन व्याख्या द्वारा किस प्रकार प्रदान किया जाता है। सबसे पहले, इस बात पर जोर दिया जाना चाहिए कि यह फैलाव है जो एक यादृच्छिक चर के मूल्यों के फैलाव का सबसे प्राकृतिक उपाय है। इस "स्वाभाविकता" की प्रकृति में स्वतंत्र यादृच्छिक चर के लिए भिन्नता की अतिरिक्तता शामिल है, लेकिन इस संपत्ति में बहुत ही विविध अभिव्यक्तियां हैं, जिनमें से भिन्नता को रैखिक रूप से वातानुकूलित और अवशिष्ट भिन्नताओं में विभाजित किया गया है।

तो मूल्य r2मात्रा के विचरण के अनुपात को निर्धारित करता है यू, एक यादृच्छिक चर के साथ प्रतिगमन संबंध की उपस्थिति द्वारा रैखिक रूप से निर्धारित किया जाता है एक्स. रैखिक रूप से वातानुकूलित विचरण के किस अनुपात को एक स्पष्ट सहसंबंध की उपस्थिति का संकेत माना जा सकता है, यह सवाल शोधकर्ता के विवेक पर बना हुआ है। हालांकि, यह स्पष्ट हो जाता है कि सहसंबंध गुणांक के छोटे मान ( आर< 0.3 ) रैखिक रूप से समझाया गया विचरण का इतना छोटा अनुपात दें कि किसी भी स्पष्ट सहसंबंध के बारे में बात करना व्यर्थ है। पर आर > 0.5हम मात्राओं के बीच ध्यान देने योग्य सहसंबंध की उपस्थिति के बारे में बात कर सकते हैं, और कब आर > 0.7सहसम्बन्ध महत्वपूर्ण माना जा सकता है।

कुछ शोधकर्ता, सहसंबंध गुणांक के मूल्य की गणना करते हुए, वहीं रुक जाते हैं। लेकिन प्रयोग की एक सक्षम कार्यप्रणाली की दृष्टि से, इस गुणांक के महत्व का स्तर (अर्थात विश्वसनीयता की डिग्री) भी निर्धारित किया जाना चाहिए।

सहसंबंध गुणांक के महत्व स्तर की गणना महत्वपूर्ण मूल्यों की तालिका का उपयोग करके की जाती है। नीचे इस तालिका का एक अंश है, जो हमें हमारे द्वारा प्राप्त गुणांक के महत्व के स्तर को निर्धारित करने की अनुमति देता है।

हम उस पंक्ति का चयन करते हैं जो नमूना आकार से मेल खाती है। हमारे मामले में, n = 10. हम इस पंक्ति में तालिका मान का चयन करते हैं जो अनुभवजन्य से थोड़ा कम है (या इसके बिल्कुल बराबर, जो अत्यंत दुर्लभ है)। यह बोल्ड नंबर 0.632 है। यह p = 0.05 के विश्वास स्तर मान वाले कॉलम को संदर्भित करता है। अर्थात्, वास्तव में, अनुभवजन्य मान कॉलम p = 0.05 और p = 0.01 के बीच का मध्यवर्ती है, इसलिए 0.05 p  0.01। इस प्रकार, हम शून्य परिकल्पना को अस्वीकार करते हैं और यह निष्कर्ष निकालते हैं कि प्राप्त परिणाम (R xy = 0.758) p स्तर पर महत्वपूर्ण है।< 0,05 (это уровень статистической значимости): R эмп >आर करोड़ (पी< 0,05) H 0 ,  Н 1 ! ст. зн.

रोज़मर्रा की भाषा में, इसकी व्याख्या इस प्रकार की जा सकती है: हम उम्मीद कर सकते हैं कि कनेक्शन की यह ताकत 100 में से पांच मामलों की तुलना में नमूने में कम होगी, अगर यह कनेक्शन संयोग का परिणाम है।

    1. प्रतिगमन विश्लेषण

एक्स(वृद्धि)

यू(वज़न)

एम एक्स = 166,6

एम आप = 58,3

एक्स = 6 , 54

आप = 8 , 34

प्रतिगमन विश्लेषण का उपयोग अंतराल पैमाने पर मापी गई दो मात्राओं के बीच संबंध का अध्ययन करने के लिए किया जाता है। इस प्रकार के विश्लेषण में एक प्रतिगमन समीकरण का निर्माण शामिल है जो एक को दूसरे पर एक विशेषता की निर्भरता का मात्रात्मक रूप से वर्णन करने की अनुमति देता है (पियर्सन का सहसंबंध गुणांक एक रिश्ते की उपस्थिति या अनुपस्थिति को इंगित करता है, लेकिन इस संबंध का वर्णन नहीं करता है)। किसी एक विशेषता के यादृच्छिक मान को जानकर और इस समीकरण का उपयोग करके, शोधकर्ता एक निश्चित डिग्री की संभावना के साथ, दूसरी विशेषता के संबंधित मूल्य की भविष्यवाणी कर सकता है। निम्नलिखित प्रकार के समीकरण द्वारा सुविधाओं की रैखिक निर्भरता का वर्णन किया गया है:

वाई = ए +बी आप * एक्स ,

कहाँ पे एक -एक बिंदु पर ग्राफ के उदय के बराबर समीकरण का मुक्त पद एक्स = 0एक्स-अक्ष के बारे में, बी प्रतिगमन रेखा का ढलान x-अक्ष के ग्राफ़ के ढलान की स्पर्शरेखा के बराबर है (बशर्ते कि दोनों अक्षों पर मानों का पैमाना समान हो)।

अध्ययन की गई विशेषताओं के मूल्यों को जानने के बाद, निम्न सूत्रों का उपयोग करके मुक्त अवधि और प्रतिगमन गुणांक का मूल्य निर्धारित करना संभव है:

ए =एम आप बी आप * एम एक्स

हमारे मामले में:
;

ए = 58,3 – 0,97 * 166,6 = -103,3

इस प्रकार, ऊँचाई पर भार की निर्भरता का सूत्र इस प्रकार है: वाई = 0.969 * एक्स - 103.3

संबंधित चार्ट नीचे दिखाया गया है।

यदि वजन पर ऊंचाई की निर्भरता का वर्णन करना आवश्यक है ( एक्ससे पर), फिर मान एकतथा बीअलग हो जाते हैं और सूत्रों को तदनुसार संशोधित करने की आवश्यकता होती है:

एक्स= ए +बी एक्स * पर

ए =एम एक्स बी एक्स * एम आप

इस मामले में, ग्राफ का रूप भी बदल जाता है।

प्रतीपगमन गुणांक सहसम्बन्ध गुणांक से निकटता से संबंधित है। उत्तरार्द्ध सुविधा प्रतिगमन गुणांक का ज्यामितीय माध्य है:

सहसंबंध गुणांक के वर्ग को निर्धारण गुणांक कहा जाता है। इसका मान चर के पारस्परिक प्रभाव का प्रतिशत निर्धारित करता है। हमारे मामले में आर 2 = 0,76 2 = 0,58 . इसका मतलब है कि 58% कुल विचरणवाई को चर एक्स के प्रभाव से समझाया गया है, शेष 42% समीकरण में ध्यान में नहीं रखे गए कारकों के प्रभाव के कारण हैं।

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...