प्रतिगमन समीकरण से कारकों के महत्व के गुणांक का निर्धारण। प्रतीपगमन समीकरण के गुणांकों के महत्व के स्तरों का आकलन

विषय 4. संबंधों के अध्ययन के लिए सांख्यिकीय तरीके

प्रतिगमन समीकरण -यह सहसंबंध निर्भरता का एक विश्लेषणात्मक प्रतिनिधित्व है। प्रतिगमन समीकरण प्रभावी विशेषता के सशर्त औसत मूल्य और सुविधा के मूल्य - कारक (कारक) के बीच एक काल्पनिक कार्यात्मक संबंध का वर्णन करता है, अर्थात। व्यसन की अंतर्निहित प्रवृत्ति।

जोड़ी सहसंबंध निर्भरता जोड़ी प्रतिगमन समीकरण द्वारा वर्णित है, बहु सहसंबंध निर्भरता समीकरण द्वारा वर्णित है एकाधिक प्रतिगमन.

प्रतिगमन समीकरण में सुविधा-परिणाम आश्रित चर (प्रतिक्रिया, व्याख्यात्मक चर) है, और सुविधा-कारक स्वतंत्र चर (तर्क, व्याख्यात्मक चर) है।

प्रतिगमन समीकरण का सबसे सरल प्रकार एक युग्मित रैखिक संबंध का समीकरण है:

जहाँ y आश्रित चर (चिह्न-परिणाम) है; x एक स्वतंत्र चर (साइन-फैक्टर) है; और समाश्रयण समीकरण के प्राचल हैं; - अनुमान त्रुटि।

प्रतिगमन समीकरण के रूप में विभिन्न गणितीय कार्यों का उपयोग किया जा सकता है। अक्सर प्रायोगिक उपयोगरैखिक निर्भरता, परवलय, अतिपरवलय, स्टेपी फलन आदि के समीकरण ज्ञात कीजिए।

एक नियम के रूप में, विश्लेषण एक रैखिक संबंध से शुरू होता है, क्योंकि परिणाम अर्थपूर्ण रूप से व्याख्या करना आसान होता है। विश्लेषण में बाधा समीकरण के प्रकार का चुनाव एक महत्वपूर्ण कदम है। "पूर्व-कंप्यूटर" युग में, यह प्रक्रिया कुछ कठिनाइयों से जुड़ी थी और विश्लेषक को गणितीय कार्यों के गुणों को जानने की आवश्यकता थी। वर्तमान में, विशेष कार्यक्रमों के आधार पर, संचार समीकरणों के एक सेट का निर्माण करना संभव है और औपचारिक मानदंडों के आधार पर, सर्वोत्तम मॉडल का चयन करें (हालांकि, एक विश्लेषक की गणितीय साक्षरता ने अपनी प्रासंगिकता नहीं खोई है)।

सहसंबंध क्षेत्र के निर्माण के परिणामों के आधार पर सहसंबंध निर्भरता के प्रकार के बारे में एक परिकल्पना सामने रखी जा सकती है (व्याख्यान 6 देखें)। ग्राफ पर बिंदुओं के स्थान की प्रकृति के आधार पर (अंकों के निर्देशांक आश्रित और स्वतंत्र चर के मूल्यों के अनुरूप होते हैं), संकेतों (संकेतक) के बीच संबंध की प्रवृत्ति का पता चलता है। यदि प्रतिगमन रेखा सहसंबंध क्षेत्र के सभी बिंदुओं से होकर गुजरती है, तो यह एक कार्यात्मक संबंध को इंगित करता है। सामाजिक-आर्थिक अनुसंधान के अभ्यास में, ऐसी तस्वीर नहीं देखी जा सकती है, क्योंकि एक सांख्यिकीय (सहसंबंध) निर्भरता है। सहसंबंध निर्भरता की शर्तों के तहत, स्कैटरप्लॉट पर एक प्रतिगमन रेखा खींचते समय, प्रतिगमन रेखा से सहसंबंध क्षेत्र के बिंदुओं का विचलन देखा जाता है, जो तथाकथित अवशिष्ट या अनुमान त्रुटियों को प्रदर्शित करता है (चित्र 7.1 देखें)।

एक समीकरण त्रुटि की उपस्थिति इस तथ्य के कारण है कि:

प्रतिगमन समीकरण में परिणाम को प्रभावित करने वाले सभी कारकों को ध्यान में नहीं रखा जाता है;

कनेक्शन का रूप गलत तरीके से चुना जा सकता है - प्रतिगमन समीकरण;

सभी कारक समीकरण में शामिल नहीं हैं।

प्रतिगमन समीकरण का निर्माण करने का अर्थ है इसके मापदंडों के मूल्यों की गणना करना। प्रतिगमन समीकरण विश्लेषण की गई विशेषताओं के वास्तविक मूल्यों के आधार पर बनाया गया है। मापदंडों की गणना आमतौर पर का उपयोग करके की जाती है तरीका कम से कम वर्गों(एमएनके)।

MNC . का सारयह है कि समीकरण के मापदंडों के ऐसे मूल्यों को प्राप्त करना संभव है, जिस पर विशेषता-परिणाम (प्रतिगमन समीकरण के आधार पर गणना) के सैद्धांतिक मूल्यों के वर्ग विचलन का योग इसके वास्तविक से मान कम से कम है:

,

सुविधा-परिणाम का वास्तविक मूल्य कहां है y मैं-वें इकाईसमुच्चय; - प्रतिगमन समीकरण () द्वारा प्राप्त जनसंख्या की i-वें इकाई के साइन-परिणाम का मूल्य।

इस प्रकार, समस्या को एक चरम सीमा के लिए हल किया जाता है, अर्थात, यह पता लगाना आवश्यक है कि मापदंडों के किन मूल्यों पर, फ़ंक्शन S न्यूनतम तक पहुंचता है।

विभेदन करना, आंशिक व्युत्पन्न को शून्य के बराबर करना:



, (7.3)

, (7.4)

कारक और परिणाम मूल्यों का औसत उत्पाद कहां है; - संकेत का औसत मूल्य - कारक; - साइन-परिणाम का औसत मूल्य; - साइन-फैक्टर का विचरण।

प्रतिगमन समीकरण में पैरामीटर ग्राफ़ पर प्रतिगमन रेखा के ढलान को दर्शाता है। इस विकल्प को कहा जाता है प्रतिगमन गुणांकऔर इसका मान इस बात की विशेषता है कि इसके माप की इकाई द्वारा साइन-फैक्टर में परिवर्तन होने पर इसके माप की कितनी इकाइयाँ साइन-परिणाम बदल जाएगा। प्रतिगमन गुणांक का संकेत निर्भरता (प्रत्यक्ष या उलटा) की दिशा को दर्शाता है और सहसंबंध गुणांक (युग्मित निर्भरता की शर्तों के तहत) के संकेत के साथ मेल खाता है।

विचाराधीन उदाहरण के ढांचे के भीतर, STATISTICA कार्यक्रम ने प्रतिगमन समीकरण के मापदंडों की गणना की, जो जनसंख्या की औसत प्रति व्यक्ति मौद्रिक आय के स्तर और रूस के क्षेत्रों में प्रति व्यक्ति सकल क्षेत्रीय उत्पाद के मूल्य के बीच संबंध का वर्णन करता है। तालिका 7.1 देखें।

तालिका 7.1 - जनसंख्या की औसत प्रति व्यक्ति नकद आय के स्तर और रूस के क्षेत्रों में प्रति व्यक्ति सकल क्षेत्रीय उत्पाद के मूल्य के बीच संबंध का वर्णन करने वाले समीकरण के मापदंडों की गणना और मूल्यांकन, 2013

तालिका के कॉलम "बी" में जोड़ी प्रतिगमन समीकरण के मापदंडों के मान शामिल हैं, इसलिए, हम लिख सकते हैं: = 13406.89 + 22.82 x। यह समीकरण विश्लेषण की गई विशेषताओं के बीच संबंधों की प्रवृत्ति का वर्णन करता है। पैरामीटर प्रतिगमन गुणांक है। इस मामले में, यह 22.82 के बराबर है और निम्नलिखित की विशेषता है: प्रति व्यक्ति जीआरपी में 1 हजार रूबल की वृद्धि के साथ, प्रति व्यक्ति औसत नकद आय औसतन 22.28 रूबल से बढ़ जाती है (जैसा कि "+" संकेत द्वारा इंगित किया गया है)।

सामाजिक-आर्थिक अध्ययनों में प्रतिगमन समीकरण के पैरामीटर, एक नियम के रूप में, अर्थपूर्ण रूप से व्याख्या नहीं की जाती है। औपचारिक रूप से, यह संकेत के मूल्य को दर्शाता है - परिणाम, बशर्ते कि संकेत - कारक शून्य के बराबर हो। पैरामीटर ग्राफ पर प्रतिगमन रेखा के स्थान को दर्शाता है, चित्र 7.1 देखें।

चित्र 7.1 - सहसंबंध क्षेत्र और प्रतिगमन रेखा, रूस के क्षेत्रों में जनसंख्या की औसत प्रति व्यक्ति मौद्रिक आय के स्तर की निर्भरता और प्रति व्यक्ति जीआरपी के मूल्य को दर्शाती है

पैरामीटर मान X = 0 पर Y-अक्ष के साथ प्रतिगमन रेखा के प्रतिच्छेदन बिंदु से मेल खाता है।

प्रतिगमन समीकरण का निर्माण एक अनुमान के साथ होता है आंकड़ों की महत्तासमग्र रूप से समीकरण और उसके पैरामीटर। ऐसी प्रक्रियाओं की आवश्यकता सीमित मात्रा में डेटा से जुड़ी होती है, जो कानून के संचालन में हस्तक्षेप कर सकती है बड़ी संख्याऔर, परिणामस्वरूप, विश्लेषण किए गए संकेतकों के संबंध में सही प्रवृत्ति का खुलासा करना। इसके अलावा, किसी भी अध्ययन आबादी को के नमूने के रूप में माना जा सकता है आबादी, और सामान्य मापदंडों के अनुमान के रूप में विश्लेषण के दौरान प्राप्त विशेषताएं।

मापदंडों के सांख्यिकीय महत्व और समग्र रूप से समीकरण का आकलन प्रबंधकीय निर्णय लेने और पूर्वानुमान (मॉडलिंग) करने के लिए निर्मित संचार मॉडल का उपयोग करने की संभावना की पुष्टि है।

प्रतिगमन समीकरण का सांख्यिकीय महत्वआम तौर पर अनुमान लगाया जाता है फिशर एफ-टेस्ट, जो स्वतंत्रता की एक डिग्री के लिए परिकलित भाज्य और अवशिष्ट प्रसरणों का अनुपात है:

कहाँ पे - सुविधा का कारक विचरण - परिणाम; k तथ्यात्मक फैलाव की स्वतंत्रता की डिग्री की संख्या है (प्रतिगमन समीकरण में कारकों की संख्या); - आश्रित चर का माध्य मान; - जनसंख्या की i-वें इकाई के लिए आश्रित चर का सैद्धांतिक (प्रतिगमन समीकरण द्वारा प्राप्त) मान; - अवशिष्ट फैलावसंकेत - परिणाम; n जनसंख्या का आयतन है; n-k-1 अवशिष्ट फैलाव की स्वतंत्रता की डिग्री की संख्या है।

फिशर के एफ-टेस्ट का मूल्य, सूत्र के अनुसार, आश्रित चर के कारक और अवशिष्ट भिन्नताओं के बीच के अनुपात को दर्शाता है, संक्षेप में, कितनी बार भिन्नता के समझाया भाग का मूल्य अस्पष्टीकृत से अधिक है।

फिशर का एफ-टेस्ट सारणीबद्ध है, तालिका में इनपुट फैक्टोरियल और अवशिष्ट भिन्नताओं की स्वतंत्रता की डिग्री की संख्या है। सारणीबद्ध (महत्वपूर्ण) के साथ मानदंड के परिकलित मूल्य की तुलना प्रश्न का उत्तर देने की अनुमति देती है: क्या विशेषता-परिणाम की भिन्नता का वह हिस्सा है जिसे सांख्यिकीय रूप से महत्वपूर्ण इस प्रकार के समीकरण में शामिल कारकों द्वारा समझाया जा सकता है? यदि एक , तो प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है और तदनुसार, निर्धारण का गुणांक भी सांख्यिकीय रूप से महत्वपूर्ण है। अन्यथा ( ), समीकरण सांख्यिकीय रूप से महत्वहीन है, अर्थात। समीकरण में ध्यान में रखे गए कारकों की भिन्नता विशेषता-परिणाम की भिन्नता के सांख्यिकीय रूप से महत्वपूर्ण भाग की व्याख्या नहीं करती है, या संबंध समीकरण सही ढंग से नहीं चुना गया है।

समीकरण के मापदंडों के सांख्यिकीय महत्व का अनुमानके आधार पर किया गया टी सांख्यिकी, जिसे प्रतिगमन समीकरण के मापदंडों के निरपेक्ष मान के अनुपात के रूप में उनकी मानक त्रुटियों के रूप में परिकलित किया जाता है ( ):

, कहाँ पे ; (7.6)

, कहाँ पे ; (7.7)

कहाँ पे - मानक विचलनसंकेत - कारक और संकेत - परिणाम; - दृढ़ संकल्प का गुणांक।

विशिष्ट सांख्यिकीय कार्यक्रमों में, मापदंडों की गणना हमेशा उनके मानक (मूल माध्य वर्ग) त्रुटियों और टी-सांख्यिकी की गणना के साथ होती है (तालिका 7.1 देखें)। t-सांख्यिकी के परिकलित मान की तुलना सारणी से की जाती है, यदि अध्ययन की गई जनसंख्या का आयतन 30 इकाइयों (निश्चित रूप से एक छोटा सा नमूना) से कम है, तो किसी को छात्र की t-वितरण तालिका का उल्लेख करना चाहिए, यदि जनसंख्या की मात्रा बड़ी है , किसी को सामान्य वितरण तालिका (लाप्लास की संभाव्यता अभिन्न) का उपयोग करना चाहिए। एक समीकरण पैरामीटर को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है यदि।

टी-सांख्यिकी के आधार पर मापदंडों का अनुमान, संक्षेप में, सामान्य मापदंडों की शून्य (एच 0: = 0; एच 0: = 0;) की समानता के बारे में शून्य परिकल्पना का एक परीक्षण है, जो कि सांख्यिकीय रूप से महत्वहीन है प्रतिगमन समीकरण के मापदंडों का मूल्य। परिकल्पना का महत्व स्तर, एक नियम के रूप में, लिया जाता है: = 0.05। यदि परिकलित महत्व स्तर 0.05 से कम है, तो शून्य परिकल्पना को खारिज कर दिया जाता है और वैकल्पिक एक को स्वीकार किया जाता है - पैरामीटर के सांख्यिकीय महत्व के बारे में।

आइए उदाहरण के साथ जारी रखें। कॉलम "बी" में तालिका 7.1 पैरामीटर के मान दिखाती है, कॉलम Std.Err.ofB में - पैरामीटर की मानक त्रुटियों के मान ( ), कॉलम t (77 - स्वतंत्रता की डिग्री की संख्या) में t - आँकड़ों के मूल्यों की गणना स्वतंत्रता की डिग्री की संख्या को ध्यान में रखते हुए की जाती है। मापदंडों के सांख्यिकीय महत्व का आकलन करने के लिए, टी-सांख्यिकी के परिकलित मूल्यों की तुलना तालिका मूल्य से की जानी चाहिए। सामान्य वितरण तालिका में दिया गया महत्व का स्तर (0.05) t = 1.96 से मेल खाता है। 18.02, 10.84 से, अर्थात्। , किसी को प्राप्त पैरामीटर मानों के सांख्यिकीय महत्व को पहचानना चाहिए, अर्थात। ये मान गैर-यादृच्छिक कारकों के प्रभाव में बनते हैं और विश्लेषण किए गए संकेतकों के बीच संबंधों की प्रवृत्ति को दर्शाते हैं।

समग्र रूप से समीकरण के सांख्यिकीय महत्व का आकलन करने के लिए, हम फिशर के एफ-परीक्षण के मूल्य की ओर मुड़ते हैं (तालिका 7.1 देखें)। F-मानदंड का परिकलित मान = 117.51, स्वतंत्रता की डिग्री की संगत संख्या के आधार पर मानदंड का सारणीबद्ध मान (कारक विचरण d.f. =1 के लिए, अवशिष्ट प्रसरण d.f. = 77 के लिए), 4.00 है (देखें परिशिष्ट .. ..।) इस तरह, इसलिए, समग्र रूप से प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है। ऐसे में हम निर्धारण गुणांक के मान के सांख्यिकीय महत्व के बारे में भी बात कर सकते हैं, अर्थात्। रूस के क्षेत्रों में जनसंख्या की औसत प्रति व्यक्ति आय में 60 प्रतिशत भिन्नता को प्रति व्यक्ति सकल क्षेत्रीय उत्पाद की मात्रा में भिन्नता द्वारा समझाया जा सकता है।

प्रतिगमन समीकरण और उसके मापदंडों के सांख्यिकीय महत्व का आकलन करके, हम परिणामों का एक अलग संयोजन प्राप्त कर सकते हैं।

एफ-टेस्ट द्वारा समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और टी-सांख्यिकी द्वारा समीकरण के सभी पैरामीटर भी सांख्यिकीय रूप से महत्वपूर्ण हैं। इस समीकरण का उपयोग प्रबंधकीय निर्णय लेने के लिए किया जा सकता है (वांछित परिणाम प्राप्त करने के लिए किन कारकों को प्रभावित किया जाना चाहिए), और कारकों के कुछ मूल्यों के लिए परिणाम विशेषता के व्यवहार की भविष्यवाणी करने के लिए।

· एफ-मानदंड के अनुसार, समीकरण सांख्यिकीय रूप से महत्वपूर्ण है, लेकिन समीकरण के पैरामीटर (पैरामीटर) महत्वहीन हैं। समीकरण का उपयोग प्रबंधन निर्णय लेने के लिए किया जा सकता है (उन कारकों के संबंध में जिनके लिए उनके प्रभाव के सांख्यिकीय महत्व की पुष्टि की गई है), लेकिन समीकरण का उपयोग पूर्वानुमान के लिए नहीं किया जा सकता है।

· एफ-परीक्षण समीकरण सांख्यिकीय रूप से महत्वपूर्ण नहीं है। समीकरण का उपयोग नहीं किया जा सकता है। तर्क और प्रतिक्रिया के बीच महत्वपूर्ण संकेत-कारकों या संबंध के विश्लेषणात्मक रूप की खोज जारी रखी जानी चाहिए।

यदि समीकरण और उसके मापदंडों के सांख्यिकीय महत्व की पुष्टि की जाती है, तो तथाकथित बिंदु पूर्वानुमान को लागू किया जा सकता है, अर्थात। गुणक (x) के कुछ मानों के लिए गुण-परिणाम (y) के मान का अनुमान प्राप्त किया गया था।

यह बिल्कुल स्पष्ट है कि संबंध समीकरण के आधार पर परिकलित आश्रित चर का अनुमानित मान, उसके वास्तविक मान से मेल नहीं खाएगा ( ग्राफिक रूप से, इस स्थिति की पुष्टि इस तथ्य से होती है कि सहसंबंध क्षेत्र के सभी बिंदु प्रतिगमन रेखा पर नहीं होते हैं, केवल एक कार्यात्मक कनेक्शन के साथ प्रतिगमन रेखा स्कैटर आरेख के सभी बिंदुओं से होकर गुजरेगी। आश्रित चर के वास्तविक और सैद्धांतिक मूल्यों के बीच विसंगतियों की उपस्थिति मुख्य रूप से सहसंबंध निर्भरता के बहुत सार के कारण होती है: एक ही समय में, कई कारक परिणाम को प्रभावित करते हैं, जिनमें से केवल एक हिस्से को ध्यान में रखा जा सकता है विशिष्ट संबंध समीकरण इसके अलावा, परिणाम और कारक (प्रतिगमन समीकरण का प्रकार) के बीच संबंध के रूप को गलत तरीके से चुना जा सकता है। इस संबंध में, प्रश्न उठता है कि निर्मित बाधा समीकरण कितना जानकारीपूर्ण है। इस प्रश्न का उत्तर दो संकेतकों द्वारा दिया गया है: निर्धारण का गुणांक (इसकी पहले ही ऊपर चर्चा की जा चुकी है) और अनुमान की मानक त्रुटि।

आश्रित चर के वास्तविक और सैद्धांतिक मूल्यों के बीच के अंतर को कहा जाता है विचलन या त्रुटियां, या बचा हुआ. इन मूल्यों के आधार पर, अवशिष्ट विचरण की गणना की जाती है। वर्गमूलअवशिष्ट विचरण से और है रूट-माध्य-वर्ग (मानक) अनुमान त्रुटि:

= (7.8)

समीकरण की मानक त्रुटि को अनुमानित दर के समान इकाइयों में मापा जाता है। यदि समीकरण त्रुटियां एक सामान्य वितरण (बड़ी मात्रा में डेटा के साथ) का पालन करती हैं, तो 95 प्रतिशत मान प्रतिगमन रेखा से 2S से अधिक की दूरी पर होना चाहिए (सामान्य वितरण की संपत्ति के आधार पर - नियम तीन सिग्मा)। अनुमान के मानक त्रुटि के मूल्य का उपयोग किसी संकेत के मूल्य की भविष्यवाणी करते समय आत्मविश्वास अंतराल की गणना में किया जाता है - जनसंख्या की एक विशिष्ट इकाई के लिए परिणाम।

व्यावहारिक अनुसंधान में, अक्सर एक विशेषता के औसत मूल्य की भविष्यवाणी करना आवश्यक हो जाता है - विशेषता के एक विशेष मूल्य के लिए परिणाम - कारक। इस मामले में, आश्रित चर के औसत मूल्य के लिए विश्वास अंतराल की गणना में ()

मूल्य को ध्यान में रखा जाता है औसत त्रुटि:

(7.9)

विभिन्न त्रुटि मानों के उपयोग को इस तथ्य से समझाया जाता है कि जनसंख्या की विशिष्ट इकाइयों के लिए संकेतकों के स्तर की परिवर्तनशीलता औसत मूल्य की परिवर्तनशीलता से बहुत अधिक है, इसलिए, औसत मूल्य की पूर्वानुमान त्रुटि छोटी है।

विश्वास अंतरालआश्रित चर के माध्य मान का पूर्वानुमान:

, (7.10)

कहाँ पे - सीमांत त्रुटिअनुमान (नमूना सिद्धांत देखें); t आत्मविश्वास गुणांक है, जिसका मान शोधकर्ता द्वारा अपनाई गई संभाव्यता के स्तर (स्वतंत्रता की डिग्री की संख्या) के आधार पर संबंधित तालिका में है (नमूना सिद्धांत देखें)।

परिणाम विशेषता के अनुमानित मूल्य के लिए विश्वास अंतराल की गणना प्रतिगमन रेखा के बदलाव (शिफ्ट) के लिए सुधार को ध्यान में रखते हुए भी की जा सकती है। सुधार कारक का मूल्य इसके द्वारा निर्धारित किया जाता है:

(7.11)

विशेषता-कारक का मूल्य कहाँ है, जिसके आधार पर विशेषता-परिणाम के मूल्य की भविष्यवाणी की जाती है।

यह इस प्रकार है कि जितना अधिक मूल्य विशेषता-कारक के औसत मूल्य से भिन्न होता है, अधिक मूल्यसुधार कारक, पूर्वानुमान त्रुटि जितनी अधिक होगी। इस गुणांक को देखते हुए, पूर्वानुमान के विश्वास अंतराल की गणना की जाएगी:

प्रतिगमन समीकरण के आधार पर पूर्वानुमान की सटीकता से प्रभावित हो सकता है विभिन्न कारणों से. सबसे पहले, यह ध्यान में रखा जाना चाहिए कि समीकरण की गुणवत्ता और उसके मापदंडों का मूल्यांकन यादृच्छिक अवशेषों के सामान्य वितरण की धारणा पर आधारित है। इस धारणा का उल्लंघन डेटा में तेजी से भिन्न मूल्यों की उपस्थिति के कारण हो सकता है, गैर-समान भिन्नता के साथ, गैर-रैखिक संबंध की उपस्थिति के साथ। इस मामले में, पूर्वानुमान की गुणवत्ता कम हो जाती है। ध्यान रखने वाली दूसरी बात यह है कि परिणाम की भविष्यवाणी करते समय ध्यान में रखे गए कारकों के मूल्यों को उस डेटा में भिन्नता की सीमा से आगे नहीं जाना चाहिए जिस पर समीकरण बनाया गया है।

©2015-2019 साइट
सभी अधिकार उनके लेखकों के हैं। यह साइट लेखकत्व का दावा नहीं करती है, लेकिन मुफ्त उपयोग प्रदान करती है।
पेज बनाने की तारीख: 2018-01-08

समीकरण खोजने के बाद रेखीय प्रतिगमन, समग्र रूप से समीकरण और उसके व्यक्तिगत मापदंडों दोनों के महत्व का अनुमान लगाया जाता है।

प्रतिगमन समीकरण के महत्व की जाँच करें - यह निर्धारित करने का मतलब है कि क्या गणित का मॉडल, चर, प्रयोगात्मक डेटा के बीच संबंध को व्यक्त करना, और क्या आश्रित चर का वर्णन करने के लिए समीकरण (एक या अधिक) में पर्याप्त व्याख्यात्मक चर शामिल हैं।

महत्व परीक्षण पर आधारित है भिन्नता का विश्लेषण.

विचरण के विश्लेषण के विचार के अनुसार, माध्य मान से y के वर्ग विचलन (RMS) का कुल योग दो भागों में विघटित होता है - समझाया और अस्पष्टीकृत:

या, क्रमशः:

यहां दो चरम मामले हैं: जब कुल मानक विचलन बिल्कुल अवशिष्ट के बराबर होता है और जब कुल मानक विचलन भाज्य के बराबर होता है।

पहले मामले में, x कारक परिणाम को प्रभावित नहीं करता है, y का संपूर्ण विचरण अन्य कारकों के प्रभाव के कारण होता है, प्रतिगमन रेखा ऑक्स अक्ष के समानांतर होती है, और समीकरण जैसा दिखना चाहिए।

दूसरे मामले में, अन्य कारक परिणाम को प्रभावित नहीं करते हैं, y कार्यात्मक रूप से x से संबंधित है, और अवशिष्ट मानक विचलन शून्य है।

हालाँकि, व्यवहार में दोनों शब्द दायीं ओर मौजूद हैं। भविष्यवाणी के लिए प्रतिगमन रेखा की उपयुक्तता इस बात पर निर्भर करती है कि y में कुल विचरण का कितना हिस्सा समझाया गया है। यदि समझाया गया आरएमएसडी अवशिष्ट आरएमएसडी से अधिक है, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और x कारक का y परिणाम पर महत्वपूर्ण प्रभाव पड़ता है। यह इस तथ्य के बराबर है कि दृढ़ संकल्प का गुणांक एकता के करीब पहुंच जाएगा।

स्वतंत्रता की डिग्री की संख्या (डीएफ-स्वतंत्रता की डिग्री) स्वतंत्र रूप से चर विशेषता मूल्यों की संख्या है।

समग्र मानक विचलन के लिए (n-1) स्वतंत्र विचलन की आवश्यकता होती है,

फैक्टोरियल मानक विचलन में स्वतंत्रता की एक डिग्री होती है, और

इस प्रकार, हम लिख सकते हैं:

इस संतुलन से, हम यह निर्धारित करते हैं कि = n-2।

प्रत्येक मानक विचलन को उसकी स्वतंत्रता की डिग्री की संख्या से विभाजित करने पर, हमें विचलन का माध्य वर्ग, या प्रति एक डिग्री स्वतंत्रता का विचरण मिलता है: - कुल विचरण, - भाज्य, - अवशिष्ट।

रैखिक प्रतिगमन गुणांक के सांख्यिकीय महत्व का विश्लेषण

यद्यपि रैखिक निर्भरता समीकरण के गुणांकों के सैद्धांतिक मूल्यों को स्थिर माना जाता है, यादृच्छिक नमूनाकरण डेटा से समीकरण के निर्माण के दौरान प्राप्त इन गुणांकों के ए और बी के अनुमान हैं यादृच्छिक चर. यदि प्रतिगमन त्रुटियाँ हैं सामान्य वितरण, तो गुणांकों के अनुमानों को भी सामान्य रूप से वितरित किया जाता है और उनके माध्य मानों और विचरण की विशेषता हो सकती है। इसलिए, इन विशेषताओं की गणना के साथ गुणांक का विश्लेषण शुरू होता है।

गुणांक प्रसरणों की गणना सूत्रों द्वारा की जाती है:

प्रतिगमन गुणांक का विचरण:

प्रति एक डिग्री स्वतंत्रता के लिए अवशिष्ट फैलाव कहाँ है।

पैरामीटर फैलाव:

इसलिए, प्रतिगमन गुणांक की मानक त्रुटि सूत्र द्वारा निर्धारित की जाती है:

पैरामीटर की मानक त्रुटि सूत्र द्वारा निर्धारित की जाती है:

वे अशक्त परिकल्पनाओं का परीक्षण करने के लिए कार्य करते हैं कि प्रतिगमन गुणांक b या अवरोधन a का सही मान शून्य है: ।

वैकल्पिक परिकल्पना का रूप है:।

टी-सांख्यिकी में स्वतंत्रता की डिग्री के साथ टी-छात्र वितरण है। विद्यार्थी की वितरण सारणी के अनुसार, महत्व के एक निश्चित स्तर b और स्वतंत्रता की डिग्री पर, एक महत्वपूर्ण मूल्य पाया जाता है।

यदि, तो, शून्य परिकल्पना को अस्वीकार कर दिया जाना चाहिए, गुणांक को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है।

यदि, तो शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है। (यदि गुणांक b सांख्यिकीय रूप से महत्वहीन है, तो समीकरण इस तरह दिखना चाहिए, और इसका मतलब है कि सुविधाओं के बीच कोई संबंध नहीं है। यदि गुणांक a सांख्यिकीय रूप से महत्वहीन है, तो फॉर्म में नए समीकरण का मूल्यांकन करने की अनुशंसा की जाती है)।

अंतराल गुणांक अनुमान रेखीय समीकरणप्रतिगमन:

के लिए कॉन्फिडेंस इंटरवलएक: ।

के लिए कॉन्फिडेंस इंटरवलबी:

इसका मतलब यह है कि दी गई विश्वसनीयता (जहां महत्व स्तर है) के साथ, ए, बी के सही मूल्य संकेतित अंतराल में हैं।

प्रतिगमन गुणांक की स्पष्ट आर्थिक व्याख्या है, इसलिए अंतराल की आत्मविश्वास सीमा में असंगत परिणाम नहीं होने चाहिए, उदाहरण के लिए, उनमें शून्य शामिल नहीं होना चाहिए।

समग्र रूप से समीकरण के सांख्यिकीय महत्व का विश्लेषण।

प्रतिगमन विश्लेषण में फिशर वितरण

समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन फिशर के एफ-परीक्षण का उपयोग करके दिया गया है। इस मामले में, शून्य परिकल्पना को सामने रखा गया है कि सभी प्रतिगमन गुणांक, मुक्त शब्द a के अपवाद के साथ, शून्य के बराबर हैं और इसलिए, x कारक परिणाम y (या) को प्रभावित नहीं करता है।

एफ-मानदंड का मान निर्धारण के गुणांक के साथ जुड़ा हुआ है। कब एकाधिक प्रतिगमन:

जहाँ m स्वतंत्र चरों की संख्या है।

कब जोड़ीदार प्रतिगमनफॉर्मूला एफ - आंकड़े फॉर्म लेते हैं:

F-मानदंड का सारणीबद्ध मान ज्ञात करते समय, एक महत्व स्तर निर्धारित किया जाता है (आमतौर पर 0.05 या 0.01) और स्वतंत्रता की दो डिग्री: - एकाधिक प्रतिगमन के मामले में, - युग्मित प्रतिगमन के लिए।

यदि, तो इसे अस्वीकार कर दिया जाता है और y और x के बीच सांख्यिकीय संबंध के महत्व के बारे में निष्कर्ष निकाला जाता है।

यदि, तो सांख्यिकीय रूप से महत्वहीन माने जाने वाले प्रतिगमन समीकरण की प्रायिकता को अस्वीकार नहीं किया जाता है।

टिप्पणी। जोड़ीदार रैखिक प्रतिगमन में। इसके अलावा, इसलिए। इस प्रकार, प्रतिगमन और सहसंबंध गुणांक के महत्व के बारे में परिकल्पना का परीक्षण रेखीय प्रतिगमन समीकरण के महत्व के बारे में परिकल्पना के परीक्षण के बराबर है।

फिशर वितरण का उपयोग न केवल इस परिकल्पना का परीक्षण करने के लिए किया जा सकता है कि सभी रैखिक प्रतिगमन गुणांक एक साथ शून्य के बराबर हैं, बल्कि यह भी परिकल्पना है कि इनमें से कुछ गुणांक शून्य के बराबर हैं। यह एक रैखिक के विकास में महत्वपूर्ण है प्रतिगमन मॉडल, चूंकि यह अलग-अलग चर या उनके समूहों को व्याख्यात्मक चर की संख्या से बाहर करने की वैधता का आकलन करने की अनुमति देता है, या, इसके विपरीत, उन्हें इस संख्या में शामिल करता है।

उदाहरण के लिए, उदाहरण के लिए, बहु रेखीय प्रतिगमन का अनुमान पहले m व्याख्यात्मक चर के साथ n टिप्पणियों के लिए लगाया गया था, और निर्धारण का गुणांक बराबर है, फिर अंतिम k चर को व्याख्यात्मक चर की सूची से बाहर रखा गया है, और वह समीकरण जिसके लिए गुणांक का गुणांक है निर्धारण है (, क्योंकि (प्रत्येक अतिरिक्त चर आश्रित चर की भिन्नता के एक भाग, चाहे वह कितना ही छोटा क्यों न हो) की व्याख्या करता है।

बहिष्कृत चर वाले सभी गुणांकों के शून्य से समकालिक समानता के बारे में परिकल्पना का परीक्षण करने के लिए, मान की गणना की जाती है

जिसमें स्वतंत्रता की डिग्री के साथ फिशर वितरण है।

फिशर की वितरण सारणी के अनुसार, एक दिए गए महत्व स्तर पर, वे पाते हैं। और यदि, तो शून्य परिकल्पना अस्वीकृत हो जाती है। इस मामले में, सभी k चर को समीकरण से बाहर करना गलत है।

समाश्रयण समीकरण में एक या एक से अधिक k नए व्याख्यात्मक चरों को शामिल करने की वैधता के बारे में समान तर्क किया जा सकता है।

इस मामले में, एफ की गणना की जाती है - आंकड़े

वितरण कर रहा है। और यदि यह एक महत्वपूर्ण स्तर से अधिक है, तो नए चरों का समावेश आश्रित चर के पहले अस्पष्टीकृत विचरण का एक महत्वपूर्ण हिस्सा बताता है (यानी, नए व्याख्यात्मक चर का समावेश उचित है)।

टिप्पणियां। 1. यह सलाह दी जाती है कि एक बार में एक नए चर शामिल करें।

2. एफ - आंकड़ों की गणना करने के लिए, समीकरण में व्याख्यात्मक चर को शामिल करने पर विचार करते समय, स्वतंत्रता की डिग्री की संख्या के लिए समायोजित निर्धारण के गुणांक पर विचार करना वांछनीय है।

एफ - फिशर सांख्यिकी का उपयोग अवलोकन के अलग-अलग समूहों के लिए प्रतिगमन समीकरणों के संयोग के बारे में परिकल्पना का परीक्षण करने के लिए भी किया जाता है।

मान लीजिए कि 2 नमूने हैं, जिनमें क्रमशः प्रेक्षण हैं। इनमें से प्रत्येक नमूने के लिए, प्रजाति प्रतिगमन समीकरण का मूल्यांकन किया गया था। मान लीजिए कि समाश्रयण रेखा (अर्थात) से मानक विचलन क्रमशः उनके लिए समान है।

शून्य परिकल्पना का परीक्षण किया जाता है: कि इन समीकरणों के सभी संगत गुणांक एक दूसरे के बराबर हैं, अर्थात। इन नमूनों के लिए प्रतिगमन समीकरण समान है।

एक ही प्रकार के प्रतिगमन समीकरण को एक ही बार में सभी अवलोकनों और आरएमएस के लिए अनुमानित होने दें।

फिर F की गणना की जाती है - सूत्र के अनुसार आँकड़े:

इसमें स्वतंत्रता की डिग्री के साथ फिशर वितरण है। एफ - आंकड़े शून्य के करीब होंगे यदि दोनों नमूनों के लिए समीकरण समान है, क्योंकि इस मामले में। वे। है, तो शून्य परिकल्पना स्वीकृत होती है।

यदि, तो शून्य परिकल्पना को खारिज कर दिया जाता है, और एक एकल प्रतिगमन समीकरण का निर्माण नहीं किया जा सकता है।

रैखिक प्रतिगमन समीकरण मिलने के बाद, समग्र रूप से समीकरण और उसके व्यक्तिगत मापदंडों दोनों के महत्व का आकलन किया जाता है।

समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन फिशर के एफ-परीक्षण का उपयोग करके दिया गया है। इस मामले में, शून्य परिकल्पना को आगे रखा जाता है, प्रतिगमन गुणांक शून्य है, अर्थात b = 0 है, और इसलिए, कारक x परिणाम y को प्रभावित नहीं करता है। एफ-मानदंड की प्रत्यक्ष गणना विचरण के विश्लेषण से पहले होती है। केन्द्रीय स्थानयह अपघटन लेता है कुल राशिचर y का वर्ग विचलन y के माध्य मान से दो भागों में - "व्याख्या" और "अस्पष्टीकृत" (परिशिष्ट 2)।

औसत मूल्य y से परिणामी विशेषता y के व्यक्तिगत मूल्यों के वर्ग विचलन का कुल योग कई कारणों के प्रभाव के कारण होता है। परंपरागत रूप से, कारणों के पूरे सेट को दो समूहों में विभाजित किया जा सकता है:

  • अध्ययनित कारक x
  • अन्य कारक

यदि कारक परिणाम को प्रभावित नहीं करता है, तो ग्राफ पर प्रतिगमन रेखा x-अक्ष y = y के समानांतर होती है। तब परिणामी विशेषता का संपूर्ण फैलाव अन्य कारकों के प्रभाव के कारण होता है और वर्ग विचलन का कुल योग अवशिष्ट के साथ मेल खाता है। यदि अन्य कारक परिणाम को प्रभावित नहीं करते हैं, तो y कार्यात्मक रूप से x से संबंधित है और वर्गों का अवशिष्ट योग शून्य है। इस मामले में, प्रतिगमन द्वारा समझाया गया वर्ग विचलन का योग वर्गों के कुल योग के समान है।

चूंकि सहसंबंध क्षेत्र के सभी बिंदु प्रतिगमन रेखा पर नहीं होते हैं, इसलिए कारक x के प्रभाव के कारण, यानी x पर y का प्रतिगमन, और अन्य मात्राओं (अस्पष्टीकृत भिन्नता) की कार्रवाई के कारण दोनों में हमेशा बिखराव होता है। ) भविष्यवाणी के लिए प्रतिगमन रेखा की उपयुक्तता इस बात पर निर्भर करती है कि व्याख्या की गई भिन्नता के कारण विशेषता y की कुल भिन्नता का कितना हिस्सा है। जाहिर है, अगर प्रतिगमन के कारण वर्ग विचलन का योग वर्गों के अवशिष्ट योग से अधिक है, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और x कारक का y परिणाम पर महत्वपूर्ण प्रभाव पड़ता है। यह इस तथ्य के बराबर है कि निर्धारण का गुणांक r 2 xy एकता के करीब पहुंच जाएगा।

वर्ग विचलन का कोई भी योग स्वतंत्रता की डिग्री (df - स्वतंत्रता की डिग्री) की संख्या के साथ जुड़ा हुआ है, अर्थात, सुविधा की स्वतंत्र भिन्नता की स्वतंत्रता की संख्या के साथ। स्वतंत्रता की डिग्री की संख्या जनसंख्या n की इकाइयों की संख्या और इससे निर्धारित स्थिरांक की संख्या से संबंधित है। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या को यह दिखाना चाहिए कि n में से कितने स्वतंत्र विचलन संभव हैं [(y 1 -y), (y 2 -y), ..., (y n -y)] हैं दिए गए वर्गों का योग बनाने के लिए आवश्यक है। तो, वर्गों का कुल योग?(y-y) 2 के लिए (n-1) स्वतंत्र विचलन की आवश्यकता होती है।

वर्गों की व्याख्या या भाज्य योग की गणना करते समय? (y x -y) 2, प्रभावी विशेषता y x के सैद्धांतिक (गणना) मूल्यों का उपयोग किया जाता है, जो प्रतिगमन रेखा के साथ पाए जाते हैं: y x ​​\u003d a + b * एक्स।

रैखिक प्रतिगमन में, रैखिक प्रतिगमन के कारण वर्ग विचलन का योग होगा: ?(y x -y) 2 =b 2 *?(x -x) 2 ।

चूँकि, x और y में दी गई प्रेक्षणों की मात्रा के लिए, रैखिक समाश्रयण में वर्गों का भाज्य योग, समाश्रयण गुणांक b के केवल एक स्थिरांक पर निर्भर करता है, तो वर्गों के इस योग में स्वतंत्रता की एक डिग्री होती है। यदि हम फीचर y, यानी y x के परिकलित मान के सामग्री पक्ष पर विचार करते हैं तो हम उसी निष्कर्ष पर पहुंचेंगे। y x का मान रैखिक प्रतिगमन समीकरण द्वारा निर्धारित किया जाता है: y x ​​=a+b*x। पैरामीटर a को इस प्रकार परिभाषित किया जा सकता है: a=y-b*x. पैरामीटर a के लिए व्यंजक को रैखिक मॉडल में प्रतिस्थापित करने पर, हम प्राप्त करते हैं:

y x \u003d y-b * x + b * x \u003d y-b * (x-x)।

इससे पता चलता है कि दिए गए चर y और x के लिए, रैखिक प्रतिगमन में परिकलित मान y x केवल एक पैरामीटर का एक कार्य है - प्रतिगमन गुणांक। तदनुसार, वर्ग विचलन के भाज्य योग में स्वतंत्रता की कई डिग्री 1 के बराबर होती है।

वर्गों के कुल, भाज्य और अवशिष्ट योगों की स्वतंत्रता की डिग्री की संख्या के बीच एक समानता है। रैखिक प्रतिगमन में वर्गों के अवशिष्ट योग की स्वतंत्रता की डिग्री की संख्या n-2 है। वर्गों के कुल योग के लिए स्वतंत्रता की डिग्री की संख्या इकाइयों की संख्या से निर्धारित होती है, और चूंकि नमूना डेटा से गणना की गई औसत का उपयोग किया जाता है, इसलिए हम स्वतंत्रता की एक डिग्री खो देते हैं, यानी df कुल = n-1।

तो दो समानताएँ हैं:

? (y-y) 2 \u003d? (y x -y) 2 +? (y- y x) 2,

प्रत्येक वर्ग के योग को उसके अनुरूप स्वतंत्रता की डिग्री की संख्या से विभाजित करते हुए, हम विचलन का औसत वर्ग प्राप्त करते हैं, या, समान रूप से, प्रति एक डिग्री स्वतंत्रता डी का विचरण।

डी कुल \u003d? (वाई-वाई) 2 / (एन -1);

डी तथ्य \u003d? (वाई एक्स -वाई) 2/1;

डी आराम \u003d? (y- y x) 2 / (n-1)।

प्रति एक डिग्री की स्वतंत्रता के लिए फैलाव का निर्धारण करने से फैलाव एक तुलनीय रूप में आ जाता है। प्रति एक डिग्री स्वतंत्रता के भाज्य और अवशिष्ट प्रसरणों की तुलना करने पर, हम F-अनुपात (F-मानदंड) का मान प्राप्त करते हैं:

एफ = डी तथ्य / डी बाकी, जहां

एफ - शून्य परिकल्पना के परीक्षण के लिए मानदंड एच 0: डी तथ्य = डी आराम।

यदि शून्य परिकल्पना सत्य है, तो तथ्यात्मक और अवशिष्ट प्रसरण एक दूसरे से भिन्न नहीं होते हैं। एच 0 के लिए, एक खंडन आवश्यक है ताकि कारक भिन्नता कई बार अवशिष्ट से अधिक हो।

अंग्रेजी सांख्यिकीविद् स्नेडेकोर ने के लिए एफ-अनुपात के महत्वपूर्ण मूल्यों की सारणी विकसित की अलग - अलग स्तरशून्य परिकल्पना का महत्व और स्वतंत्रता की डिग्री की एक अलग संख्या।

एफ-मानदंड का सारणीबद्ध मान भिन्नताओं के अनुपात का अधिकतम मूल्य है जो तब हो सकता है जब वे यादृच्छिक रूप से विचलन करते हैं दिया गया स्तरशून्य परिकल्पना होने की संभावना।

एफ-अनुपात का परिकलित मूल्य विश्वसनीय (एक के अलावा) के रूप में पहचाना जाता है यदि यह सारणीबद्ध से अधिक है।

इस मामले में, संकेतों के संबंध की अनुपस्थिति के बारे में शून्य परिकल्पना को खारिज कर दिया जाता है और इस संबंध के महत्व के बारे में निष्कर्ष निकाला जाता है: एफ तथ्य> एफ टैब। एच 0 खारिज कर दिया है।

यदि मान सारणीबद्ध F तथ्य से कम है

मॉडल की गुणवत्ता का निर्धारण निर्धारण के गुणांक द्वारा किया जाता है। निर्धारण गुणांक ( आर 2) बहु सहसंबंध गुणांक का वर्ग है।

यह दर्शाता है कि परिणामी विशेषता के विचरण के अनुपात को स्वतंत्र चर के प्रभाव से समझाया गया है।

निर्धारण के गुणांक की गणना के लिए सूत्र:

आप मैं-- नमूना डेटा, और एफ मैं- संबंधित मॉडल मान।

यह दो चरों के बीच पियर्सन सहसंबंध का वर्ग भी है। यह दो चरों के बीच साझा किए गए विचरण की मात्रा को व्यक्त करता है।

गुणांक अंतराल से मान लेता है। मान 1 के जितना करीब होगा, मॉडल अनुभवजन्य टिप्पणियों के उतना ही करीब होगा।

एक युग्मित रैखिक प्रतिगमन मॉडल के मामले में, निर्धारण का गुणांक सहसंबंध गुणांक के वर्ग के बराबर होता है, अर्थात आर 2 = आर 2 .

कभी-कभी कनेक्शन की निकटता के संकेतकों को गुणात्मक मूल्यांकन (चैडॉक स्केल) (परिशिष्ट 3) दिया जा सकता है।

एक कार्यात्मक कनेक्शन 1 के बराबर मूल्य पर होता है, और कनेक्शन की अनुपस्थिति 0 है। 0.7 से कम कनेक्शन की जकड़न के संकेतकों के मूल्यों के साथ, निर्धारण के गुणांक का मूल्य हमेशा 50 से नीचे होगा। %. इसका मतलब यह है कि कारक विशेषताओं में भिन्नता का हिस्सा अन्य कारकों की तुलना में एक छोटे से हिस्से के लिए होता है, जो कि प्रभावी संकेतक में परिवर्तन को प्रभावित करने वाले मॉडल में ध्यान में नहीं रखा जाता है। ऐसी परिस्थितियों में निर्मित प्रतिगमन मॉडल कम व्यावहारिक मूल्य के होते हैं।

जोड़ी प्रतिगमनदो चरों के बीच प्रतिगमन है

-y और x, अर्थात्।मॉडल देखें + ई

कहाँ पे पर- प्रभावी संकेत, यानी आश्रित चर; एक्स- संकेत कारक।

रेखीय प्रतिगमन को फॉर्म का समीकरण खोजने के लिए कम किया जाता है या

फॉर्म का एक समीकरण कारक x के दिए गए मानों को प्रभावी विशेषता के सैद्धांतिक मूल्यों के लिए अनुमति देता है, इसमें कारक x के वास्तविक मूल्यों को प्रतिस्थापित करता है।

एक रेखीय प्रतिगमन का निर्माण इसके मापदंडों a और b का अनुमान लगाने के लिए कम किया गया है।

रैखिक प्रतिगमन पैरामीटर अनुमान विभिन्न तरीकों से पाए जा सकते हैं।

1.

2.

पैरामीटर बीबुलाया प्रतिगमन गुणांक. इसका मूल्य दिखाता है

एक इकाई द्वारा कारक में परिवर्तन के साथ परिणाम में औसत परिवर्तन।

औपचारिक रूप से एक- अर्थ पर x = 0 पर। यदि साइन-फैक्टर

शून्य मान नहीं है और नहीं हो सकता है, तो उपरोक्त

मुक्त अवधि व्याख्या, एककोई मतलब नहीं है। पैरामीटर, एकशायद

कोई आर्थिक सामग्री नहीं है। आर्थिक प्रयास

पैरामीटर की व्याख्या करें, एकबेतुकापन पैदा कर सकता है, खासकर जब एक < 0.

केवल पैरामीटर के संकेत की व्याख्या की जा सकती है एक।यदि एक एक > 0,

तो परिणाम में सापेक्ष परिवर्तन परिवर्तन की तुलना में धीमा है

पाए गए मापदंडों और संपूर्ण मॉडल की गुणवत्ता की जाँच करना:

-प्रतिगमन गुणांक (बी) और सहसंबंध गुणांक के महत्व का आकलन

-पूरे प्रतिगमन समीकरण के महत्व का आकलन करना। निर्धारण गुणांक

प्रतिगमन समीकरण हमेशा कनेक्शन की जकड़न के संकेतक के साथ पूरक होता है। पर

ऐसे संकेतक के रूप में रैखिक प्रतिगमन का उपयोग करना है

रैखिक सहसंबंध गुणांक r xy . वह अलग अलग है

रैखिक सहसंबंध गुणांक सूत्र के संशोधन।

रैखिक गुणांकसहसंबंध सीमा में है: -1≤ .rxy

≤ 1. इसके अलावा, करीब आर 0 से कमजोर सहसंबंध और इसके विपरीत

r, 1 या -1 के जितना करीब होगा, सहसंबंध उतना ही मजबूत होगा, यानी। x और y की निर्भरता के करीब है

रैखिक। यदि एक आरठीक =1 या -1 सभी बिंदु एक ही सीधी रेखा पर स्थित हैं।

यदि गुणांक प्रतिगमन बी> 0 फिर 0 । आरएक्सवाई 1 और

बी के लिए इसके विपरीत<0 -1≤.आरएक्सवाई 0. कोफ.

सहसंबंध की उपस्थिति में m / y मानों की रैखिक निर्भरता की डिग्री को दर्शाता है

किसी अन्य प्रजाति की स्पष्ट निर्भरता।

एक रेखीय फलन के चयन की गुणवत्ता का आकलन करने के लिए, रैखिक का वर्ग

सहसंबंध गुणांक

बुलाया निर्धारण गुणांक।निर्धारण गुणांक

परिणामी विशेषता y के प्रसरण के अनुपात की विशेषता है, द्वारा समझाया गया

प्रतिगमन। अनुरूप मूल्य

फैलाव के हिस्से की विशेषता है वाई,अन्य बेहिसाब के प्रभाव के कारण

कारक मॉडल में

ओएलएस अनुमति देता हैऐसे पैरामीटर अनुमान प्राप्त करें एकतथा बी,कौन सा

परिणामी विशेषता के वास्तविक मूल्यों के वर्ग विचलन का योग

(वाई)गणना से (सैद्धांतिक)

न्यूनतम:

दूसरे शब्दों में, से

लाइनों के पूरे सेट में, चार्ट पर रिग्रेशन लाइन को चुना जाता है ताकि योग

बिंदुओं और इस रेखा के बीच की ऊर्ध्वाधर दूरी के वर्ग होंगे

न्यूनतम।

सामान्य समीकरणों की प्रणाली हल हो गई है

रैखिक प्रतिगमन मापदंडों के महत्व का अनुमान।

समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन F-मानदंड का उपयोग करके दिया जाता है

मछुआरा। इस मामले में, शून्य परिकल्पना सामने रखी गई है कि प्रतिगमन गुणांक बराबर है

शून्य, यानी ख = 0, और इसलिए कारक एक्सप्रदान नहीं करता

परिणाम पर प्रभाव वाई

एफ-मानदंड की प्रत्यक्ष गणना विचरण के विश्लेषण से पहले होती है।

इसका केंद्र वर्ग विचलन के कुल योग का विस्तार है

चर परऔसत मूल्य से परदो भागों में -

"समझाया" और "अस्पष्टीकृत":

वर्ग विचलन का कुल योग

वर्गों का योग

प्रतिगमन द्वारा समझाया गया विचलन

वर्ग विचलन का अवशिष्ट योग।

वर्ग विचलन का कोई भी योग स्वतंत्रता की डिग्री की संख्या से संबंधित है , टी।

ई. सुविधा की स्वतंत्र भिन्नता की स्वतंत्रता की संख्या के साथ। स्वतंत्रता की डिग्री की संख्या जनसंख्या n की इकाइयों की संख्या और इससे निर्धारित स्थिरांक की संख्या से संबंधित है। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या से पता चलता है कि कितने स्वतंत्र विचलन हैं पीसंभव के लिए आवश्यक

वर्गों के दिए गए योग का गठन।

स्वतंत्रता की प्रति डिग्री फैलाव डी।

एफ-अनुपात (एफ-मानदंड):

यदि शून्य परिकल्पना सत्य है, तो कारक और अवशिष्ट प्रसरण नहीं हैं

एक दूसरे से भिन्न। एच 0 के लिए, एक खंडन आवश्यक है ताकि

कारक विचरण अवशिष्ट एक से कई गुना अधिक हो गया। अंग्रेज़ी

सांख्यिकीविद् स्नेडेकोर ने एफ-अनुपात के महत्वपूर्ण मूल्यों की सारणी विकसित की

शून्य परिकल्पना के महत्व के विभिन्न स्तरों पर और डिग्री की एक अलग संख्या

स्वतंत्रता। F-परीक्षण का तालिका मान अनुपात का अधिकतम मान है

प्रसरण, जो किसी दिए गए के लिए उनके यादृच्छिक विचलन के मामले में हो सकता है

शून्य परिकल्पना की उपस्थिति का संभाव्यता स्तर। एफ-अनुपात का परिकलित मूल्य

यदि o तालिका मान से अधिक है तो विश्वसनीय के रूप में पहचाना जाता है। इस मामले में, शून्य

संकेतों के संबंध की अनुपस्थिति के बारे में परिकल्पना को खारिज कर दिया जाता है और निष्कर्ष निकाला जाता है

इस संबंध का महत्व: एफ तथ्य > एफ तालिका एच 0

खारिज किया जाता है।

यदि मान सारणीबद्ध F तथ्य से कम है ‹, एफ टेबल

तब शून्य परिकल्पना की प्रायिकता किसी दिए गए स्तर से ऊपर होती है और यह नहीं हो सकती है

कनेक्शन को गुमराह करने के गंभीर जोखिम के बिना खारिज कर दिया। पर

इस मामले में, प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वहीन माना जाता है। परंतु

खारिज नहीं किया जाता है।


इसी तरह की जानकारी।


दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...