एकाधिक प्रतिगमन मॉडल द्वारा पूर्वानुमान।

भविष्य कहनेवाला गणना में, प्रतिगमन समीकरण अनुमानित निर्धारित करता है बिंदु पूर्वानुमान के रूप में मूल्य पर , यानी प्रतिगमन समीकरण में प्रतिस्थापित करके संगत मान एक्स।हालांकि, बिंदु पूर्वानुमान स्पष्ट रूप से यथार्थवादी नहीं है। इसलिए, यह मानक त्रुटि की गणना द्वारा पूरक है, यानी, और, तदनुसार, पूर्वानुमान मूल्य का अंतराल अनुमान (वाई*)

यह समझने के लिए कि माध्य वर्ग त्रुटि के मान निर्धारित करने का सूत्र कैसे बनाया जाता है, आइए रेखीय युग्म प्रतिगमन समीकरण की ओर मुड़ें:

एक ज्ञात तरीके से, हम युग्मित रैखिक प्रतिगमन मॉडल का विचरण पाते हैं:

(3.29)

भावों (3.24) और (3.25) को ध्यान में रखते हुए, हम पहले लिखते हैं:

सरल परिवर्तनों के बाद, हम अंत में प्राप्त करते हैं:

(3.30)

यहाँ से हम युग्मित रेखीय प्रतिगमन मॉडल के माध्य वर्ग त्रुटि की ओर बढ़ते हैं:

माना गया सूत्र अनुमानित माध्य का मूल माध्य वर्ग त्रुटि है आप किसी दिए गए मूल्य पर प्रतिगमन रेखा की स्थिति त्रुटि की विशेषता है। मानक त्रुटि मान , जैसा कि सूत्र से देखा जा सकता है, न्यूनतम पर पहुंचता है , और जैसे-जैसे यह दूर जाता है बढ़ता जाता है किसी भी दिशा में। दूसरे शब्दों में, के बीच का अंतर जितना बड़ा होगा तथा एक्स, बड़ी त्रुटि जिसके साथ माध्य मान की भविष्यवाणी की जाती है आपके लियेमूल्य ते करना । आप सबसे अच्छे पूर्वानुमान परिणामों की उम्मीद कर सकते हैं यदि साइन-फैक्टर एक्सअवलोकन क्षेत्र के केंद्र में स्थित एक्सऔर हटाते समय अच्छे पूर्वानुमान परिणामों की अपेक्षा नहीं की जा सकती है से । यदि मान देखे गए मूल्यों के बाहर है एक्स,एक रैखिक प्रतिगमन के निर्माण में उपयोग किया जाता है, तो पूर्वानुमान के परिणाम कितने पर निर्भर करते हैं? कारक के देखे गए मूल्यों के क्षेत्र से विचलन एक्स.

हमारे उदाहरण के लिए यह होगा:

अनुमानित मूल्य के लिए, किसी दिए गए के लिए 95% विश्वास अंतराल अभिव्यक्ति द्वारा परिभाषित किया गया है

95% संभावना के लिए फिर 26.04।

पर , पूर्वानुमान मूल्य आपहोगा:

जो एक बिंदु पूर्वानुमान है।

अंतराल में प्रतिगमन रेखा का पूर्वानुमान होगा:

हालाँकि, वास्तविक मान परमाध्य के आसपास भिन्न होता है। व्यक्तिगत मूल्य परसे विचलित हो सकता है यादृच्छिक त्रुटि की मात्रा से, जिसके विचरण का अनुमान लगाया जाता है अवशिष्ट फैलावस्वतंत्रता की एक डिग्री . इसलिए, अनुमानित व्यक्तिगत मूल्य आप न केवल मानक त्रुटि, बल्कि यादृच्छिक त्रुटि भी शामिल होनी चाहिए एस.

अनुमानित व्यक्तिगत मूल्य की औसत त्रुटि आप होगा:

दिए गए उदाहरण के अनुसार, हम प्राप्त करते हैं:

व्यक्तिगत मूल्यों की भविष्यवाणी के लिए विश्वास अंतराल आप 0.95 की प्रायिकता के साथ होगा:, या 141.57, इसका मतलब है कि।

अंतराल काफी व्यापक है, मुख्यतः टिप्पणियों की छोटी मात्रा के कारण।

प्रतिगमन समीकरण के आधार पर पूर्वानुमान लगाते समय, यह याद रखना चाहिए कि पूर्वानुमान का परिमाण न केवल व्यक्तिगत मूल्य की मानक त्रुटि पर निर्भर करता है वाई,लेकिन कारक के मूल्य के पूर्वानुमान की सटीकता पर भी एक्स।इसका मूल्य एक विशिष्ट स्थिति के आधार पर अन्य मॉडलों के विश्लेषण के साथ-साथ इस कारक की गतिशीलता के विश्लेषण के आधार पर निर्धारित किया जा सकता है।

सुविधा के व्यक्तिगत मूल्य की औसत त्रुटि के लिए माना गया सूत्र आप प्रतिगमन मॉडल और घटनाओं के विकास की आगे की परिकल्पना के आधार पर अनुमानित मूल्य में अंतर के महत्व का आकलन करने के लिए भी इस्तेमाल किया जा सकता है।

मान लीजिए कि हमारे उदाहरण में लागत समारोह के साथ, यह माना जाता है कि आने वाले वर्ष में, 8 हजार इकाइयों के उत्पादन के साथ अर्थव्यवस्था के स्थिरीकरण के कारण। उत्पादन लागत 250 मिलियन रूबल से अधिक नहीं होगी। क्या इसका मतलब वास्तव में पाए गए पैटर्न में बदलाव है, या क्या यह लागत मूल्य प्रतिगमन मॉडल के अनुरूप है?

इस प्रश्न का उत्तर देने के लिए, हम इसके लिए एक बिंदु पूर्वानुमान पाते हैं एक्स= 8, यानी।

आर्थिक स्थिति के आधार पर अनुमानित लागत मूल्य 250.0 है। इन मूल्यों के बीच अंतर के महत्व का आकलन करने के लिए, हम अनुमानित व्यक्तिगत मूल्य की औसत त्रुटि निर्धारित करते हैं:

आइए इसकी तुलना उत्पादन लागत में अपेक्षित कमी के मूल्य से करें, अर्थात:

चूंकि केवल लागत में कटौती के महत्व का आकलन किया जाता है, इसलिए एक-पूंछ वाले छात्र के टी-परीक्षण का उपयोग किया जाता है। पांच डिग्री स्वतंत्रता के साथ 5% की त्रुटि के साथ। इसलिए, अनुमानित लागत में कमी 95% विश्वास स्तर पर मॉडल द्वारा की गई भविष्यवाणी से काफी अलग है। हालांकि, अगर 1% की त्रुटि के साथ संभावना 99% तक बढ़ जाती है, तो मानदंड का वास्तविक मूल्य 3.365 के सारणीबद्ध मूल्य से कम है, और लागत में माना गया अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं है।

प्रतिगमन समीकरण के अनुसार पूर्वानुमान संबंधित मान के प्रतिगमन समीकरण में एक प्रतिस्थापन है एक्स . ऐसा पूर्वानुमान बुलाया बिंदु।यह सटीक नहीं है, इसलिए यह मानक त्रुटि की गणना द्वारा पूरक है ; यह पता चला है अंतराल अनुमानपूर्वानुमान मूल्य:

आइए प्रतिगमन समीकरण को रूपांतरित करें:

त्रुटि त्रुटि पर निर्भर करती है और प्रतिगमन गुणांक त्रुटियाँ बी , अर्थात। .

प्रतिचयन सिद्धांत से ज्ञात होता है कि .

हम एक अनुमान s 2 के रूप में स्वतंत्रता S 2 के प्रति एक डिग्री के अवशिष्ट विचरण का उपयोग करते हैं, हमें मिलता है:।

सूत्र से प्रतिगमन गुणांक त्रुटि (15):

इस प्रकार, अत एक्स = एक्स के हम पाते हैं:

(31)

जैसा कि सूत्र से देखा जा सकता है, मान न्यूनतम पर पहुंचता है और किसी भी दिशा से दूरी के साथ बढ़ता है।

हमारे उदाहरण के लिए, यह मान होगा:

पर , पर एक्स के = 4

अनुमानित मूल्य के लिए किसी दिए गए के लिए 95% विश्वास अंतराल एक्स केअभिव्यक्ति द्वारा परिभाषित:

वे। पर एक्स के=4 ±2.57-3.34 या ±8.58। पर एक्स के=4 अनुमानित मूल्य होगा

पी पर\u003d -5.79 + 36.84 4 \u003d 141.57 - यह एक बिंदु पूर्वानुमान है।

प्रतिगमन रेखा की भविष्यवाणी अंतराल में निहित है: 132.99 150,15.

हमने इसके लिए विश्वास अंतराल पर विचार किया है औसत मूल्य परदिया गया एक्स।हालाँकि, वास्तविक मान पर औसत के आसपास भिन्न , वे यादृच्छिक त्रुटि की मात्रा से विचलित हो सकते हैं , जिसके विचरण का अनुमान प्रति एक डिग्री स्वतंत्रता के अवशिष्ट विचरण के रूप में लगाया जाता है S2.इसलिए, एकल मान की भविष्यवाणी त्रुटि पर न केवल मानक त्रुटि बल्कि यादृच्छिक त्रुटि भी शामिल होनी चाहिए एस . इस प्रकार, एक व्यक्तिगत मूल्य की औसत भविष्यवाणी त्रुटि आपहोगा:

(33)

उदाहरण के लिए:

विश्वास अंतरालव्यक्तिगत मूल्यों की भविष्यवाणी परपर एक्स के\u003d 4 0.95 की निष्ठा के साथ होगा:। 141.57 ± 2.57 8.01, या 120.98 y r 162,16.

लागत फलन के साथ उदाहरण मान लें कि आने वाले वर्ष में अर्थव्यवस्था के स्थिर होने के कारण उत्पादन की लागत 8 हजार इकाई है। उत्पाद 250 मिलियन रूबल से अधिक नहीं होंगे। क्या यह पाया गया पैटर्न बदलता है या क्या लागत प्रतिगमन मॉडल से मेल खाती है?

बिंदु पूर्वानुमान: = -5.79 + 36.84 8 = 288.93। अनुमानित मूल्य 250 है। औसत त्रुटिभविष्य कहनेवाला व्यक्तिगत मूल्य:

इसकी तुलना उत्पादन लागत में अपेक्षित कमी से करें, अर्थात्। 250-288.93=-38.93:

चूंकि केवल लागत में कटौती के महत्व का मूल्यांकन किया जाता है, इसलिए एकतरफा दृष्टिकोण का उपयोग किया जाता है। टी~छात्र की कसौटी। n-2=5 . के साथ 5% की त्रुटि के साथ टी टेबल= 2.015, इसलिए अनुमानित लागत में कमी 95% विश्वास स्तर पर अनुमानित मूल्य से काफी अलग है। हालांकि, अगर हम 1% की त्रुटि के साथ संभावना को 99% तक बढ़ाते हैं, तो वास्तविक मूल्य टी-मानदंड सारणी 3.365 से नीचे है, और लागत में अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं है, अर्थात। लागत प्रस्तावित प्रतिगमन मॉडल के अनुरूप हैं।

अरेखीय प्रतिगमन

अभी तक हमने केवल पर ही विचार किया है रैखिकप्रतिगमन मॉडल पर से एक्स (3). साथ ही, अर्थव्यवस्था में कई महत्वपूर्ण कड़ियाँ हैं गैर-रैखिक।इस तरह के उदाहरण प्रतिगमन मॉडलहैं उत्पादन कार्य(विनिर्मित उत्पादों की मात्रा और उत्पादन के मुख्य कारकों - श्रम, पूंजी, आदि) और मांग फ़ंक्शन (एक तरफ किसी भी प्रकार की वस्तुओं या सेवाओं की मांग के बीच संबंध, और आय और कीमतों के बीच संबंध) इसके लिए और अन्य सामान - दूसरे के साथ)।

नॉनलाइनियर का विश्लेषण करते समय प्रतिगमन निर्भरताशास्त्रीय कम से कम वर्गों के आवेदन में सबसे महत्वपूर्ण मुद्दा उनके रैखिककरण की विधि है। एक गैर-रेखीय निर्भरता के रैखिककरण के मामले में, हम एक रैखिक प्राप्त करते हैं प्रतिगमन समीकरणप्रकार (3), जिसके मापदंडों का अनुमान सामान्य न्यूनतम वर्ग विधि द्वारा लगाया जाता है, जिसके बाद प्रारंभिक गैर-रैखिक संबंध लिखा जा सकता है।

इस अर्थ में कुछ हद तक मनमानी डिग्री का बहुपद मॉडल है:

जिसमें बिना किसी पूर्व रैखिकरण के पारंपरिक न्यूनतम वर्गों को लागू किया जा सकता है।

दूसरी डिग्री के परवलय पर लागू होने वाली इस प्रक्रिया पर विचार करें:

(35)

इस तरह की निर्भरता उपयुक्त है, यदि कारक मूल्यों की एक निश्चित सीमा के लिए, बढ़ती निर्भरता घटती हुई या इसके विपरीत में बदल जाती है। इस मामले में, उस कारक का मूल्य निर्धारित करना संभव है जिस पर प्रभावी विशेषता का अधिकतम या न्यूनतम मूल्य प्राप्त किया जाता है। यदि प्रारंभिक डेटा कनेक्शन की दिशा में बदलाव का पता नहीं लगाता है, तो परवलय के मापदंडों की व्याख्या करना मुश्किल हो जाता है, और अन्य गैर-रेखीय मॉडल के साथ कनेक्शन के रूप को बदलना बेहतर होता है।

दूसरी डिग्री के परवलय के मापदंडों का आकलन करने के लिए कम से कम वर्गों का उपयोग प्रत्येक अनुमानित मापदंडों के लिए प्रतिगमन अवशेषों के वर्गों के योग को कम करने और परिणामी अभिव्यक्तियों को शून्य के बराबर करने के लिए कम किया जाता है। यह सिस्टम पता चला है सामान्य समीकरण, जिसकी संख्या अनुमानित मापदंडों की संख्या के बराबर है, अर्थात। तीन:

(36)

इस प्रणाली को किसी भी तरह से हल किया जा सकता है, विशेष रूप से, निर्धारकों की विधि द्वारा।

फ़ंक्शन का चरम मान इसके बराबर कारक के मूल्य पर देखा जाता है:

यदि एक बी> 0, एस<0, एक अधिकतम है, अर्थात्। निर्भरता पहले बढ़ती है और फिर गिरती है। श्रम अर्थशास्त्र में इस तरह की निर्भरता मैनुअल मजदूरों की मजदूरी का अध्ययन करते समय देखी जाती है, जब उम्र एक कारक के रूप में कार्य करती है। पर बी<0, с>0 परवलय में न्यूनतम होता है, जो आमतौर पर उत्पादन की मात्रा के आधार पर इकाई उत्पादन लागत में प्रकट होता है।

गैर-रेखीय निर्भरता में, जो शास्त्रीय बहुपद नहीं हैं, प्रारंभिक रैखिककरण आवश्यक रूप से किया जाता है, जिसमें या तो चर या मॉडल मापदंडों का परिवर्तन होता है, या इन परिवर्तनों का संयोजन होता है। आइए ऐसी निर्भरता के कुछ वर्गों पर विचार करें।

हाइपरबोलिक प्रकार की निर्भरता का रूप है:

(37)

इस तरह की निर्भरता का एक उदाहरण फिलिप्स वक्र है, जो मजदूरी वृद्धि के प्रतिशत और बेरोजगारी दर के बीच व्युत्क्रम संबंध बताता है। इस मामले में, पैरामीटर मान बी शून्य से अधिक होगा। निर्भरता का एक और उदाहरण (37) एंगेल वक्र है, जो निम्नलिखित पैटर्न तैयार करता है: आय में वृद्धि के साथ, भोजन पर खर्च की गई आय का हिस्सा कम हो जाता है, और गैर-खाद्य वस्तुओं पर खर्च की गई आय का हिस्सा बढ़ जाएगा। इस मामले में बी<0 , और (37) में परिणामी विशेषता गैर-खाद्य उत्पादों पर व्यय के हिस्से को दर्शाती है।

कारक के प्रतिस्थापन के लिए समीकरण (37) का रैखिककरण कम हो गया है z=1/x , और प्रतिगमन समीकरण का रूप (3) है, जिसमें कारक के बजाय एक्स कारक का प्रयोग करें जेड:

सेमीलॉगरिदमिक वक्र समान रैखिक समीकरण में कम हो जाता है:

(39)

जिसका उपयोग एंगेल वक्रों का वर्णन करने के लिए किया जा सकता है। यहां 1पी (एक्स) द्वारा प्रतिस्थापित किया जाता है जेड , और समीकरण (38) प्राप्त होता है।

आर्थिक संकेतकों का एक काफी विस्तृत वर्ग समय के साथ सापेक्ष विकास की लगभग स्थिर दर की विशेषता है। यह घातीय (घातीय) प्रकार की निर्भरता से मेल खाता है, जिसे इस प्रकार लिखा जाता है:

या रूप में

निम्नलिखित निर्भरता संभव है:

प्रकार (40) - (42) के प्रतिगमन में, एक ही रैखिककरण विधि का उपयोग किया जाता है - लघुगणक। समीकरण (40) को फॉर्म में घटाया गया है:

(43)

परिवर्तनीय प्रतिस्थापन यू= मैं आपइसे एक रैखिक रूप में कम कर देता है:

(44)

कहाँ पे . यदि एक गॉस-मार्कोव शर्तों को संतुष्ट करता है, समीकरण (40) के पैरामीटर समीकरण (44) से कम से कम वर्गों द्वारा अनुमानित हैं। समीकरण (41) को इस रूप में घटाया गया है:

जो (43) से केवल मुक्त पद के रूप में भिन्न है, और रैखिक समीकरण इस तरह दिखता है:

वाई=ए+बीएक्स+ई(46)

कहाँ पे ए =एलएन एक. विकल्प लेकिनतथा बीसामान्य न्यूनतम वर्गों द्वारा प्राप्त किया जाता है, फिर पैरामीटर एक निर्भरता में (41) एक लघुगणक के रूप में प्राप्त होता है लेकिन।लघुगणक (42) लेते समय, हम एक रैखिक निर्भरता प्राप्त करते हैं:

वाई=ए+बीएक्स+ई(47)

कहाँ पे बी= एलएन बी, और शेष अंकन ऊपर जैसा ही है। यहां, एलएसएम को रूपांतरित डेटा और पैरामीटर पर भी लागू किया जाता है बी के लिए (42) गुणांक के प्रतिलक्षण के रूप में प्राप्त किया जाता है पर।

चौड़ा सामान्यसामाजिक-आर्थिक अनुसंधान, शक्ति निर्भरता के अभ्यास में। उनका उपयोग उत्पादन कार्यों के निर्माण और विश्लेषण के लिए किया जाता है। दृश्य कार्यों में:

विशेष रूप से मूल्यवान तथ्य यह है कि पैरामीटर बी कारक द्वारा परिणामी विशेषता की लोच के गुणांक के बराबर है एक्स . एक लघुगणक लेकर रूपांतरण (48), हम एक रैखिक प्रतिगमन प्राप्त करते हैं:

वाई=ए+बीएक्स+ई (49)

कहाँ पे वाई =एलएन आप,ए =एलएन ए, एक्स =एलएन एक्स, ई =एलएन ε .

एक अन्य प्रकार की गैर-रैखिकता, जो एक रैखिक रूप में कम हो जाती है, व्युत्क्रम संबंध है:

(50)

प्रतिस्थापन करना तथा=1/वर्ष, हम पाते हैं:

(51)

अंत में, रसद प्रकार की निर्भरता पर ध्यान दिया जाना चाहिए:

(52)

फ़ंक्शन का ग्राफ (52) तथाकथित "संतृप्ति वक्र" है, जिसमें दो क्षैतिज स्पर्शोन्मुख हैं वाई = 0तथा y=1/aऔर विभक्ति बिंदु एक्स =एलएन (बी/ए), वाई=1/(2ए), साथ ही y-अक्ष के साथ प्रतिच्छेदन बिंदु y=1/(ए+बी):

चरों के परिवर्तन से समीकरण (52) को एक रैखिक रूप में घटाया जाता है यू=1/वाई, जेड=ई - एक्स.

कोई भी गैर-रेखीय प्रतिगमन समीकरण, साथ ही एक रैखिक संबंध, एक सहसंबंध संकेतक द्वारा पूरक होता है, जिसे इस मामले में सहसंबंध सूचकांक कहा जाता है:

(53)

यहाँ कुल भिन्नता है प्रभावीसंकेत पर , गैर-रैखिक प्रतिगमन समीकरण द्वारा निर्धारित अवशिष्ट विचरण। यह ध्यान दिया जाना चाहिए कि संबंधित राशियों में अंतर और परिवर्तित में नहीं, बल्कि प्रभावी विशेषता के मूल मूल्यों में लिया जाता है। दूसरे शब्दों में, इन राशियों की गणना करते समय, किसी को रूपांतरित (रैखिककृत) निर्भरता का उपयोग नहीं करना चाहिए, बल्कि मूल गैर-रेखीय प्रतिगमन समीकरणों का उपयोग करना चाहिए। दूसरे तरीके से, (53) को इस प्रकार लिखा जा सकता है:

(54)

मूल्य आर 0 . के भीतर है रू 1, और यह एक के जितना करीब होगा, विचाराधीन सुविधाओं का संबंध उतना ही करीब होगा, पाया गया प्रतिगमन समीकरण उतना ही अधिक विश्वसनीय होगा। इस मामले में, सहसंबंध सूचकांक उस मामले में रैखिक सहसंबंध गुणांक के साथ मेल खाता है जब प्रतिगमन समीकरण को रैखिक बनाने के लिए चर का परिवर्तन परिणामी विशेषता के मूल्यों के साथ नहीं किया जाता है। यह अर्ध-लघुगणक और बहुपद प्रतिगमन के साथ-साथ समबाहु अतिपरवलय (37) के मामले में है। रेखीय समीकरणों के लिए रैखिक सहसंबंध गुणांक निर्धारित करने के बाद, उदाहरण के लिए, LINEST फ़ंक्शन का उपयोग करके Excel पैकेज पर, आप इसे गैर-रैखिक संबंध के लिए भी उपयोग कर सकते हैं।

उस स्थिति में स्थिति अलग होती है जब परिवर्तन भी मूल्य के साथ किया जाता है पर , उदाहरण के लिए, किसी मान का व्युत्क्रम लेना या लघुगणक लेना। फिर मान आर,समान LINEST फ़ंक्शन द्वारा परिकलित रेखीयकृत प्रतिगमन समीकरण को संदर्भित करेगा, न कि मूल अरेखीय समीकरण के लिए, और (54) में योग के तहत अंतर के मान रूपांतरित मानों को संदर्भित करेंगे, न कि मूल वाले को , जो एक ही बात नहीं है। उसी समय, जैसा कि ऊपर बताया गया है, गणना करने के लिए आरमूल अरैखिक समीकरण से परिकलित व्यंजक (54) का प्रयोग किया जाना चाहिए।

चूंकि सहसंबंध सूचकांक की गणना फैक्टोरियल और कुल मानक विचलन के अनुपात का उपयोग करके की जाती है, तो R2निर्धारण के गुणांक के समान अर्थ है। विशेष अध्ययनों में, मूल्य R2गैर-रैखिक कनेक्शन के लिए निर्धारण का सूचकांक कहा जाता है।

सहसंबंध सूचकांक के महत्व का आकलन उसी तरह किया जाता है जैसे सहसंबंध गुणांक की विश्वसनीयता का आकलन किया जाता है।

निर्धारण सूचकांक का उपयोग सामान्य रूप से गैर-रेखीय प्रतिगमन समीकरण के महत्व को जांचने के लिए किया जाता है एफ-फिशर की कसौटी:

(55)

कहाँ पे एन -अवलोकन की संख्या, एम चर के लिए मापदंडों की संख्या एक्स . बहुपद प्रतिगमन को छोड़कर, हमारे द्वारा विचार किए गए सभी मामलों में, एम= 1, बहुपदों के लिए (34) एम = के, अर्थात। बहुपद की डिग्री। मूल्य टी तथ्यात्मक मानक विचलन के लिए स्वतंत्रता की डिग्री की संख्या की विशेषता है, और (पी-टी-1) -अवशिष्ट आरएमएस के लिए स्वतंत्रता की डिग्री की संख्या।

निर्धारण सूचकांक R2 निर्धारण के गुणांक के साथ तुलना की जा सकती है r2 एक रैखिक फ़ंक्शन का उपयोग करने की संभावना को सही ठहराने के लिए। प्रतिगमन रेखा की वक्रता जितनी अधिक होगी, के बीच का अंतर उतना ही अधिक होगा R2 तथा r2 . इन संकेतकों की निकटता का मतलब है कि प्रतिगमन समीकरण का रूप जटिल नहीं होना चाहिए और एक रैखिक फ़ंक्शन का उपयोग किया जा सकता है। व्यवहार में, यदि मान (R2-r2) 0.1 से अधिक नहीं है, तो रैखिक निर्भरता को उचित माना जाता है। अन्यथा, निर्धारण के संकेतकों में अंतर के महत्व का आकलन किया जाता है, एक ही डेटा से गणना की जाती है टी-छात्र की कसौटी:

यहाँ हर में अंतर की त्रुटि है (आर 2-आर 2),सूत्र द्वारा निर्धारित:

यदि एक टी>टी टेबल (α; n-m-1),तो सहसंबंध संकेतकों के बीच अंतर महत्वपूर्ण हैं और एक रैखिक के साथ गैर-रेखीय प्रतिगमन का प्रतिस्थापन अनुचित है।

अंत में, हम सबसे सामान्य प्रतिगमन समीकरणों के लिए लोच गुणांक की गणना के लिए सूत्र प्रस्तुत करते हैं।

अर्थमितीय मॉडलिंग के केंद्रीय कार्यों में से एक व्याख्यात्मक चर के कुछ मूल्यों के लिए व्याख्यात्मक चर के कुछ मूल्यों के लिए आश्रित चर के मूल्यों की भविष्यवाणी (पूर्वानुमान) है। यहां, एक दोहरा दृष्टिकोण संभव है: या तो आश्रित चर की सशर्त अपेक्षा की भविष्यवाणी करें ( मतलब भविष्यवाणी), या आश्रित चर के कुछ विशिष्ट मूल्य की भविष्यवाणी करने के लिए ( एक विशेष मूल्य की भविष्यवाणी).

टिप्पणी।कुछ लेखक भविष्यवाणी और भविष्यवाणी जैसी अवधारणाओं के बीच अंतर करते हैं। यदि व्याख्यात्मक चर का मान एक्सबिल्कुल ज्ञात है, तो आश्रित चर का अनुमान यूबुलाया भविष्यवाणी. यदि व्याख्यात्मक चर का मान एक्सयह ठीक-ठीक पता नहीं है, फिर वे कहते हैं कि क्या किया जा रहा है भविष्यवाणीमूल्यों यू. यह स्थिति समय श्रृंखला के लिए विशिष्ट है। इस मामले में, हम भविष्यवाणी और पूर्वानुमान के बीच अंतर नहीं करेंगे।

अंतर करना बिंदुतथा मध्यान्तरपूर्वानुमान पहले मामले में, स्कोर एक निश्चित संख्या है; दूसरे मामले में, यह अंतराल है जिसमें दिए गए स्तर के महत्व के साथ आश्रित चर का सही मान होता है।

एक) औसत मूल्य भविष्यवाणी. युग्मित प्रतिगमन समीकरण का निर्माण करें, जिसके आधार पर सशर्त गणितीय अपेक्षा की भविष्यवाणी करना आवश्यक है . इस मामले में, मूल्य एक बिंदु अनुमान है . फिर यह प्रश्न स्वाभाविक रूप से उठता है कि अनुभवजन्य समीकरण द्वारा परिकलित मॉडल मान, संबंधित सशर्त गणितीय अपेक्षा से कितना विचलित हो सकता है। इस प्रश्न का उत्तर किसी विशिष्ट मान के लिए दिए गए महत्व के स्तर के साथ निर्मित अंतराल अनुमानों के आधार पर दिया गया है एक्सपीव्याख्यात्मक अस्थिरता।

हम इस रूप में अनुभवजन्य प्रतिगमन समीकरण लिखते हैं

यहां दो स्वतंत्र घटक प्रतिष्ठित हैं: औसत और वृद्धि। इससे यह निष्कर्ष निकलता है कि विचरण बराबर होगा

नमूनाकरण सिद्धांत से, हम जानते हैं कि

एक अनुमान के रूप में उपयोग करना s 2 अवशिष्ट विचरण एस 2, हमें मिलता है



प्रतिगमन गुणांक का विचरण, जैसा कि पहले ही दिखाया जा चुका है

पाए गए प्रसरणों को (5.41) में प्रतिस्थापित करने पर, हम प्राप्त करते हैं

. (5.56)

इस प्रकार, गणना सूत्र प्रतिगमन-पूर्वानुमानित माध्य Y की मानक त्रुटिरूप है

. (5.57)

मानक त्रुटि का मान, जैसा कि सूत्र से देखा जा सकता है, न्यूनतम पर पहुंच जाता है, और जैसे-जैसे आप किसी भी दिशा से दूर जाते हैं, बढ़ता जाता है। दूसरे शब्दों में, और के बीच का अंतर जितना अधिक होगा, उतनी ही अधिक त्रुटि जिसके साथ माध्य मान की भविष्यवाणी की जाती है आपनिर्धारित मूल्य के लिए एक्सपी. आप सर्वोत्तम पूर्वानुमान परिणामों की अपेक्षा कर सकते हैं यदि मान एक्सपीअवलोकन क्षेत्र के केंद्र में स्थित एक्सऔर जब कोई इससे दूर जाता है तो कोई अच्छे भविष्यवाणी के परिणाम की उम्मीद नहीं कर सकता है।

यादृच्छिक मूल्य

(5.58)

स्वतंत्रता की डिग्री की संख्या के साथ एक छात्र वितरण है n= एन-2 (अंदर सामान्य शास्त्रीय मॉडल) इसलिए, आवश्यक स्तर के महत्व के अनुसार छात्र के वितरण के महत्वपूर्ण बिंदुओं की तालिका के अनुसार और स्वतंत्रता की डिग्री की संख्या n= एन-2 स्थिति को संतुष्ट करने वाले महत्वपूर्ण बिंदु को निर्धारित करना संभव है

.

(5.46) को ध्यान में रखते हुए, हमारे पास है:

.

इसलिए, कुछ बीजीय परिवर्तनों के बाद, हम प्राप्त करते हैं कि विश्वास अंतराल का रूप है:

, (5.59)

कहाँ पे सीमांत त्रुटिडी पीरूप है

. (5.60)

यह सूत्रों (5.57) और (5.60) से देखा जा सकता है कि विश्वास अंतराल का मान (लंबाई) व्याख्यात्मक चर के मूल्य पर निर्भर करता है एक्सपी: जब यह न्यूनतम होता है, और जैसे-जैसे यह दूर होता जाता है एक्सपीविश्वास अंतराल के मूल्य से बढ़ता है (चित्र। 5.4)। इस प्रकार, आश्रित चर के मूल्यों का पूर्वानुमान यूप्रतिगमन समीकरण के अनुसार उचित है यदि मूल्य एक्सपीव्याख्यात्मक अस्थिरता एक्सनमूने में अपने मूल्यों की सीमा से आगे नहीं जाता है (और अधिक सटीक, करीब एक्सपीप्रति )। दूसरे शब्दों में, प्रतिगमन वक्र का एक्सट्रपलेशन, यानी। व्याख्यात्मक चर के मूल्यों की सर्वेक्षण सीमा के बाहर इसका उपयोग(भले ही यह समस्या के हल होने के अर्थ के आधार पर प्रश्न में चर के लिए उचित हो) महत्वपूर्ण त्रुटियां हो सकती हैं।.

बी) आश्रित चर के व्यक्तिगत मूल्यों की भविष्यवाणी करना. व्यवहार में, विचरण को जानना कभी-कभी अधिक महत्वपूर्ण होता है यूसशर्त गणितीय अपेक्षाओं के लिए इसके साधन या विश्वास अंतराल की तुलना में। ऐसा इसलिए है क्योंकि वास्तविक मान यूमाध्य के आसपास भिन्न होता है। व्यक्तिगत मूल्य यूयादृच्छिक त्रुटि ई की मात्रा से विचलित हो सकता है, जिसके विचरण का अनुमान प्रति एक डिग्री स्वतंत्रता के अवशिष्ट विचरण के रूप में लगाया जाता है एस 2. इसलिए, अनुमानित व्यक्तिगत मूल्य की त्रुटि यून केवल मानक त्रुटि, बल्कि यादृच्छिक त्रुटि भी शामिल होनी चाहिए एस. यह आपको किसी विशेष मान के लिए मान्य सीमा निर्धारित करने की अनुमति देता है। यू.

आइए कुछ संभावित मूल्यों में रुचि लें आप 0 चर यूएक निश्चित मूल्य पर एक्सपीव्याख्यात्मक अस्थिरता एक्स. प्रतिगमन समीकरण द्वारा अनुमानित मूल्य यूपर एक्स=एक्सपीहै हाँ. अगर हम मूल्य पर विचार करें आप 0 एक यादृच्छिक मान के रूप में यू 0, और हाँ- एक यादृच्छिक चर के रूप में वाईपी, तो यह ध्यान दिया जा सकता है कि

,

.

यादृच्छिक चर यू 0 और वाईपीस्वतंत्र हैं, और इसलिए यादृच्छिक चर यू=यू 0 –वाईपीके साथ एक सामान्य वितरण है

और . (5.61)

s 2 के रूप में उपयोग करना अवशिष्ट विचरण एस 2 , हमें गणना सूत्र मिलता है प्रतिगमन रेखा द्वारा अनुमानित व्यक्तिगत Y मान की मानक त्रुटि:

. (5.63)

यादृच्छिक मूल्य

(5.64)

स्वतंत्रता की डिग्री की संख्या के साथ एक छात्र वितरण है =एन-2। इसके आधार पर, व्यक्तिगत मूल्यों के लिए एक विश्वास अंतराल बनाना संभव है वाईपी:

, (5.65)

कहाँ पे सीमांत त्रुटिडी तुमरूप है

. (5.66)

ध्यान दें कि यह अंतराल सशर्त अपेक्षा के लिए विश्वास अंतराल से अधिक व्यापक है (चित्र 5.4 देखें)।

उदाहरण 5.5.उदाहरण 5.1-5.3 के डेटा का उपयोग करते हुए, सशर्त गणितीय अपेक्षा और व्यक्तिगत मान के लिए 95% विश्वास अंतराल की गणना करें एक्सपी=160.

समाधान।उदाहरण 5.1 में यह पाया गया था। सूत्र (5.48) का उपयोग करते हुए, हम सशर्त अपेक्षा के लिए सीमा त्रुटि पाते हैं

तब महत्व स्तर a=0.05 पर माध्य मान के लिए विश्वास अंतराल ऐसा दिखाई देगा

दूसरे शब्दों में, 0.95 की संभावना के साथ 160 की आय के साथ औसत खपत अंतराल (149.8; 156.6) में होगी।

आइए हम उस अंतराल की सीमाओं की गणना करें जिसमें उपभोग की संभावित मात्रा का कम से कम 95% आय के स्तर पर केंद्रित होगा एक्सपी=160, यानी व्यक्तिगत मूल्य के लिए आत्मविश्वास अंतराल। एक व्यक्तिगत मूल्य के लिए सीमांत त्रुटि का पता लगाएं

तब अंतराल जिसमें आय पर व्यक्तिगत खपत की मात्रा का कम से कम 95% होगा एक्सपी=160 का रूप है

यह देखना आसान है कि इसमें सशर्त औसत खपत के लिए एक विश्वास अंतराल शामिल है। एक

उदाहरण

उदाहरण 5.65। 199X के लिए डेटा क्षेत्र के क्षेत्रों के लिए प्रदान किया गया है (तालिका 1.1)।

2. रैखिक जोड़ी प्रतिगमन समीकरण बनाएँ आपपर एक्सऔर प्रतिगमन मापदंडों के सांख्यिकीय महत्व का मूल्यांकन करें। एक चित्र बनाओ।

3. निर्धारण के गुणांक का उपयोग करके प्रतिगमन समीकरण की गुणवत्ता का आकलन करें। के साथ प्रतिगमन समीकरण की गुणवत्ता की जाँच करें एफ- फिशर की कसौटी।

4. वेतन पूर्वानुमान चलाएं आपऔसत प्रति व्यक्ति निर्वाह न्यूनतम के अनुमानित मूल्य के साथ एक्स, जो औसत स्तर का 107% है। महत्व स्तर a=0.05 के लिए पूर्वानुमान त्रुटि और उसके विश्वास अंतराल की गणना करके पूर्वानुमान की सटीकता का आकलन करें। समाप्त करने के लिए।

समाधान

1. आमतौर पर रिश्ते की निकटता की डिग्री निर्धारित करने के लिए प्रयोग किया जाता है सहसंबंध गुणांक:

जहाँ , चरों के प्रतिदर्श प्रसरण हैं एक्सतथा आप. सहसंबंध गुणांक की गणना करने के लिए, हम एक गणना तालिका (तालिका 5.4) बनाते हैं:

तालिका 5.4

एक्स आप xy x2 y2 ई 2
148,77 -15,77 248,70
152,45 -4,45 19,82
157,05 -23,05 531,48
149,69 4,31 18,57
158,89 3,11 9,64
174,54 20,46 418,52
138,65 0,35 0,13
157,97 0,03 0,00
144,17 7,83 61,34
157,05 4,95 24,46
146,93 12,07 145,70
182,83 -9,83 96,55
कुल 1574,92
अर्थ 85,58 155,75 13484,00 7492,25 24531,42

तालिका के अनुसार हम पाते हैं:

, , , ,

, , , ,

, .

इस तरह, मजदूरी (y) और औसत प्रति व्यक्ति निर्वाह न्यूनतम (x) के बीच एक सीधा काफी मजबूत संबंध है .

दर के लिए सहसंबंध गुणांक का सांख्यिकीय महत्वदो तरफा गणना करें छात्र का टी-टेस्ट:

जिसके साथ छात्र का वितरण है =एन-2 और महत्व स्तर ए। हमारे मामले में

तथा .

तब से, सहसंबंध गुणांक शून्य से काफी भिन्न होता है।

एक महत्वपूर्ण गुणांक के लिए, कोई निर्माण कर सकता है विश्वास अंतराल, जिसमें दी गई संभावना के साथ एक अज्ञात सामान्य सहसंबंध गुणांक होता है। अंतराल अनुमान बनाने के लिए (छोटे नमूनों के लिए एन<30), используют फिशर जेड-ट्रांसफॉर्म:

वितरण जेडपहले से ही छोटा एनमाध्य और विचरण के साथ एक अनुमानित सामान्य वितरण है। इसलिए, पहले M के लिए एक कॉन्फिडेंस इंटरवल बनाएं[ जेड] और फिर इसके विपरीत करें जेड-रूपांतरण। को लागू करने जेड- पाया गया सहसंबंध गुणांक के लिए परिवर्तन, हम प्राप्त करते हैं

एम के लिए कॉन्फिडेंस इंटरवल ( जेड) ऐसा दिखाई देगा

,

कहाँ पे टीजी लैपलेस फ़ंक्शन का उपयोग करके पाया जाता है F( टीजी) = जी / 2। जी = 0.95 के लिए हमारे पास है टीजी = 1.96। फिर

या । उल्टा जेड- सूत्र के अनुसार परिवर्तन किया जाता है

परिणामस्वरूप, हम पाते हैं

.

0.05 (0.95 की विश्वसनीयता के साथ) के महत्व स्तर पर निर्दिष्ट सीमाओं के भीतर, सामान्य सहसंबंध गुणांक r का निष्कर्ष निकाला जाता है।

2. इस प्रकार, चरों के बीच एक्सतथा आपमहत्वपूर्ण सहसम्बन्ध है। हम मानते हैं कि यह निर्भरता रैखिक है। युग्मित रैखिक प्रतिगमन मॉडल का रूप है

,

कहाँ पे आप- आश्रित चर (परिणामी संकेत), एक्स- स्वतंत्र (व्याख्यात्मक) चर, ई - यादृच्छिक विचलन, बी 0 और बी 1 - प्रतिगमन पैरामीटर। एक सीमित आकार के नमूने के आधार पर, एक अनुभवजन्य प्रतिगमन समीकरण का निर्माण किया जा सकता है:

कहाँ पे बी 0 और बी 1 - अनुभवजन्य प्रतिगमन गुणांक। प्रतिगमन मापदंडों का अनुमान लगाने के लिए, आमतौर पर उपयोग किया जाता है कम से कम वर्ग विधि (बहुराष्ट्रीय कंपनी) ओएलएस के अनुसार, आश्रित चर के वास्तविक मूल्यों के वर्ग विचलन का योग आपसैद्धांतिक से न्यूनतम था:

,

कहाँ पे विचलन y iअनुमानित प्रतिगमन रेखा से। दो चर के एक फ़ंक्शन के न्यूनतम अस्तित्व के लिए एक आवश्यक शर्त अज्ञात मापदंडों के संबंध में इसके आंशिक व्युत्पन्न के शून्य की समानता है बी 0 और बीएक । परिणामस्वरूप, हमें प्राप्त होता है सामान्य समीकरणों की प्रणाली:

इस प्रणाली को हल करते हुए, हम पाते हैं

, .

तालिका के अनुसार, हम पाते हैं

प्राप्त प्रतिगमन समीकरण:

पैरामीटर बी 1 बुलाया प्रतिगमन गुणांक. इसका मान एक इकाई द्वारा कारक में परिवर्तन के साथ परिणाम में औसत परिवर्तन को दर्शाता है। विचाराधीन मामले में, प्रति व्यक्ति न्यूनतम 1 रगड़ की वृद्धि के साथ। औसत दैनिक वेतन में औसतन 0.92 रूबल की वृद्धि होती है .

,

कहाँ पे एफमहत्व स्तर ए और स्वतंत्रता की डिग्री के साथ फिशर वितरण का पालन करता है 1 = 1 और 2 =एन-2। हमारे मामले में

.

चूँकि कसौटी का क्रांतिक मान है

और, तब निर्मित प्रतिगमन समीकरण के सांख्यिकीय महत्व को पहचाना जाता है। ध्यान दें कि रैखिक मॉडल के लिए एफ- तथा टी-मानदंड समानता से संबंधित हैं, जिसका उपयोग गणनाओं की जांच के लिए किया जा सकता है।

4. प्रतिगमन समीकरण के प्राप्त अनुमान हमें इसे पूर्वानुमान के लिए उपयोग करने की अनुमति देते हैं। पूर्वानुमान मूल्य हाँप्रतिगमन समीकरण (1.16) में संबंधित (पूर्वानुमानित) मान को प्रतिस्थापित करके निर्धारित किया जाता है एक्सपी

व्याख्यान 5 99

5.2. प्रतिगमन गुणांक 99 . के अनुमानों की सटीकता का विश्लेषण

5.2.1. यादृच्छिक विचलन के प्रसरण का आकलन 99

5.2.2. प्रतिगमन गुणांक के संबंध में परिकल्पना परीक्षण 100

5.2.3. प्रतिगमन गुणांक का अंतराल अनुमान 103

5.3। प्रतिगमन समीकरण के गुणवत्ता संकेतक 104

5.3.1. निर्धारण गुणांक 104

5.3.2. प्रतिगमन समीकरण की समग्र गुणवत्ता की जाँच करना: F-परीक्षण 106

5.3.3. प्रतिगमन समीकरण की समग्र गुणवत्ता की जाँच करना: t-परीक्षण 108

5.4. प्रतिगमन पूर्वानुमान अंतराल 108

पूर्वानुमान में रैखिक प्रतिगमन का अनुप्रयोग

पूर्वानुमान विज्ञान की एक स्वतंत्र शाखा है जिसका व्यापक रूप से मानव गतिविधि के सभी क्षेत्रों में उपयोग किया जाता है। विचाराधीन कार्यों की प्रकृति, अध्ययन के उद्देश्यों और सूचना की स्थिति को ध्यान में रखते हुए विकसित किए गए पूर्वानुमान के कई प्रकार और तरीके हैं। कई किताबें और जर्नल लेख इन मुद्दों के लिए समर्पित हैं। रैखिक प्रतिगमन के उदाहरण का उपयोग करते हुए, हम आर्थिक संकेतकों के मूल्यों की भविष्यवाणी में अर्थमितीय मॉडल का उपयोग दिखाएंगे।

सामान्य अर्थों में, पूर्वानुमान अतीत और वर्तमान राज्यों पर पूर्वव्यापी डेटा के आधार पर किसी वस्तु या रुचि की घटना की भविष्य की स्थिति की भविष्यवाणी है, बशर्ते अतीत और भविष्य के बीच एक कारण संबंध हो। हम कह सकते हैं कि पूर्वानुमान ज्ञान द्वारा समर्थित एक अनुमान है। चूंकि भविष्य कहनेवाला अनुमान स्वाभाविक रूप से अनुमानित हैं, इसलिए इसकी उपयुक्तता के बारे में बिल्कुल भी संदेह हो सकता है। इसलिए, किसी भी पूर्वानुमान के लिए मुख्य आवश्यकता संबंधित अनुमानों में त्रुटियों को यथासंभव कम से कम करना है। यादृच्छिक और सहज पूर्वानुमानों की तुलना में, वैज्ञानिक रूप से आधारित और व्यवस्थित रूप से विकसित पूर्वानुमान निस्संदेह अधिक सटीक और प्रभावी होते हैं। सांख्यिकीय विश्लेषण के तरीकों के उपयोग पर आधारित पूर्वानुमान ऐसे ही हैं। यह तर्क दिया जा सकता है कि पूर्वानुमान के सभी तरीकों में, वे सबसे अधिक आत्मविश्वास को प्रेरित करते हैं, सबसे पहले, क्योंकि सांख्यिकीय डेटा भविष्य के बारे में निर्णय लेने के लिए एक विश्वसनीय आधार के रूप में काम करते हैं, और दूसरी बात, ऐसे पूर्वानुमान विकसित और पूरी तरह से मौलिक तरीकों का उपयोग करके परीक्षण किए जाते हैं। गणितीय सांख्यिकी।

रेखीय प्रतिगमन मापदंडों का अनुमान सांख्यिकीय आंकड़ों के आधार पर इन मापदंडों के सही मूल्यों की भविष्यवाणी है। प्राप्त भविष्यवाणियां काफी प्रभावी साबित होती हैं, क्योंकि वे सही मापदंडों के निष्पक्ष अनुमान हैं।

हम रेखीय प्रतिगमन मॉडल (8.2.4) को पाए गए मापदंडों (8.2.8) और (8.2.9) के साथ व्याख्यात्मक चर के कुछ सेट के लिए व्याख्यात्मक चर निर्धारित करने के लिए लागू करते हैं। अधिक सटीक रूप से, आइए व्याख्यात्मक चर के कुछ मान के अनुरूप माध्य मान की भविष्यवाणी करने की समस्या को सेट करें, जो किसी भी मान से मेल नहीं खाता है। इस मामले में, यह दोनों नमूना टिप्पणियों के बीच स्थित हो सकता है और अंतराल के बाहर। पूर्वानुमान मूल्य बिंदु या अंतराल हो सकता है। हम एक बिंदु पूर्वानुमान पर विचार करने के लिए खुद को सीमित रखते हैं, अर्थात। वांछित मूल्य फॉर्म में परिभाषित किया गया है

यादृच्छिक चर के देखे गए मान कहां हैं, और गुणांक (वजन) हैं जिन्हें चुना जाना चाहिए ताकि यह सबसे अच्छा रैखिक निष्पक्ष भविष्यवाणी हो, यानी। प्रति

प्रेक्षित मानों के लिए (8.5.1) से

चूँकि, गणितीय अपेक्षा के गुण से ((2.5.4) - (2.5.5))

,

लेकिन चूंकि उम्मीद ऑपरेटर के तहत दाईं ओर केवल स्थिर संख्याएं हैं, तो

संबंध को देखते हुए, अब हम कह सकते हैं कि if और केवल if . के लिए निष्पक्ष रैखिक भविष्यवाणी क्या होगी?

इसलिए, कोई भी सदिश जो शर्तों (8.5.2) को संतुष्ट करता है, अभिव्यक्ति (8.5.1) को मान का एक निष्पक्ष रैखिक पूर्वानुमान बनाता है। इसलिए, हमारे लिए ज्ञात मात्राओं के संदर्भ में वजन के लिए एक विशिष्ट अभिव्यक्ति खोजना आवश्यक है। ऐसा करने के लिए, हम मात्रा के विचरण को कम करने की समस्या को हल करते हैं:

चूँकि समीकरण के दायीं ओर पहले पद में परिक्षेपण संकारक के अंतर्गत अचर संख्याएँ होती हैं, तो

मान्यताओं को ध्यान में रखते हुए b) और c) और फैलाव गुणों (2.5.4) और (2.5.6) का उपयोग करते हुए, हमारे पास है:

यादृच्छिक चर का मानक विचलन कहाँ है।

आइए प्रतिबंधों के साथ विचरण को कम करने की अनुकूलन समस्या की रचना करें (8.5.2):

प्रतिबंधों के तहत

चूंकि गुणक उद्देश्य फलन के न्यूनतम मान पर निर्भर नहीं करता है और न ही प्रभावित करता है, इसलिए हम लैग्रेंज फलन की रचना करते हैं (देखें (2.3.8)) इस प्रकार है:

लैग्रेंज गुणक कहां और हैं। एक बिंदु की इष्टतमता के लिए आवश्यक शर्तों का रूप है (देखें (2.3.9)):

(8.5.3)

पहले समीकरण का योग करने पर, दूसरे समीकरण को ध्यान में रखते हुए, हम प्राप्त करते हैं:

यहाँ से हम लैग्रेंज गुणक पाते हैं

यादृच्छिक चर का माध्य मान कहाँ है। हम फिर से प्राप्त मान को सिस्टम के पहले समीकरण (8.5.3) में प्रतिस्थापित करते हैं और पाते हैं

बहु रेखीय प्रतिगमन मॉडल का उपयोग करते हुए पूर्वानुमान में प्रतिगमन समीकरण में शामिल स्वतंत्र चर के मूल्यों को देखते हुए आश्रित चर के अपेक्षित मूल्यों का अनुमान लगाना शामिल है। बिंदु और अंतराल पूर्वानुमान हैं।

बिंदु पूर्वानुमान बहु रेखीय प्रतिगमन समीकरण में स्वतंत्र चर के भविष्य कहनेवाला (शोधकर्ता द्वारा निर्दिष्ट) मूल्यों को प्रतिस्थापित करके प्राप्त आश्रित चर का परिकलित मूल्य है। यदि मान दिए गए हैं, तो आश्रित चर (बिंदु पूर्वानुमान) का अनुमानित मान बराबर होगा

अंतराल पूर्वानुमान के बीच आश्रित चर के न्यूनतम और अधिकतम मान हैं

जो यह दी गई प्रायिकता के साथ और स्वतंत्र चर के दिए गए मानों के लिए आता है।

रैखिक फ़ंक्शन के लिए अंतराल पूर्वानुमान की गणना सूत्र द्वारा की जाती है

कहाँ पे टीटी छात्र के मानदंड का सैद्धांतिक मूल्य है डीएफ = एन- - टी- स्वतंत्रता की 1 डिग्री; एस y सूत्र द्वारा परिकलित पूर्वानुमान की मानक त्रुटि है

(2.57)

कहाँ पे एक्स- स्वतंत्र चर के प्रारंभिक मूल्यों का मैट्रिक्स; एक्सपीआर - फॉर्म के स्वतंत्र चर के भविष्य कहनेवाला मूल्यों का मैट्रिक्स-कॉलम

आइए हम कर प्राप्तियों के अनुमानित मूल्यों को खोजें (उदाहरण 2.1), बशर्ते कि संकेतकों के बीच संबंध समीकरण द्वारा वर्णित किया गया हो

आइए स्वतंत्र चर के भविष्य कहनेवाला मूल्य निर्धारित करें:

  • - कर्मचारियों की संख्या Xj: 500 हजार लोग;
  • - विनिर्माण उद्योगों में शिपमेंट की मात्रा एक्स 2: 65,000 मिलियन रूबल;
  • - ऊर्जा उत्पादन x3:15,000 मिलियन रूबल।

आइए कर प्राप्तियों के बिंदु और अंतराल पूर्वानुमान का पता लगाएं।

स्वतंत्र चर के दिए गए मानों के लिए, औसत कर राजस्व होगा

स्वतंत्र चर के भविष्य कहनेवाला मूल्यों का वेक्टर दिखेगा

सूत्र (2.57) द्वारा परिकलित पूर्वानुमान त्रुटि 5556.7 थी। स्वतंत्रता की डिग्री की संख्या के साथ टी-मानदंड का सारणीबद्ध मान डीएफ = 44 और महत्व स्तर a = 0.05, 2.0154 के बराबर है। नतीजतन, कर प्राप्तियों का अनुमानित मूल्य 0.95 की सीमा के भीतर होगा जिसकी संभावना है:

18,013.69 से - 2.0154-5556.7=6814.1 मिलियन रूबल;

अप करने के लिए 18,013.69 + 2.0154-5556.7=29,212 मिलियन रूबल

गैर-रैखिक एकाधिक प्रतिगमन मॉडल द्वारा पूर्वानुमान भी सूत्रों (2.55) - (2.57) का उपयोग करके किया जा सकता है, इन मॉडलों को पहले से रैखिक किया गया है।

डेटा बहुसंकेतिकता

एक अर्थमितीय मॉडल का निर्माण करते समय, यह माना जाता है कि स्वतंत्र चर आश्रित को अलगाव में प्रभावित करते हैं, अर्थात, परिणामी विशेषता पर एकल चर का प्रभाव अन्य चर के प्रभाव से जुड़ा नहीं होता है। वास्तविक आर्थिक वास्तविकता में, सभी घटनाएं कुछ हद तक जुड़ी हुई हैं, इसलिए इस धारणा को प्राप्त करना लगभग असंभव है। स्वतंत्र चरों के बीच संबंध की उपस्थिति सहसंबंध-प्रतिगमन विश्लेषण के परिणामों पर इसके प्रभाव का आकलन करने की आवश्यकता की ओर ले जाती है।

व्याख्यात्मक चर के बीच कार्यात्मक और स्टोकेस्टिक संबंध हैं। पहले मामले में, कोई मॉडल के विनिर्देश में त्रुटियों की बात करता है, जिसे ठीक किया जाना चाहिए।

एक कार्यात्मक संबंध तब उत्पन्न होता है जब प्रतिगमन समीकरण में, विशेष रूप से, व्याख्यात्मक चर के रूप में पहचान में शामिल सभी चर शामिल होते हैं। उदाहरण के लिए, हम कह सकते हैं कि आय Y खपत C और निवेश का योग है मैंयानी पहचान रखती है। हम मानते हैं कि ब्याज दरों का स्तर आय पर निर्भर करता है, अर्थात। सामान्य मॉडल के रूप में प्रतिनिधित्व किया जा सकता है

एक अनुभवहीन शोधकर्ता, जो मॉडल में सुधार करना चाहता है, समीकरण में "खपत" और "निवेश" चर भी शामिल कर सकता है, जिससे व्याख्यात्मक चर के बीच एक कार्यात्मक संबंध बन जाएगा:

मैट्रिक्स कॉलम का कार्यात्मक संबंध एक्ससमीकरण का एक अनूठा समाधान खोजने की असंभवता को जन्म देगा

प्रतिगमन क्योंकि , और व्युत्क्रम ढूँढना

मैट्रिक्स में एक मैट्रिक्स के बीजीय पूरक को उसके निर्धारक द्वारा विभाजित करना शामिल है, जो दिया गया है

अन्यथा यह शून्य के बराबर होगा।

अधिक बार, व्याख्यात्मक चरों के बीच एक स्टोकेस्टिक संबंध होता है, जिससे में कमी आती है

मैट्रिक्स निर्धारक मान: कनेक्शन जितना मजबूत होगा,

निर्धारक जितना छोटा होगा। इससे न केवल एलएसएम का उपयोग करके प्राप्त पैरामीटर अनुमानों में वृद्धि होती है, बल्कि उनकी मानक त्रुटियों में भी वृद्धि होती है, जिनकी गणना सूत्र (2.24) द्वारा की जाती है:

जो, जैसा कि हम देख सकते हैं, एक मैट्रिक्स का भी उपयोग करता है। दो व्याख्यात्मक चर के बीच एक सहसंबंध मौजूद हो सकता है ( अंतर्संबंध) और कई . के बीच (बहुविकल्पी)।

ऐसे कई संकेत हैं जो बहुसंकेतन की उपस्थिति का संकेत देते हैं। विशेष रूप से, ये संकेत हैं:

  • प्रतिगमन गुणांक के संकेत हैं जो आर्थिक सिद्धांत के अनुरूप नहीं हैं। उदाहरण के लिए, हम जानते हैं कि व्याख्यात्मक चर एक्ससमझाया गया चर y पर सीधा प्रभाव पड़ता है, साथ ही, इस चर के लिए प्रतिगमन गुणांक शून्य से कम है;
  • - अध्ययन की गई आबादी की मात्रा में मामूली कमी (वृद्धि) के साथ मॉडल के मापदंडों में महत्वपूर्ण परिवर्तन;
  • - मापदंडों की मानक त्रुटियों के उच्च मूल्यों के कारण प्रतिगमन मापदंडों का महत्वहीन होना।

स्वतंत्र चर के बीच सहसंबंध के अस्तित्व को उनके बीच सहसंबंध संकेतकों का उपयोग करके प्रकट किया जा सकता है, विशेष रूप से, युग्मित सहसंबंध गुणांक का उपयोग करके आर XiX, जिसे एक मैट्रिक्स के रूप में लिखा जा सकता है

(2.58)

एक चर का स्वयं के साथ सहसंबंध गुणांक एक के बराबर होता है (जी xx = 1), और चर के सहसंबंध गुणांक *, चर के साथ *, चर के सहसंबंध गुणांक के बराबर है एक्सजेसीपरिवर्तनीय एक्स, (जीएक्स एक्स =आरएक्स एक्स ). इसलिए, यह मैट्रिक्स सममित है, इसलिए इसमें केवल मुख्य विकर्ण और इसके नीचे के तत्वों को दर्शाया गया है:

युग्मित रैखिक सहसंबंध गुणांक के उच्च मान अंतर्संबंध की उपस्थिति का संकेत देते हैं, अर्थात। दो व्याख्यात्मक चर के बीच रैखिक संबंध। मूल्य जितना अधिक होगा, अंतर्संबंध उतना ही अधिक होगा। चूंकि मॉडल बनाते समय व्याख्यात्मक चर के बीच संबंधों की अनुपस्थिति से बचना व्यावहारिक रूप से असंभव है, इसलिए मॉडल में दो चर को व्याख्यात्मक चर के रूप में शामिल करने के संबंध में निम्नलिखित सिफारिश है। दोनों चर को मॉडल में शामिल किया जा सकता है यदि संबंध

वे। परिणामी और व्याख्यात्मक चर के बीच संबंध की जकड़न व्याख्यात्मक चर के बीच संबंधों की जकड़न से अधिक है।

मैट्रिक्स के सारणिक (2.58) का पता लगाकर बहुसंरेखण की उपस्थिति की पुष्टि की जा सकती है। यदि स्वतंत्र चर के बीच संबंध पूरी तरह से अनुपस्थित है, तो ऑफ-विकर्ण तत्व शून्य के बराबर होंगे, और मैट्रिक्स का निर्धारक एक के बराबर होगा। यदि स्वतंत्र चर के बीच संबंध कार्यात्मक के करीब है (यानी, यह बहुत करीब है), तो मैट्रिक्स yxr का निर्धारक शून्य के करीब होगा।

बहुसंरेखण को मापने की एक अन्य विधि प्रतिगमन गुणांक (2.28) की मानक त्रुटि के लिए सूत्र के विश्लेषण का परिणाम है:

इस सूत्र के अनुसार, मानक त्रुटि जितनी अधिक होगी, मान उतना ही छोटा होगा, जिसे कहा जाता है विचरण मुद्रास्फीति कारक (याफैलाव उड़ाने वाला कारक ) वीआईएफ:

चर की निर्भरता के समीकरण के लिए निर्धारण का गुणांक कहाँ पाया जाता है Xjएकाधिक प्रतिगमन के माने गए मॉडल में शामिल अन्य चर से।

चूंकि मान चर के बीच संबंध की निकटता को दर्शाता है Xjऔर अन्य व्याख्यात्मक चर, तो यह वास्तव में, इस चर के संबंध में बहुसंस्कृति की विशेषता है एक्सजेकनेक्शन के अभाव में, संकेतक वीआईएफएक्स एक के बराबर (या करीब) होगा, कनेक्शन को मजबूत करने से इस सूचक की प्रवृत्ति अनंत तक हो जाती है। उन्हें लगता है कि अगर वीआईएफ X >3 प्रत्येक चर * के लिए, फिर बहुसंरेखण होता है।

बहुसंरेखण मीटर भी तथाकथित . है सशर्तता का संकेतक (संख्या) मैट्रिक्स यह इस मैट्रिक्स के अधिकतम और न्यूनतम eigenvalues ​​के अनुपात के बराबर है:

ऐसा माना जाता है कि यदि इस अनुपात का क्रम 10s-106 से अधिक हो जाता है, तो प्रबल बहुसंरेखण होता है।

आइए हमारे उदाहरण 2.1 में बहुसंरेखण की उपस्थिति की जाँच करें। जोड़ीदार सहसंबंध गुणांक के मैट्रिक्स का रूप है

यह ध्यान दिया जा सकता है कि व्याख्यात्मक चर के बीच संबंध काफी करीब हैं, विशेष रूप से चर Xj और x2 के बीच; X] और x3, जो इन चरों के अंतर्संबंध को दर्शाता है। चर x2 और x3 के बीच एक कमजोर संबंध देखा जाता है। आइए हम मैट्रिक्स r^.. का सारणिक ज्ञात करें।

परिणामी मान एक की तुलना में शून्य के करीब है, जो व्याख्यात्मक चर में बहुसंकेतन की उपस्थिति को इंगित करता है।

आइए नियम (2.59) का उपयोग करके प्रतिगमन मॉडल में सभी तीन स्वतंत्र चरों को शामिल करने की वैधता की जांच करें। आश्रित और स्वतंत्र चर के युग्मित रैखिक सहसंबंध गुणांक हैं

वे स्वतंत्र चर के बीच संबंध की निकटता के संकेतकों से अधिक हैं, इसलिए, नियम (2.59) संतुष्ट है, सभी तीन चर को प्रतिगमन मॉडल में शामिल किया जा सकता है।

आइए हम विचरण मुद्रास्फीति कारक का उपयोग करके चर के बहुसंरेखण की डिग्री को मापें ( वीआईएफ) ऐसा करने के लिए, प्रतिगमन के लिए निर्धारण के गुणांक की गणना करना आवश्यक है:

ऐसा करने के लिए, प्रत्येक प्रतिगमन के लिए एलएसएम लागू करना, उसके मापदंडों का मूल्यांकन करना और निर्धारण के गुणांक की गणना करना आवश्यक है। हमारे उदाहरण के लिए, गणना परिणाम इस प्रकार हैं:

इसलिए, प्रत्येक स्वतंत्र चर के लिए विचरण मुद्रास्फीति कारक बराबर होगा

सभी परिकलित मान तीन के बराबर महत्वपूर्ण मान से अधिक नहीं थे, इसलिए, एक मॉडल का निर्माण करते समय, स्वतंत्र चर के बीच संबंधों के अस्तित्व की उपेक्षा की जा सकती है।

मैट्रिक्स के eigenvalues ​​​​को खोजने के लिए (सशर्तता सूचकांक (2.60) की गणना के उद्देश्य से) विशेषता समीकरण का समाधान खोजना आवश्यक है

हमारे उदाहरण के लिए मैट्रिक्स जैसा दिखता है

और मैट्रिक्स, जिसके निर्धारक का मापांक शून्य के बराबर होना चाहिए, निम्नलिखित होगा:

इस मामले में विशेषता बहुपद में चौथी डिग्री होगी, जिससे समस्या को मैन्युअल रूप से हल करना मुश्किल हो जाता है। इस मामले में, कंप्यूटर प्रौद्योगिकी की क्षमताओं का उपयोग करने की सिफारिश की जाती है। उदाहरण के लिए, पीपीपी में ईव्यूजनिम्नलिखित मैट्रिक्स eigenvalues ​​​​प्राप्त कर रहे हैं:

इसलिए, सशर्तता सूचकांक η के बराबर होगा

जो मॉडल में मजबूत बहुसंस्कृति की उपस्थिति को इंगित करता है।

बहुसंरेखण को दूर करने की विधियाँ इस प्रकार हैं।

  • 1. प्रतिगमन मॉडल में शामिल चर के बीच संबंधों का विश्लेषण व्याख्यात्मक (स्वतंत्र) के रूप में, केवल उन चरों का चयन करने के लिए जो एक दूसरे से कमजोर रूप से संबंधित हैं।
  • 2. निकट से संबंधित चरों के कार्यात्मक परिवर्तन। उदाहरण के लिए, हम मानते हैं कि शहरों में करों की आय निवासियों की संख्या और शहर के क्षेत्रफल पर निर्भर करती है। जाहिर है, ये चर निकट से संबंधित होंगे। उन्हें एक सापेक्ष चर "जनसंख्या घनत्व" द्वारा प्रतिस्थापित किया जा सकता है।
  • 3. यदि किसी कारण से स्वतंत्र चर की सूची परिवर्तन के अधीन नहीं है, तो आप बहुसंरेखण को समाप्त करने के लिए मॉडल को समायोजित करने के लिए विशेष विधियों का उपयोग कर सकते हैं: रिज प्रतिगमन (रिज प्रतिगमन), प्रमुख घटक विधि।

आवेदन पत्र रिज प्रतिगमनमैट्रिक्स के मुख्य विकर्ण के तत्वों को कुछ मनमाने ढंग से दिए गए सकारात्मक मान द्वारा समायोजित करना शामिल है। मान को 0.1 से 0.4 तक ले जाने की अनुशंसा की जाती है। एन. ड्रेपर, जी. स्मिथ ने अपने काम में होरल, केनार्ड और बेल्डविन द्वारा प्रस्तावित के मूल्य की "स्वचालित" पसंद के तरीकों में से एक दिया:

(2.61)

कहाँ पे टीमूल प्रतिगमन मॉडल में मापदंडों की संख्या (मुक्त अवधि को छोड़कर) है; एसएसई बहुसंकेतितता के समायोजन के बिना मूल प्रतिगमन मॉडल से प्राप्त वर्गों का अवशिष्ट योग है; एकसूत्र द्वारा रूपांतरित प्रतिगमन गुणांक का एक स्तंभ वेक्टर है

(2.62)

कहाँ पे सिजो- मूल प्रतिगमन मॉडल में चर y के साथ पैरामीटर।

का मान चुनने के बाद, प्रतिगमन मापदंडों का अनुमान लगाने का सूत्र इस तरह दिखेगा

(2.63)

कहाँ पे मैंपहचान मैट्रिक्स है; एक्स,- स्वतंत्र चर के मूल्यों का मैट्रिक्स: सूत्र के अनुसार प्रारंभिक या रूपांतरित (2.64); Υ τ आश्रित चर के मूल्यों का वेक्टर है: प्रारंभिक या सूत्र द्वारा रूपांतरित (2.65)।

(2.64)

और परिणामी चर

इस मामले में, सूत्र (2.63) के अनुसार मापदंडों का अनुमान लगाने के बाद, संबंधों का उपयोग करते हुए, मूल चर पर प्रतिगमन के लिए आगे बढ़ना आवश्यक है

सूत्र (2.63) का उपयोग करके प्राप्त प्रतिगमन मापदंडों के अनुमान पक्षपाती होंगे। हालांकि, चूंकि मैट्रिक्स का निर्धारक मैट्रिक्स के निर्धारक से अधिक है, इसलिए प्रतिगमन मापदंडों के अनुमानों का विचरण कम हो जाएगा, जो मॉडल के भविष्य कहनेवाला गुणों को सकारात्मक रूप से प्रभावित करेगा।

उदाहरण 2.1 के लिए रिज प्रतिगमन के आवेदन पर विचार करें। आइए हम सूत्र (2.61) का उपयोग करके का मान ज्ञात करें। ऐसा करने के लिए, हम पहले सूत्र (2.62) का उपयोग करके रूपांतरित प्रतिगमन गुणांक के वेक्टर की गणना करते हैं:

उत्पाद 1.737-109 है। इसलिए, अनुशंसित τ होगा

सूत्र (2.63) और सूत्र (2.66) के अनुसार परिवर्तन लागू करने के बाद, हम प्रतिगमन समीकरण प्राप्त करते हैं

आवेदन पत्र प्रमुख घटक विधि अन्योन्याश्रित चर x से पारस्परिक रूप से स्वतंत्र चर में संक्रमण शामिल है, जिसे कहा जाता है मुख्य

अवयव. प्रत्येक प्रमुख घटक, z, को केंद्रित (या मानकीकृत) व्याख्यात्मक चर के रैखिक संयोजन के रूप में दर्शाया जा सकता है टी:।याद रखें कि एक चर के केंद्र में दिए गए के प्रत्येक i-th मान से घटाना शामिल है j-वेंइसके माध्य मान का चर:

और मानकीकरण (स्केलिंग) चर Xj के प्रारंभिक मूल्यों के लिए गणना किए गए मानक विचलन द्वारा अभिव्यक्ति (2.67) का विभाजन है

चूंकि स्वतंत्र चरों में अक्सर अलग-अलग माप पैमाने होते हैं, सूत्र (2.68) को अधिक बेहतर माना जाता है।

घटकों की संख्या मूल स्वतंत्र चर की संख्या से कम या उसके बराबर हो सकती है आर।घटक संख्या प्रतिइस प्रकार लिखा जा सकता है:

(2.69)

यह दिखाया जा सकता है कि सूत्र (2.69) में अनुमान तत्वों के अनुरूप हैं प्रति-मैट्रिक्स का eigenvector, जहां टीमानकीकृत चर वाले आकार का एक मैट्रिक्स है। प्रमुख घटकों की संख्या मनमानी नहीं है। पहले प्रमुख घटक में अधिकतम विचरण होता है, यह मैट्रिक्स के अधिकतम eigenvalue से मेल खाता है; अंतिम न्यूनतम विचरण और सबसे छोटा eigenvalue है।

विचरण का हिस्सा प्रति-स्वतंत्र चर के कुल प्रसरण में वें घटक की गणना सूत्र द्वारा की जाती है

कहाँ पे एक्स k इस घटक के अनुरूप एक eigenvalue है; सूत्र के हर (2.70) में मैट्रिक्स के सभी eigenvalues ​​​​का योग होता है।

z घटकों के मूल्यों की गणना करने के बाद, कम से कम वर्ग विधि का उपयोग करके एक प्रतिगमन बनाया जाता है। मुख्य घटकों (2.71) पर प्रतिगमन में आश्रित चर को सूत्रों (2.67) या (2.68) के अनुसार केंद्रित (मानकीकृत) किया जाना चाहिए।

कहाँ पे टी y - मानकीकृत (केंद्रित) आश्रित चर; प्रमुख घटकों के लिए समाश्रयण गुणांक हैं; eigenvalues ​​के अवरोही क्रम में क्रमबद्ध प्रमुख घटक हैं एक्सप्रति ; एक यादृच्छिक शेष है।

प्रतीपगमन प्राचलों (2.71) का आकलन करने के बाद, व्यंजक (2.67)-(2.69) का प्रयोग करते हुए मूल चरों में समाश्रयण समीकरण पर आगे बढ़ सकते हैं।

उदाहरण 2.1 के डेटा पर प्रमुख घटक पद्धति के अनुप्रयोग पर विचार करें। ध्यान दें कि मानकीकृत चर के लिए मैट्रिक्स एक ही समय में स्वतंत्र चर के बीच युग्मित रैखिक सहसंबंध गुणांक का एक मैट्रिक्स है। इसकी गणना पहले ही की जा चुकी है और यह बराबर है

PPP का उपयोग करके इस मैट्रिक्स के eigenvalues ​​और eigenvectors खोजें समीक्षा।हमें निम्नलिखित परिणाम मिलते हैं।

मैट्रिक्स eigenvalues:

घटकों द्वारा परावर्तित स्वतंत्र चरों के प्रसरण का अनुपात था

आइए मैट्रिक्स के eigenvectors को नीचे मैट्रिक्स के कॉलम के रूप में लिखकर संयोजित करें एफ।उन्हें अवरोही eigenvalues ​​द्वारा क्रमबद्ध किया जाता है, अर्थात। पहला स्तंभ अधिकतम eigenvalue का eigenvector है, और इसी तरह:

इसलिए, तीन घटकों (तीन eigenvectors के अनुरूप) को इस प्रकार लिखा जा सकता है

सूत्र (2.68) के अनुसार प्रारंभिक चर को मानकीकृत करने और कम से कम वर्गों का उपयोग करके घटकों के मूल्यों (प्रत्येक घटक के n मानों द्वारा) की गणना करने के बाद, हम समीकरण (2.71) के पैरामीटर पाते हैं:

परिणामी प्रतिगमन समीकरण में, पहले घटक पर केवल पैरामीटर महत्वपूर्ण है। यह एक स्वाभाविक परिणाम है, यह देखते हुए कि यह घटक स्वतंत्र चर में 70.8% भिन्नता का वर्णन करता है। चूंकि घटक स्वतंत्र होते हैं, जब कुछ घटकों को मॉडल से बाहर रखा जाता है, तो अन्य घटकों के समीकरण के पैरामीटर नहीं बदलते हैं। इस प्रकार, हमारे पास एक घटक के साथ एक प्रतिगमन समीकरण है:

आइए परिणामी अभिव्यक्ति को मूल चर के साथ एक प्रतिगमन में बदल दें

इस प्रकार, मुख्य घटक विधि का उपयोग करते हुए, हमने प्रतिगमन समीकरण प्राप्त किया

रिज रिग्रेशन और प्रिंसिपल कंपोनेंट मेथड का उपयोग करके मल्टीकोलिनियरिटी को खत्म करने से मूल रिग्रेशन के मापदंडों में एक निश्चित बदलाव आया, जिसका रूप था

ध्यान दें कि ये परिवर्तन अपेक्षाकृत छोटे थे, जो निम्न स्तर की बहुसंकेतनता को दर्शाता है।

  • देखें, उदाहरण के लिए, वुचकोव आई।, बोयादज़िवा एल।, सोलाकोव ई।एप्लाइड रिग्रेशन विश्लेषण: प्रति। बल्गेरियाई से एम.: वित्त और सांख्यिकी, 1987. पी. 110.
  • ड्रेपर एन।, स्मिथ जी।हुक्मनामा। सेशन। एस. 514.
दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...