बहु समाश्रयण समीकरण के प्राचलों का क्या अर्थ है। रैखिक एकाधिक प्रतिगमन समीकरण

लक्ष्य: एकाधिक समीकरण के मापदंडों को निर्धारित करना सीखें रेखीय प्रतिगमनतरीका कम से कम वर्गोंऔर निर्मित समीकरण का विश्लेषण।

दिशा-निर्देश

इस अध्याय में सब कुछ महत्वपूर्ण है। अध्ययन करने से पहले, मैट्रिक्स विश्लेषण से निम्नलिखित सामग्री को दोहराना आवश्यक है: मैट्रिक्स गुणा, उलटा मैट्रिक्स, उलटा मैट्रिक्स विधि का उपयोग करके रैखिक समीकरणों की एक प्रणाली को हल करना। इस अध्याय में, जोड़ीदार रैखिक प्रतिगमन से संबंधित हर चीज को कई रैखिक मॉडल के लिए सामान्यीकृत किया गया है। पहला अध्याय माइक्रोसॉफ्ट ऑफिस एक्सेल प्रोग्राम के कार्यों का वर्णन करता है जो आपको मैट्रिस के साथ संचालन करने की अनुमति देता है। ध्यान दें कि, पिछले अध्याय की तुलना में, व्याख्यात्मक चर के लिए गुणांकों के सामाजिक-आर्थिक अर्थ को निर्धारित करने के लिए इन चरों की बहुसंरेखता (मजबूत रैखिक संबंध) की अनुपस्थिति महत्वपूर्ण है। याद रखें कि समीकरण के गुणांकों की गणना के लिए सूत्र भी कम से कम वर्ग विधि के आवेदन से अनुसरण करता है। आपको नीचे दिए गए उदाहरण का अध्ययन करना चाहिए। मूल और मानकीकृत चर में मॉडल के संबंध पर ध्यान दें।

§ 1. प्रतिगमन समीकरण के मापदंडों का निर्धारण

किसी के लिए आर्थिक संकेतकअक्सर, एक नहीं, बल्कि कई कारक प्रभावित करते हैं। इस मामले में, युग्मित reg के बजाय-

एम (वाई एक्स) = एफ (एक्स) सोच-विचार किया हुआएकाधिक प्रतिगमन:

x1, x2,...,xm) = f(x1,x2,...,xm) ।

सांख्यिकीय संबंध का आकलन करने का कार्य

चर

वाई और एक्स = (एक्स 1, एक्स 2, ..., एक्स एम) इसी तरह तैयार किया गया है

जोड़ों का अवसर

नूह प्रतिगमन। एकाधिक प्रतिगमन समीकरण के रूप में प्रतिनिधित्व किया जा सकता है:

वाई = एफ (बीटा, एक्स) + ,

जहां वाई और एक्स = (एक्स 1, एक्स 2, ..., एक्स एम) - स्वतंत्र (व्याख्यात्मक) चर के वेक्टर; β= (β 0, β 1, β 2,..., β मीटर) - पैरामीटर के वेक्टर

(निर्धारित किए जाने हेतु); - यादृच्छिक त्रुटि (विचलन); वाई - निर्भर (व्याख्या) चर। ऐसा माना जाता है कि इसके लिए आबादीयह फ़ंक्शन f है जो जांच किए गए चर Y को स्वतंत्र चर के वेक्टर से जोड़ता है

वाई और एक्स = (एक्स 1, एक्स 2, ..., एक्सएम)।

बहु रेखीय प्रतीपगमन मॉडल - बहु प्रतीपगमन मॉडल के सबसे अधिक उपयोग किए जाने वाले और सरलतम पर विचार करें।

सैद्धांतिक रैखिक प्रतिगमन समीकरण का रूप है:

यहाँ β= (β 0 , β 1 , β 2 ,..., β m ) अज्ञात मापदंडों के आयाम (m +1) का एक सदिश है। β j , j = (1, 2, ..., m ) सैद्धांतिक रूप से j - m कहा जाता है

स्किम प्रतिगमन गुणांक (आंशिक प्रतिगमन गुणांक)। यह X j में परिवर्तन के प्रति Y की संवेदनशीलता को दर्शाता है। दूसरे शब्दों में, यह सशर्त गणित पर प्रभाव को दर्शाता है

तार्किक अपेक्षा M (Y x 1, x 2 ,...,x m ) आश्रित चर Y की व्याख्या करता है

चर X j बशर्ते कि मॉडल के अन्य सभी व्याख्यात्मक चर स्थिर रहें, β 0 एक मुक्त शब्द है,

जो उस स्थिति में Y का मान निर्धारित करता है जब सभी व्याख्यात्मक चर X j शून्य के बराबर हों।

चयन के बाद रैखिक प्रकार्यएक निर्भरता मॉडल के रूप में, प्रतिगमन मापदंडों का अनुमान लगाना आवश्यक है।

मान लें कि व्याख्यात्मक चर X = (X 1 , X 2 , ...,X m ) और आश्रित चर Y के वेक्टर के n अवलोकन हैं:

( xi 1 , xi 2 , ..., xim , yi ) , i= 1 ,2 , ..., n.

β 0 , β 1 , β 2 ,..., β m , असमानता को खोजने की समस्या को विशिष्ट रूप से हल करने के लिए

एन एम + 1। यदि n = m + 1, तो सदिश β . के गुणांकों का अनुमान

एक अनोखे तरीके से गणना की गई।

यदि प्रेक्षणों की संख्या आवश्यक न्यूनतम से अधिक है: n>m + 1, तो अनुकूलन, आकलन की आवश्यकता है

पैरामीटर β 0 , β 1 , β 2 ,..., β m , जिसके लिए सूत्र सबसे अच्छा देता है

उपलब्ध टिप्पणियों के लिए सन्निकटन।

इस स्थिति में, संख्या ν= n - m - 1 कहलाती है स्वतंत्रता की डिग्री की संख्या. बहु रेखीय प्रतीपगमन समीकरण के प्राचलों का आकलन करने की सबसे सामान्य विधि है कम से कम वर्ग विधि(एमएनके)। याद रखें कि इसका सार मनाया मूल्यों के वर्ग विचलन के योग को कम करना है

प्रतिगमन समीकरण द्वारा प्राप्त अपने Y मानों पर निर्भर चर Y।

ध्यान दें कि पहले निर्धारित किए गए कम से कम वर्गों की पूर्वापेक्षाएँ हमें शास्त्रीय रैखिक प्रतिगमन मॉडल के ढांचे के भीतर विश्लेषण करने की अनुमति देती हैं।

जैसा कि जोड़ीदार प्रतिगमन के मामले में, पैरामीटर β j के सही मान नमूने से प्राप्त नहीं किए जा सकते हैं। इस मामले में, के बजाय

सैद्धांतिक प्रतिगमन समीकरण (3.3) तथाकथित द्वारा अनुमानित है

दिया गया अनुभवजन्य प्रतिगमन समीकरण:

वाई = बी 0 + बी 1 एक्स 1 + बी 2 एक्स 2 + ... + बीएम एक्सएम + ई।

बी 0 , बी 1 , ..., बी एम - सैद्धांतिक का अनुमान

मूल्यों

β 0, β 1, ..., β एम

प्रतिगमन गुणांक (अनुभवजन्य गुणांक

प्रतिगमन ईएनटी, ई -श्रेणी यादृच्छिक विचलन)। व्यक्तिगत टिप्पणियों के लिए हमारे पास है:

yi = b0 + b1 xi 1 + b2 xi 2 + ...+ bm xim + ei ,(i= 1,2 , ..., n) (3.6)

अनुमानित समीकरण को सबसे पहले आश्रित चर Y में परिवर्तन की सामान्य प्रवृत्ति (दिशा) का वर्णन करना चाहिए। इस मामले में, निर्दिष्ट प्रवृत्ति से विचलन की गणना करने में सक्षम होना आवश्यक है।

मात्रा के नमूने के अनुसार n:(xi 1 , xi 2 , ..., xim , yi ) , i= 1 ,2 , ..., n

वेक्टर β के पैरामीटर β j के मानों का अनुमान लगाना आवश्यक है, यानी, चुने हुए मॉडल को पैरामीट्रिज करने के लिए (यहां x ij , j = 1, 2, ..., m

i-वें प्रेक्षण में चर X j का मान)।

जब एलएसएम पूर्वापेक्षाएँ यादृच्छिक विचलन के संबंध में पूरी होती हैं i , अनुमान b 0 , b 1 , ..., b m पैरामीटर β 0 , β 1 , ..., β m

कम से कम वर्ग रैखिक प्रतिगमन निष्पक्ष, कुशल और सुसंगत हैं।

(3.6) के आधार पर, प्रतिगमन समीकरण के अनुरूप मॉडल मान y i से आश्रित चर के y i के मान के विचलन e i की गणना की जाती है और i-अवलोकन i = 1, 2, ..., n , द्वारा गणना की जाती है सूत्र:

ei = yi - yi = yi - b0 - b1 xi 1 - b2 xi 2 - ...- bm xim। (3.7)

§ 2. बहु रेखीय प्रतीपगमन के गुणांकों की गणना

हम अवलोकन संबंधी डेटा और संबंधित गुणांक मैट्रिक्स रूप में प्रस्तुत करते हैं।

एक्सएन 1

एक्सएन 2

x1 मी

x2 मी

यहाँ Y आश्रित चर Y के प्रेक्षणों का एक n-आयामी स्तंभ वेक्टर है;X एक n × (m + 1) मैट्रिक्स है जिसमें i-th पंक्ति i = 1, 2, ..., n i- को दर्शाता है। स्वतंत्र चर एक्स 1, एक्स 2, ..., एक्स एम के मूल्यों के वेक्टर का वां अवलोकन, एक मुक्त सदस्य बी 0 के साथ एक चर से मेल खाता है;

(एम + 1) प्रतिगमन समीकरण के पैरामीटर (3.5);

प्रतिगमन समीकरण:

मैं = 1

जहां ई टी \u003d (ई 1, ई 2, ..., ई एन) , यानी सुपरस्क्रिप्ट टी का अर्थ है ट्रांस-

प्रस्तुत मैट्रिक्स।

यह दिखाया जा सकता है कि यदि गुणांक B का स्तंभ सदिश सूत्र द्वारा पाया जाता है, तो स्थिति (3.10) संतुष्ट होती है:

बी = (एक्सटीएक्स) - 1XTY।

यहां एक्स टी मैट्रिक्स एक्स में स्थानांतरित मैट्रिक्स है,

(X T X ) - 1 (X T X ) का व्युत्क्रम मैट्रिक्स है। संबंध (3.11)

व्याख्यात्मक चरों की मनमानी संख्या m के साथ समाश्रयण समीकरणों के लिए मान्य।

उदाहरण 3.1। मान लीजिए कि फर्म की एक निश्चित वस्तु Y की आपूर्ति की मात्रा रैखिक रूप से इस वस्तु का उत्पादन करने वाले कर्मचारियों की कीमत X 1 और मजदूरी X 2 पर निर्भर करती है (सारणी 3.1)। आइए हम रैखिक समाश्रयण समीकरण के गुणांकों का निर्धारण करें। (यह मैट्रिक्स बीजगणित का ज्ञान मानता है)।

तालिका 3.1

एकाधिक रैखिक प्रतिगमन के लिए डेटा

मैट्रिक्स की तरह दिखते हैं:

एक्स टी एक्स = 318

7, 310816

− 0, 10049

− 0, 53537

−1

0, 001593

, (एक्सटीएक्स)

= − 0, 10049

− 0, 006644,

− 0, 53537

− 0, 006644

0, 043213

एक्स टी वाई = 23818,

एकाधिक रैखिक प्रतिगमन का कार्य निरंतर भविष्यवक्ताओं के एक सेट और एक निरंतर आश्रित चर के बीच संबंध का एक रैखिक मॉडल बनाना है। निम्नलिखित प्रतिगमन समीकरण अक्सर प्रयोग किया जाता है:

यहां एक मैं - प्रतिगमन गुणांक, बी 0- मुक्त सदस्य (यदि उपयोग किया जाता है), - एक त्रुटि वाले सदस्य - इसके बारे में विभिन्न धारणाएं बनाई जाती हैं, हालांकि, शून्य वेक्टर मैट के साथ वितरण की सामान्यता को अक्सर कम कर दिया जाता है। अपेक्षा और सहसंबंध मैट्रिक्स।

इस तरह का एक रैखिक मॉडल विभिन्न विषय क्षेत्रों में कई कार्यों का वर्णन करता है, उदाहरण के लिए, अर्थशास्त्र, उद्योग और चिकित्सा। ऐसा इसलिए है क्योंकि कुछ कार्य प्रकृति में रैखिक होते हैं।

आइए एक साधारण उदाहरण लेते हैं। इसके ज्ञात मापदंडों के अनुसार सड़क बिछाने की लागत का अनुमान लगाना आवश्यक है। साथ ही, हमारे पास सड़कों पर डेटा है जो पहले से ही बिछाया जा चुका है, जो लंबाई, छिड़काव की गहराई, काम करने वाली सामग्री की मात्रा, श्रमिकों की संख्या आदि को दर्शाता है।

यह स्पष्ट है कि सड़क की लागत अंततः बन जाएगी योग के बराबरइन सभी कारकों के मूल्य अलग-अलग। यह एक निश्चित राशि लेगा, उदाहरण के लिए, कुचल पत्थर, प्रति टन ज्ञात लागत के साथ, एक निश्चित मात्रा में डामर, एक ज्ञात लागत के साथ भी।

यह संभव है कि बिछाने के लिए वानिकी में कटौती करनी पड़ेगी, जिससे अतिरिक्त लागत भी आएगी। यह सब मिलकर सड़क बनाने की लागत देगा।

इस मामले में, मॉडल में एक स्वतंत्र सदस्य शामिल होगा, जो, उदाहरण के लिए, संगठनात्मक लागतों के लिए जिम्मेदार होगा (जो लगभग सभी निर्माण और स्थापना कार्यों के लिए समान हैं) दिया गया स्तर) या कर।

त्रुटि में वे कारक शामिल होंगे जिन्हें हमने मॉडल बनाते समय ध्यान में नहीं रखा था (उदाहरण के लिए, निर्माण के दौरान मौसम - इसे बिल्कुल भी ध्यान में नहीं रखा जा सकता है)।

उदाहरण: एकाधिक प्रतिगमन विश्लेषण

इस उदाहरण के लिए, गरीबी दर के कई संभावित सहसंबंधों और गरीबी रेखा से नीचे के परिवारों के प्रतिशत की भविष्यवाणी करने वाली शक्ति का विश्लेषण किया जाएगा। इसलिए, हम गरीबी रेखा से नीचे के परिवारों के प्रतिशत को आश्रित चर के रूप में और शेष चर को निरंतर भविष्यवक्ता के रूप में दर्शाने वाले चर पर विचार करेंगे।

प्रतिगमन गुणांक

यह पता लगाने के लिए कि गरीबी के स्तर का अनुमान लगाने में कौन सा स्वतंत्र चर अधिक योगदान देता है, हम जांच करते हैं मानकीकृत गुणांक(या बीटा) प्रतिगमन।

चावल। 1. प्रतीपगमन गुणांकों के प्राचलों का अनुमान।

बीटा गुणांक वे गुणांक हैं जो आपको प्राप्त होंगे यदि आप सभी चरों को 0 के माध्य और 1 के मानक विचलन में समायोजित करते हैं। इसलिए, इन बीटा गुणांकों का परिमाण आपको प्रत्येक स्वतंत्र चर के सापेक्ष योगदान की निर्भर चर से तुलना करने की अनुमति देता है। . जैसा कि ऊपर दी गई तालिका से देखा जा सकता है, 1960 से जनसंख्या में परिवर्तन (POP_CHING), गाँव में रहने वाली जनसंख्या का प्रतिशत (PT_RURAL) और इसमें कार्यरत लोगों की संख्या कृषि(N_Empld) गरीबी दर के सबसे महत्वपूर्ण भविष्यवक्ता हैं, जैसे केवल वे सांख्यिकीय रूप से महत्वपूर्ण हैं (उनके 95% विश्वास अंतराल में 0 शामिल नहीं है)। 1960 के बाद से जनसंख्या परिवर्तन का प्रतिगमन गुणांक (Pop_Chng) नकारात्मक है, इसलिए जनसंख्या जितनी कम होगी, संबंधित काउंटी में गरीबी रेखा से नीचे रहने वाले परिवारों की संख्या उतनी ही अधिक होगी। गाँव में रहने वाली जनसंख्या (%) के लिए प्रतिगमन गुणांक (Pt_Rural) सकारात्मक है, अर्थात ग्रामीण निवासियों का प्रतिशत जितना अधिक होगा, गरीबी दर उतनी ही अधिक होगी।

भविष्यवक्ता प्रभाव का महत्व

आइए तालिका को महत्व मानदंड के साथ देखें।

चावल। 2. प्रत्येक दिए गए चर के लिए एक साथ परिणाम।

जैसा कि इस तालिका से पता चलता है, केवल 2 चर के प्रभाव सांख्यिकीय रूप से महत्वपूर्ण हैं: 1960 के बाद से जनसंख्या में परिवर्तन (Pop_Chng) और गाँव में रहने वाली जनसंख्या का प्रतिशत (Pt_Rural), p< .05.

अवशेष विश्लेषण। प्रतिगमन समीकरण को फिट करने के बाद, अनुमानित मूल्यों और अवशिष्टों की जांच करना लगभग हमेशा आवश्यक होता है। उदाहरण के लिए, बड़े आउटलेयर परिणामों को बहुत कम कर सकते हैं और गलत निष्कर्ष निकाल सकते हैं।

उत्सर्जन का रेखा ग्राफ

आमतौर पर बड़े आउटलेर्स के लिए मूल या मानकीकृत अवशेषों की जांच करना आवश्यक होता है।

चावल। 3. अवलोकनों और अवशेषों की संख्या।

इस ग्राफ के ऊर्ध्वाधर अक्ष का पैमाना सिग्मा के मान द्वारा प्लॉट किया जाता है, अर्थात, मानक विचलनबचा हुआ। यदि एक या अधिक अवलोकन ±3 गुना सिग्मा के भीतर नहीं आते हैं, तो यह उन अवलोकनों को छोड़कर (यह अवलोकन चयन शर्तों के माध्यम से आसानी से किया जा सकता है) और यह सुनिश्चित करने के लिए विश्लेषण को फिर से चलाने के लायक हो सकता है कि परिणाम इनके द्वारा परिवर्तित नहीं होते हैं बाहरी।

महालनोबिस दूरियाँ

अधिकांश सांख्यिकीय पाठ्यपुस्तकें आश्रित चर पर बाहरी और अवशिष्ट पर बहुत समय व्यतीत करती हैं। हालांकि, भविष्यवक्ताओं में आउटलेर्स की भूमिका अक्सर अज्ञात रहती है। भविष्यवक्ता चर के पक्ष में, चर की एक सूची है जो आश्रित चर की भविष्यवाणी करने में विभिन्न भार (प्रतिगमन गुणांक) के साथ भाग लेते हैं। आप स्वतंत्र चरों को एक बहुआयामी स्थान के रूप में सोच सकते हैं जिसमें किसी भी प्रेक्षण को टाला जा सकता है। उदाहरण के लिए, यदि आपके पास समान प्रतिगमन गुणांक वाले दो स्वतंत्र चर हैं, तो आप उन दो चरों का एक स्कैटरप्लॉट प्लॉट कर सकते हैं और प्रत्येक अवलोकन को उस प्लॉट पर रख सकते हैं। तब कोई इस ग्राफ पर औसत मान को चिह्नित कर सकता है और द्वि-आयामी अंतरिक्ष में प्रत्येक अवलोकन से इस औसत (तथाकथित गुरुत्वाकर्षण केंद्र) की दूरी की गणना कर सकता है। महालनोबिस दूरी की गणना के पीछे यही मुख्य विचार है। अब 1960 के बाद से जनसंख्या परिवर्तन चर के हिस्टोग्राम को देखें।

चावल। 4. महालनोबिस दूरियों के वितरण का हिस्टोग्राम।

यह ग्राफ से पता चलता है कि महालनोबिस दूरी पर एक बाहरी है।

चावल। 5. मनाया, अनुमानित और अवशिष्ट मूल्य।

ध्यान दें कि शेल्बी काउंटी (पहली पंक्ति में) बाकी काउंटियों से कैसे अलग है। यदि आप मूल डेटा को देखते हैं, तो आप पाएंगे कि वास्तव में शेल्बी काउंटी में सबसे अधिक है बड़ी संख्याकृषि में कार्यरत लोग (चर N_Empld)। शायद इसे प्रतिशत के बजाय प्रतिशत के रूप में व्यक्त करना समझदारी होगी निरपेक्ष संख्या, इस मामले में शेल्बी काउंटी की महलानोबिस दूरी शायद अन्य काउंटियों की तुलना में उतनी बड़ी नहीं होगी। जाहिर है, शेल्बी काउंटी एक बाहरी है।

हटाए गए अवशेष

एक और बहुत महत्वपूर्ण आँकड़ा जो किसी को बाहरी समस्या की गंभीरता को मापने की अनुमति देता है, वह है हटाए गए अवशेष। ये संबंधित मामलों के लिए मानकीकृत अवशेष हैं, जो उस मामले को विश्लेषण से हटाकर प्राप्त किए जाते हैं। याद रखें कि बहु प्रतिगमन प्रक्रिया आश्रित चर और भविष्यवक्ता के बीच संबंध दिखाने के लिए प्रतिगमन सतह को समायोजित करती है। यदि एक अवलोकन एक बाहरी (जैसे शेल्बी काउंटी) है, तो प्रतिगमन सतह को उस बाहरी की ओर "खींचने" की प्रवृत्ति होती है। नतीजतन, यदि संबंधित अवलोकन हटा दिया जाता है, तो एक और सतह (और बीटा गुणांक) प्राप्त की जाएगी। इसलिए, यदि हटाए गए अवशेष मानकीकृत अवशेषों से बहुत अलग हैं, तो आपके पास यह मानने का कारण होगा कि संबंधित अवलोकन द्वारा प्रतिगमन विश्लेषण गंभीरता से विषम है। इस उदाहरण में, शेल्बी काउंटी के लिए हटाए गए अवशेष बताते हैं कि यह एक बाहरी है जो विश्लेषण को गंभीर रूप से खराब कर देता है। स्कैटरप्लॉट स्पष्ट रूप से बाहरी दिखाता है।

चावल। 6. प्रारंभिक अवशेष और विस्थापित अवशेष चर गरीबी रेखा से नीचे रहने वाले परिवारों के प्रतिशत को दर्शाता है।

उनमें से अधिकांश की कमोबेश स्पष्ट व्याख्याएं हैं, हालांकि, आइए सामान्य संभाव्यता ग्राफ की ओर मुड़ें।

जैसा कि पहले ही उल्लेख किया गया है, एकाधिक प्रतिगमन मानता है कि समीकरण में चर और अवशिष्टों के सामान्य वितरण के बीच एक रैखिक संबंध है। यदि इन मान्यताओं का उल्लंघन किया जाता है, तो निष्कर्ष गलत हो सकता है। अवशेषों का एक सामान्य प्रायिकता प्लॉट आपको बताएगा कि इन मान्यताओं का गंभीर उल्लंघन हुआ है या नहीं।

चावल। 7. सामान्य संभाव्यता ग्राफ; मूल बचा हुआ।

यह चार्ट निम्न प्रकार से बनाया गया था। सबसे पहले, मानकीकृत अवशेषों को क्रम में रखा गया है। इन रैंकों से, डेटा का पालन करने वाली धारणा के आधार पर z-मान (यानी सामान्य वितरण के मानक मान) की गणना कर सकते हैं सामान्य वितरण. ये z मान ग्राफ़ पर y-अक्ष के अनुदिश प्लॉट किए जाते हैं।

यदि देखे गए अवशेष (x-अक्ष के साथ प्लॉट किए गए) सामान्य रूप से वितरित किए जाते हैं, तो सभी मान ग्राफ़ पर एक सीधी रेखा पर स्थित होंगे। हमारे ग्राफ पर, सभी बिंदु वक्र के बहुत करीब हैं। यदि अवशिष्ट सामान्य रूप से वितरित नहीं होते हैं, तो वे इस रेखा से विचलित हो जाते हैं। इस ग्राफ में आउटलेयर भी ध्यान देने योग्य हो जाते हैं।

यदि समझौते का नुकसान होता है और डेटा रेखा के बारे में एक स्पष्ट वक्र (उदाहरण के लिए, एस के आकार में) बनाता है, तो आश्रित चर को किसी तरह से परिवर्तित किया जा सकता है (उदाहरण के लिए, "कम" करने के लिए एक लॉगरिदमिक परिवर्तन वितरण की पूंछ, आदि)। इस पद्धति की चर्चा इस उदाहरण के दायरे से बाहर है (नेटर, वासरमैन, और कुटनर, 1985, पीपी। 134-141, डेटा की गैर-सामान्यता और गैर-रैखिकता को दूर करने वाले परिवर्तनों की चर्चा प्रस्तुत है)। हालांकि, शोधकर्ता अक्सर प्रासंगिक मान्यताओं का परीक्षण किए बिना सीधे विश्लेषण करते हैं, जिससे गलत निष्कर्ष निकलते हैं।

आर्थिक घटनाओं को आमतौर पर परिभाषित किया जाता है एक बड़ी संख्या मेंएक साथ और संचयी कारक। इस संबंध में, चर की निर्भरता का अध्ययन करने में अक्सर समस्या उत्पन्न होती है परकई व्याख्यात्मक चर से ( एक्स 1, एक्स 2,…, एक्स के)जिसे से हल किया जा सकता है एकाधिक सहसंबंध-प्रतिगमन विश्लेषण।

कई प्रतिगमन विधियों का उपयोग करके निर्भरता का अध्ययन करते समय, समस्या उसी तरह बनती है जैसे युग्मित प्रतिगमन का उपयोग करते समय, अर्थात। परिणामी विशेषता के बीच संबंध के रूप की विश्लेषणात्मक अभिव्यक्ति को निर्धारित करना आवश्यक है परऔर कारक चिह्न x, एक्स 2,..., एक्स के,फ़ंक्शन का पता लगाएं, जहां k कारक सुविधाओं की संख्या है

मल्टीपल रिग्रेशन का व्यापक रूप से मांग, स्टॉक रिटर्न, उत्पादन लागत के कार्य का अध्ययन करने, मैक्रोइकॉनॉमिक कैलकुलेशन और अर्थमिति के कई अन्य मुद्दों को हल करने में उपयोग किया जाता है। वर्तमान में, एकाधिक प्रतिगमन अर्थमिति में सबसे आम तरीकों में से एक है। एकाधिक प्रतिगमन का मुख्य लक्ष्य बड़ी संख्या में कारकों के साथ एक मॉडल का निर्माण करना है, जबकि उनमें से प्रत्येक के प्रभाव को व्यक्तिगत रूप से निर्धारित करना, साथ ही साथ मॉडलिंग संकेतक पर उनके संचयी प्रभाव का निर्धारण करना है।

एकाधिक प्रतिगमन में कम से कम वर्ग विधि की ख़ासियत के कारण, जोड़ी एक के रूप में, केवल रैखिक समीकरणों और चर को बदलकर एक रैखिक रूप में कम किए गए समीकरणों का उपयोग किया जाता है। सबसे अधिक इस्तेमाल किया जाने वाला रैखिक समीकरण निम्नानुसार लिखा जा सकता है:

a 0 , a 1, …, a k - मॉडल पैरामीटर (प्रतिगमन गुणांक);

उज - यादृच्छिक मूल्य(शेष का मान)।

प्रतिगमन गुणांक एक j दिखाता है कि परिणामी चिन्ह औसतन कितनी मात्रा में बदलेगा वाई,यदि परिवर्तनशील एक्स j प्रतिगमन समीकरण में शामिल अन्य कारकों के एक निश्चित (स्थिर) मान के साथ माप की एक इकाई द्वारा वृद्धि। पर पैरामीटर्स एक्सबुलाया "शुद्ध" प्रतिगमन के गुणांक .

उदाहरण।

आइए मान लें कि परिवारों की आबादी पर भोजन व्यय की निर्भरता निम्नलिखित समीकरण द्वारा विशेषता है:

आप- भोजन के लिए प्रति माह परिवार का खर्च, हजार रूबल;

एक्स 1 - प्रति परिवार के सदस्य की मासिक आय, हजार रूबल;

एक्स 2 - परिवार का आकार, लोग।

इस समीकरण का विश्लेषण हमें निष्कर्ष निकालने की अनुमति देता है - प्रति परिवार के सदस्य की आय में 1 हजार रूबल की वृद्धि के साथ। भोजन की लागत में औसतन 350 रूबल की वृद्धि होगी। एक ही औसत परिवार के आकार के साथ। दूसरे शब्दों में, परिवार के अतिरिक्त खर्च का 35 प्रतिशत भोजन पर खर्च किया जाता है। समान आय के साथ परिवार के आकार में वृद्धि का तात्पर्य भोजन की लागत में 730 रूबल की अतिरिक्त वृद्धि है। पहला पैरामीटर आर्थिक व्याख्या के अधीन नहीं है।

मॉडल के प्रत्येक पैरामीटर की विश्वसनीयता का आकलन छात्र के टी-टेस्ट का उपयोग करके किया जाता है। किसी भी मॉडल पैरामीटर a j के लिए, t-मानदंड के मान की गणना सूत्र द्वारा की जाती है , कहाँ पे


एस - प्रतिगमन समीकरण का मानक (मूल माध्य वर्ग) विचलन)

सूत्र द्वारा निर्धारित किया जाता है

प्रतिगमन गुणांक a j को पर्याप्त रूप से विश्वसनीय माना जाता है यदि परिकलित मान टी-के साथ मानदंड ( एन-के-1) स्वतंत्रता की डिग्री सारणीबद्ध एक से अधिक है, अर्थात। टी कैल्क> टी एकजेएन-के-1. यदि प्रतिगमन गुणांक की विश्वसनीयता की पुष्टि नहीं की जाती है, तो यह निम्नानुसार है; फैक्टोरियल मॉडल में महत्वहीनता का अनुमान जेसुविधा और इसे मॉडल से समाप्त करने या इसे किसी अन्य कारक विशेषता से बदलने की आवश्यकता है।

प्रतिगमन मॉडल के गुणांकों द्वारा कारकों के प्रभाव का आकलन करने में एक महत्वपूर्ण भूमिका निभाई जाती है। हालांकि, सीधे उनकी मदद से माप की इकाइयों में अंतर और उतार-चढ़ाव की विभिन्न डिग्री के कारण निर्भर चर पर उनके प्रभाव की डिग्री के अनुसार कारक संकेतों की तुलना करना असंभव है। इन मतभेदों को दूर करने के लिए आवेदन करें लोच के आंशिक गुणांकई जू और बीटा गुणांक β j.

लोच के गुणांक की गणना के लिए सूत्र

कहाँ पे

ए जे कारक का प्रतिगमन गुणांक है जे,

प्रभावी सुविधा का औसत मूल्य

किसी विशेषता का माध्य मान जे

लोच गुणांक दर्शाता है कि आश्रित चर कितने प्रतिशत बदलता है परजब कारक बदलता है जे 1% से।

बीटा - गुणांक निर्धारित करने का सूत्र।

, कहाँ पे

S xj गुणनखंड का मानक विचलन है जे;

एस वाई - कारक का मानक विचलन वाई

β - गुणांक मानक विचलन के मूल्य के किस भाग से दिखाता है एसवाईआश्रित चर बदल जाएगा परसंगत स्वतंत्र चर में परिवर्तन के साथ एक्स j अन्य स्वतंत्र चरों के निश्चित मान के साथ इसके मानक विचलन के मान से।

सभी कारकों के कुल प्रभाव में एक निश्चित कारक के प्रभाव की हिस्सेदारी का अनुमान मूल्य द्वारा लगाया जा सकता है डेल्टा गुणांक जे.

ये गुणांक हमें आश्रित चर पर कारकों के प्रभाव की डिग्री के अनुसार कारकों को रैंक करने की अनुमति देते हैं।

डेल्टा - गुणांक निर्धारित करने का सूत्र।

r yj कारक j और आश्रित चर के बीच युग्म सहसंबंध का गुणांक है;

R2- एकाधिक कारकदृढ़ संकल्प।

गुणक एकाधिक निर्धारणके लिए उपयोग गुणवत्ता आकलनएकाधिक प्रतिगमन मॉडल।

एकाधिक निर्धारण के गुणांक को निर्धारित करने का सूत्र।

निर्धारण का गुणांक परिणामी गुण की भिन्नता के अनुपात को दर्शाता है, जो कारक लक्षणों के प्रभाव में होता है, अर्थात। यह निर्धारित करता है कि विशेषता भिन्नता का अनुपात क्या है परमॉडल में और मॉडल में शामिल कारकों के प्रभाव के कारण ध्यान में रखा गया है। करीब R2एकता के लिए, मॉडल की गुणवत्ता जितनी अधिक होगी

स्वतंत्र चर जोड़ते समय, मान R2बढ़ता है, इसलिए अनुपात R2सूत्र के अनुसार स्वतंत्र चर की संख्या के लिए समायोजित किया जाना चाहिए

के लिये मॉडल महत्व परीक्षणप्रतिगमन फिशर के एफ-परीक्षण का उपयोग करता है। यह सूत्र द्वारा निर्धारित किया जाता है

यदि मानदंड के परिकलित मान के साथ 1, = तथा 2 \u003d (एन - के -1)महत्व के दिए गए स्तर पर तालिका की तुलना में स्वतंत्रता की डिग्री अधिक है, तो मॉडल को महत्वपूर्ण माना जाता है।

मॉडल की सटीकता के माप के रूप में, मानक त्रुटि का उपयोग किया जाता है, जो कि अवशिष्ट घटक के स्तर के वर्गों के योग का अनुपात है (n - k -1):

एक रैखिक मॉडल के मापदंडों का आकलन करने के लिए शास्त्रीय दृष्टिकोण पर आधारित है कम से कम वर्ग विधि (LSM). व्यवस्था सामान्य समीकरणकी तरह लगता है:

सिस्टम का समाधान इनमें से किसी एक के अनुसार किया जा सकता है ज्ञात तरीके: गॉस विधि, क्रैमर विधि, आदि।

उदाहरण 15।

क्षेत्र में चार उद्यमों के लिए (तालिका 41), हम प्रति कर्मचारी उत्पादन की निर्भरता का अध्ययन करते हैं आप(हजार रूबल) नई अचल संपत्तियों की कमीशनिंग से (वर्ष के अंत में धन के मूल्य का %) और श्रमिकों की कुल संख्या (%) में अत्यधिक कुशल श्रमिकों के अनुपात से। आपको एक से अधिक प्रतिगमन समीकरण लिखने की आवश्यकता है।

तालिका 41 - प्रति कार्यकर्ता उत्पादन की निर्भरता

एकाधिक प्रतिगमन का मुख्य उद्देश्य- बड़ी संख्या में कारकों के साथ एक मॉडल का निर्माण करें, जबकि उनमें से प्रत्येक के प्रभाव को व्यक्तिगत रूप से निर्धारित करें, साथ ही साथ मॉडलिंग संकेतक पर उनके संचयी प्रभाव का निर्धारण करें।

सेवा असाइनमेंट. ऑनलाइन कैलकुलेटर का उपयोग करके, आप निम्नलिखित संकेतक पा सकते हैं:

  • एकाधिक प्रतिगमन समीकरण, जोड़ीदार सहसंबंध मैट्रिक्स, रैखिक प्रतिगमन के लिए औसत लोच गुणांक;
  • दृढ़ संकल्प के कई गुणांक, विश्वास अंतरालप्रभावी सुविधा के व्यक्तिगत और औसत मूल्य के लिए;
इसके अलावा, वहाँ है अवशेषों के स्वत: सहसंबंध की जांच करेंऔर विषमलैंगिकता।

निर्देश। डेटा की मात्रा (पंक्तियों की संख्या), चर की संख्या x निर्दिष्ट करें, अगला क्लिक करें। परिणामी समाधान एक वर्ड फ़ाइल में सहेजा जाता है (एकाधिक प्रतिगमन और सहसंबंध समीकरण खोजने का उदाहरण देखें)। यदि बहुत अधिक डेटा है, तो आप उन्हें MS Excel से सम्मिलित कर सकते हैं। ऐसा करने के लिए, चर x की संख्या निर्दिष्ट करें, Excel से सम्मिलित करें () पर क्लिक करें।

कारकों की संख्या (x) 1 2 3 4 5 6 7 8 9 10 पंक्तियों की संख्या
",0);">

बहु प्रतिगमन समीकरण के मापदंडों की गणना करते समय, हम उपयोग करते हैं मैट्रिक्स विधि . दो चरों (m = 2) के साथ बहु समाश्रयण के लिए, आप समीकरणों के निकाय को हल करने की विधि का उपयोग कर सकते हैं।

एक बहु प्रतिगमन समीकरण का निर्माणमॉडल के विनिर्देश पर निर्णय के साथ शुरू होता है, जिसमें बदले में प्रश्नों के 2 मंडल शामिल होते हैं: कारक चयनतथा प्रतिगमन समीकरण का विकल्प.

कारकों का चयन आमतौर पर दो चरणों में किया जाता है:

  1. परिणाम और उस पर महत्वपूर्ण प्रभाव डालने वाले कारकों की श्रेणी के बीच संबंधों का सैद्धांतिक विश्लेषण;
  2. परिणाम के साथ कारकों के संबंध का मात्रात्मक मूल्यांकन। सुविधाओं के बीच संबंध के एक रैखिक रूप के साथ, यह चरण सहसंबंध मैट्रिक्स (युग्मित रैखिक सहसंबंध गुणांक का मैट्रिक्स) के विश्लेषण के लिए कम हो गया है। इस प्रकार की समस्याओं का वैज्ञानिक रूप से प्रमाणित समाधान भी किसकी सहायता से किया जाता है? भिन्नता का विश्लेषण- एकल-कारक, यदि विचाराधीन गुण पर एक या दूसरे कारक के प्रभाव के महत्व की जाँच की जाती है, या उस पर कारकों के संयोजन के प्रभाव का अध्ययन करने के मामले में बहु-तथ्यात्मक।
एकाधिक प्रतिगमन में शामिल कारकों को निम्नलिखित आवश्यकताओं को पूरा करना चाहिए:
  1. उन्हें मात्रात्मक होना चाहिए। यदि मॉडल में गुणात्मक कारक शामिल करना आवश्यक है जिसमें मात्रात्मक माप नहीं है, तो इसे मात्रात्मक निश्चितता दी जानी चाहिए।
  2. प्रत्येक कारक को परिणाम से पर्याप्त रूप से निकटता से संबंधित होना चाहिए (यानी, कारक और परिणाम के बीच जोड़ीदार रैखिक सहसंबंध गुणांक महत्वपूर्ण होना चाहिए)।
  3. कारकों को एक दूसरे के साथ अत्यधिक सहसंबद्ध नहीं होना चाहिए, सख्त कार्यात्मक संबंध में तो बहुत कम होना चाहिए (अर्थात उन्हें परस्पर संबंधित नहीं होना चाहिए)। एक प्रकार का परस्पर संबंधित कारक बहुसंस्कृति है - कारकों के बीच एक करीबी रैखिक संबंध।

उदाहरण। 2 व्याख्यात्मक चर (एकाधिक प्रतिगमन) के साथ एक प्रतिगमन मॉडल बनाएँ। सैद्धांतिक बहु प्रतिगमन समीकरण का निर्धारण करें। निर्मित मॉडल की पर्याप्तता का आकलन करें।
समाधान.
हम मूल मैट्रिक्स एक्स में एक कॉलम जोड़ते हैं, एक नया मैट्रिक्स एक्स प्राप्त करते हैं


हम देखतें है उलटा मैट्रिक्स(एक्स टी एक्स) -1
13.99 0.64 -1.3
0.64 0.1 -0.0988
-1.3 -0.0988 0.14

प्रतिगमन गुणांक के अनुमानों का सदिश बराबर है
(एक्स टी एक्स) -1 एक्स टी वाई = वाई (एक्स) =
13,99 0,64 -1,3
0,64 0,1 -0,0988
-1,3 -0,0988 0,14
*
73
563
1032,5
=
34,66
1,97
-2,45

प्रतिगमन समीकरण का अनुमान प्राप्त हुआ: Y = 34.66 + 1.97X 1 -2.45X 2
एकाधिक प्रतिगमन समीकरण के महत्व का आकलनपरिकल्पना का परीक्षण करके किया जाता है कि सामान्य जनसंख्या के डेटा से गणना की गई निर्धारण का गुणांक शून्य के बराबर है। इसे जांचने के लिए, उपयोग करें

प्रतिगमन विश्लेषण का सार: इमारत गणित का मॉडलऔर इसकी सांख्यिकीय विश्वसनीयता का निर्धारण।

बहु रेखीय प्रतिगमन विश्लेषण मॉडल का प्रकार: Y = b 0 + b 1 x i1 + ... + b j x ij + ... + b k x ik + e i जहां ई मैं- यादृच्छिक अवलोकन त्रुटियां, एक दूसरे से स्वतंत्र, शून्य माध्य और विचरण होती हैं एस.

एकाधिक प्रतिगमन का उद्देश्य: कई स्वतंत्र चर और एक आश्रित चर के बीच संबंध का विश्लेषण।

एकाधिक प्रतिगमन मापदंडों का आर्थिक अर्थ
एकाधिक प्रतिगमन गुणांक बी जेदिखाता है कि परिणामी चिन्ह औसतन कितनी मात्रा में बदलेगा यूयदि चर Xjमाप की एक इकाई द्वारा वृद्धि, अर्थात, एक मानक गुणांक है।

एकाधिक रैखिक प्रतिगमन विश्लेषण मॉडल की मैट्रिक्स प्रविष्टि:वाई = एक्सबी + ई जहां यू (एन एक्स 1)प्रभावी सुविधा के देखे गए मान ( y 1 , y 2 ,..., y n);
एक्स- आयाम का मैट्रिक्स [ एन एक्स (के+1)] देखने योग्य तर्क मान;
बी- वेक्टर - आयाम स्तंभ [ (के+1) एक्स 1] अनुमानित किए जाने वाले मॉडल के अज्ञात पैरामीटर (प्रतिगमन गुणांक);
- यादृच्छिक वेक्टर - आयाम स्तंभ (एन एक्स 1)अवलोकन त्रुटियां (अवशिष्ट)।

प्रतिगमन विश्लेषण के कार्य
प्रतिगमन विश्लेषण का मुख्य कार्य नमूना आकार का पता लगाना है एनअज्ञात प्रतिगमन गुणांक का अनुमान बी 0, बी 1 ,..., बी के. प्रतिगमन विश्लेषण का कार्य चर के लिए उपलब्ध सांख्यिकीय डेटा का उपयोग करना है एक्स मैंतथा यू:

  • अज्ञात मापदंडों का सर्वोत्तम अनुमान प्राप्त करें बी 0, बी 1 ,..., बी के;
  • सत्यापित करना सांख्यिकीय परिकल्पनामॉडल मापदंडों के बारे में;
  • जाँच करें कि क्या मॉडल सांख्यिकीय डेटा (अवलोकन डेटा के लिए मॉडल की पर्याप्तता) के साथ पर्याप्त रूप से सहमत है।

एकाधिक प्रतिगमन मॉडल के निर्माण में निम्नलिखित चरण होते हैं:

  1. कनेक्शन के रूप का चुनाव (प्रतिगमन समीकरण);
  2. चयनित समीकरण के मापदंडों का निर्धारण;
  3. समीकरण की गुणवत्ता का विश्लेषण और अनुभवजन्य डेटा के लिए समीकरण की पर्याप्तता का सत्यापन, समीकरण में सुधार।
  • एक चर के साथ एकाधिक प्रतिगमन
  • तीन चर के साथ एकाधिक प्रतिगमन

निर्देश। डेटा की मात्रा (पंक्तियों की संख्या), चर की संख्या x निर्दिष्ट करें, अगला क्लिक करें।

कारकों की संख्या (x) 1 2 3 4 5 6 7 8 9 10 पंक्तियों की संख्या
.");">

एकाधिक प्रतिगमन मॉडल खोजने के लिए समाधान का एक उदाहरण

दो चर के साथ एकाधिक प्रतिगमन

एकाधिक प्रतिगमन मॉडलफॉर्म वाई \u003d बी 0 + बी 1 एक्स 1 + बी 2 एक्स 2;
1) आप अज्ञात बी 0, बी 1, बी 2 पा सकते हैं, हम तीन अज्ञात बी 0, बी 1, बी 2 के साथ तीन-रैखिक समीकरणों की एक प्रणाली को हल करते हैं:

सिस्टम को हल करने के लिए, आप उपयोग कर सकते हैं
2) या सूत्रों का उपयोग करना


ऐसा करने के लिए, हम फॉर्म की एक तालिका बनाते हैं:

यू एक्स 1 x2 (वाई-वाई औसत) 2 (एक्स 1-एक्स 1एसआर) 2 (एक्स 2-एक्स 2एसआर) 2 (y-y sr)(x 1 -x 1sr) (y-y sr)(x 2 -x 2sr) (एक्स 1-एक्स 1एसआर)(एक्स 2-एक्स 2एसआर)

अनुभवजन्य एकाधिक प्रतिगमन गुणांक के नमूना संस्करण निम्नानुसार निर्धारित किए जा सकते हैं:

यहाँ z" jj मैट्रिक्स Z -1 =(X T X) -1 का j-वाँ विकर्ण तत्व है।

जिसमें:

जहाँ m मॉडल में व्याख्यात्मक चरों की संख्या है।
विशेष रूप से, दो व्याख्यात्मक चरों के साथ बहु समाश्रयण समीकरण Y = b 0 + b 1 X 1 + b 2 X 2 के लिए, निम्नलिखित सूत्रों का उपयोग किया जाता है:


या

या
,,.
यहाँ r 12 - व्याख्यात्मक चर X 1 और X 2 के बीच नमूना सहसंबंध गुणांक; एसबी जे - प्रतिगमन गुणांक की मानक त्रुटि; एस एकाधिक प्रतिगमन (निष्पक्ष अनुमान) की मानक त्रुटि है।
जोड़ी प्रतिगमन के साथ सादृश्य द्वारा, सैद्धांतिक बहु प्रतिगमन समीकरण के गुणांक β j (j=1,2,…,m) के बिंदु अनुमान b j का निर्धारण करने के बाद, हम गणना कर सकते हैं अंतराल अनुमाननिर्दिष्ट गुणांक।

विश्वसनीयता (1-α ) के साथ कवर करने वाला आत्मविश्वास अंतराल पैरामीटर β j के अज्ञात मान के रूप में परिभाषित किया गया है

एक्सेल में एकाधिक प्रतिगमन

एकाधिक प्रतिगमन मापदंडों को खोजने के लिए एक्सेल का उपयोग करना, फ़ंक्शन LINEST(Y;X;0;1) का उपयोग किया जाता है,
जहां वाई वाई मानों के लिए एक सरणी है
जहां एक्स एक्स मानों के लिए एक सरणी है (सभी एक्स मानों के लिए एकल सरणी के रूप में निर्दिष्ट i)

बहु समाश्रयण समीकरण के गुणांकों के सांख्यिकीय महत्व की जाँच करना

जैसा कि कई प्रतिगमन के मामले में, एम व्याख्यात्मक चर के साथ कई प्रतिगमन के गुणांक के सांख्यिकीय महत्व का परीक्षण टी-सांख्यिकी के आधार पर किया जाता है:

इस मामले में स्वतंत्रता की डिग्री की संख्या के साथ छात्र का वितरण v = n-m-1। महत्व के आवश्यक स्तर पर, टी-सांख्यिकी के देखे गए मूल्य की तुलना महत्वपूर्ण सटीक छात्र के वितरण से की जाती है।
यदि , तो संगत बहु प्रतीपगमन गुणांक के सांख्यिकीय महत्व की पुष्टि की जाती है। इसका मतलब यह है कि कारक Xj आश्रित चर Y से रैखिक रूप से संबंधित है। यदि यह स्थापित हो जाता है कि गुणांक b j महत्वहीन है, तो चर Xj को समीकरण से बाहर करने की सिफारिश की जाती है। इससे मॉडल की गुणवत्ता में महत्वपूर्ण नुकसान नहीं होगा, लेकिन यह इसे और अधिक विशिष्ट बना देगा।

इस प्रयोजन के लिए, जैसा कि कई प्रतिगमन के मामले में, निर्धारण गुणांक R 2 का उपयोग किया जाता है:

अनुपात 0 . है<=R2<=1. Чем ближе этот коэффициент к единице, тем больше уравнение множественной регрессии объясняет поведение Y.
के लिये एकाधिक प्रतिगमननिर्धारण का गुणांक व्याख्यात्मक चर की संख्या का एक गैर-घटता हुआ कार्य है। एक नए व्याख्यात्मक चर का जोड़ कभी भी R 2 के मान को कम नहीं करता है, क्योंकि प्रत्येक अनुवर्ती चर केवल उस जानकारी को जोड़ सकता है, लेकिन कम नहीं कर सकता, जो आश्रित चर के व्यवहार की व्याख्या करता है।

अनुपात को निम्नानुसार दर्शाया जा सकता है:

एम> 1 के लिए। m . के मान के रूप में


संकेतक F और R2 एक ही समय में शून्य के बराबर या बराबर नहीं हैं। यदि F = 0, तो R 2 = 0, इसलिए, Y का मान X1,X2,…,Xm से रैखिक रूप से स्वतंत्र है। F के परिकलित मान की तुलना महत्वपूर्ण Fcr से की जाती है। Fcr, आवश्यक महत्व स्तर α और स्वतंत्रता की डिग्री की संख्या v1 = m और v2 = n - m - 1 के आधार पर, फिशर वितरण के आधार पर निर्धारित किया जाता है। यदि F>Fcr, तो R 2 सांख्यिकीय रूप से महत्वपूर्ण है।

OLS एकाधिक प्रतिगमन की मान्यताओं की व्यवहार्यता की जाँच करना। कई प्रतिगमन के लिए डर्बिन-वाटसन आँकड़े

एकाधिक प्रतिगमन के गुणांकों का सांख्यिकीय महत्व और निर्धारण गुणांक का मान R 2 एक के करीब गारंटी नहीं देता है उच्च गुणवत्ताएकाधिक प्रतिगमन समीकरण। इसलिए, बहु प्रतिगमन समीकरण की गुणवत्ता की जांच करने में अगला कदम एलएसएम मान्यताओं की व्यवहार्यता की जांच करना है। इन पूर्वापेक्षाओं की असंभवता के कारण और परिणाम, प्रतिगमन मॉडल को ठीक करने के तरीकों पर बाद के अध्यायों में विचार किया जाएगा। इस खंड में, हम लोकप्रिय पर विचार करेंगे प्रतिगमन विश्लेषणडर्बिन-वाटसन सांख्यिकी।
प्रतिगमन समीकरण के सांख्यिकीय विश्लेषण में आरंभिक चरणअक्सर वे एक आधार की व्यवहार्यता की जाँच करते हैं: एक दूसरे से विचलन की सांख्यिकीय स्वतंत्रता के लिए शर्तें।

इस मामले में, पड़ोसी मात्राओं की असंबद्धता की जाँच की जाती है ई मैं, मैं = 1,2,… एन ..
विचलन के सहसंबंध का विश्लेषण करने के लिए, डर्बिन-वाटसन सांख्यिकी का उपयोग किया जाता है:

महत्वपूर्ण मूल्य d1तथा d2आवश्यक महत्व स्तर के लिए विशेष तालिकाओं के आधार पर निर्धारित किया जाता है α , अवलोकनों की संख्या एनऔर व्याख्यात्मक चर की संख्या एम.

एकाधिक प्रतिगमन में आंशिक सहसंबंध गुणांक

आंशिक सहसंबंध गुणांक (या सूचकांक) जो अन्य कारकों के स्तर के साथ कारक x i के y पर प्रभाव को मापते हैं, मानक सूत्र द्वारा निर्धारित किए जाते हैं रैखिक गुणांकसहसंबंध, अर्थात्। जोड़े yx 1, yx 2,..., x 1 x 2, x 1 x 3 और इसी तरह क्रमिक रूप से लिए जाते हैं और प्रत्येक जोड़ी के लिए सहसंबंध गुणांक पाया जाता है
एमएस एक्सेल में गणना. सहसंबंध डेटा विश्लेषण उपकरण का उपयोग करके चर के जोड़ीदार सहसंबंध गुणांक के एक मैट्रिक्स की गणना की जा सकती है। इसके लिए:
1) रन कमांड सेवा / डेटा विश्लेषण / सहसंबंध.
2) डेटा श्रेणी निर्दिष्ट करें;

बहु समाश्रयण समीकरण की समग्र गुणवत्ता की जाँच करना

इस प्रयोजन के लिए, जैसा कि कई प्रतिगमन के मामले में, निर्धारण के गुणांक का उपयोग किया जाता है R2:

उचित अनुपात 0 < =R 2 < = 1 . यह गुणांक एक के जितना करीब होता है, उतना ही अधिक प्रतिगमन समीकरण व्यवहार की व्याख्या करता है यू.
के लिये एकाधिक प्रतिगमननिर्धारण का गुणांक व्याख्यात्मक चर की संख्या का एक गैर-घटता हुआ कार्य है। एक नया व्याख्यात्मक चर जोड़ने से मूल्य कभी कम नहीं होता है R2, चूंकि प्रत्येक अनुवर्ती चर केवल पूरक हो सकता है, लेकिन किसी भी तरह से उस जानकारी को कम नहीं करता है जो आश्रित चर के व्यवहार की व्याख्या करता है।
कभी-कभी, एकता से घटाए गए अंश के अंश और हर में निष्पक्ष अनुमान प्राप्त करने के लिए निर्धारण गुणांक की गणना करते समय, स्वतंत्रता की डिग्री की संख्या के लिए एक सुधार किया जाता है, अर्थात। तथाकथित समायोजित (सही) निर्धारण का गुणांक पेश किया गया है:

अनुपात को निम्नानुसार दर्शाया जा सकता है:

एम> 1 के लिए। m . के मान के रूप में निर्धारण का समायोजित गुणांकसामान्य से अधिक धीरे-धीरे बढ़ता है यह स्पष्ट है कि केवल जब R 2 = 1 ले सकता है नकारात्मक मान.
यह साबित हो गया है कि एक नए व्याख्यात्मक चर के अतिरिक्त के साथ बढ़ता है अगर और केवल अगर इस चर के लिए मॉड्यूल टी-सांख्यिकी एक से अधिक है। इसलिए, जब तक निर्धारण का समायोजित गुणांक बढ़ता है, तब तक मॉडल में नए व्याख्यात्मक चरों को जोड़ा जाता है।
प्रतिगमन समीकरण की समग्र गुणवत्ता की जांच करने के बाद, इसका विश्लेषण करने की सिफारिश की जाती है आंकड़ों की महत्ता. इसके लिए F-सांख्यिकी का उपयोग किया जाता है:
संकेतक एफतथा R2एक ही समय में शून्य के बराबर या नहीं के बराबर। यदि एक एफ = 0, फिर आर 2 \u003d 0, इसलिए, मान यूरैखिक रूप से स्वतंत्र एक्स 1, एक्स 2,…, एक्स एमपरिकलित मूल्य एफक्रिटिकल की तुलना में एफसीआर एफसीआर, महत्व के आवश्यक स्तर के आधार पर α और स्वतंत्रता की डिग्री की संख्या वी 1 = एमतथा वी 2 \u003d एन - एम - 1, फिशर वितरण के आधार पर निर्धारित किया जाता है। यदि एक एफ > एफसीआर, फिर R2आंकड़ों की दृष्टि से महत्वपूर्ण।

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...