युग्म समाश्रयण समीकरण के गुणांक ज्ञात करना। रैखिक जोड़ी प्रतिगमन

1. मूल परिभाषाएँ और सूत्र

जोड़ी प्रतिगमन- दो चर, आदि के बीच प्रतिगमन (संबंध)। मॉडल देखें:

जहां - आश्रित चर (परिणामी संकेत);

- स्वतंत्र व्याख्यात्मक चर (साइन-फैक्टर);

मॉडल में ध्यान में नहीं रखे गए कारकों के प्रभाव सहित गड़बड़ी या स्टोकेस्टिक चर।

लगभग हर मामले में, मान में दो पद होते हैं:

प्रभावी सुविधा का वास्तविक मूल्य कहां है;

परिणामी विशेषता का सैद्धांतिक मूल्य, प्रतिगमन समीकरण के आधार पर पाया जाता है। "^" चिन्ह का अर्थ है कि चर और के बीच कोई सख्त कार्यात्मक संबंध नहीं है।

अंतर करना रैखिकतथा गैर रेखीयप्रतिगमन।

रेखीय प्रतिगमनएक सीधी रेखा के समीकरण द्वारा वर्णित है

अरेखीय प्रतिगमनदो वर्गों में विभाजित हैं:

1) प्रतिगमन, व्याख्यात्मक चर में गैर-रैखिक, लेकिन अनुमानित मापदंडों में रैखिक, उदाहरण के लिए:

विभिन्न डिग्री के बहुपद

समबाहु अतिपरवलय

2) प्रतिगमन, अनुमानित मापदंडों में गैर-रैखिक, उदाहरण के लिए:

शक्ति

प्रदर्शन

घातीय

एक युग्मित रैखिक प्रतिगमन बनाने के लिए, सहायक मात्राओं की गणना की जाती है ( - टिप्पणियों की संख्या)।

नमूना मतलब: तथा

नमूना सहप्रसरणइनके बीच में

या

सहप्रसरण- ये है संख्यात्मक विशेषतादो यादृच्छिक चर का संयुक्त वितरण।

के लिए नमूना विचरण

या

के लिए नमूना विचरण

या

नमूना विचरणमाध्य मान (परिवर्तनशीलता, परिवर्तनशीलता) के आसपास एक यादृच्छिक चर के मूल्यों के प्रसार की डिग्री की विशेषता है।

अध्ययन की गई घटनाओं के बीच संबंध की निकटता का अनुमान लगाया जाता है नमूना सहसंबंध गुणांकइनके बीच में

सहसंबंध गुणांक -1 से +1 तक भिन्न होता है। मॉडुलो से 1 के करीब, एक रैखिक कार्यात्मक के बीच और सांख्यिकीय संबंध के करीब।

यदि = 0, तो और के बीच कोई रैखिक संबंध नहीं है;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

गुणांक का एक सकारात्मक मान इंगित करता है कि सुविधाओं के बीच संबंध प्रत्यक्ष है (मूल्य वृद्धि के साथ बढ़ता है), एक नकारात्मक मान एक उलटा संबंध इंगित करता है (मूल्य वृद्धि के साथ घटता है)।

एक रैखिक प्रतिगमन का निर्माणइसके मापदंडों का अनुमान लगाने के लिए कम कर देता है और रैखिक प्रतिगमन के मापदंडों का आकलन करने के लिए शास्त्रीय दृष्टिकोण पर आधारित है तरीका कम से कम वर्गों (एमएनके)। एलएसएम ऐसे पैरामीटर अनुमान प्राप्त करना संभव बनाता है जिसके लिए सैद्धांतिक लोगों से परिणामी विशेषता के वास्तविक मूल्यों के वर्ग विचलन का योग न्यूनतम है, यानी।

रैखिक प्रतिगमन के लिए, पैरामीटर और सामान्य समीकरणों की प्रणाली से पाए जाते हैं:

सिस्टम को हल करते हुए, हम पाते हैं मेंपर

और पैरामीटर

गुणकएक कारक चर के साथ दिखाता है कि माप की प्रति इकाई कारक बदलने पर मूल्य औसतन कितना बदल जाएगा।

पैरामीटर जब 0 के बराबर नहीं हो सकता है, तो यह आर्थिक समझ में नहीं आता है। केवल अगर के संकेत की व्याख्या करना संभव है, तो परिणाम में सापेक्ष परिवर्तन कारक में परिवर्तन की तुलना में धीमा है, अर्थात। परिणाम का प्रसरण कारक के प्रसरण से कम होता है और इसके विपरीत।

निर्मित प्रतिगमन मॉडल की गुणवत्ता का आकलन करने के लिए, आप उपयोग कर सकते हैं दृढ़ संकल्प का गुणांकया औसत सन्निकटन त्रुटि.

प्रतिनिर्धारण गुणांक

या

परिणामी विशेषता के कुल विचरण में प्रतिगमन द्वारा समझाया गया विचरण का हिस्सा दिखाता है। तदनुसार, मान मॉडल और अन्य कारणों में ध्यान में नहीं रखे गए कारकों के प्रभाव के कारण संकेतक के विचरण के हिस्से को दर्शाता है।

1 के करीब, बेहतर रिग्रेशन मॉडल, यानी। निर्मित मॉडल प्रारंभिक डेटा को अच्छी तरह से अनुमानित करता है।

औसत सन्निकटन त्रुटिवास्तविक मूल्यों से सैद्धांतिक मूल्यों का औसत सापेक्ष विचलन है, अर्थात।

निर्मित प्रतिगमन समीकरण को संतोषजनक माना जाता है यदि मान 10-12% से अधिक न हो।

रैखिक प्रतिगमन के लिए लोच का औसत गुणांकसूत्र के अनुसार पाया जाता है:

लोच का औसत गुणांकदिखाता है कि जनसंख्या में औसतन कितने प्रतिशत परिणाम अपने मूल्य से बदल जाएगा जब कारक अपने मूल्य से 1% बदल जाता है।

ग्रेड एचनचिमोस्तोतथाप्रतिगमन समीकरणआमतौर पर फिशर-टेस्ट का उपयोग करके दिया जाता है, जिसमें प्रतिगमन समीकरण के सांख्यिकीय महत्व की परिकल्पना का परीक्षण होता है . यह तुलना करके किया जाता है वास्तविकआकाशतथा नाजुक(तालिका) मान - फिशर का मानदंड .

स्वतंत्रता की एक डिग्री के लिए गणना किए गए कारक और अवशिष्ट भिन्नताओं के मूल्यों के अनुपात से निर्धारित किया जाता है, अर्थात।

- स्वतंत्रता की डिग्री के साथ यादृच्छिक कारकों के प्रभाव में मानदंड का अधिकतम संभव मूल्य = 1, = -2 और महत्व स्तर फिशर मानदंड तालिका (परिशिष्ट की तालिका 1) से पाया जाता है।

सार्थक तल- एक सही परिकल्पना को खारिज करने की संभावना है, यह देखते हुए कि यह सच है।

यदि एक तब अध्ययन किए गए संकेतक और कारक के बीच संबंध की अनुपस्थिति के बारे में परिकल्पना को खारिज कर दिया जाता है और महत्व के स्तर के साथ इस संबंध के महत्व के बारे में एक निष्कर्ष निकाला जाता है (यानी, प्रतिगमन समीकरण महत्वपूर्ण है)।

यदि एक तब परिकल्पना को स्वीकार किया जाता है और प्रतिगमन समीकरण के सांख्यिकीय महत्व और अविश्वसनीयता को मान्यता दी जाती है।

रैखिक प्रतिगमन के लिए महत्वप्रतिगमन गुणांकके साथ मूल्यांकन किया गया - विद्यार्थी का मानदंड, जिसके अनुसार संकेतकों की यादृच्छिक प्रकृति के बारे में एक परिकल्पना सामने रखी जाती है, अर्थात। शून्य से उनके महत्वहीन अंतर के बारे में। अगला, मानदंड के वास्तविक मूल्यों की गणना प्रत्येक अनुमानित प्रतिगमन गुणांक के लिए की जाती है, अर्थात।

और कहां - मानक त्रुटियांरैखिक प्रतिगमन पैरामीटर सूत्रों द्वारा निर्धारित किए जाते हैं:

- स्वतंत्रता की दी गई डिग्री के लिए यादृच्छिक कारकों के प्रभाव में छात्र की कसौटी का अधिकतम संभव मूल्य = -2 और महत्व स्तर छात्र की मानदंड तालिका (परिशिष्ट की तालिका 2) से पाया जाता है।

यदि एक तो प्रतिगमन गुणांक के महत्व के बारे में परिकल्पना को महत्व के स्तर के साथ खारिज कर दिया जाता है यानी। गुणांक (या) गलती से शून्य से भिन्न नहीं होता है और एक व्यवस्थित रूप से अभिनय कारक के प्रभाव में बनता है

यदि एक तब परिकल्पना को अस्वीकार नहीं किया जाता है और पैरामीटर के गठन की यादृच्छिक प्रकृति को मान्यता दी जाती है।

महत्व रैखिक गुणांकसहसम्बन्धके साथ भी चेक किया गया - छात्र की कसौटी, यानी।

सहसंबंध गुणांक की महत्वहीनता की परिकल्पना को महत्व के स्तर के साथ खारिज कर दिया जाता है यदि

टिप्पणी।रैखिक जोड़ीदार प्रतिगमन के लिए, गुणांक और सहसंबंध गुणांक के महत्व के बारे में परिकल्पना का परीक्षण समग्र रूप से प्रतिगमन समीकरण के महत्व के बारे में परिकल्पना का परीक्षण करने के बराबर है, अर्थात।

गणना के लिए विश्वास अंतरालपरिभाषित करना सीमांत त्रुटि प्रत्येक संकेतक के लिए, अर्थात्।

विश्वास अंतरालरैखिक प्रतिगमन गुणांक के लिए:

यदि शून्य विश्वास अंतराल की सीमाओं के भीतर आता है, अर्थात निचली सीमा नकारात्मक है, और ऊपरी सीमा सकारात्मक है, तो अनुमानित पैरामीटर शून्य माना जाता है, क्योंकि यह एक ही समय में सकारात्मक और नकारात्मक दोनों मूल्यों को नहीं ले सकता है।

पूर्वानुमान मूल्यप्रतिगमन समीकरण में संबंधित भविष्य कहनेवाला मूल्य को प्रतिस्थापित करके निर्धारित किया जाता है, फिर इसकी गणना की जाती है पूर्वानुमान की औसत मानक त्रुटि

कहाँ पे

और बनाया जा रहा है पूर्वानुमान विश्वास अंतराल

अवलोकनों की छोटी मात्रा के कारण अंतराल काफी चौड़ा हो सकता है।

प्रतिगमन, शामिल चर में गैर-रैखिक , चर के एक साधारण परिवर्तन द्वारा एक रैखिक रूप में कम कर दिया जाता है, और मापदंडों का आगे का अनुमान कम से कम वर्ग विधि का उपयोग करके किया जाता है।

जीहाइपरबॉलical प्रतिगमन:

आर बहिर्मुखता , गैर रेखीय अनुमानित मापदंडों के अनुसार दो प्रकारों में विभाजित हैं: आंतरिक रूप से गैर-रैखिकआदि। (एक रैखिक रूप में कम नहीं) और आंतरिक रूप से रैखिक(उपयुक्त परिवर्तनों का उपयोग करके एक रैखिक रूप में घटाया गया), उदाहरण के लिए:

घातीय प्रतिगमन:

रैखिक परिवर्तन:

शक्ति प्रतिगमन:

रैखिक परिवर्तन:

अनुक्रमणिकानया प्रतिगमन:

रैखिक परिवर्तन:

लघुगणकवां प्रतिगमन:

रैखिक परिवर्तन:

2. विशिष्ट समस्याओं का समाधान

उदाहरण9 .1 . 15 कृषि उद्यमों (तालिका 9.1) के लिए, निम्नलिखित ज्ञात हैं: - बोए गए क्षेत्र (इकाइयों / हेक्टेयर) की प्रति इकाई उपकरणों की संख्या और - उगाए गए उत्पादों की मात्रा (हजार डेन। इकाइयां)। ज़रूरी:

1) पर निर्भरता निर्धारित करें

2) सहसंबंध क्षेत्रों को प्लॉट करें और रैखिक प्रतिगमन समीकरण को पर प्लॉट करें

3) मॉडल की गुणवत्ता के बारे में निष्कर्ष निकालें और औसत स्तर के 112% के अनुमानित मूल्य के साथ अनुमानित मूल्य की गणना करें।

तालिका 9.1

समाधान:

1) एक्सेल में, हम एक सहायक तालिका 9.2 संकलित करेंगे।

तालिका 9.2

चावल।9 ।एक। मध्यवर्ती मूल्यों की गणना के लिए तालिका

माप की संख्या की गणना करें ऐसा करने के लिए, एक सेल में बी19डाल = COUNT(A2:A16 ) .

टूलबार पर (ऑटोसम) फ़ंक्शन का उपयोग करना मानक टी नया सभी का योग ज्ञात करें (सेल .) बी17) और (सेल .) सी17).

चावल। 9.2. मूल्यों और औसत के योग की गणना

औसत मूल्यों की गणना करने के लिए, हम अंतर्निहित MS Excel AVERAGE () फ़ंक्शन का उपयोग करते हैं, औसत निर्धारित करने के लिए मानों की श्रेणी को कोष्ठक में दर्शाया गया है। इस प्रकार, 15 खेतों के लिए उगाए गए उत्पादों की औसत मात्रा 210.833 हजार डेन है। इकाइयाँ, और वाहनों की औसत संख्या 6.248 इकाई / हेक्टेयर है।

कॉलम भरने के लिए डी, , एफउत्पाद की गणना के लिए सूत्र दर्ज करें: सेल में डी2 डाल = बी2*सी2, फिर कीबोर्ड पर ENTER दबाएँ। सेल पर बायाँ-क्लिक करें डी2 और, इस सेल के निचले दाएं कोने (ब्लैक प्लस) को पकड़कर, सेल तक नीचे खींचें डी16 . रेंज अपने आप भर जाएगी। डी3 - डी16 .

गणना के लिए चयनात्मकओह कॉन्वर्सिसके बीच और सूत्र का उपयोग करें अर्थात। एक सेल में बी21 डाल = डी18- बी18* सी18 और 418.055 प्राप्त करें (चित्र 9.3)।

चावल।9 .3. गणना

चयनात्मकबहुत खूबफैलावयूसूत्र द्वारा खोजने के लिए इसके लिए एक सेल में बी22 डाल = E18-B18^2 (^ - घातांक का संकेत देने वाला चिन्ह ) और 11.337 प्राप्त करें। इसी तरह, हम निर्धारित करते हैं \u003d 16745.05556 (चित्र। 9.4)

चावल।9 ।चार। गणनावर(एक्स) तथावर (आप)

इसके अलावा, मानक एमएस एक्सेल फ़ंक्शन "CORREL" का उपयोग करते हुए, हम अपने कार्य के लिए रैखिक सहसंबंध गुणांक के मान की गणना करते हैं, फ़ंक्शन "=CORREL(B2:B16;C2:C16)" जैसा दिखेगा, और मान rxy=0.96 . सहसंबंध गुणांक का प्राप्त मूल्य उपकरण की उपलब्धता और उगाए गए उत्पादों की मात्रा के बीच एक सीधा और मजबूत संबंध दर्शाता है।

हम देखतें है मेंरैखिक प्रतिगमन नमूना गुणांक =36.87; पैरामीटर = -17.78। तो, युग्मित रैखिक समाश्रयण समीकरण = -17.78 + 36.87 . जैसा दिखता है

गुणांक से पता चलता है कि उपकरणों की संख्या में 1 यूनिट / हेक्टेयर की वृद्धि के साथ, उगाए गए उत्पादों की मात्रा औसतन 36.875 हजार डेन बढ़ जाएगी। इकाइयों (चित्र 9.5)

चावल।9 .5. प्रतिगमन समीकरण के मापदंडों की गणना।

इस प्रकार, प्रतिगमन समीकरण इस तरह दिखेगा:।

हम वास्तविक मानों को परिणामी समीकरण में प्रतिस्थापित करते हैं एक्स(उपकरणों की संख्या) हम उगाए गए उत्पादों की मात्रा के सैद्धांतिक मूल्यों को पाते हैं (चित्र। 9.6)।

चावल।9 .6. विकसित उत्पादों की मात्रा के सैद्धांतिक मूल्यों की गणना

का उपयोग करते हुए चार्ट विज़ार्डहम सहसंबंध फ़ील्ड (कॉलम और मानों को हाइलाइट करना) और एक रेखीय प्रतिगमन समीकरण (कॉलम और मानों को हाइलाइट करना) का निर्माण करते हैं। चार्ट का प्रकार चुनें - टी तमाशा परिणामी आरेख में, आवश्यक पैरामीटर भरें (शीर्षक, कुल्हाड़ियों के लिए लेबल, किंवदंती, आदि)। नतीजतन, हमें अंजीर में दिखाया गया ग्राफ मिलता है। 9.7.

चावल।9 .7. उपकरणों की संख्या पर उगाए गए उत्पादों की मात्रा की निर्भरता का ग्राफ

निर्मित प्रतिगमन मॉडल की गुणवत्ता का आकलन करने के लिए, हम गणना करते हैं:

. प्रतिनिर्धारण गुणांक\u003d 0.92, जो दर्शाता है कि निर्मित उत्पादों की मात्रा में परिवर्तन के कारण उत्पादन लागत में परिवर्तन 92% है, और 8% मॉडल में ध्यान में नहीं रखे गए कारकों की हिस्सेदारी पर पड़ता है, जो निर्माण की गुणवत्ता को इंगित करता है प्रतिगमन मॉडल;

. साथरेड्नोयुयुगलतीपरअनुमान. इसके लिए कॉलम में एचकॉलम में वास्तविक और सैद्धांतिक मूल्यों के बीच अंतर की गणना करें मैं- अभिव्यक्ति । कृपया ध्यान दें कि मानक एमएस एक्सेल "एबीएस" फ़ंक्शन का उपयोग मॉड्यूलो मान की गणना के लिए किया जाता है। औसत मूल्य (सेल .) को गुणा करते समय मैं18 ) 100% पर हमें 18.2% मिलता है। नतीजतन, औसतन, सैद्धांतिक मूल्य वास्तविक से 18.2% (चित्र। 1.8) से विचलित हो जाते हैं।

फिशर-मानदंड की सहायता से, हम अनुमान लगाते हैं एचनचिमोस्तोबीसमीकरणregreसाथये आम तौर पर: 150,74.

0.05 = 4.67 के महत्व स्तर पर, हम अंतर्निहित सांख्यिकीय फ़ंक्शन का उपयोग करके निर्धारित करते हैं एफडीआईएसपी(चित्र। 1.9)। उसी समय, यह याद रखना चाहिए कि "डिग्री_ऑफ_फ्रीडम 1" हर है, और "डिग्री_ऑफ_फ्रीडम 2" अंश है, जहां प्रतिगमन समीकरण में मापदंडों की संख्या है (हमारे पास 2 है), एन- मूल्यों के प्रारंभिक जोड़े की संख्या (हमारे पास 15 है)।

इसलिये तब समाश्रयण समीकरण = 0.05 पर सार्थक होता है।

चावल।9 .8. निर्धारण के गुणांक का निर्धारण औरऔसत त्रुटिअनुमान

चावल। 9 . 9 . डायलॉग विंडोकार्योंएफडीआईएसपी

अगला, हम परिभाषित करते हैं साथलोच का मध्यम गुणांकसूत्र के अनुसार। पाया गया कि विनिर्मित उत्पादों की मात्रा में 1% की वृद्धि के साथ, इन उत्पादों के उत्पादन की लागत में कुल मिलाकर औसतन 1.093% की वृद्धि होगी।

गणना पूर्वानुमान मूल्यप्रतीपगमन समीकरण =-19.559+36.8746 में कारक =1.12=6.248*1.12=6.9978 के अनुमानित मान को प्रतिस्थापित करके। हमें = 238.48 प्राप्त होता है। फलस्वरूप 6.9978 इकाई/हेक्टेयर की मात्रा में उपकरणों की संख्या के साथ उत्पादन की मात्रा 238.48 हजार डेन होगी। इकाइयों

अवशिष्ट विचरण ज्ञात कीजिए, इसके लिए हम वास्तविक और सैद्धांतिक मूल्यों के बीच के अंतर के वर्गों के योग की गणना करते हैं। =39.166 निम्नलिखित सूत्र रखने पर = रूट (J17/(B19-2))एक सेल में एच2 1 (चित्र 9.10)।

चावल।9 ।दस। अवशिष्ट विचरण का निर्धारण

सेरेड्नोफिरमानकवें त्रुटिभविष्यवाणी:

महत्व स्तर पर = 0.05 अंतर्निहित सांख्यिकीय फ़ंक्शन का उपयोग करके स्टुद्रस्पोब्रहम =2.1604 को परिभाषित करते हैं और सीमांत पूर्वानुमान त्रुटि की गणना करते हैं, जो 95% मामलों में अधिक नहीं होगी .

डीपूर्वानुमान विश्वास अंतराल:

या .

उत्पादन लागत का पूर्वानुमान विश्वसनीय (1-0.05 = 0.95) निकला, लेकिन गलत, क्योंकि विश्वास अंतराल की ऊपरी और निचली सीमाओं की सीमा है बार। यह टिप्पणियों की छोटी मात्रा के कारण हुआ।

यह रद्द किया जाना चाहिए कि एमएस एक्सेल में अंतर्निहित सांख्यिकीय कार्य हैं जो मध्यवर्ती गणनाओं की संख्या को काफी कम कर सकते हैं, उदाहरण के लिए (चित्र। 9.11।):

हिसाब करना मेंचयनात्मकएक्सऔसतएक्सफ़ंक्शन का उपयोग करें औसत (संख्या 1: संख्या .)एन) श्रेणी . से सांख्यिकीय .

नमूना सहप्रसरणके बीच और फ़ंक्शन का उपयोग करके पाया जाता है COVAR(सरणीएक्ससरणीयू) श्रेणी . से सांख्यिकीय .

चयनात्मकएसफैलावतथासांख्यिकीय कार्य द्वारा निर्धारित वीएआरपी (संख्या 1: संख्या .)एन) .

चावल।9 ।ग्यारह। कंप्यूटिंग नंबरसंकेतक अंतर्निहित कार्यएमएसएक्सेल

पीपैरामीटरएसरेखीय प्रतिगमनएक्सेल में कई तरह से परिभाषित किया जा सकता है।

1 मार्ग) अंतर्निहित फ़ंक्शन के साथ लाइनस्ट. प्रक्रिया निम्नलिखित है:

1. परिणाम प्रदर्शित करने के लिए खाली कक्षों 5x2 (5 पंक्तियों, 2 स्तंभों) के एक क्षेत्र का चयन करें प्रतिगमन आँकड़ेया क्षेत्र 1x2 - केवल प्रतिगमन गुणांक प्राप्त करने के लिए।

2. उपयोग करना फंक्शन विजार्ड्सके बीच सांख्यिकीय समारोह का चयन करें लाइनस्टऔर इसके तर्कों को भरें (चित्र 9.12):

चावल। 9 . 12 . फ़ंक्शन तर्क प्रविष्टि संवाद बॉक्सलाइनस्ट

ज्ञात_मान_आप

ज्ञात_मान_एक्स

कॉन्स्टो- एक तार्किक मान (1 या 0), जो समीकरण में एक मुक्त पद की उपस्थिति या अनुपस्थिति को इंगित करता है; 1 डाल;

आंकड़े- बूलियन मान (1 या 0) जो इंगित करता है कि प्रतिगमन विश्लेषण पर अतिरिक्त जानकारी प्रदर्शित करना है या नहीं; डाल 1.

3. तालिका की पहली संख्या चयनित क्षेत्र के ऊपरी बाएँ कक्ष में दिखाई देगी। संपूर्ण तालिका खोलने के लिए बटन दबाएं। < एफ2> , और फिर - कुंजी संयोजन पर < CTRL> + < खिसक जाना> + < प्रवेश करना> .

अतिरिक्त समाश्रयण आँकड़े प्रपत्र में प्रदर्शित किए जाएंगे (तालिका 9.3):

तालिका 9.3

गुणांक मूल्य

गुणांक मूल्य

आरएमएस
विचलन

आरएमएस
विचलन

गुणक
निर्धारण

आरएमएस
विचलन

आंकड़े

स्वतंत्रता की डिग्री की संख्या

वर्गों का प्रतिगमन योग

वर्गों का अवशिष्ट योग

फ़ंक्शन को लागू करने के परिणामस्वरूप लाइनस्टहम पाते हैं:

( 2 मार्ग) डेटा विश्लेषण उपकरण का उपयोग करना वापसी आप प्रतिगमन आँकड़ों के परिणाम प्राप्त कर सकते हैं, भिन्नता का विश्लेषण, कॉन्फिडेंस इंटरवल्स, रेसिडुअल्स, रिग्रेशन फिटिंग प्लॉट्स, रेसिडुअल प्लॉट्स, और नॉर्मल प्रोबेबिलिटी प्लॉट्स। प्रक्रिया निम्नलिखित है:

1. आपको पहुंच की जांच करने की आवश्यकता है विश्लेषण पैकेज. ऐसा करने के लिए, मुख्य मेनू में (एमएस एक्सेल विकल्पों तक पहुंचने के लिए माइक्रोसॉफ्ट ऑफिस बटन के माध्यम से) "विकल्प" में एमएसएक्सेल» "ऐड-ऑन" कमांड चुनें और दाईं ओर ऐड-ऑन चुनें पैकेज विश्लेषण एक फिर "गो" बटन पर क्लिक करें (चित्र 9.13)। खुलने वाले संवाद बॉक्स में, "विश्लेषण पैकेज" के बगल में स्थित बॉक्स को चेक करें और "ओके" पर क्लिक करें (चित्र 9.14)।

"विश्लेषण" समूह में "डेटा" टैब पर, आपके पास इंस्टॉल किए गए ऐड-इन तक पहुंच होगी। (चित्र। 9.15)।

चावल।9 .13. ऐड-ऑन सक्षम करेंएमएसएक्सेल

चावल।9 ।चौदह। ऐड-इन्स डायलॉग बॉक्स

चावल।9 .15. रिबन पर डेटा विश्लेषण ऐड-इनएमएसएक्सेल 2007 .

2. "विश्लेषण" समूह में "डेटा" पर चयन करें, कमांड का चयन करें विश्लेषण हाँ एन निह खुलने वाले डायलॉग बॉक्स में, "रिग्रेशन" विश्लेषण टूल चुनें और "ओके" पर क्लिक करें (चित्र 9.16):

चावल।9 .16. डेटा विश्लेषण संवाद बॉक्स

दिखाई देने वाले संवाद बॉक्स में (चित्र 9.17), फ़ील्ड भरें:

इनपुट अंतरालयू- प्रभावी विशेषता Y के डेटा वाली श्रेणी;

इनपुट अंतरालएक्स- व्याख्यात्मक विशेषता X के डेटा वाली श्रेणी;

टैग- एक ध्वज जो इंगित करता है कि पहली पंक्ति में स्तंभों के नाम हैं या नहीं;

कॉन्स्टोचींटी शून्य- समीकरण में एक मुक्त पद की उपस्थिति या अनुपस्थिति का संकेत देने वाला ध्वज;

आउटपुट अंतराल- यह भविष्य की सीमा के ऊपरी बाएँ सेल को इंगित करने के लिए पर्याप्त है;

नई कार्यपत्रक- आप नई शीट के लिए मनमाना नाम सेट कर सकते हैं जिस पर परिणाम प्रदर्शित होंगे।

चावल।9 .17. रिग्रेशन डायलॉग बॉक्स

अवशिष्ट जानकारी, अवशिष्ट भूखंड, फिटिंग और सामान्य संभावना के लिए, संवाद बॉक्स में उपयुक्त चेकबॉक्स का चयन करें।

चावल। 9 . 18 . उपकरण लागू करने के परिणामवापसी

पर एमएसएक्सेल प्रवृत्ति रेखाबार चार्ट या लाइन चार्ट में जोड़ा जा सकता है। इसके लिए:

1. चार्ट निर्माण क्षेत्र का चयन करना और रिबन में "लेआउट" का चयन करना और विश्लेषण समूह में "ट्रेंड लाइन" कमांड का चयन करना आवश्यक है (चित्र। 9.19।)। ड्रॉप-डाउन मेनू आइटम में, "उन्नत ट्रेंडलाइन विकल्प" चुनें।

चावल। 1.19.फीता

2. दिखाई देने वाले डायलॉग बॉक्स में, वास्तविक मानों का चयन करें, फिर "ट्रेंड लाइन फॉर्मेट" डायलॉग बॉक्स (चित्र 9.20.) खुलेगा जिसमें ट्रेंड लाइन प्रकार का चयन किया जाता है और उपयुक्त पैरामीटर सेट किए जाते हैं।

चावल। 9 . 20 . डायलॉग विंडो"ट्रेंड लाइन प्रारूप"

बहुपद प्रवृत्ति के लिए, आपको अनुमानित बहुपद की डिग्री, रैखिक फ़िल्टरिंग के लिए, औसत बिंदुओं की संख्या निर्दिष्ट करनी होगी।

चुनना रैखिकएक रैखिक प्रतिगमन समीकरण बनाने के लिए।

जैसा अतिरिक्त जानकारीकर सकते हैं di . पर समीकरण दिखाओएकचनातथा आरेख पर एक मान डालें(अंजीर.9.21)।

चावल। 9 . 21 . रैखिक प्रवृत्ति

नॉनलाइनियर रिग्रेशन मॉडल एक्सेल में चयनित सांख्यिकीय फ़ंक्शन का उपयोग करके समीकरण के मापदंडों की गणना करते समय सचित्र हैं लीGRFPRIBL. गणना प्रक्रिया LINEST फ़ंक्शन का उपयोग करने के समान है।

अपने अच्छे काम को नॉलेज बेस में भेजें सरल है। नीचे दिए गए फॉर्म का प्रयोग करें

अच्छा कामसाइट पर">

छात्र, स्नातक छात्र, युवा वैज्ञानिक जो अपने अध्ययन और कार्य में ज्ञान के आधार का उपयोग करते हैं, वे आपके बहुत आभारी रहेंगे।

प्रकाशित किया गया एचटीटीपी:// www. सब अच्छा. एन/

रूसी संघ के शिक्षा और विज्ञान मंत्रालय

संघीय राज्य बजटीय शैक्षिक संस्थाउच्च शिक्षा

"कोम्सोमोल्स्क-ऑन-अमूर राज्य तकनीकी विश्वविद्यालय"

अर्थशास्त्र और प्रबंधन के संकाय

अर्थशास्त्र, वित्त और लेखा विभाग

गणना और ग्राफिक कार्य

अनुशासन में "अर्थमिति"

समूह छात्र

ए.यू. ज़ैचेंको

शिक्षक

आई.आई. एंटोनोवा

तालिका एक

क्षेत्र संख्या

औसत प्रति व्यक्ति निर्वाह न्यूनतम प्रति दिन एक सक्षम व्यक्ति के लिए, रगड़।

औसत दैनिक वेतन, रगड़।,

आवश्यक:

1. से एक रैखिक युग्म समाश्रयण समीकरण बनाएँ।

3. फिशर के टी-टेस्ट और स्टूडेंट के टी-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध मापदंडों के सांख्यिकीय महत्व का आकलन करें।

4. भविष्यवाणी चलाएँ वेतनऔसत प्रति व्यक्ति निर्वाह न्यूनतम के अनुमानित मूल्य के साथ, जो औसत स्तर का 107% है।

5. पूर्वानुमान त्रुटि और उसके विश्वास अंतराल की गणना करके पूर्वानुमान की सटीकता का आकलन करें।

6. एक ग्राफ़ पर प्रारंभिक डेटा और सैद्धांतिक रेखा खींचिए।

1. रैखिक प्रतिगमन समीकरण के मापदंडों की गणना करने के लिए, हम एक गणना तालिका 2 बनाते हैं। रैखिक सहसंबंधसन्निकटन प्रतिगमन

तालिका 2

अर्थ

प्राप्त प्रतिगमन समीकरण:

प्रति व्यक्ति निर्वाह में न्यूनतम 1 रगड़ की वृद्धि के साथ। औसत दैनिक वेतन में औसतन 0.89 रूबल की वृद्धि होती है।

2. सहसंबंध गुणांक द्वारा रैखिक संबंध की जकड़न का अनुमान लगाया जाएगा:

इसका मतलब यह है कि मजदूरी () में भिन्नता का 51% कारक की भिन्नता द्वारा समझाया गया है - औसत प्रति व्यक्ति निर्वाह न्यूनतम।

मॉडल की गुणवत्ता औसत सन्निकटन त्रुटि से निर्धारित होती है:

निर्मित मॉडल की गुणवत्ता का मूल्यांकन अच्छे के रूप में किया जाता है, क्योंकि यह 8-10% से अधिक नहीं होता है।

3. समग्र रूप से, हम फिशर-मानदंड का उपयोग करके प्रतिगमन समीकरण के महत्व का मूल्यांकन करेंगे। वास्तविक मूल्य -मानदंड:

पांच प्रतिशत महत्व स्तर और स्वतंत्रता की डिग्री पर मानदंड का सारणीबद्ध मूल्य है। चूंकि प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण माना जाता है।

आकलन आंकड़ों की महत्ताप्रतिगमन मापदंडों को छात्र के आँकड़ों का उपयोग करके और प्रत्येक संकेतक के लिए आत्मविश्वास अंतराल की गणना करके किया जाएगा।

स्वतंत्रता की डिग्री की संख्या के लिए मानदंड का सारणीबद्ध मूल्य और होगा।

आइए यादृच्छिक त्रुटियों को परिभाषित करें:

-आँकड़े का वास्तविक मान तालिका मान से अधिक है:

इसलिए, पैरामीटर और शून्य से यादृच्छिक रूप से भिन्न नहीं हैं, लेकिन सांख्यिकीय रूप से महत्वपूर्ण हैं। आइए प्रतिगमन मापदंडों के लिए विश्वास अंतराल की गणना करें और। ऐसा करने के लिए, हम प्रत्येक संकेतक के लिए सीमांत त्रुटि को परिभाषित करते हैं:

विश्वास अंतराल:

विश्वास अंतराल की ऊपरी और निचली सीमाओं के विश्लेषण से यह निष्कर्ष निकलता है कि, एक संभावना के साथ, पैरामीटर और, निर्दिष्ट सीमाओं के भीतर होने के कारण, शून्य मान नहीं लेते हैं, अर्थात। सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं और शून्य से काफी भिन्न हैं।

4. प्रतिगमन समीकरण के प्राप्त अनुमान हमें इसे पूर्वानुमान के लिए उपयोग करने की अनुमति देते हैं। यदि निर्वाह का पूर्वानुमान मूल्य न्यूनतम है:

तब मजदूरी का पूर्वानुमान मूल्य होगा:

पूर्वानुमान त्रुटि होगी:

सीमांत पूर्वानुमान त्रुटि, जो मामलों में पार नहीं की जाएगी, होगी:

पूर्वानुमान विश्वास अंतराल:

औसत मासिक वेतन का पूरा पूर्वानुमान विश्वसनीय () है और 131.66 रूबल की सीमा में है। 190.62 रूबल तक। अंत में, हम एक ही ग्राफ पर प्रारंभिक डेटा और सैद्धांतिक सीधी रेखा को प्लॉट करेंगे (चित्र 1)

चित्र 1

Allbest.ru . पर होस्ट किया गया

इसी तरह के दस्तावेज़

    इमारत रेखीय समीकरणजोड़ी प्रतिगमन, जोड़ी सहसंबंध के रैखिक गुणांक की गणना और औसत सन्निकटन त्रुटि। सहसंबंध गुणांक और लोच का निर्धारण, सहसंबंध सूचकांक, अर्थमिति में फिशर मानदंड के आवेदन का सार।

    परीक्षण, जोड़ा गया 05/05/2010

    युग्मित रैखिक प्रतिगमन के मापदंडों की गणना। फिशर और छात्र के परीक्षणों का उपयोग करते हुए प्रतिगमन समीकरण और उसके मापदंडों के सांख्यिकीय महत्व का मूल्यांकन। युग्मित सहसंबंध गुणांकों के एक मैट्रिक्स का निर्माण। सांख्यिकीय विश्लेषणपीपीपी एमएस एक्सेल का उपयोग करना।

    परीक्षण, जोड़ा गया 05/14/2008

    जोड़ी और आंशिक सहसंबंध के रैखिक गुणांक की गणना। प्रतिगमन और सहसंबंध मापदंडों का सांख्यिकीय महत्व। सहसंबंध डेटा क्षेत्र का विश्लेषण। पूर्वानुमान सटीकता, त्रुटि गणना और विश्वास अंतराल। एकाधिक निर्धारण गुणांक।

    नियंत्रण कार्य, जोड़ा गया 12/11/2010

    प्रतिगमन गुणांक की आर्थिक व्याख्या। वर्गों का अवशिष्ट योग ज्ञात करना और अवशिष्टों के प्रसरण का अनुमान लगाना। छात्र के टी-टेस्ट का उपयोग करके प्रतिगमन समीकरण के मापदंडों के महत्व की जाँच करना। औसत की गणना रिश्तेदारों की गलतीसन्निकटन।

    परीक्षण, जोड़ा गया 03/23/2010

    प्रतिगमन गुणांक के लिए एक विश्वास अंतराल का निर्माण। सन्निकटन त्रुटि का निर्धारण, सहसंबंध सूचकांक और फिशर का एफ-परीक्षण। उत्पादों की भौतिक खपत में परिवर्तन की लोच का मूल्यांकन। एक रेखीय बहु समाश्रयण समीकरण का निर्माण।

    परीक्षण, जोड़ा गया 04/11/2015

    रैखिक प्रतिगमन समीकरण के मापदंडों की गणना, सहसंबंध और निर्धारण के संकेतकों का उपयोग करके संबंधों की जकड़न का आकलन। औसत सन्निकटन त्रुटि का निर्धारण। फिशर के एफ-टेस्ट और स्टूडेंट के टी-टेस्ट का उपयोग करके मॉडलिंग की सांख्यिकीय विश्वसनीयता।

    परीक्षण, 10/17/2009 जोड़ा गया

    एक फर-असर वाले जानवर के द्रव्यमान की उसकी उम्र पर मात्रात्मक निर्भरता का निर्धारण। एक युग्मित प्रतिगमन समीकरण का निर्माण, इसके मापदंडों की गणना और पर्याप्तता का सत्यापन। प्रतिगमन मापदंडों के सांख्यिकीय महत्व का मूल्यांकन, उनके विश्वास अंतराल की गणना।

    प्रयोगशाला कार्य, जोड़ा गया 06/02/2014

    रूसी संघ के यूराल और पश्चिम साइबेरियाई क्षेत्रों में प्रति व्यक्ति नकद आय और उपभोक्ता खर्च के बीच संबंध के रूप के बारे में एक परिकल्पना का निर्माण। जोड़ी प्रतिगमन समीकरणों के मापदंडों की गणना, औसत सन्निकटन त्रुटि का उपयोग करके उनकी गुणवत्ता का मूल्यांकन।

    परीक्षण, जोड़ा गया 11/05/2014

    रैखिक प्रतिगमन मापदंडों के आकलन के लिए एक विधि के रूप में जोड़ी प्रतिगमन के लिए कम से कम वर्ग विधि का विश्लेषण। जोड़ी प्रतिगमन के रैखिक समीकरण पर विचार। एकाधिक रैखिक प्रतिगमन अध्ययन। प्रतिगमन गुणांक की त्रुटियों का अध्ययन करना।

    परीक्षण, जोड़ा गया 03/28/2018

    सहसंबंध क्षेत्र का निर्माण। युग्मित प्रतिगमन समीकरणों के मापदंडों की गणना। कुछ कारकों पर औसत जीवन प्रत्याशा की निर्भरता। "फिशर की कसौटी" का अध्ययन। सहसंबंध और निर्धारण के संकेतकों का उपयोग करके कनेक्शन की जकड़न का मूल्यांकन।

जोड़ी प्रतिगमन समीकरण.

सहसंबंध क्षेत्र के आधार पर, कोई (सामान्य आबादी के लिए) परिकल्पना कर सकता है कि एक्स और वाई के सभी संभावित मूल्यों के बीच संबंध रैखिक है।

रैखिक समाश्रयण समीकरण y = bx + a + . है

सामान्य समीकरणों की प्रणाली।

a n + b∑x = y

a∑x + b∑x 2 = y x

हमारे डेटा के लिए, समीकरणों की प्रणाली का रूप है

12ए + 1042 बी = 1709

1042 ए + 91556 बी = 149367

पहले समीकरण से हम व्यक्त करते हैं एकऔर दूसरे समीकरण में स्थानापन्न करें:

हमें अनुभवजन्य प्रतिगमन गुणांक मिलते हैं: बी = 0.9, ए = 64.21

प्रतिगमन समीकरण (अनुभवजन्य प्रतिगमन समीकरण):

वाई = 0.9 एक्स + 64.21

अनुभवजन्य प्रतिगमन गुणांक एकतथा बीकेवल सैद्धांतिक गुणांक β i के अनुमान हैं, और समीकरण ही विचाराधीन चर के व्यवहार में केवल सामान्य प्रवृत्ति को दर्शाता है।

रैखिक प्रतिगमन के मापदंडों की गणना करने के लिए, हम एक गणना तालिका (तालिका 1) का निर्माण करेंगे।

1. प्रतिगमन समीकरण के पैरामीटर।

नमूना का अर्थ है।

नमूना भिन्नताएं:

मानक विचलन

1.1. सहसंबंध गुणांक

सहप्रसरण.

हम संचार की निकटता के संकेतक की गणना करते हैं। ऐसा संकेतक एक चयनात्मक रैखिक सहसंबंध गुणांक है, जिसकी गणना सूत्र द्वारा की जाती है:

1.2. प्रतिगमन समीकरण(प्रतिगमन समीकरण का मूल्यांकन)।

रैखिक समाश्रयण समीकरण y = 0.9 x + 64.21 . है

1.3. लोच गुणांक.

लोच का गुणांक सूत्र द्वारा पाया जाता है:

1.4. सन्निकटन त्रुटि.

5%-7% के भीतर सन्निकटन त्रुटि मूल डेटा के लिए प्रतिगमन समीकरण के एक अच्छे चयन का संकेत देती है।

1.5. अनुभवजन्य सहसंबंध संबंध।

अनुभवजन्य सहसंबंध अनुपात की गणना सभी प्रकार के कनेक्शन के लिए की जाती है और निर्भरता की निकटता को मापने के लिए कार्य करती है। भीतर परिवर्तन।

सहसंबंध सूचकांक.

रैखिक प्रतिगमन के लिए, सहसंबंध सूचकांक सहसंबंध गुणांक r xy = 0.79 के बराबर है।

निर्भरता के किसी भी रूप के लिए, कनेक्शन की जकड़न का उपयोग करके निर्धारित किया जाता है एकाधिक सहसंबंध गुणांक:

1.6. निर्धारण गुणांक।

अक्सर, निर्धारण के गुणांक की व्याख्या देते हुए, इसे प्रतिशत के रूप में व्यक्त किया जाता है।

R2 = 0.792 = 0.62

रैखिक प्रतिगमन मापदंडों की गुणवत्ता का आकलन करने के लिए, हम एक गणना तालिका (तालिका 2) का निर्माण करेंगे।

2. प्रतीपगमन समीकरण के प्राचलों का अनुमान।

2.1. सहसंबंध गुणांक का महत्व.

एक महत्व स्तर α पर शून्य परिकल्पना का परीक्षण करने के लिए कि एक सामान्य द्वि-आयामी यादृच्छिक चर का सामान्य सहसंबंध गुणांक एक प्रतिस्पर्धी परिकल्पना एच 1 ≠ 0 के साथ शून्य के बराबर है, मानदंड के देखे गए मूल्य की गणना करना आवश्यक है

और तालिका के अनुसार महत्वपूर्ण बिंदुछात्र का वितरण, महत्व स्तर α और स्वतंत्रता की डिग्री की संख्या k = n - 2 को देखते हुए, दो-तरफा महत्वपूर्ण क्षेत्र का महत्वपूर्ण बिंदु t क्रिट ज्ञात करें। अगर टी अवलोकन< t крит оснований отвергнуть нулевую гипотезу. Если |t набл | >टी क्रिट - शून्य परिकल्पना अस्वीकृत की जाती है।

महत्व स्तर के साथ छात्र तालिका के अनुसार α=0.05 और स्वतंत्रता की डिग्री k=10 हम टी आलोचना पाते हैं:

जहाँ m = 1 व्याख्यात्मक चरों की संख्या है।

2.2. सहसंबंध गुणांक (विश्वास अंतराल) के लिए अंतराल अनुमान।

2.3. प्रतिगमन गुणांक के अनुमानों के निर्धारण की सटीकता का विश्लेषण।

गड़बड़ी के विचरण का निष्पक्ष अनुमान मूल्य है:

एस 2 वाई = 53.63 - अस्पष्टीकृत विचरण (प्रतिगमन रेखा के चारों ओर आश्रित चर के फैलाव का एक उपाय)।

S y = 7.32 - अनुमान की मानक त्रुटि (प्रतिगमन की मानक त्रुटि)।

एसए मानक विचलनयादृच्छिक चर ए।

एस बी - यादृच्छिक चर बी का मानक विचलन।

2.4. आश्रित चर के लिए विश्वास अंतराल।

(ए + बीएक्स पी ± )

आइए हम अंतराल की सीमाओं की गणना करें जिसमें वाई के संभावित मूल्यों का 95% असीमित संख्या में अवलोकनों के साथ केंद्रित होगा और एक्स पी = 107

Y के लिए व्यक्तिगत विश्वास अंतरालों को X का मान दिया गया है।

(ए + बीएक्स मैं ± )

टी क्रिट (एन-एम-1;α/2) = (10;0.025) = 2.228

2.5. रेखीय प्रतीपगमन समीकरण के गुणांकों के संबंध में परीक्षण परिकल्पना।

1) टी-सांख्यिकी। छात्र की कसौटी।

टी क्रिट (एन-एम-1;α/2) = (10;0.025) = 2.228

प्रतीपगमन समीकरण के गुणांकों के लिए विश्वास अंतराल.

(बी - टी क्रिट एस बी; बी + टी क्रिट एस बी)

(ए - टी क्रिट एस ए; ए + टी क्रिट एस ए)

2) एफ-सांख्यिकी। फिशर की कसौटी।

स्वतंत्रता की डिग्री के साथ मानदंड का सारणीबद्ध मान k 1 \u003d 1 और k 2 \u003d 10, F तालिका \u003d 4.96

युग्मित रैखिक प्रतिगमन

कार्यशाला

भाप से भरा कमरा रेखीय प्रतिगमन: कार्यशाला। -

अर्थमिति के अध्ययन में छात्रों को अर्थमितीय मॉडल के निर्माण में अनुभव प्राप्त करना, एक मॉडल के विनिर्देश और पहचान पर निर्णय लेना, मॉडल मापदंडों के आकलन के लिए एक विधि का चयन करना, इसकी गुणवत्ता का आकलन करना, परिणामों की व्याख्या करना, भविष्य कहनेवाला अनुमान प्राप्त करना आदि शामिल हैं। कार्यशाला छात्रों की मदद करेगी। इन मामलों में व्यावहारिक कौशल हासिल करें।

संपादकीय और प्रकाशन परिषद द्वारा स्वीकृत

द्वारा संकलित: एम.बी. पेरोवा, अर्थशास्त्र के डॉक्टर, प्रोफेसर

सामान्य प्रावधान

अर्थमितीय अनुसंधान एक सिद्धांत से शुरू होता है जो घटना के बीच संबंध स्थापित करता है। प्रभावी विशेषता को प्रभावित करने वाले कारकों की पूरी श्रृंखला से, सबसे महत्वपूर्ण कारक प्रतिष्ठित हैं। अध्ययन की गई विशेषताओं के बीच एक संबंध की उपस्थिति की पहचान के बाद, प्रतिगमन विश्लेषण का उपयोग करके इस संबंध का सटीक रूप निर्धारित किया जाता है।

प्रतिगमन विश्लेषणएक विश्लेषणात्मक अभिव्यक्ति (एक फ़ंक्शन की परिभाषा में) की परिभाषा में शामिल है, जिसमें एक मूल्य (परिणामी विशेषता) में परिवर्तन एक स्वतंत्र मूल्य (फैक्टोरियल विशेषता) के प्रभाव के कारण होता है। इस संबंध को एक प्रतिगमन समीकरण या एक प्रतिगमन फ़ंक्शन का निर्माण करके निर्धारित किया जा सकता है।

मूल प्रतिगमन मॉडल एक युग्मित (एक-कारक) प्रतिगमन मॉडल है। जोड़ी प्रतिगमन- दो चरों के संयोजन का समीकरण परतथा एक्स:

कहाँ पे - आश्रित चर (परिणामी संकेत);

- स्वतंत्र, व्याख्यात्मक चर (फैक्टोरियल साइन)।

परिवर्तन की प्रकृति के आधार पर परपरिवर्तन के साथ एक्सरैखिक और गैर-रेखीय प्रतिगमन के बीच अंतर।

रेखीय प्रतिगमन

इस प्रतिगमन फ़ंक्शन को पहली डिग्री का बहुपद कहा जाता है और इसका उपयोग समय में समान रूप से विकसित होने वाली प्रक्रियाओं का वर्णन करने के लिए किया जाता है।

एक यादृच्छिक सदस्य होना (प्रतिगमन त्रुटियां) अन्य कारकों के आश्रित चर पर प्रभाव के साथ जुड़ा हुआ है, जो समीकरण में ध्यान में नहीं रखा गया है, मॉडल की संभावित गैर-रैखिकता, माप त्रुटियों के साथ, इसलिए, उपस्थिति यादृच्छिक त्रुटि समीकरणप्रतिगमन निम्नलिखित उद्देश्य के कारण हो सकता है कारणों:

1) नमूने का गैर-प्रतिनिधित्व। युग्मित प्रतिगमन मॉडल में एक कारक शामिल होता है जो परिणाम विशेषता की भिन्नता को पूरी तरह से समझाने में सक्षम नहीं होता है, जो कि कई अन्य कारकों (लापता चर) से काफी हद तक प्रभावित हो सकता है। रोजगार, मजदूरी योग्यता के अलावा, शिक्षा के स्तर, कार्य अनुभव, लिंग, आदि पर निर्भर हो सकती है;

2) इस बात की संभावना है कि मॉडल में शामिल चरों को गलती से मापा जा सकता है। उदाहरण के लिए, पारिवारिक खाद्य व्यय पर डेटा सर्वेक्षण प्रतिभागियों के रिकॉर्ड से संकलित किया जाता है, जिनसे अपेक्षा की जाती है कि वे अपने दैनिक खर्चों को ध्यान से रिकॉर्ड करें। बेशक, इससे त्रुटियां हो सकती हैं।

नमूना अवलोकन के आधार पर, नमूना प्रतिगमन समीकरण का अनुमान लगाया जाता है ( प्रतिगमन लाइन):

,

कहाँ पे
- प्रतिगमन समीकरण के मापदंडों का अनुमान (
).

निर्भरता का विश्लेषणात्मक रूपअध्ययन की गई जोड़ी के बीच की विशेषताएं (प्रतिगमन फ़ंक्शन) निम्नलिखित का उपयोग करके निर्धारित की जाती हैं तरीकों:

    सैद्धांतिक और तार्किक विश्लेषण के आधार परअध्ययन की गई घटनाओं की प्रकृति, उनका सामाजिक-आर्थिक सार। उदाहरण के लिए, यदि जनसंख्या की आय और बैंकों में जनसंख्या के जमा के आकार के बीच संबंध का अध्ययन किया जाता है, तो यह स्पष्ट है कि संबंध प्रत्यक्ष है।

    ग्राफिक विधिजब रिश्ते की प्रकृति का नेत्रहीन मूल्यांकन किया जाता है।

यह निर्भरता स्पष्ट रूप से देखी जा सकती है यदि आप एक्स-अक्ष पर विशेषता के मूल्य की साजिश रचकर एक ग्राफ बनाते हैं एक्स, और y-अक्ष पर - सुविधा के मान पर. ग्राफ़ पर मानों के संगत बिंदुओं को रखना एक्सतथा पर, हम पाते हैं सहसंबंध क्षेत्र:

ए) यदि बिंदु पूरे क्षेत्र में बेतरतीब ढंग से बिखरे हुए हैं, तो यह इन विशेषताओं के बीच संबंध की अनुपस्थिति को इंगित करता है;

बी) यदि बिंदु निचले बाएं कोने से ऊपरी दाएं तक फैली धुरी के चारों ओर केंद्रित होते हैं, तो सुविधाओं के बीच सीधा संबंध होता है;

ग) यदि बिंदु ऊपरी बाएँ कोने से निचले दाएँ कोने तक चलने वाली धुरी के चारों ओर केंद्रित हैं, तो उलटा नातासंकेतों के बीच।

यदि हम सहसंबंध क्षेत्र के बिंदुओं को सीधी रेखा के खंडों से जोड़ते हैं, तो हमें एक निश्चित उर्ध्व प्रवृत्ति के साथ एक टूटी हुई रेखा मिलती है। यह एक अनुभवजन्य कड़ी होगी या अनुभवजन्य प्रतिगमन रेखा. इसकी उपस्थिति से, कोई न केवल उपस्थिति का न्याय कर सकता है, बल्कि अध्ययन की गई विशेषताओं के बीच संबंध के रूप को भी आंक सकता है।

एक जोड़ी प्रतिगमन समीकरण का निर्माण

प्रतिगमन समीकरण का निर्माण इसके मापदंडों का अनुमान लगाने के लिए कम किया गया है। ये पैरामीटर अनुमान विभिन्न तरीकों से पाए जा सकते हैं। उनमें से एक कम से कम वर्गों (एलएसएम) की विधि है। विधि का सार इस प्रकार है। प्रत्येक मान अनुभवजन्य (मनाया) मूल्य से मेल खाती है . एक समाश्रयण समीकरण की रचना करके, उदाहरण के लिए, एक सीधी रेखा समीकरण, प्रत्येक मान सैद्धांतिक (गणना) मूल्य के अनुरूप होगा . देखे गए मान प्रतिगमन रेखा पर बिल्कुल झूठ मत बोलो, अर्थात। के साथ मेल नहीं खाते . आश्रित चर के वास्तविक और परिकलित मानों के बीच के अंतर को कहते हैं शेष:

एलएसएम आपको पैरामीटर के ऐसे अनुमान प्राप्त करने की अनुमति देता है, जिसमें प्रभावी सुविधा के वास्तविक मूल्यों के वर्ग विचलन का योग होता है परसैद्धांतिक से , अर्थात। अवशिष्ट के वर्गों का योग, न्यूनतम:

रेखीय समीकरणों और अरैखिक समीकरणों के लिए जो रेखीय में कम हो जाते हैं, निम्नलिखित प्रणाली को के संबंध में हल किया जाता है एकतथा बी:

कहाँ पे एन- नमूने का आकार।

समीकरणों की प्रणाली को हल करने पर, हम मान प्राप्त करते हैं एकतथा बी, जो हमें लिखने की अनुमति देता है प्रतिगमन समीकरण(प्रतिगमन समीकरण):

कहाँ पे व्याख्यात्मक (स्वतंत्र) चर है;

- समझाया (आश्रित) चर;

प्रतिगमन रेखा बिंदु से होकर गुजरती है ( ,) और समानताएं पूरी होती हैं:

आप तैयार किए गए सूत्रों का उपयोग कर सकते हैं जो समीकरणों की इस प्रणाली से अनुसरण करते हैं:

कहाँ पे - आश्रित सुविधा का औसत मूल्य;

एक स्वतंत्र विशेषता का औसत मूल्य है;

आश्रित और स्वतंत्र विशेषताओं के गुणनफल का अंकगणितीय माध्य है;

एक स्वतंत्र विशेषता का प्रसरण है;

आश्रित और स्वतंत्र विशेषताओं के बीच सहप्रसरण है।

नमूना सहप्रसरणदो चर एक्स, परबुलाया औसत मूल्यइन चरों के उनके साधनों से विचलन का गुणनफल

पैरामीटर बीपर एक्सबहुत व्यावहारिक महत्व का है और इसे प्रतिगमन गुणांक कहा जाता है। प्रतिगमन गुणांकदिखाता है कि मूल्य में औसतन कितनी इकाइयाँ बदलती हैं पर एक्सइसकी माप की 1 इकाई।

पैरामीटर चिह्न बीजोड़ी में प्रतिगमन समीकरण रिश्ते की दिशा को इंगित करता है:

यदि
, तो अध्ययन किए गए संकेतकों के बीच संबंध प्रत्यक्ष है, अर्थात। कारक विशेषता में वृद्धि के साथ एक्सपरिणामी चिन्ह बढ़ता है पर, और इसके विपरीत;

यदि
, तो अध्ययन किए गए संकेतकों के बीच संबंध उलटा होता है, अर्थात। कारक विशेषता में वृद्धि के साथ एक्सप्रभावी संकेत परघटता है और इसके विपरीत।

पैरामीटर मान एककुछ मामलों में जोड़ी प्रतिगमन समीकरण में प्रभावी विशेषता के प्रारंभिक मूल्य के रूप में व्याख्या की जा सकती है पर. पैरामीटर की यह व्याख्या एककेवल तभी संभव है जब value
अर्थ है।

प्रतिगमन समीकरण के निर्माण के बाद, देखे गए मान आपके रूप में कल्पना की जा सकती है:

खंडहर , साथ ही त्रुटियां , हैं यादृच्छिक चर, लेकिन वे, त्रुटियों के विपरीत , देखने योग्य। शेष आश्रित चर का वह भाग है आप, जिसे प्रतिगमन समीकरण द्वारा समझाया नहीं जा सकता है।

प्रतिगमन समीकरण के आधार पर, कोई गणना कर सकता है सैद्धांतिक मूल्य एक्सकिसी भी मूल्य के लिए एक्स.

आर्थिक विश्लेषण में, फ़ंक्शन की लोच की अवधारणा का अक्सर उपयोग किया जाता है। समारोह लोच
सापेक्ष परिवर्तन के रूप में गणना आपसापेक्ष परिवर्तन के लिए एक्स. लोच दिखाता है कि फ़ंक्शन कितना बदलता है
जब स्वतंत्र चर में 1% का परिवर्तन होता है।

एक रैखिक कार्य की लोच के बाद से
स्थिर नहीं है, लेकिन निर्भर करता है एक्स, तो लोच गुणांक की गणना आमतौर पर औसत लोच सूचकांक के रूप में की जाती है।

लोच गुणांकदिखाता है कि कुल मिलाकर प्रभावी विशेषता का मूल्य औसतन कितने प्रतिशत बदलेगा परकारक चिह्न बदलते समय एक्सइसके औसत मूल्य का 1%:

कहाँ पे
- चर के औसत मूल्य एक्सतथा परनमूने में।

निर्मित प्रतिगमन मॉडल की गुणवत्ता का मूल्यांकन

प्रतिगमन मॉडल की गुणवत्ता- प्रारंभिक (देखे गए) डेटा के लिए निर्मित मॉडल की पर्याप्तता।

कनेक्शन की जकड़न को मापने के लिए, अर्थात। यह मापने के लिए कि यह कार्यात्मक के कितना करीब है, आपको विचलन को मापने वाले विचरण को निर्धारित करने की आवश्यकता है परसे पर एक्सऔर अन्य कारकों के कारण अवशिष्ट भिन्नता को चिह्नित करना। वे उन संकेतकों को रेखांकित करते हैं जो प्रतिगमन मॉडल की गुणवत्ता की विशेषता रखते हैं।

जोड़ीदार प्रतिगमन की गुणवत्ता का निर्धारण गुणांकों का उपयोग करके किया जाता है

1) कनेक्शन की जकड़न - सहसंबंध सूचकांक, युग्मित रैखिक सहसंबंध गुणांक;

2) सन्निकटन त्रुटि;

3) प्रतिगमन समीकरण की गुणवत्ता और इसके व्यक्तिगत पैरामीटर - समग्र रूप से प्रतिगमन समीकरण की औसत वर्ग त्रुटियां और इसके व्यक्तिगत पैरामीटर।

किसी भी प्रकार के प्रतिगमन समीकरणों के लिए परिभाषित किया गया है सहसंबंध सूचकांक, जो केवल सहसंबंध निर्भरता की जकड़न की विशेषता है, अर्थात। एक कार्यात्मक कनेक्शन के लिए इसके सन्निकटन की डिग्री:

,

कहाँ पे - तथ्यात्मक (सैद्धांतिक) विचरण;

कुल भिन्नता है।

सहसंबंध सूचकांक मान लेता है
, जिसमें,

यदि

यदि
सुविधाओं के बीच संबंध है एक्सतथा परकार्यात्मक है, करीब 1 तक, अध्ययन किए गए लक्षणों के बीच के संबंध को जितना करीब माना जाता है। यदि एक
, तो रिश्ते को करीबी माना जा सकता है

कनेक्शन की जकड़न के संकेतकों की गणना करने के लिए आवश्यक भिन्नताओं की गणना की जाती है:

कुल विचरण, जो सभी कारकों की कार्रवाई के कारण कुल भिन्नता को मापता है:

फैक्टोरियल (सैद्धांतिक) भिन्नता,परिणामी विशेषता की भिन्नता को मापना परकारक चिन्ह की क्रिया के कारण एक्स:

अवशिष्ट फैलाव, जो विशेषता की भिन्नता को दर्शाता है परको छोड़कर सभी कारकों के कारण एक्स(यानी बहिष्कृत के साथ एक्स):

फिर, प्रसरणों के योग के नियम के अनुसार:

भाप कमरे की गुणवत्ता रैखिकप्रतिगमन का उपयोग करके भी परिभाषित किया जा सकता है युग्मित रैखिक सहसंबंध गुणांक:

,

कहाँ पे
- चर का सहप्रसरण एक्सतथा पर;

- एक स्वतंत्र विशेषता का मानक विचलन;

आश्रित विशेषता का मानक विचलन है।

रैखिक सहसंबंध गुणांक अध्ययन की गई विशेषताओं के बीच संबंधों की जकड़न और दिशा की विशेषता है। इसे [-1; के भीतर मापा जाता है; +1]:

यदि
- तब संकेतों के बीच संबंध प्रत्यक्ष है;

यदि
- तब संकेतों के बीच संबंध उलटा होता है;

यदि
- तब संकेतों के बीच कोई संबंध नहीं है;

यदि
या
- तब सुविधाओं के बीच संबंध कार्यात्मक है, अर्थात। के बीच एक आदर्श मैच की विशेषता है एक्सतथा पर. करीब 1 तक, अध्ययन किए गए लक्षणों के बीच के संबंध को जितना करीब माना जाता है।

यदि सहसंबंध सूचकांक (युग्मित रैखिक सहसंबंध गुणांक) को चुकता किया जाता है, तो हमें निर्धारण का गुणांक प्राप्त होता है।

निर्धारण गुणांक- कुल में कारक विचरण के हिस्से का प्रतिनिधित्व करता है और दिखाता है कि परिणामी विशेषता की भिन्नता कितने प्रतिशत है परकारक विशेषता की भिन्नता द्वारा समझाया गया एक्स:

यह सभी विविधताओं को शामिल नहीं करता है। परएक कारक चिह्न से एक्स, लेकिन इसका केवल वह हिस्सा जो रैखिक प्रतिगमन समीकरण से मेल खाता है, अर्थात। परिणामी गुण की भिन्नता के विशिष्ट भार को दर्शाता है, रैखिक रूप से कारक विशेषता की भिन्नता से संबंधित है।

मूल्य
- परिणामी विशेषता की भिन्नता का अनुपात, जिसे प्रतिगमन मॉडल ध्यान में नहीं रख सका।

सहसंबंध क्षेत्र में बिंदुओं का बिखराव बहुत बड़ा हो सकता है, और परिकलित प्रतिगमन समीकरण विश्लेषण किए गए संकेतक के आकलन में एक बड़ी त्रुटि दे सकता है।

औसत सन्निकटन त्रुटिवास्तविक मान से परिकलित मानों का औसत विचलन दिखाता है:

अधिकतम स्वीकार्य मूल्य 12-15% है।

प्रतिगमन रेखा के चारों ओर आश्रित चर के प्रसार का एक माप मानक त्रुटि है। देखे गए मानों के पूरे सेट के लिए, मानक (आरएमएस) प्रतिगमन समीकरण त्रुटि, जो वास्तविक मूल्यों का मानक विचलन है परप्रतिगमन समीकरण द्वारा परिकलित सैद्धांतिक मूल्यों के सापेक्ष पर एक्स .

,

कहाँ पे
स्वतंत्रता की डिग्री की संख्या है;

एमप्रतिगमन समीकरण के मापदंडों की संख्या है (सीधी रेखा समीकरण के लिए एम=2).

औसत के मूल्य का अनुमान लगाएं द्विघात त्रुटिआप इसकी तुलना कर सकते हैं

ए) प्रभावी सुविधा के औसत मूल्य के साथ पर;

बी) सुविधा के मानक विचलन के साथ पर:

यदि
, तो इस प्रतिगमन समीकरण का उपयोग उपयुक्त है।

अलग से मूल्यांकन मानक (आरएमएस) समीकरण मापदंडों और सहसंबंध सूचकांक की त्रुटियां:

;
;
.

एक्स- मानक विचलन एक्स.

प्रतिगमन समीकरण के महत्व और कनेक्शन की जकड़न के संकेतकों की जाँच करना

आगे की आर्थिक गणना के लिए निर्मित मॉडल का उपयोग करने के लिए, निर्मित मॉडल की गुणवत्ता की जांच करना पर्याप्त नहीं है। प्रतिगमन समीकरण के अनुमानों के महत्व (महत्व) और कम से कम वर्ग विधि का उपयोग करके प्राप्त कनेक्शन की निकटता के संकेतक की जांच करना भी आवश्यक है, अर्थात। रिश्ते के सही मापदंडों के अनुपालन के लिए उनकी जांच करना आवश्यक है।

यह इस तथ्य के कारण है कि सीमित जनसंख्या के लिए गणना किए गए संकेतक विशेषता के व्यक्तिगत मूल्यों में निहित यादृच्छिकता के तत्व को बनाए रखते हैं। इसलिए, वे केवल एक निश्चित सांख्यिकीय नियमितता के अनुमान हैं। प्रतिगमन मापदंडों की सटीकता और महत्व (विश्वसनीयता, भौतिकता) की डिग्री का आकलन करना आवश्यक है। नीचे महत्वइस संभावना को समझें कि चेक किए गए पैरामीटर का मान शून्य के बराबर नहीं है, इसमें विपरीत संकेतों के मान शामिल नहीं हैं।

महत्व परीक्षण- इस धारणा की जाँच करना कि पैरामीटर शून्य से भिन्न हैं।

युग्मित प्रतिगमन समीकरण के महत्व का आकलनसमग्र रूप से प्रतिगमन समीकरण के महत्व और इसके व्यक्तिगत मापदंडों के बारे में परिकल्पना का परीक्षण करने के लिए नीचे आता है ( एक, बी), निर्धारण या सहसंबंध सूचकांक की जोड़ी गुणांक।

इस मामले में, निम्नलिखित को सामने रखा जा सकता है मुख्य परिकल्पनाएच 0 :

1)
- प्रतिगमन गुणांक महत्वहीन हैं और प्रतिगमन समीकरण भी महत्वहीन है;

2)
- निर्धारण का युग्म गुणांक महत्वहीन है और समाश्रयण समीकरण भी महत्वहीन है।

वैकल्पिक (या विपरीत) निम्नलिखित परिकल्पनाएँ हैं:

1)
- प्रतिगमन गुणांक शून्य से काफी अलग हैं, और निर्मित प्रतिगमन समीकरण महत्वपूर्ण है;

2)
- निर्धारण का युग्म गुणांक शून्य से काफी अलग है और निर्मित प्रतिगमन समीकरण महत्वपूर्ण है।

युग्मित प्रतिगमन समीकरण के महत्व के बारे में परिकल्पना का परीक्षण

समग्र रूप से प्रतिगमन समीकरण के सांख्यिकीय महत्व की परिकल्पना और निर्धारण के गुणांक का परीक्षण करने के लिए, हम उपयोग करते हैं एफ-मानदंड(फिशर का मानदंड):

या

कहाँ पे 1 = एम–1 ; 2 = एनएम स्वतंत्रता की डिग्री की संख्या है;

एनजनसंख्या इकाइयों की संख्या है;

एमप्रतिगमन समीकरण के मापदंडों की संख्या है;

- कारक विचरण;

अवशिष्ट विचरण है।

परिकल्पना का परीक्षण निम्नानुसार किया जाता है:

1) यदि वास्तविक (मनाया गया) मान एफ-मानदंड इस मानदंड के महत्वपूर्ण (तालिका) मान से अधिक है
, तो संभावना के साथ
प्रतिगमन समीकरण या निर्धारण के युग्म गुणांक के महत्व के बारे में मुख्य परिकल्पना को खारिज कर दिया जाता है, और प्रतिगमन समीकरण को महत्वपूर्ण माना जाता है;

2) यदि एफ-मानदंड का वास्तविक (देखा गया) मान इस मानदंड के महत्वपूर्ण मूल्य से कम है
, तो संभावना के साथ (
) प्रतिगमन समीकरण के महत्व या निर्धारण के युग्म गुणांक के बारे में मुख्य परिकल्पना को स्वीकार किया जाता है, और निर्मित प्रतिगमन समीकरण को महत्वहीन माना जाता है।

महत्वपूर्ण मान एफ- महत्व के स्तर के आधार पर संबंधित तालिकाओं के अनुसार मानदंड पाया जाता है और स्वतंत्रता की डिग्री की संख्या
.

स्वतंत्रता की डिग्री की संख्या- संकेतक, जिसे नमूना आकार के बीच अंतर के रूप में परिभाषित किया गया है ( एन) और इस नमूने के लिए अनुमानित मापदंडों की संख्या ( एम) एक युग्मित प्रतिगमन मॉडल के लिए, स्वतंत्रता की डिग्री की संख्या की गणना इस प्रकार की जाती है
, चूंकि नमूने से दो मापदंडों का अनुमान लगाया जाता है (
).

सार्थक तल - निर्धारित मूल्य
,

कहाँ पे विश्वास संभावना है कि अनुमानित पैरामीटर विश्वास अंतराल के भीतर आता है। आमतौर पर 0.95 लिया जाता है। इस तरह संभावना है कि अनुमानित पैरामीटर 0.05 (5%) के बराबर विश्वास अंतराल में नहीं आएगा।

फिर, युग्मित प्रतिगमन समीकरण के महत्व का आकलन करने के मामले में, एफ-मानदंड के महत्वपूर्ण मूल्य की गणना इस प्रकार की जाती है
:

.

जोड़ी प्रतिगमन समीकरण और सहसंबंध सूचकांक के मापदंडों के महत्व के बारे में परिकल्पना का परीक्षण

समीकरण के मापदंडों के महत्व की जाँच करते समय (यह धारणा कि पैरामीटर शून्य से भिन्न होते हैं), प्राप्त अनुमानों के महत्व के बारे में मुख्य परिकल्पना को सामने रखा जाता है (
. समीकरण के मापदंडों के महत्व के बारे में एक वैकल्पिक (रिवर्स) परिकल्पना को सामने रखा गया है (
).

प्रस्तावित परिकल्पनाओं का परीक्षण करने के लिए, हम उपयोग करते हैं टी -मानदंड (टी-सांख्यिकी) विद्यार्थी. मनाया मूल्य टी-मानदंड की तुलना मूल्य के साथ की जाती है टीछात्र की वितरण तालिका (महत्वपूर्ण मूल्य) द्वारा निर्धारित मानदंड। महत्वपूर्ण मान टी-मानदंड
दो मापदंडों पर निर्भर करता है: महत्व स्तर और स्वतंत्रता की डिग्री की संख्या
.

प्रस्तावित परिकल्पनाओं का परीक्षण निम्नानुसार किया जाता है:

1) यदि प्रेक्षित मान का मापांक टी-मानदंड महत्वपूर्ण मूल्य से अधिक है टी-मानदंड, यानी।
, तो संभावना के साथ
प्रतिगमन मापदंडों के महत्व के बारे में मुख्य परिकल्पना को खारिज कर दिया गया है, अर्थात। प्रतिगमन पैरामीटर 0 के बराबर नहीं हैं;

2) यदि प्रेक्षित मान का मापांक टी- मानदंड महत्वपूर्ण मूल्य से कम या उसके बराबर है टी-मानदंड, यानी।
, तो संभावना के साथ
प्रतिगमन मापदंडों के महत्व के बारे में मुख्य परिकल्पना स्वीकार की जाती है, अर्थात। प्रतिगमन पैरामीटर लगभग 0 से भिन्न नहीं होते हैं या 0 के बराबर होते हैं।

छात्र के परीक्षण का उपयोग करके प्रतिगमन गुणांक के महत्व का आकलन उनके अनुमानों की मानक त्रुटि के मूल्य से तुलना करके किया जाता है:

;

सहसंबंध के सूचकांक (रैखिक गुणांक) के सांख्यिकीय महत्व का आकलन करने के लिए, इसका उपयोग भी किया जाता है टी- छात्र की कसौटी।

युग्मित रैखिक प्रतिगमन

प्रारंभिक गणना:

;
;
;
;
;

;
.

एक व्यू टेबल बनाना

अर्थ

मापदंडों की गणना के लिए सूत्र:

,
.

रैखिक

कनेक्शन की जकड़न का अनुमान:

ए) सहसंबंध गुणांक
, या
;

कंप्यूटर चयन के लिए, अंतर्निहित फ़ंक्शन का उपयोग करें कोरल

बी) लोच का गुणांक
;

ग) निर्धारण का गुणांक .

समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन:

प्रपत्र की तालिका के निर्माण के साथ प्रारंभिक गणना

एक) एफ - फिशर की कसौटीस्वतंत्रता की डिग्री की संख्या के साथ
तथा
और 0.05 का महत्व स्तर, तालिका देखें। मानदंड का अनुमानित मूल्य:

.

यदि F-मानदंड का परिकलित मान सारणीबद्ध मान से अधिक है, तो सुविधाओं के महत्वपूर्ण संबंध की अनुपस्थिति के बारे में शून्य परिकल्पना एक्सतथा आप खारिज कर दिया जाता है, और इस रिश्ते के महत्व के बारे में एक निष्कर्ष निकाला जाता है।

बी) औसत सन्निकटन त्रुटि

.

प्रतिगमन मापदंडों के महत्व का अनुमान:

ए) पैरामीटर की मानक त्रुटि एक सूत्र द्वारा गणना

, कहाँ पे
.

बी) प्रतिगमन गुणांक की मानक त्रुटि बीसूत्र द्वारा गणना

.

ग) सहसंबंध गुणांक की मानक त्रुटि सूत्र द्वारा गणना

.

टी-स्वतंत्रता की डिग्री की संख्या के साथ छात्र की कसौटी
और 0.05 का महत्व स्तर, तालिका देखें।

वास्तविक मूल्य टी- आँकड़े:

,
,
.

यदि वास्तविक मान निरपेक्ष मान में तालिका मान से अधिक है, तो प्रतिगमन पैरामीटर के महत्वहीन होने की परिकल्पना को अस्वीकार किया जा सकता है, पैरामीटर को महत्वपूर्ण माना जाता है।

के बीच संबंधएफ - फिशर की कसौटी तथा टी -छात्र की कसौटीसमानता द्वारा व्यक्त किया जाता है

.

प्रतिगमन मापदंडों के लिए विश्वास अंतराल की गणना:

पैरामीटर के लिए कॉन्फिडेंस इंटरवल एक के रूप में परिभाषित किया गया है
;

प्रतिगमन गुणांक के लिए विश्वास अंतराल के रूप में परिभाषित किया गया है
.

कंप्यूटर विश्लेषण के लिए एक्सेल में प्रयोग करें सेवा/डेटा विश्लेषण/प्रतिगमन।

रैखिक प्रतिगमन समीकरण पर आधारित अंतराल पूर्वानुमान:

होने देना - कारक विशेषता का अनुमानित मूल्य;
- प्रभावी सुविधा का बिंदु पूर्वानुमान। फिर

ए) औसत पूर्वानुमान त्रुटि :

;

बी) पूर्वानुमान विश्वास अंतराल

स्प्रेडशीट संपादक का उपयोग करनाएमएस एक्सेल

ऐड-इन सक्रियणविश्लेषण पैकेज

ऐड-ऑन सक्रिय करने के लिए विश्लेषण पैकेजआपको निम्न कार्य करने की आवश्यकता है:

1. एक टीम चुनें सेवा / ऐड-ऑन।

2. दिखाई देने वाले डायलॉग बॉक्स में, बॉक्स को चेक करें विश्लेषण पैकेज।

असाइनमेंट विकल्प के अनुसार, सांख्यिकीय सामग्री का उपयोग करते हुए, ज़रूरी:

2. सहसंबंध और निर्धारण संकेतकों का उपयोग करके आश्रित चर (परिणामी कारक) और व्याख्यात्मक चर के बीच संबंध की निकटता का आकलन करें।

3. के साथ दर एफ- फिशर की कसौटी मॉडलिंग की सांख्यिकीय विश्वसनीयता।

4. प्रतिगमन और सहसंबंध मापदंडों के सांख्यिकीय महत्व का आकलन करें।

5. औसत सन्निकटन त्रुटि ज्ञात कीजिए।

6. लोच गुणांक का उपयोग करके, परिणाम पर व्याख्यात्मक कारक के प्रभाव को मापें।

7. एक परिणामी विशेषता का एक बिंदु और अंतराल पूर्वानुमान करें जिसमें व्याख्यात्मक विशेषता में उसके औसत मूल्य के 25% (पूर्वानुमान विश्वसनीयता 95%) की वृद्धि हो।

8. एक आरेख पर, मूल डेटा और प्रतीपगमन रेखा के सहसंबंध क्षेत्र को चित्रित करें।

उदाहरण

डेटा मास्टर ऑफ बिजनेस एडमिनिस्ट्रेशन प्रोग्राम की वार्षिक लागत और एक शैक्षणिक संस्थान में छात्रों की संख्या पर उपलब्ध हैं।

I. दस्तावेज़ में प्रारंभिक डेटा दर्ज करना एक्सेल.

द्वितीय. हम ऐड-इन कहते हैं डेटा विश्लेषणव्यंजक सूची में सेवा।

III. एक उपकरण चुनना वापसी.

चतुर्थ। उपयुक्त विंडो पोजीशन भरें प्रतिगमन।

V. OK पर क्लिक करने के बाद, हमें समस्या को हल करने के लिए एक प्रोटोकॉल मिलता है।

VI. हम प्राप्त प्रोटोकॉल का विश्लेषण करते हैं।

1) प्रतिगमन गुणांक;

समाश्रयण समीकरण का मुक्त पद
.

टिप्पणी. यदि आवश्यक हो, तो परिणाम वांछित सटीकता के लिए गोल किए जाते हैं। मेनू में दशमलव स्थानों की संख्या निर्धारित करके प्रारंभ में गोलाई की आवश्यकता की जा सकती है सेल प्रारूप।

युग्मित रैखिक समाश्रयण समीकरण का रूप है: .

2) सहसंबंध गुणांक
, लक्षणों के बीच घनिष्ठ संबंध को दर्शाता है आपतथा एक्स. निर्धारण गुणांक
. परिणामी प्रतिगमन समीकरण 53% विशेषता भिन्नता की व्याख्या करता है आप, इस विशेषता की शेष 47% परिवर्तनशीलता उन कारकों के प्रभाव के कारण है जिन्हें मॉडल में ध्यान में नहीं रखा गया है।

3) समग्र रूप से समीकरण के सांख्यिकीय महत्व (सिमुलेशन विश्वसनीयता) का मूल्यांकन करें। फिशर मानदंड का परिकलित मान प्रोटोकॉल में दर्शाया गया है,
. इस मानदंड का महत्वपूर्ण मान सांख्यिकीय फ़ंक्शन का उपयोग करके पाया जा सकता है एफवितरणस्प्रेडशीट संपादक एक्सेल.

इस फ़ंक्शन के इनपुट पैरामीटर हैं:

- महत्व स्तर (प्रायिकता), जिसका अर्थ है निर्मित प्रतिगमन समीकरण के सांख्यिकीय महत्व के बारे में सही परिकल्पना को अस्वीकार करने के लिए त्रुटि की संभावना। एक नियम के रूप में, 0.05 या 0.01 का महत्व स्तर चुना जाता है;

- स्वतंत्रता की डिग्री की संख्या 1 - युग्मित रैखिक प्रतिगमन के लिए प्रतिगमन समीकरण में चर के लिए मापदंडों की संख्या के साथ मेल खाता है
यह संख्या एक के बराबर है;

- स्वतंत्रता की डिग्री की संख्या 2 युग्मित रैखिक प्रतिगमन के बराबर है
, कहाँ पे एन- प्रारंभिक सांख्यिकीय डेटा की मात्रा।

क्रियाएँ करना सम्मिलित करें / कार्य करें, जिसे आप चाहते हैं उसे चुनें।

चूँकि F-मानदंड का परिकलित मान सारणीबद्ध मान से अधिक है, 4.84 के बराबर, सुविधाओं x और y के बीच एक महत्वपूर्ण संबंध की अनुपस्थिति के बारे में शून्य परिकल्पना को खारिज कर दिया जाता है और इस संबंध के महत्व के बारे में एक निष्कर्ष निकाला जाता है।

4) मापदंडों के सांख्यिकीय महत्व का मूल्यांकन करें एकतथा बीप्रतिगमन समीकरण में . का उपयोग कर टी- छात्र की कसौटी।

छात्र के आँकड़ों के अनुमानित मूल्य
,
. संबंधित तालिका मान सांख्यिकीय फ़ंक्शन का उपयोग करके निर्धारित किया जा सकता है STUDRSPOBBR, स्वतंत्रता की डिग्री की संख्या है
.

चूंकि निरपेक्ष मान में वास्तविक मान 2.2 के बराबर सारणीबद्ध मान से अधिक है, इसलिए प्रतिगमन मापदंडों के महत्व की परिकल्पना को खारिज किया जा सकता है।

5) औसत सन्निकटन त्रुटि का निर्धारण करें,
. आपको तालिका के रूप में तैयार की गई सहायक गणना करने की आवश्यकता होगी।

इस प्रकार, इस प्रतिगमन समीकरण के लिए औसत सन्निकटन त्रुटि 12.66% है, युग्मित रैखिक प्रतिगमन मॉडल को संतोषजनक और पूर्वानुमान के लिए उपयुक्त माना जा सकता है।

6) कारक के प्रभाव का मात्रात्मक मूल्यांकन करें एक्सप्रति कारक आपलोच के गुणांक का उपयोग करना। जोड़ीदार रैखिक प्रतिगमन के लिए, इसे सूत्र द्वारा पाया जा सकता है
. हमारे पास है

.

इसलिए, श्रोताओं की संख्या में 1% की वृद्धि के साथ, वार्षिक मूल्य में 0.4% की कमी आएगी।

7) आइए पूर्वानुमान की गणना करें आपबढ़ते कारक के साथ एक्सऔसत का 25%।

पूर्वानुमान मूल्य।

फ़ीचर पॉइंट प्रेडिक्शन आप: .

औसत पूर्वानुमान त्रुटि है ,

कहाँ पे
अवशिष्ट विचरण है,
कारक का विचरण है एक्स.

योग का संख्यात्मक मान
प्रोटोकॉल में इसे अवशिष्ट एसएस के रूप में नामित किया गया है।

फिर
,
.

उपयोगिता आँकड़े प्राप्त करने का सबसे तेज़ तरीका - कारक का औसत मूल्य एक्सतथा - विचरण, उपकरण का लाभ उठाएं वर्णनात्मक आँकड़ेपैकेज में डेटा विश्लेषण।

परिणाम आउटपुट प्रोटोकॉल जैसा दिखता है

पूर्वानुमान विश्वास अंतराल: , जहाँ - छात्र की कसौटी का संगत सारणीबद्ध मान (फ़ंक्शन द्वारा पहले पाया गया STUDRSPOBBR,
).

फलस्वरूप,

वे। आप 95% सुनिश्चित हो सकते हैं कि 35 छात्रों के साथ एक वार्षिक पाठ्यक्रम की कीमत निर्दिष्ट सीमा के भीतर अलग-अलग होगी (3.65825 हजार डॉलर के एक बिंदु मूल्य पूर्वानुमान के साथ)।

8) चार्ट बनाने के लिए, निम्न कार्य करें:

स्टेप 1 सम्मिलित करें/चार्ट/ग्राफ

चरण 3पंक्ति/जोड़ें/मान/प्रतिगमन कारक मानों के एक स्तंभ को हाइलाइट करें − .

चरण 4अक्ष लेबलएक्स/ मानों का स्तंभ हाइलाइट करें एक्स.

चरण 4प्रत्येक श्रृंखला को एक नाम निर्दिष्ट करें, समन्वय अक्षों और चार्ट के नाम पर हस्ताक्षर करें।

टिप्पणी।

एक कारक के मूल्य की साजिश करने के लिए एक्सइसी मान को बनाए रखते हुए आरोही क्रम में क्रमबद्ध किया जाना चाहिए आप. यह इस तरह किया जा सकता है डेटा/सॉर्ट/उस कॉलम का चयन करें जिसमें आप सॉर्ट करना चाहते हैं। उदाहरण के लिए,

स्वतंत्र कार्य के लिए कार्य

विकल्प 1

एक्स

आप

विकल्प 2

एक्स- 10 उद्यमों में पावर-टू-वेट अनुपात, kW;

आप- श्रम उत्पादकता, हजार रूबल।

विकल्प 3

एक्स- भूमि की गुणवत्ता, अंक;

आप- उत्पादकता, सी / हेक्टेयर।

विकल्प 4

एक्स- भूमि की गुणवत्ता, अंक;

आप- उत्पादकता, सी / हेक्टेयर।

विकल्प 5

एक्स- कारोबार;

आप- टर्नओवर के संबंध में वितरण लागत।

विकल्प 6

एक्स- प्रति कर्मचारी बिजली;

आप- प्रति कर्मचारी तैयार उत्पादों की रिहाई।

विकल्प 7

एक्स- परिवार की आय का स्तर;

आप- भोजन व्यय (प्रति 100 रूबल आय)।

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...