युग्म प्रतीपगमन समीकरण के गुणांक ज्ञात करना। पेयरवाइज लीनियर रिग्रेशन (डेमो के साथ)

1. मूल परिभाषाएँ और सूत्र

जोड़ी प्रतिगमन- दो चर, आदि के बीच प्रतिगमन (संबंध)। मॉडल देखें:

आश्रित चर (परिणामी चिन्ह) कहाँ है;

- स्वतंत्र व्याख्यात्मक चर (संकेत-कारक);

मॉडल में ध्यान में नहीं रखे गए कारकों के प्रभाव सहित गड़बड़ी या स्टोकेस्टिक चर।

लगभग हर एक मामले में, मान में दो पद होते हैं:

प्रभावी सुविधा का वास्तविक मूल्य कहां है;

परिणामी विशेषता का सैद्धांतिक मूल्य, प्रतिगमन समीकरण के आधार पर पाया जाता है। "^" चिन्ह का अर्थ है कि चर और के बीच कोई सख्त कार्यात्मक संबंध नहीं है।

अंतर करना रैखिकतथा गैर रेखीयप्रतिगमन।

रेखीय प्रतिगमनएक सीधी रेखा के समीकरण द्वारा वर्णित है

अरेखीय प्रतिगमनदो वर्गों में विभाजित हैं:

1) प्रतिगमन, व्याख्यात्मक चर में गैर-रैखिक, लेकिन अनुमानित मापदंडों में रैखिक, उदाहरण के लिए:

विभिन्न डिग्री के बहुपद

समबाहु अतिपरवलय

2) प्रतिगमन, अनुमानित मापदंडों में गैर-रैखिक, उदाहरण के लिए:

शक्ति

प्रदर्शन

घातीय

एक युग्मित रैखिक प्रतिगमन बनाने के लिए, सहायक मात्राओं की गणना की जाती है ( - टिप्पणियों की संख्या)।

नमूना मतलब: तथा

नमूना सहप्रसरणइनके बीच में

या

सहप्रसरण- ये है संख्यात्मक विशेषतादो यादृच्छिक चर का संयुक्त वितरण।

के लिए नमूना विचरण

या

के लिए नमूना विचरण

या

नमूना विचरणमाध्य मान (परिवर्तनशीलता, परिवर्तनशीलता) के आसपास एक यादृच्छिक चर के मूल्यों के प्रसार की डिग्री की विशेषता है।

अध्ययन की गई घटनाओं के बीच संबंध की निकटता का अनुमान लगाया जाता है नमूना सहसंबंध गुणांकइनके बीच में

सहसंबंध गुणांक -1 से +1 तक भिन्न होता है। मॉडुलो से 1 के करीब, एक रैखिक कार्यात्मक के बीच और सांख्यिकीय संबंध के करीब।

यदि = 0, तो और के बीच कोई रैखिक संबंध नहीं है;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

गुणांक का एक सकारात्मक मूल्य इंगित करता है कि संकेतों के बीच संबंध प्रत्यक्ष है (मूल्य वृद्धि के साथ बढ़ता है), एक नकारात्मक मूल्य एक उलटा संबंध इंगित करता है (मूल्य वृद्धि के साथ घटता है)।

एक रैखिक प्रतिगमन का निर्माणइसके मापदंडों का अनुमान लगाने के लिए कम कर देता है और रैखिक प्रतिगमन के मापदंडों का आकलन करने के लिए शास्त्रीय दृष्टिकोण पर आधारित है तरीका कम से कम वर्गों (एमएनके)। एलएसएम पैरामीटर के ऐसे अनुमान प्राप्त करना संभव बनाता है जिसके तहत सैद्धांतिक लोगों से परिणामी विशेषता के वास्तविक मूल्यों के वर्ग विचलन का योग न्यूनतम है, यानी।

रैखिक प्रतिगमन के लिए, पैरामीटर और सिस्टम से पाए जाते हैं सामान्य समीकरण:

सिस्टम को हल करते हुए, हम पाते हैं मेंपर

और पैरामीटर

गुणकएक कारक चर के साथ दिखाता है कि जब माप की प्रति इकाई कारक बदलता है तो मूल्य औसतन कितना बदल जाएगा।

पैरामीटर जब 0 के बराबर नहीं हो सकता है, तो यह आर्थिक समझ में नहीं आता है। केवल अगर के संकेत की व्याख्या करना संभव है, तो परिणाम में सापेक्ष परिवर्तन कारक में परिवर्तन की तुलना में धीमा है, अर्थात। परिणाम का प्रसरण कारक के प्रसरण से कम होता है और इसके विपरीत।

निर्मित प्रतिगमन मॉडल की गुणवत्ता का आकलन करने के लिए, आप उपयोग कर सकते हैं दृढ़ संकल्प का गुणांकया औसत सन्निकटन त्रुटि.

प्रतिनिर्धारण गुणांक

या

परिणामी विशेषता के कुल विचरण में प्रतिगमन द्वारा समझाया गया विचरण का हिस्सा दिखाता है। तदनुसार, मान मॉडल और अन्य कारणों में ध्यान में नहीं रखे गए कारकों के प्रभाव के कारण संकेतक के विचरण के हिस्से को दर्शाता है।

1 के करीब, बेहतर रिग्रेशन मॉडल, यानी। निर्मित मॉडल प्रारंभिक डेटा को अच्छी तरह से अनुमानित करता है।

औसत सन्निकटन त्रुटिवास्तविक मूल्यों से सैद्धांतिक मूल्यों का औसत सापेक्ष विचलन है, अर्थात।

निर्मित प्रतिगमन समीकरण को संतोषजनक माना जाता है यदि मान 10-12% से अधिक न हो।

रैखिक प्रतिगमन के लिए लोच का औसत गुणांकसूत्र के अनुसार पाया जाता है:

लोच का औसत गुणांकदिखाता है कि जनसंख्या में औसतन कितने प्रतिशत परिणाम अपने मूल्य से बदल जाएगा जब कारक अपने मूल्य से 1% बदल जाता है।

ग्रेड एचनचिमोस्तोतथाप्रतिगमन समीकरणआमतौर पर फिशर-टेस्ट का उपयोग करके दिया जाता है, जिसमें प्रतिगमन समीकरण के सांख्यिकीय महत्व की परिकल्पना का परीक्षण होता है . इसके लिए तुलना की जाती है वास्तविकआकाशतथा नाजुक(तालिका) मान - फिशर की कसौटी .

स्वतंत्रता की एक डिग्री के लिए गणना किए गए कारक और अवशिष्ट भिन्नताओं के मूल्यों के अनुपात से निर्धारित किया जाता है, अर्थात।

- स्वतंत्रता की डिग्री के साथ यादृच्छिक कारकों के प्रभाव में मानदंड का अधिकतम संभव मूल्य = 1, = -2 और महत्व स्तर फिशर मानदंड तालिका (परिशिष्ट की तालिका 1) से पाया जाता है।

सार्थक तल- एक सही परिकल्पना को खारिज करने की संभावना है, यह देखते हुए कि यह सच है।

यदि एक तब अध्ययन किए गए संकेतक और कारक के बीच संबंध की अनुपस्थिति के बारे में परिकल्पना को खारिज कर दिया जाता है और महत्व के स्तर के साथ इस संबंध के महत्व के बारे में एक निष्कर्ष निकाला जाता है (यानी, प्रतिगमन समीकरण महत्वपूर्ण है)।

यदि एक तब परिकल्पना को स्वीकार किया जाता है और प्रतिगमन समीकरण के सांख्यिकीय महत्व और अविश्वसनीयता को मान्यता दी जाती है।

रैखिक प्रतिगमन के लिए महत्वप्रतिगमन गुणांकके साथ मूल्यांकन किया गया - विद्यार्थी का मानदंड, जिसके अनुसार संकेतकों की यादृच्छिक प्रकृति के बारे में एक परिकल्पना सामने रखी जाती है, अर्थात। शून्य से उनके महत्वहीन अंतर के बारे में। अगला, मानदंड के वास्तविक मूल्यों की गणना प्रत्येक अनुमानित प्रतिगमन गुणांक के लिए की जाती है, अर्थात।

और कहां - मानक त्रुटियांरैखिक प्रतिगमन पैरामीटर सूत्रों द्वारा निर्धारित किए जाते हैं:

- स्वतंत्रता की दी गई डिग्री के लिए यादृच्छिक कारकों के प्रभाव में छात्र की कसौटी का अधिकतम संभव मूल्य = -2 और महत्व स्तर छात्र की मानदंड तालिका (परिशिष्ट की तालिका 2) से पाया जाता है।

यदि एक तो प्रतिगमन गुणांक के महत्व के बारे में परिकल्पना को महत्व के स्तर के साथ खारिज कर दिया जाता है यानी। गुणांक (या) गलती से शून्य से भिन्न नहीं होता है और एक व्यवस्थित रूप से अभिनय कारक के प्रभाव में बनता है

यदि एक तब परिकल्पना को अस्वीकार नहीं किया जाता है और पैरामीटर के गठन की यादृच्छिक प्रकृति को मान्यता दी जाती है।

रैखिक सहसंबंध गुणांक का महत्वके साथ भी चेक किया गया - छात्र की कसौटी, यानी।

सहसंबंध गुणांक की महत्वहीनता की परिकल्पना को महत्व के स्तर के साथ खारिज कर दिया जाता है यदि

टिप्पणी।रैखिक जोड़ीदार प्रतिगमन के लिए, गुणांक और सहसंबंध गुणांक के महत्व के बारे में परिकल्पना का परीक्षण समग्र रूप से प्रतिगमन समीकरण के महत्व के बारे में परिकल्पना का परीक्षण करने के बराबर है, अर्थात।

विश्वास अंतराल की गणना करने के लिए, निर्धारित करें सीमांत त्रुटि प्रत्येक संकेतक के लिए, अर्थात्।

विश्वास अंतरालरैखिक प्रतिगमन गुणांक के लिए:

यदि शून्य विश्वास अंतराल की सीमाओं के भीतर आता है, अर्थात निचली सीमा नकारात्मक है, और ऊपरी सीमा सकारात्मक है, तो अनुमानित पैरामीटर शून्य माना जाता है, क्योंकि यह एक ही समय में सकारात्मक और नकारात्मक दोनों मूल्यों को नहीं ले सकता है।

पूर्वानुमान मूल्यप्रतिगमन समीकरण में संबंधित भविष्य कहनेवाला मूल्य को प्रतिस्थापित करके निर्धारित किया जाता है, फिर इसकी गणना की जाती है पूर्वानुमान की औसत मानक त्रुटि

कहाँ पे

और बनाया जा रहा है विश्वास अंतरालभविष्यवाणी

अवलोकनों की छोटी मात्रा के कारण अंतराल काफी चौड़ा हो सकता है।

प्रतिगमन, शामिल चर में गैर-रैखिक , चर के एक साधारण परिवर्तन द्वारा एक रैखिक रूप में कम कर दिया जाता है, और मापदंडों का आगे का अनुमान कम से कम वर्ग विधि का उपयोग करके किया जाता है।

जीहाइपरबॉलical प्रतिगमन:

आर निकासी , गैर रेखीय अनुमानित मापदंडों के अनुसार दो प्रकारों में विभाजित हैं: आंतरिक रूप से गैर-रैखिकआदि। (एक रैखिक रूप में कम नहीं) और आंतरिक रूप से रैखिक(उपयुक्त परिवर्तनों का उपयोग करके एक रैखिक रूप में घटाया गया), उदाहरण के लिए:

घातीय प्रतिगमन:

रैखिक परिवर्तन:

शक्ति प्रतिगमन:

रैखिक परिवर्तन:

अनुक्रमणिकानया प्रतिगमन:

रैखिक परिवर्तन:

लघुगणकवां प्रतिगमन:

रैखिक परिवर्तन:

2. विशिष्ट समस्याओं का समाधान

उदाहरण9 .1 . 15 कृषि उद्यमों (तालिका 9.1) के लिए, निम्नलिखित ज्ञात हैं: - बोए गए क्षेत्र (इकाइयों / हेक्टेयर) की प्रति इकाई उपकरणों की संख्या और - उगाए गए उत्पादों की मात्रा (हजार डेन। इकाइयां)। ज़रूरी:

1) पर निर्भरता निर्धारित करें

2) सहसंबंध क्षेत्रों को प्लॉट करें और रैखिक प्रतिगमन समीकरण को पर प्लॉट करें

3) मॉडल की गुणवत्ता के बारे में निष्कर्ष निकालें और औसत स्तर के 112% के अनुमानित मूल्य के साथ अनुमानित मूल्य की गणना करें।

तालिका 9.1

समाधान:

1) एक्सेल में, हम एक सहायक तालिका 9.2 संकलित करेंगे।

तालिका 9.2

चावल।9 ।एक। मध्यवर्ती मूल्यों की गणना के लिए तालिका

माप की संख्या की गणना करें ऐसा करने के लिए, एक सेल में बी19डाल = COUNT(A2:A16 ) .

टूलबार पर (ऑटोसम) फ़ंक्शन का उपयोग करना मानक टी नया सभी का योग ज्ञात करें (सेल .) बी17) और (सेल .) सी17).

चावल। 9.2. मूल्यों और औसत के योग की गणना

औसत मूल्यों की गणना करने के लिए, हम अंतर्निहित MS Excel AVERAGE () फ़ंक्शन का उपयोग करते हैं, औसत निर्धारित करने के लिए मानों की श्रेणी को कोष्ठक में दर्शाया गया है। इस प्रकार, 15 खेतों के लिए उगाए गए उत्पादों की औसत मात्रा 210.833 हजार डेन है। इकाइयाँ, और वाहनों की औसत संख्या 6.248 इकाई / हेक्टेयर है।

कॉलम भरने के लिए डी, , एफउत्पाद की गणना के लिए सूत्र दर्ज करें: सेल में डी2 डाल = बी2*सी2, फिर कीबोर्ड पर ENTER दबाएँ। सेल पर बायाँ-क्लिक करें डी2 और, इस सेल के निचले दाएं कोने (ब्लैक प्लस) को पकड़कर, सेल तक नीचे खींचें डी16 . रेंज अपने आप भर जाएगी। डी3 - डी16 .

गणना के लिए चयनात्मकओह कॉन्वर्सिसके बीच और सूत्र का उपयोग करें अर्थात। एक सेल में बी21 डाल = डी18- बी18* सी18 और 418.055 प्राप्त करें (चित्र 9.3)।

चावल।9 .3. गणना

चयनात्मकबहुत खूबफैलावयूसूत्र द्वारा खोजने के लिए इसके लिए एक सेल में बी22 डाल = E18-B18^2 (^ - घातांक का संकेत देने वाला चिन्ह ) और 11.337 प्राप्त करें। इसी तरह, हम निर्धारित करते हैं \u003d 16745.05556 (चित्र। 9.4)

चावल।9 ।चार। गणनावर(एक्स) तथावर (आप)

इसके अलावा, मानक एमएस एक्सेल फ़ंक्शन "CORREL" का उपयोग करके, हम अपने कार्य के लिए रैखिक सहसंबंध गुणांक के मान की गणना करते हैं, फ़ंक्शन "=CORREL(B2:B16;C2:C16)" जैसा दिखेगा, और मान rxy=0.96 . सहसंबंध गुणांक का प्राप्त मूल्य उपकरण की उपलब्धता और उगाए गए उत्पादों की मात्रा के बीच एक सीधा और मजबूत संबंध दर्शाता है।

हम देखतें है मेंरैखिक प्रतिगमन नमूना गुणांक =36.87; पैरामीटर = -17.78। तो, युग्मित रैखिक समाश्रयण समीकरण = -17.78 + 36.87 . जैसा दिखता है

गुणांक से पता चलता है कि उपकरणों की संख्या में 1 यूनिट / हेक्टेयर की वृद्धि के साथ, उगाए गए उत्पादों की मात्रा औसतन 36.875 हजार डेन बढ़ जाएगी। इकाइयों (चित्र 9.5)

चावल।9 .5. प्रतिगमन समीकरण के मापदंडों की गणना।

इस प्रकार, प्रतिगमन समीकरण इस तरह दिखेगा:।

हम वास्तविक मानों को परिणामी समीकरण में प्रतिस्थापित करते हैं एक्स(उपकरणों की संख्या) हम उगाए गए उत्पादों की मात्रा के सैद्धांतिक मूल्यों को पाते हैं (चित्र। 9.6)।

चावल।9 .6. विकसित उत्पादों की मात्रा के सैद्धांतिक मूल्यों की गणना

का उपयोग करते हुए चार्ट विज़ार्डहम सहसंबंध फ़ील्ड बनाते हैं (मानों के साथ कॉलम का चयन करना और) और एक रैखिक प्रतिगमन समीकरण (मानों के साथ कॉलम का चयन करना और)। चार्ट का प्रकार चुनें - टी तमाशा परिणामी आरेख में, आवश्यक पैरामीटर भरें (शीर्षक, कुल्हाड़ियों के लिए लेबल, किंवदंती, आदि)। नतीजतन, हमें अंजीर में दिखाया गया ग्राफ मिलता है। 9.7.

चावल।9 .7. उपकरणों की संख्या पर उगाए गए उत्पादों की मात्रा की निर्भरता का ग्राफ

निर्मित प्रतिगमन मॉडल की गुणवत्ता का आकलन करने के लिए, हम गणना करते हैं:

. प्रतिनिर्धारण गुणांक\u003d 0.92, जो दर्शाता है कि उत्पादन की मात्रा में परिवर्तन के कारण उत्पादन लागत में परिवर्तन 92% है, और 8% मॉडल में ध्यान में नहीं रखे गए कारकों की हिस्सेदारी पर पड़ता है, जो निर्मित प्रतिगमन की गुणवत्ता को इंगित करता है नमूना;

. साथरेड्नोयुयुगलतीपरअनुमान. ऐसा करने के लिए, कॉलम में एचकॉलम में वास्तविक और सैद्धांतिक मूल्यों के बीच अंतर की गणना करें मैं- अभिव्यक्ति । कृपया ध्यान दें कि मानक एमएस एक्सेल "एबीएस" फ़ंक्शन का उपयोग मॉड्यूलो मान की गणना के लिए किया जाता है। औसत मूल्य (सेल .) को गुणा करते समय मैं18 ) 100% पर हमें 18.2% मिलता है। नतीजतन, औसतन, सैद्धांतिक मूल्य वास्तविक से 18.2% (चित्र। 1.8) से विचलित होते हैं।

फिशर-मानदंड का उपयोग करते हुए, हम अनुमान लगाते हैं एचनचिमोस्तोबीसमीकरणregreसाथये आम तौर पर: 150,74.

0.05 = 4.67 के महत्व स्तर पर, हम अंतर्निहित सांख्यिकीय फ़ंक्शन का उपयोग करके निर्धारित करते हैं एफ वितरण(चित्र। 1.9)। उसी समय, यह याद रखना चाहिए कि "डिग्री_ऑफ_फ्रीडम 1" हर है, और "डिग्री_ऑफ_फ्रीडम 2" अंश है, जहां प्रतिगमन समीकरण में मापदंडों की संख्या है (हमारे पास 2 है), एन- मूल्यों के प्रारंभिक जोड़े की संख्या (हमारे पास 15 है)।

इसलिये तब समाश्रयण समीकरण = 0.05 पर सार्थक होता है।

चावल।9 .8. निर्धारण के गुणांक का निर्धारण औरऔसत त्रुटिअनुमान

चावल। 9 . 9 . डायलॉग विंडोकार्योंएफ वितरण

अगला, हम परिभाषित करते हैं साथलोच का मध्यम गुणांकसूत्र के अनुसार। पाया गया कि विनिर्मित उत्पादों की मात्रा में 1% की वृद्धि के साथ, इन उत्पादों के उत्पादन की लागत में कुल मिलाकर औसतन 1.093% की वृद्धि होगी।

गणना पूर्वानुमान मूल्यप्रतीपगमन समीकरण =-19.559+36.8746 में कारक =1.12=6.248*1.12=6.9978 के अनुमानित मान को प्रतिस्थापित करके। हमें = 238.48 प्राप्त होता है। फलस्वरूप 6.9978 इकाई/हेक्टेयर की मात्रा में उपकरणों की संख्या के साथ उत्पादन की मात्रा 238.48 हजार डेन होगी। इकाइयों

अवशिष्ट विचरण ज्ञात कीजिए, इसके लिए हम वास्तविक और सैद्धांतिक मूल्यों के बीच के अंतर के वर्गों के योग की गणना करते हैं। =39.166 निम्नलिखित सूत्र रखने पर = रूट (J17/(B19-2))एक सेल में एच2 1 (चित्र। 9.10)।

चावल।9 ।दस। अवशिष्ट विचरण का निर्धारण

सेरेड्नोफिरमानकवें त्रुटिभविष्यवाणी:

महत्व स्तर पर = 0.05 अंतर्निहित सांख्यिकीय फ़ंक्शन का उपयोग करके स्टीयूड्रेस्पोब्रहम परिभाषित करते हैं =2.1604 और सीमांत पूर्वानुमान त्रुटि की गणना करते हैं, जो 95% मामलों में अधिक नहीं होगी .

डीपूर्वानुमान विश्वास अंतराल:

या .

उत्पादन लागत का पूर्वानुमान विश्वसनीय (1-0.05 = 0.95) निकला, लेकिन गलत, क्योंकि विश्वास अंतराल की ऊपरी और निचली सीमाओं की सीमा है बार। यह टिप्पणियों की छोटी मात्रा के कारण हुआ।

यह रद्द किया जाना चाहिए कि एमएस एक्सेल में अंतर्निहित सांख्यिकीय कार्य हैं जो मध्यवर्ती गणनाओं की संख्या को काफी कम कर सकते हैं, उदाहरण के लिए (चित्र। 9.11।):

हिसाब करना मेंचयनात्मकएक्सऔसतएक्सफ़ंक्शन का उपयोग करें औसत (संख्या 1: संख्याएन) श्रेणी . से सांख्यिकीय .

नमूना सहप्रसरणके बीच और फ़ंक्शन का उपयोग करके पाया जाता है COVAR(सरणीएक्ससरणीयू) श्रेणी . से सांख्यिकीय .

चयनात्मकएसफैलावतथासांख्यिकीय कार्य द्वारा निर्धारित वीएआरपी (संख्या 1: संख्या .)एन) .

चावल।9 ।ग्यारह। कंप्यूटिंग नंबरअनुक्रमित अंतर्निहित कार्यएमएसएक्सेल

पीपैरामीटरएसरेखीय प्रतिगमनएक्सेल में कई तरह से परिभाषित किया जा सकता है।

1 मार्ग) अंतर्निहित फ़ंक्शन के साथ लाइनस्ट. प्रक्रिया निम्नलिखित है:

1. प्रतिगमन आँकड़ों के परिणाम प्रदर्शित करने के लिए 5x2 (5 पंक्तियाँ, 2 कॉलम) खाली कोशिकाओं के क्षेत्र का चयन करें या 1x2 क्षेत्र - केवल प्रतिगमन गुणांक प्राप्त करने के लिए।

2. उपयोग करना फंक्शन विजार्ड्सके बीच सांख्यिकीय समारोह का चयन करें लाइनस्टऔर इसके तर्कों को भरें (चित्र 9.12):

चावल। 9 . 12 . फ़ंक्शन तर्क प्रविष्टि संवाद बॉक्सलाइनस्ट

ज्ञात_मान_आप

ज्ञात_मान_एक्स

कॉन्स्टो- एक तार्किक मान (1 या 0), जो समीकरण में एक मुक्त पद की उपस्थिति या अनुपस्थिति को इंगित करता है; 1 डाल;

आंकड़े- बूलियन मान (1 या 0) जो इंगित करता है कि प्रतिगमन विश्लेषण पर अतिरिक्त जानकारी प्रदर्शित करना है या नहीं; डाल 1.

3. तालिका की पहली संख्या चयनित क्षेत्र के ऊपरी बाएँ कक्ष में दिखाई देगी। संपूर्ण तालिका खोलने के लिए बटन दबाएं। < एफ2> , और फिर - कुंजी संयोजन पर < CTRL> + < खिसक जाना> + < प्रवेश करना> .

अतिरिक्त समाश्रयण आँकड़े प्रपत्र में प्रदर्शित किए जाएंगे (तालिका 9.3):

तालिका 9.3

गुणांक मूल्य

गुणांक मूल्य

आरएमएस
विचलन

आरएमएस
विचलन

गुणक
निर्धारण

आरएमएस
विचलन

आंकड़े

स्वतंत्रता की डिग्री की संख्या

वर्गों का प्रतिगमन योग

वर्गों का अवशिष्ट योग

फ़ंक्शन को लागू करने के परिणामस्वरूप लाइनस्टहम पाते हैं:

( 2 मार्ग) डेटा विश्लेषण उपकरण का उपयोग करना वापसी आप प्रतिगमन आँकड़ों के परिणाम प्राप्त कर सकते हैं, भिन्नता का विश्लेषण, कॉन्फिडेंस इंटरवल, रेसिडुअल्स, रिग्रेशन फिटिंग प्लॉट्स, रेसिडुअल प्लॉट्स, और नॉर्मल प्रोबेबिलिटी प्लॉट्स। प्रक्रिया निम्नलिखित है:

1. आपको पहुंच की जांच करने की आवश्यकता है विश्लेषण पैकेज. ऐसा करने के लिए, मुख्य मेनू में (एमएस एक्सेल विकल्पों तक पहुंचने के लिए माइक्रोसॉफ्ट ऑफिस बटन के माध्यम से) "विकल्प" में एमएसएक्सेल» "ऐड-ऑन" कमांड चुनें और दाईं ओर ऐड-ऑन चुनें पैकेज विश्लेषण एक फिर "गो" बटन पर क्लिक करें (चित्र 9.13)। खुलने वाले संवाद बॉक्स में, "विश्लेषण पैकेज" के बगल में स्थित बॉक्स को चेक करें और "ओके" पर क्लिक करें (चित्र 9.14)।

"विश्लेषण" समूह में "डेटा" टैब पर, आपके पास इंस्टॉल किए गए ऐड-इन तक पहुंच होगी। (चित्र। 9.15)।

चावल।9 .13. ऐड-ऑन सक्षम करेंएमएसएक्सेल

चावल।9 ।चौदह। ऐड-इन्स डायलॉग बॉक्स

चावल।9 .15. रिबन पर डेटा विश्लेषण ऐड-इनएमएसएक्सेल 2007 .

2. "विश्लेषण" समूह में "डेटा" पर चयन करें, कमांड का चयन करें विश्लेषण हाँ एन निह खुलने वाले डायलॉग बॉक्स में, "रिग्रेशन" विश्लेषण टूल चुनें और "ओके" पर क्लिक करें (चित्र 9.16):

चावल।9 .16. डेटा विश्लेषण संवाद बॉक्स

दिखाई देने वाले संवाद बॉक्स में (चित्र 9.17), फ़ील्ड भरें:

इनपुट अंतरालयू- प्रभावी विशेषता Y के डेटा वाली श्रेणी;

इनपुट अंतरालएक्स- व्याख्यात्मक विशेषता X के डेटा वाली श्रेणी;

टैग- एक ध्वज जो इंगित करता है कि पहली पंक्ति में स्तंभों के नाम हैं या नहीं;

कॉन्स्टोचींटी शून्य- समीकरण में एक मुक्त पद की उपस्थिति या अनुपस्थिति का संकेत देने वाला ध्वज;

आउटपुट अंतराल- यह भविष्य की सीमा के ऊपरी बाएँ सेल को इंगित करने के लिए पर्याप्त है;

नई कार्यपत्रक- आप नई शीट के लिए मनमाना नाम सेट कर सकते हैं जिस पर परिणाम प्रदर्शित होंगे।

चावल।9 .17. रिग्रेशन डायलॉग बॉक्स

अवशिष्ट जानकारी, अवशिष्ट भूखंड, फिटिंग और सामान्य संभावना के लिए, संवाद बॉक्स में उपयुक्त चेकबॉक्स का चयन करें।

चावल। 9 . 18 . उपकरण लागू करने के परिणामवापसी

पर एमएसएक्सेल प्रवृत्ति रेखाबार चार्ट या लाइन चार्ट में जोड़ा जा सकता है। इसके लिए:

1. चार्ट निर्माण क्षेत्र का चयन करना और रिबन में "लेआउट" का चयन करना और विश्लेषण समूह (चित्र। 9.19.) में "ट्रेंड लाइन" कमांड का चयन करना आवश्यक है। ड्रॉप-डाउन मेनू आइटम में, "उन्नत ट्रेंडलाइन विकल्प" चुनें।

चावल। 1.19.फीता

2. दिखाई देने वाले डायलॉग बॉक्स में, वास्तविक मानों का चयन करें, फिर "ट्रेंड लाइन फॉर्मेट" डायलॉग बॉक्स (चित्र 9.20.) खुलेगा जिसमें ट्रेंड लाइन प्रकार का चयन किया जाता है और उपयुक्त पैरामीटर सेट किए जाते हैं।

चावल। 9 . 20 . डायलॉग विंडो"ट्रेंड लाइन प्रारूप"

बहुपद प्रवृत्ति के लिए, आपको अनुमानित बहुपद की डिग्री, रैखिक फ़िल्टरिंग के लिए, औसत बिंदुओं की संख्या निर्दिष्ट करनी होगी।

चुनना रैखिकएक रैखिक प्रतिगमन समीकरण बनाने के लिए।

जैसा अतिरिक्त जानकारीकर सकते हैं di . पर समीकरण दिखाओएकचनातथा आरेख पर एक मान डालें(अंजीर.9.21)।

चावल। 9 . 21 . रैखिक प्रवृत्ति

नॉनलाइनियर रिग्रेशन मॉडल एक्सेल में चयनित सांख्यिकीय फ़ंक्शन का उपयोग करके समीकरण मापदंडों की गणना करते समय सचित्र हैं लीGRFPRIBL. गणना प्रक्रिया LINEST फ़ंक्शन का उपयोग करने के समान है।

युग्मित रैखिक प्रतिगमन

प्रारंभिक गणना:

;
;
;
;
;

;
.

एक व्यू टेबल बनाना

अर्थ

मापदंडों की गणना के लिए सूत्र:

,
.

रैखिक

कनेक्शन की जकड़न का अनुमान:

ए) सहसंबंध गुणांक
, या
;

कंप्यूटर चयन के लिए, अंतर्निहित फ़ंक्शन का उपयोग करें कोरल

बी) लोच का गुणांक
;

ग) निर्धारण का गुणांक .

समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन:

प्रपत्र की तालिका के निर्माण के साथ प्रारंभिक गणना

एक) एफ - फिशर की कसौटीस्वतंत्रता की डिग्री की संख्या के साथ
तथा
और 0.05 का महत्व स्तर, तालिका देखें। मानदंड का अनुमानित मूल्य:

.

यदि F-मानदंड का परिकलित मान सारणीबद्ध मान से अधिक है, तो सुविधाओं के महत्वपूर्ण संबंध की अनुपस्थिति के बारे में शून्य परिकल्पना एक्सतथा आप खारिज कर दिया जाता है, और इस रिश्ते के महत्व के बारे में एक निष्कर्ष निकाला जाता है।

बी) औसत सन्निकटन त्रुटि

.

प्रतिगमन मापदंडों के महत्व का अनुमान:

ए) पैरामीटर की मानक त्रुटि एक सूत्र द्वारा गणना

, कहाँ पे
.

बी) प्रतिगमन गुणांक की मानक त्रुटि बीसूत्र द्वारा गणना

.

ग) सहसंबंध गुणांक की मानक त्रुटि सूत्र द्वारा गणना

.

टी-स्वतंत्रता की डिग्री की संख्या के साथ छात्र की कसौटी
और 0.05 का महत्व स्तर, तालिका देखें।

वास्तविक मूल्य टी- आँकड़े:

,
,
.

यदि वास्तविक मान निरपेक्ष मान में तालिका मान से अधिक है, तो प्रतिगमन पैरामीटर के महत्वहीन होने की परिकल्पना को अस्वीकार किया जा सकता है, पैरामीटर को महत्वपूर्ण माना जाता है।

के बीच संबंधएफ - फिशर की कसौटी तथा टी -छात्र की कसौटीसमानता द्वारा व्यक्त किया जाता है

.

प्रतिगमन मापदंडों के लिए विश्वास अंतराल की गणना:

पैरामीटर के लिए कॉन्फिडेंस इंटरवल एक के रूप में परिभाषित किया गया है
;

प्रतिगमन गुणांक के लिए विश्वास अंतराल के रूप में परिभाषित किया गया है
.

कंप्यूटर विश्लेषण के लिए एक्सेल में प्रयोग करें सेवा/डेटा विश्लेषण/प्रतिगमन।

अंतराल पूर्वानुमान के आधार पर रेखीय समीकरणप्रतिगमन:

होने देना - कारक विशेषता का अनुमानित मूल्य;
- प्रभावी सुविधा का बिंदु पूर्वानुमान। फिर

ए) औसत पूर्वानुमान त्रुटि :

;

बी) पूर्वानुमान विश्वास अंतराल

स्प्रेडशीट संपादक का उपयोग करनाएमएस एक्सेल

ऐड-इन सक्रियणविश्लेषण पैकेज

ऐड-ऑन सक्रिय करने के लिए विश्लेषण पैकेजआपको निम्न कार्य करने की आवश्यकता है:

1. एक टीम चुनें सेवा / ऐड-ऑन।

2. दिखाई देने वाले डायलॉग बॉक्स में, बॉक्स को चेक करें विश्लेषण पैकेज।

असाइनमेंट विकल्प के अनुसार, सांख्यिकीय सामग्री का उपयोग करते हुए, ज़रूरी:

2. सहसंबंध और निर्धारण संकेतकों का उपयोग करके आश्रित चर (परिणामी कारक) और व्याख्यात्मक चर के बीच संबंध की निकटता का आकलन करें।

3. के साथ दर एफ- फिशर की कसौटी मॉडलिंग की सांख्यिकीय विश्वसनीयता।

4. प्रतिगमन और सहसंबंध मापदंडों के सांख्यिकीय महत्व का आकलन करें।

5. औसत सन्निकटन त्रुटि ज्ञात कीजिए।

6. लोच गुणांक का उपयोग करके, परिणाम पर व्याख्यात्मक कारक के प्रभाव को मापें।

7. एक परिणामी विशेषता का एक बिंदु और अंतराल पूर्वानुमान करें जिसमें व्याख्यात्मक विशेषता में उसके औसत मूल्य (95% पूर्वानुमान विश्वसनीयता) के 25% की वृद्धि हो।

8. प्रारंभिक डेटा के सहसंबंध क्षेत्र और प्रतिगमन रेखा को एक आरेख पर दिखाएं।

उदाहरण

डेटा मास्टर ऑफ बिजनेस एडमिनिस्ट्रेशन प्रोग्राम की वार्षिक लागत और एक शैक्षणिक संस्थान में छात्रों की संख्या पर उपलब्ध हैं।

I. दस्तावेज़ में प्रारंभिक डेटा दर्ज करना एक्सेल.

द्वितीय. हम ऐड-इन कहते हैं डेटा विश्लेषणव्यंजक सूची में सेवा।

III. एक उपकरण चुनना वापसी.

चतुर्थ। उपयुक्त विंडो पोजीशन भरें प्रतिगमन।

V. OK पर क्लिक करने के बाद, हमें समस्या को हल करने के लिए एक प्रोटोकॉल मिलता है।

VI. हम प्राप्त प्रोटोकॉल का विश्लेषण करते हैं।

1) प्रतिगमन गुणांक;

समाश्रयण समीकरण का मुक्त पद
.

टिप्पणी. यदि आवश्यक हो, तो परिणाम वांछित सटीकता के लिए गोल किए जाते हैं। मेनू में दशमलव स्थानों की संख्या निर्धारित करके प्रारंभ में गोलाई की आवश्यकता की जा सकती है सेल प्रारूप।

युग्मित रैखिक समाश्रयण समीकरण का रूप है: .

2) सहसंबंध गुणांक
, लक्षणों के बीच घनिष्ठ संबंध को दर्शाता है आपतथा एक्स. निर्धारण गुणांक
. परिणामी प्रतिगमन समीकरण 53% विशेषता भिन्नता की व्याख्या करता है आप, इस सुविधा की शेष 47% परिवर्तनशीलता मॉडल में ध्यान में नहीं रखे गए कारकों के प्रभाव के कारण है।

3) समग्र रूप से समीकरण के सांख्यिकीय महत्व (सिमुलेशन विश्वसनीयता) का मूल्यांकन करें। फिशर मानदंड का परिकलित मान प्रोटोकॉल में दर्शाया गया है,
. इस मानदंड का महत्वपूर्ण मान सांख्यिकीय फ़ंक्शन का उपयोग करके पाया जा सकता है एफवितरणस्प्रेडशीट संपादक एक्सेल.

इस फ़ंक्शन के इनपुट पैरामीटर हैं:

- महत्व स्तर (प्रायिकता), जिसका अर्थ है निर्मित प्रतिगमन समीकरण के सांख्यिकीय महत्व के बारे में सही परिकल्पना को अस्वीकार करने के लिए त्रुटि की संभावना। एक नियम के रूप में, 0.05 या 0.01 का महत्व स्तर चुना जाता है;

- स्वतंत्रता की डिग्री की संख्या 1 - युग्मित रैखिक प्रतिगमन के लिए प्रतिगमन समीकरण में चर के लिए मापदंडों की संख्या के साथ मेल खाता है
यह संख्या एक के बराबर है;

- स्वतंत्रता की डिग्री की संख्या 2 युग्मित रैखिक प्रतिगमन के लिए बराबर है
, कहाँ पे एन- प्रारंभिक सांख्यिकीय डेटा की मात्रा।

क्रियाएँ करना सम्मिलित करें / कार्य करें, जिसे आप चाहते हैं उसे चुनें।

चूंकि एफ-मानदंड का परिकलित मान सारणीबद्ध एक से अधिक है, 4.84 के बराबर, सुविधाओं x और y के बीच एक महत्वपूर्ण संबंध की अनुपस्थिति के बारे में शून्य परिकल्पना को खारिज कर दिया जाता है और इस संबंध के महत्व के बारे में निष्कर्ष निकाला जाता है।

4) मापदंडों के सांख्यिकीय महत्व का मूल्यांकन करें एकतथा बीप्रतिगमन समीकरण में . का उपयोग कर टी- छात्र की कसौटी।

छात्र के आँकड़ों के अनुमानित मूल्य
,
. संबंधित तालिका मान सांख्यिकीय फ़ंक्शन का उपयोग करके निर्धारित किया जा सकता है स्टुद्रस्पोब्र, स्वतंत्रता की डिग्री की संख्या है
.

चूंकि निरपेक्ष मान में वास्तविक मान 2.2 के बराबर सारणीबद्ध मान से अधिक है, इसलिए प्रतिगमन मापदंडों के महत्वहीन होने की परिकल्पना को खारिज किया जा सकता है।

5) औसत सन्निकटन त्रुटि निर्धारित करें,
. आपको तालिका के रूप में तैयार की गई सहायक गणना करने की आवश्यकता होगी।

इस प्रकार, इस प्रतिगमन समीकरण के लिए औसत सन्निकटन त्रुटि 12.66% है, युग्मित रैखिक प्रतिगमन मॉडल को संतोषजनक और पूर्वानुमान के लिए उपयुक्त माना जा सकता है।

6) कारक के प्रभाव का मात्रात्मक मूल्यांकन करें एक्सप्रति कारक आपलोच के गुणांक का उपयोग करना। जोड़ीदार रैखिक प्रतिगमन के लिए, इसे सूत्र द्वारा पाया जा सकता है
. हमारे पास है

.

इसलिए, श्रोताओं की संख्या में 1% की वृद्धि के साथ, वार्षिक मूल्य में 0.4% की कमी आएगी।

7) आइए पूर्वानुमान की गणना करें आपबढ़ते कारक के साथ एक्सऔसत का 25%।

पूर्वानुमान मूल्य।

फ़ीचर पॉइंट प्रेडिक्शन आप: .

औसत पूर्वानुमान त्रुटि है ,

कहाँ पे
अवशिष्ट भिन्नता है,
कारक का विचरण है एक्स.

योग का संख्यात्मक मान
प्रोटोकॉल में इसे अवशिष्ट एसएस के रूप में नामित किया गया है।

फिर
,
.

उपयोगिता आँकड़े प्राप्त करने का सबसे तेज़ तरीका - कारक का औसत मूल्य एक्सतथा - विचरण, उपकरण का लाभ उठाएं वर्णनात्मक आँकड़ेपैकेज में डेटा विश्लेषण।

परिणाम आउटपुट प्रोटोकॉल जैसा दिखता है

पूर्वानुमान विश्वास अंतराल: , जहाँ - छात्र की कसौटी का संगत सारणीबद्ध मान (फ़ंक्शन द्वारा पहले पाया गया स्टुद्रस्पोब्र,
).

फलस्वरूप,

वे। आप 95% सुनिश्चित हो सकते हैं कि 35 छात्रों के साथ एक वार्षिक पाठ्यक्रम की कीमत निर्दिष्ट सीमा के भीतर अलग-अलग होगी (3.65825 हजार डॉलर के एक बिंदु मूल्य पूर्वानुमान के साथ)।

8) चार्ट बनाने के लिए, निम्न कार्य करें:

स्टेप 1 सम्मिलित करें/चार्ट/ग्राफ

चरण 3पंक्ति/जोड़ें/मान/प्रतिगमन कारक मानों के एक स्तंभ को हाइलाइट करें − .

चरण 4अक्ष लेबलएक्स/ मानों का स्तंभ हाइलाइट करें एक्स.

चरण 4प्रत्येक श्रृंखला के लिए एक नाम निर्दिष्ट करें, निर्देशांक अक्षों और चार्ट के नाम पर हस्ताक्षर करें।

टिप्पणी।

एक कारक के मूल्य की साजिश करने के लिए एक्सइसी मान को बनाए रखते हुए आरोही क्रम में क्रमबद्ध किया जाना चाहिए आप. यह इस तरह किया जा सकता है डेटा/सॉर्ट/उस कॉलम का चयन करें जिसमें आप सॉर्ट करना चाहते हैं। उदाहरण के लिए,

स्वतंत्र कार्य के लिए कार्य

विकल्प 1

एक्स

आप

विकल्प 2

एक्स- 10 उद्यमों में पावर-टू-वेट अनुपात, kW;

आप- श्रम उत्पादकता, हजार रूबल।

विकल्प 3

एक्स- भूमि की गुणवत्ता, अंक;

आप- उत्पादकता, सी / हेक्टेयर।

विकल्प 4

एक्स- भूमि की गुणवत्ता, अंक;

आप- उत्पादकता, सी / हेक्टेयर।

विकल्प 5

एक्स- कारोबार;

आप- टर्नओवर के संबंध में वितरण लागत।

विकल्प 6

एक्स- प्रति कर्मचारी बिजली;

आप- प्रति कर्मचारी तैयार उत्पादों की रिहाई।

विकल्प 7

एक्स- परिवार की आय का स्तर;

आप- भोजन व्यय (प्रति 100 रूबल आय)।

नॉलेज बेस में अपना अच्छा काम भेजें सरल है। नीचे दिए गए फॉर्म का प्रयोग करें

अच्छा कामसाइट पर">

छात्र, स्नातक छात्र, युवा वैज्ञानिक जो अपने अध्ययन और कार्य में ज्ञान आधार का उपयोग करते हैं, वे आपके बहुत आभारी रहेंगे।

प्रकाशित किया गया एचटीटीपी:// www. सब अच्छा. एन/

रूसी संघ के शिक्षा और विज्ञान मंत्रालय

संघीय राज्य बजटीय शैक्षिक संस्थाउच्च शिक्षा

"कोम्सोमोल्स्क-ऑन-अमूर राज्य तकनीकी विश्वविद्यालय"

अर्थशास्त्र और प्रबंधन के संकाय

अर्थशास्त्र, वित्त और लेखा विभाग

गणना और ग्राफिक कार्य

अनुशासन में "अर्थमिति"

समूह छात्र

ए.यू. ज़ैचेंको

शिक्षक

आई.आई. एंटोनोवा

तालिका एक

क्षेत्र संख्या

औसत प्रति व्यक्ति निर्वाह न्यूनतम प्रति दिन एक सक्षम व्यक्ति के लिए, रगड़।

औसत दैनिक वेतन, रगड़।,

आवश्यक:

1. से एक रैखिक युग्म समाश्रयण समीकरण बनाएँ।

3. फिशर के टी-टेस्ट और स्टूडेंट के टी-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध मापदंडों के सांख्यिकीय महत्व का आकलन करें।

4. भविष्यवाणी चलाएँ वेतनऔसत प्रति व्यक्ति निर्वाह न्यूनतम के अनुमानित मूल्य के साथ, जो औसत स्तर का 107% है।

5. पूर्वानुमान त्रुटि और उसके विश्वास अंतराल की गणना करके पूर्वानुमान की सटीकता का आकलन करें।

6. एक ग्राफ़ पर प्रारंभिक डेटा और सैद्धांतिक रेखा खींचिए।

1. रैखिक प्रतिगमन समीकरण के मापदंडों की गणना करने के लिए, हम एक गणना तालिका 2 बनाते हैं। रैखिक सहसंबंधसन्निकटन प्रतिगमन

तालिका 2

अर्थ

प्राप्त प्रतिगमन समीकरण:

प्रति व्यक्ति निर्वाह में न्यूनतम 1 रगड़ की वृद्धि के साथ। औसत दैनिक वेतन में औसतन 0.89 रूबल की वृद्धि होती है।

2. सहसंबंध गुणांक द्वारा रैखिक संबंध की जकड़न का अनुमान लगाया जाएगा:

इसका मतलब यह है कि मजदूरी में भिन्नता का 51% () कारक की भिन्नता द्वारा समझाया गया है - औसत प्रति व्यक्ति निर्वाह न्यूनतम।

मॉडल की गुणवत्ता औसत सन्निकटन त्रुटि से निर्धारित होती है:

निर्मित मॉडल की गुणवत्ता का मूल्यांकन अच्छे के रूप में किया जाता है, क्योंकि यह 8-10% से अधिक नहीं होता है।

3. हम फिशर-मानदंड का उपयोग करके समग्र रूप से प्रतिगमन समीकरण के महत्व का अनुमान लगाएंगे। वास्तविक मूल्य -मानदंड:

पांच प्रतिशत महत्व स्तर और स्वतंत्रता की डिग्री पर मानदंड का सारणीबद्ध मूल्य है। चूंकि प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है।

आकलन आंकड़ों की महत्ताप्रतिगमन मापदंडों को छात्र के आंकड़ों का उपयोग करके और प्रत्येक संकेतक के लिए आत्मविश्वास अंतराल की गणना करके किया जाएगा।

स्वतंत्रता की डिग्री की संख्या के लिए मानदंड का सारणीबद्ध मूल्य और होगा।

आइए यादृच्छिक त्रुटियों को परिभाषित करें:

-आँकड़े का वास्तविक मान तालिका मान से अधिक है:

इसलिए, पैरामीटर और शून्य से यादृच्छिक रूप से भिन्न नहीं हैं, लेकिन सांख्यिकीय रूप से महत्वपूर्ण हैं। आइए प्रतिगमन मापदंडों के लिए विश्वास अंतराल की गणना करें और। ऐसा करने के लिए, हम प्रत्येक संकेतक के लिए सीमांत त्रुटि को परिभाषित करते हैं:

विश्वास अंतराल:

विश्वास अंतराल की ऊपरी और निचली सीमाओं के विश्लेषण से यह निष्कर्ष निकलता है कि, एक संभावना के साथ, पैरामीटर और, संकेतित सीमाओं के भीतर होने के कारण, शून्य मान नहीं लेते हैं, अर्थात। सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं और शून्य से काफी भिन्न हैं।

4. प्रतिगमन समीकरण के प्राप्त अनुमान हमें इसे पूर्वानुमान के लिए उपयोग करने की अनुमति देते हैं। यदि निर्वाह का पूर्वानुमान मूल्य न्यूनतम है:

तब मजदूरी का पूर्वानुमान मूल्य होगा:

पूर्वानुमान त्रुटि होगी:

सीमांत पूर्वानुमान त्रुटि, जो मामलों में पार नहीं की जाएगी, होगी:

पूर्वानुमान विश्वास अंतराल:

औसत मासिक वेतन का पूरा पूर्वानुमान विश्वसनीय () है और 131.66 रूबल की सीमा में है। 190.62 रूबल तक। अंत में, हम एक ही ग्राफ पर प्रारंभिक डेटा और सैद्धांतिक सीधी रेखा को प्लॉट करेंगे (चित्र 1)

चित्र 1

Allbest.ru . पर होस्ट किया गया

इसी तरह के दस्तावेज़

    रैखिक जोड़ी प्रतिगमन समीकरण का निर्माण, रैखिक जोड़ी सहसंबंध गुणांक और औसत सन्निकटन त्रुटि की गणना करना। सहसंबंध गुणांक और लोच का निर्धारण, सहसंबंध सूचकांक, अर्थमिति में फिशर मानदंड के आवेदन का सार।

    परीक्षण, जोड़ा गया 05/05/2010

    युग्मित रैखिक प्रतिगमन के मापदंडों की गणना। फिशर और छात्र के परीक्षणों का उपयोग करके प्रतिगमन समीकरण और उसके मापदंडों के सांख्यिकीय महत्व का मूल्यांकन। युग्मित सहसंबंध गुणांकों के एक मैट्रिक्स का निर्माण। सांख्यिकीय विश्लेषणपीपीपी एमएस एक्सेल का उपयोग करना।

    परीक्षण, जोड़ा गया 05/14/2008

    जोड़ी और आंशिक सहसंबंध के रैखिक गुणांक की गणना। प्रतिगमन और सहसंबंध मापदंडों का सांख्यिकीय महत्व। सहसंबंध डेटा क्षेत्र का विश्लेषण। पूर्वानुमान सटीकता, त्रुटि गणना और विश्वास अंतराल। एकाधिक निर्धारण गुणांक।

    नियंत्रण कार्य, जोड़ा गया 12/11/2010

    प्रतिगमन गुणांक की आर्थिक व्याख्या। वर्गों का अवशिष्ट योग ज्ञात करना और अवशिष्टों के प्रसरण का अनुमान लगाना। छात्र के टी-टेस्ट का उपयोग करके प्रतिगमन समीकरण के मापदंडों के महत्व की जाँच करना। औसत की गणना रिश्तेदारों की गलतीसन्निकटन।

    परीक्षण, जोड़ा गया 03/23/2010

    प्रतिगमन गुणांक के लिए एक विश्वास अंतराल का निर्माण। सन्निकटन त्रुटि का निर्धारण, सहसंबंध सूचकांक और फिशर का एफ-परीक्षण। उत्पादों की भौतिक खपत में परिवर्तन की लोच का मूल्यांकन। एक रेखीय बहु समाश्रयण समीकरण का निर्माण।

    परीक्षण, जोड़ा गया 04/11/2015

    रैखिक प्रतिगमन समीकरण के मापदंडों की गणना, सहसंबंध और निर्धारण के संकेतकों का उपयोग करके रिश्ते की जकड़न का आकलन। औसत सन्निकटन त्रुटि का निर्धारण। फिशर के एफ-टेस्ट और स्टूडेंट के टी-टेस्ट का उपयोग करके मॉडलिंग की सांख्यिकीय विश्वसनीयता।

    परीक्षण, 10/17/2009 जोड़ा गया

    एक फर-असर वाले जानवर के द्रव्यमान की उसकी उम्र पर मात्रात्मक निर्भरता का निर्धारण। एक युग्मित प्रतिगमन समीकरण का निर्माण, इसके मापदंडों की गणना और पर्याप्तता का सत्यापन। प्रतिगमन मापदंडों के सांख्यिकीय महत्व का मूल्यांकन, उनके विश्वास अंतराल की गणना।

    प्रयोगशाला कार्य, जोड़ा गया 06/02/2014

    रूसी संघ के यूराल और पश्चिम साइबेरियाई क्षेत्रों में प्रति व्यक्ति नकद आय और उपभोक्ता खर्च के बीच संबंध के रूप के बारे में एक परिकल्पना का निर्माण। जोड़ी प्रतिगमन समीकरणों के मापदंडों की गणना, औसत सन्निकटन त्रुटि का उपयोग करके उनकी गुणवत्ता का मूल्यांकन।

    परीक्षण, जोड़ा गया 11/05/2014

    रैखिक प्रतिगमन मापदंडों के आकलन के लिए एक विधि के रूप में जोड़ी प्रतिगमन के लिए कम से कम वर्ग विधि का विश्लेषण। जोड़ी प्रतिगमन के रैखिक समीकरण पर विचार। एकाधिक रैखिक प्रतिगमन अध्ययन। प्रतिगमन गुणांक की त्रुटियों का अध्ययन करना।

    परीक्षण, जोड़ा गया 03/28/2018

    सहसंबंध क्षेत्र का निर्माण। युग्मित प्रतिगमन समीकरणों के मापदंडों की गणना। कुछ कारकों पर औसत जीवन प्रत्याशा की निर्भरता। "फिशर की कसौटी" का अध्ययन। सहसंबंध और निर्धारण के संकेतकों का उपयोग करके कनेक्शन की जकड़न का मूल्यांकन।

जोड़ी प्रतिगमन समीकरण.

सहसंबंध क्षेत्र के आधार पर, कोई (सामान्य जनसंख्या के लिए) परिकल्पना कर सकता है कि एक्स और वाई के सभी संभावित मूल्यों के बीच संबंध रैखिक है।

रैखिक समाश्रयण समीकरण y = bx + a + . है

सामान्य समीकरणों की प्रणाली।

एक n + b∑x = y

a∑x + b∑x 2 = y x

हमारे डेटा के लिए, समीकरणों की प्रणाली का रूप है

12ए + 1042 बी = 1709

1042 ए + 91556 बी = 149367

पहले समीकरण से हम व्यक्त करते हैं एकऔर दूसरे समीकरण में स्थानापन्न करें:

हमें अनुभवजन्य प्रतिगमन गुणांक मिलते हैं: बी = 0.9, ए = 64.21

प्रतिगमन समीकरण (अनुभवजन्य प्रतिगमन समीकरण):

वाई = 0.9 एक्स + 64.21

अनुभवजन्य प्रतिगमन गुणांक एकतथा बीकेवल सैद्धांतिक गुणांक β i के अनुमान हैं, और समीकरण ही विचाराधीन चरों के व्यवहार में केवल सामान्य प्रवृत्ति को दर्शाता है।

रैखिक प्रतिगमन के मापदंडों की गणना करने के लिए, हम एक गणना तालिका (तालिका 1) का निर्माण करेंगे।

1. प्रतिगमन समीकरण के पैरामीटर।

नमूना का अर्थ है।

नमूना भिन्नताएं:

मानक विचलन

1.1. सहसंबंध गुणांक

सहप्रसरण.

हम संचार की निकटता के संकेतक की गणना करते हैं। ऐसा संकेतक एक चयनात्मक रैखिक सहसंबंध गुणांक है, जिसकी गणना सूत्र द्वारा की जाती है:

1.2. प्रतिगमन समीकरण(प्रतिगमन समीकरण का मूल्यांकन)।

रैखिक समाश्रयण समीकरण y = 0.9 x + 64.21 . है

1.3. लोच गुणांक.

लोच का गुणांक सूत्र द्वारा पाया जाता है:

1.4. सन्निकटन त्रुटि.

5%-7% के भीतर सन्निकटन त्रुटि मूल डेटा के लिए प्रतिगमन समीकरण के एक अच्छे चयन का संकेत देती है।

1.5. अनुभवजन्य सहसंबंध संबंध।

अनुभवजन्य सहसंबंध अनुपात की गणना सभी प्रकार के कनेक्शन के लिए की जाती है और निर्भरता की निकटता को मापने के लिए कार्य करती है। भीतर परिवर्तन।

सहसंबंध सूचकांक.

रैखिक प्रतिगमन के लिए, सहसंबंध सूचकांक सहसंबंध गुणांक r xy = 0.79 के बराबर है।

निर्भरता के किसी भी रूप के लिए, कनेक्शन की जकड़न का उपयोग करके निर्धारित किया जाता है एकाधिक सहसंबंध गुणांक:

1.6. निर्धारण गुणांक।

अक्सर, निर्धारण के गुणांक की व्याख्या देते हुए, इसे प्रतिशत के रूप में व्यक्त किया जाता है।

R2 = 0.792 = 0.62

रैखिक प्रतिगमन मापदंडों की गुणवत्ता का आकलन करने के लिए, हम एक गणना तालिका (तालिका 2) का निर्माण करेंगे।

2. प्रतीपगमन समीकरण के प्राचलों का अनुमान।

2.1. सहसंबंध गुणांक का महत्व.

महत्व स्तर α पर शून्य परिकल्पना का परीक्षण करने के लिए कि एक सामान्य द्वि-आयामी यादृच्छिक चर का सामान्य सहसंबंध गुणांक एक प्रतिस्पर्धी परिकल्पना एच 1 ≠ 0 के साथ शून्य के बराबर है, मानदंड के देखे गए मूल्य की गणना करना आवश्यक है

और तालिका के अनुसार महत्वपूर्ण बिंदुछात्र का वितरण, महत्व स्तर α और स्वतंत्रता की डिग्री की संख्या k = n - 2 को देखते हुए, दो-तरफा महत्वपूर्ण क्षेत्र का महत्वपूर्ण बिंदु t क्रिट ज्ञात करें। अगर टी अवलोकन< t крит оснований отвергнуть нулевую гипотезу. Если |t набл | >टी क्रिट - शून्य परिकल्पना अस्वीकृत की जाती है।

महत्व स्तर के साथ छात्र तालिका के अनुसार α=0.05 और स्वतंत्रता की डिग्री k=10 हम टी आलोचना पाते हैं:

जहाँ m = 1 व्याख्यात्मक चरों की संख्या है।

2.2. सहसंबंध गुणांक (विश्वास अंतराल) के लिए अंतराल अनुमान।

2.3. प्रतिगमन गुणांक के अनुमानों के निर्धारण की सटीकता का विश्लेषण।

गड़बड़ी के विचरण का निष्पक्ष अनुमान मूल्य है:

एस 2 वाई = 53.63 - अस्पष्टीकृत विचरण (प्रतिगमन रेखा के चारों ओर आश्रित चर के फैलाव का एक उपाय)।

S y = 7.32 - अनुमान की मानक त्रुटि (प्रतिगमन की मानक त्रुटि)।

एसए मानक विचलनयादृच्छिक चर ए।

एस बी - यादृच्छिक चर बी का मानक विचलन।

2.4. आश्रित चर के लिए विश्वास अंतराल।

(ए + बीएक्स पी ± )

आइए हम अंतराल की सीमाओं की गणना करें जिसमें वाई के संभावित मूल्यों का 95% असीमित संख्या में अवलोकनों के साथ केंद्रित होगा और एक्स पी = 107

Y के लिए व्यक्तिगत विश्वास अंतरालों को X का मान दिया गया है।

(ए + बीएक्स मैं ± )

टी क्रिट (एन-एम-1;α/2) = (10;0.025) = 2.228

2.5. रेखीय प्रतीपगमन समीकरण के गुणांकों के संबंध में परीक्षण परिकल्पना।

1) टी-सांख्यिकी। छात्र की कसौटी।

टी क्रिट (एन-एम-1;α/2) = (10;0.025) = 2.228

प्रतीपगमन समीकरण के गुणांकों के लिए विश्वास अंतराल.

(बी - टी क्रिट एस बी; बी + टी क्रिट एस बी)

(ए - टी क्रिट एस ए; ए + टी क्रिट एस ए)

2) एफ-सांख्यिकी। फिशर की कसौटी।

स्वतंत्रता की डिग्री के साथ मानदंड का सारणीबद्ध मान k 1 \u003d 1 और k 2 \u003d 10, F तालिका \u003d 4.96

सेवा असाइनमेंट. ऑनलाइन सेवा की मदद से आप पा सकते हैं:
  • रैखिक प्रतिगमन समीकरण के पैरामीटर y=a+bx , रैखिक गुणांकइसके महत्व के परीक्षण के साथ सहसंबंध;
  • सहसंबंध और निर्धारण संकेतकों का उपयोग करके कनेक्शन की जकड़न, कम से कम वर्ग अनुमान, फिशर के एफ-टेस्ट और छात्र के टी-टेस्ट का उपयोग करके प्रतिगमन मॉडलिंग की स्थिर विश्वसनीयता, महत्व स्तर α के लिए पूर्वानुमान का आत्मविश्वास अंतराल

जोड़ीदार समाश्रयण समीकरण संदर्भित करता है प्रथम कोटि समाश्रयण समीकरण. यदि एक अर्थमितीय मॉडल में केवल एक व्याख्यात्मक चर होता है, तो इसे एक जोड़ीदार प्रतिगमन कहा जाता है। दूसरा क्रम प्रतिगमन समीकरणतथा तीसरा क्रम प्रतिगमन समीकरणगैर-रैखिक प्रतिगमन समीकरणों का संदर्भ लें।

उदाहरण। युग्मित प्रतिगमन मॉडल बनाने के लिए आश्रित (व्याख्या) और व्याख्यात्मक चर का चयन करें। देना । सैद्धांतिक जोड़ी प्रतिगमन समीकरण का निर्धारण करें। निर्मित मॉडल की पर्याप्तता का आकलन करें (आर-स्क्वायर, टी-सांख्यिकी, एफ-सांख्यिकी की व्याख्या करें)।
समाधानपर आधारित होगा अर्थमितीय मॉडलिंग प्रक्रिया.
स्टेज 1 (स्टेजिंग) - मॉडलिंग के अंतिम लक्ष्यों का निर्धारण, मॉडल में भाग लेने वाले कारकों और संकेतकों का एक सेट और उनकी भूमिका।
मॉडल विनिर्देश - अध्ययन के उद्देश्य की परिभाषा और मॉडल के आर्थिक चर की पसंद।
स्थितिजन्य (व्यावहारिक) कार्य। क्षेत्र में 10 उद्यमों के लिए, हम श्रमिकों की कुल संख्या x (% में) में अत्यधिक कुशल श्रमिकों की हिस्सेदारी पर प्रति कार्यकर्ता y (हजार रूबल) उत्पादन की निर्भरता का अध्ययन करते हैं।
चरण 2 (एक प्राथमिकता) - पूर्व-मॉडल विश्लेषण आर्थिक सारअध्ययन के तहत घटना की, प्राथमिक जानकारी और प्रारंभिक मान्यताओं का गठन और औपचारिकता, विशेष रूप से, प्रारंभिक सांख्यिकीय डेटा की प्रकृति और उत्पत्ति और कई परिकल्पनाओं के रूप में यादृच्छिक अवशिष्ट घटकों से संबंधित।
पहले से ही इस स्तर पर, हम कार्यकर्ता के कौशल स्तर और उसके उत्पादन की स्पष्ट निर्भरता के बारे में बात कर सकते हैं, क्योंकि कार्यकर्ता जितना अधिक अनुभवी होगा, उसकी उत्पादकता उतनी ही अधिक होगी। लेकिन इस निर्भरता का मूल्यांकन कैसे करें?
जोड़ी प्रतिगमनदो चरों के बीच एक प्रतिगमन है - y और x, यानी फॉर्म का एक मॉडल:

जहाँ y आश्रित चर (परिणामी चिन्ह) है; x एक स्वतंत्र, या व्याख्यात्मक, चर (संकेत-कारक) है। "^" चिन्ह का अर्थ है कि चर x और y के बीच कोई सख्त कार्यात्मक निर्भरता नहीं है, इसलिए, लगभग हर व्यक्तिगत मामले में, y के मान में दो शब्द होते हैं:

जहाँ y प्रभावी विशेषता का वास्तविक मूल्य है; y x प्रतीपगमन समीकरण के आधार पर पाए जाने वाले प्रभावी गुण का सैद्धांतिक मान है; - यादृच्छिक मूल्य, जो प्रतिगमन समीकरण द्वारा प्राप्त सैद्धांतिक मूल्य से प्रभावी विशेषता के वास्तविक मूल्य के विचलन की विशेषता है।
रेखांकन दिखाएँ प्रतिगमन निर्भरताप्रति कर्मचारी उत्पादन और अत्यधिक कुशल श्रमिकों के हिस्से के बीच।


तीसरा चरण (पैरामीट्रिजेशन) - वास्तविक मॉडलिंग, यानी। पसंद सामान्य दृष्टि सेमॉडल, इसमें शामिल चर के बीच संबंधों की संरचना और रूप सहित। प्रतिगमन समीकरण में कार्यात्मक निर्भरता के प्रकार के चुनाव को मॉडल पैरामीट्रिजेशन कहा जाता है। चुनना जोड़ी प्रतिगमन समीकरण, अर्थात। केवल एक कारक अंतिम परिणाम y को प्रभावित करेगा।
चौथा चरण (सूचनात्मक) - आवश्यक सांख्यिकीय जानकारी का संग्रह, अर्थात। मॉडल में भाग लेने वाले कारकों और संकेतकों के मूल्यों का पंजीकरण। नमूने में 10 उद्योग उद्यम शामिल हैं।
चरण 5 (मॉडल पहचान) - उपलब्ध सांख्यिकीय डेटा का उपयोग करके अज्ञात मॉडल मापदंडों का अनुमान।
मॉडल के मापदंडों को निर्धारित करने के लिए, हम उपयोग करते हैं एलएसएम - कम से कम वर्ग विधि. सामान्य समीकरणों की प्रणाली इस तरह दिखेगी:
एक n + b∑x = y
a∑x + b∑x 2 = y x
प्रतिगमन मापदंडों की गणना करने के लिए, हम एक गणना तालिका (तालिका 1) का निर्माण करेंगे।
एक्सआपx2y2एक्स वाई
10 6 100 36 60
12 6 144 36 72
15 7 225 49 105
17 7 289 49 119
18 7 324 49 126
19 8 361 64 152
19 8 361 64 152
20 9 400 81 180
20 9 400 81 180
21 10 441 100 210
171 77 3045 609 1356

हम तालिका 1 (अंतिम पंक्ति) से डेटा लेते हैं, जिसके परिणामस्वरूप हमारे पास है:
10a + 171b = 77
171 ए + 3045 बी = 1356
यह एसएलएई क्रैमर विधि या उलटा मैट्रिक्स विधि द्वारा हल किया जाता है।
हमें अनुभवजन्य प्रतिगमन गुणांक मिलते हैं: b = 0.3251, a = 2.1414
अनुभवजन्य प्रतिगमन समीकरण का रूप है:
वाई = 0.3251 एक्स + 2.1414
चरण 6 (मॉडल सत्यापन) - वास्तविक और मॉडल डेटा की तुलना, मॉडल की पर्याप्तता का सत्यापन, मॉडल डेटा की सटीकता का आकलन।
विश्लेषण का उपयोग करके किया जाता है
दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...