औसत सन्निकटन त्रुटि ज्ञात कीजिए। प्रतिगमन समीकरण की गुणवत्ता का मूल्यांकन

के लिये संपूर्ण मूल्यांकननिर्मित अर्थमितीय एक की गुणवत्ता, निर्धारण के गुणांक, सहसंबंध सूचकांक, औसत सापेक्ष सन्निकटन त्रुटि जैसी विशेषताओं को निर्धारित किया जाता है, और प्रतिगमन समीकरण के महत्व का उपयोग करके जाँच की जाती है एफ- फिशर की कसौटी। सूचीबद्ध विशेषताएं काफी सार्वभौमिक हैं और दोनों रैखिक और गैर-रैखिक मॉडल के साथ-साथ दो या दो से अधिक कारक चर वाले मॉडल पर लागू की जा सकती हैं। सभी की गणना में मूल्य को परिभाषित करना सूचीबद्ध विशेषताएंगुणवत्ता कई अवशेषों द्वारा निभाई जाती है मैं, जिसकी गणना अध्ययन के तहत विशेषता के वास्तविक (अवलोकन से प्राप्त) मूल्यों से घटाकर की जाती है यीमॉडल समीकरण के अनुसार परिकलित मान y pi.

निर्धारण गुणांक

दिखाता है कि मॉडल में अध्ययन किए गए गुण में परिवर्तन के किस अनुपात को ध्यान में रखा गया है। दूसरे शब्दों में, निर्धारण के गुणांक से पता चलता है कि अध्ययन के तहत चर में परिवर्तन के किस हिस्से की गणना मॉडल में शामिल कारक चर में परिवर्तन के आधार पर की जा सकती है, जो चयनित प्रकार के फ़ंक्शन का उपयोग करके कारक चर और अध्ययन के तहत विशेषता को जोड़ता है। मॉडल समीकरण।

निर्धारण गुणांक R2 0 से 1 तक मान ले सकते हैं। निर्धारण का गुणांक जितना करीब होगा R2इकाई के लिए, बेहतर गुणवत्तामॉडल।

सहसंबंध सूचकांक निर्धारण के गुणांक को जानकर आसानी से गणना की जा सकती है:

सहसंबंध सूचकांक आरमॉडल में ध्यान में रखे गए कारकों और अध्ययन के तहत चर के बीच मॉडल का निर्माण करते समय चुने गए संबंधों के प्रकार की जकड़न की विशेषता है। रैखिक युग्म प्रतिगमन के मामले में, इसका निरपेक्ष मान युग्म सहसंबंध गुणांक के साथ मेल खाता है आर(एक्स, वाई), जिसे हमने पहले माना था, और के बीच रैखिक संबंध की जकड़न की विशेषता है एक्सतथा आप. सहसंबंध सूचकांक के मान, जाहिर है, 0 से 1 की सीमा में भी हैं। मान जितना करीब होगा आरएकता के लिए, चयनित प्रकार के फ़ंक्शन कारक चर और अध्ययन के तहत विशेषता को जितना अधिक निकटता से जोड़ते हैं, मॉडल की गुणवत्ता उतनी ही बेहतर होती है।

(2.11)

प्रतिशत के रूप में व्यक्त किया गया और मॉडल की सटीकता की विशेषता है। हल करते समय मॉडल की स्वीकार्य सटीकता व्यावहारिक कार्यविशिष्ट स्थिति को ध्यान में रखते हुए, आर्थिक व्यवहार्यता के विचारों के आधार पर निर्धारित किया जा सकता है। व्यापक रूप से इस्तेमाल किया जाने वाला मानदंड यह है कि सटीकता को संतोषजनक माना जाता है यदि औसत रिश्तेदारों की गलती 15% से कम। यदि एक ई रिले.ए.वी. 5% से कम है, तो कहा जाता है कि मॉडल में उच्च सटीकता है। विश्लेषण और पूर्वानुमान के लिए असंतोषजनक सटीकता वाले मॉडल का उपयोग करने की अनुशंसा नहीं की जाती है, अर्थात जब ई रिले.ए.वी. 15% से अधिक।

फिशर एफ-टेस्ट प्रतिगमन समीकरण के महत्व का मूल्यांकन करने के लिए प्रयोग किया जाता है। एफ-मानदंड का परिकलित मूल्य अनुपात से निर्धारित होता है:

. (2.12)

महत्वपूर्ण मान एफ-मानदंड α और स्वतंत्रता की डिग्री के दिए गए स्तर पर तालिकाओं से निर्धारित किया जाता है (आप एक्सेल में FDISP फ़ंक्शन का उपयोग कर सकते हैं)। यहाँ, अभी भी एममॉडल में ध्यान में रखे गए कारकों की संख्या है, एनअवलोकनों की संख्या है। यदि परिकलित मान महत्वपूर्ण मान से अधिक है, तो मॉडल समीकरण को सार्थक माना जाता है। परिकलित मान जितना बड़ा होगा एफ-मानदंड, मॉडल की गुणवत्ता जितनी बेहतर होगी।

आइए हम उस रैखिक मॉडल की गुणवत्ता विशेषताओं को निर्धारित करें जिसका हमने निर्माण किया है उदाहरण 1. आइए तालिका 2 के डेटा का उपयोग करें। निर्धारण गुणांक:

इसलिए, रैखिक मॉडल के भीतर, बिक्री की मात्रा में 90.1% की वृद्धि को हवा के तापमान में परिवर्तन द्वारा समझाया गया है।

सहसंबंध सूचकांक

.

एक युग्मित रैखिक मॉडल के मामले में सहसंबंध सूचकांक का मूल्य, जैसा कि हम देख सकते हैं, वास्तव में संबंधित चर (बिक्री मात्रा और तापमान) के बीच सहसंबंध गुणांक के बराबर मॉड्यूल है। चूंकि प्राप्त मूल्य एक के काफी करीब है, हम यह निष्कर्ष निकाल सकते हैं कि अध्ययन के तहत चर (बिक्री की मात्रा) और कारक चर (तापमान) के बीच एक करीबी रैखिक संबंध है।

फिशर एफ-टेस्ट

महत्वपूर्ण मान एफ क्रेα = 0.1 पर; वी 1 = 1; ν 2 =7-1-1=5 4.06 के बराबर है। अनुमानित मूल्य एफ-मानदंड सारणीबद्ध से बड़ा है, इसलिए, मॉडल समीकरण महत्वपूर्ण है।

औसत सापेक्ष सन्निकटन त्रुटि

निर्मित रैखिक जोड़ी प्रतिगमन मॉडल में असंतोषजनक सटीकता (> 15%) है, और इसे विश्लेषण और पूर्वानुमान के लिए उपयोग करने की अनुशंसा नहीं की जाती है।

नतीजतन, इस तथ्य के बावजूद कि अधिकांश सांख्यिकीय विशेषताएं उनके लिए मानदंडों को पूरा करती हैं, रैखिक युग्मित प्रतिगमन मॉडल हवा के तापमान के आधार पर बिक्री की मात्रा की भविष्यवाणी करने के लिए उपयुक्त नहीं है। अवलोकन संबंधी आंकड़ों के अनुसार इन चरों के बीच संबंध की गैर-रैखिक प्रकृति चित्र 1 में काफी स्पष्ट रूप से दिखाई देती है। किए गए विश्लेषण ने इसकी पुष्टि की।

सहसंबंध और निर्धारण के संकेतक

रैखिक जोड़ी प्रतिगमन

सहायक डेटा के आधार पर, जिनकी गणना तालिका में की गई है। 2, हम संचार की निकटता के संकेतक की गणना करते हैं।

यह सूचक एक नमूना है रैखिक गुणांकसहसंबंध की गणना सूत्र द्वारा की जाती है।

सहसंबंध गुणांक की गणना के परिणामों के आधार पर, यह निष्कर्ष निकाला जा सकता है कि कारक और परिणामी विशेषता के बीच संबंध प्रत्यक्ष और मजबूत है (चैडॉक पैमाने के अनुसार)।

सहसंबंध गुणांक के वर्ग को निर्धारण का गुणांक कहा जाता है, जो कारक गुण की भिन्नता द्वारा समझाया गया परिणामी गुण की भिन्नता का अनुपात दर्शाता है।

आमतौर पर, निर्धारण के गुणांक की व्याख्या देते हुए, इसे प्रतिशत के रूप में व्यक्त किया जाता है।

आर 2 \u003d 0.847 2 \u003d 0.7181

वे। 71.81% मामलों में, कारक विशेषता में परिवर्तन से परिणामी गुण में परिवर्तन होता है। प्रतिगमन समीकरण के चयन की सटीकता काफी अधिक है। Y में शेष 28.19% परिवर्तन उन कारकों द्वारा समझाया गया है जिन्हें मॉडल में ध्यान में नहीं रखा गया है।

पावर जोड़ी रिग्रेशन

पावर जोड़ी प्रतिगमन के लिए परिणामी और कारक चिह्न के बीच संबंध की निकटता सहसंबंध गुणांक का उपयोग करके निर्धारित की जाती है:

ज्ञात डेटा को प्रतिस्थापित करते हुए, हम प्राप्त करते हैं:

निर्धारण संकेतक।

वे। 69% मामलों में, कारक गुण में परिवर्तन से परिणामी गुण में परिवर्तन होता है। प्रतिगमन समीकरण के चयन की सटीकता औसत है। Y में शेष 31% परिवर्तन उन कारकों द्वारा समझाया गया है जिन्हें मॉडल में ध्यान में नहीं रखा गया है।

औसत सन्निकटन त्रुटि

रैखिक जोड़ी प्रतिगमन

आइए हम निरपेक्ष सन्निकटन त्रुटि का उपयोग करके प्रतिगमन समीकरण की गुणवत्ता का मूल्यांकन करें। औसत सन्निकटन त्रुटि वास्तविक से परिकलित मानों का औसत विचलन है:

पावर जोड़ी रिग्रेशन

औसत सन्निकटन त्रुटि वास्तविक से परिकलित मानों का औसत विचलन है:

5%-7% के भीतर सन्निकटन त्रुटि मूल डेटा के लिए प्रतिगमन समीकरण के एक अच्छे चयन का संकेत देती है।

चूंकि त्रुटि 7% से अधिक है, इसलिए यह समीकरण प्रतिगमन के रूप में उपयोग करने के लिए वांछनीय नहीं है।

प्रतिगमन मॉडलिंग के परिणामों की सांख्यिकीय विश्वसनीयता के फिशर एफ-मानदंड का उपयोग करके अनुमान

रैखिक जोड़ी प्रतिगमन

निर्धारण गुणांक R 2 का उपयोग समीकरण के महत्व की जाँच करने के लिए किया जाता है रेखीय प्रतिगमनआम तौर पर।

फिशर के एफ-टेस्ट का उपयोग करके प्रतिगमन मॉडल के महत्व की जांच की जाती है, जिसका परिकलित मूल्य अध्ययन के तहत संकेतक की टिप्पणियों की प्रारंभिक श्रृंखला के विचरण के अनुपात के रूप में पाया जाता है और अवशिष्ट अनुक्रम के विचरण के निष्पक्ष अनुमान के रूप में पाया जाता है। यह मॉडल।

यदि k 1 =(m) और k 2 =(n-m-1) स्वतंत्रता की डिग्री के साथ परिकलित मान किसी दिए गए महत्व स्तर पर सारणीबद्ध मान से अधिक है, तो मॉडल को महत्वपूर्ण माना जाता है।

युग्मित रेखीय प्रतिगमन के सांख्यिकीय महत्व का आकलन निम्नलिखित एल्गोरिथम के अनुसार किया जाता है:

जहां एम = 1 जोड़ीदार प्रतिगमन के लिए।

चूंकि F> . का वास्तविक मान

पावर जोड़ी रिग्रेशन

इसी तरह लीनियर पेयर रिग्रेशन के लिए, हम पावर पेयर रिग्रेशन का अनुमान लगाएंगे

जहाँ m मॉडल में कारकों की संख्या है।

1. एक शून्य परिकल्पना सामने रखी जाती है कि समग्र रूप से समीकरण सांख्यिकीय रूप से महत्वहीन है: एच 0: आर 2 = 0 महत्व स्तर बी पर।

2. एफ-मानदंड का वास्तविक मूल्य निर्धारित करें:

जहां एम = 1 जोड़ीदार प्रतिगमन के लिए।

3. सारणीबद्ध मान किसी दिए गए महत्व स्तर के लिए फिशर वितरण तालिकाओं से निर्धारित किया जाता है, इस बात को ध्यान में रखते हुए कि स्वतंत्रता की डिग्री की संख्या कुल राशिवर्ग (बड़ा विचरण) 1 है और रैखिक प्रतिगमन में वर्गों के अवशिष्ट योग (निचला विचरण) की स्वतंत्रता की डिग्री की संख्या n-2 है।

एफ तालिका स्वतंत्रता और महत्व स्तर बी की दी गई डिग्री के लिए यादृच्छिक कारकों के प्रभाव में मानदंड का अधिकतम संभव मूल्य है। महत्व स्तर बी - सही परिकल्पना को खारिज करने की संभावना, बशर्ते कि यह सच हो। आमतौर पर b को 0.05 या 0.01 के बराबर लिया जाता है।

4. यदि F-मानदंड का वास्तविक मान तालिका मान से कम है, तो वे कहते हैं कि शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है।

अन्यथा, शून्य परिकल्पना को अस्वीकार कर दिया जाता है और संभाव्यता (1-बी) के साथ समीकरण के सांख्यिकीय महत्व के बारे में वैकल्पिक परिकल्पना को समग्र रूप से स्वीकार किया जाता है।

स्वतंत्रता की डिग्री के साथ मानदंड का सारणीबद्ध मूल्य:

के 1 \u003d 1 और के 2 \u003d 8, एफ टेबल \u003d 5.32

चूंकि एफ> एफ तालिका का वास्तविक मूल्य, निर्धारण का गुणांक सांख्यिकीय रूप से महत्वपूर्ण है (प्रतिगमन समीकरण का पाया गया अनुमान सांख्यिकीय रूप से विश्वसनीय है)।

विश्लेषण के परिणामों के आधार पर, हम यह निष्कर्ष निकालते हैं कि रैखिक जोड़ी प्रतिगमन और शक्ति जोड़ी प्रतिगमन दोनों के निर्धारण के गुणांक सांख्यिकीय रूप से महत्वपूर्ण हैं।

चूंकि रैखिक जोड़ीदार प्रतिगमन में उच्च (घातीय रूप से) निर्धारण गुणांक होता है, हम मानते हैं कि यह वह है जो कारक और परिणामी विशेषता के बीच संबंध का पर्याप्त रूप से वर्णन करता है।

आइए व्यक्तिगत प्रतिगमन गुणांक की समानता के बारे में परिकल्पना एच 0 का परीक्षण करें (वैकल्पिक एच 1 के बराबर नहीं है) महत्व स्तर बी = 0.05 पर।

यदि मुख्य परिकल्पना असत्य हो जाती है, तो हम वैकल्पिक परिकल्पना को स्वीकार करते हैं। इस परिकल्पना का परीक्षण करने के लिए विद्यार्थी के t-परीक्षण का प्रयोग किया जाता है।

अवलोकन संबंधी डेटा (इसे प्रेक्षित या वास्तविक भी कहा जाता है) से प्राप्त टी-टेस्ट के मूल्य की तुलना छात्र के वितरण तालिकाओं (जो आमतौर पर पाठ्यपुस्तकों और सांख्यिकी या अर्थमिति पर कार्यशालाओं के अंत में दी जाती है) से निर्धारित सारणीबद्ध (महत्वपूर्ण) मान से की जाती है। )

सारणीबद्ध मान महत्व स्तर (बी) और स्वतंत्रता की डिग्री की संख्या के आधार पर निर्धारित किया जाता है, जो रैखिक जोड़ी प्रतिगमन के मामले में (एन-2) है, एन अवलोकनों की संख्या है।

यदि टी-मानदंड का वास्तविक मान सारणीबद्ध एक (निरपेक्ष मूल्य में) से अधिक है, तो मुख्य परिकल्पना को खारिज कर दिया जाता है और यह माना जाता है कि संभावना (1-बी) में पैरामीटर या सांख्यिकीय विशेषता के साथ आबादीशून्य से काफी अलग।

यदि टी-मानदंड का वास्तविक मान सारणीबद्ध (मापांक में) से कम है, तो मुख्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है, अर्थात। सामान्य जनसंख्या में एक पैरामीटर या सांख्यिकीय विशेषता बी के महत्व स्तर पर शून्य से काफी भिन्न नहीं होती है।

टी क्रिट (एन-एम-1;बी/2) = (30;0.025) = 2.042

1.7 . के बाद से< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.

0.56 . के बाद से< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

प्रतीपगमन समीकरण के गुणांकों के लिए विश्वास अंतराल।

आइए हम प्रतीपगमन गुणांकों के विश्वास अंतराल का निर्धारण करें, जो 95% विश्वसनीयता के साथ इस प्रकार होगा:

  • (बी - टी क्रिट एस बी; बी + टी क्रिट एस बी)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

चूंकि बिंदु 0 (शून्य) अंदर स्थित है विश्वास अंतराल, फिर अंतराल अनुमानगुणांक बी सांख्यिकीय रूप से महत्वहीन है।

  • (ए - टी क्रिट एस ए; ए + टी क्रिट एस ए)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

95% की संभावना के साथ, यह तर्क दिया जा सकता है कि इस पैरामीटर का मान पाए गए अंतराल में होगा।

चूंकि बिंदु 0 (शून्य) विश्वास अंतराल के भीतर है, गुणांक a का अंतराल अनुमान सांख्यिकीय रूप से महत्वहीन है।

2) एफ-सांख्यिकी। फिशर की कसौटी।

निर्धारण गुणांक R 2 का उपयोग समग्र रूप से रेखीय प्रतीपगमन समीकरण के महत्व को जांचने के लिए किया जाता है।

फिशर के एफ-टेस्ट का उपयोग करके प्रतिगमन मॉडल के महत्व की जांच की जाती है, जिसका परिकलित मूल्य अध्ययन के तहत संकेतक की टिप्पणियों की प्रारंभिक श्रृंखला के विचरण के अनुपात के रूप में पाया जाता है और अवशिष्ट अनुक्रम के विचरण के निष्पक्ष अनुमान के रूप में पाया जाता है। यह मॉडल।

यदि k 1 =(m) और k 2 =(n-m-1) स्वतंत्रता की डिग्री के साथ परिकलित मान किसी दिए गए महत्व स्तर पर सारणीबद्ध मान से अधिक है, तो मॉडल को महत्वपूर्ण माना जाता है।

जहाँ m मॉडल में कारकों की संख्या है।

युग्मित रेखीय प्रतिगमन के सांख्यिकीय महत्व का आकलन निम्नलिखित एल्गोरिथम के अनुसार किया जाता है:

  • 1. एक शून्य परिकल्पना सामने रखी जाती है कि समग्र रूप से समीकरण सांख्यिकीय रूप से महत्वहीन है: एच 0: आर 2 = 0 महत्व स्तर बी पर।
  • 2. अगला, एफ-मानदंड का वास्तविक मूल्य निर्धारित करें:

जहां एम = 1 जोड़ीदार प्रतिगमन के लिए।

3. सारणीबद्ध मान किसी दिए गए महत्व स्तर के लिए फिशर वितरण तालिकाओं से निर्धारित किया जाता है, इस बात को ध्यान में रखते हुए कि वर्गों के कुल योग (बड़ा विचरण) के लिए स्वतंत्रता की डिग्री की संख्या 1 है और अवशिष्ट के लिए स्वतंत्रता की डिग्री की संख्या है रेखीय प्रतीपगमन में वर्गों (निम्न विचरण) का योग n-2 है।

एफ तालिका स्वतंत्रता और महत्व स्तर बी की दी गई डिग्री के लिए यादृच्छिक कारकों के प्रभाव में मानदंड का अधिकतम संभव मूल्य है। महत्व स्तर बी - सही परिकल्पना को खारिज करने की संभावना, बशर्ते कि यह सच हो। आमतौर पर b को 0.05 या 0.01 के बराबर लिया जाता है।

4. यदि F-मानदंड का वास्तविक मान तालिका मान से कम है, तो वे कहते हैं कि शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है।

अन्यथा, शून्य परिकल्पना को अस्वीकार कर दिया जाता है और संभाव्यता (1-बी) के साथ समीकरण के सांख्यिकीय महत्व के बारे में वैकल्पिक परिकल्पना को समग्र रूप से स्वीकार किया जाता है।

स्वतंत्रता की डिग्री के साथ मानदंड का सारणीबद्ध मान k 1 \u003d 1 और k 2 \u003d 30, F तालिका \u003d 4.17

चूंकि F . का वास्तविक मान< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

फिशर के एफ-परीक्षण और छात्र के टी-सांख्यिकी के बीच संबंध समानता द्वारा व्यक्त किया गया है:

प्रतिगमन समीकरण के गुणवत्ता संकेतक।

अवशेषों के स्वत: सहसंबंध के लिए जाँच करें।

कम से कम वर्गों के लिए उच्च गुणवत्ता वाले प्रतिगमन मॉडल के निर्माण के लिए एक महत्वपूर्ण शर्त मूल्यों की स्वतंत्रता है यादृच्छिक विचलनअन्य सभी अवलोकनों में विचलन मूल्यों से। यह सुनिश्चित करता है कि किसी भी विचलन और विशेष रूप से आसन्न विचलन के बीच कोई संबंध नहीं है।

ऑटोसहसंबंध (सीरियल सहसंबंध) को समय (समय श्रृंखला) या अंतरिक्ष (क्रॉस श्रृंखला) में आदेशित देखे गए संकेतकों के बीच सहसंबंध के रूप में परिभाषित किया गया है। अवशिष्टों (आउटलेयर्स) का स्वतःसहसंबंध सामान्यतः पाया जाता है प्रतिगमन विश्लेषणसमय श्रृंखला डेटा का उपयोग करते समय और बहुत कम ही क्रॉस-अनुभागीय डेटा का उपयोग करते समय।

आर्थिक समस्याओं में, सकारात्मक स्वसहसंबंध नकारात्मक स्वसहसंबंध की तुलना में बहुत अधिक सामान्य है। ज्यादातर मामलों में, सकारात्मक ऑटोसहसंबंध मॉडल में ध्यान में नहीं रखे गए कुछ कारकों के दिशात्मक निरंतर प्रभाव के कारण होता है।

ऋणात्मक स्वसहसंबंध का वास्तव में अर्थ है कि एक सकारात्मक विचलन के बाद एक ऋणात्मक विचलन होता है और इसके विपरीत। ऐसी स्थिति हो सकती है यदि मौसमी आंकड़ों (सर्दी-गर्मी) के अनुसार शीतल पेय की मांग और आय के बीच समान संबंध माना जाए।

स्वसहसंबंध के मुख्य कारणों में निम्नलिखित हैं:

  • 1. विशिष्टता त्रुटियां। मॉडल में किसी भी महत्वपूर्ण व्याख्यात्मक चर या निर्भरता के रूप के गलत विकल्प को ध्यान में रखने में विफलता आमतौर पर प्रतिगमन रेखा से अवलोकन बिंदुओं के व्यवस्थित विचलन की ओर ले जाती है, जिससे स्वत: सहसंबंध हो सकता है।
  • 2. जड़ता। अनेक आर्थिक संकेतक(मुद्रास्फीति, बेरोजगारी, जीएनपी, आदि) में एक निश्चित चक्रीयता होती है जो व्यावसायिक गतिविधि के उतार-चढ़ाव से जुड़ी होती है। इसलिए, संकेतकों में परिवर्तन तुरंत नहीं होता है, लेकिन एक निश्चित जड़ता है।
  • 3. वेब प्रभाव। कई औद्योगिक और अन्य क्षेत्रों में, आर्थिक संकेतक देरी (समय अंतराल) के साथ आर्थिक परिस्थितियों में बदलाव पर प्रतिक्रिया करते हैं।
  • 4. डेटा चौरसाई। अक्सर, एक निश्चित लंबी अवधि के लिए डेटा अपने घटक अंतराल पर डेटा के औसत से प्राप्त किया जाता है। इससे विचाराधीन अवधि के भीतर मौजूद उतार-चढ़ाव का एक निश्चित चौरसाई हो सकता है, जो बदले में स्वत: सहसंबंध का कारण बन सकता है।

ऑटोसहसंबंध के परिणाम विषमलैंगिकता के परिणामों के समान हैं: टी- और एफ-सांख्यिकी पर निष्कर्ष जो प्रतिगमन गुणांक और निर्धारण के गुणांक के महत्व को निर्धारित करते हैं, गलत हो सकते हैं।


अनुभवजन्य प्रतिगमन गुणांक बी 0, बी 1 एमएस एक्सेल स्प्रेडशीट प्रोसेसर के "डेटा विश्लेषण" ऐड-ऑन के "रिग्रेशन" टूल का उपयोग करके निर्धारित किया जाएगा।

गुणांक निर्धारित करने के लिए एल्गोरिथ्म इस प्रकार है।

1. स्प्रेडशीट एमएस एक्सेल में प्रारंभिक डेटा दर्ज करें।

2. डेटा विश्लेषण ऐड-ऑन (चित्र 2) को कॉल करें।

3. विश्लेषण उपकरण रिग्रेशन (चित्र 3) का चयन करें।

4. रिग्रेशन विंडो के संगत पदों को भरें (चित्र 4)।

5. रिग्रेशन विंडो के ओके बटन को दबाएं और समस्या को हल करने के लिए प्रोटोकॉल प्राप्त करें (चित्र 5)


चित्र 3 - रिग्रेशन टूल का चयन




चित्र 4 - विंडो रिग्रेशन

चित्र 5 - समस्या को हल करने के लिए प्रोटोकॉल

चित्रा 5 से पता चलता है कि अनुभवजन्य प्रतिगमन गुणांक क्रमशः बराबर हैं

ख 0 = 223

बी 1 = 0.0088।

फिर युग्मित रैखिक प्रतिगमन का समीकरण, जो मासिक पेंशन y के मूल्य को निर्वाह न्यूनतम के मूल्य से संबंधित करता है, का रूप है

.(3.2)

इसके अलावा, कार्य के अनुसार, निर्वाह न्यूनतम x और मासिक पेंशन y के बीच सांख्यिकीय संबंध की जकड़न का मूल्यांकन करना आवश्यक है। यह अनुमान सहसंबंध गुणांक का उपयोग करके लगाया जा सकता है। चित्रा 5 में इस गुणांक का मान एकाधिक आर के रूप में नामित किया गया है और क्रमशः 0.038 के बराबर है। चूंकि सैद्धांतिक रूप से इस गुणांक का मान -1 से +1 तक है, इसलिए हम यह निष्कर्ष निकाल सकते हैं कि निर्वाह न्यूनतम x और मासिक पेंशन y के बीच सांख्यिकीय संबंध महत्वपूर्ण नहीं है।

चित्रा 5 में दिखाया गया पैरामीटर "आर - वर्ग", सहसंबंध गुणांक का वर्ग है और इसे निर्धारण का गुणांक कहा जाता है। इस गुणांक का मान आश्रित चर y के विचरण के अनुपात को दर्शाता है, जिसे प्रतिगमन (व्याख्यात्मक चर x) द्वारा समझाया गया है। तदनुसार, 1- का मान, चर y के विचरण के अनुपात को दर्शाता है, जो कि अर्थमितीय मॉडल में अन्य सभी व्याख्यात्मक चरों के प्रभाव के कारण होता है। चित्र 5 से पता चलता है कि परिणामी अर्थमितीय मॉडल में सभी व्याख्यात्मक चरों का अनुपात लगभग 1-0.00145 = 0.998 या 99.8% है।



अगले चरण में, कार्य के अनुसार, लोच गुणांक का उपयोग करके व्याख्यात्मक चर x और आश्रित चर y के बीच संबंध की डिग्री निर्धारित करना आवश्यक है। एक युग्मित रैखिक प्रतिगमन मॉडल के लिए लोच गुणांक को इस प्रकार परिभाषित किया गया है:

इसलिए, जब निर्वाह न्यूनतम 1% बदलता है, तो मासिक पेंशन 0.000758% बदल जाती है।

. (3.4)

ऐसा करने के लिए, हम मूल तालिका 1 को दो स्तंभों के साथ पूरक करते हैं जिसमें हम निर्भरता (3.2) और अंतर के मूल्य का उपयोग करके गणना किए गए मान निर्धारित करते हैं।

तालिका 3.2. औसत सन्निकटन त्रुटि की गणना।

तब औसत सन्निकटन त्रुटि बराबर होती है

.

अभ्यास से ज्ञात होता है कि औसत सन्निकटन त्रुटि का मान (12 ... 15)% से अधिक नहीं होना चाहिए

अंतिम चरण में, हम F - फिशर की कसौटी का उपयोग करके मॉडलिंग की सांख्यिकीय विश्वसनीयता का मूल्यांकन करेंगे। ऐसा करने के लिए, हम स्थिति के अनुसार प्राप्त प्रतिगमन समीकरण के सांख्यिकीय महत्व के बारे में शून्य परिकल्पना एच 0 की जांच करेंगे:

यदि, किसी दिए गए महत्व स्तर पर a = 0.05, F-मानदंड का सैद्धांतिक (गणना) मान इसके महत्वपूर्ण मान F क्रिट (तालिका) से अधिक है, तो शून्य परिकल्पना को खारिज कर दिया जाता है, और परिणामी प्रतिगमन समीकरण को माना जाता है महत्वपूर्ण।

चित्र 5 से यह इस प्रकार है कि Fcalc = 0.0058। F-मानदंड का महत्वपूर्ण मान सांख्यिकीय फ़ंक्शन FDISP (चित्र 6) का उपयोग करके निर्धारित किया जाता है। फ़ंक्शन के इनपुट पैरामीटर महत्व स्तर (प्रायिकता) और स्वतंत्रता 1 और 2 की डिग्री की संख्या हैं। युग्मित प्रतिगमन मॉडल के लिए, स्वतंत्रता की डिग्री की संख्या क्रमशः 1 (एक व्याख्यात्मक चर) और n-2 के बराबर है। = 6-2 = 4।



चित्र 6 - सांख्यिकीय फ़ंक्शन की विंडो FDISP

चित्रा 6 से पता चलता है कि एफ-मानदंड का महत्वपूर्ण मूल्य 7.71 है।

चूंकि एफ कैल्क< F крит, то нулевая гипотеза не отвергается и полученное प्रतिगमन समीकरणसांख्यिकीय रूप से महत्वहीन।

13. मॉडल बिल्डिंग एकाधिक प्रतिगमनएक्सेल का उपयोग करना।

असाइनमेंट विकल्प के अनुसार सांख्यिकीय सामग्री का उपयोग करना आवश्यक है।

1. बिल्ड रेखीय समीकरणएकाधिक प्रतिगमन व्याख्या आर्थिक भावनाइसके पैरामीटर।

2. औसत (सामान्य) लोच गुणांक का उपयोग करके उत्पादक विशेषता वाले कारकों के संबंध की निकटता का तुलनात्मक मूल्यांकन देना।

3. दर आंकड़ों की महत्ताछात्र के टी-टेस्ट और एफ-टेस्ट का उपयोग करके समीकरण के महत्व के बारे में शून्य परिकल्पना का उपयोग करते हुए प्रतिगमन गुणांक।

4. औसत सन्निकटन त्रुटि का निर्धारण करके समीकरण की गुणवत्ता का मूल्यांकन करें।

युग्मित प्रतिगमन मॉडल बनाने के लिए प्रारंभिक डेटा तालिका 3.3 में दिया गया है।

तालिका 3.3। प्रारंभिक आंकड़े।

शुद्ध आय, एमएलएन यूएसडी पूंजी का कारोबार, एमएल। अमेरिकी डॉलर, x 1 प्रयुक्त पूंजी, एमएल। अमेरिकी डॉलर, x 2
6,6 6,9 83,6
2,7 93,6 25,4
1,6 10,0 6,4
2,4 31,5 12,5
3,3 36,7 14,3
1,8 13,8 6,5
2,4 64,8 22,7
1,6 30,4 15,8
1,4 12,1 9,3
0,9 31,3 18,9

प्रतिगमन समीकरण के निर्माण की तकनीक पैराग्राफ 3.1 में वर्णित एल्गोरिथम के समान है। प्रतिगमन समीकरण के निर्माण के लिए प्रोटोकॉल चित्र 7 में दिखाया गया है।

परिणाम
प्रतिगमन आँकड़े
एकाधिक आर 0,901759207
आर स्कवेयर 0,813169667
सामान्यीकृत आर-वर्ग 0,759789572
मानक त्रुटि 0,789962026
टिप्पणियों
भिन्नता का विश्लेषण
डीएफ एमएस एफ
वापसी 9,50635999 15,23357468
शेष 0,624040003
कुल
कठिनाइयाँ टी आंकड़ा
वाई-चौराहा 1,113140304 2,270238114
चर एक्स 1 -0,000592199 -0,061275574
चर एक्स 2 0,063902851 5,496523193

चित्रा 7. परिणाम आउटपुट।

के बीच विभिन्न तरीकेपूर्वानुमान, सन्निकटन को उजागर नहीं करना असंभव है। इसकी मदद से, आप अनुमानित गणना कर सकते हैं और मूल वस्तुओं को सरल लोगों के साथ बदलकर नियोजित संकेतकों की गणना कर सकते हैं। एक्सेल में, पूर्वानुमान और विश्लेषण के लिए इस पद्धति का उपयोग करने की संभावना भी है। आइए देखें कि अंतर्निहित टूल के साथ निर्दिष्ट प्रोग्राम में इस पद्धति को कैसे लागू किया जा सकता है।

इस पद्धति का नाम लैटिन शब्द प्रॉक्सिमा - "निकटतम" से आया है। यह ज्ञात संकेतकों को सरल और चौरसाई करके, उन्हें एक प्रवृत्ति में संरेखित करके अनुमान है जो इसका आधार है। परंतु यह विधिइसका उपयोग न केवल पूर्वानुमान के लिए, बल्कि मौजूदा परिणामों के अध्ययन के लिए भी किया जा सकता है। आखिरकार, सन्निकटन, वास्तव में, प्रारंभिक डेटा का सरलीकरण है, और सरलीकृत संस्करण का अध्ययन करना आसान है।

मुख्य उपकरण जिसके साथ एक्सेल में स्मूथिंग की जाती है, एक ट्रेंड लाइन का निर्माण है। लब्बोलुआब यह है कि मौजूदा संकेतकों के आधार पर, भविष्य की अवधि के लिए फ़ंक्शन का ग्राफ पूरा किया जा रहा है। ट्रेंड लाइन का मुख्य उद्देश्य, जैसा कि आप अनुमान लगा सकते हैं, पूर्वानुमान लगाना या सामान्य प्रवृत्ति की पहचान करना है।

लेकिन इसे पांच प्रकार के सन्निकटन में से एक का उपयोग करके बनाया जा सकता है:

  • रैखिक;
  • घातीय;
  • लघुगणक;
  • बहुपद;
  • शक्ति।

आइए प्रत्येक विकल्प पर अलग से अधिक विस्तार से विचार करें।

विधि 1: रैखिक चौरसाई

सबसे पहले, आइए सबसे सरल सन्निकटन पर विचार करें, अर्थात् का उपयोग करना रैखिक प्रकार्य. हम इस पर अधिक विस्तार से ध्यान देंगे, क्योंकि हम बताएंगे सामान्य बिंदुअन्य तरीकों के लिए विशेषता, अर्थात् एक ग्राफ का निर्माण और कुछ अन्य बारीकियां, जिन पर हम बाद के विकल्पों पर विचार करते समय ध्यान नहीं देंगे।

सबसे पहले, एक ग्राफ बनाते हैं, जिसके आधार पर हम चौरसाई प्रक्रिया को अंजाम देंगे। एक ग्राफ बनाने के लिए, आइए एक तालिका लेते हैं जिसमें उद्यम द्वारा उत्पादित उत्पादन की एक इकाई की लागत और एक निश्चित अवधि में संबंधित लाभ मासिक आधार पर इंगित किया जाता है। ग्राफिक फ़ंक्शन, जिसे हम बनाएंगे, उत्पादन की लागत में कमी पर लाभ में वृद्धि की निर्भरता को प्रदर्शित करेगा।


इस मामले में उपयोग की जाने वाली चिकनाई को निम्न सूत्र द्वारा वर्णित किया गया है:

हमारे विशेष मामले में, सूत्र निम्नलिखित रूप लेता है:

y=-0.1156x+72.255

सन्निकटन विश्वसनीयता का मान बराबर है 0,9418 , जो एक काफी स्वीकार्य परिणाम है जो स्मूथिंग को विश्वसनीय के रूप में दर्शाता है।

विधि 2: घातीय सन्निकटन

अब आइए एक्सेल में घातीय प्रकार के सन्निकटन को देखें।


चौरसाई समारोह का सामान्य रूप इस प्रकार है:

कहाँ पे आधार है प्राकृतिक.

हमारे विशेष मामले में, सूत्र ने निम्नलिखित रूप लिया:

y=6282.7*e^(-0.012*x)

विधि 3: लघुगणकीय चौरसाई

अब लॉगरिदमिक सन्निकटन विधि पर विचार करने की बारी है।


पर सामान्य दृष्टि सेचौरसाई सूत्र इस तरह दिखता है:

कहाँ पे एलएनप्राकृतिक लघुगणक है। इसलिए विधि का नाम।

हमारे मामले में, सूत्र निम्नलिखित रूप लेता है:

y=-62.81ln(x)+404.96

विधि 4: बहुपद चौरसाई

बहुपद चौरसाई की विधि पर विचार करने का समय आ गया है।


इस प्रकार के चौरसाई का वर्णन करने वाले सूत्र ने निम्नलिखित रूप लिया है:

y=8E-08x^6-0.0003x^5+0.3725x^4-269.33x^3+109525x^2-2E+07x+2E+09

विधि 5: पावर स्मूथिंग

निष्कर्ष में, एक्सेल में पावर सन्निकटन विधि पर विचार करें।


फ़ंक्शन डेटा के गहन परिवर्तन के मामलों में इस पद्धति का प्रभावी ढंग से उपयोग किया जाता है। यह ध्यान रखना महत्वपूर्ण है कि यह विकल्प केवल तभी लागू होता है जब फ़ंक्शन और तर्क नकारात्मक या शून्य मान नहीं लेते हैं।

इस विधि का वर्णन करने वाला सामान्य सूत्र इस प्रकार है:

हमारे विशेष मामले में, यह इस तरह दिखता है:

वाई = 6ई+18x^(-6.512)

जैसा कि आप देख सकते हैं, उदाहरण के लिए हमारे द्वारा उपयोग किए गए विशिष्ट डेटा का उपयोग करते समय, छठी डिग्री बहुपद के साथ बहुपद सन्निकटन की विधि ने उच्चतम स्तर की विश्वसनीयता दिखाई ( 0,9844 ), में विश्वास का निम्नतम स्तर रैखिक विधि (0,9418 ) लेकिन इसका मतलब यह बिल्कुल भी नहीं है कि अन्य उदाहरणों का उपयोग करते समय भी यही प्रवृत्ति होगी। नहीं, उपरोक्त विधियों की दक्षता का स्तर उस विशिष्ट प्रकार के फ़ंक्शन के आधार पर महत्वपूर्ण रूप से भिन्न हो सकता है जिसके लिए ट्रेंड लाइन का निर्माण किया जाएगा। इसलिए, यदि चयनित विधि इस फ़ंक्शन के लिए सबसे कुशल है, तो इसका मतलब यह बिल्कुल नहीं है कि यह किसी अन्य स्थिति में भी इष्टतम होगा।

यदि आप उपरोक्त सिफारिशों के आधार पर तुरंत यह निर्धारित नहीं कर सकते हैं कि किस प्रकार का सन्निकटन आपके मामले के लिए विशेष रूप से उपयुक्त है, तो सभी तरीकों को आजमाने का कोई मतलब नहीं है। ट्रेंड लाइन को प्लॉट करने और उसके कॉन्फिडेंस लेवल को देखने के बाद, आप सबसे अच्छा विकल्प चुन सकते हैं।

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...