सामान्य रूप से प्रतिगमन समीकरण का महत्व। समग्र रूप से समाश्रयण समीकरण के महत्व का आकलन और इसके पैरामीटर
मापदंडों के सांख्यिकीय महत्व का मूल्यांकन और समग्र रूप से समीकरण एक अनिवार्य प्रक्रिया है जो आपको प्रबंधकीय निर्णय लेने और पूर्वानुमान लगाने के लिए निर्मित संबंध समीकरण का उपयोग करने की संभावना के बारे में एक इनपुट बनाने की अनुमति देती है।
प्रतिगमन समीकरण के सांख्यिकीय महत्व का आकलन फिशर के एफ-परीक्षण का उपयोग करके किया जाता है, जो कि स्वतंत्रता की एक डिग्री के लिए गणना की गई भाज्य और अवशिष्ट प्रसरणों का अनुपात है।
कारक विचरण विशेषता-परिणाम की भिन्नता का समझाया गया हिस्सा है, जो कि उन कारकों की भिन्नता के कारण है जो विश्लेषण में शामिल हैं (समीकरण में):
जहां k प्रतिगमन समीकरण में कारकों की संख्या है (फैक्टोरियल फैलाव की स्वतंत्रता की डिग्री की संख्या); - आश्रित चर का माध्य मान; - जनसंख्या की i-वें इकाई के लिए आश्रित चर का सैद्धांतिक (प्रतिगमन समीकरण के अनुसार परिकलित) मान।
अवशिष्ट विचरण एक परिणाम में भिन्नता का अस्पष्टीकृत हिस्सा है, अर्थात विश्लेषण में शामिल नहीं किए गए अन्य कारकों में भिन्नता के कारण।
=
, (71)
जहाँ - आश्रित चर का वास्तविक मूल्य y i - जनसंख्या की इकाई; n-k-1 अवशिष्ट फैलाव की स्वतंत्रता की डिग्री की संख्या है; n जनसंख्या का आयतन है।
जैसा कि ऊपर बताया गया है, कारक और अवशिष्ट भिन्नताओं का योग है कुल विचरणपरिणाम-चिह्न।
फिशर के एफ-परीक्षण की गणना निम्न सूत्र का उपयोग करके की जाती है:
फिशर का एफ-टेस्ट - एक मूल्य जो समझाया और अस्पष्टीकृत भिन्नताओं के अनुपात को दर्शाता है, आपको प्रश्न का उत्तर देने की अनुमति देता है: क्या विश्लेषण में शामिल कारक विशेषता-परिणाम की भिन्नता के सांख्यिकीय रूप से महत्वपूर्ण हिस्से की व्याख्या करते हैं। फिशर का एफ-परीक्षण सारणीबद्ध है (तालिका में इनपुट कारक और अवशिष्ट भिन्नताओं की स्वतंत्रता की डिग्री की संख्या है)। यदि एक , तो प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है और तदनुसार, निर्धारण का गुणांक सांख्यिकीय रूप से महत्वपूर्ण होता है। अन्यथा, समीकरण सांख्यिकीय रूप से महत्वपूर्ण नहीं है, अर्थात। लक्षण-परिणाम की भिन्नता के एक महत्वपूर्ण हिस्से की व्याख्या नहीं करता है।
समीकरण मापदंडों के सांख्यिकीय महत्व का आकलन टी-सांख्यिकी के आधार पर किया जाता है, जिसे प्रतिगमन समीकरण मापदंडों के मापांक के अनुपात के रूप में उनकी मानक त्रुटियों के रूप में गणना की जाती है ( ):
, कहाँ पे
; (73)
, कहाँ पे
. (74)
किसी भी सांख्यिकीय कार्यक्रम में, मापदंडों की गणना हमेशा उनके मानक (मूल माध्य वर्ग) त्रुटियों और टी-सांख्यिकी की गणना के साथ होती है। पैरामीटर को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है यदि टी-सांख्यिकी का वास्तविक मान सारणीबद्ध एक से अधिक है।
टी-सांख्यिकी के आधार पर मापदंडों का अनुमान, संक्षेप में, सामान्य मापदंडों की शून्य (एच 0: = 0; एच 0: = 0;) की समानता के बारे में शून्य परिकल्पना का एक परीक्षण है, जो कि महत्वहीन के बारे में है प्रतिगमन समीकरण के पैरामीटर शून्य परिकल्पनाओं को स्वीकार करने का महत्व स्तर = 1-0.95 = 0.05 (0.95 एक नियम के रूप में, आर्थिक गणना में निर्धारित संभाव्यता स्तर है)। यदि परिकलित महत्व स्तर 0.05 से कम है, तो शून्य परिकल्पना को खारिज कर दिया जाता है और वैकल्पिक एक को स्वीकार किया जाता है - पैरामीटर के सांख्यिकीय महत्व के बारे में।
प्रतिगमन समीकरण और उसके मापदंडों के सांख्यिकीय महत्व का आकलन करके, हम परिणामों का एक अलग संयोजन प्राप्त कर सकते हैं।
एफ-टेस्ट द्वारा समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और टी-सांख्यिकी द्वारा समीकरण के सभी पैरामीटर भी सांख्यिकीय रूप से महत्वपूर्ण हैं। इस समीकरण का उपयोग प्रबंधकीय निर्णय लेने के लिए किया जा सकता है (वांछित परिणाम प्राप्त करने के लिए किन कारकों को प्रभावित किया जाना चाहिए), और कारकों के कुछ मूल्यों के लिए परिणाम विशेषता के व्यवहार की भविष्यवाणी करने के लिए।
एफ-मानदंड के अनुसार, समीकरण सांख्यिकीय रूप से महत्वपूर्ण है, लेकिन समीकरण के कुछ पैरामीटर महत्वहीन हैं। समीकरण का उपयोग प्रबंधन निर्णय लेने के लिए किया जा सकता है (उन कारकों के संबंध में जिनके लिए उनके प्रभाव के सांख्यिकीय महत्व की पुष्टि की गई है), लेकिन समीकरण का उपयोग पूर्वानुमान के लिए नहीं किया जा सकता है।
· एफ-परीक्षण समीकरण सांख्यिकीय रूप से महत्वपूर्ण नहीं है। समीकरण का उपयोग नहीं किया जा सकता है। तर्कों और प्रतिक्रिया के बीच महत्वपूर्ण संकेत-कारकों या संबंध के विश्लेषणात्मक रूप की खोज जारी रखी जानी चाहिए।
अगर पुष्टि हुई है आंकड़ों की महत्तासमीकरण और उसके पैरामीटर, तो तथाकथित बिंदु पूर्वानुमान लागू किया जा सकता है, अर्थात। गुण-परिणाम (y) के संभावित मूल्य की गणना कारकों (x) के कुछ मूल्यों के लिए की जाती है। यह बिल्कुल स्पष्ट है कि आश्रित चर का अनुमानित मूल्य उसके वास्तविक मूल्य के साथ मेल नहीं खाएगा। यह जुड़ा हुआ है, सबसे पहले, सहसंबंध निर्भरता के बहुत सार के साथ। साथ ही, परिणाम कई कारकों से प्रभावित होता है, जिनमें से संबंध समीकरण में केवल एक हिस्से को ही ध्यान में रखा जा सकता है। इसके अलावा, परिणाम और कारकों (प्रतिगमन समीकरण का प्रकार) के बीच संबंध के रूप को गलत तरीके से चुना जा सकता है। विशेषता-परिणाम के वास्तविक मूल्यों और उसके सैद्धांतिक (पूर्वानुमान) मूल्यों के बीच हमेशा अंतर होता है ( ) ग्राफिक रूप से, यह स्थिति इस तथ्य में व्यक्त की जाती है कि सहसंबंध क्षेत्र के सभी बिंदु प्रतिगमन रेखा पर नहीं होते हैं। केवल एक कार्यात्मक कनेक्शन के साथ प्रतिगमन रेखा सहसंबंध क्षेत्र के सभी बिंदुओं से होकर गुजरेगी। परिणामी विशेषता के वास्तविक और सैद्धांतिक मूल्यों के बीच के अंतर को विचलन या त्रुटि या अवशिष्ट कहा जाता है। इन मानों के आधार पर, अवशिष्ट विचरण की गणना की जाती है, जो प्रतिगमन समीकरण के माध्य वर्ग त्रुटि का अनुमान है। मानक त्रुटि के मान का उपयोग गणना करने के लिए किया जाता है विश्वास अंतरालविशेषता-परिणाम (वाई) का अनुमानित मूल्य।
समीकरण खोजने के बाद रेखीय प्रतिगमन, समग्र रूप से समीकरण और उसके व्यक्तिगत मापदंडों दोनों के महत्व का अनुमान लगाया जाता है।
समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन फिशर के एफ-परीक्षण का उपयोग करके दिया गया है। इस मामले में, शून्य परिकल्पना को आगे रखा जाता है, प्रतिगमन गुणांक शून्य है, अर्थात b = 0 है, और इसलिए, कारक x परिणाम y को प्रभावित नहीं करता है। एफ-मानदंड की प्रत्यक्ष गणना विचरण के विश्लेषण से पहले होती है। केन्द्रीय स्थानयह अपघटन लेता है कुल राशिचर y का वर्ग विचलन माध्य मान y से दो भागों में - "व्याख्या" और "अस्पष्टीकृत" (परिशिष्ट 2)।
औसत मूल्य y से परिणामी विशेषता y के व्यक्तिगत मूल्यों के वर्ग विचलन का कुल योग कई कारणों के प्रभाव के कारण होता है। परंपरागत रूप से, कारणों के पूरे सेट को दो समूहों में विभाजित किया जा सकता है:
- अध्ययनित कारक x
- अन्य कारक
यदि कारक परिणाम को प्रभावित नहीं करता है, तो ग्राफ पर प्रतिगमन रेखा x-अक्ष y = y के समानांतर होती है। तब परिणामी विशेषता का संपूर्ण फैलाव अन्य कारकों के प्रभाव के कारण होता है और वर्ग विचलन का कुल योग अवशिष्ट के साथ मेल खाता है। यदि अन्य कारक परिणाम को प्रभावित नहीं करते हैं, तो y कार्यात्मक रूप से x से संबंधित है और वर्गों का अवशिष्ट योग शून्य है। इस मामले में, प्रतिगमन द्वारा समझाया गया वर्ग विचलन का योग वर्गों के कुल योग के समान है।
चूंकि सहसंबंध क्षेत्र के सभी बिंदु प्रतिगमन रेखा पर नहीं होते हैं, इसलिए कारक x के प्रभाव के कारण, यानी x पर y का प्रतिगमन, और अन्य मात्राओं (अस्पष्टीकृत भिन्नता) की कार्रवाई के कारण दोनों में हमेशा बिखराव होता है। ) भविष्यवाणी के लिए प्रतिगमन रेखा की उपयुक्तता इस बात पर निर्भर करती है कि व्याख्या की गई भिन्नता के कारण विशेषता y की कुल भिन्नता का कितना हिस्सा है। जाहिर है, अगर प्रतिगमन के कारण वर्ग विचलन का योग वर्गों के अवशिष्ट योग से अधिक है, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और x कारक का y परिणाम पर महत्वपूर्ण प्रभाव पड़ता है। यह इस तथ्य के बराबर है कि निर्धारण का गुणांक r 2 xy एकता के करीब पहुंच जाएगा।
वर्ग विचलन का कोई भी योग स्वतंत्रता की डिग्री (df - स्वतंत्रता की डिग्री) की संख्या के साथ जुड़ा हुआ है, अर्थात, सुविधा की स्वतंत्र भिन्नता की स्वतंत्रता की संख्या के साथ। स्वतंत्रता की डिग्री की संख्या जनसंख्या n की इकाइयों की संख्या और इससे निर्धारित स्थिरांक की संख्या से संबंधित है। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या को यह दिखाना चाहिए कि n में से कितने स्वतंत्र विचलन संभव हैं [(y 1 -y), (y 2 -y), ..., (y n -y)] हैं दिए गए वर्गों का योग बनाने के लिए आवश्यक है। तो, वर्गों का कुल योग?(y-y) 2 के लिए (n-1) स्वतंत्र विचलन की आवश्यकता होती है।
वर्गों की व्याख्या या भाज्य योग की गणना करते समय? (y x -y) 2, प्रभावी विशेषता y x के सैद्धांतिक (गणना) मूल्यों का उपयोग किया जाता है, जो प्रतिगमन रेखा के साथ पाए जाते हैं: y x \u003d a + b * एक्स।
रैखिक प्रतिगमन में, रैखिक प्रतिगमन के कारण वर्ग विचलन का योग होगा: ?(y x -y) 2 =b 2 *?(x -x) 2 ।
चूँकि, x और y में दी गई प्रेक्षणों की मात्रा के लिए, रैखिक समाश्रयण में वर्गों का भाज्य योग, समाश्रयण गुणांक b के केवल एक स्थिरांक पर निर्भर करता है, तो वर्गों के इस योग में स्वतंत्रता की एक डिग्री होती है। हम उसी निष्कर्ष पर पहुंचेंगे यदि हम विशेषता y, यानी y x के परिकलित मान के सामग्री पक्ष पर विचार करें। y x का मान रैखिक प्रतिगमन समीकरण द्वारा निर्धारित किया जाता है: y x =a+b*x। पैरामीटर a को इस प्रकार परिभाषित किया जा सकता है: a=y-b*x. पैरामीटर a के लिए व्यंजक को रैखिक मॉडल में प्रतिस्थापित करने पर, हम प्राप्त करते हैं:
y x \u003d y-b * x + b * x \u003d y-b * (x-x)।
इससे पता चलता है कि दिए गए चर y और x के लिए, रैखिक प्रतिगमन में परिकलित मान y x केवल एक पैरामीटर - प्रतिगमन गुणांक का एक कार्य है। तदनुसार, वर्ग विचलन के भाज्य योग में स्वतंत्रता की कई डिग्री 1 के बराबर होती है।
वर्गों के कुल, भाज्य और अवशिष्ट योगों की स्वतंत्रता की डिग्री की संख्या के बीच एक समानता है। रैखिक प्रतिगमन में वर्गों के अवशिष्ट योग की स्वतंत्रता की डिग्री की संख्या n-2 है। वर्गों के कुल योग के लिए स्वतंत्रता की डिग्री की संख्या इकाइयों की संख्या से निर्धारित होती है, और चूंकि नमूना डेटा से गणना की गई औसत का उपयोग किया जाता है, हम स्वतंत्रता की एक डिग्री खो देते हैं, यानी df कुल = n-1।
तो दो समानताएँ हैं:
? (y-y) 2 \u003d? (y x -y) 2 +? (y- y x) 2,
प्रत्येक वर्ग के योग को उसके अनुरूप स्वतंत्रता की डिग्री की संख्या से विभाजित करते हुए, हम विचलन का औसत वर्ग प्राप्त करते हैं, या, समान रूप से, प्रति एक डिग्री स्वतंत्रता डी का विचरण।
डी कुल \u003d? (वाई-वाई) 2 / (एन -1);
डी तथ्य \u003d? (वाई एक्स -वाई) 2/1;
डी आराम \u003d? (y- y x) 2 / (n-1)।
प्रति एक डिग्री की स्वतंत्रता के लिए फैलाव का निर्धारण करने से फैलाव एक तुलनीय रूप में आ जाता है। प्रति एक डिग्री स्वतंत्रता के भाज्य और अवशिष्ट प्रसरणों की तुलना करने पर, हम F-अनुपात (F-मानदंड) का मान प्राप्त करते हैं:
एफ = डी तथ्य / डी बाकी, जहां
एफ - शून्य परिकल्पना के परीक्षण के लिए मानदंड एच 0: डी तथ्य = डी आराम।
यदि शून्य परिकल्पना सत्य है, तो भाज्य और अवशिष्ट फैलावएक दूसरे से भिन्न न हों। एच 0 के लिए, एक खंडन आवश्यक है ताकि कारक भिन्नता कई बार अवशिष्ट से अधिक हो।
अंग्रेजी सांख्यिकीविद् स्नेडेकोर ने के लिए एफ-अनुपात के महत्वपूर्ण मूल्यों की सारणी विकसित की अलग - अलग स्तरशून्य परिकल्पना का महत्व और स्वतंत्रता की डिग्री की एक अलग संख्या।
एफ-मानदंड का सारणीबद्ध मान भिन्नताओं के अनुपात का अधिकतम मूल्य है जो तब हो सकता है जब वे यादृच्छिक रूप से विचलन करते हैं दिया गया स्तरशून्य परिकल्पना होने की संभावना।
एफ-अनुपात का परिकलित मूल्य विश्वसनीय (एक के अलावा) के रूप में पहचाना जाता है यदि यह सारणीबद्ध से अधिक है।
इस मामले में, संकेतों के संबंध की अनुपस्थिति के बारे में शून्य परिकल्पना को खारिज कर दिया जाता है और इस संबंध के महत्व के बारे में निष्कर्ष निकाला जाता है: एफ तथ्य> एफ टैब। एच 0 खारिज कर दिया है।
यदि मान सारणीबद्ध F तथ्य से कम है मॉडल की गुणवत्ता का निर्धारण निर्धारण के गुणांक द्वारा किया जाता है। निर्धारण गुणांक ( आर 2) बहु सहसंबंध गुणांक का वर्ग है। यह दर्शाता है कि परिणामी विशेषता के विचरण के अनुपात को स्वतंत्र चर के प्रभाव से समझाया गया है। निर्धारण के गुणांक की गणना के लिए सूत्र: आप मैं-- नमूना डेटा, और एफ मैं- संबंधित मॉडल मान। यह दो चरों के बीच पियर्सन सहसंबंध का वर्ग भी है। यह दो चरों के बीच साझा किए गए विचरण की मात्रा को व्यक्त करता है। गुणांक अंतराल से मान लेता है। मान 1 के जितना करीब होगा, मॉडल अनुभवजन्य टिप्पणियों के उतना ही करीब होगा। एक युग्मित रैखिक प्रतिगमन मॉडल के मामले में, निर्धारण का गुणांक सहसंबंध गुणांक के वर्ग के बराबर होता है, अर्थात आर 2 = आर 2 . कभी-कभी कनेक्शन की निकटता के संकेतकों को गुणात्मक मूल्यांकन (चैडॉक स्केल) (परिशिष्ट 3) दिया जा सकता है। एक कार्यात्मक कनेक्शन 1 के बराबर मूल्य पर होता है, और कनेक्शन की अनुपस्थिति 0 है। 0.7 से कम कनेक्शन की जकड़न के संकेतकों के मूल्यों के साथ, निर्धारण के गुणांक का मूल्य हमेशा 50 से नीचे होगा। %. इसका मतलब यह है कि कारक विशेषताओं में भिन्नता का हिस्सा अन्य कारकों की तुलना में एक छोटे से हिस्से के लिए होता है, जो कि प्रभावी संकेतक में परिवर्तन को प्रभावित करने वाले मॉडल में ध्यान में नहीं रखा जाता है। ऐसी परिस्थितियों में निर्मित प्रतिगमन मॉडल कम व्यावहारिक मूल्य के होते हैं। प्रतिगमन समीकरण के निर्माण के बाद और निर्धारण के गुणांक का उपयोग करके इसकी सटीकता का अनुमान लगाया जाता है, यह प्रश्न खुला रहता है कि यह सटीकता क्या हासिल की गई थी और तदनुसार, क्या इस समीकरण पर भरोसा किया जा सकता है। तथ्य यह है कि प्रतिगमन समीकरण सामान्य आबादी के अनुसार नहीं बनाया गया था, जो अज्ञात है, लेकिन इसके एक नमूने के अनुसार। सामान्य आबादी के अंक बेतरतीब ढंग से नमूने में आते हैं, इसलिए, संभाव्यता के सिद्धांत के अनुसार, अन्य मामलों में, यह संभव है कि "व्यापक" सामान्य आबादी से नमूना "संकीर्ण" हो (चित्र 15) . चावल। 15. सामान्य जनसंख्या से नमूने में हिट पॉइंट्स का एक संभावित रूप। इस मामले में: ए) नमूने पर निर्मित प्रतिगमन समीकरण सामान्य आबादी के लिए प्रतिगमन समीकरण से काफी भिन्न हो सकता है, जिससे पूर्वानुमान त्रुटियां हो सकती हैं; बी) निर्धारण का गुणांक और सटीकता की अन्य विशेषताएं अनुचित रूप से उच्च होंगी और समीकरण के भविष्य कहनेवाला गुणों के बारे में गुमराह करेंगी। सीमित मामले में, वैरिएंट को बाहर नहीं किया जाता है, जब सामान्य आबादी से, जो क्षैतिज अक्ष के समानांतर मुख्य अक्ष के साथ एक बादल है (चर के बीच कोई संबंध नहीं है), यादृच्छिक चयन के कारण एक नमूना प्राप्त किया जाएगा, जिसकी मुख्य धुरी धुरी की ओर झुकी होगी। इस प्रकार, नमूना डेटा के आधार पर सामान्य आबादी के अगले मूल्यों की भविष्यवाणी करने का प्रयास न केवल आश्रित और स्वतंत्र चर के बीच संबंधों की ताकत और दिशा का आकलन करने में त्रुटियों से भरा होता है, बल्कि एक खोजने के खतरे से भी भरा होता है। चर के बीच संबंध जहां वास्तव में कोई नहीं है। सामान्य जनसंख्या के सभी बिंदुओं के बारे में जानकारी के अभाव में, पहले मामले में त्रुटियों को कम करने का एकमात्र तरीका प्रतिगमन समीकरण के गुणांकों के आकलन में एक विधि का उपयोग करना है जो उनकी निष्पक्षता और दक्षता सुनिश्चित करता है। और दूसरे मामले की घटना की संभावना को इस तथ्य के कारण काफी कम किया जा सकता है कि एक दूसरे से स्वतंत्र दो चर के साथ सामान्य आबादी की एक संपत्ति को प्राथमिकता के रूप में जाना जाता है - यह वह संबंध है जो इसमें अनुपस्थित है। यह कमी जाँच करके हासिल की जाती है आंकड़ों की महत्तापरिणामी प्रतिगमन समीकरण। सबसे अधिक उपयोग किए जाने वाले सत्यापन विकल्पों में से एक इस प्रकार है। परिणामी प्रतिगमन समीकरण के लिए निर्धारित किया जाता है
कहाँ पे: जैसा कि उपरोक्त सूत्र से देखा जा सकता है, प्रसरणों को स्वतंत्रता की डिग्री की संख्या से संबंधित वर्गों के योग को विभाजित करने के भागफल के रूप में परिभाषित किया गया है। स्वतंत्रता की डिग्री की संख्यायह आश्रित चर के मूल्यों की न्यूनतम आवश्यक संख्या है जो वांछित नमूना विशेषता प्राप्त करने के लिए पर्याप्त है और जो स्वतंत्र रूप से भिन्न हो सकती है, यह देखते हुए कि इस नमूने के लिए वांछित विशेषता की गणना करने के लिए उपयोग की जाने वाली अन्य सभी मात्राएं ज्ञात हैं। अवशिष्ट विचरण प्राप्त करने के लिए, प्रतिगमन समीकरण के गुणांकों की आवश्यकता होती है। एक युग्मित रैखिक प्रतिगमन के मामले में, दो गुणांक हैं, इसलिए, सूत्र के अनुसार (मानते हुए व्याख्या किए गए विचरण की गणना करने के लिए, आश्रित चर के मूल्यों की बिल्कुल भी आवश्यकता नहीं होती है, क्योंकि इसकी गणना स्वतंत्र चर के प्रतिगमन गुणांक और स्वतंत्र चर के विचरण को जानकर की जा सकती है। इसे देखने के लिए, पहले दिए गए व्यंजक को याद करना ही काफी है नतीजतन प्रायिकता सिद्धांत सिद्ध करता है कि प्रतिगमन समीकरण के महत्व का सांख्यिकीय सत्यापन करने के लिए, हम तैयार करते हैं शून्य परिकल्पनाचर के बीच संबंध की कमी के बारे में (चर के लिए सभी गुणांक शून्य के बराबर हैं) और महत्व स्तर का चयन किया जाता है सार्थक तलकरने की स्वीकार्य संभावना है एक त्रुटि टाइप करें- परीक्षण के परिणामस्वरूप सही शून्य परिकल्पना को अस्वीकार करें। इस मामले में, टाइप I त्रुटि बनाने का अर्थ है नमूने से सामान्य आबादी में चर के बीच संबंध की उपस्थिति को पहचानना, जब वास्तव में यह नहीं है। महत्व स्तर आमतौर पर 5% या 1% लिया जाता है। महत्व स्तर जितना अधिक होगा (कम .) फिशर वितरण के अनुसार चयनित महत्व स्तर के लिए, एक सारणीबद्ध मान निर्धारित किया जाता है अगर शर्त पूरी होती है अगर यह निकला दूसरा सत्यापन विकल्प, स्प्रैडशीट्स का उपयोग करने के मामले में अधिक सुविधाजनक, प्राप्त मूल्य की घटना की संभावना की तुलना है प्रतिगमन समीकरण के सांख्यिकीय महत्व की जाँच के बाद, यह आम तौर पर उपयोगी होता है, विशेष रूप से बहुभिन्नरूपी निर्भरता के लिए, प्राप्त प्रतिगमन गुणांक के सांख्यिकीय महत्व की जांच करने के लिए। जाँच की विचारधारा एक ही है जैसे कि समग्र रूप से समीकरण की जाँच करते समय, लेकिन एक मानदंड के रूप में,
कहाँ पे: छात्र की कसौटी के प्राप्त वास्तविक मूल्यों की तुलना सारणीबद्ध मूल्यों से की जाती है वे चर जिनके गुणांक सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं, जनसंख्या में आश्रित चर पर कोई प्रभाव नहीं पड़ने की संभावना है। इसलिए, या तो नमूने में अंकों की संख्या में वृद्धि करना आवश्यक है, तो यह संभव है कि गुणांक सांख्यिकीय रूप से महत्वपूर्ण हो जाएगा और साथ ही इसका मूल्य निर्दिष्ट किया जाएगा, या, स्वतंत्र चर के रूप में, अन्य को ढूंढें जो अधिक बारीकी से हैं आश्रित चर से संबंधित। इस मामले में, दोनों मामलों में पूर्वानुमान की सटीकता बढ़ जाएगी। प्रतिगमन समीकरण के गुणांकों के महत्व का आकलन करने के लिए एक व्यक्त विधि के रूप में, निम्नलिखित नियम लागू किया जा सकता है - यदि छात्र का मानदंड 3 से अधिक है, तो ऐसा गुणांक, एक नियम के रूप में, सांख्यिकीय रूप से महत्वपूर्ण हो जाता है। सामान्य तौर पर, यह माना जाता है कि सांख्यिकीय रूप से महत्वपूर्ण प्रतिगमन समीकरण प्राप्त करने के लिए, यह आवश्यक है कि स्थिति अज्ञात मान के प्राप्त प्रतिगमन समीकरण द्वारा पूर्वानुमान की मानक त्रुटि इस प्रकार, 68% के विश्वास स्तर वाले पूर्वानुमान को इस प्रकार दर्शाया जा सकता है: यदि एक और आत्मविश्वास के स्तर की आवश्यकता है बहुआयामी और गैर-रैखिक निर्भरता की भविष्यवाणी यदि अनुमानित मूल्य कई स्वतंत्र चर पर निर्भर करता है, तो इस मामले में है बहुभिन्नरूपी प्रतिगमनप्रकार: कहाँ पे: प्रतीपगमन गुणांकों को निर्धारित करने की पद्धति जोड़ीवार रैखिक प्रतिगमन से अलग नहीं है, खासकर जब एक स्प्रेडशीट का उपयोग करते हैं, क्योंकि एक ही फ़ंक्शन का उपयोग जोड़ीदार और बहुभिन्नरूपी रैखिक प्रतिगमन दोनों के लिए किया जाता है। इस मामले में, यह वांछनीय है कि स्वतंत्र चर के बीच कोई संबंध नहीं है, अर्थात। एक चर को बदलने से अन्य चरों के मूल्यों पर कोई प्रभाव नहीं पड़ता है। लेकिन यह आवश्यकता अनिवार्य नहीं है, यह महत्वपूर्ण है कि चर के बीच कोई कार्यात्मक रैखिक निर्भरता न हो। प्राप्त प्रतिगमन समीकरण और उसके व्यक्तिगत गुणांक के सांख्यिकीय महत्व की जांच के लिए उपरोक्त प्रक्रियाएं, पूर्वानुमान सटीकता का आकलन युग्मित रैखिक प्रतिगमन के मामले के समान ही रहता है। उसी समय, एक जोड़ी प्रतिगमन के बजाय बहुभिन्नरूपी प्रतिगमन का उपयोग आमतौर पर, चर के उपयुक्त विकल्प के साथ, आश्रित चर के व्यवहार का वर्णन करने की सटीकता में उल्लेखनीय रूप से सुधार करने की अनुमति देता है, और इसलिए पूर्वानुमान की सटीकता। इसके अलावा, बहुभिन्नरूपी रैखिक प्रतिगमन के समीकरण स्वतंत्र चर पर अनुमानित मूल्य की गैर-रेखीय निर्भरता का वर्णन करना संभव बनाते हैं। एक अरेखीय समीकरण को एक रैखिक रूप में कम करने की प्रक्रिया को कहा जाता है linearization. विशेष रूप से, यदि इस निर्भरता को 1 से भिन्न डिग्री के बहुपद द्वारा वर्णित किया जाता है, तो पहली डिग्री में नए चर के साथ एकता से भिन्न डिग्री वाले चर को बदलकर, हम एक गैर-रेखीय के बजाय एक बहुभिन्नरूपी रैखिक प्रतिगमन समस्या प्राप्त करते हैं। इसलिए, उदाहरण के लिए, यदि स्वतंत्र चर के प्रभाव को रूप के परवलय द्वारा वर्णित किया जाता है फिर प्रतिस्थापन गैर-रेखीय समस्याओं को भी आसानी से रूपांतरित किया जा सकता है, जिसमें गैर-रैखिकता इस तथ्य के कारण उत्पन्न होती है कि अनुमानित मूल्य स्वतंत्र चर के उत्पाद पर निर्भर करता है। इस प्रभाव को ध्यान में रखते हुए, इस उत्पाद के बराबर एक नया चर पेश करना आवश्यक है। ऐसे मामलों में जहां गैर-रैखिकता को अधिक जटिल निर्भरताओं द्वारा वर्णित किया जाता है, समन्वय परिवर्तनों के कारण रैखिककरण संभव है। इसके लिए, मानों की गणना की जाती है एक रैखिक में बदल जाता है कहाँ पे: रूपांतरित समीकरण के परिणामी प्रतिगमन गुणांक निष्पक्ष और प्रभावी रहते हैं, लेकिन सांख्यिकीय महत्व के लिए समीकरण और गुणांक का परीक्षण नहीं किया जा सकता है न्यूनतम वर्ग विधि के अनुप्रयोग की वैधता की जाँच करना कम से कम वर्ग विधि का अनुप्रयोग निम्नलिखित स्थितियों (शर्तों) के तहत प्रतिगमन समीकरण गुणांक की दक्षता और निष्पक्ष अनुमान सुनिश्चित करता है गौस-इरकुत्स्क): 1.
2.
3. मान 4. मान यह जांचने का सबसे आसान तरीका है कि क्या ये शर्तें पूरी होती हैं, अवशिष्टों की साजिश रचकर प्रतिगमन विश्लेषण एक सांख्यिकीय अनुसंधान पद्धति है जो आपको एक या अधिक स्वतंत्र चर पर एक पैरामीटर की निर्भरता दिखाने की अनुमति देती है। प्री-कंप्यूटर युग में, इसका उपयोग काफी कठिन था, खासकर जब यह बड़ी मात्रा में डेटा की बात आती थी। आज, एक्सेल में रिग्रेशन बनाने का तरीका जानने के बाद, आप कुछ ही मिनटों में जटिल सांख्यिकीय समस्याओं को हल कर सकते हैं। अर्थशास्त्र के क्षेत्र से विशिष्ट उदाहरण नीचे दिए गए हैं। इस अवधारणा को ही 1886 में गणित में पेश किया गया था। प्रतिगमन होता है: 6 औद्योगिक उद्यमों में औसत वेतन पर सेवानिवृत्त टीम के सदस्यों की संख्या की निर्भरता निर्धारित करने की समस्या पर विचार करें। एक कार्य। छह उद्यमों में, हमने औसत मासिक वेतन और कर्मचारियों की संख्या का विश्लेषण किया, जो अपने हिसाब से चले गए। सारणीबद्ध रूप में हमारे पास है: छोड़ने वालों की संख्या वेतन 30000 रूबल 35000 रूबल 40000 रूबल 45000 रूबल 50000 रूबल 55000 रूबल 60000 रूबल 6 उद्यमों में औसत वेतन पर सेवानिवृत्त श्रमिकों की संख्या की निर्भरता निर्धारित करने की समस्या के लिए, प्रतिगमन मॉडल में समीकरण Y = a 0 + a 1 x 1 +…+a k x k का रूप होता है, जहां x i प्रभावित करने वाले चर हैं , a i प्रतिगमन गुणांक हैं, a k कारकों की संख्या है। इस कार्य के लिए, Y छोड़ने वाले कर्मचारियों का संकेतक है, और प्रभावित करने वाला कारक वेतन है, जिसे हम X से दर्शाते हैं। एक्सेल में रिग्रेशन विश्लेषण उपलब्ध सारणीबद्ध डेटा में अंतर्निहित कार्यों के अनुप्रयोग से पहले होना चाहिए। हालांकि, इन उद्देश्यों के लिए, बहुत उपयोगी ऐड-इन "विश्लेषण टूलकिट" का उपयोग करना बेहतर है। इसे सक्रिय करने के लिए आपको चाहिए: यदि सब कुछ सही ढंग से किया जाता है, तो वांछित बटन एक्सेल वर्कशीट के ऊपर स्थित डेटा टैब के दाईं ओर दिखाई देगा। अब जब हमारे पास अर्थमितीय गणना करने के लिए सभी आवश्यक आभासी उपकरण हैं, तो हम अपनी समस्या को हल करना शुरू कर सकते हैं। इसके लिए: परिणामस्वरूप, प्रोग्राम स्वचालित रूप से प्रतिगमन विश्लेषण डेटा के साथ स्प्रेडशीट की एक नई शीट को पॉप्युलेट करेगा। टिप्पणी! एक्सेल में इस उद्देश्य के लिए आपके द्वारा पसंद किए जाने वाले स्थान को मैन्युअल रूप से सेट करने की क्षमता है। उदाहरण के लिए, यह वही शीट हो सकती है जहां वाई और एक्स मान हैं, या यहां तक कि विशेष रूप से ऐसे डेटा को स्टोर करने के लिए डिज़ाइन की गई एक नई कार्यपुस्तिका भी हो सकती है। एक्सेल में, माना उदाहरण के डेटा के प्रसंस्करण के दौरान प्राप्त डेटा इस तरह दिखता है: सबसे पहले आपको आर-स्क्वायर की वैल्यू पर ध्यान देना चाहिए। यह निर्धारण का गुणांक है। इस उदाहरण में, आर-स्क्वायर = 0.755 (75.5%), यानी, मॉडल के परिकलित पैरामीटर 75.5% द्वारा माने गए मापदंडों के बीच संबंध की व्याख्या करते हैं। निर्धारण गुणांक का मान जितना अधिक होगा, किसी विशेष कार्य के लिए चुना गया मॉडल उतना ही अधिक लागू होगा। ऐसा माना जाता है कि यह 0.8 से ऊपर के आर-वर्ग मान के साथ वास्तविक स्थिति का सही वर्णन करता है। अगर R-वर्ग<0,5, то такой анализа регрессии в Excel нельзя считать резонным. संख्या 64.1428 दर्शाती है कि Y का मान क्या होगा यदि हम जिस मॉडल पर विचार कर रहे हैं उसमें सभी चर xi शून्य पर सेट हैं। दूसरे शब्दों में, यह तर्क दिया जा सकता है कि विश्लेषण किए गए पैरामीटर का मूल्य अन्य कारकों से भी प्रभावित होता है जो किसी विशिष्ट मॉडल में वर्णित नहीं हैं। सेल B18 में स्थित अगला गुणांक -0.16285, Y पर चर X के प्रभाव के भार को दर्शाता है। इसका मतलब है कि विचाराधीन मॉडल के भीतर कर्मचारियों का औसत मासिक वेतन -0.16285 के वजन के साथ छोड़ने वालों की संख्या को प्रभावित करता है, अर्थात। इसके प्रभाव की डिग्री बिल्कुल छोटी है। "-" चिह्न इंगित करता है कि गुणांक का ऋणात्मक मान है। यह स्पष्ट है, क्योंकि हर कोई जानता है कि उद्यम में वेतन जितना अधिक होता है, उतने ही कम लोग रोजगार अनुबंध को समाप्त करने या छोड़ने की इच्छा व्यक्त करते हैं। यह शब्द फॉर्म के कई स्वतंत्र चर के साथ एक कनेक्शन समीकरण को संदर्भित करता है: y \u003d f (x 1 + x 2 + ... x m) + , जहां y प्रभावी विशेषता (आश्रित चर) है, और x 1 , x 2 , ... x m कारक कारक (स्वतंत्र चर) हैं। एकाधिक प्रतिगमन (MR) के लिए इसे कम से कम वर्गों (OLS) की विधि का उपयोग करके किया जाता है। Y = a + b 1 x 1 +…+b m x m + के रूप के रैखिक समीकरणों के लिए, हम सामान्य समीकरणों की एक प्रणाली बनाते हैं (नीचे देखें) विधि के सिद्धांत को समझने के लिए, दो-कारक मामले पर विचार करें। तब हमारे पास सूत्र द्वारा वर्णित स्थिति होती है यहाँ से हमें मिलता है: जहां सूचकांक में परिलक्षित संबंधित विशेषता का प्रसरण है। एलएसएम एक मानक पैमाने पर एमपी समीकरण पर लागू होता है। इस मामले में, हमें समीकरण मिलता है: जहाँ t y , t x 1,… t xm मानकीकृत चर हैं जिनके लिए माध्य मान 0 हैं; β मैं मानकीकृत प्रतिगमन गुणांक हैं, और मानक विचलन 1 है। कृपया ध्यान दें कि इस मामले में सभी β i को सामान्यीकृत और केंद्रीकृत के रूप में सेट किया गया है, इसलिए एक दूसरे के साथ उनकी तुलना सही और स्वीकार्य मानी जाती है। इसके अलावा, यह βi के सबसे छोटे मूल्यों वाले कारकों को छोड़कर, कारकों को फ़िल्टर करने के लिए प्रथागत है। मान लीजिए कि पिछले 8 महीनों के दौरान किसी विशेष उत्पाद एन की कीमत की गतिशीलता की एक तालिका है। 1850 रूबल / टी की कीमत पर इसके बैच को खरीदने की सलाह पर निर्णय लेना आवश्यक है। माह संख्या महीने का नाम आइटम नंबर की कीमत 1750 रूबल प्रति टन 1755 रूबल प्रति टन 1767 रूबल प्रति टन 1760 रूबल प्रति टन 1770 रूबल प्रति टन 1790 रूबल प्रति टन 1810 रूबल प्रति टन 1840 रूबल प्रति टन एक्सेल स्प्रेडशीट में इस समस्या को हल करने के लिए, आपको उपरोक्त उदाहरण से पहले से ज्ञात डेटा विश्लेषण टूल का उपयोग करने की आवश्यकता है। अगला, "रिग्रेशन" अनुभाग चुनें और पैरामीटर सेट करें। यह याद रखना चाहिए कि "इनपुट अंतराल Y" फ़ील्ड में, आश्रित चर के लिए मानों की एक श्रेणी (इस मामले में, वर्ष के विशिष्ट महीनों में उत्पाद की कीमत) दर्ज की जानी चाहिए, और "इनपुट" में अंतराल X" - स्वतंत्र चर (माह संख्या) के लिए। "ओके" पर क्लिक करके कार्रवाई की पुष्टि करें। एक नई शीट पर (यदि ऐसा संकेत दिया गया था), हमें प्रतिगमन के लिए डेटा मिलता है। उनके आधार पर, हम y=ax+b फॉर्म का एक रैखिक समीकरण बनाते हैं, जहां पैरामीटर ए और बी महीने की संख्या के नाम के साथ पंक्ति के गुणांक हैं और गुणांक और "वाई-चौराहे" पंक्ति से प्रतिगमन विश्लेषण के परिणामों के साथ शीट। इस प्रकार, समस्या 3 के लिए रैखिक समाश्रयण समीकरण (LE) को इस प्रकार लिखा जाता है: उत्पाद की कीमत एन = 11.714* माह संख्या + 1727.54। या बीजीय संकेतन में वाई = 11.714 एक्स + 1727.54 यह तय करने के लिए कि परिणामी रैखिक प्रतिगमन समीकरण पर्याप्त है, एकाधिक सहसंबंध गुणांक (एमसीसी) और निर्धारण गुणांक का उपयोग किया जाता है, साथ ही फिशर का परीक्षण और छात्र का परीक्षण। प्रतिगमन परिणामों के साथ एक्सेल तालिका में, वे क्रमशः एकाधिक आर, आर-वर्ग, एफ-सांख्यिकी और टी-सांख्यिकी के नामों के तहत दिखाई देते हैं। केएमसी आर स्वतंत्र और आश्रित चर के बीच संभाव्य संबंध की मजबूती का आकलन करना संभव बनाता है। इसका उच्च मूल्य चर "महीने की संख्या" और "माल की कीमत एन प्रति 1 टन रूबल में" के बीच काफी मजबूत संबंध को इंगित करता है। हालाँकि, इस रिश्ते की प्रकृति अज्ञात बनी हुई है। निर्धारण गुणांक का वर्ग R 2 (RI) कुल प्रकीर्णन के हिस्से की एक संख्यात्मक विशेषता है और प्रयोगात्मक डेटा के किस भाग के बिखराव को दर्शाता है, अर्थात। आश्रित चर के मान रैखिक प्रतिगमन समीकरण से मेल खाते हैं। विचाराधीन समस्या में, यह मान 84.8% के बराबर है, अर्थात्, प्राप्त एसडी द्वारा सांख्यिकीय डेटा को उच्च स्तर की सटीकता के साथ वर्णित किया गया है। एफ-सांख्यिकी, जिसे फिशर का परीक्षण भी कहा जाता है, का उपयोग एक रैखिक संबंध के महत्व का आकलन करने के लिए किया जाता है, इसके अस्तित्व की परिकल्पना का खंडन या पुष्टि करता है। (छात्र की कसौटी) एक रैखिक संबंध के अज्ञात या मुक्त पद के साथ गुणांक के महत्व का मूल्यांकन करने में मदद करता है। यदि t-मानदंड का मान> t करोड़, तो रैखिक समीकरण के मुक्त पद के महत्व की परिकल्पना को खारिज कर दिया जाता है। मुक्त सदस्य के लिए विचाराधीन समस्या में, एक्सेल टूल्स का उपयोग करते हुए, यह प्राप्त किया गया था कि t = 169.20903, और p = 2.89E-12, यानी, हमारे पास एक शून्य संभावना है कि स्वतंत्र सदस्य के महत्व के बारे में सही परिकल्पना होगी खारिज किया जाए। अज्ञात t=5.79405, और p=0.001158 पर गुणांक के लिए। दूसरे शब्दों में, अज्ञात के लिए गुणांक के महत्व के बारे में सही परिकल्पना के खारिज होने की संभावना 0.12% है। इस प्रकार, यह तर्क दिया जा सकता है कि परिणामी रैखिक प्रतिगमन समीकरण पर्याप्त है। एक्सेल में मल्टीपल रिग्रेशन एक ही डेटा एनालिसिस टूल का उपयोग करके किया जाता है। एक विशिष्ट लागू समस्या पर विचार करें। NNN के प्रबंधन को MMM SA में 20% हिस्सेदारी खरीदने की उपयुक्तता पर निर्णय लेना चाहिए। पैकेज की लागत (जेवी) 70 मिलियन अमेरिकी डॉलर है। एनएनएन विशेषज्ञों ने समान लेनदेन पर डेटा एकत्र किया। लाखों अमेरिकी डॉलर में व्यक्त किए गए ऐसे मापदंडों के अनुसार शेयरों के ब्लॉक के मूल्य का मूल्यांकन करने का निर्णय लिया गया, जैसे: इसके अलावा, हजारों अमेरिकी डॉलर में उद्यम (V3 P) के पैरामीटर पेरोल बकाया का उपयोग किया जाता है। सबसे पहले, आपको प्रारंभिक डेटा की एक तालिका बनाने की आवश्यकता है। यह इस तरह दिख रहा है: "नई वर्कशीट" चुनें और "ओके" पर क्लिक करें। दी गई समस्या के लिए प्रतिगमन विश्लेषण प्राप्त करें। एक्सेल स्प्रेडशीट शीट पर ऊपर प्रस्तुत गोल डेटा से "हम एकत्र करते हैं", प्रतिगमन समीकरण: एसपी \u003d 0.103 * एसओएफ + 0.541 * वीओ - 0.031 * वीके + 0.405 * वीडी + 0.691 * वीजेडपी - 265.844। अधिक परिचित गणितीय रूप में, इसे इस प्रकार लिखा जा सकता है: y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844 JSC "MMM" के लिए डेटा तालिका में प्रस्तुत किया गया है: उन्हें प्रतिगमन समीकरण में प्रतिस्थापित करने पर, उन्हें 64.72 मिलियन अमेरिकी डॉलर का आंकड़ा मिलता है। इसका मतलब है कि जेएससी एमएमएम के शेयर नहीं खरीदे जाने चाहिए, क्योंकि उनका मूल्य 70 मिलियन अमेरिकी डॉलर अधिक है। जैसा कि आप देख सकते हैं, एक्सेल स्प्रेडशीट और रिग्रेशन समीकरण के उपयोग ने एक बहुत ही विशिष्ट लेनदेन की व्यवहार्यता के बारे में एक सूचित निर्णय लेना संभव बना दिया है। अब आप जानते हैं कि प्रतिगमन क्या है। ऊपर चर्चा किए गए एक्सेल में उदाहरण आपको अर्थमिति के क्षेत्र से व्यावहारिक समस्याओं को हल करने में मदद करेंगे। अर्थमिति में अंतिम परीक्षण 1. प्रतिगमन समीकरण के मापदंडों के महत्व का आकलन निम्न के आधार पर किया जाता है: ए) टी - छात्र की कसौटी; बी) फिशर का एफ-मानदंड - स्नेडेकोर; ग) माध्य वर्ग त्रुटि; d) औसत सन्निकटन त्रुटि। 2. वर्ष के लिए मोटर वाहन उद्योग में बिक्री की मात्रा (मिलियन रूबल) और उद्यमों के लाभ (मिलियन रूबल) के बीच संबंध को दर्शाने वाले समीकरण में प्रतिगमन गुणांक का अर्थ है कि बिक्री की मात्रा में वृद्धि के साथ 1
मिलियन रूबल लाभ बढ़ता है: घ) 0.5 मिलियन रगड़ना।; ग) 500 हजार। रगड़ना।; डी) 1.5 मिलियन रूबल 3. सहसंबंध अनुपात (सहसंबंध सूचकांक) एक्स और के बीच संबंधों की निकटता की डिग्री को मापता हैयू:
ए) केवल निर्भरता के एक गैर-रैखिक रूप के साथ; बी) किसी भी प्रकार की लत के साथ; ग) केवल एक रैखिक संबंध के साथ। 4. संचार की दिशा में हैं: ए) मध्यम; बी) सीधे; ग) सीधा। 5. 17 प्रेक्षणों के आधार पर एक समाश्रयण समीकरण बनाया गया: ए) समीकरण a . के लिए महत्वपूर्ण है =
0,05; बी) समीकरण एक = 0.01 पर महत्वहीन है; c) समीकरण a = 0.05 पर सार्थक नहीं है। 6. ओएलएस धारणा "प्रतिगमन अवशेषों की अपेक्षा शून्य है" का उल्लंघन करने के परिणाम क्या हैं? ए) प्रतिगमन गुणांक के पक्षपाती अनुमान; बी) प्रतिगमन गुणांक के कुशल लेकिन असंगत अनुमान; ग) समाश्रयण गुणांकों के अकुशल अनुमान; d) समाश्रयण गुणांकों के असंगत अनुमान। 7. अवशेषों की विषमलैंगिकता के मामले में निम्नलिखित में से कौन सा कथन सत्य है? ए) टी और एफ-सांख्यिकी पर निष्कर्ष अविश्वसनीय हैं; d) समाश्रयण समीकरण के प्राचलों के अनुमान पक्षपाती हैं। 8. स्पीयरमैन का रैंक सहसंबंध परीक्षण किस पर आधारित है? ए) टी - सांख्यिकी के उपयोग पर; सी) उपयोग पर 9. श्वेत परीक्षण किस पर आधारित है? बी) एफ-सांख्यिकी के उपयोग पर; बी) उपयोग में घ) अवशेषों के चित्रमय विश्लेषण पर। 10. स्वसहसंबंध को समाप्त करने के लिए किस विधि का उपयोग किया जा सकता है? 11. अवशिष्टों के प्रसरण की स्थिरता की धारणा के उल्लंघन को क्या कहा जाता है? ए) बहुसंकेतन; बी) ऑटोसहसंबंध; बी) विषमलैंगिकता; डी) समलैंगिकता। 12. डमी वेरिएबल्स को इसमें पेश किया गया है: ए) केवल रैखिक मॉडल में; बी) केवल कई गैर-रेखीय प्रतिगमन में; ग) केवल अरेखीय मॉडल में; डी) रैखिक और गैर-रैखिक दोनों मॉडल एक रैखिक रूप में कम हो गए। 13. यदि युग्मित सहसंबंध गुणांक के मैट्रिक्स में हैं ए) बहुसंकेतन की उपस्थिति के बारे में; बी) बहुसंकेतन की अनुपस्थिति के बारे में; ग) स्वसहसंबंध की उपस्थिति के बारे में; d) विषमलैंगिकता की अनुपस्थिति के बारे में। 14. बहुसंरेखण से छुटकारा पाने के लिए कौन सा उपाय असंभव है? ए) नमूना आकार बढ़ाना; डी) यादृच्छिक घटक का परिवर्तन। 15. अगर ए) अधिक पहचान; बी) पहचाना नहीं गया; ग) सटीक रूप से पहचाना गया। 16. प्रतिगमन समीकरण इस तरह दिखता है: लेकिन) बी) में) 17. मॉडल पहचान की समस्या क्या है? ए) एक साथ समीकरणों की प्रणाली द्वारा दिए गए मॉडल के विशिष्ट रूप से परिभाषित पैरामीटर प्राप्त करना; बी) प्रारंभिक सांख्यिकीय डेटा के अनुसार मॉडल के अज्ञात मापदंडों के सांख्यिकीय आकलन के लिए विधियों का चयन और कार्यान्वयन; ग) मॉडल की पर्याप्तता की जाँच करना। 18. किसी अति-पहचान वाले समीकरण के प्राचलों का अनुमान लगाने के लिए किस विधि का उपयोग किया जाता है? सी) डीएमएनके, केएमएनके; 19. यदि एक गुणात्मक चर हैकवैकल्पिक मान, फिर सिमुलेशन उपयोग करता है: ए) (के -1) डमी चर; बी) kdummy चर; ग) (के+1) डमी चर। 20. दो संकेतों के लिंक की निकटता और दिशा का विश्लेषण निम्न के आधार पर किया जाता है: ए) जोड़ी सहसंबंध गुणांक; बी) निर्धारण का गुणांक; सी) एकाधिक सहसंबंध गुणांक। 21. एक रैखिक समीकरण में
ए) कनेक्शन की निकटता; बी) "एक्स" पर निर्भर विचरण "वाई" का अनुपात; ग) जब "X" एक इकाई से बदलता है तो औसतन कितना "Y" बदलेगा; डी) सहसंबंध गुणांक त्रुटि। 22. अध्ययन के तहत कारक के मूल्य में परिवर्तन के कारण भिन्नता के हिस्से को निर्धारित करने के लिए किस संकेतक का उपयोग किया जाता है? ए) भिन्नता का गुणांक; बी) सहसंबंध गुणांक; सी) निर्धारण का गुणांक; डी) लोच का गुणांक। 23. लोच का गुणांक दर्शाता है: ए) जब x 1% से बदलता है तो y का मान कितना% बदल जाएगा; बी) इसके माप की कितनी इकाइयों से y का मान बदल जाएगा जब x 1% बदल जाएगा; c) जब x इकाई के अनुसार बदलता है, तो y का मान कितना% बदल जाएगा। आपका माप। 24. विषमलैंगिकता का पता लगाने के लिए कौन से तरीके लागू किए जा सकते हैं? ए) गोल्फल्ड-क्वांड्ट परीक्षण; बी) स्पीयरमैन का रैंक सहसंबंध परीक्षण; ग) डर्बिन-वाटसन परीक्षण। 25. गोल्फेल्ड-क्वांड्ट परीक्षण का आधार क्या है? ए) टी-सांख्यिकी के उपयोग पर; बी) एफ के उपयोग पर - सांख्यिकी; सी) उपयोग पर घ) अवशेषों के चित्रमय विश्लेषण पर। 26. अवशिष्टों के स्वतः सहसंबंध को समाप्त करने के लिए किन विधियों का उपयोग नहीं किया जा सकता है? ए) कम से कम वर्गों की सामान्यीकृत विधि; बी) भारित न्यूनतम वर्ग विधि; सी) अधिकतम संभावना विधि; डी) कम से कम वर्गों की दो-चरणीय विधि। 27. अवशेषों की स्वतंत्रता की धारणा के उल्लंघन को क्या कहा जाता है? ए) बहुसंकेतन; बी) ऑटोसहसंबंध; ग) विषमलैंगिकता; डी) समलैंगिकता। 28. विषमलैंगिकता को समाप्त करने के लिए किस विधि का उपयोग किया जा सकता है? ए) कम से कम वर्गों की सामान्यीकृत विधि; बी) भारित न्यूनतम वर्ग विधि; ग) अधिकतम संभावना विधि; डी) दो-चरण कम से कम वर्ग विधि। 30. यदि द्वाराटी-मानदंड, अधिकांश प्रतिगमन गुणांक सांख्यिकीय रूप से महत्वपूर्ण हैं, और समग्र रूप से मॉडलएफ- मानदंड महत्वहीन है, तो यह संकेत कर सकता है: ए) बहुसंकेतन; बी) अवशेषों के स्वत: सहसंबंध पर; ग) अवशेषों की विषमलैंगिकता पर; घ) यह विकल्प संभव नहीं है। 31. क्या चरों को परिवर्तित करके बहुसंरेखण से छुटकारा पाना संभव है? ए) यह उपाय तभी प्रभावी होता है जब नमूना आकार बढ़ाया जाता है; 32. रेखीय समाश्रयण समीकरण के प्राचल का अनुमान लगाने के लिए किस विधि का उपयोग किया जा सकता है: ए) कम से कम वर्ग विधि; बी) सहसंबंध और प्रतिगमन विश्लेषण; ग) विचरण का विश्लेषण। 33.
डमी चर के साथ एक बहु रेखीय प्रतिगमन समीकरण का निर्माण किया गया है। व्यक्तिगत गुणांकों के महत्व की जाँच करने के लिए, हम उपयोग करते हैं वितरण: ए) सामान्य; बी) छात्र; ग) पियर्सन; d) फिशर-स्नेडेकोर। 34. अगर ए) अधिक पहचान; बी) पहचाना नहीं गया; ग) सटीक रूप से पहचाना गया। 35. समीकरणों की एक सटीक पहचान योग्य प्रणाली के मापदंडों का अनुमान लगाने के लिए, निम्नलिखित का उपयोग किया जाता है: क) डीएमएनके, केएमएनके; बी) डीएमएनके, एमएनके, केएमएनके; 36. चाउ की कसौटी आवेदन पर आधारित है: ए) एफ - सांख्यिकी; बी) टी - सांख्यिकी; ग) डर्बिन-वाटसन मानदंड। 37.
डमी चर निम्नलिखित मान ले सकते हैं: डी) कोई मूल्य। 39. 20 अवलोकनों के आधार पर, एक प्रतिगमन समीकरण बनाया गया था: a) समीकरण a=0.05 पर सार्थक है; b) समीकरण a=0.05 पर सार्थक नहीं है; c) समीकरण a=0.01 पर सार्थक नहीं है। 40. निम्नलिखित में से कौन सा कथन सत्य नहीं है यदि अवशिष्ट विषमलैंगिक हैं? ए) टी और एफ आंकड़ों पर निष्कर्ष अविश्वसनीय हैं; बी) हेटेरोस्केडैस्टिसिटी डर्बिन-वाटसन आंकड़ों के निम्न मूल्य के माध्यम से प्रकट होती है; ग) विषमलैंगिकता के साथ, अनुमान प्रभावी रहते हैं; d) अनुमान पक्षपाती हैं। 41. चाउ परीक्षण एक तुलना पर आधारित है: ए) फैलाव; बी) निर्धारण के गुणांक; ग) गणितीय अपेक्षाएं; घ) मध्यम। 42. अगर चाउ टेस्ट में ए) मॉडल की गुणवत्ता में सुधार के दृष्टिकोण से उप-अंतराल में विभाजन उपयोगी है; बी) मॉडल सांख्यिकीय रूप से महत्वहीन है; ग) मॉडल सांख्यिकीय रूप से महत्वपूर्ण है; घ) कि नमूने को भागों में विभाजित करने का कोई मतलब नहीं है। 43.
डमी चर चर हैं: गुण; बी) यादृच्छिक; बी) मात्रात्मक; डी) तार्किक। 44. निम्नलिखित में से किस विधि का उपयोग स्वतः सहसंबंध का पता लगाने के लिए नहीं किया जा सकता है? ए) श्रृंखला विधि; बी) डर्बिन-वाटसन परीक्षण; ग) स्पीयरमैन का रैंक सहसंबंध परीक्षण; डी) व्हाइट का परीक्षण। 45. मॉडल का सबसे सरल संरचनात्मक रूप है: लेकिन) बी) में) जी) 46. बहुसंकेतन से छुटकारा पाने के लिए क्या उपाय किए जा सकते हैं? ए) नमूना आकार बढ़ाना; बी) चरों का बहिष्करण बाकी के साथ अत्यधिक सहसंबद्ध है; ग) मॉडल विनिर्देश में परिवर्तन; डी) यादृच्छिक घटक का परिवर्तन। 47. अगर ए) अधिक पहचान; बी) पहचाना नहीं गया; बी) सटीक रूप से पहचाना गया; 48. एक मॉडल की पहचान मानी जाती है यदि: ए) मॉडल के समीकरणों में कम से कम एक सामान्य है; बी) प्रणाली के प्रत्येक समीकरण की पहचान की जा सकती है; ग) मॉडल समीकरणों में कम से कम एक अज्ञात है; d) मॉडल के समीकरणों में से कम से कम एक की पहचान की गई है। 49. अज्ञात समीकरण के प्राचलों का अनुमान लगाने के लिए किस विधि का प्रयोग किया जाता है? क) डीएमएनके, केएमएनके; बी) डीएमएनसी, एमएनसी; सी) ऐसे समीकरण के पैरामीटर का अनुमान नहीं लगाया जा सकता है। 50. ज्ञान के किन क्षेत्रों के जंक्शन पर अर्थमिति उत्पन्न हुई: ए) आर्थिक सिद्धांत; आर्थिक और गणितीय सांख्यिकी; बी) आर्थिक सिद्धांत, गणितीय सांख्यिकी और संभाव्यता सिद्धांत; ग) आर्थिक और गणितीय सांख्यिकी, संभाव्यता सिद्धांत। 51. बहु रेखीय प्रतिगमन समीकरण में, वितरण का उपयोग करके प्रतिगमन गुणांक के लिए विश्वास अंतराल बनाए जाते हैं: ए) सामान्य; बी) छात्र; ग) पियर्सन; d) फिशर-स्नेडेकोर। 52. 16 प्रेक्षणों के आधार पर एक युग्मित रैखिक समाश्रयण समीकरण का निर्माण किया गया। के लियेप्रतिगमन गुणांक महत्व जांच की गणना की गईटी 6ली के लिए =2.5.
a) गुणांक a=0.05 पर महत्वहीन है; बी) गुणांक एक = 0.05 पर महत्वपूर्ण है; c) गुणांक a=0.01 पर सार्थक है। 53. यह ज्ञात है कि मात्राओं के बीचएक्सतथायूमौजूदसकारात्मक संबंध। किस हद तकजोड़ीवार सहसंबंध गुणांक है? ए) -1 से 0 तक; बी) 0 से 1 तक; सी) -1 से 1 तक। 54. बहु सहसंबंध गुणांक 0.9 है। कितने प्रतिशतपरिणामी गुण के फैलाव को सभी के प्रभाव द्वारा समझाया गया हैकारक लक्षण? 55. निम्नलिखित में से किस विधि का उपयोग विषमलैंगिकता का पता लगाने के लिए नहीं किया जा सकता है? ए) गोल्फल्ड-क्वांड्ट परीक्षण; बी) स्पीयरमैन का रैंक सहसंबंध परीक्षण; सी) श्रृंखला विधि। 56. मॉडल का दिया गया रूप है: ए) अंतर्जात चर से बहिर्जात चर के गैर-रेखीय कार्यों की एक प्रणाली; बी) बहिर्जात चर से अंतर्जात चर के रैखिक कार्यों की एक प्रणाली; ग) अंतर्जात चर से बहिर्जात चर के रैखिक कार्यों की एक प्रणाली; डी) सामान्य समीकरणों की एक प्रणाली। 57. पुनरावर्ती सूत्रों द्वारा परिकलित आंशिक सहसंबंध गुणांक किस सीमा के भीतर बदलता है? एक से - बी) 0 से 1 तक; ग) 0 से + . तक डी) -1 से +1 तक। 58. निर्धारण परिवर्तन के गुणांक के माध्यम से गणना की गई आंशिक सहसंबंध गुणांक किस सीमा के भीतर है? एक से - बी) 0 से 1 तक; ग) 0 से + . तक घ) -1 से +1 तक। 59. बहिर्जात चर: ए) आश्रित चर; बी) स्वतंत्र चर; 61. प्रतिगमन समीकरण में एक और व्याख्यात्मक कारक जोड़ते समय, बहु सहसंबंध गुणांक: ए) घट जाएगा बी) वृद्धि होगी; ग) अपना मूल्य बनाए रखें। 62. एक अतिपरवलयिक प्रतिगमन समीकरण बनाया गया था:यू=
एक+
बी/
एक्स. के लियेसमीकरण का महत्व परीक्षण वितरण का उपयोग करता है: ए) सामान्य; बी) छात्र; ग) पियर्सन; d) फिशर-स्नेडेकोर। 63. पारंपरिक न्यूनतम वर्ग विधि का उपयोग करके किस प्रकार की प्रणालियों के लिए व्यक्तिगत अर्थमितीय समीकरणों के पैरामीटर पाए जा सकते हैं? ए) सामान्य समीकरणों की एक प्रणाली; बी) स्वतंत्र समीकरणों की एक प्रणाली; सी) पुनरावर्ती समीकरणों की एक प्रणाली; डी) अन्योन्याश्रित समीकरणों की एक प्रणाली। 64. अंतर्जात चर: ए) आश्रित चर; बी) स्वतंत्र चर; ग) समय में पिछले बिंदुओं से दिनांकित। 65. निर्धारण के गुणांक में किस सीमा के भीतर परिवर्तन होता है? ए) 0 से + . तक बी) से - सी) 0 से +1 तक; d) -l से +1 तक। 66. एक बहु रेखीय समाश्रयण समीकरण बनाया गया है। व्यक्तिगत गुणांकों के महत्व की जाँच करने के लिए, हम उपयोग करते हैं वितरण: ए) सामान्य; बी) छात्र; ग) पियर्सन; डी) फिशर-स्नेडेकोर। 67. प्रतिगमन समीकरण में एक और व्याख्यात्मक कारक जोड़ते समय, निर्धारण का गुणांक: ए) घट जाएगा बी) में वृद्धि होगी; ग) अपना मूल्य बनाए रखें; डी) कम नहीं होगा। 68. सबसे छोटी वर्ग विधि का सार यह है कि: ए) अनुमान निर्धारित अनुमान से नमूना डेटा के वर्ग विचलन के योग को कम करने की स्थिति से निर्धारित होता है; बी) अनुमान निर्धारित अनुमान से नमूना डेटा के विचलन के योग को कम करने की स्थिति से निर्धारित होता है; सी) अनुमान नमूना भिन्नता से नमूना माध्य के वर्ग विचलन के योग को कम करने की स्थिति से निर्धारित होता है। 69. परवलय किस वर्ग के गैर-रेखीय प्रतिगमन से संबंधित है: 73. घातीय वक्र किस वर्ग के गैर-रेखीय प्रतिगमन से संबंधित है: 74. गैर-रैखिक प्रतिगमन का कौन सा वर्ग के रूप का एक कार्य करता है . से संबंधित है ए) प्रतिगमन जो विश्लेषण में शामिल चर के संबंध में गैर-रैखिक हैं, लेकिन अनुमानित मापदंडों के संबंध में रैखिक हैं; बी) अनुमानित मापदंडों पर गैर-रेखीय प्रतिगमन। 78. गैर-रैखिक प्रतिगमन का कौन सा वर्ग के रूप का एक कार्य करता है . से संबंधित है ए) प्रतिगमन जो विश्लेषण में शामिल चर के संबंध में गैर-रैखिक हैं, लेकिन अनुमानित मानकों के संबंध में रैखिक हैं; बी) अनुमानित मापदंडों पर गैर-रेखीय प्रतिगमन। 79. अतिपरवलय के रूप में समाश्रयण समीकरण में ए) कारक विशेषता में वृद्धि के साथ एक्सपरिणामी विशेषता का मान परधीरे-धीरे कम करें, और एक्स→∞औसत मूल्य परके बराबर होगा एक; बी) प्रभावी सुविधा का मूल्य परकारक विशेषता में वृद्धि के साथ धीमी वृद्धि के साथ बढ़ता है एक्स, और कम से एक्स→∞
81. लोच का गुणांक सूत्र द्वारा निर्धारित किया जाता है ए) रैखिक समारोह; बी) परबोलस; ग) अतिपरवलय; डी) घातीय वक्र; ई) शक्ति। 82. लोच का गुणांक सूत्र द्वारा निर्धारित किया जाता है क) रैखिक कार्य; बी) परबोलस; ग) अतिपरवलय; डी) घातीय वक्र; ई) शक्ति। 86. समीकरण ए) एक रैखिक प्रवृत्ति बी) परवलयिक प्रवृत्ति; ग) अतिशयोक्तिपूर्ण प्रवृत्ति; डी) घातीय प्रवृत्ति। 89. समीकरण ए) एक रैखिक प्रवृत्ति; बी) परवलयिक प्रवृत्ति; ग) अतिशयोक्तिपूर्ण प्रवृत्ति; डी) एक घातीय प्रवृत्ति। 90. सिस्टम दृश्य
ए) स्वतंत्र समीकरणों की एक प्रणाली; बी) पुनरावर्ती समीकरणों की एक प्रणाली; सी) अन्योन्याश्रित (एक साथ, एक साथ) समीकरणों की एक प्रणाली। 93.
अर्थमिति को इस प्रकार परिभाषित किया जा सकता है: ए) यह एक स्वतंत्र वैज्ञानिक अनुशासन है जो आर्थिक सिद्धांत, आर्थिक सांख्यिकी और गणितीय और सांख्यिकीय उपकरणों के आधार पर डिजाइन किए गए सैद्धांतिक परिणामों, तकनीकों, विधियों और मॉडलों के एक सेट को जोड़ता है, सामान्य (गुणात्मक) पैटर्न को विशिष्ट मात्रात्मक अभिव्यक्ति देता है। आर्थिक सिद्धांत के कारण; बी) आर्थिक माप का विज्ञान; सी) आर्थिक डेटा का सांख्यिकीय विश्लेषण। 94. अर्थमिति के कार्यों में शामिल हैं: ए) राज्य और विश्लेषण प्रणाली के विकास की विशेषता वाले आर्थिक और सामाजिक-आर्थिक संकेतकों का पूर्वानुमान; बी) प्रणाली के सामाजिक-आर्थिक विकास के लिए संभावित परिदृश्यों का अनुकरण यह पहचानने के लिए कि कुछ प्रबंधनीय मापदंडों में नियोजित परिवर्तन आउटपुट विशेषताओं को कैसे प्रभावित करेंगे; ग) सांख्यिकीय आंकड़ों के अनुसार परिकल्पना का परीक्षण। 95. रिश्ते उनके स्वभाव से प्रतिष्ठित होते हैं: ए) कार्यात्मक और सहसंबंध; बी) कार्यात्मक, घुमावदार और सीधा; ग) सहसंबंध और प्रतिलोम; डी) सांख्यिकीय और प्रत्यक्ष। 96. एक कारक विशेषता में वृद्धि के साथ सीधे संबंध के साथ: ए) प्रभावी संकेत कम हो जाता है; बी) प्रभावी विशेषता नहीं बदलती है; सी) प्रदर्शन संकेतक बढ़ता है। 97. सांख्यिकी में संघ की उपस्थिति, प्रकृति और दिशा की पहचान करने के लिए किन विधियों का उपयोग किया जाता है? ए) औसत मूल्य; बी) समानांतर पंक्तियों की तुलना; ग) विश्लेषणात्मक समूहन विधि; डी) सापेक्ष मूल्य; डी) चित्रमय विधि। 98. दूसरों पर कुछ कारकों के प्रभाव के रूपों की पहचान करने के लिए किस विधि का उपयोग किया जाता है? ए) सहसंबंध विश्लेषण; बी) प्रतिगमन विश्लेषण; ग) सूचकांक विश्लेषण; डी) विचरण का विश्लेषण। 99. दूसरों पर कुछ कारकों के प्रभाव की ताकत को मापने के लिए किस विधि का उपयोग किया जाता है: ए) सहसंबंध विश्लेषण; बी) प्रतिगमन विश्लेषण; ग) औसत की विधि; डी) विचरण का विश्लेषण। 100. माइनस से प्लस वन की सीमा में उनके परिमाण में कौन से संकेतक मौजूद हैं: क) निर्धारण का गुणांक; बी) सहसंबंध अनुपात; सी) रैखिक सहसंबंध गुणांक। 101. एक-कारक मॉडल के लिए प्रतिगमन गुणांक दिखाता है: ए) एक इकाई द्वारा तर्क बदलने पर फ़ंक्शन कितनी इकाइयाँ बदलता है; बी) तर्क में प्रति इकाई परिवर्तन कितने प्रतिशत फ़ंक्शन बदलता है। 102. लोच का गुणांक दर्शाता है: ए) माप की एक इकाई द्वारा तर्क में परिवर्तन के साथ फ़ंक्शन कितने प्रतिशत बदलता है; बी) तर्क में 1% परिवर्तन के साथ फ़ंक्शन कितने प्रतिशत बदलता है; ग) इसके माप की कितनी इकाइयाँ, तर्क में 1% के परिवर्तन के साथ फ़ंक्शन बदलता है। 105. सहसंबंध सूचकांक का मान, 0.087 के बराबर, इंगित करता है: ए) उनकी कमजोर निर्भरता के बारे में; बी) एक मजबूत रिश्ता; ग) गणना में त्रुटियां। 107. युग्म सहसंबंध गुणांक का मान, 1.12 के बराबर, इंगित करता है: क) उनकी कमजोर निर्भरता के बारे में; बी) एक मजबूत रिश्ता; सी) गणना में त्रुटियों के बारे में। 109. दी गई संख्याओं में से कौन सी जोड़ी सहसंबंध गुणांक का मान हो सकता है: 111. दी गई संख्याओं में से कौन सी बहु सहसंबंध गुणांक के मान हो सकते हैं: 115. रैखिक समाश्रयण समीकरण के सही रूप को चिह्नित करें: जैसा द्वारा सी) डी) -सांख्यिकी- प्रतिगमन समीकरण की सटीकता की एक विशेषता, जो निर्भर चर के विचरण के उस हिस्से का अनुपात है जिसे प्रतिगमन समीकरण द्वारा विचरण के अस्पष्टीकृत (अवशिष्ट) भाग के लिए समझाया गया है। निर्धारित करने के लिए समीकरण
-बहुभिन्नरूपी प्रतिगमन के मामले में सांख्यिकी का रूप है:
- समझाया गया विचरण - आश्रित चर Y के प्रसरण का हिस्सा, जिसे प्रतिगमन समीकरण द्वारा समझाया गया है;
-अवशिष्ट फैलाव- आश्रित चर Y के विचरण का हिस्सा, जिसे प्रतिगमन समीकरण द्वारा समझाया नहीं गया है, इसकी उपस्थिति एक यादृच्छिक घटक की कार्रवाई का परिणाम है;
- नमूने में अंकों की संख्या;
- प्रतिगमन समीकरण में चर की संख्या।
) स्वतंत्रता की डिग्री की संख्या है
. इसका मतलब यह है कि अवशिष्ट विचरण को निर्धारित करने के लिए, प्रतिगमन समीकरण के गुणांकों को जानना पर्याप्त है और केवल
नमूने से आश्रित चर के मान। शेष दो मूल्यों की गणना इन आंकड़ों से की जा सकती है और इसलिए स्वतंत्र रूप से परिवर्तनशील नहीं हैं।
. इसलिए, अवशिष्ट विचरण के लिए स्वतंत्रता की डिग्री की संख्या प्रतिगमन समीकरण में स्वतंत्र चर की संख्या के बराबर है (युग्मित रैखिक प्रतिगमन के लिए)
).
युग्मित रैखिक प्रतिगमन के समीकरण के लिए मानदंड सूत्र द्वारा निर्धारित किया जाता है:
.
-सामान्य जनसंख्या से एक नमूने के लिए प्राप्त प्रतिगमन समीकरण का मानदंड जिसमें आश्रित और स्वतंत्र चर के बीच कोई संबंध नहीं है, में फिशर वितरण है, जिसका काफी अच्छी तरह से अध्ययन किया गया है। इस वजह से, किसी भी मूल्य के लिए
-मानदंड, आप इसकी घटना की संभावना की गणना कर सकते हैं और इसके विपरीत, मूल्य निर्धारित कर सकते हैं
-मानदंड कि वह किसी दी गई संभावना से अधिक नहीं हो सकता है।
.
), उच्चतर विश्वसनीयता स्तरके बराबर परीक्षण
, अर्थात। वास्तव में असंबंधित चरों की आबादी में एक रिश्ते के अस्तित्व की नमूना त्रुटि से बचने का मौका जितना अधिक होगा। लेकिन जैसे-जैसे महत्व का स्तर बढ़ता है, प्रतिबद्ध होने का जोखिम टाइप II त्रुटियां- सही शून्य परिकल्पना को अस्वीकार करें, अर्थात। नमूने में सामान्य जनसंख्या में चरों के वास्तविक संबंध पर ध्यान न देना। इसलिए, इस आधार पर कि किस त्रुटि के बड़े नकारात्मक परिणाम हैं, एक या दूसरे स्तर के महत्व को चुना जाता है।
शक्ति द्वारा नमूने में से अधिक होने की संभावना
चर के बीच संबंध के बिना सामान्य जनसंख्या से प्राप्त, महत्व स्तर से अधिक नहीं है।
प्रतिगमन समीकरण के मानदंड के वास्तविक मूल्य की तुलना में
.
, फिर मूल्य के साथ कनेक्शन का गलत पता लगाना
-मानदंड बराबर या अधिक
असंबंधित चर वाले सामान्य जनसंख्या से एक नमूने के लिए महत्व स्तर से कम संभावना के साथ घटित होगा। नियम के अनुसार "बहुत दुर्लभ घटनाएँ नहीं होती हैं", हम इस निष्कर्ष पर पहुँचते हैं कि नमूने द्वारा स्थापित चर के बीच का संबंध उस सामान्य आबादी में भी मौजूद है जिससे इसे प्राप्त किया गया था।
, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण नहीं है। दूसरे शब्दों में, इस बात की वास्तविक संभावना है कि नमूने में उन चरों के बीच संबंध स्थापित किया गया है जो वास्तविकता में मौजूद नहीं हैं। एक समीकरण जो सांख्यिकीय महत्व के लिए एक परीक्षण में विफल रहता है, उसे एक एक्सपायर्ड दवा के समान माना जाता है - ऐसी दवाएं जरूरी खराब नहीं होती हैं, लेकिन चूंकि उनकी गुणवत्ता के बारे में कोई निश्चितता नहीं है, इसलिए उन्हें इस्तेमाल नहीं करने के लिए प्राथमिकता दी जाती है। यह नियम सभी त्रुटियों से रक्षा नहीं करता है, लेकिन यह आपको सबसे स्थूल त्रुटियों से बचने की अनुमति देता है, जो कि काफी महत्वपूर्ण भी है।
महत्व स्तर के साथ मानदंड। यदि यह संभावना महत्व स्तर से कम है
, तो समीकरण सांख्यिकीय रूप से महत्वपूर्ण है, अन्यथा नहीं।
-छात्र की कसौटी, सूत्रों द्वारा निर्धारित:
तथा
,
- गुणांक के लिए छात्र की कसौटी के मूल्य
तथा
क्रमश;
- प्रतिगमन समीकरण का अवशिष्ट विचरण;
- नमूने में अंकों की संख्या;
- युग्मित रेखीय प्रतिगमन के लिए नमूने में चर की संख्या
.
छात्र वितरण से प्राप्त अगर यह पता चला है कि
, तो संगत गुणांक सांख्यिकीय रूप से महत्वपूर्ण है, अन्यथा यह नहीं है। गुणांकों के सांख्यिकीय महत्व की जाँच के लिए दूसरा विकल्प विद्यार्थी की कसौटी के घटित होने की प्रायिकता का निर्धारण करना है
और महत्व स्तर के साथ तुलना करें
.
.
एक ज्ञात के साथ
सूत्र के अनुसार मूल्यांकन किया गया:
, फिर महत्व स्तर के लिए
विद्यार्थी की कसौटी खोजना आवश्यक है
तथा विश्वास अंतरालविश्वसनीयता के स्तर के साथ पूर्वानुमान के लिए
के बराबर होगा
.
- चर के प्रभाव का वर्णन करने वाले प्रतिगमन गुणांक
अनुमानित मूल्य से।
आपको एक गैर-रेखीय समस्या को एक बहुआयामी रैखिक समस्या में बदलने की अनुमति देता है
और परिवर्तित चर के विभिन्न संयोजनों में प्रारंभिक बिंदुओं की निर्भरता के रेखांकन बनाए जाते हैं। रूपांतरित निर्देशांक, या रूपांतरित और गैर-रूपांतरित निर्देशांक का वह संयोजन, जिसमें निर्भरता एक सीधी रेखा के सबसे करीब होती है, चर के परिवर्तन का सुझाव देती है जो एक गैर-रेखीय निर्भरता के एक रैखिक रूप में परिवर्तन की ओर ले जाएगी। उदाहरण के लिए, प्रपत्र की एक अरेखीय निर्भरता
,
तथा
.
एक दूसरे पर निर्भर न हों
स्वतंत्र चर पर निर्भर न हों
निर्भर करना
, फिर स्वतंत्र (स्वतंत्र) चर पर। यदि इन ग्राफ़ पर बिंदु x-अक्ष के सममित रूप से स्थित गलियारे में स्थित हैं और बिंदुओं के स्थान में कोई नियमितता नहीं है, तो गॉस-मार्कोव की स्थिति पूरी होती है और प्रतिगमन की सटीकता में सुधार करने के कोई अवसर नहीं हैं। समीकरण यदि ऐसा नहीं है, तो समीकरण की सटीकता में काफी सुधार करना संभव है, और इसके लिए विशेष साहित्य का उल्लेख करना आवश्यक है।
प्रतिगमन के प्रकार
उदाहरण 1
स्प्रेडशीट "एक्सेल" की क्षमताओं का उपयोग करना
एक्सेल में
आर-स्क्वायर के लिए प्रतिगमन परिणामों का विश्लेषण
अनुपात विश्लेषण
एकाधिक प्रतिगमन
पैरामीटर अनुमान
रैखिक प्रतिगमन समीकरण का उपयोग करने में समस्या
परिणामों का विश्लेषण
शेयरों का एक ब्लॉक खरीदने की समीचीनता की समस्या
एक्सेल स्प्रेडशीट का उपयोग कर समाधान
परिणामों और निष्कर्षों की जांच
.
समीकरण के महत्व की जांच करने के लिए, हमने गणना कीमनाया मूल्यटी- आँकड़े: 3.9। निष्कर्ष:
;
;
, तो यह दिखाता है:
और मैट्रिक्स A की रैंक (K-1) से कम है तो समीकरण:
;
;
.
एक्स =
एक 0
+ए 1
एक्स प्रतिगमन गुणांक दिखाता है:
;
और मैट्रिक्स A की रैंक (K-1) से अधिक है तो समीकरण:
.
समीकरण के महत्व की जाँच करने के लिए, आँकड़ों के मूल्य की गणना की जाती है:4.2. निष्कर्ष:
तब माना जाता है:
.
और मैट्रिक्स A की रैंक (K-1) है तो समीकरण:
करने के लिए +
;
;
करने के लिए +
;
;
;
करने के लिए +
;
:
:
अगर मूल्यबी
>0
, फिर:
फॉर्म में एक रिग्रेशन मॉडल के लिए:
बुलाया:
बुलाया:
बुलाया:
;
;
;
.