न्यूनतम वर्ग विधि का उपयोग करके वित्तीय परिणामों का पूर्वानुमान लगाना। एक्सेल में कम से कम वर्ग - ट्रेंड फ़ंक्शन का उपयोग करना

100 रुपयेपहला ऑर्डर बोनस

काम का प्रकार चुनें स्नातक काम कोर्स वर्कसार मास्टर की थीसिस अभ्यास पर रिपोर्ट लेख रिपोर्ट समीक्षा परीक्षणमोनोग्राफ समस्या समाधान व्यवसाय योजना प्रश्नों के उत्तर रचनात्मक कार्यनिबंध ड्राइंग रचनाएँ अनुवाद प्रस्तुतियाँ टाइपिंग अन्य पाठ की विशिष्टता को बढ़ाना उम्मीदवार की थीसिस प्रयोगशाला कार्यऑनलाइन मदद करें

कीमत मांगो

तरीका कम से कम वर्गों- एक गणितीय (गणितीय-सांख्यिकीय) तकनीक जो गतिशील श्रृंखला को संरेखित करने का कार्य करती है, यादृच्छिक चर के बीच सहसंबंध के रूप की पहचान करती है, आदि। इसमें यह तथ्य शामिल है कि फ़ंक्शन जो वर्णन करता है यह घटना, एक सरल फ़ंक्शन द्वारा अनुमानित है। इसके अलावा, बाद वाले को इस तरह से चुना जाता है कि स्तर के स्तर से देखे गए बिंदुओं पर फ़ंक्शन के वास्तविक स्तरों का मानक विचलन (विचरण देखें) सबसे छोटा है।

उदाहरण के लिए, उपलब्ध आंकड़ों के अनुसार ( ग्यारहवीं,यी) (मैं = 1, 2, ..., एन) ऐसा वक्र निर्मित होता है आप = एक + बीएक्स, जिस पर वर्ग विचलन का योग न्यूनतम हो जाता है

यानी, एक फ़ंक्शन को छोटा किया जाता है जो दो मापदंडों पर निर्भर करता है: एक- y-अक्ष पर खंड और बी- सीधी रेखा का ढलान।

किसी फ़ंक्शन को छोटा करने के लिए आवश्यक शर्तें देने वाले समीकरण एस(एक,बी), कहा जाता है सामान्य समीकरण।सन्निकटन कार्यों के रूप में, न केवल रैखिक (एक सीधी रेखा के साथ संरेखण), बल्कि द्विघात, परवलयिक, घातांक आदि का भी उपयोग किया जाता है। संरेखण का उदाहरण गतिशील श्रृंखलाएक सीधी रेखा में, अंजीर देखें। एम.2, जहां वर्ग दूरी का योग ( आप 1 – मैं 1)2 + (आप 2 – मैं 2)2 .... - सबसे छोटी और परिणामी सीधी रेखा सबसे अच्छा तरीकासमय के साथ किसी संकेतक के लिए प्रेक्षणों की गतिशील श्रृंखला की प्रवृत्ति को दर्शाता है।

निष्पक्ष न्यूनतम वर्ग अनुमानकों के लिए, यह आवश्यक और सबसे महत्वपूर्ण शर्त को पूरा करने के लिए पर्याप्त है प्रतिगमन विश्लेषण: कारकों पर सशर्त यादृच्छिक त्रुटि की गणितीय अपेक्षा शून्य के बराबर होनी चाहिए। यह स्थिति, विशेष रूप से, पूरी होती है यदि: 1. यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य के बराबर है, और 2. कारक और यादृच्छिक त्रुटियां स्वतंत्र यादृच्छिक चर हैं। स्थिरांक वाले मॉडल के लिए पहली शर्त को हमेशा संतुष्ट माना जा सकता है, क्योंकि स्थिरांक त्रुटियों की गैर-शून्य गणितीय अपेक्षा पर ले जाता है। दूसरी शर्त - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति संतुष्ट नहीं है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात बहुत बड़ी मात्राडेटा इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)।

प्रतिगमन समीकरणों के मापदंडों के सांख्यिकीय अनुमान के अभ्यास में सबसे आम है कम से कम वर्गों की विधि। यह विधि डेटा की प्रकृति और मॉडल निर्माण के परिणामों के बारे में कई मान्यताओं पर आधारित है। मुख्य हैं आश्रित और स्वतंत्र लोगों में प्रारंभिक चर का स्पष्ट पृथक्करण, समीकरणों में शामिल कारकों की असंबद्धता, रिश्ते की रैखिकता, अवशेषों के स्वत: सहसंबंध की अनुपस्थिति, उनकी समानता गणितीय अपेक्षाएंशून्य और निरंतर फैलाव।

एलएसएम की मुख्य परिकल्पनाओं में से एक यह धारणा है कि विचलन ई के फैलाव बराबर हैं, यानी। श्रृंखला के औसत (शून्य) मूल्य के आसपास उनका फैलाव एक स्थिर मूल्य होना चाहिए। इस संपत्ति को होमोसेडैस्टिसिटी कहा जाता है। व्यवहार में, विचलन के विचलन अक्सर समान नहीं होते हैं, अर्थात विषमलैंगिकता देखी जाती है। यह एक परिणाम हो सकता है विभिन्न कारणों से. उदाहरण के लिए, मूल डेटा में त्रुटियां हो सकती हैं। स्रोत जानकारी में यादृच्छिक अशुद्धियाँ, जैसे संख्याओं के क्रम में त्रुटियाँ, परिणामों पर महत्वपूर्ण प्रभाव डाल सकती हैं। अक्सर विचलन का एक बड़ा प्रसार i आश्रित चर (चर) के बड़े मूल्यों पर देखा जाता है। यदि डेटा में एक महत्वपूर्ण त्रुटि है, तो स्वाभाविक रूप से, गलत डेटा से गणना किए गए मॉडल मान का विचलन भी बड़ा होगा। इस त्रुटि से छुटकारा पाने के लिए, हमें गणना परिणामों में इन आंकड़ों के योगदान को कम करना होगा, बाकी सभी की तुलना में उनके लिए कम वजन निर्धारित करना होगा। यह विचार भारित न्यूनतम वर्गों में कार्यान्वित किया जाता है।

विधि का सार इस तथ्य में निहित है कि विचाराधीन समाधान की गुणवत्ता की कसौटी चुकता त्रुटियों का योग है, जिसे कम करने की कोशिश की जाती है। इसे लागू करने के लिए जितना हो सके उतना अमल करना जरूरी है अधिकअज्ञात की माप अनियमित चर(अधिक - समाधान की सटीकता जितनी अधिक होगी) और प्रस्तावित समाधानों का कुछ सेट, जिसमें से सबसे अच्छा चुनना आवश्यक है। यदि समाधान के सेट को पैरामीटरकृत किया जाता है, तो मापदंडों का इष्टतम मूल्य पाया जाना चाहिए।

त्रुटि वर्गों को कम से कम क्यों किया जाता है, और स्वयं त्रुटियाँ क्यों नहीं? तथ्य यह है कि ज्यादातर मामलों में दोनों दिशाओं में त्रुटियां होती हैं: अनुमान माप से अधिक या उससे कम हो सकता है। यदि आप इसमें त्रुटियां जोड़ते हैं विभिन्न संकेत, तो वे एक दूसरे को रद्द कर देंगे, और परिणामस्वरूप, योग हमें अनुमान की गुणवत्ता का गलत विचार देगा। अक्सर, अंतिम अनुमान के लिए मापे गए मानों के समान आयाम होने के लिए, वर्गमूल को चुकता त्रुटियों के योग से लिया जाता है।


एक छवि:

एलएसएम गणित में प्रयोग किया जाता है, विशेष रूप से - संभाव्यता सिद्धांत और गणितीय आंकड़ों में। फ़िल्टरिंग समस्याओं में इस पद्धति का सबसे बड़ा अनुप्रयोग है, जब उपयोगी सिग्नल को उस पर लगाए गए शोर से अलग करना आवश्यक होता है।

इसका उपयोग गणितीय विश्लेषण में किसी दिए गए फ़ंक्शन के सरल कार्यों द्वारा अनुमानित प्रतिनिधित्व के लिए भी किया जाता है। एलएसएम के आवेदन का एक अन्य क्षेत्र समीकरणों की संख्या से कम अज्ञात के साथ समीकरणों की प्रणाली का समाधान है।

मैं एलएसएम के कुछ और बहुत ही अप्रत्याशित अनुप्रयोगों के साथ आया, जिनके बारे में मैं इस लेख में बात करना चाहूंगा।

बहुराष्ट्रीय कंपनियां और टाइपोस

टाइपो और वर्तनी की त्रुटियाँ स्वचालित अनुवादकों और खोज इंजनों के लिए अभिशाप हैं। वास्तव में, यदि शब्द केवल 1 अक्षर से भिन्न है, तो प्रोग्राम इसे दूसरे शब्द के रूप में मानता है और गलत तरीके से इसका अनुवाद/खोज करता है या इसका अनुवाद नहीं करता है/बिल्कुल नहीं ढूंढता है।

मुझे एक समान समस्या थी: मॉस्को के घरों के पते के साथ दो डेटाबेस थे, और उन्हें एक में जोड़ा जाना था। लेकिन पते में लिखे गए थे भिन्न शैली. एक डेटाबेस में KLADR मानक (ऑल-रूसी एड्रेस क्लासिफायरियर) था, उदाहरण के लिए: "BABUSHKINA PILOT UL।, D10K3"। और एक अन्य डेटाबेस में एक डाक शैली थी, उदाहरण के लिए: "सेंट। पायलट बाबुश्किन, मकान 10 भवन 3। ऐसा लगता है कि दोनों मामलों में कोई त्रुटि नहीं है, और प्रक्रिया को स्वचालित करना अविश्वसनीय रूप से कठिन है (प्रत्येक डेटाबेस में 40,000 रिकॉर्ड हैं!) हालाँकि पर्याप्त टाइपो भी थे ... कंप्यूटर को कैसे समझा जाए कि ऊपर दिए गए 2 पते एक ही घर के हैं? यहीं पर एमएनसी मेरे काम आई।

मैने क्या किया है? पहले पते में अगला पत्र पाकर मैंने दूसरे पते में वही पत्र खोजा। यदि वे दोनों एक ही स्थान पर थे, तो मैंने मान लिया कि उस अक्षर के लिए त्रुटि 0 थी। यदि वे आसन्न पदों पर थे, तो त्रुटि 1 थी। यदि 2 पदों से बदलाव होता है, तो त्रुटि 2 थी, और इसी तरह आगे यदि अन्य पते पर ऐसा कोई पत्र नहीं था, तो त्रुटि को n+1 मान लिया गया था, जहां n पहले पते में अक्षरों की संख्या है। इस प्रकार, मैंने चुकता त्रुटियों के योग की गणना की और उन अभिलेखों को जोड़ा जिनमें यह राशि न्यूनतम थी।

बेशक, घरों और इमारतों की संख्या अलग से संसाधित की गई थी। मुझे नहीं पता कि मैंने एक और "साइकिल" का आविष्कार किया था, या यह वास्तव में था, लेकिन समस्या जल्दी और कुशलता से हल हो गई थी। मुझे आश्चर्य है कि क्या इस पद्धति का उपयोग किया जाता है खोज यन्त्र? शायद इसका उपयोग किया जाता है, क्योंकि प्रत्येक स्वाभिमानी खोज इंजन, किसी अपरिचित शब्द से मिलते समय, परिचित शब्दों ("शायद आपका मतलब ...") से प्रतिस्थापन प्रदान करता है। हालाँकि, वे इस विश्लेषण को किसी तरह अलग तरीके से कर सकते हैं।

OLS और चित्रों, चेहरों और मानचित्रों द्वारा खोजें

यह विधि चित्रों, रेखाचित्रों, मानचित्रों और यहां तक ​​कि लोगों के चेहरों द्वारा भी खोजने के लिए लागू की जा सकती है।

एक छवि:

अब सभी सर्च इंजन इमेज द्वारा सर्च करने के बजाय इमेज कैप्शन द्वारा सर्च का उपयोग करते हैं। यह निस्संदेह एक उपयोगी और सुविधाजनक सेवा है, लेकिन मैं इसे वास्तविक छवि खोज के साथ पूरक करने का प्रस्ताव करता हूं।

एक नमूना चित्र पेश किया जाता है और सभी छवियों के लिए विशेषता बिंदुओं के वर्ग विचलन के योग द्वारा एक रेटिंग बनाई जाती है। इन बहुत ही विशिष्ट बिंदुओं को निर्धारित करना अपने आप में एक गैर-तुच्छ कार्य है। हालांकि, यह काफी हल करने योग्य है: उदाहरण के लिए, चेहरे के लिए, ये आंखों के कोने, होंठ, नाक की नोक, नासिका, भौंहों के किनारों और केंद्रों, विद्यार्थियों आदि हैं।

इन मापदंडों की तुलना करके, आप एक ऐसा चेहरा पा सकते हैं जो नमूने के समान है। मैंने पहले से ही ऐसी साइटें देखी हैं जहां ऐसी सेवा काम करती है, और आप एक सेलिब्रिटी ढूंढ सकते हैं जो आपके द्वारा सुझाए गए फोटो के समान है, और यहां तक ​​​​कि एक एनीमेशन भी बना सकते हैं जो आपको एक सेलिब्रिटी में बदल देता है और वापस आ जाता है। निश्चित रूप से वही तरीका आंतरिक मामलों के मंत्रालय के ठिकानों में काम करता है, जिसमें अपराधियों की पहचान वाली छवियां होती हैं।

फोटो: pixabay.com

हां, और उंगलियों के निशान उसी तरह से खोजे जा सकते हैं। मानचित्र खोज भौगोलिक वस्तुओं की प्राकृतिक अनियमितताओं पर केंद्रित है - नदियों का मोड़, पर्वत श्रृंखलाएं, तटों की रूपरेखा, जंगल और खेत।

यह बहुत बढ़िया है और सार्वभौमिक विधिएमएनके। मुझे विश्वास है कि प्रिय पाठकों, आप अपने लिए इस पद्धति के कई असामान्य और अप्रत्याशित अनुप्रयोगों को खोजने में सक्षम होंगे।

जो विज्ञान और अभ्यास के विभिन्न क्षेत्रों में व्यापक आवेदन पाता है। यह भौतिकी, रसायन विज्ञान, जीव विज्ञान, अर्थशास्त्र, समाजशास्त्र, मनोविज्ञान आदि हो सकता है। भाग्य की इच्छा से, मुझे अक्सर अर्थव्यवस्था से निपटना पड़ता है, और इसलिए आज मैं आपके लिए एक अद्भुत देश के टिकट की व्यवस्था करूंगा जिसे कहा जाता है अर्थमिति=) ... आप ऐसा कैसे नहीं चाहते?! यह वहां बहुत अच्छा है - आपको बस फैसला करना है! ...लेकिन आप जो निश्चित रूप से चाहते हैं वह यह है कि समस्याओं को हल करना सीखना है कम से कम वर्गों. और विशेष रूप से मेहनती पाठक उन्हें न केवल सटीक रूप से हल करना सीखेंगे, बल्कि बहुत तेज़ ;-) लेकिन पहले समस्या का सामान्य विवरण+ संबंधित उदाहरण:

कुछ विषय क्षेत्र में संकेतकों का अध्ययन करने दें जिनकी मात्रात्मक अभिव्यक्ति है। साथ ही, यह मानने का हर कारण है कि संकेतक संकेतक पर निर्भर करता है। यह धारणा हो सकती है वैज्ञानिक परिकल्पना, और प्राथमिक के आधार पर व्यावहारिक बुद्धि. आइए विज्ञान को एक तरफ छोड़ दें, और अधिक स्वादिष्ट क्षेत्रों का पता लगाएं - अर्थात्, किराना स्टोर। द्वारा निरूपित करें:

- किराने की दुकान का खुदरा स्थान, वर्गमीटर,
- किराने की दुकान का वार्षिक कारोबार, मिलियन रूबल।

यह बिल्कुल स्पष्ट है कि स्टोर का क्षेत्रफल जितना बड़ा होगा, ज्यादातर मामलों में उसका कारोबार उतना ही अधिक होगा।

मान लीजिए कि एक डफ के साथ अवलोकन / प्रयोग / गणना / नृत्य करने के बाद, हमारे पास हमारे निपटान में संख्यात्मक डेटा है:

किराने की दुकानों के साथ, मुझे लगता है कि सब कुछ स्पष्ट है: - यह पहली दुकान का क्षेत्र है, - इसका वार्षिक कारोबार, - दूसरे स्टोर का क्षेत्र, - इसका वार्षिक कारोबार, आदि। वैसे, वर्गीकृत सामग्रियों तक पहुंच होना बिल्कुल भी आवश्यक नहीं है - इसका उपयोग करके टर्नओवर का काफी सटीक मूल्यांकन प्राप्त किया जा सकता है। गणितीय सांख्यिकी. हालांकि, विचलित न हों, वाणिज्यिक जासूसी का कोर्स पहले ही भुगतान किया जा चुका है =)

सारणीबद्ध डेटा को बिंदुओं के रूप में भी लिखा जा सकता है और हमारे लिए सामान्य तरीके से दर्शाया जा सकता है। कार्तीय प्रणाली .

आइए एक महत्वपूर्ण प्रश्न का उत्तर दें: गुणात्मक अध्ययन के लिए कितने अंक चाहिए?

जितना बड़ा उतना अच्छा। न्यूनतम स्वीकार्य सेट में 5-6 अंक होते हैं। इसके अलावा, डेटा की एक छोटी मात्रा के साथ, "असामान्य" परिणामों को नमूने में शामिल नहीं किया जाना चाहिए। इसलिए, उदाहरण के लिए, एक छोटा संभ्रांत स्टोर "उनके सहयोगियों" से अधिक परिमाण के आदेशों में मदद कर सकता है, जिससे सामान्य पैटर्न को विकृत करने की आवश्यकता होती है!

यदि यह काफी सरल है, तो हमें एक फ़ंक्शन चुनना होगा, अनुसूचीजो जितना संभव हो उतना करीब से गुजरता है . इस तरह के एक समारोह कहा जाता है अनुमान करने वाले (सन्निकटन - सन्निकटन)या सैद्धांतिक कार्य . सामान्यतया, यहाँ तुरंत स्पष्ट "आवेदक" दिखाई देता है - बहुपद उच्च डिग्री, जिसका ग्राफ सभी बिंदुओं से होकर गुजरता है। लेकिन यह विकल्प जटिल है, और अक्सर बस गलत है। (क्योंकि चार्ट हर समय "हवा" देगा और मुख्य प्रवृत्ति को खराब रूप से प्रतिबिंबित करेगा).

इस प्रकार, वांछित कार्य पर्याप्त रूप से सरल होना चाहिए और साथ ही साथ निर्भरता को पर्याप्त रूप से प्रतिबिंबित करना चाहिए। जैसा कि आप अनुमान लगा सकते हैं, ऐसे कार्यों को खोजने के तरीकों में से एक को कहा जाता है कम से कम वर्गों. सबसे पहले, आइए इसके सार का विश्लेषण करें सामान्य दृष्टि से. कुछ फ़ंक्शन को प्रयोगात्मक डेटा का अनुमान लगाने दें:


इस सन्निकटन की सटीकता का मूल्यांकन कैसे करें? आइए हम प्रयोगात्मक और . के बीच अंतर (विचलन) की गणना भी करें कार्यात्मक मूल्य (हम ड्राइंग का अध्ययन करते हैं). पहला विचार जो दिमाग में आता है वह यह है कि यह अनुमान लगाया जाए कि राशि कितनी बड़ी है, लेकिन समस्या यह है कि मतभेद नकारात्मक हो सकते हैं। (उदाहरण के लिए, ) और इस तरह के योग के परिणामस्वरूप विचलन एक दूसरे को रद्द कर देंगे। इसलिए, सन्निकटन की सटीकता के अनुमान के रूप में, यह खुद को योग लेने का सुझाव देता है मॉड्यूलविचलन:

या मुड़े हुए रूप में: (अचानक, कौन नहीं जानता: योग आइकन है, और एक सहायक चर है- "काउंटर", जो 1 से मान लेता है).

विभिन्न कार्यों के साथ प्रयोगात्मक बिंदुओं का अनुमान लगाते हुए, हम प्राप्त करेंगे विभिन्न अर्थ, और जाहिर है, जहां यह राशि कम है, वह फ़ंक्शन अधिक सटीक है।

ऐसी विधि मौजूद है और कहा जाता है कम से कम मापांक विधि. हालाँकि, व्यवहार में यह बहुत अधिक व्यापक हो गया है। कम से कम वर्ग विधि, जिसमें संभव नकारात्मक मानमापांक द्वारा नहीं, बल्कि विचलन को चुकता करके समाप्त किया जाता है:

, जिसके बाद प्रयासों को ऐसे फ़ंक्शन के चयन के लिए निर्देशित किया जाता है कि वर्ग विचलन का योग जितना संभव हो उतना छोटा था। दरअसल, इसलिए विधि का नाम।

और अब हम एक और महत्वपूर्ण बिंदु पर लौटते हैं: जैसा कि ऊपर उल्लेख किया गया है, चयनित फ़ंक्शन काफी सरल होना चाहिए - लेकिन ऐसे कई कार्य भी हैं: रैखिक , अतिपरवलिक, घातीय, लघुगणक, द्विघात आदि। और, ज़ाहिर है, यहाँ मैं तुरंत "गतिविधि के क्षेत्र को कम करना" चाहूंगा। अनुसंधान के लिए किस वर्ग के कार्यों का चयन करना है? आदिम लेकिन प्रभावी स्वागत:

- अंक आकर्षित करने का सबसे आसान तरीका ड्राइंग पर और उनके स्थान का विश्लेषण करें। यदि वे एक सीधी रेखा में होते हैं, तो आपको देखना चाहिए सीधी रेखा समीकरण साथ इष्टतम मूल्यतथा । दूसरे शब्दों में, कार्य ऐसे गुणांकों को खोजना है - ताकि वर्ग विचलनों का योग सबसे छोटा हो।

यदि बिंदु स्थित हैं, उदाहरण के लिए, साथ में अतिशयोक्ति, तो यह स्पष्ट है कि रैखिक फलन खराब सन्निकटन देगा। इस मामले में, हम हाइपरबोला समीकरण के लिए सबसे "अनुकूल" गुणांक की तलाश कर रहे हैं - वे जो वर्गों का न्यूनतम योग देते हैं .

अब ध्यान दें कि दोनों ही मामलों में हम बात कर रहे हैं दो चर के कार्य, जिनके तर्क हैं खोज निर्भरता विकल्प:

और संक्षेप में, हमें एक मानक समस्या को हल करने की आवश्यकता है - खोजने के लिए दो चर के एक समारोह का न्यूनतम.

हमारे उदाहरण को याद करें: मान लीजिए कि "दुकान" बिंदु एक सीधी रेखा में स्थित हैं और उपस्थिति पर विश्वास करने का हर कारण है रैखिक निर्भरताव्यापार क्षेत्र से कारोबार। आइए ऐसे गुणांक "ए" और "बी" खोजें ताकि वर्ग विचलन का योग हो सबसे छोटा था। सब कुछ हमेशा की तरह - पहले 1 क्रम के आंशिक व्युत्पन्न. के अनुसार रैखिकता नियमआप योग आइकन के ठीक नीचे अंतर कर सकते हैं:

यदि आप उपयोग करना चाहते हैं यह जानकारीनिबंध या टर्म पेपर के लिए - मैं स्रोतों की सूची में लिंक के लिए बहुत आभारी रहूंगा, आपको कुछ जगहों पर इस तरह की विस्तृत गणना मिल जाएगी:

आइए एक मानक प्रणाली बनाएं:

हम प्रत्येक समीकरण को "दो" से कम करते हैं और, इसके अलावा, "अलग" रकम:

टिप्पणी : स्वतंत्र रूप से विश्लेषण करें कि "ए" और "बी" को योग आइकन से क्यों निकाला जा सकता है। वैसे, औपचारिक रूप से यह योग के साथ किया जा सकता है

आइए सिस्टम को "लागू" रूप में फिर से लिखें:

जिसके बाद हमारी समस्या को हल करने के लिए एल्गोरिदम तैयार करना शुरू होता है:

क्या हम बिंदुओं के निर्देशांक जानते हैं? हम जानते है। रकम क्या हम ढूंढ सकते हैं? सरलता। हम सबसे सरल रचना करते हैं दो अज्ञात के साथ दो रैखिक समीकरणों की प्रणाली("ए" और "बीएच")। हम सिस्टम को हल करते हैं, उदाहरण के लिए, क्रैमर की विधि, जिसके परिणामस्वरूप एक स्थिर बिंदु होता है। चेकिंग एक चरम के लिए पर्याप्त स्थिति, हम सत्यापित कर सकते हैं कि इस बिंदु पर फ़ंक्शन ठीक पहुँचता है न्यूनतम. सत्यापन अतिरिक्त गणनाओं से जुड़ा है और इसलिए हम इसे पर्दे के पीछे छोड़ देंगे। (यदि आवश्यक हो, लापता फ्रेम देखा जा सकता है). हम अंतिम निष्कर्ष निकालते हैं:

समारोह सबसे अच्छा तरीका (कम से कम किसी अन्य रैखिक कार्य की तुलना में)प्रयोगात्मक बिंदुओं को करीब लाता है . मोटे तौर पर, इसका ग्राफ इन बिंदुओं के जितना करीब हो सके गुजरता है। परंपरा में अर्थमितिपरिणामी सन्निकटन फलन को भी कहा जाता है युग्मित रैखिक समाश्रयण समीकरण .

विचाराधीन समस्या बहुत व्यावहारिक महत्व की है। हमारे उदाहरण के साथ स्थिति में, समीकरण आपको यह अनुमान लगाने की अनुमति देता है कि किस प्रकार का टर्नओवर ("यिग")बिक्री क्षेत्र के एक या दूसरे मूल्य के साथ स्टोर पर होगा ("एक्स" का एक या दूसरा अर्थ). हां, परिणामी पूर्वानुमान केवल एक पूर्वानुमान होगा, लेकिन कई मामलों में यह काफी सटीक साबित होगा।

मैं "वास्तविक" संख्याओं के साथ केवल एक समस्या का विश्लेषण करूंगा, क्योंकि इसमें कोई कठिनाई नहीं है - सभी गणना स्तर पर हैं स्कूल के पाठ्यक्रम 7-8 ग्रेड। 95 प्रतिशत मामलों में, आपको केवल एक रैखिक फ़ंक्शन खोजने के लिए कहा जाएगा, लेकिन लेख के अंत में मैं दिखाऊंगा कि इष्टतम हाइपरबोला, घातांक और कुछ अन्य कार्यों के लिए समीकरणों को खोजना अधिक कठिन नहीं है।

वास्तव में, यह वादा किए गए उपहारों को वितरित करने के लिए बनी हुई है - ताकि आप सीखें कि ऐसे उदाहरणों को न केवल सटीक रूप से हल करना है, बल्कि जल्दी से भी। हम मानक का ध्यानपूर्वक अध्ययन करते हैं:

एक कार्य

दो संकेतकों के बीच संबंध का अध्ययन करने के परिणामस्वरूप, संख्याओं के निम्नलिखित जोड़े प्राप्त हुए:

कम से कम वर्ग विधि का उपयोग करते हुए, उस रैखिक फ़ंक्शन को खोजें जो अनुभवजन्य का सबसे अच्छा अनुमान लगाता है (अनुभव)जानकारी। एक ऐसा चित्र बनाइए जिस पर कार्तीय आयताकार निर्देशांक प्रणाली में प्रायोगिक बिंदुओं को आलेखित करें और सन्निकट फलन का आलेख तैयार करें। . अनुभवजन्य और सैद्धांतिक मूल्यों के बीच वर्ग विचलन का योग ज्ञात कीजिए। पता करें कि क्या फ़ंक्शन बेहतर है (न्यूनतम वर्ग विधि के संदर्भ में)अनुमानित प्रयोगात्मक बिंदु।

ध्यान दें कि "x" मान प्राकृतिक मूल्य हैं, और इसका एक विशिष्ट अर्थपूर्ण अर्थ है, जिसके बारे में मैं थोड़ी देर बाद बात करूंगा; लेकिन वे, निश्चित रूप से, भिन्नात्मक हो सकते हैं। इसके अलावा, किसी विशेष कार्य की सामग्री के आधार पर, "X" और "G" दोनों मान पूर्ण या आंशिक रूप से नकारात्मक हो सकते हैं। खैर, हमें एक "फेसलेस" टास्क दिया गया है, और हम इसे शुरू करते हैं समाधान:

कठिनाइयाँ इष्टतम कार्यसिस्टम के समाधान के रूप में खोजें:

अधिक कॉम्पैक्ट नोटेशन के प्रयोजनों के लिए, "काउंटर" चर को छोड़ा जा सकता है, क्योंकि यह पहले से ही स्पष्ट है कि योग 1 से .

सारणीबद्ध रूप में आवश्यक राशियों की गणना करना अधिक सुविधाजनक है:


गणना एक माइक्रोकैलकुलेटर पर की जा सकती है, लेकिन एक्सेल का उपयोग करना बहुत बेहतर है - दोनों तेज और त्रुटियों के बिना; एक छोटा वीडियो देखें:

इस प्रकार, हम निम्नलिखित प्राप्त करते हैं: व्यवस्था:

यहां आप दूसरे समीकरण को 3 और . से गुणा कर सकते हैं पहले समीकरण पद से दूसरे को पद द्वारा घटाएं. लेकिन यह भाग्य है - व्यवहार में, सिस्टम अक्सर उपहार में नहीं होते हैं, और ऐसे मामलों में यह बचाता है क्रैमर की विधि:
, इसलिए सिस्टम के पास एक अनूठा समाधान है।

चलो एक चेक करते हैं। मैं समझता हूं कि मैं नहीं करना चाहता, लेकिन गलतियों को क्यों छोड़ें जहां आप उन्हें बिल्कुल याद नहीं कर सकते? सिस्टम के प्रत्येक समीकरण के बाईं ओर पाए गए समाधान को प्रतिस्थापित करें:

संबंधित समीकरणों के सही हिस्से प्राप्त होते हैं, जिसका अर्थ है कि सिस्टम सही ढंग से हल हो गया है।

इस प्रकार, वांछित सन्निकटन फलन: - from सब रैखिक कार्य प्रयोगात्मक डेटा इसके द्वारा सबसे अच्छा अनुमानित है।

भिन्न सीधा अपने क्षेत्र पर स्टोर के कारोबार की निर्भरता, मिली निर्भरता है उल्टा (सिद्धांत "अधिक - कम"), और यह तथ्य तुरंत नकारात्मक द्वारा प्रकट होता है कोणीय गुणांक. समारोह हमें सूचित करता है कि एक निश्चित संकेतक में 1 इकाई की वृद्धि के साथ, आश्रित संकेतक का मूल्य घट जाता है औसत 0.65 इकाइयों द्वारा। जैसा कि वे कहते हैं, एक प्रकार का अनाज की कीमत जितनी अधिक होगी, उतना ही कम बेचा जाएगा।

सन्निकटन फलन को आलेखित करने के लिए, हमें इसके दो मान मिलते हैं:

और ड्राइंग निष्पादित करें:


निर्मित रेखा कहलाती है प्रवृत्ति रेखा (अर्थात्, एक रेखीय प्रवृत्ति रेखा, अर्थात in सामान्य मामलाप्रवृत्ति जरूरी नहीं कि एक सीधी रेखा हो). हर कोई "प्रवृत्ति में होना" अभिव्यक्ति से परिचित है, और मुझे लगता है कि इस शब्द को अतिरिक्त टिप्पणियों की आवश्यकता नहीं है।

वर्ग विचलन के योग की गणना करें अनुभवजन्य और सैद्धांतिक मूल्यों के बीच। ज्यामितीय रूप से, यह "क्रिमसन" खंडों की लंबाई के वर्गों का योग है (जिनमें से दो इतने छोटे हैं कि आप उन्हें देख भी नहीं सकते).

आइए एक तालिका में गणनाओं को संक्षेप में प्रस्तुत करें:


उन्हें फिर से मैन्युअल रूप से किया जा सकता है, बस अगर मैं पहले बिंदु के लिए एक उदाहरण दूंगा:

लेकिन यह करने के लिए बहुत अधिक कुशल है एक निश्चित तरीके से:

आइए दोहराएं: परिणाम का अर्थ क्या है?से सभी रैखिक कार्यसमारोह घातांक सबसे छोटा है, अर्थात यह अपने परिवार में सबसे अच्छा सन्निकटन है। और यहाँ, वैसे, समस्या का अंतिम प्रश्न आकस्मिक नहीं है: क्या होगा यदि प्रस्तावित घातीय कार्य क्या प्रायोगिक बिंदुओं का अनुमान लगाना बेहतर होगा?

आइए वर्ग विचलन के संगत योग का पता लगाएं - उन्हें अलग करने के लिए, मैं उन्हें "एप्सिलॉन" अक्षर से नामित करूंगा। तकनीक बिल्कुल समान है:


और फिर से 1 बिंदु के लिए हर आग की गणना के लिए:

एक्सेल में, हम मानक फ़ंक्शन का उपयोग करते हैं ऍक्स्प (सिंटेक्स एक्सेल सहायता में पाया जा सकता है).

निष्कर्ष: , इसलिए घातांकीय फलन सीधी रेखा से भी बदतर प्रयोगात्मक बिंदुओं का अनुमान लगाता है .

लेकिन यहां यह ध्यान दिया जाना चाहिए कि "बदतर" है इसका मतलब अभी तक नहीं है, गलत क्या है। अब मैंने इसका एक ग्राफ बनाया है घातांक प्रकार्य- और यह बिंदुओं के करीब से भी गुजरता है - इतना अधिक कि एक विश्लेषणात्मक अध्ययन के बिना यह कहना मुश्किल है कि कौन सा कार्य अधिक सटीक है।

यह समाधान को पूरा करता है, और मैं तर्क के प्राकृतिक मूल्यों के प्रश्न पर लौटता हूं। विभिन्न अध्ययनों में, एक नियम के रूप में, आर्थिक या सामाजिक, महीनों, वर्षों या अन्य समान समय अंतरालों को प्राकृतिक "X" के साथ गिना जाता है। उदाहरण के लिए, ऐसी समस्या पर विचार करें।

संरेखण के बाद, हमें निम्नलिखित रूप का एक फलन मिलता है: g (x) = x + 1 3 + 1।

हम उपयुक्त मापदंडों की गणना करके इस डेटा को रैखिक संबंध y = a x + b के साथ अनुमानित कर सकते हैं। ऐसा करने के लिए, हमें तथाकथित कम से कम वर्ग विधि को लागू करने की आवश्यकता होगी। प्रयोगात्मक डेटा को सबसे अच्छी तरह से संरेखित करने के लिए आपको यह जांचने के लिए एक चित्र बनाने की भी आवश्यकता होगी।

यांडेक्स.आरटीबी आर-ए-339285-1

OLS वास्तव में क्या है (न्यूनतम वर्ग विधि)

मुख्य चीज जो हमें करने की आवश्यकता है वह है रैखिक निर्भरता के ऐसे गुणांकों को खोजना, जिस पर दो चर F (a, b) = i = 1 n (y i - (a x i + b)) 2 के फलन का मान होगा सबसे छोटा। दूसरे शब्दों में, ए और बी के कुछ मूल्यों के लिए, परिणामी सीधी रेखा से प्रस्तुत डेटा के वर्ग विचलन के योग का न्यूनतम मूल्य होगा। यह न्यूनतम वर्ग विधि का अर्थ है। उदाहरण को हल करने के लिए हमें केवल दो चरों के फलन का चरम ज्ञात करना है।

गुणांक की गणना के लिए सूत्र कैसे प्राप्त करें

गुणांकों की गणना के लिए सूत्र प्राप्त करने के लिए, दो चर वाले समीकरणों की एक प्रणाली को बनाना और हल करना आवश्यक है। ऐसा करने के लिए, हम अभिव्यक्ति F (a , b) = i = 1 n (y i - (a x i + b)) 2 के आंशिक अवकलज की गणना a और b के संबंध में करते हैं और उन्हें 0 के बराबर करते हैं।

एफ (ए, बी) δ ए = 0 δ एफ (ए, बी) δ बी = 0 ⇔ - 2 ∑ मैं = 1 एन (वाई मैं - (ए एक्स आई + बी)) एक्स i = 0 - 2 ∑ मैं = 1 एन ( y i - (a x i + b)) = 0 a i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a i = 1 n x i 2 + b i = 1 n x i = ∑ i = 1 n x i y i a i = 1 n x i + n b = i = 1 n y i

समीकरणों की एक प्रणाली को हल करने के लिए, आप किसी भी तरीके का उपयोग कर सकते हैं, जैसे प्रतिस्थापन या क्रैमर की विधि। नतीजतन, हमें ऐसे सूत्र प्राप्त करने चाहिए जो कम से कम वर्ग विधि का उपयोग करके गुणांक की गणना करें।

n i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

हमने उन चरों के मानों की गणना की है जिनके लिए फ़ंक्शन
F (a , b) = i = 1 n (y i - (a x i + b)) 2 न्यूनतम मान लेगा। तीसरे पैराग्राफ में हम साबित करेंगे कि ऐसा क्यों है।

यह व्यवहार में कम से कम वर्ग विधि का अनुप्रयोग है। उसके सूत्र, जिसका उपयोग पैरामीटर a को खोजने के लिए किया जाता है, में i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2 और पैरामीटर शामिल हैं।
n - यह प्रयोगात्मक डेटा की मात्रा को दर्शाता है। हम आपको प्रत्येक राशि की अलग से गणना करने की सलाह देते हैं। गुणांक मान b की गणना a के तुरंत बाद की जाती है।

आइए मूल उदाहरण पर वापस जाएं।

उदाहरण 1

यहाँ हमारे पास n बराबर पाँच है। गुणांक सूत्रों में शामिल आवश्यक राशियों की गणना करना अधिक सुविधाजनक बनाने के लिए, हम तालिका को भरते हैं।

मैं = 1 मैं = 2 मैं = 3 मैं = 4 मैं = 5 मैं = 1 5
एक्स मैं 0 1 2 4 5 12
यी 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
एक्स मैं वाई मैं 0 2 , 4 5 , 2 11 , 2 15 33 , 8
एक्स मैं 2 0 1 4 16 25 46

समाधान

चौथी पंक्ति में प्रत्येक व्यक्ति i के लिए तीसरी पंक्ति के मानों को दूसरी पंक्ति के मानों से गुणा करके प्राप्त डेटा होता है। पांचवीं पंक्ति में दूसरे वर्ग का डेटा होता है। अंतिम कॉलम अलग-अलग पंक्तियों के मूल्यों का योग दिखाता है।

आइए हम आवश्यक गुणांक a और b की गणना करने के लिए कम से कम वर्ग विधि का उपयोग करें। ऐसा करने के लिए, अंतिम कॉलम से वांछित मानों को प्रतिस्थापित करें और रकम की गणना करें:

n i = 1 n x i y i - i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33 , 8 - 12 12, 9 5 46 - 12 2 बी = 12, 9 - ए 12 5 ए 0, 165 बी ≈ 2, 184

हमने पाया कि वांछित सन्निकटन सीधी रेखा y = 0 , 165 x + 2 , 184 जैसी दिखेगी। अब हमें यह निर्धारित करने की आवश्यकता है कि कौन सी रेखा डेटा का सबसे अच्छा अनुमान लगाएगी - g (x) = x + 1 3 + 1 या 0 , 165 x + 2 , 184 । आइए कम से कम वर्ग विधि का उपयोग करके एक अनुमान लगाएं।

त्रुटि की गणना करने के लिए, हमें 1 = i = 1 n (y i - (a x i + b i)) 2 और σ 2 = ∑ i = 1 n (y i - g (x i)) 2 , न्यूनतम मान एक अधिक उपयुक्त रेखा के अनुरूप होगा।

1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 0, 019 σ 2 = i = 1 n (y i - g (x i)) 2 = = i = 1 5 (y i - (x i + 1 3 + 1)) 2 0 , 096

उत्तर: 1 . के बाद से< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
वाई = 0, 165 x + 2, 184।

कम से कम वर्ग विधि को ग्राफिक चित्रण में स्पष्ट रूप से दिखाया गया है। लाल रेखा सीधी रेखा g (x) = x + 1 3 + 1 को चिह्नित करती है, नीली रेखा y = 0, 165 x + 2, 184 को चिह्नित करती है। कच्चे डेटा को गुलाबी बिंदुओं से चिह्नित किया जाता है।

आइए हम बताते हैं कि वास्तव में इस प्रकार के सन्निकटन की आवश्यकता क्यों है।

उनका उपयोग उन समस्याओं में किया जा सकता है जिनके लिए डेटा स्मूथिंग की आवश्यकता होती है, साथ ही उन मामलों में जहां डेटा को प्रक्षेपित या एक्सट्रपलेशन की आवश्यकता होती है। उदाहरण के लिए, ऊपर चर्चा की गई समस्या में, कोई प्रेक्षित मात्रा y का मान x = 3 या x = 6 पर ज्ञात कर सकता है। हमने ऐसे उदाहरणों के लिए एक अलग लेख समर्पित किया है।

एलएसएम विधि का प्रमाण

ए और बी की गणना करते समय न्यूनतम मान लेने के लिए फ़ंक्शन के लिए, यह आवश्यक है कि किसी दिए गए बिंदु पर फॉर्म एफ (ए, बी) के फ़ंक्शन के अंतर के द्विघात रूप का मैट्रिक्स = i = 1 n (y i - (a x i + b)) 2 धनात्मक निश्चित हो। आइए आपको दिखाते हैं कि यह कैसा दिखना चाहिए।

उदाहरण 2

हमारे पास निम्नलिखित फॉर्म का दूसरा क्रम अंतर है:

डी 2 एफ (ए; बी) = δ 2 एफ (ए; बी) δ ए 2 डी 2 ए + 2 δ 2 एफ (ए; बी) δ ए बी डी ए डी बी + δ 2 एफ (ए; बी) δ बी 2 डी 2 बी

समाधान

2 एफ (ए; बी) δ ए 2 = δ एफ (ए; बी) ए δ ए = = - 2 ∑ आई = 1 एन (वाई आई - (ए एक्स आई + बी)) एक्स आई δ ए = 2 ∑ मैं = 1 n (x i) 2 δ 2 F (a ; b) a b = δ F (a ; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) b 2 = F (a ; b) b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + बी)) बी = 2 ∑ मैं = 1 एन (1) = 2 एन

दूसरे शब्दों में, इसे इस प्रकार लिखा जा सकता है: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i = 1 n d a d b + (2 n) d 2 b।

हमने द्विघात रूप M = 2 i = 1 n (x i) 2 2 i = 1 n x i 2 ∑ i = 1 n x i 2 n का मैट्रिक्स प्राप्त किया है।

इस मामले में, मान व्यक्तिगत तत्व a और b के आधार पर नहीं बदलेगा। क्या यह मैट्रिक्स सकारात्मक निश्चित है? इस प्रश्न का उत्तर देने के लिए, आइए देखें कि क्या इसके कोणीय अवयस्क सकारात्मक हैं।

पहले क्रम की गणना कोणीय नाबालिग: 2 i = 1 n (x i) 2 > 0 । चूँकि बिंदु x मैं संपाती नहीं हैं, असमानता सख्त है। आगे की गणना में हम इसे ध्यान में रखेंगे।

हम दूसरे क्रम के कोणीय नाबालिग की गणना करते हैं:

डी ई टी (एम) = 2 ∑ i = 1 n (x i) 2 2 i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - i = 1 n x i 2

उसके बाद, हम गणितीय प्रेरण का उपयोग करके असमानता n i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 के प्रमाण के लिए आगे बढ़ते हैं।

  1. आइए जाँच करें कि क्या यह असमानता मनमानी n के लिए मान्य है। आइए 2 लें और गणना करें:

2 i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = एक्स 1 + एक्स 2 2 > 0

हमें सही समानता मिली (यदि मान x 1 और x 2 मेल नहीं खाते हैं)।

  1. आइए मान लें कि यह असमानता n के लिए सही होगी, अर्थात। n i = 1 n (x i) 2 - i = 1 n x i 2 > 0 - सत्य।
  2. आइए अब n + 1 की वैधता सिद्ध करें, अर्थात्। कि (n + 1) ∑ i = 1 n + 1 (x i) 2 - i = 1 n + 1 x i 2 > 0 यदि n i = 1 n (x i) 2 - i = 1 n x i 2 > 0 ।

हम गणना करते हैं:

(एन + 1) ∑ i = 1 n + 1 (x i) 2 - i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - i = 1 n x i 2 + n x n + 1 2 - x n + 1 i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 एक्स 2 + एक्स 2 2 +। . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - एक्स 2) 2 +। . . + (एक्स एन - 1 - एक्स एन) 2 > 0

घुंघराले ब्रेसिज़ में संलग्न अभिव्यक्ति 0 से अधिक होगी (चरण 2 में हमने जो ग्रहण किया था उसके आधार पर), और शेष शब्द 0 से अधिक होंगे क्योंकि वे सभी संख्याओं के वर्ग हैं। हमने असमानता साबित की है।

उत्तर:पाया गया a और b मेल खाएगा सबसे छोटा मानफ़ंक्शन F (a , b) \u003d ∑ i \u003d 1 n (y i - (a x i + b)) 2, जिसका अर्थ है कि वे कम से कम वर्ग विधि (LSM) के वांछित पैरामीटर हैं।

यदि आप टेक्स्ट में कोई गलती देखते हैं, तो कृपया उसे हाइलाइट करें और Ctrl+Enter दबाएं

कम से कम वर्ग विधि संकलन के लिए एक गणितीय प्रक्रिया है रेखीय समीकरण, अधिकतम रूप से क्रमबद्ध जोड़े के एक सेट के अनुरूप, a और b के लिए मान ढूंढकर, सीधी रेखा समीकरण में गुणांक। कम से कम वर्ग विधि का लक्ष्य y और मानों के बीच कुल चुकता त्रुटि को कम करना है। यदि प्रत्येक बिंदु के लिए हम त्रुटि निर्धारित करते हैं, तो कम से कम वर्ग विधि न्यूनतम होती है:

जहाँ n = रेखा के चारों ओर क्रमित युग्मों की संख्या। डेटा के लिए सबसे प्रासंगिक।

यह अवधारणा चित्र . में सचित्र है

आंकड़े को देखते हुए, वह रेखा जो डेटा को सबसे अच्छी तरह से फिट करती है, प्रतिगमन रेखा, ग्राफ़ पर चार बिंदुओं की कुल चुकता त्रुटि को कम करती है। मैं आपको दिखाऊंगा कि निम्न उदाहरण में कम से कम वर्ग विधि का उपयोग करके इसे कैसे निर्धारित किया जाए।

एक युवा जोड़े की कल्पना करें जो हाल ही में एक साथ रहते हैं और एक बाथरूम वैनिटी टेबल साझा करते हैं। युवक ने नोटिस करना शुरू कर दिया कि उसकी मेज का आधा हिस्सा लगातार सिकुड़ रहा था, बाल मूस और सोया परिसरों से जमीन खो रहा था। पिछले कुछ महीनों से, वह आदमी उस दर पर बारीकी से नज़र रख रहा है जिस पर उसके टेबल पर आइटमों की संख्या बढ़ रही है। नीचे दी गई तालिका से पता चलता है कि पिछले कुछ महीनों में लड़की ने बाथरूम की मेज पर कितनी चीजें जमा की हैं।

चूंकि हमारा लक्ष्य यह पता लगाना है कि क्या समय के साथ वस्तुओं की संख्या बढ़ती है, "माह" स्वतंत्र चर होगा, और "वस्तुओं की संख्या" आश्रित चर होगा।

कम से कम वर्ग विधि का उपयोग करते हुए, हम उस समीकरण को निर्धारित करते हैं जो डेटा के लिए सबसे अच्छा फिट बैठता है a, y-अक्ष पर खंड, और b, रेखा का ढलान:

ए = वाई सीएफ - बीएक्स सीएफ

जहाँ x cf, x का माध्य मान है, स्वतंत्र चर, y cf, y का माध्य मान है, स्वतंत्र चर।

नीचे दी गई तालिका इन समीकरणों के लिए आवश्यक गणनाओं को सारांशित करती है।

हमारे बाथटब उदाहरण के लिए प्रभाव वक्र निम्नलिखित समीकरण द्वारा दिया जाएगा:

चूंकि हमारे समीकरण में 0.976 की सकारात्मक ढलान है, इसलिए आदमी के पास सबूत है कि टेबल पर वस्तुओं की संख्या समय के साथ प्रति माह 1 आइटम की औसत दर से बढ़ रही है। ग्राफ क्रमित युग्मों के साथ प्रभाव वक्र दिखाता है।

अगले छमाही (माह 16) के लिए अपेक्षित मदों की संख्या की गणना निम्नानुसार की जाएगी:

= 5.13 + 0.976x = 5.13 + 0.976(16) ~ 20.7 = 21 आइटम

तो यह हमारे नायक के लिए कुछ कार्रवाई करने का समय है।

एक्सेल में ट्रेंड फंक्शन

जैसा कि आपने अनुमान लगाया होगा, एक्सेल के पास एक मान की गणना करने के लिए एक फ़ंक्शन है कम से कम वर्ग विधि।इस फीचर को ट्रेंड कहा जाता है। इसका सिंटैक्स निम्नलिखित है:

रुझान ( ज्ञात मूल्यवाई; ज्ञात एक्स मान; नए एक्स मान; स्थिरांक)

Y के ज्ञात मान - आश्रित चरों की एक सरणी, हमारे मामले में, तालिका में वस्तुओं की संख्या

एक्स के ज्ञात मूल्य - स्वतंत्र चर की एक सरणी, हमारे मामले में यह एक महीना है

नए X मान - नए X (माह) मान जिसके लिए प्रवृत्ति समारोहआश्रित चरों का अपेक्षित मान लौटाता है (वस्तुओं की संख्या)

कॉन्स्ट - वैकल्पिक। एक बूलियन मान जो निर्दिष्ट करता है कि क्या स्थिरांक b का 0 होना आवश्यक है।

उदाहरण के लिए, यह आंकड़ा 16वें महीने के लिए बाथरूम टेबल पर अपेक्षित संख्या में आइटम निर्धारित करने के लिए उपयोग किए जाने वाले TREND फ़ंक्शन को दिखाता है।

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...