कम से कम वर्ग निर्माण का इतिहास। कम से कम वर्ग विधि

  • ट्यूटोरियल

परिचय

मैं एक कंप्यूटर प्रोग्रामर हूं. मैंने अपने करियर में सबसे बड़ी छलांग लगाई जब मैंने यह कहना सीखा: "मुझे कुछ भी समझ में नहीं आता!"अब मुझे विज्ञान के प्रकाशक को यह बताने में कोई शर्म नहीं है कि वह मुझे व्याख्यान दे रहा है, कि मुझे समझ में नहीं आता कि यह, प्रकाशमान, मुझसे क्या बात कर रहा है। और यह बहुत मुश्किल है। हां, यह स्वीकार करना कठिन और शर्मनाक है कि आप नहीं जानते। कौन यह स्वीकार करना पसंद करता है कि वह किसी चीज की मूल बातें नहीं जानता है। अपने पेशे के कारण, मुझे बड़ी संख्या में प्रस्तुतियों और व्याख्यानों में भाग लेना पड़ता है, जहां मैं स्वीकार करता हूं, अधिकांश मामलों में मुझे नींद आती है, क्योंकि मुझे कुछ भी समझ में नहीं आता है। और मुझे समझ में नहीं आता क्योंकि विज्ञान की वर्तमान स्थिति की बड़ी समस्या गणित में है। यह मानता है कि सभी छात्र गणित के सभी क्षेत्रों से परिचित हैं (जो कि बेतुका है)। यह स्वीकार करने के लिए कि आप नहीं जानते कि व्युत्पन्न क्या है (कि यह थोड़ी देर बाद है) शर्म की बात है।

लेकिन मैंने यह कहना सीख लिया है कि मैं नहीं जानता कि गुणन क्या है। हाँ, मैं नहीं जानता कि लाई बीजगणित के ऊपर उप-बीजगणित क्या है। हां, पता नहीं क्यों जिंदगी में चाहिए द्विघातीय समीकरण. वैसे, यदि आप सुनिश्चित हैं कि आप जानते हैं, तो हमारे पास बात करने के लिए कुछ है! गणित चालों की एक श्रृंखला है। गणितज्ञ जनता को भ्रमित करने और डराने की कोशिश करते हैं; जहां कोई भ्रम नहीं, कोई प्रतिष्ठा नहीं, कोई अधिकार नहीं। हां, सबसे अमूर्त भाषा में बोलना प्रतिष्ठित है, जो अपने आप में पूरी तरह बकवास है।

क्या आप जानते हैं कि व्युत्पन्न क्या है? सबसे अधिक संभावना है कि आप मुझे अंतर संबंध की सीमा के बारे में बताएंगे। सेंट पीटर्सबर्ग स्टेट यूनिवर्सिटी में गणित के पहले वर्ष में, विक्टर पेट्रोविच खविन मे परिभाषितबिंदु पर फ़ंक्शन के टेलर श्रृंखला के पहले पद के गुणांक के रूप में व्युत्पन्न (यह डेरिवेटिव के बिना टेलर श्रृंखला निर्धारित करने के लिए एक अलग जिम्नास्टिक था)। मैं इस परिभाषा पर लंबे समय तक हंसता रहा, जब तक कि मैं अंत में समझ नहीं पाया कि यह किस बारे में है। व्युत्पन्न केवल एक माप से ज्यादा कुछ नहीं है कि हम कितने फ़ंक्शन को अलग कर रहे हैं, फ़ंक्शन y=x, y=x^2, y=x^3 के समान है।

मुझे अब उन छात्रों को व्याख्यान देने का सम्मान मिला है जो डरअंक शास्त्र। यदि आप गणित से डरते हैं - हम रास्ते में हैं। जैसे ही आप कुछ पाठ पढ़ने की कोशिश करते हैं और आपको लगता है कि यह अत्यधिक जटिल है, तो जान लें कि यह बुरी तरह लिखा गया है। मेरा तर्क है कि गणित का एक भी क्षेत्र ऐसा नहीं है जिसे सटीकता खोए बिना "उंगलियों पर" के बारे में बात नहीं की जा सकती है।

निकट भविष्य के लिए चुनौती: मैंने अपने छात्रों को यह समझने का निर्देश दिया कि रैखिक-द्विघात नियंत्रक क्या है। शरमाओ मत, अपने जीवन के तीन मिनट बर्बाद करो, लिंक का पालन करें। अगर आपको कुछ समझ नहीं आ रहा है, तो हम रास्ते में हैं। मुझे (पेशेवर गणितज्ञ-प्रोग्रामर) भी कुछ समझ नहीं आया। और मैं आपको विश्वास दिलाता हूं, इसे "उंगलियों पर" सुलझाया जा सकता है। फिलहाल मैं नहीं जानता कि यह क्या है, लेकिन मैं आपको विश्वास दिलाता हूं कि हम इसका पता लगाने में सक्षम होंगे।

तो, पहला व्याख्यान जो मैं अपने छात्रों को देने जा रहा हूं, जब वे मेरे पास डरावने शब्दों के साथ दौड़ते हुए आते हैं कि एक रैखिक-द्विघात नियंत्रक एक भयानक बग है जिसे आप अपने जीवन में कभी भी मास्टर नहीं करेंगे तरीकों कम से कम वर्गों . क्या आप तय कर सकते हैं रेखीय समीकरण? यदि आप इस पाठ को पढ़ रहे हैं, तो शायद नहीं।

इसलिए, दो बिंदुओं (x0, y0), (x1, y1), उदाहरण के लिए, (1,1) और (3,2) दिए गए, इन दो बिंदुओं से गुजरने वाली एक सीधी रेखा के समीकरण को खोजने का कार्य है:

चित्रण

इस सीधी रेखा में निम्न जैसा समीकरण होना चाहिए:

यहाँ अल्फा और बीटा हमारे लिए अज्ञात हैं, लेकिन इस रेखा के दो बिंदु ज्ञात हैं:

आप इस समीकरण को मैट्रिक्स रूप में लिख सकते हैं:

यहाँ आपको करना चाहिए गीतात्मक विषयांतर: मैट्रिक्स क्या है? एक मैट्रिक्स एक द्वि-आयामी सरणी के अलावा और कुछ नहीं है। यह डेटा स्टोर करने का एक तरीका है, इसमें और कोई वैल्यू नहीं दी जानी चाहिए। यह हम पर निर्भर करता है कि किसी निश्चित मैट्रिक्स की व्याख्या कैसे की जाए। समय-समय पर, मैं इसे एक रैखिक मानचित्रण के रूप में, समय-समय पर द्विघात रूप के रूप में और कभी-कभी बस वैक्टर के एक सेट के रूप में व्याख्या करूंगा। यह सब संदर्भ में स्पष्ट किया जाएगा।

आइए विशिष्ट मैट्रिक्स को उनके प्रतीकात्मक प्रतिनिधित्व से बदलें:

तब (अल्फा, बीटा) आसानी से पाया जा सकता है:

अधिक विशेष रूप से हमारे पिछले डेटा के लिए:

जो बिंदुओं (1,1) और (3,2) से गुजरने वाली एक सीधी रेखा के निम्नलिखित समीकरण की ओर ले जाता है:

ठीक है, यहाँ सब कुछ स्पष्ट है। और आइए से गुजरने वाली एक सीधी रेखा का समीकरण ज्ञात करें तीनअंक: (x0,y0), (x1,y1) और (x2,y2):

ओह-ओह-ओह, लेकिन हमारे पास दो अज्ञात के लिए तीन समीकरण हैं! मानक गणितज्ञ कहेगा कि कोई हल नहीं है। प्रोग्रामर क्या कहेगा? और वह पहले समीकरणों की पिछली प्रणाली को निम्नलिखित रूप में फिर से लिखेंगे:

हमारे मामले में वैक्टर मैं, जे, बीत्रि-आयामी, इसलिए, (में सामान्य मामला) इस प्रणाली का कोई समाधान नहीं है। कोई भी सदिश (alpha\*i + beta\*j) सदिशों (i, j) द्वारा फैले हुए तल में होता है। यदि b इस तल से संबंधित नहीं है, तो कोई हल नहीं है (समीकरण में समानता प्राप्त नहीं की जा सकती)। क्या करें? आइए एक समझौता देखें। आइए द्वारा निरूपित करें ई (अल्फा, बीटा)हमने वास्तव में समानता कैसे हासिल नहीं की:

और हम इस त्रुटि को कम करने का प्रयास करेंगे:

एक वर्ग क्यों?

हम न केवल न्यूनतम मानदंड की तलाश कर रहे हैं, बल्कि मानदंड के न्यूनतम वर्ग की भी तलाश कर रहे हैं। क्यों? न्यूनतम बिंदु ही मेल खाता है, और वर्ग एक सुचारू कार्य देता है (तर्कों का एक द्विघात कार्य (अल्फा, बीटा)), जबकि केवल लंबाई एक शंकु के रूप में एक फ़ंक्शन देती है, जो न्यूनतम बिंदु पर गैर-भिन्न है। भाई स्क्वायर अधिक सुविधाजनक है।

जाहिर है, त्रुटि कम हो जाती है जब वेक्टर सदिशों द्वारा फैलाए गए समतल के लिए ओर्थोगोनल मैंतथा जे.

चित्रण

दूसरे शब्दों में: हम एक ऐसी रेखा की तलाश कर रहे हैं, जिसमें सभी बिंदुओं से इस रेखा तक की दूरी की चुकता लंबाई का योग न्यूनतम हो:

अद्यतन: यहां मेरे पास एक जंब है, रेखा की दूरी को लंबवत रूप से मापा जाना चाहिए, न कि ऑर्थोग्राफिक प्रोजेक्शन। यह टिप्पणीकार सही है।

चित्रण

पूरी तरह से अलग शब्दों में (ध्यान से, खराब औपचारिक रूप से, लेकिन यह उंगलियों पर स्पष्ट होना चाहिए): हम सभी जोड़ी बिंदुओं के बीच सभी संभावित रेखाएं लेते हैं और सभी के बीच औसत रेखा की तलाश करते हैं:

चित्रण

उंगलियों पर एक और स्पष्टीकरण: हम सभी डेटा बिंदुओं (यहां हमारे पास तीन हैं) और उस रेखा के बीच एक वसंत संलग्न करते हैं जिसे हम ढूंढ रहे हैं, और संतुलन स्थिति की रेखा ठीक वही है जिसे हम ढूंढ रहे हैं।

द्विघात रूप न्यूनतम

तो, वेक्टर दिया गया बीऔर मैट्रिक्स के कॉलम-वैक्टर द्वारा फैला हुआ विमान (इस मामले में (x0,x1,x2) और (1,1,1)), हम एक वेक्टर की तलाश कर रहे हैं न्यूनतम वर्ग लंबाई के साथ। जाहिर है, न्यूनतम केवल वेक्टर के लिए प्राप्त करने योग्य है , मैट्रिक्स के कॉलम-वैक्टर द्वारा फैले विमान के लिए ऑर्थोगोनल :

दूसरे शब्दों में, हम एक सदिश x=(alpha, beta) की तलाश कर रहे हैं जैसे कि:

मैं आपको याद दिलाता हूं कि यह वेक्टर x=(alpha, beta) न्यूनतम है द्विघात फंक्शन||ई(अल्फा, बीटा)||^2:

यहां यह याद रखना उपयोगी है कि मैट्रिक्स की व्याख्या द्विघात रूप के साथ-साथ की जा सकती है, उदाहरण के लिए, पहचान मैट्रिक्स ((1,0),(0,1)) को x^2 + y के एक फ़ंक्शन के रूप में व्याख्या किया जा सकता है ^2:

द्विघात रूप

यह सभी जिम्नास्टिक रैखिक प्रतिगमन के रूप में जाना जाता है।

डिरिचलेट सीमा शर्त के साथ लाप्लास समीकरण

अब सबसे सरल वास्तविक समस्या: एक निश्चित त्रिकोणीय सतह है, इसे चिकना करना आवश्यक है। उदाहरण के लिए, आइए मेरा चेहरा मॉडल लोड करें:

मूल प्रतिबद्धता उपलब्ध है। बाहरी निर्भरता को कम करने के लिए, मैंने अपने सॉफ़्टवेयर रेंडरर का कोड लिया, जो पहले से ही हैब्रे पर है। समाधान के लिए रैखिक प्रणालीमैं ओपनएनएल का उपयोग करता हूं, यह एक महान सॉल्वर है, लेकिन इसे स्थापित करना वास्तव में कठिन है: आपको अपने प्रोजेक्ट फ़ोल्डर में दो फाइलों (.h+.c) की प्रतिलिपि बनाने की आवश्यकता है। सभी चौरसाई निम्नलिखित कोड द्वारा किया जाता है:

के लिए (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; iऔर चेहरा = चेहरे [i]; के लिए (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y और Z निर्देशांक वियोज्य हैं, मैं उन्हें अलग से चिकना करता हूं। यही है, मैं रैखिक समीकरणों की तीन प्रणालियों को हल करता हूं, जिनमें से प्रत्येक में समान संख्या में चर होते हैं जैसे कि मेरे मॉडल में शिखर की संख्या। मैट्रिक्स ए की पहली एन पंक्तियों में प्रति पंक्ति केवल एक 1 है, और वेक्टर बी की पहली एन पंक्तियों में मूल मॉडल निर्देशांक हैं। यही है, मैं नई शीर्ष स्थिति और पुरानी शीर्ष स्थिति के बीच वसंत-टाई करता हूं - नए लोगों को पुराने से बहुत दूर नहीं होना चाहिए।

मैट्रिक्स ए की सभी बाद की पंक्तियों (faces.size()*3 = ग्रिड में सभी त्रिकोणों के किनारों की संख्या) में 1 की एक घटना और -1 की एक घटना होती है, जबकि वेक्टर बी में शून्य घटक विपरीत होते हैं। इसका मतलब है कि मैंने अपने त्रिकोणीय जाल के प्रत्येक किनारे पर एक वसंत लगाया: सभी किनारों को उनके शुरुआती और अंत बिंदुओं के समान शीर्ष प्राप्त करने का प्रयास किया गया।

एक बार फिर: सभी कोने चर हैं, और वे अपनी मूल स्थिति से दूर नहीं जा सकते हैं, लेकिन साथ ही वे एक दूसरे के समान बनने की कोशिश करते हैं।

यहाँ परिणाम है:

सब कुछ ठीक हो जाएगा, मॉडल वास्तव में चिकना है, लेकिन यह अपने मूल किनारे से दूर चला गया। आइए कोड को थोड़ा बदलें:

के लिए (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

हमारे मैट्रिक्स ए में, किनारे पर स्थित कोने के लिए, मैं श्रेणी से एक पंक्ति नहीं जोड़ता v_i = verts[i][d], लेकिन 1000*v_i = 1000*verts[i][d]। यह क्या बदलता है? और यह त्रुटि के हमारे द्विघात रूप को बदल देता है। अब किनारे पर ऊपर से एक भी विचलन पहले की तरह एक इकाई नहीं, बल्कि 1000 * 1000 इकाइयों का खर्च आएगा। यही है, हमने चरम शिखर पर एक मजबूत वसंत लटका दिया, समाधान दूसरों को और अधिक मजबूती से फैलाना पसंद करता है। यहाँ परिणाम है:

आइए शिखरों के बीच स्प्रिंग्स की ताकत को दोगुना करें:
एनएल गुणांक (चेहरा [जे], 2); एनएल गुणांक (चेहरा [(जे + 1)% 3], -2);

यह तर्कसंगत है कि सतह चिकनी हो गई है:

और अब सौ गुना मजबूत:

यह क्या है? कल्पना कीजिए कि हमने एक तार के छल्ले को साबुन के पानी में डुबोया है। नतीजतन, परिणामी साबुन फिल्म कम से कम वक्रता रखने की कोशिश करेगी, उसी सीमा को छूते हुए - हमारे तार की अंगूठी। ठीक यही हमें सीमा तय करने और अंदर एक चिकनी सतह की मांग करने से मिला है। बधाई हो, हमने हाल ही में डिरिचलेट सीमा शर्तों के साथ लाप्लास समीकरण को हल किया है। ठीक लगता है? लेकिन वास्तव में, हल करने के लिए रैखिक समीकरणों की सिर्फ एक प्रणाली।

पॉइसन समीकरण

चलिए एक और अच्छा नाम लेते हैं।

मान लें कि मेरे पास इस तरह की एक छवि है:

सब अच्छे हैं, लेकिन मुझे कुर्सी पसंद नहीं है।

मैंने चित्र को आधा में काट दिया:



और मैं अपने हाथों से एक कुर्सी चुनूंगा:

फिर मैं तस्वीर के बाईं ओर मुखौटा में सफेद सब कुछ खींचूंगा, और साथ ही मैं पूरी तस्वीर में कहूंगा कि दो पड़ोसी पिक्सल के बीच का अंतर दो पड़ोसी पिक्सल के बीच के अंतर के बराबर होना चाहिए सही छवि:

के लिए (int i=0; i

यहाँ परिणाम है:

कोड और चित्र उपलब्ध हैं

इसके कई अनुप्रयोग हैं, क्योंकि यह किसी दिए गए फ़ंक्शन के अन्य सरल लोगों द्वारा अनुमानित प्रतिनिधित्व की अनुमति देता है। एलएसएम अवलोकनों को संसाधित करने में बेहद उपयोगी हो सकता है, और यह सक्रिय रूप से यादृच्छिक त्रुटियों वाले अन्य लोगों के माप के परिणामों से कुछ मात्राओं का अनुमान लगाने के लिए सक्रिय रूप से उपयोग किया जाता है। इस लेख में, आप सीखेंगे कि एक्सेल में कम से कम वर्ग गणना कैसे लागू करें।

एक विशिष्ट उदाहरण पर समस्या का विवरण

मान लीजिए कि दो संकेतक एक्स और वाई हैं। इसके अलावा, वाई एक्स पर निर्भर करता है। चूंकि ओएलएस प्रतिगमन विश्लेषण के दृष्टिकोण से हमारे लिए रूचि रखता है (एक्सेल में, इसकी विधियों को अंतर्निहित कार्यों का उपयोग करके कार्यान्वित किया जाता है), हमें तुरंत आगे बढ़ना चाहिए एक विशिष्ट समस्या पर विचार करने के लिए।

तो, X को एक किराने की दुकान का विक्रय क्षेत्र होने दें, जिसे वर्ग मीटर में मापा जाता है, और Y वार्षिक कारोबार हो, जिसे लाखों रूबल में परिभाषित किया गया हो।

यह भविष्यवाणी करना आवश्यक है कि यदि एक या कोई अन्य खुदरा स्थान है तो स्टोर का टर्नओवर (Y) क्या होगा। जाहिर है, फ़ंक्शन Y = f (X) बढ़ रहा है, क्योंकि हाइपरमार्केट स्टाल से अधिक सामान बेचता है।

भविष्यवाणी के लिए उपयोग किए गए प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द

मान लें कि हमारे पास n स्टोर्स के लिए डेटा के साथ निर्मित एक टेबल है।

गणितीय आँकड़ों के अनुसार, कम से कम 5-6 वस्तुओं के डेटा की जांच करने पर परिणाम कमोबेश सही होंगे। साथ ही, "विसंगतिपूर्ण" परिणामों का उपयोग नहीं किया जा सकता है। विशेष रूप से, एक कुलीन छोटे बुटीक का टर्नओवर "मासमार्केट" वर्ग के बड़े आउटलेट्स के टर्नओवर से कई गुना अधिक हो सकता है।

विधि का सार

तालिका डेटा को कार्तीय तल पर बिंदु M 1 (x 1, y 1), ... M n (x n, y n) के रूप में प्रदर्शित किया जा सकता है। अब समस्या का समाधान एक सन्निकट फलन y = f (x) के चयन तक सीमित कर दिया जाएगा, जिसमें एक ग्राफ जितना संभव हो सके बिंदुओं M 1, M 2, .. M n के करीब से गुजर रहा हो।

बेशक, आप एक उच्च डिग्री बहुपद का उपयोग कर सकते हैं, लेकिन यह विकल्प न केवल लागू करना मुश्किल है, बल्कि बस गलत है, क्योंकि यह उस मुख्य प्रवृत्ति को प्रतिबिंबित नहीं करेगा जिसका पता लगाने की आवश्यकता है। सबसे उचित समाधान एक सीधी रेखा y = ax + b की खोज करना है, जो प्रयोगात्मक डेटा का सबसे अच्छा अनुमान लगाता है, और अधिक सटीक रूप से, गुणांक - a और b।

शुद्धता स्कोर

किसी भी सन्निकटन के लिए, उसकी सटीकता के आकलन का विशेष महत्व है। बिंदु x i के लिए कार्यात्मक और प्रायोगिक मूल्यों के बीच अंतर (विचलन) को e i द्वारा निरूपित करें, अर्थात e i = y i - f (x i)।

जाहिर है, सन्निकटन की सटीकता का आकलन करने के लिए, आप विचलन के योग का उपयोग कर सकते हैं, अर्थात, Y पर X की निर्भरता के अनुमानित प्रतिनिधित्व के लिए एक सीधी रेखा का चयन करते समय, उस व्यक्ति को वरीयता दी जानी चाहिए जिसका सबसे छोटा मान हो विचाराधीन सभी बिंदुओं पर योग ई। हालांकि, सब कुछ इतना सरल नहीं है, क्योंकि सकारात्मक विचलन के साथ, व्यावहारिक रूप से नकारात्मक भी होंगे।

आप विचलन मॉड्यूल या उनके वर्गों का उपयोग करके समस्या का समाधान कर सकते हैं। बाद की विधि सबसे व्यापक रूप से उपयोग की जाती है। इसका उपयोग कई क्षेत्रों में किया जाता है, जिसमें प्रतिगमन विश्लेषण शामिल है (एक्सेल में, इसका कार्यान्वयन दो अंतर्निहित कार्यों का उपयोग करके किया जाता है), और लंबे समय से प्रभावी साबित हुआ है।

कम से कम वर्ग विधि

एक्सेल में, जैसा कि आप जानते हैं, एक अंतर्निहित ऑटोसम फ़ंक्शन है जो आपको चयनित श्रेणी में स्थित सभी मूल्यों के मूल्यों की गणना करने की अनुमति देता है। इस प्रकार, हमें व्यंजक के मान की गणना करने से कोई नहीं रोकेगा (e 1 2 + e 2 2 + e 3 2 + ... e n 2)।

गणितीय संकेतन में, ऐसा दिखता है:

चूंकि निर्णय शुरू में एक सीधी रेखा का उपयोग करके अनुमानित करने के लिए किया गया था, हमारे पास है:

इस प्रकार, एक सीधी रेखा खोजने का कार्य जो एक्स और वाई के बीच एक विशिष्ट संबंध का सबसे अच्छा वर्णन करता है, दो चर के न्यूनतम फ़ंक्शन की गणना करने के बराबर है:

इसके लिए नए चर ए और बी के संबंध में शून्य आंशिक डेरिवेटिव के बराबर होना आवश्यक है, और एक आदिम प्रणाली को हल करना जिसमें दो अज्ञात फॉर्म के साथ दो समीकरण शामिल हैं:

सरल परिवर्तनों के बाद, जिसमें 2 से भाग देना और योगों में हेर-फेर करना शामिल है, हम प्राप्त करते हैं:

इसे हल करना, उदाहरण के लिए, क्रैमर की विधि द्वारा, हम कुछ गुणांक a * और b * के साथ एक स्थिर बिंदु प्राप्त करते हैं। यह न्यूनतम है, यानी यह अनुमान लगाने के लिए कि किसी निश्चित क्षेत्र के लिए स्टोर का टर्नओवर क्या होगा, सीधी रेखा y = a * x + b * उपयुक्त है, जो प्रश्न में उदाहरण के लिए एक प्रतिगमन मॉडल है। बेशक, यह आपको सटीक परिणाम खोजने की अनुमति नहीं देगा, लेकिन इससे आपको यह अंदाजा लगाने में मदद मिलेगी कि क्या किसी विशेष क्षेत्र के लिए क्रेडिट पर स्टोर खरीदने से भुगतान होगा।

एक्सेल में कम से कम वर्ग विधि को कैसे लागू करें

एक्सेल में कम से कम वर्गों के मूल्य की गणना के लिए एक फ़ंक्शन है। इसका निम्न रूप है: TREND (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिर)। आइए एक्सेल में ओएलएस की गणना के लिए हमारी तालिका में सूत्र लागू करें।

ऐसा करने के लिए, उस सेल में जिसमें एक्सेल में कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम प्रदर्शित किया जाना चाहिए, "=" चिह्न दर्ज करें और "ट्रेंड" फ़ंक्शन का चयन करें। खुलने वाली विंडो में, हाइलाइट करते हुए उपयुक्त फ़ील्ड भरें:

  • वाई के लिए ज्ञात मूल्यों की श्रेणी (इस मामले में कारोबार के लिए डेटा);
  • रेंज x 1 , …x n , यानी खुदरा स्थान का आकार;
  • और x के ज्ञात और अज्ञात मान, जिसके लिए आपको टर्नओवर के आकार का पता लगाना होगा (वर्कशीट पर उनके स्थान के बारे में जानकारी के लिए, नीचे देखें)।

इसके अलावा, सूत्र में एक तार्किक चर "कॉन्स्ट" है। यदि आप इसके अनुरूप क्षेत्र में 1 दर्ज करते हैं, तो इसका मतलब यह होगा कि गणना की जानी चाहिए, यह मानते हुए कि बी \u003d 0।

यदि आपको एक से अधिक x मान के लिए पूर्वानुमान जानने की आवश्यकता है, तो सूत्र दर्ज करने के बाद, आपको "एंटर" नहीं दबाना चाहिए, लेकिन आपको संयोजन "Shift" + "Control" + "Enter" ("Enter" टाइप करना होगा) ) कीबोर्ड पर।

कुछ सुविधाएं

प्रतिगमन विश्लेषण डमी के लिए भी सुलभ हो सकता है। अज्ञात चरों की एक सरणी के मूल्य की भविष्यवाणी करने के लिए एक्सेल फॉर्मूला - "ट्रेंड" - का उपयोग उन लोगों द्वारा भी किया जा सकता है जिन्होंने कम से कम वर्ग विधि के बारे में कभी नहीं सुना है। इसके काम की कुछ विशेषताओं को जानना ही काफी है। विशेष रूप से:

  • यदि आप चर y के ज्ञात मानों की श्रेणी को एक पंक्ति या स्तंभ में रखते हैं, तो x के ज्ञात मानों वाली प्रत्येक पंक्ति (स्तंभ) को प्रोग्राम द्वारा एक अलग चर के रूप में माना जाएगा।
  • यदि ज्ञात x के साथ श्रेणी TREND विंडो में निर्दिष्ट नहीं है, तो एक्सेल में फ़ंक्शन का उपयोग करने के मामले में, प्रोग्राम इसे पूर्णांकों से युक्त एक सरणी के रूप में मानेगा, जिसकी संख्या दिए गए मानों के साथ श्रेणी से मेल खाती है। चर y.
  • "अनुमानित" मानों की एक सरणी को आउटपुट करने के लिए, प्रवृत्ति अभिव्यक्ति को एक सरणी सूत्र के रूप में दर्ज किया जाना चाहिए।
  • यदि कोई नया x मान निर्दिष्ट नहीं है, तो TREND फ़ंक्शन उन्हें ज्ञात मान के बराबर मानता है। यदि वे निर्दिष्ट नहीं हैं, तो सरणी 1 को तर्क के रूप में लिया जाता है; 2; 3; 4;…, जो पहले से दिए गए पैरामीटर y के साथ सीमा के अनुरूप है।
  • नए x मानों वाली श्रेणी में दिए गए y मानों वाली श्रेणी के समान या अधिक पंक्तियाँ या स्तंभ होने चाहिए। दूसरे शब्दों में, यह स्वतंत्र चर के अनुपात में होना चाहिए।
  • ज्ञात x मानों वाली एक सरणी में कई चर हो सकते हैं। हालांकि, अगर हम केवल एक के बारे में बात कर रहे हैं, तो यह आवश्यक है कि x और y के दिए गए मानों वाली श्रेणियां अनुरूप हों। कई चरों के मामले में, यह आवश्यक है कि दिए गए y मानों वाली श्रेणी एक कॉलम या एक पंक्ति में फिट हो।

पूर्वानुमान समारोह

इसे कई कार्यों का उपयोग करके कार्यान्वित किया जाता है। उनमें से एक को "प्रेडिक्शन" कहा जाता है। यह ट्रेंड के समान है, यानी यह कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम देता है। हालाँकि, केवल एक X के लिए, जिसके लिए Y का मान अज्ञात है।

अब आप डमी के लिए एक्सेल फ़ार्मुलों को जानते हैं जो आपको एक रेखीय प्रवृत्ति के अनुसार एक संकेतक के भविष्य के मूल्य के मूल्य की भविष्यवाणी करने की अनुमति देते हैं।

कम से कम वर्ग विधि

न्यूनतम वर्ग विधि ( एमएनके, ओएलएस, साधारण कम से कम वर्ग) - नमूना डेटा से प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए प्रतिगमन विश्लेषण के बुनियादी तरीकों में से एक। विधि प्रतिगमन अवशेषों के वर्गों के योग को कम करने पर आधारित है।

यह ध्यान दिया जाना चाहिए कि कम से कम वर्ग विधि को किसी भी क्षेत्र में किसी समस्या को हल करने के लिए एक विधि कहा जा सकता है यदि समाधान अज्ञात चर के कुछ कार्यों के वर्गों के योग को कम करने के लिए एक निश्चित मानदंड को पूरा करता है या पूरा करता है। इसलिए, कम से कम वर्ग विधि का उपयोग अन्य (सरल) कार्यों द्वारा दिए गए फ़ंक्शन के अनुमानित प्रतिनिधित्व (सन्निकटन) के लिए भी किया जा सकता है, जब समीकरणों या प्रतिबंधों को संतुष्ट करने वाली मात्राओं का एक सेट ढूंढा जाता है, जिसकी संख्या इन मात्राओं की संख्या से अधिक होती है , आदि।

MNC . का सार

(व्याख्या) चर के बीच संभाव्यता (प्रतिगमन) निर्भरता के कुछ (पैरामीट्रिक) मॉडल दें आपऔर कई कारक (व्याख्यात्मक चर) एक्स

अज्ञात मॉडल पैरामीटर का वेक्टर कहां है

- रैंडम मॉडल त्रुटि।

बता दें कि संकेतित चरों के मूल्यों का नमूना अवलोकन भी होना चाहिए। आज्ञा देना प्रेक्षण संख्या () हो। फिर -वें अवलोकन में चरों के मान हैं। फिर, पैरामीटर b के दिए गए मानों के लिए, व्याख्या किए गए चर y के सैद्धांतिक (मॉडल) मानों की गणना करना संभव है:

अवशिष्टों का मान पैरामीटर b के मानों पर निर्भर करता है।

एलएसएम (साधारण, शास्त्रीय) का सार ऐसे पैरामीटर बी को ढूंढना है जिसके लिए अवशिष्ट के वर्गों का योग (इंग्लैंड। वर्गों का अवशिष्ट योग) न्यूनतम होगा:

सामान्य स्थिति में, इस समस्या को अनुकूलन (न्यूनतमीकरण) के संख्यात्मक तरीकों से हल किया जा सकता है। इस मामले में, कोई बोलता है अरेखीय कम से कम वर्ग(एनएलएस या एनएलएलएस - अंग्रेजी। गैर रेखीय कम से कम वर्ग) कई मामलों में, एक विश्लेषणात्मक समाधान प्राप्त किया जा सकता है। न्यूनीकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को अज्ञात पैरामीटर बी के संबंध में अंतर करके, डेरिवेटिव को शून्य के बराबर करना, और समीकरणों की परिणामी प्रणाली को हल करना आवश्यक है:

यदि मॉडल की यादृच्छिक त्रुटियों को सामान्य रूप से वितरित किया जाता है, समान भिन्नता होती है, और एक दूसरे के साथ सहसंबद्ध नहीं होते हैं, तो कम से कम वर्ग पैरामीटर अनुमान अधिकतम संभावना विधि (एमएलएम) अनुमानों के समान होते हैं।

रैखिक मॉडल के मामले में एलएसएम

प्रतिगमन निर्भरता को रैखिक होने दें:

होने देना आप- समझाया चर के अवलोकन के कॉलम वेक्टर, और - कारक अवलोकनों का मैट्रिक्स (मैट्रिक्स की पंक्तियां - किसी दिए गए अवलोकन में कारक मानों के वैक्टर, कॉलम द्वारा - सभी अवलोकनों में किसी दिए गए कारक के मूल्यों के वेक्टर)। रैखिक मॉडल के मैट्रिक्स प्रतिनिधित्व का रूप है:

फिर समझाया गया चर के अनुमानों का वेक्टर और प्रतिगमन अवशिष्ट के वेक्टर के बराबर होगा

तदनुसार, प्रतिगमन अवशेषों के वर्गों का योग बराबर होगा

पैरामीटर वेक्टर के संबंध में इस फ़ंक्शन को अलग करना और व्युत्पन्न को शून्य के बराबर करना, हम समीकरणों की एक प्रणाली प्राप्त करते हैं (मैट्रिक्स रूप में):

.

समीकरणों की इस प्रणाली का समाधान रैखिक मॉडल के लिए कम से कम वर्ग अनुमानों के लिए सामान्य सूत्र देता है:

विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का अंतिम प्रतिनिधित्व उपयोगी साबित होता है। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस निरूपण में पहले मैट्रिक्स में कारकों के नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा एक आश्रित चर वाले कारकों के सहप्रसरणों का वेक्टर है। यदि, इसके अतिरिक्त, डेटा भी है सामान्यीकृत SKO पर (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के नमूना सहसंबंध मैट्रिक्स का अर्थ है, दूसरा वेक्टर - आश्रित चर के साथ कारकों के नमूना सहसंबंधों का वेक्टर।

मॉडल के लिए एलएलएस अनुमानों की एक महत्वपूर्ण संपत्ति स्थिरांक के साथ- निर्मित प्रतिगमन की रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता पूरी होती है:

विशेष रूप से, चरम मामले में, जब एकमात्र प्रतिगामी स्थिर होता है, तो हम पाते हैं कि एकल पैरामीटर (स्थिर स्वयं) का ओएलएस अनुमान चर के औसत मूल्य के बराबर है। अर्थात्, बड़ी संख्याओं के नियमों से अपने अच्छे गुणों के लिए जाना जाने वाला अंकगणितीय माध्य भी एक न्यूनतम वर्ग अनुमान है - यह इससे वर्ग विचलन के न्यूनतम योग के मानदंड को पूरा करता है।

उदाहरण: सरल (जोड़ीवार) प्रतिगमन

स्टीम रूम के मामले में रेखीय प्रतिगमनगणना सूत्र सरल हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं):

ओएलएस अनुमानों के गुण

सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए, कम से कम वर्ग अनुमान रैखिक अनुमान हैं, जैसा कि उपरोक्त सूत्र से निम्नानुसार है। निष्पक्ष ओएलएस अनुमानों के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: कारकों पर सशर्त यादृच्छिक त्रुटि की गणितीय अपेक्षा शून्य के बराबर होनी चाहिए। यह शर्त संतुष्ट है, विशेष रूप से, यदि

  1. यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और
  2. कारक और यादृच्छिक त्रुटियां स्वतंत्र यादृच्छिक चर हैं।

दूसरी शर्त - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति संतुष्ट नहीं है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)। शास्त्रीय मामले में, एक यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से मतलब है कि बहिर्जात स्थिति संतुष्ट है। सामान्य मामले में, अनुमानों की स्थिरता के लिए, नमूना आकार में अनंत तक वृद्धि के साथ कुछ गैर-एकवचन मैट्रिक्स के मैट्रिक्स के अभिसरण के साथ-साथ बहिर्जात स्थिति को पूरा करने के लिए पर्याप्त है।

निरंतरता और निष्पक्षता के अलावा, (साधारण) कम से कम वर्ग अनुमान भी प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में सर्वश्रेष्ठ) होने के लिए, एक यादृच्छिक त्रुटि के अतिरिक्त गुणों को संतुष्ट किया जाना चाहिए:

इन मान्यताओं को यादृच्छिक त्रुटि वेक्टर के सहप्रसरण मैट्रिक्स के लिए तैयार किया जा सकता है

एक रैखिक मॉडल जो इन शर्तों को पूरा करता है, कहलाता है क्लासिक. शास्त्रीय रैखिक प्रतिगमन के लिए ओएलएस अनुमान सभी रैखिक निष्पक्ष अनुमानों के वर्ग में निष्पक्ष, सुसंगत और सबसे कुशल अनुमान हैं (अंग्रेजी साहित्य में, संक्षेप में कभी-कभी उपयोग किया जाता है नीला (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) सबसे अच्छा रैखिक निष्पक्ष अनुमान है; घरेलू साहित्य में, गॉस-मार्कोव प्रमेय को अधिक बार उद्धृत किया जाता है)। जैसा कि यह दिखाना आसान है, गुणांक अनुमान वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा:

सामान्यीकृत कम से कम वर्ग

कम से कम वर्गों की विधि व्यापक सामान्यीकरण की अनुमति देती है। अवशेषों के वर्गों के योग को कम करने के बजाय, कोई अवशिष्ट वेक्टर के कुछ सकारात्मक निश्चित द्विघात रूप को कम कर सकता है, जहां कुछ सममित सकारात्मक निश्चित वजन मैट्रिक्स है। साधारण कम से कम वर्ग इस दृष्टिकोण का एक विशेष मामला है, जब वजन मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि सममित मैट्रिक्स (या ऑपरेटरों) के सिद्धांत से जाना जाता है, ऐसे मैट्रिक्स के लिए एक अपघटन होता है। इसलिए, निर्दिष्ट कार्यात्मक को निम्नानुसार दर्शाया जा सकता है, अर्थात, इस कार्यात्मक को कुछ रूपांतरित "अवशिष्ट" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम कम से कम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस-विधियां (कम से कम वर्ग)।

यह साबित होता है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल के लिए (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है), सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित के अनुमान हैं। सामान्यीकृत ओएलएस (ओएमएनके, जीएलएस - सामान्यीकृत कम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहप्रसरण मैट्रिक्स के बराबर भार मैट्रिक्स के साथ LS-विधि: .

यह दिखाया जा सकता है कि रैखिक मॉडल के मापदंडों के जीएलएस-अनुमानों के सूत्र का रूप है

इन अनुमानों का सहप्रसरण मैट्रिक्स, क्रमशः, के बराबर होगा

वास्तव में, ओएलएस का सार मूल डेटा के एक निश्चित (रैखिक) परिवर्तन (पी) और रूपांतरित डेटा के लिए सामान्य न्यूनतम वर्गों के अनुप्रयोग में निहित है। इस परिवर्तन का उद्देश्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को संतुष्ट करती हैं।

भारित न्यूनतम वर्ग

एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (WLS - भारित कम से कम वर्ग) हैं। इस मामले में, मॉडल के अवशेषों के वर्गों के भारित योग को कम से कम किया जाता है, अर्थात, प्रत्येक अवलोकन को एक "वजन" प्राप्त होता है जो इस अवलोकन में यादृच्छिक त्रुटि के विचरण के व्युत्क्रमानुपाती होता है: । वास्तव में, डेटा को प्रेक्षणों को भारित करके (यादृच्छिक त्रुटियों के कल्पित मानक विचलन के अनुपात में विभाजित करके) रूपांतरित किया जाता है, और भारित डेटा पर सामान्य न्यूनतम वर्ग लागू होते हैं।

व्यवहार में एलएसएम के प्रयोग के कुछ विशेष मामले

रैखिक सन्निकटन

उस मामले पर विचार करें, जब एक निश्चित अदिश मात्रा पर एक निश्चित अदिश मात्रा की निर्भरता का अध्ययन करने के परिणामस्वरूप (यह हो सकता है, उदाहरण के लिए, वर्तमान ताकत पर वोल्टेज की निर्भरता: , जहां एक स्थिर मूल्य है, कंडक्टर का प्रतिरोध ), इन मात्राओं को मापा गया, जिसके परिणामस्वरूप मान और उनके संबंधित मान प्राप्त किए गए। माप डेटा एक तालिका में दर्ज किया जाना चाहिए।

मेज। माप परिणाम।

मापन संख्या
1
2
3
4
5
6

सवाल इस तरह लगता है: निर्भरता का सबसे अच्छा वर्णन करने के लिए गुणांक का कौन सा मूल्य चुना जा सकता है? कम से कम वर्गों के अनुसार, यह मान ऐसा होना चाहिए कि मानों के चुकता विचलन का योग मानों से

न्यूनतम था

वर्ग विचलन के योग में एक चरम सीमा होती है - न्यूनतम, जो हमें इस सूत्र का उपयोग करने की अनुमति देती है। आइए इस सूत्र से गुणांक का मान ज्ञात करें। ऐसा करने के लिए, हम इसके बाईं ओर को इस प्रकार बदलते हैं:

अंतिम सूत्र हमें गुणांक का मान ज्ञात करने की अनुमति देता है, जो समस्या में आवश्यक था।

कहानी

XIX सदी की शुरुआत तक। वैज्ञानिकों के पास समीकरणों की एक प्रणाली को हल करने के लिए कुछ नियम नहीं थे जिसमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, समीकरणों के प्रकार और कैलकुलेटर की सरलता के आधार पर, विशेष विधियों का उपयोग किया जाता था, और इसलिए एक ही अवलोकन डेटा से शुरू होने वाले विभिन्न कैलकुलेटर अलग-अलग निष्कर्ष पर आते थे। गॉस (1795) को विधि के पहले आवेदन का श्रेय दिया जाता है, और लीजेंड्रे (1805) ने स्वतंत्र रूप से इसे अपने आधुनिक नाम (fr। मेथोड डेस मोइंड्रेस क्वारेस ) . लैपलेस ने विधि को संभाव्यता के सिद्धांत से जोड़ा, और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके संभाव्य अनुप्रयोगों पर विचार किया। Encke, Bessel, Hansen और अन्य द्वारा आगे के शोध द्वारा विधि व्यापक और बेहतर है।

बहुराष्ट्रीय कंपनियों का वैकल्पिक उपयोग

कम से कम वर्ग विधि के विचार का उपयोग अन्य मामलों में भी किया जा सकता है जो सीधे प्रतिगमन विश्लेषण से संबंधित नहीं हैं। तथ्य यह है कि वर्गों का योग वैक्टर के लिए सबसे आम निकटता उपायों में से एक है (परिमित-आयामी रिक्त स्थान में यूक्लिडियन मीट्रिक)।

एक अनुप्रयोग रैखिक समीकरणों की "समाधान" प्रणाली है जिसमें समीकरणों की संख्या चर की संख्या से अधिक होती है

जहां मैट्रिक्स वर्गाकार नहीं, बल्कि आयताकार है।

समीकरणों की ऐसी प्रणाली, सामान्य स्थिति में, कोई हल नहीं है (यदि रैंक वास्तव में चर की संख्या से अधिक है)। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है ताकि वैक्टर और के बीच "दूरी" को कम किया जा सके। ऐसा करने के लिए, आप सिस्टम के समीकरणों के बाएँ और दाएँ भागों के वर्ग अंतरों के योग को न्यूनतम करने के लिए मानदंड लागू कर सकते हैं, अर्थात्। यह दिखाना आसान है कि इस न्यूनीकरण समस्या का समाधान समीकरणों की निम्नलिखित प्रणाली के समाधान की ओर ले जाता है

  • प्रोग्रामिंग
    • ट्यूटोरियल

    परिचय

    मैं एक कंप्यूटर प्रोग्रामर हूं. मैंने अपने करियर में सबसे बड़ी छलांग लगाई जब मैंने यह कहना सीखा: "मुझे कुछ भी समझ में नहीं आता!"अब मुझे विज्ञान के प्रकाशक को यह बताने में कोई शर्म नहीं है कि वह मुझे व्याख्यान दे रहा है, कि मुझे समझ में नहीं आता कि यह, प्रकाशमान, मुझसे क्या बात कर रहा है। और यह बहुत मुश्किल है। हां, यह स्वीकार करना कठिन और शर्मनाक है कि आप नहीं जानते। कौन यह स्वीकार करना पसंद करता है कि वह किसी चीज की मूल बातें नहीं जानता है। अपने पेशे के कारण, मुझे बड़ी संख्या में प्रस्तुतियों और व्याख्यानों में भाग लेना पड़ता है, जहां मैं स्वीकार करता हूं, अधिकांश मामलों में मुझे नींद आती है, क्योंकि मुझे कुछ भी समझ में नहीं आता है। और मुझे समझ में नहीं आता क्योंकि विज्ञान की वर्तमान स्थिति की बड़ी समस्या गणित में है। यह मानता है कि सभी छात्र गणित के सभी क्षेत्रों से परिचित हैं (जो कि बेतुका है)। यह स्वीकार करने के लिए कि आप नहीं जानते कि व्युत्पन्न क्या है (कि यह थोड़ी देर बाद है) शर्म की बात है।

    लेकिन मैंने यह कहना सीख लिया है कि मैं नहीं जानता कि गुणन क्या है। हाँ, मैं नहीं जानता कि लाई बीजगणित के ऊपर उप-बीजगणित क्या है। हाँ, मुझे नहीं पता कि जीवन में द्विघात समीकरणों की आवश्यकता क्यों है। वैसे, यदि आप सुनिश्चित हैं कि आप जानते हैं, तो हमारे पास बात करने के लिए कुछ है! गणित चालों की एक श्रृंखला है। गणितज्ञ जनता को भ्रमित करने और डराने की कोशिश करते हैं; जहां कोई भ्रम नहीं, कोई प्रतिष्ठा नहीं, कोई अधिकार नहीं। हां, सबसे अमूर्त भाषा में बोलना प्रतिष्ठित है, जो अपने आप में पूरी तरह बकवास है।

    क्या आप जानते हैं कि व्युत्पन्न क्या है? सबसे अधिक संभावना है कि आप मुझे अंतर संबंध की सीमा के बारे में बताएंगे। सेंट पीटर्सबर्ग स्टेट यूनिवर्सिटी में गणित के पहले वर्ष में, विक्टर पेट्रोविच खविन मे परिभाषितबिंदु पर फ़ंक्शन के टेलर श्रृंखला के पहले पद के गुणांक के रूप में व्युत्पन्न (यह डेरिवेटिव के बिना टेलर श्रृंखला निर्धारित करने के लिए एक अलग जिम्नास्टिक था)। मैं इस परिभाषा पर लंबे समय तक हंसता रहा, जब तक कि मैं अंत में समझ नहीं पाया कि यह किस बारे में है। व्युत्पन्न केवल एक माप से ज्यादा कुछ नहीं है कि हम कितने फ़ंक्शन को अलग कर रहे हैं, फ़ंक्शन y=x, y=x^2, y=x^3 के समान है।

    मुझे अब उन छात्रों को व्याख्यान देने का सम्मान मिला है जो डरअंक शास्त्र। यदि आप गणित से डरते हैं - हम रास्ते में हैं। जैसे ही आप कुछ पाठ पढ़ने की कोशिश करते हैं और आपको लगता है कि यह अत्यधिक जटिल है, तो जान लें कि यह बुरी तरह लिखा गया है। मेरा तर्क है कि गणित का एक भी क्षेत्र ऐसा नहीं है जिसे सटीकता खोए बिना "उंगलियों पर" के बारे में बात नहीं की जा सकती है।

    निकट भविष्य के लिए चुनौती: मैंने अपने छात्रों को यह समझने का निर्देश दिया कि रैखिक-द्विघात नियंत्रक क्या है। शरमाओ मत, अपने जीवन के तीन मिनट बर्बाद करो, लिंक का पालन करें। अगर आपको कुछ समझ नहीं आ रहा है, तो हम रास्ते में हैं। मुझे (पेशेवर गणितज्ञ-प्रोग्रामर) भी कुछ समझ नहीं आया। और मैं आपको विश्वास दिलाता हूं, इसे "उंगलियों पर" सुलझाया जा सकता है। फिलहाल मैं नहीं जानता कि यह क्या है, लेकिन मैं आपको विश्वास दिलाता हूं कि हम इसका पता लगाने में सक्षम होंगे।

    तो, पहला व्याख्यान जो मैं अपने छात्रों को देने जा रहा हूं, जब वे मेरे पास डरावने शब्दों के साथ दौड़ते हुए आते हैं कि एक रैखिक-द्विघात नियंत्रक एक भयानक बग है जिसे आप अपने जीवन में कभी भी मास्टर नहीं करेंगे कम से कम वर्ग विधियां. क्या आप रैखिक समीकरणों को हल कर सकते हैं? यदि आप इस पाठ को पढ़ रहे हैं, तो शायद नहीं।

    इसलिए, दो बिंदुओं (x0, y0), (x1, y1), उदाहरण के लिए, (1,1) और (3,2) दिए गए, इन दो बिंदुओं से गुजरने वाली एक सीधी रेखा के समीकरण को खोजने का कार्य है:

    चित्रण

    इस सीधी रेखा में निम्न जैसा समीकरण होना चाहिए:

    यहाँ अल्फा और बीटा हमारे लिए अज्ञात हैं, लेकिन इस रेखा के दो बिंदु ज्ञात हैं:

    आप इस समीकरण को मैट्रिक्स रूप में लिख सकते हैं:

    यहां हमें एक गेय विषयांतर करना चाहिए: मैट्रिक्स क्या है? एक मैट्रिक्स एक द्वि-आयामी सरणी के अलावा और कुछ नहीं है। यह डेटा स्टोर करने का एक तरीका है, इसमें और कोई वैल्यू नहीं दी जानी चाहिए। यह हम पर निर्भर करता है कि किसी निश्चित मैट्रिक्स की व्याख्या कैसे की जाए। समय-समय पर, मैं इसे एक रैखिक मानचित्रण के रूप में, समय-समय पर द्विघात रूप के रूप में और कभी-कभी बस वैक्टर के एक सेट के रूप में व्याख्या करूंगा। यह सब संदर्भ में स्पष्ट किया जाएगा।

    आइए विशिष्ट मैट्रिक्स को उनके प्रतीकात्मक प्रतिनिधित्व से बदलें:

    तब (अल्फा, बीटा) आसानी से पाया जा सकता है:

    अधिक विशेष रूप से हमारे पिछले डेटा के लिए:

    जो बिंदुओं (1,1) और (3,2) से गुजरने वाली एक सीधी रेखा के निम्नलिखित समीकरण की ओर ले जाता है:

    ठीक है, यहाँ सब कुछ स्पष्ट है। और आइए से गुजरने वाली एक सीधी रेखा का समीकरण ज्ञात करें तीनअंक: (x0,y0), (x1,y1) और (x2,y2):

    ओह-ओह-ओह, लेकिन हमारे पास दो अज्ञात के लिए तीन समीकरण हैं! मानक गणितज्ञ कहेगा कि कोई हल नहीं है। प्रोग्रामर क्या कहेगा? और वह पहले समीकरणों की पिछली प्रणाली को निम्नलिखित रूप में फिर से लिखेंगे:

    हमारे मामले में, सदिश i, j, b त्रि-आयामी हैं, इसलिए, (सामान्य स्थिति में) इस प्रणाली का कोई हल नहीं है। कोई भी सदिश (alpha\*i + beta\*j) सदिशों (i, j) द्वारा फैले हुए तल में होता है। यदि b इस तल से संबंधित नहीं है, तो कोई हल नहीं है (समीकरण में समानता प्राप्त नहीं की जा सकती)। क्या करें? आइए एक समझौता देखें। आइए द्वारा निरूपित करें ई (अल्फा, बीटा)हमने वास्तव में समानता कैसे हासिल नहीं की:

    और हम इस त्रुटि को कम करने का प्रयास करेंगे:

    एक वर्ग क्यों?

    हम न केवल न्यूनतम मानदंड की तलाश कर रहे हैं, बल्कि मानदंड के न्यूनतम वर्ग की भी तलाश कर रहे हैं। क्यों? न्यूनतम बिंदु ही मेल खाता है, और वर्ग एक सुचारू कार्य देता है (तर्कों का एक द्विघात कार्य (अल्फा, बीटा)), जबकि केवल लंबाई एक शंकु के रूप में एक फ़ंक्शन देती है, जो न्यूनतम बिंदु पर गैर-भिन्न है। भाई स्क्वायर अधिक सुविधाजनक है।

    जाहिर है, त्रुटि कम हो जाती है जब वेक्टर सदिशों द्वारा फैलाए गए समतल के लिए ओर्थोगोनल मैंतथा जे.

    चित्रण

    दूसरे शब्दों में: हम एक ऐसी रेखा की तलाश कर रहे हैं, जिसमें सभी बिंदुओं से इस रेखा तक की दूरी की चुकता लंबाई का योग न्यूनतम हो:

    अद्यतन: यहां मेरे पास एक जंब है, रेखा की दूरी को लंबवत रूप से मापा जाना चाहिए, न कि ऑर्थोग्राफिक प्रोजेक्शन। टिप्पणीकार सही है।

    चित्रण

    पूरी तरह से अलग शब्दों में (ध्यान से, खराब औपचारिक रूप से, लेकिन यह उंगलियों पर स्पष्ट होना चाहिए): हम सभी जोड़ी बिंदुओं के बीच सभी संभावित रेखाएं लेते हैं और सभी के बीच औसत रेखा की तलाश करते हैं:

    चित्रण

    उंगलियों पर एक और स्पष्टीकरण: हम सभी डेटा बिंदुओं (यहां हमारे पास तीन हैं) और उस रेखा के बीच एक वसंत संलग्न करते हैं जिसे हम ढूंढ रहे हैं, और संतुलन स्थिति की रेखा ठीक वही है जिसे हम ढूंढ रहे हैं।

    द्विघात रूप न्यूनतम

    तो, वेक्टर दिया गया बीऔर मैट्रिक्स के कॉलम-वैक्टर द्वारा फैला हुआ विमान (इस मामले में (x0,x1,x2) और (1,1,1)), हम एक वेक्टर की तलाश कर रहे हैं न्यूनतम वर्ग लंबाई के साथ। जाहिर है, न्यूनतम केवल वेक्टर के लिए प्राप्त करने योग्य है , मैट्रिक्स के कॉलम-वैक्टर द्वारा फैले विमान के लिए ऑर्थोगोनल :

    दूसरे शब्दों में, हम एक सदिश x=(alpha, beta) की तलाश कर रहे हैं जैसे कि:

    मैं आपको याद दिलाता हूं कि यह वेक्टर x=(alpha, beta) द्विघात फलन का न्यूनतम है ||e(alpha, beta)||^2:

    यहां यह याद रखना उपयोगी है कि मैट्रिक्स की व्याख्या द्विघात रूप के साथ-साथ की जा सकती है, उदाहरण के लिए, पहचान मैट्रिक्स ((1,0),(0,1)) को x^2 + y के एक फ़ंक्शन के रूप में व्याख्या किया जा सकता है ^2:

    द्विघात रूप

    यह सभी जिम्नास्टिक रैखिक प्रतिगमन के रूप में जाना जाता है।

    डिरिचलेट सीमा शर्त के साथ लाप्लास समीकरण

    अब सबसे सरल वास्तविक समस्या: एक निश्चित त्रिकोणीय सतह है, इसे चिकना करना आवश्यक है। उदाहरण के लिए, आइए मेरा चेहरा मॉडल लोड करें:

    मूल प्रतिबद्धता उपलब्ध है। बाहरी निर्भरता को कम करने के लिए, मैंने अपने सॉफ़्टवेयर रेंडरर का कोड लिया, जो पहले से ही हैब्रे पर है। रैखिक प्रणाली को हल करने के लिए, मैं ओपनएनएल का उपयोग करता हूं, यह एक महान सॉल्वर है, लेकिन इसे स्थापित करना बहुत मुश्किल है: आपको अपने प्रोजेक्ट फ़ोल्डर में दो फाइलों (.h + .c) की प्रतिलिपि बनाने की आवश्यकता है। सभी चौरसाई निम्नलिखित कोड द्वारा किया जाता है:

    के लिए (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; iऔर चेहरा = चेहरे [i]; के लिए (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

    X, Y और Z निर्देशांक वियोज्य हैं, मैं उन्हें अलग से चिकना करता हूं। यही है, मैं रैखिक समीकरणों की तीन प्रणालियों को हल करता हूं, जिनमें से प्रत्येक में समान संख्या में चर होते हैं जैसे कि मेरे मॉडल में शिखर की संख्या। मैट्रिक्स ए की पहली एन पंक्तियों में प्रति पंक्ति केवल एक 1 है, और वेक्टर बी की पहली एन पंक्तियों में मूल मॉडल निर्देशांक हैं। यही है, मैं नई शीर्ष स्थिति और पुरानी शीर्ष स्थिति के बीच वसंत-टाई करता हूं - नए लोगों को पुराने से बहुत दूर नहीं होना चाहिए।

    मैट्रिक्स ए की सभी बाद की पंक्तियों (faces.size()*3 = ग्रिड में सभी त्रिकोणों के किनारों की संख्या) में 1 की एक घटना और -1 की एक घटना होती है, जबकि वेक्टर बी में शून्य घटक विपरीत होते हैं। इसका मतलब है कि मैंने अपने त्रिकोणीय जाल के प्रत्येक किनारे पर एक वसंत लगाया: सभी किनारों को उनके शुरुआती और अंत बिंदुओं के समान शीर्ष प्राप्त करने का प्रयास किया गया।

    एक बार फिर: सभी कोने चर हैं, और वे अपनी मूल स्थिति से दूर नहीं जा सकते हैं, लेकिन साथ ही वे एक दूसरे के समान बनने की कोशिश करते हैं।

    यहाँ परिणाम है:

    सब कुछ ठीक हो जाएगा, मॉडल वास्तव में चिकना है, लेकिन यह अपने मूल किनारे से दूर चला गया। आइए कोड को थोड़ा बदलें:

    के लिए (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

    हमारे मैट्रिक्स ए में, किनारे पर स्थित कोने के लिए, मैं श्रेणी से एक पंक्ति नहीं जोड़ता v_i = verts[i][d], लेकिन 1000*v_i = 1000*verts[i][d]। यह क्या बदलता है? और यह त्रुटि के हमारे द्विघात रूप को बदल देता है। अब किनारे पर ऊपर से एक भी विचलन पहले की तरह एक इकाई नहीं, बल्कि 1000 * 1000 इकाइयों का खर्च आएगा। यही है, हमने चरम शिखर पर एक मजबूत वसंत लटका दिया, समाधान दूसरों को और अधिक मजबूती से फैलाना पसंद करता है। यहाँ परिणाम है:

    आइए शिखरों के बीच स्प्रिंग्स की ताकत को दोगुना करें:
    एनएल गुणांक (चेहरा [जे], 2); एनएल गुणांक (चेहरा [(जे + 1)% 3], -2);

    यह तर्कसंगत है कि सतह चिकनी हो गई है:

    और अब सौ गुना मजबूत:

    यह क्या है? कल्पना कीजिए कि हमने एक तार के छल्ले को साबुन के पानी में डुबोया है। नतीजतन, परिणामी साबुन फिल्म कम से कम वक्रता रखने की कोशिश करेगी, उसी सीमा को छूते हुए - हमारे तार की अंगूठी। ठीक यही हमें सीमा तय करने और अंदर एक चिकनी सतह की मांग करने से मिला है। बधाई हो, हमने हाल ही में डिरिचलेट सीमा शर्तों के साथ लाप्लास समीकरण को हल किया है। ठीक लगता है? लेकिन वास्तव में, हल करने के लिए रैखिक समीकरणों की सिर्फ एक प्रणाली।

    पॉइसन समीकरण

    चलिए एक और अच्छा नाम लेते हैं।

    मान लें कि मेरे पास इस तरह की एक छवि है:

    सब अच्छे हैं, लेकिन मुझे कुर्सी पसंद नहीं है।

    मैंने चित्र को आधा में काट दिया:



    और मैं अपने हाथों से एक कुर्सी चुनूंगा:

    फिर मैं तस्वीर के बाईं ओर मुखौटा में सफेद सब कुछ खींचूंगा, और साथ ही मैं पूरी तस्वीर में कहूंगा कि दो पड़ोसी पिक्सल के बीच का अंतर दो पड़ोसी पिक्सल के बीच के अंतर के बराबर होना चाहिए सही छवि:

    के लिए (int i=0; i

    यहाँ परिणाम है:

    कोड और चित्र उपलब्ध हैं

    जो विज्ञान और अभ्यास के विभिन्न क्षेत्रों में व्यापक आवेदन पाता है। यह भौतिकी, रसायन विज्ञान, जीव विज्ञान, अर्थशास्त्र, समाजशास्त्र, मनोविज्ञान आदि हो सकता है। भाग्य की इच्छा से, मुझे अक्सर अर्थव्यवस्था से निपटना पड़ता है, और इसलिए आज मैं आपके लिए एक अद्भुत देश के टिकट की व्यवस्था करूंगा जिसे कहा जाता है अर्थमिति=) ... आप ऐसा कैसे नहीं चाहते?! यह वहां बहुत अच्छा है - आपको बस फैसला करना है! ...लेकिन आप जो निश्चित रूप से चाहते हैं वह यह है कि समस्याओं को हल करना सीखना है कम से कम वर्गों. और विशेष रूप से मेहनती पाठक उन्हें न केवल सटीक रूप से हल करना सीखेंगे, बल्कि बहुत तेज़ ;-) लेकिन पहले समस्या का सामान्य विवरण+ संबंधित उदाहरण:

    कुछ विषय क्षेत्र में संकेतकों का अध्ययन करने दें जिनकी मात्रात्मक अभिव्यक्ति है। साथ ही, यह मानने का हर कारण है कि संकेतक संकेतक पर निर्भर करता है। यह धारणा वैज्ञानिक परिकल्पना और प्राथमिक सामान्य ज्ञान दोनों पर आधारित हो सकती है। आइए विज्ञान को एक तरफ छोड़ दें, और अधिक स्वादिष्ट क्षेत्रों का पता लगाएं - अर्थात्, किराना स्टोर। द्वारा निरूपित करें:

    - किराने की दुकान का खुदरा स्थान, वर्गमीटर,
    - किराने की दुकान का वार्षिक कारोबार, मिलियन रूबल।

    यह बिल्कुल स्पष्ट है कि स्टोर का क्षेत्रफल जितना बड़ा होगा, ज्यादातर मामलों में उसका कारोबार उतना ही अधिक होगा।

    मान लीजिए कि एक डफ के साथ अवलोकन / प्रयोग / गणना / नृत्य करने के बाद, हमारे पास हमारे निपटान में संख्यात्मक डेटा है:

    किराने की दुकानों के साथ, मुझे लगता है कि सब कुछ स्पष्ट है: - यह पहली दुकान का क्षेत्र है, - इसका वार्षिक कारोबार, - दूसरे स्टोर का क्षेत्र, - इसका वार्षिक कारोबार, आदि। वैसे, वर्गीकृत सामग्रियों तक पहुंच होना बिल्कुल भी आवश्यक नहीं है - इसका उपयोग करके टर्नओवर का काफी सटीक मूल्यांकन प्राप्त किया जा सकता है गणितीय सांख्यिकी. हालांकि, विचलित न हों, वाणिज्यिक जासूसी का कोर्स पहले ही भुगतान किया जा चुका है =)

    सारणीबद्ध डेटा को बिंदुओं के रूप में भी लिखा जा सकता है और हमारे लिए सामान्य तरीके से दर्शाया जा सकता है। कार्तीय प्रणाली .

    आइए एक महत्वपूर्ण प्रश्न का उत्तर दें: गुणात्मक अध्ययन के लिए कितने अंक चाहिए?

    जितना बड़ा उतना अच्छा। न्यूनतम स्वीकार्य सेट में 5-6 अंक होते हैं। इसके अलावा, डेटा की एक छोटी मात्रा के साथ, "असामान्य" परिणामों को नमूने में शामिल नहीं किया जाना चाहिए। इसलिए, उदाहरण के लिए, एक छोटा संभ्रांत स्टोर "उनके सहयोगियों" से अधिक परिमाण के आदेशों में मदद कर सकता है, जिससे सामान्य पैटर्न को विकृत करने की आवश्यकता होती है!

    यदि यह काफी सरल है, तो हमें एक फ़ंक्शन चुनना होगा, अनुसूचीजो जितना संभव हो उतना करीब से गुजरता है . इस तरह के एक समारोह कहा जाता है अनुमान करने वाले (सन्निकटन - सन्निकटन)या सैद्धांतिक कार्य . सामान्यतया, यहाँ तुरंत एक स्पष्ट "दिखावा" दिखाई देता है - उच्च डिग्री का एक बहुपद, जिसका ग्राफ सभी बिंदुओं से होकर गुजरता है। लेकिन यह विकल्प जटिल है, और अक्सर बस गलत है। (क्योंकि चार्ट हर समय "हवा" करेगा और मुख्य प्रवृत्ति को खराब रूप से प्रतिबिंबित करेगा).

    इस प्रकार, वांछित कार्य पर्याप्त रूप से सरल होना चाहिए और साथ ही साथ निर्भरता को पर्याप्त रूप से प्रतिबिंबित करना चाहिए। जैसा कि आप अनुमान लगा सकते हैं, ऐसे कार्यों को खोजने के तरीकों में से एक को कहा जाता है कम से कम वर्गों. सबसे पहले, आइए इसके सार का सामान्य तरीके से विश्लेषण करें। कुछ फ़ंक्शन को प्रायोगिक डेटा का अनुमान लगाने दें:


    इस सन्निकटन की सटीकता का मूल्यांकन कैसे करें? आइए हम प्रयोगात्मक और कार्यात्मक मूल्यों के बीच अंतर (विचलन) की गणना भी करें (हम ड्राइंग का अध्ययन करते हैं). पहला विचार जो दिमाग में आता है वह यह अनुमान लगाना है कि राशि कितनी बड़ी है, लेकिन समस्या यह है कि मतभेद नकारात्मक हो सकते हैं। (उदाहरण के लिए, ) और इस तरह के योग के परिणामस्वरूप विचलन एक दूसरे को रद्द कर देंगे। इसलिए, सन्निकटन की सटीकता के अनुमान के रूप में, यह खुद को योग लेने का सुझाव देता है मॉड्यूलविचलन:

    या मुड़े हुए रूप में: (अचानक, कौन नहीं जानता: योग आइकन है, और एक सहायक चर है- "काउंटर", जो 1 से मान लेता है).

    विभिन्न कार्यों के साथ प्रयोगात्मक बिंदुओं को अनुमानित करके, हम अलग-अलग मान प्राप्त करेंगे, और यह स्पष्ट है कि जहां यह योग छोटा है, वह कार्य अधिक सटीक है।

    ऐसी एक विधि मौजूद है और कहा जाता है कम से कम मापांक विधि. हालाँकि, व्यवहार में यह बहुत अधिक व्यापक हो गया है। कम से कम वर्ग विधि, जिसमें संभावित नकारात्मक मूल्यों को मापांक द्वारा समाप्त नहीं किया जाता है, लेकिन विचलन को चुकता करके:

    , जिसके बाद प्रयासों को ऐसे फ़ंक्शन के चयन के लिए निर्देशित किया जाता है कि वर्ग विचलन का योग जितना संभव हो उतना छोटा था। दरअसल, इसलिए विधि का नाम।

    और अब हम एक और महत्वपूर्ण बिंदु पर लौटते हैं: जैसा कि ऊपर उल्लेख किया गया है, चयनित फ़ंक्शन काफी सरल होना चाहिए - लेकिन ऐसे कई कार्य भी हैं: रैखिक , अतिपरवलिक, घातीय, लघुगणक, द्विघात आदि। और, ज़ाहिर है, यहाँ मैं तुरंत "गतिविधि के क्षेत्र को कम करना" चाहूंगा। अनुसंधान के लिए किस वर्ग के कार्यों का चयन करना है? आदिम लेकिन प्रभावी तकनीक:

    - अंक आकर्षित करने का सबसे आसान तरीका ड्राइंग पर और उनके स्थान का विश्लेषण करें। यदि वे एक सीधी रेखा में होते हैं, तो आपको देखना चाहिए सीधी रेखा समीकरण इष्टतम मूल्यों के साथ और . दूसरे शब्दों में, कार्य ऐसे गुणांकों को खोजना है - ताकि वर्ग विचलनों का योग सबसे छोटा हो।

    यदि बिंदु स्थित हैं, उदाहरण के लिए, साथ में अतिशयोक्ति, तो यह स्पष्ट है कि रैखिक फलन खराब सन्निकटन देगा। इस मामले में, हम हाइपरबोला समीकरण के लिए सबसे "अनुकूल" गुणांक की तलाश कर रहे हैं - वे जो वर्गों का न्यूनतम योग देते हैं .

    अब ध्यान दें कि दोनों ही मामलों में हम बात कर रहे हैं दो चर के कार्य, जिनके तर्क हैं खोज निर्भरता विकल्प:

    और संक्षेप में, हमें एक मानक समस्या को हल करने की आवश्यकता है - खोजने के लिए दो चर के एक समारोह का न्यूनतम.

    हमारे उदाहरण को याद करें: मान लीजिए कि "दुकान" बिंदु एक सीधी रेखा में स्थित हैं और उपस्थिति पर विश्वास करने का हर कारण है रैखिक निर्भरताव्यापार क्षेत्र से कारोबार। आइए ऐसे गुणांक "ए" और "बी" खोजें ताकि वर्ग विचलन का योग हो सबसे छोटा था। सब कुछ हमेशा की तरह - पहले 1 क्रम के आंशिक व्युत्पन्न. के अनुसार रैखिकता नियमआप योग आइकन के ठीक नीचे अंतर कर सकते हैं:

    यदि आप इस जानकारी का उपयोग निबंध या शोध कार्य के लिए करना चाहते हैं, तो मैं स्रोतों की सूची में लिंक के लिए बहुत आभारी रहूंगा, आपको ऐसी विस्तृत गणना कहीं नहीं मिलेगी:

    आइए एक मानक प्रणाली बनाएं:

    हम प्रत्येक समीकरण को "दो" से कम करते हैं और, इसके अलावा, "अलग" रकम:

    टिप्पणी : स्वतंत्र रूप से विश्लेषण करें कि "ए" और "बी" को योग आइकन से क्यों निकाला जा सकता है। वैसे, औपचारिक रूप से यह योग के साथ किया जा सकता है

    आइए सिस्टम को "लागू" रूप में फिर से लिखें:

    जिसके बाद हमारी समस्या को हल करने के लिए एल्गोरिदम तैयार करना शुरू होता है:

    क्या हम बिंदुओं के निर्देशांक जानते हैं? हम जानते है। रकम क्या हम ढूंढ सकते हैं? सरलता। हम सबसे सरल रचना करते हैं दो अज्ञात के साथ दो रैखिक समीकरणों की प्रणाली("ए" और "बीएच")। हम सिस्टम को हल करते हैं, उदाहरण के लिए, क्रैमर की विधि, जिसके परिणामस्वरूप एक स्थिर बिंदु होता है। चेकिंग एक चरम के लिए पर्याप्त स्थिति, हम सत्यापित कर सकते हैं कि इस बिंदु पर फ़ंक्शन ठीक पहुँचता है न्यूनतम. सत्यापन अतिरिक्त गणनाओं से जुड़ा है और इसलिए हम इसे पर्दे के पीछे छोड़ देंगे। (यदि आवश्यक हो, लापता फ्रेम देखा जा सकता है). हम अंतिम निष्कर्ष निकालते हैं:

    समारोह सबसे अच्छा तरीका (कम से कम किसी अन्य रैखिक कार्य की तुलना में)प्रयोगात्मक बिंदुओं को करीब लाता है . मोटे तौर पर, इसका ग्राफ इन बिंदुओं के जितना करीब हो सके गुजरता है। परंपरा में अर्थमितिपरिणामी सन्निकटन फलन को भी कहा जाता है युग्मित रैखिक समाश्रयण समीकरण .

    विचाराधीन समस्या बहुत व्यावहारिक महत्व की है। हमारे उदाहरण के साथ स्थिति में, समीकरण आपको यह अनुमान लगाने की अनुमति देता है कि किस प्रकार का टर्नओवर ("यिग")बिक्री क्षेत्र के एक या दूसरे मूल्य के साथ स्टोर पर होगा ("एक्स" का एक या दूसरा अर्थ). हां, परिणामी पूर्वानुमान केवल एक पूर्वानुमान होगा, लेकिन कई मामलों में यह काफी सटीक साबित होगा।

    मैं "वास्तविक" संख्याओं के साथ केवल एक समस्या का विश्लेषण करूंगा, क्योंकि इसमें कोई कठिनाइयां नहीं हैं - सभी गणनाएं 7-8 ग्रेड में स्कूली पाठ्यक्रम के स्तर पर हैं। 95 प्रतिशत मामलों में, आपको केवल एक रैखिक फ़ंक्शन खोजने के लिए कहा जाएगा, लेकिन लेख के अंत में मैं दिखाऊंगा कि इष्टतम हाइपरबोला, घातांक और कुछ अन्य कार्यों के लिए समीकरणों को खोजना अधिक कठिन नहीं है।

    वास्तव में, यह वादा किए गए उपहारों को वितरित करने के लिए बनी हुई है - ताकि आप सीखें कि ऐसे उदाहरणों को न केवल सटीक रूप से हल करना है, बल्कि जल्दी से भी। हम मानक का ध्यानपूर्वक अध्ययन करते हैं:

    एक कार्य

    दो संकेतकों के बीच संबंध का अध्ययन करने के परिणामस्वरूप, संख्याओं के निम्नलिखित जोड़े प्राप्त हुए:

    कम से कम वर्ग विधि का उपयोग करते हुए, उस रैखिक फ़ंक्शन को खोजें जो अनुभवजन्य का सबसे अच्छा अनुमान लगाता है (अनुभव)जानकारी। एक ऐसा चित्र बनाइए जिस पर कार्तीय आयताकार निर्देशांक प्रणाली में प्रायोगिक बिंदुओं को आलेखित करें और सन्निकट फलन का आलेख तैयार करें। . अनुभवजन्य और सैद्धांतिक मूल्यों के बीच वर्ग विचलन का योग ज्ञात कीजिए। पता करें कि क्या फ़ंक्शन बेहतर है (न्यूनतम वर्ग विधि के संदर्भ में)अनुमानित प्रयोगात्मक बिंदु।

    ध्यान दें कि "x" मान प्राकृतिक मूल्य हैं, और इसका एक विशिष्ट अर्थपूर्ण अर्थ है, जिसके बारे में मैं थोड़ी देर बाद बात करूंगा; लेकिन वे, निश्चित रूप से, भिन्नात्मक हो सकते हैं। इसके अलावा, किसी विशेष कार्य की सामग्री के आधार पर, "X" और "G" दोनों मान पूर्ण या आंशिक रूप से नकारात्मक हो सकते हैं। खैर, हमें एक "फेसलेस" टास्क दिया गया है, और हम इसे शुरू करते हैं समाधान:

    हम सिस्टम के समाधान के रूप में इष्टतम फ़ंक्शन के गुणांक पाते हैं:

    अधिक कॉम्पैक्ट नोटेशन के प्रयोजनों के लिए, "काउंटर" चर को छोड़ा जा सकता है, क्योंकि यह पहले से ही स्पष्ट है कि योग 1 से .

    सारणीबद्ध रूप में आवश्यक राशियों की गणना करना अधिक सुविधाजनक है:


    गणना एक माइक्रोकैलकुलेटर पर की जा सकती है, लेकिन एक्सेल का उपयोग करना बहुत बेहतर है - दोनों तेज और त्रुटियों के बिना; एक छोटा वीडियो देखें:

    इस प्रकार, हम निम्नलिखित प्राप्त करते हैं: व्यवस्था:

    यहां आप दूसरे समीकरण को 3 और . से गुणा कर सकते हैं पहले समीकरण पद से दूसरे को पद द्वारा घटाएं. लेकिन यह भाग्य है - व्यवहार में, सिस्टम अक्सर उपहार में नहीं होते हैं, और ऐसे मामलों में यह बचाता है क्रैमर की विधि:
    , इसलिए सिस्टम के पास एक अनूठा समाधान है।

    चलो एक चेक करते हैं। मैं समझता हूं कि मैं नहीं करना चाहता, लेकिन गलतियों को क्यों छोड़ें जहां आप उन्हें बिल्कुल याद नहीं कर सकते? सिस्टम के प्रत्येक समीकरण के बाईं ओर पाए गए समाधान को प्रतिस्थापित करें:

    संबंधित समीकरणों के सही हिस्से प्राप्त होते हैं, जिसका अर्थ है कि सिस्टम सही ढंग से हल हो गया है।

    इस प्रकार, वांछित सन्निकटन फलन:- from सभी रैखिक कार्यप्रयोगात्मक डेटा इसके द्वारा सबसे अच्छा अनुमानित है।

    भिन्न सीधा अपने क्षेत्र पर स्टोर के कारोबार की निर्भरता, मिली निर्भरता है उल्टा (सिद्धांत "अधिक - कम"), और यह तथ्य तुरंत नकारात्मक द्वारा प्रकट होता है कोणीय गुणांक. समारोह हमें सूचित करता है कि एक निश्चित संकेतक में 1 इकाई की वृद्धि के साथ, आश्रित संकेतक का मूल्य घट जाता है औसत 0.65 इकाइयों द्वारा। जैसा कि वे कहते हैं, एक प्रकार का अनाज की कीमत जितनी अधिक होगी, उतना ही कम बेचा जाएगा।

    सन्निकटन फलन को आलेखित करने के लिए, हमें इसके दो मान मिलते हैं:

    और ड्राइंग निष्पादित करें:


    निर्मित रेखा कहलाती है प्रवृत्ति रेखा (अर्थात्, एक रेखीय प्रवृत्ति रेखा, अर्थात सामान्य स्थिति में, एक प्रवृत्ति आवश्यक रूप से एक सीधी रेखा नहीं होती है). हर कोई "प्रवृत्ति में होना" अभिव्यक्ति से परिचित है, और मुझे लगता है कि इस शब्द को अतिरिक्त टिप्पणियों की आवश्यकता नहीं है।

    वर्ग विचलन के योग की गणना करें अनुभवजन्य और सैद्धांतिक मूल्यों के बीच। ज्यामितीय रूप से, यह "क्रिमसन" खंडों की लंबाई के वर्गों का योग है (जिनमें से दो इतने छोटे हैं कि आप उन्हें देख भी नहीं सकते).

    आइए एक तालिका में गणनाओं को संक्षेप में प्रस्तुत करें:


    उन्हें फिर से मैन्युअल रूप से किया जा सकता है, बस अगर मैं पहले बिंदु के लिए एक उदाहरण दूंगा:

    लेकिन यह पहले से ज्ञात तरीके से करने के लिए और अधिक कुशल है:

    आइए दोहराएं: परिणाम का अर्थ क्या है?से सभी रैखिक कार्यसमारोह घातांक सबसे छोटा है, अर्थात यह अपने परिवार में सबसे अच्छा सन्निकटन है। और यहाँ, वैसे, समस्या का अंतिम प्रश्न आकस्मिक नहीं है: क्या होगा यदि प्रस्तावित घातीय कार्य क्या प्रायोगिक बिंदुओं का अनुमान लगाना बेहतर होगा?

    आइए वर्ग विचलन के संगत योग का पता लगाएं - उन्हें अलग करने के लिए, मैं उन्हें "एप्सिलॉन" अक्षर से नामित करूंगा। तकनीक बिल्कुल समान है:


    और फिर से 1 बिंदु के लिए हर आग की गणना के लिए:

    एक्सेल में, हम मानक फ़ंक्शन का उपयोग करते हैं ऍक्स्प (सिंटेक्स एक्सेल सहायता में पाया जा सकता है).

    निष्कर्ष: , इसलिए घातांकीय फलन सीधी रेखा से भी बदतर प्रयोगात्मक बिंदुओं का अनुमान लगाता है .

    लेकिन यहां यह ध्यान दिया जाना चाहिए कि "बदतर" है इसका मतलब अभी तक नहीं है, गलत क्या है। अब मैंने इस एक्सपोनेंशियल फंक्शन का एक ग्राफ बनाया - और यह पॉइंट्स के करीब भी जाता है - इतना अधिक कि एक विश्लेषणात्मक अध्ययन के बिना यह कहना मुश्किल है कि कौन सा कार्य अधिक सटीक है।

    यह समाधान को पूरा करता है, और मैं तर्क के प्राकृतिक मूल्यों के प्रश्न पर लौटता हूं। विभिन्न अध्ययनों में, एक नियम के रूप में, आर्थिक या सामाजिक, महीनों, वर्षों या अन्य समान समय अंतरालों को प्राकृतिक "X" के साथ गिना जाता है। उदाहरण के लिए, ऐसी समस्या पर विचार करें।

    दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

    लोड हो रहा है...