मिनिमैक्स विधि और बेयस-लाप्लास और सैवेज विधियों के विशेषज्ञ मूल्यांकन। बेयस, लाप्लास, सैवेज, वाल्ड, हर्विट्ज़ मानदंड

यह माना जाएगा कि जमा पूरे क्षेत्र में समान रूप से वितरित किए जाते हैं। इस तरह के दृष्टिकोण को शायद ही वैध माना जा सकता है, क्योंकि इसकी मदद से प्राप्त निष्कर्षों का कोई तार्किक आधार नहीं है। हालांकि, बेयस-लाप्लास मानदंड हर्विट्ज़ मानदंड से अधिक मनमाना नहीं है।


एक आशावादी दृष्टिकोण, हर्विट्ज़ मानदंड, बेयस-लाप्लास मानदंड और इस मामले में सैवेज मानदंड के आधार पर निम्नलिखित रूप हैं

बायेसियन (लाप्लास) मानदंड 27, 224 बायेसियन दृष्टिकोण 27 संतुलन 27 संतुलन (या संतुलन)

इन मानदंडों और नियमों के बीच, एक विशेष स्थान पर प्रसिद्ध बेयस प्रमेय के आधार पर नियमों और मानदंडों का कब्जा है। इस प्रमेय पर आधारित दृष्टिकोण, सबसे पहले, कुछ कार्यप्रणाली सिद्धांतों का उपयोग करने की अनुमति देता है प्राकृतिक विज्ञानप्रबंधन में, और दूसरा, यह सुनिश्चित करने के लिए कि अनुभव प्राप्त होने पर निर्णय और निर्णय लेने को समायोजित किया जाता है। उत्तरार्द्ध का अर्थ है प्रबंधन की प्रक्रिया में (निर्णय लेने के अर्थ में) प्रबंधन करना सीखना।

कभी-कभी ऑपरेशन के दौरान, जानकारी उपलब्ध होने पर अनिश्चितता धीरे-धीरे प्रकट होती है। इस मामले में, निर्णयों को सही ठहराने के लिए, किसी घटना की पश्च संभावना के रूप में इस तरह के एक उद्देश्य मानदंड का उपयोग करना सुविधाजनक होता है। इस प्रायिकता की गणना ऑड्स के संदर्भ में बेयस के सूत्र का उपयोग करके सबसे आसानी से की जाती है। आइए इस दृष्टिकोण के सार पर विचार करें।

बायेसियन मानदंड का उपयोग उन मामलों में किया जाता है जहां संभावित राज्यों का संभाव्यता वितरण ज्ञात होता है। यदि यह असतत संभाव्यता वितरण संभावनाओं के सेट द्वारा दिया जाता है, तो, बायेसियन मानदंड के अनुसार, रणनीति Si Sj (s > if) के लिए बेहतर है

इस मानदंड के विशेष मामले बायेसियन मानदंड (ए = 1 के लिए) और वाल्ड मानदंड (ए = 0 के लिए) हैं।

वाल्ड मानदंड के विपरीत, बेयस-लाप्लास मानदंड, सभी निर्णय विकल्पों के संभावित परिणामों में से प्रत्येक को ध्यान में रखता है

बेयस-लाप्लास मानदंड उस स्थिति पर निम्नलिखित आवश्यकताओं को लागू करता है जिसमें निर्णय लिया जाता है

Z = 1 पर, कसौटी को बेयस-लाप्लास मानदंड में बदल दिया जाता है, और z = O पर इसे वाल्ड मानदंड में बदल दिया जाता है। इस प्रकार, पैरामीटर z का चुनाव व्यक्तिपरक है। इसके अलावा, कार्यान्वयन की संख्या को भी नजरअंदाज कर दिया जाता है। इसलिए, तकनीकी निर्णय लेते समय इस मानदंड का उपयोग शायद ही कभी किया जाता है।

हमने अध्ययन के तहत मॉडल में अनिश्चित कारकों के मामले में निर्णय लेने के लिए कई बुनियादी दृष्टिकोणों पर विचार किया है। उदाहरण दिए जा सकते हैं जब सभी निर्णय मानदंड एक ही निर्णय x e X के चुनाव की ओर ले जाते हैं, लेकिन आमतौर पर ऐसा नहीं होता है, प्रत्येक मानदंड अपने स्वयं के निर्णय की ओर ले जाता है (इस तरह का एक उदाहरण अगले अध्याय में माना जाता है)। इसलिए, इस बारे में चर्चा होती है कि कौन सा मानदंड और कब बेहतर है। कई मानदंडों के आधार पर एक अद्वितीय निर्माण करने का प्रयास किया जाता है। विशेष रूप से, हर्विट्ज़ मानदंड दो मानदंडों का ऐसा मिलन है। हर्वपेट्ज़ परीक्षण और बेयस-लाप्लास परीक्षण को मिलाने का भी प्रयास किया गया है। सभी प्राप्त मानदंड हैं एक उच्च डिग्रीमनमानी करना। हमारी राय में, इन कठिनाइयों को दूर करने का एकमात्र तरीका एक बहु-मानदंड दृष्टिकोण है, जिसमें निर्णय निर्माता निर्णय लेने के विकल्पों पर विचार कर सकता है जो संकेतकों की समग्रता के संदर्भ में प्रभावी हैं और उनमें से सबसे उपयुक्त का चयन करते हैं। इस उपागम का प्रयोग अगले अध्याय में दिए गए उदाहरण में किया गया है। बेशक, इस मामले में संकेतकों की समग्रता बहुत बड़ी नहीं होनी चाहिए।

आमतौर पर विभिन्न विन्यासों को विभिन्न तत्वों और कनेक्शन संरचना के साथ आजमाया जाता है। सबसे महत्वपूर्ण संकेतकों में से एक प्रशिक्षण सेट की मात्रा है और आगे के काम के दौरान सामान्यीकरण की क्षमता सुनिश्चित करना है, और विभिन्न योजनाओं पर वांछित परिणाम प्राप्त किया जा सकता है। सबसे अधिक इस्तेमाल की जाने वाली प्रक्रियाएं क्रमिक वंश (पुष्टि सेट के साथ) या एन-फोल्ड क्रॉस-सत्यापन हैं। अधिक शक्तिशाली सूचना मानदंड भी लागू किए जा सकते हैं (1) सामान्यीकृत क्रॉस सत्यापन (जीवी), कुल एकाइक भविष्यवाणी त्रुटि (एफपीई), बायेसियन (बीआई) और एकाइके (एआई) परीक्षण (देखें)। सामान्यीकरण क्षमताओं में सुधार करने और ओवरफिटिंग के खतरे को खत्म करने के लिए, वजन घटाने और उन्मूलन (पेड़ को पतला करना) भी लागू किया जाता है। यह नेटवर्क के आर्किटेक्चर को बदलता है, कुछ लिंक को हटाता है और जांचता है कि दक्षता पर उनका क्या प्रभाव पड़ा। >,

बेयस (लैप्लेस) मानदंड - निर्णय सिद्धांत में, "प्रकृति" रणनीतियों की सापेक्ष संभावनाओं के बारे में किसी भी जानकारी के अभाव में निर्णय लेने का मानदंड। (अनिश्चित समस्याएं देखें।) बी (एल।) के अनुसार। विचाराधीन सभी रणनीतियों के लिए समान संभावनाएं देने का प्रस्ताव है, और फिर उस रणनीति को स्वीकार करें जिसके लिए अपेक्षित भुगतान सबसे बड़ा होगा। इसका नुकसान यह है कि एक ही कार्य में मूल्यांकन किए गए विकल्पों की सीमा भिन्न हो सकती है और तदनुसार, भिन्न भी हो सकती है सापेक्ष संभावनाउनमें से हर एक।

होजेस-लेहमैन मानदंड। इस मानदंड को लागू करते समय, दो व्यक्तिपरक संकेतकों का उपयोग किया जाता है, पहला, बायेसियन मानदंड में प्रयुक्त संभाव्यता वितरण, और दूसरा, हर्विट्ज़ मानदंड से "आशावाद पैरामीटर"।

हॉज-लेहमैन मानदंड वाल्ड और बेयस-लाप्लास मानदंड पर एक साथ आधारित है

यदि ओपीडी का निर्णय लेते समय राज्यों पीजे की संभावनाएं पीजे जानी जाती हैं, तो हम मान लेंगे कि स्थिति को आंशिक अनिश्चितता की स्थिति में माना जाता है।

आंशिक अनिश्चितता की स्थिति में खिलाड़ी i-th निर्णय (रणनीति Аi का उपयोग करने के लिए) करता है। वह राज्य पीजे को महसूस करते समय आय प्राप्त करने की उम्मीद करता है, जो तालिका में प्रस्तुत वितरण की एक श्रृंखला के साथ एक यादृच्छिक चर क्यूई है। 3.9.

तालिका 3.9. यादृच्छिक चर Qi . की वितरण श्रृंखला

इस मामले में, निर्णय लेने के लिए निम्नलिखित मानदंडों में से एक का उपयोग किया जा सकता है।

बेयस मानदंड

औसत अपेक्षित प्रतिफल को अधिकतम करने के लिए यह एक मानदंड है। बेयस मानदंड को अधिकतम औसत भुगतान मानदंड भी कहा जाता है।

जैसा कि ज्ञात है, अपेक्षित मूल्ययादृच्छिक चर क्यूई का एम (क्यूई) औसत अपेक्षित आय है, जो क्यूई को भी प्रभावित करता है सूत्र (3.21) द्वारा पाया जा सकता है:

प्रत्येक रणनीति i (i-th समाधान विकल्प) के लिए, औसत अपेक्षित आय (गणितीय अपेक्षा) की गणना सूत्र (3.21) का उपयोग करके की जानी चाहिए, और बेयस मानदंड के अनुसार, किसी को विकल्प (रणनीति Аi) चुनना चाहिए जिसके लिए उच्चतम मूल्य प्राप्त किया जाता है:

बेयस मानदंड का उपयोग उस स्थिति में किया जाता है जिसमें निर्णय लिया जाता है जो निम्नलिखित शर्तों को पूरा करता है:

राज्य j की घटना की संभावना ज्ञात है और समय पर निर्भर नहीं है; सैद्धांतिक रूप से किया गया निर्णय अनंत बड़ी संख्या में कार्यान्वयन की अनुमति देता है;

कम संख्या में प्राप्तियों के लिए कुछ जोखिम की अनुमति है।

समाधान उच्चतम औसत आय प्राप्त करता है और इस आय का मूल्य क्या है।

समाधान। आइए तालिका 3.10 के रूप में j राज्यों की संभावनाओं के साथ एक अतिरिक्त पंक्ति के साथ अदायगी मैट्रिक्स लिखें।

तालिका 3.10. गेम पेऑफ मैट्रिक्स

आइए प्रत्येक रणनीति के लिए सूत्र (3.21) के अनुसार औसत अपेक्षित आय खोजें:

एआई रणनीति को लागू करते समय, ओआरपी अधिकतम से भिन्न आय प्राप्त कर सकता है, जिसे जोखिम की मात्रा के रूप में लिया जाता है। वितरण की एक श्रृंखला के साथ एक यादृच्छिक चर री का जोखिम, जो तालिका में दिया गया है। 3.11.

तालिका 3.11. यादृच्छिक चर Ri . की वितरण श्रृंखला

प्रत्येक रणनीति i (i-th समाधान विकल्प) के लिए, औसत अपेक्षित जोखिम (गणितीय अपेक्षा) की गणना सूत्र (3.23) का उपयोग करके की जानी चाहिए, और बेयस मानदंड के अनुसार, विकल्प चुना जाना चाहिए जिसके लिए सबसे छोटा मान प्राप्त किया गया है :

इस मामले में, बेयस मानदंड औसत अपेक्षित जोखिम को कम करने के लिए एक मानदंड के रूप में कार्य करता है। बेयस मानदंड को न्यूनतम औसत नुकसान की कसौटी कहा जा सकता है।

उदाहरण 3.9। बायेसियन जोखिम मैट्रिक्स के आधार पर उदाहरण 3.8 के आउटपुट के लिए, पता करें कि कौन सा समाधान विकल्प सबसे छोटा औसत जोखिम प्राप्त करता है और इस जोखिम का परिमाण क्या है।

अनलोडिंग प्रतिबद्धता। आइए तालिका 3.12 के रूप में पाई राज्यों की संभावनाओं के साथ एक अतिरिक्त पंक्ति के साथ खेल के जोखिम मैट्रिक्स को लिखें।

तालिका 3.12. खेल जोखिम मैट्रिक्स

आइए प्रत्येक रणनीति के लिए सूत्र (3.23) के अनुसार औसत अपेक्षित जोखिम खोजें:

बर्नौली-लाप्लास मानदंड

बर्नौली-लाप्लास मानदंड का उपयोग तब किया जाता है जब यह माना जा सकता है कि कोई भी पर्यावरण विकल्प दूसरे की तुलना में अधिक संभावना नहीं है। यहां यह माना जाता है कि पर्यावरण के सभी राज्य (वास्तविक स्थिति के सभी प्रकार) समान रूप से संभावित हैं।

प्रत्येक रणनीति एआई (और वें समाधान विकल्प) के लिए, औसत अपेक्षित आय (गणितीय अपेक्षा) की गणना सूत्र (3.25) का उपयोग करके की जानी चाहिए, और बर्नौली-लाप्लास मानदंड के अनुसार, विकल्प (रणनीति एआई) को चुना जाना चाहिए जो उच्चतम मूल्य प्राप्त किया जाता है:

उदाहरण 3.10. मान लीजिए कि उदाहरण 3.2 में पेऑफ मैट्रिक्स द्वारा दिए गए गेम के लिए, ओडीपी प्रकृति के सभी राज्यों को बिल्कुल संभावित मानता है

पता करें कि किस समाधान विकल्प के तहत सबसे बड़ी औसत आय प्राप्त की जाती है और इस आय का मूल्य क्या है।

समाधान। आइए तालिका 3.13 के रूप में j राज्यों की संभावनाओं के साथ एक अतिरिक्त पंक्ति के साथ अदायगी मैट्रिक्स लिखें।

तालिका 3.13

आइए प्रत्येक रणनीति के लिए सूत्र (3.25) के अनुसार औसत अपेक्षित आय का पता लगाएं:

जोखिम पर विचार करें अनियमित चरवितरण की एक श्रृंखला के साथ री, जो तालिका में दिया गया है। 3.14.

तालिका 3.14। यादृच्छिक चर Ri . की वितरण श्रृंखला

यादृच्छिक चर री की गणितीय अपेक्षा एम (री) औसत अपेक्षित जोखिम है, जिसकी गणना सूत्र (3.27) द्वारा की जाती है

प्रत्येक रणनीति i (i-th समाधान विकल्प) के लिए, औसत अपेक्षित जोखिम (गणितीय अपेक्षा) की गणना सूत्र (3.27) का उपयोग करके की जानी चाहिए, और बर्नौली-लाप्लास मानदंड के अनुसार, रणनीति (विकल्प) को चुना जाना चाहिए जो सबसे छोटा मूल्य हासिल किया जाता है:

उदाहरण 3.11. उदाहरण 3.10 के आउटपुट के लिए, बर्नौली-लाप्लास मानदंड का उपयोग करते हुए जोखिम मैट्रिक्स के आधार पर, पता करें कि कौन सा समाधान विकल्प सबसे छोटा औसत जोखिम प्राप्त करता है और इस जोखिम का परिमाण क्या है।

समाधान। आइए तालिका 3.15 के रूप में j राज्यों की संभावनाओं के साथ एक अतिरिक्त पंक्ति के साथ खेल के जोखिम मैट्रिक्स को लिखें।

तालिका 3.15। खेल जोखिम मैट्रिक्स

आइए प्रत्येक रणनीति के लिए सूत्र (3.27) के अनुसार औसत अपेक्षित जोखिम खोजें:

यह ध्यान दिया जाना चाहिए कि बर्नौली-लाप्लास मानदंड आंशिक अनिश्चितता के मामले में सीधे लागू नहीं होता है, और इसका उपयोग पूर्ण अनिश्चितता की स्थितियों के तहत किया जाता है।

बेयस अदायगी मानदंड रणनीतियों की इष्टतमता के लिए मुख्य मानदंड है, जिसका उपयोग जोखिम के तहत निर्णय लेते समय किया जाता है (देखें 2.1)।

अदायगी मैट्रिक्स द्वारा दिए गए प्रकृति के साथ एक खेल पर विचार करें लेकिन(देखें (2.1.2))। होने देना क्यू= प्रकृति की अवस्थाओं का प्रायिकता सदिश है जो उन शर्तों (2.1.1) को संतुष्ट करता है, जो आसानी से मैट्रिक्स (2.1.2) की अतिरिक्त पंक्ति में स्थित हैं:


थॉमस बेयस का संदर्भ लें

(1702 - 17.04.1761)

प्रकृति के राज्यों की संभावनाओं के वेक्टर एच के साथ शुद्ध रणनीतियों की इष्टतमता के लिए बेयस की जीत-मानदंड (बी 1 '(क्यू) -मानदंड 2) को मानदंड कहा जाता है जिसके अनुसार:

- शुद्ध रणनीति की प्रभावशीलता का संकेतक (बी '' (क्यू) -सूचक)

ए- (मैं = 1,2.....टी)मात्रा कहा जाता है

- शुद्ध रणनीतियों में खेल के (बी 1 '(क्यू)-लागत) की कीमत पर(सेट अनुसूचित जाति), को प्रदर्शन संकेतकों में सबसे बड़ा कहा जाता है बीजे '(क्यू), /" = 1,2..., टी,शुद्ध रणनीतियाँ:

- इष्टतम (शुद्ध रणनीतियों के सेट एससी में 1 '(क्यू) -इष्टतम) मेंएक रणनीति कहा जाता है एकेएस 1अधिकतम दक्षता के साथ

इष्टतम रणनीति को भी कहा जाता है बायेसियन रणनीति।प्रदर्शन संकेतक के बाद से बीजे '(क्यू)रणनीतियाँ ए टूइस रणनीति के लिए भुगतान का भारित औसत है, तो इष्टतम रणनीति इस मानदंड के अनुसार प्रत्येक व्यक्तिगत मामले में नहीं, बल्कि भारित औसत में इष्टतम है।

समानता (2.5.2) को सदिश रूप में लिखा जा सकता है:

जहाँ "r" स्थानान्तरण चिह्न है।

जैसा कि (2.5.3) और (2.5.4) से देखा जा सकता है, शुद्ध रणनीतियों के सेट में, इष्टतम रणनीति का दक्षता सूचकांक खेल की लागत के साथ मेल खाता है।

शुद्ध रणनीति की व्याख्या लेकिन-मानों के साथ असतत यादृच्छिक चर के रूप में एक एन, एक आई 2, ..., एक आईआरएलई, जिसे वह क्रमशः संभावनाओं के साथ स्वीकार करता है क्यू यू क्यू 2 ,...,क्यू एन ,हमें वह मिलता है बी "'(क्यू)- रणनीति की प्रभावशीलता का सूचक लेकिन-नेटवर्क इसकी गणितीय अपेक्षा है। इसीलिए बेयस अदायगी मानदंड को " अपेक्षा मानदंड।

(2.5.2) और (2.5.3) से निम्नलिखित अनुमान निम्नलिखित हैं: जहाँ a" = min एक,मैं "" = चेक एकएन, ए एक "ttt= अधिकतम मिनट एक,और अधिकतम अधिकतम एल, -संगत

है जे एस एन 1 1 क्लिफिमिसी&आई 1 जू 1

सहज रूप में मैक्सिमिनतथा शुद्ध रणनीतियों में मैक्सी गेम।हम इस बात पर जोर देते हैं कि असमानताओं के बाएँ और दाएँ भाग (2.5.5) और (2.5.6) सदिश पर निर्भर नहीं करते हैं क्यू।

एक शुद्ध रणनीति जिसका न्यूनतम भुगतान अधिकतम के साथ मेल खाता है, कहलाता है मैक्सिमिनरणनीति। अगर खिलाड़ी लेकिनअधिकतम रणनीति का पालन करता है लेकिन k, तो प्रकृति की किसी भी अवस्था R के लिए हमारे पास असमानता है a k1 > a "" t \u003d a" uhtt, y = 1,2,..., u, जिसका अर्थ है कि अधिकतम आर्थिक रूप से है

खिलाड़ी की गारंटीकृत सबसे छोटी अदायगी है लेकिनप्रकृति के राज्यों की किसी भी संभावना के लिए, जब तक कि खिलाड़ी लेकिनअधिकतम रणनीति का पालन करता है।

शुद्ध रणनीतियों का सेट जो सेट में इष्टतम हैं अनुसूचित जातिके लिए शुद्ध रणनीतियाँ बीपी (क्यू)-मानदंड, द्वारा निरूपित (? с) 0(а "'»_ सामान्य निर्णयशुद्ध रणनीतियों में प्रकृति वाले खेलों की व्याख्या दो-तत्व सेट ((S c) 0 , ?(()) के रूप में की जा सकती है।

शुद्ध रणनीतियों में प्रकृति के साथ एक खेल का एक विशेष समाधान दो-तत्व सेट के रूप में समझा जा सकता है, जिनमें से एक तत्व शुद्ध रणनीतियों का एक गैर-खाली अधूरा सेट है जो शुद्ध रणनीतियों के सेट में इष्टतम हैं, और दूसरा है शुद्ध रणनीतियों में खेलने की लागत।

आइए मिश्रित रणनीतियों के क्षेत्र में आगे बढ़ते हैं 5.

द्वारा 1 '(क्यू) मेंमिश्रित रणनीतियों की इष्टतमता का मानदंड:

- सूचक (मिश्रित रणनीति की प्रभावशीलता के 1 '(q) -indicator) में = (р 1,р 2 ,...,р t)हम भार के साथ अदायगी का भारित औसत मूल्य (2.2.3) कहते हैं क्यूएल, क्यू 2, ..., क्यूएल:

- कीमत पर (मिश्रित रणनीतियों में बी पी (क्यू) -कीमत) खेलआइए सबसे बड़े प्रदर्शन संकेतकों का नाम दें (2.5.7):

- मिश्रित रणनीतियों के सेट एस में इष्टतम (В''(क्यू) -इष्टतम)चलो रणनीति कहते हैं आर °=(पी", साथ उच्चतम संकेतकक्षमता:

यह देखना आसान है कि यदि, विशेष रूप से, मिश्रित रणनीति आरशुद्ध है, उदाहरण के लिए, ए टू, टूई (1,2,..., से), तो इसकी दक्षता संकेतक बीपी (पी; क्यू)एक मिश्रित रणनीति के रूप में, सूत्र द्वारा व्यक्त (2.5.7), इसके प्रदर्शन संकेतक में बदल जाता है बी पी (ए टी; क्यू) = बीजे '(क्यू)एक शुद्ध रणनीति के रूप में, सूत्र (2.5.2) द्वारा गणना की जाती है।

यह देखना आसान है कि प्रदर्शन संकेतक बी पी (पीक्यू)मैट्रिक्स रूप में प्रतिनिधित्व किया जा सकता है:

कहाँ पे लेकिनखेल मैट्रिक्स है।

5 मिश्रित रणनीतियों के सेट की अनंतता के संबंध में, प्रश्न उठता है अस्तित्वइस सेट में इष्टतम रणनीति। निम्नलिखित प्रमेय द्वारा एक सकारात्मक उत्तर दिया गया है।

प्रमेय 2.5.1. प्रकृति के साथ किसी भी खेल में अपने राज्यों के किसी भी संभाव्यता वेक्टर के साथ, एक रणनीति मौजूद है जो बेयस पेऑफ मानदंड के अनुसार मिश्रित रणनीतियों के सेट में इष्टतम है।

सबूत। (2.2.3) और (2.5.7) से हम यह निष्कर्ष निकालते हैं कि दक्षता संकेतक बी 1 '(पी, क्यू)मिश्रित रणनीति के एक समारोह के रूप में आररैखिक है और इसलिए, समुच्चय S पर निरंतर है, जो एक सिंप्लेक्स होने के कारण एक आयामी यूक्लिडियन अंतरिक्ष में घिरा और बंद है आर""।इसलिए, वीयरस्ट्रैस प्रमेय (, पी। 298) द्वारा, फ़ंक्शन बीपी (पी; क्यू)सिम्प्लेक्स 5 पर अपने ऊपरी चेहरे तक पहुंचता है, यानी, एक रणनीति है आर °= (/>,", p") e 5, समानता को संतुष्ट करना (2.5.9)?

सेट में S""(su)-इष्टतम रणनीतियों का सेट एसमिश्रित रणनीतियों द्वारा निरूपित किया जाएगा एस 0 (बी (एच))।

निम्नलिखित प्रमेय शुद्ध और मिश्रित रणनीतियों के प्रदर्शन संकेतकों के बीच एक संबंध स्थापित करता है।

प्रमेय 2.5.2। दक्षता सूचकांक बी "पीक्यू)मिश्रित रणनीति P = (Pi'PiP m) 1.0 p(q) में - मानदंड शुद्ध रणनीतियों के प्रदर्शन संकेतक Bj'(q) का भारित औसत हैडी, / = 1,2,..., से, वजन p (, के साथ समान मानदंड के अनुसार)/ = 1,2,..., से:

सबूत।समानताओं (2.5.7), (2.2.3) और (2.5.2) को क्रमिक रूप से लागू करने पर, हम प्राप्त करते हैं:

माना = (/; | , पी 2,...,पी टी)- मनमानी मिश्रित रणनीति। दोहरी असमानता (2.5.5) के सभी भागों को से गुणा करना आर, और प्राप्त असमानताओं को संख्या /" से 1 तक से जोड़कर, हम (2.5.11), दक्षता संकेतक में परिवर्तन की सीमा के आधार पर प्राप्त करते हैं बी पी (पीक्यू)प्रकृति के राज्यों के किसी भी संभाव्यता वैक्टर के लिए:

निम्नलिखित प्रमेय शुद्ध और मिश्रित रणनीतियों में खेल की कीमतों के बीच एक संबंध स्थापित करता है।

प्रमेय 2.5.3. बेयस अदायगी मानदंड के अनुसार, शुद्ध और मिश्रित रणनीतियों में खेलों की कीमतें समान हैं।

सबूत।होने देना पी = (पी एल, पी 2, ..., पी एम)एस।का उपयोग करते हुए (2.5.11), (2.5.3) और संभावनाओं के लिए सामान्यीकरण की स्थिति /?, मैं= 1,2,..., से, हम पाते हैं:

चूंकि यह असमानता किसी भी मिश्रित रणनीति के लिए सही है आर,तब यह रणनीति के लिए मान्य है आर डिग्री,मिश्रित रणनीतियों के सेट में इष्टतम 5 : р Р°q लेकिन अंतिम असमानता का बायां हिस्सा,

एक इष्टतम मिश्रित रणनीति की परिभाषा (2.5.9) के अनुसार, मिश्रित रणनीतियों में खेल की कीमत के बराबर है। इस तरह,

दूसरी ओर, c5 के बाद से, अधिकतम बीएफ (क्यू) अधिकतम पहले में ' (पी क्यू)या वही क्या है

असमानताएँ (2.5.13) और (2.5.14) आवश्यक समानता सिद्ध करती हैं बी पी सी (क्यू) = बी पी (क्यू) ,

इस प्रमेय के आधार पर, हम शुद्ध और मिश्रित रणनीतियों में कीमतों के बारे में अलग-अलग नहीं बोल सकते हैं, लेकिन उनके सामान्य अर्थबस इसे बुलाओ बेयस अदायगी मानदंड के अनुसार खेल की लागतऔर द्वारा निरूपित बी पी)

दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

लोड हो रहा है...