روشهای انتخاب گزینههای جایگزین در شرایط عدم قطعیت. مسائل تئوری تصمیمات آماری
از نظر ایدهها و روشها به نظریه بازیها، نظریه نزدیک است تصمیمات آماری. تفاوت آن با نظریه بازی این است که وضعیت عدم قطعیت رنگ آمیزی تعارض ندارد - هیچ کس با کسی مخالفت نمی کند، اما عنصر عدم اطمینان وجود دارد. در مسائل تئوری تصمیمات آماری، شرایط ناشناخته عملیات به دشمن آگاهانه فعال بستگی ندارد، بلکه به واقعیت عینی بستگی دارد که در تئوری تصمیمات آماری معمولاً به آن "طبیعت" می گویند. موقعیت های مربوطه را اغلب بازی با طبیعت (بازی های آماری) می نامند.
غالباً به این موقعیت ها به عنوان نظریه بازی گفته می شود و در تعریف بازی تصریح می کند که یکی از شرکت کنندگان می تواند محیط (طبیعت) باشد که به عنوان مجموع شرایط ناسازگار عمل می کند ، مجموعه شرایط خارجی که بازیکن در آن قرار دارد. تصمیم گرفتن. بیایید این بازیکن را آمارگیر بنامیم.
طبیعت نسبت به سود بی تفاوت است و به دنبال این نیست که آمارها را به نفع خود تبدیل کند. اجازه دهید آمارگیر داشته باشدمتراستراتژی ها و طبیعت می تواند اجرا شودnایالت های آنها اگر آماردان بتواند پیامدهای هر یک از استراتژی های خالص خود را در هر حالت طبیعی کمیت کند، آنگاه می توان بازی را با یک ماتریس بازده تعریف کرد. هنگام ساده کردن ماتریس بازده، یک ویژگی وجود دارد: یک یا آن استراتژی "طبیعت" را نمی توان کنار گذاشت، زیرا می تواند آنها را بدون توجه به اینکه برای آمارگیر مفید است یا نه، اجرا کند.
هنگام حل چنین بازی هایی، 2 موقعیت می تواند وجود داشته باشد:
· بازیکن A احتمالات را نمی داندpjکه طبیعت با آن حالات خود را درک می کند;
احتمالات pjشناخته شده.
معیارهای مختلفی برای تصمیم گیری در این گونه بازی ها استفاده می شود.
اگر احتمالاتpj حالات طبیعت ناشناخته هستند، پس می توانید از معیارهای والد، لاپلاس، ساویج، هورویتز و غیره استفاده کنید. تفاوت اصلی بین این معیارها با استراتژی رفتاری فرد تصمیم گیرنده در شرایط عدم اطمینان مشخص می شود. به عنوان مثال، آزمون لاپلاس بر اساس مفروضات خوش بینانه تری نسبت به آزمون والد است. معیار هورویتز را می توان با رویکردهای مختلف استفاده کرد: از خوش بینانه ترین تا بدبینانه ترین. بنابراین، معیارهای ذکر شده، علیرغم ماهیت کمی خود، ارزیابی ذهنی از موقعیتی را که آمارگیر باید در آن تصمیم بگیرد، منعکس می کند. متاسفانه وجود ندارد قوانین عمومیارزیابی کاربردی بودن یک معیار خاص، زیرا رفتار تصمیم گیرنده احتمالاً مهمترین عامل در انتخاب معیار مناسب است. بیایید این معیارها را تدوین کنیم.
1. معیار لاپلاس
این معیار بر اساس اصل است توجیه ناکافیکه بر اساس آن اعتقاد بر این است که شروع همه حالات طبیعت به یک اندازه محتمل است، یعنیپ 1 = پ 2 =...= پ n=1/ n، و استراتژی بهینه استهوش مصنوعی فراهم آوردن
. (5.1)
2. معیار Wald (معیار حداقل یا حداکثر )
این معیار محتاط ترین است، زیرا بر اساس انتخاب بهترین از بدترین احتمالات است:
- در صورت یافتن برنده؛
- در صورت ضرر
اینها معیارهای بدبینانه است.
3. معیار Savage (حداقل ریسک)
معیار والد آنقدر بدبینانه است که می تواند به نتیجه گیری های غیر منطقی منجر شود. ماتریس ضرر زیر را در نظر بگیرید که معمولاً به عنوان یک مثال کلاسیک برای توجیه معیار Savage "کمتر بدبینانه" ارائه می شود.
11000 | ||
10000 | 10000 |
استفاده از معیار Minimax منجر به انتخاب استراتژی A2 می شود، اگرچه می توان به طور شهودی A1 را انتخاب کرد، زیرا با این انتخاب می توان به از دست دادن 90 امیدوار بود، در حالی که انتخاب A2 همیشه منجر به از دست دادن 10000 واحد در هر شرایط آب و هوایی می شود.
معیار Savage با معرفی یک ماتریس ضرر جدید، وضعیت را "تصحیح" می کند.با font-size:14.0pt;line-height: 150%"> جایگزین می شوند که به صورت زیر تعریف می شوند:
معنیش اینه کهتفاوت وجود دارد بین بهترین ارزشدر یک ستونj و معنی
اساسا، ابراز تأسف تصمیم گیرنده از این که بهترین راه را در مورد شرایط انتخاب نکرده استj . ماتریس R =() ê ماتریس پشیمانی یا ماتریس ریسک نامیده می شود.
بیایید استراتژی بهینه مسئله قبلی را با توجه به این معیار پیدا کنیم:
.
قابل استفاده برای ماتریس "حسرت".آر معیار حداقل دریافتیم که استراتژی بهینه A1 است.
توجه داشته باشید که صرف نظر از اینکه آیا- سود یا زیانهمیشه ضرر هستند بنابراین، معیار حداقل حداکثر همیشه برای ماتریس "حسرت" اعمال می شود.
4. معیار هورویتز (بدبینی-خوش بینی)
این معیار تعدادی از رویکردهای مختلف برای تصمیم گیری را پوشش می دهد، از خوش بینانه ترین تا بدبینانه ترین.
با یک رویکرد خوش بینانه، استراتژی انتخاب می شود که می دهد :
، اگر برد است و
، اگر زیان باشد.
به طور مشابه، تحت بدبینانه ترین مفروضات، برگزیده تصمیم مطابقت دارد: ، اگر برد است و
font-size:14.0pt;line-height: 150%"> در صورت تلف شدن.
معیار هورویتز با سنجیدن هر دو حالت رفتاری با وزنهای مناسب، بین موارد خوشبینی و بدبینی شدید تعادل برقرار میکند. a و 1- a که 0 £ a £ 1.
اگر یک سود است، سپس استراتژی بر اساس قانون انتخاب می شود:
اگر یک - هزینه ها، معیار استراتژی را انتخاب می کند که می دهد
پارامتر a تفسیر شده است شاخص خوش بینی؛درآ =1 معیار خیلی خوش بینانه است، باآ =0 خیلی بدبینانه است. معنیآ بسته به تمایل تصمیم گیرنده به بدبین یا خوش بین بودن می توان بین 0 تا 1 را تعیین کرد.آ 0.5 = معقول ترین به نظر می رسد.
تجزیه و تحلیل موقعیت های عملی معمولاً بر اساس چندین معیار انجام می شود که امکان مطالعه عمیق تر از ماهیت پدیده را فراهم می کند.
مثال.
یکی از شرکت ها باید سطح ارائه خدمات را به گونه ای تعیین کند که نیازهای مشتریان را برآورده کند. تعداد دقیق مشتریان مشخص نیست، اما انتظار می رود که بتواند یکی از مقادیر زیر را داشته باشد: 200، 250، 300، 350. برای هر یک از این مقادیر ممکن، بهترین سطح عرضه (از نظر هزینه های احتمالی) وجود دارد. ). انحراف از این سطوح منجر به هزینههای اضافی میشود، یا به دلیل مازاد عرضه بر تقاضا یا به دلیل ارضای ناقص تقاضا.
زیان ها بسته به شرایط در جدول زیر نشان داده شده است:
مشتریان پیشنهادی. | |||||
آ 1 | |||||
آ 2 | |||||
آ 3 | |||||
آ 4 |
· معیار والد. زیرا - ضرر، ما معیار حداقل را اعمال می کنیم.
استراتژی بهینه A3 خواهد بود.
· معیار لاپلاس. بگذارید استراتژی های بازیکن دوم به همان اندازه محتمل باشد. در نتیجه. سپس:
EN-US">EN-US">EN-US">font-size:14.0pt;line-height:150%">بنابراین بهترین سطحپیشنهادات مطابق با معیار لاپلاس استراتژی A2 خواهد بود.
· ملاک وحشی . بیایید یک ماتریس ریسک بسازیم:
موقعیت: مطلق; z-index:2;left:0px;margin-left:68px;margin-top:21px;width:213px;height:2px">
بهترین استراتژی A2 است.
· معیار هورویتز بگذارید a = 1/2.
5/2+25/2=15 |
|||
7/2+23/2=15 |
|||
12/2+21/2=16,5 |
|||
15/2+30/2=22,5 |
بهترین استراتژی ها A1 و A2 هستند.
اگر با استفاده از روشهای تئوری بازی راهحلی پیدا کنیم، ابتدا به دنبال وجود یک نقطه زین میشویم:
این بازی دارای یک نقطه زین است و استراتژی بهینه A3 است.
5. معیار بیز
اگر احتمالات حالات طبیعت– pj شناخته شده اند، پس می توانید از معیار بیز استفاده کنید که بر اساس آن:
استراتژی خالص مربوط به حداکثر میانگین سود بهینه در نظر گرفته می شود: ، اگر - سود و حداقل میانگین ضرر: ، اگر -تلفات.
اگر در مثال قبل احتمالات تقاضا مشخص باشد font-size:14.0pt;line-height: 150%">، سپس برای یافتن استراتژی بهینه، باید میانگین ضرر را برای هر استراتژی خالص شرکت بیابید و یکی را انتخاب کنید که حداقل میانگین ضرر را ارائه می دهد: font- اندازه:14.0pt;ارتفاع خط: 150%;font-family:Symbol">® استراتژی A2.
می توان نشان داد که استراتژی که سود متوسط را به حداکثر می رساند، میانگین ریسک را نیز به حداقل می رساند.
تمام معیارهای در نظر گرفته شده برای استراتژیهای ناب تدوین شدهاند، اما هر یک از آنها را میتوان به استراتژیهای مختلط تعمیم داد، همانطور که در تئوری بازی انجام میشود. در تئوری تصمیم گیری آماری، استراتژی های ترکیبی زمانی معنا پیدا می کنند که بازی بارها تکرار شود.
اما با تکرار چندباره بازی، می توان فراوانی تکرار یک موقعیت خاص را تعیین کرد و سپس رویکرد تصادفی را در مسئله تصمیم گیری اعمال کرد.
اگر از استراتژی های ترکیبی استفاده شود، پس معیار والدبه صورت زیر فرموله شده است: استراتژی ترکیبی بهینه است فراهم آوردن ، یعنی به حداکثر رساندن بازده متوسط(اگر - پیروزی)
معیار Savage برای استراتژی های ترکیبی : استراتژی ترکیبی بهینه، استراتژی در نظر گرفته می شود که در آن حداکثر میانگین ریسک آماری وجود دارد حداقل، یعنی استراتژی ، از شرایط پیدا شده است .
استراتژی های ترکیبی بهینه در این مورد به همان روشی که در بازی ماتریس معمولی یافت می شود.
فصل 2 تصمیم گیری در شرایط عدم قطعیت
2.7. معیار والد
معیار والدمحتاط ترین است. به گفته وی، جایگزین بهینه، جایگزینی است که در بدترین شرایط، بهترین نتیجه را در بین همه جایگزین های ممکن ارائه دهد.
اگر نتایج منعکس کننده شاخص هایی باشد که باید به حداقل برسد (زیان ها، هزینه ها، زیان ها، و غیره)، پس معیار والد بر روی "مینیمکس"(حداقل در بین مقادیر حداکثر تلفات همه گزینه ها).
اگر نتایج جایگزینها شامل شاخصهای سود، درآمد و سایر شاخصهایی باشد که باید حداکثر شوند (طبق اصل «هرچه بیشتر، بهتر»)، پس "ماکسیمین"بردها (حداکثر در بین حداقل بردها). در اینجا و در زیر، برای تمام معیارهای موجود در متن، ما دقیقاً چنین موردی را در نظر خواهیم گرفت که نتیجه یک سود مشخص را نشان دهد.
با توجه به معیار والد، ارزیابی گزینه i-ام کوچکترین بازده آن است:
W i = min (x ij ) ، j = 1..M
جایگزین با حداکثر بدترین بازده بهینه در نظر گرفته می شود:
Х* = Х k , W k = حداکثر (W i ) , i = 1..N
نمونه ای از اعمال معیار والد
دو پروژه X 1 و X 2 وجود دارد که تحت سه سناریو ممکن برای توسعه منطقه (j=1..3 ) سودهای متفاوتی را فراهم کند. مقادیر سود در جدول 2.2 نشان داده شده است. شما باید یک پروژه را برای اجرا انتخاب کنید.
در میان پروژه های ممکن، هیچ پروژه غالبی چه به صورت مطلق و چه از لحاظ ایالتی وجود ندارد. بنابراین، تصمیم گیری باید بر اساس معیارها اتخاذ شود.
اگر انتخاب پروژه بهینه بر اساس معیار والد انجام شود، تصمیم گیرنده باید اقدامات زیر را انجام دهد:
1. حداقل نتایج را برای هر جایگزین بیابید. اینها مقادیر معیار والد خواهند بود:
W 1 = دقیقه (x 1j)، j = 1..3 => W 1 = دقیقه (45، 25، 50) = 25
W 2 = دقیقه (x 2j)، j = 1..3 => W 2 = دقیقه (20، 60، 25) = 20
2. مقادیر معیار Wald را مقایسه کنید و بزرگترین مقدار را پیدا کنید. جایگزین با حداکثر مقدار معیاربهینه در نظر گرفته خواهد شد:
25 > 20 => W 1 > W 2 => X* = X 1
اگر تصمیم فقط بر اساس معیار والد گرفته شده باشد، تصمیم گیرنده پروژه X 1 را برای اجرا انتخاب می کند، زیرا سودی که این پروژه به خودی خود فراهم می کند. توسعه ضعیفموقعیت های بالا
با انتخاب گزینه بهینه بر اساس معیار والد، تصمیم گیرنده به خود تضمین می دهد که در بدترین مجموعه شرایط ممکن، کمتر از مقدار معیار دریافت نخواهد کرد. بنابراین، این شاخص نیز نامیده می شود معیار نتیجه تضمین شده.
مشکل اصلی معیار والد بدبینی بیش از حد آن است و در نتیجه همیشه یک نتیجه منطقی نیست. بنابراین، برای مثال، هنگام انتخاب بر اساس این معیار بین گزینه های A (100؛ 500) و B (90؛ 1000)، باید روی گزینه A متوقف شود. با این حال، در زندگی واقعی، منطقی تر است که B را انتخاب کنید، زیرا در بدترین حالت، B فقط کمی بدتر از A است، در حالی که در یک مجموعه شرایط خوب، B سود بسیار بیشتری ارائه می دهد.
ملاک پشیمانی معیار انتظار روانشناسی رفتار LIRS در شرایط خطر و عدم قطعیت. استفاده از تئوری مطلوبیت برای انتخاب راه حل بهینه انتخاب شهودی گزینه بهینه.
معیار والد (معیار حداکثر")
همانطور که از جدول مشخص است، تصمیم مخاطره آمیز جایگزین بهینه در شرایط عدم قطعیت با توجه به معیار Wald (معیار حداکثر) در میدان سایه دار است و با 140 arb مطابقت دارد. لانه واحدها (این مقدار کارایی حداکثر تمام مقادیر حداقل آن در بدترین حالت است).
معیار والد (معیار "ماکزیمین") با انتخاب تصمیمات مخاطره آمیز در شرایط عدم اطمینان هدایت می شود، به عنوان یک قاعده، موضوعی که مستعد خطر نیست یا موقعیت های احتمالی را به عنوان یک بدبین در نظر می گیرد.
مقدار W به اندازه ای از شاخص W(x,y) است که می توانیم خود را تحت بدترین رفتار طبیعت برای خود تضمین کنیم (نتیجه تضمین شده). اگر یک کنترل x e X متفاوت از آنچه در مسئله فرمولبندی شده یافت میشود اعمال کنیم، طبیعت میتواند با انتخاب بدترین مقدار پارامتر y، ما را به دلیل بیهودگی مجازات کند، که در آن شاخص W کمتر از W به دست میآید. این معیار برای انتخاب راهحل است. گاهی اوقات معیار والد نیز نامیده می شود.
حداکثر برآورد با معیار والد تنها مورد کاملاً قابل اعتماد در هنگام تصمیم گیری در شرایط عدم قطعیت است.
استراتژی S حداکثر نامیده می شود، یعنی. تحت هر یک از شرایط بازار، نتیجه بدتر از W = 49310.03 هزار روبل نخواهد بود. بنابراین، این مقدار را قیمت پایینتر بازی یا حداکثر و همچنین اصل بالاترین نتیجه تضمینشده بر اساس معیار Wald مینامند که بر اساس آن استراتژی بهینه برای هر حالتی از محیط که امکان دستیابی به حداکثر سود را فراهم میکند. در بدترین شرایط استراتژی حداکثر است.
معیار والد، معیار بدبینی شدید است و تصمیم گیرنده را به سمت بدترین شرایط برای اجرای پروژه سوق می دهد.
معیار حداکثری والد. در اینجا تصمیم سازمان تجارت انتخاب می شود که حداکثر سود را در بدترین شرایط محیط خارجی (وضعیت طبیعی) تضمین می کند.
استراتژی متناظر با حداکثر مقدار در بین مینیمم های سطرها، استراتژی حداکثر نامیده می شود. معیار مربوطه (معیار والد) به صورت نوشته می شود
به عبارت دیگر، با توجه به معیار والد، استراتژی بهینه آن استراتژی است که کوچکترین بازده برای آن بزرگترین در میان کوچکترین بازده از همه استراتژیها باشد. مقدار W(, i = 1...m) با توجه به معیار والد، نشانگر بهینه بودن استراتژی A نامیده می شود.
یکی از روش ها انتخاب بهترین از بدترین احتمالات است (معیار والد). در این صورت برای هر یک از استراتژی ها، بدترین نتیجه و سپس بهترین از بین آنها انتخاب می شود. 108
اگر این منجر به استراتژی هایی با همان معیارهای والد شود، آنگاه استراتژی را انتخاب می کنند که کمترین حساسیت را به شرایط خارجی داشته باشد.
به آن معیار ماکسیمین والد نیز می گویند. ماهیت این معیار به شرح زیر است. تصمیم گیرنده راهبردهای متنوعی (گزینه ها، جایگزین ها) برای حل مسئله دارد
بنابراین، تعیین انحرافات احتمالی نتایج به دست آمده از آنها ضروری می شود مقادیر بهینه. اینجاست که معیار Savage مطرح می شود. انتخاب یک استراتژی شبیه به انتخاب یک استراتژی بر اساس اصل والد است، با این تفاوت که بازیکن توسط ماتریس سود E هدایت نمی شود، بلکه توسط ماتریس ریسک R که طبق فرمول (2.2.2) ساخته شده است، هدایت می شود.
بیشترین دقت Eg = حداکثر حداقل e i j معیار نتیجه تضمین شده (والد)
A. Wald همچنین ثابت کرد که معیار او به طور قابل توجهی سودآورتر است (با توجه به میانگین تعداد مشاهدات) از بهترین معیارهای کلاسیک - معیار Neumann-Pearson.
به طور خاص، معیار ماکسیمین والد حداکثر کردن حداقل سود یا همان چیزی که به حداقل رساندن حداکثر ضرر را تضمین می کند، که می تواند در اجرای یکی از استراتژی ها باشد. این معیار ساده و واضح است، اما محافظه کارانه است به این معنا که تصمیم گیرنده را به سمت یک خط رفتار بیش از حد محتاط سوق می دهد. مقدار مربوط به معیار حداکثر، هزینه کمتر بازی نامیده می شود، که باید به عنوان حداکثر بازده تضمین شده در بازی با حریف معین با انتخاب یکی از استراتژی های او با حداقل نتایج درک شود.
معیار Wald (یا معیار "maximin") این معیار را برای همه فرض می کند گزینه ها"ماتریس تصمیم" جایگزینی را انتخاب می کند که از بین همه نامطلوب ترین موقعیت های توسعه رویداد (به حداقل رساندن ارزش کارایی) بیشترین مقدار حداقل (یعنی ارزش کارایی، بهترین) را داشته باشد.
حداکثر معیار Wald در مواردی استفاده می شود که تضمینی لازم است که بازده در هر شرایطی کمتر از بزرگترین ممکن در بدترین شرایط نباشد. معیارهای هورویتز مقدار آن در 0 است
در فرمول این معیار ضریب a وجود دارد که مقدار آن بسته به میزان اطمینان تصمیم گیرنده به صحت انتخاب خود تعیین می شود که کدام سناریوی اجرای پروژه را باید ترجیح داد. مقدار a در محدوده 0 تا 1 انتخاب می شود. وقتی os=0، معیار Hurwitz به معیار خوش بینی شدید تبدیل می شود، زمانی که os=1، به معیار Wald تبدیل می شود. در 0، هر چه تمایل به "بیمه" بیشتر باشد، ضریب به 1 نزدیکتر انتخاب می شود.
تست احتمال بی طرفانه و سازگار است، با نمونه های بزرگ -2-log X دارای توزیع hi-squared با r درجه آزادی است، جایی که / تعداد پارامترهای p است که مقادیر خاص آن توسط H0 تعیین می شود. آزمون احتمال (LK) معادل آزمون والد (W) و آزمون ضرب لاگرانژ (LM) در تقریب مجانبی است، اما برای نمونه های کوچک W>LR>LM.
MAXIMIN بر کسب بازده تضمین شده در بدترین وضعیت محیط خارجی متمرکز است (رویکرد بدبینانه، معیار والد). مطابق با آن، جایگزینی که حداکثر مقدار نتیجه مورد انتظار را در کمترین وضعیت مطلوب محیط داشته باشد به عنوان بهینه انتخاب می شود. در اینجا راه حل امتناع از ساخت و ساز است.
بنابراین، معیار نتیجه تضمین شده (معیار حداکثر والد) به صورت نوشته می شود
3. معیار لاپلاس، والد، ساویج، هورویتز
معیارهای مختلفی برای انتخاب استراتژی بهینه هنگام تصمیم گیری در شرایط ریسک و عدم اطمینان وجود دارد.
معیار لاپلاس:در صورتی اعمال می شود که بتوان فرض کرد که همه انواع شرایط خارجی به یک اندازه محتمل هستند. برای هر راه حل وجود دارد امتیاز متوسطبرای همه انواع شرایط خارجی (بهره متوسط):
که در آن N تعداد حالات محیط است.
جایی که Z است استراتژی بهینه.
معیار والد:(معیار بدبینی شدید، معیار حداکثر): راه حل بر اساس بدترین شرایط بیرونی انتخاب می شود. احتمالات حالات طبیعت ناشناخته است و هیچ راهی برای به دست آوردن اطلاعات آماری در مورد آنها وجود ندارد. به عنوان تخمین هر راه حل، حداقل سودی که می توان با انتخاب این راه حل به دست آورد استفاده می شود:
بهترین راه حل، راه حلی است که بالاترین امتیاز را داشته باشد.
بهترین راه حل، راه حلی است که بالاترین امتیاز را داشته باشد.
با توجه به معیار والد، راهبردی انتخاب میشود که در بدترین حالت طبیعی، سود تضمینشدهای به دست میدهد.
معیار وحشی،مانند معیار والد، معیار بدبینی شدید است، اما تنها بدبینی در اینجا در این واقعیت آشکار می شود که حداکثر ضرر در سود به حداقل برسد. ماتریس ریسک برای ارزیابی تصمیمات استفاده می شود. به عنوان یک تخمین، حداکثر ریسک (حداکثر سود از دست رفته) مربوط به این تصمیم استفاده می شود:
بهترین راه حل، راه حلی است که کمترین امتیاز را داشته باشد.
این محتاطانه ترین رویکرد برای تصمیم گیری و حساس ترین رویکرد به همه خطرات ممکن است.
معیار هورویتز:این تصمیم با در نظر گرفتن امکان پذیر بودن شرایط خارجی مطلوب و نامطلوب اتخاذ می شود. هنگام استفاده از این معیار، لازم است "ضریب بدبینی" را نشان دهید - عددی در محدوده 0 تا 1، که یک ارزیابی ذهنی (یعنی محاسبه نشده، اما توسط یک فرد نشان داده شده) از امکان شرایط نامطلوب خارجی است. اگر دلیلی وجود داشته باشد که شرایط خارجی نامطلوب باشد، ضریب بدبینی نزدیک به یک در نظر گرفته می شود. اگر شرایط خارجی نامطلوب بعید باشد، از ضریب بدبینی نزدیک به صفر استفاده می شود. تخمین راه حل با فرمول زیر بدست می آید:
که در آن a ضریب بدبینی است.
بهترین راه حل، راه حلی است که بالاترین امتیاز را داشته باشد:
علاوه بر معیارهای بهینه ای که می توان هنگام تصمیم گیری در شرایط ریسک و عدم قطعیت استفاده کرد، روش بسیار شناخته شده و گسترده ای از تئوری بازی وجود دارد که در فعالیت های مدیریتی در شرایط عدم قطعیت استفاده می شود.
4. روش تئوری بازی ها در تصمیم گیری در شرایط عدم قطعیت
هنگام تصمیم گیری در شرایط عدم قطعیت، از روش تئوری بازی ها بسیار استفاده می شود. تئوری بازی یک نظریه ریاضی از موقعیت های تعارض است. وظیفه این نظریه ایجاد توصیه هایی در مورد مسیر منطقی عمل شرکت کنندگان در تعارض است. در همان زمان، یک مدل ساده از یک موقعیت درگیری، به نام یک بازی، ساخته شده است. منظور از "بازی" رویدادی است که شامل یک سری اقدامات یا "حرکات" است. این بازی با یک موقعیت درگیری واقعی تفاوت دارد زیرا بر اساس قوانین کاملاً تعریف شده انجام می شود. به طرفین درگیر درگیری، بازیکن، نتیجه درگیری را برد و غیره می گویند.
اگر منافع دو طرف در بازی تضاد داشته باشد، بازی را یک بازی جفتی می نامند، اگر تعداد طرفین بیشتر باشد - چندگانه. بازی چندگانه با دو ائتلاف دائمی بازی را به یک بازی دو نفره تبدیل می کند. بازی های زوجی بیشترین اهمیت عملی را دارند. یک بازی متناهی را در نظر بگیرید که در آن بازیکن A دارای m استراتژی و بازیکن B دارای n استراتژی است. چنین بازی m x n نامیده می شود. استراتژی ها را به ترتیب نشان می دهیم: A 1 , A 2 , ..., A m - برای بازیکن A. B 1 , B 2 , ..., B n - برای بازیکن B. اگر بازی فقط از حرکات شخصی تشکیل شده باشد، انتخاب استراتژی های A i و B j توسط بازیکنان به طور منحصر به فرد نتیجه بازی را تعیین می کند - نتیجه ما a ij اگر یک ij برای همه استراتژیهای ترکیبی شناخته شده باشد، یک ماتریس بازدهی به اندازه m x n تشکیل میدهند که: m تعداد ردیفهای ماتریس و n تعداد ستونهای آن است.
اصل احتیاط که انتخاب استراتژی های مناسب (حداکثر و حداقل) را به بازیکنان دیکته می کند، اصل اصلی در تئوری بازی ها است و به آن اصل مینیمکس می گویند. در ماتریس پرداخت چنین بازی، عنصری وجود دارد که هم حداقل در ردیف خود و هم حداکثر در ستون آن است. چنین عنصری عنصر نازک زین نامیده می شود. مقدار v=ą=þ را قیمت خالص بازی می نامند. در این صورت راه حل بازی (مجموعه استراتژی های بهینه بازیکنان) دارای این ویژگی است: اگر یکی از بازیکنان به استراتژی بهینه خود پایبند باشد، دیگر نمی تواند از استراتژی بهینه خود منحرف شود. اگر قیمت بالای بازی با قیمت پایین مطابقت نداشته باشد، در این مورد ارزش دارد در مورد بازی در استراتژی های ترکیبی صحبت شود. S A ترکیبی استفاده از راهبردهای خالص A 1 ,A 2 ,…,A n با احتمال p 1 , p 2 ,…, p n و استراتژی مختلط S B استفاده از استراتژی های خالص B 1 ,B 2 ,…,B n است. با احتمال p 1 , p 2 ,…, p m . اجازه دهید بازی دارای ابعاد 2 در 2 باشد و با ماتریس پرداخت داده شود:
برای بازیکن A، استراتژی بهینه دارای احتمالاتی است:
;
; قیمت بازی