Методи за избор на алтернативи в условия на несигурност. Проблеми на теорията на статистическите решения

Близка по идеи и методи до теорията на игрите е теорията статистически решения. Тя се различава от теорията на игрите по това, че ситуацията на несигурност няма конфликтна окраска - никой не се противопоставя на никого, но има елемент на несигурност. В проблемите на теорията на статистическите решения неизвестните условия на операцията не зависят от съзнателно действащия противник, а от обективната реалност, която в теорията на статистическите решения обикновено се нарича „природа“. Съответните ситуации често се наричат ​​игри с природата (статистически игри).

Често тези ситуации обикновено се наричат ​​​​теория на игрите, като в дефиницията на играта се посочва, че един от участниците може да бъде средата (природата), действаща като сбор от дезорганизиращи обстоятелства, целият комплекс от външни условия, в които играчът се намира да вземе решение. Нека наречем този играч статистик.

Природата е безразлична към печалбата и не се стреми да обърне пропуските на статистиката в своя полза. Нека статистиката имамстратегии, които природата може да приложинтехните състояния. Ако статистикът е в състояние да определи количествено последствията от всяка своя чиста стратегия във всяко природно състояние, тогава играта може да бъде дефинирана чрез матрица на изплащане. При опростяването на матрицата на изплащането има специфика: една или друга стратегия на „природата“ не може да бъде отхвърлена, тъй като тя може да ги приложи, независимо дали са полезни за статистиката или не.

При решаването на такива игри може да има 2 ситуации:

· играч А не знае вероятноститеpjс които природата реализира своите състояния;

вероятности pjизвестен.

За вземане на решения в такива игри се използват различни критерии.

Ако вероятноститеpj природните състояния са неизвестни, тогава можете да използвате критериите на Wald, Laplace, Savage, Hurwitz и др. Основната разлика между тези критерии се определя от стратегията на поведение на вземащия решение в условия на несигурност. Например тестът на Лаплас се основава на по-оптимистични предположения от теста на Валд. Критерият на Хурвиц може да се използва с различни подходи: от най-оптимистичния до най-песимистичния. Така изброените критерии, въпреки количествения си характер, отразяват субективна оценка на ситуацията, в която статистикът трябва да вземе решение. За съжаление не съществува Общи правилаоценка на приложимостта на конкретен критерий, тъй като поведението на вземащия решение вероятно ще бъде най-важният фактор при избора на подходящия критерий. Нека формулираме тези критерии.

1. Критерий на Лаплас

Този критерий се основава на принципа недостатъчна обосновка, според който се смята, че настъпването на всички природни състояния е еднакво вероятно, т.естр 1 = стр 2 =...= стр n=1/ н, а оптималната стратегия е AI осигуряване

. (5.1)

2. Критерий на Валд (минимаксен или максимален критерий )

Този критерий е най-предпазливият, тъй като се основава на избора на най-доброто от най-лошите възможности:

- в случай на намиране на печалба;

- при загуба.

Това са песимистични критерии.

3. Критерий на Savage (минимален риск)

Критерият на Валд е толкова песимистичен, че може да доведе до нелогични заключения. Помислете за следната матрица на загубите, която обикновено се дава като класически пример за оправдаване на „по-малко песимистичния“ критерий на Savage.

11000

10000

10000

Прилагането на минимаксния критерий води до избора на стратегия A2, въпреки че човек може интуитивно да избере A1, тъй като с този избор може да се надява да загуби 90, докато изборът на A2 винаги води до загуба от 10 000 единици при всякакви метеорологични условия.

Критерият на Savage „коригира“ ситуацията чрез въвеждане на нова матрица на загубите, в коятосе заменят с font-size:14.0pt;line-height: 150%"> дефинирани по следния начин:

Означава, чеима разлика между най-ценнов колонай и смисъл.

по същество, изразява съжалението на вземащия решението, че не е избрал най-добрия начин на действие по отношение на състояниетой . Матрица R =() ê наречена матрица на съжаление или матрица на риска.

Нека намерим оптималната стратегия на предишния проблем според този критерий:

.

Приложимо към матрицата на „съжаление“.Р минимаксен критерий. Получаваме, че оптималната стратегия ще бъде - A1.

Имайте предвид, че независимо дали- печалба или загубавинаги са загуби. Следователно критерият за минимакс винаги се прилага към матрицата на „съжаление“.

4. Критерий на Хурвиц (песимизъм-оптимизъм)

Този критерий обхваща редица различни подходи за вземане на решения, от най-оптимистичните до най-песимистичните.

При оптимистичен подход се избира стратегия, която дава :

, ако е печалба, и

, ако е загуба.

По същия начин, при най-песимистичните предположения, избраните решението съответства: , ако е печалба, и

font-size:14.0pt;line-height: 150%"> ако е със загуба.

Критерият на Хурвиц постига баланс между случаите на краен оптимизъм и песимизъм, като претегля и двата начина на поведение с подходящи тежести a и 1- a , където 0 £ a £ 1.

Ако е печалба, тогава стратегията се избира според правилото:

Ако – разходи, критерият избира стратегия, която дава

Параметър а тълкувано като показател за оптимизъм;приа =1 критерий е твърде оптимистичен, са =0 е твърде песимистично. Значениеа между 0 и 1 може да се определи в зависимост от склонността на вземащия решение да бъде песимист или оптимист.а =0,5 изглежда най-разумно.

Анализът на практическите ситуации обикновено се извършва въз основа на няколко критерия, което позволява по-задълбочено изследване на същността на явлението.

Пример.

Едно от предприятията трябва да определи нивото на предлаганите услуги по такъв начин, че да задоволи нуждите на клиентите. Точният брой клиенти не е известен, но се очаква, че той може да приеме една от следните стойности: 200, 250, 300, 350. За всяка от тези възможни стойности има най-добро ниво на предлагане (по отношение на възможните разходи ). Отклоненията от тези нива водят до допълнителни разходи или поради превишението на предлагането над търсенето, или поради непълното задоволяване на търсенето.

Загубите в зависимост от ситуацията са показани в следната таблица:


клиенти

Предложено.

а 1

а 2

а 3

а 4

· Критерий на Валд. защото – загуби, прилагаме минимаксния критерий.

Оптималната стратегия би била A3.

· Критерий на Лаплас. Нека стратегиите на втория играч са еднакво вероятни. Следователно. Тогава:

EN-US">EN-US">EN-US">font-size:14.0pt;line-height:150%">И така най-доброто нивопредложения в съответствие с критерия на Лаплас ще бъдат стратегия A2.

· Критерият на Савидж . Нека изградим матрица на риска:

позиция: абсолютна; z-index:2;left:0px;margin-left:68px;margin-top:21px;width:213px;height:2px">

Най-добрата стратегия е A2.

· Критерий на Хурвиц. Нека a =1/2.

5/2+25/2=15

7/2+23/2=15

12/2+21/2=16,5

15/2+30/2=22,5

Най-добрите стратегии са А1 и А2.

Ако намерим решение с помощта на методите на теорията на игрите, тогава първо търсим наличието на седлова точка:

Тази игра има седлова точка и оптималната стратегия е A3.

5. Критерий на Бейс

Ако вероятностите на природните състояния– pj са известни, тогава можете да използвате критерия на Бейс, според който:

Чистата стратегия, съответстваща на максималната средна печалба, се счита за оптимална: , ако – печалба и минимални средни загуби: , ако - загуби.

Ако в предишния пример са известни вероятностите за търсене font-size:14.0pt;line-height: 150%">, тогава, за да намерите оптималната стратегия, трябва да намерите средната загуба за всяка нетна корпоративна стратегия и да изберете тази, която осигурява минималната средна загуба: font-size: 14.0pt;line-height: 150%;font-family:Symbol">® стратегия A2.

Може да се покаже, че стратегията, която максимизира средната печалба, минимизира и средния риск.

Всички разгледани критерии са формулирани за чисти стратегии, но всеки от тях може да бъде разширен до смесени стратегии, точно както се прави в теорията на игрите. В статистическата теория на решенията смесените стратегии имат смисъл, когато играта се повтаря много пъти.

Но чрез повтаряне на играта много пъти е възможно да се определи честотата на повторение на определена ситуация и след това да се приложи стохастичният подход към проблема с вземането на решение.

Ако се използват смесени стратегии, тогава Критерий на Валдсе формулира по следния начин: смесената стратегия е оптимална осигуряване , т.е. максимизиране средна печалба(ако - печеля)

Критерият на Савидж за смесени стратегии : за оптимална смесена стратегия се счита тази, при която максималният среден риск на статист минимална, тоест стратегията , установено от условието .

Оптималните смесени стратегии в този случай се намират по същия начин, както в обичайната матрична игра.

Глава 2 Вземане на решения при несигурност

2.7. Критерий на Валд

Критерий на Валде най-"предпазлив". Според него оптималната алтернатива е тази, която осигурява най-добрия резултат сред всички възможни алтернативи при най-лошите обстоятелства.

Ако резултатите отразяват индикатори, които трябва да бъдат минимизирани (загуби, разходи, загуби и т.н.), тогава критерият на Wald се фокусира върху "минимакс"(минимум сред максималните стойности на загуба на всички алтернативи).

Ако резултатите от алтернативите включват показатели за печалба, доход и други показатели, които трябва да бъдат максимизирани (според принципа „колкото повече, толкова по-добре“), тогава "максимин"печалби (максимална сред минималните печалби). Тук и по-долу, за всички критерии в текста, ще разгледаме точно такъв случай, когато резултатът показва определена печалба.

Според критерия на Валд оценката на i-тата алтернатива е най-малката й печалба:

W i = min (x ij ), j = 1..M

Алтернативата с максимална най-лоша печалба се счита за оптимална:

Х* = Х k , W k = max (W i ) , i = 1..N

Пример за прилагане на критерия на Валд

Има два проекта X 1 и X 2 , които при три възможни сценария за развитие на региона (j=1..3 ) осигуряват различни печалби. Стойностите на печалбата са показани в таблица 2.2. Трябва да изберете проект за изпълнение.

Сред възможните проекти няма доминиращи нито абсолютно, нито като състояния. Следователно решението ще трябва да се вземе според критериите.

Ако изборът на оптимален проект се извършва съгласно критерия на Wald, тогава вземащият решение трябва да извърши следните действия:

1. Намерете минималните резултати за всяка алтернатива. Това ще бъдат стойностите на критерия Wald:

W 1 = min (x 1j), j = 1..3 => W 1 = min (45, 25, 50) = 25

W 2 = min (x 2j), j = 1..3 => W 2 = min (20, 60, 25) = 20

2. Сравнете стойностите на критерия Wald и намерете най-голямата стойност. Алтернатива с максималната стойност на критерияще се считат за оптимални:

25 > 20 => W 1 > W 2 => X* = X 1

Ако решението е взето само според критерия на Wald, лицето, вземащо решение, избира проект X 1 за изпълнение, тъй като печалбата, която този проект ще осигури сам по себе си слабо развитиеситуации по-горе.

Избирайки оптималната алтернатива според критерия на Wald, вземащият решение си гарантира, че при възможно най-лошите обстоятелства няма да получи по-малко от стойността на критерия. Следователно този индикатор също се нарича критерий за гарантиран резултат.

Основният проблем на критерия на Валд е неговият прекомерен песимизъм и в резултат на това не винаги логичен резултат. Така например, когато избирате според този критерий между алтернативи А (100; 500) и Б (90; 1000), трябва да спрете на вариант А. В реалния живот обаче би било по-логично да се избере B, тъй като в най-лошия случай B е само малко по-лошо от A, докато при добро стечение на обстоятелствата B осигурява много по-голяма печалба.

Критерий за съжаление. Критерий за очакване. Психология на поведението на LIRS в ситуации на риск и несигурност. Използване на теорията на полезността за избор на оптимално решение. Интуитивен избор на оптимален вариант.


КРИТЕРИЙ НА УАЛД (максимален критерий“)

Както се вижда от таблицата, оптималното алтернативно рисково решение при несигурност според критерия на Валд (максимален критерий) е в защрихованото поле и съответства на 140 арб. бърлога единици (тази стойност на ефективност е максималната от всичките й минимални стойности в най-лошия случай).

Критерият на Wald (критерий на "maximin") се ръководи от избора на рискови решения в условия на несигурност, като правило, субект, който не е склонен към риск или разглежда възможните ситуации като песимист.

Стойността на W е такава стойност на показателя W(x, y), че можем да се гарантираме при най-лошото поведение на природата за нас (гарантиран резултат). Ако приложим контрол x e X, различен от този, открит в формулирания проблем, природата може да ни накаже за несериозност, като избере най-лошата стойност на параметъра y, при която получаваме индекс W, по-малък от W. Този критерий за избор на решение е понякога се нарича още критерий на Wald.

Максималната оценка по критерия на Валд е единствената абсолютно надеждна при вземане на решение в условия на несигурност.

Стратегия S се нарича максимин, т.е. при всяко от пазарните условия резултатът няма да бъде по-лош от W = 49310,03 хиляди рубли. Следователно тази стойност се нарича най-ниската цена на играта или максимин, както и принципът на най-висок гарантиран резултат, базиран на критерия на Валд, според който оптималната стратегия за всяко състояние на околната среда, която позволява получаване на максимална печалба в най-лошите условия е стратегията maximin.

Критерият на Валд е критерий за краен песимизъм и ориентира вземащия решение към най-лошите условия за изпълнение на проекта.

Максимен критерий на Валд. Тук се избира решението на търговската организация, което гарантира максимална печалба при най-лошите условия на външната среда (естествено състояние)

Стратегията, съответстваща на максималната стойност сред минимумите на редовете, се нарича максимална стратегия. Съответният критерий (критерий на Wald) се записва като

С други думи, според критерия на Wald, оптималната стратегия е тази, за която най-малката печалба е най-голямата сред най-малките печалби на всички стратегии u. Стойността W(, i = 1...m се нарича индикатор за оптималността на стратегия А според критерия на Wald. Следователно,

Един от методите е да се избере най-доброто от най-лошите възможности (критерий на Валд). В този случай за всяка от стратегиите се избира най-лошият резултат, а след това най-добрият измежду тях. 108

Ако това доведе до стратегии със същите критерии на Wald, тогава те избират стратегията, която има най-малка чувствителност към външни условия "

Нарича се също максимален критерий на Валд. Същността на този критерий е следната. Лицето, което взема решение, разполага с различни стратегии (опции, алтернативи) за решаване на проблема

Поради това става необходимо да се определят възможните отклонения на получените резултати от техните оптимални стойности. Тук влиза в действие критерият на Савидж. Изборът на стратегия е подобен на избора на стратегия по принципа на Валд, с тази разлика, че играчът се ръководи не от матрицата на изплащане E, а от матрицата на риска R, построена по формула (2.2.2).

Най-голямо внимание Eg = max min e i j Критерий за гарантиран резултат (Wald)

А. Валд също доказа, че неговият критерий е значително по-изгоден (по отношение на средния брой наблюдения) от най-добрия от класическите критерии - критерия на Нойман-Пиърсън.

По-специално, максиминният критерий на Валд осигурява максимизиране на минималната печалба или, което е същото, минимизиране на максималната загуба, която може да бъде при изпълнението на една от стратегиите. Този критерий е прост и ясен, но консервативен в смисъл, че ориентира вземащия решение към прекалено предпазлива линия на поведение. Стойността, съответстваща на критерия maximin, се нарича долната цена на играта, която трябва да се разбира като максималната печалба, гарантирана в играта с даден противник чрез избор на една от неговите стратегии с минимални резултати.

Критерият на Wald (или критерият "maximin") предполага, че на всички настроики"матрица на решението" избира алтернативата, която от всички най-неблагоприятни ситуации на развитие на събитието (минимизиране на стойността на ефективността) има най-голямата от минималните стойности (т.е. стойността на ефективността, най-добрата

Максималният критерий на Wald се използва в случаите, когато се изисква гаранция, че изплащането при всякакви условия не е по-малко от най-голямото възможно при най-лошите условия. критерии на Хурвиц. Стойността му е в рамките на 0

Във формулата на този критерий има коефициент а, чиято стойност се определя в зависимост от степента на увереност на вземащия решение в правилността на неговия избор, кой сценарий на изпълнение на проекта трябва да бъде предпочетен). Стойността на a е избрана в диапазона от 0 до 1. При os=0 критерият на Хурвиц се превръща в критерий за краен оптимизъм, при os=1 - в критерий Wald. При 0, колкото по-голямо е желанието за "застраховане", толкова по-близо до 1 се избира коефициентът.

Тестът за вероятност е безпристрастен и последователен, с големи извадки -2-log X има разпределение hi-квадрат с r степени на свобода, където / е броят на параметрите p, специфичните стойности на които се определят от H0. Тестът за правдоподобие (LK) е еквивалентен на теста на Валд (W) и теста за умножение на Лагранж (LM) в асимптотично приближение, но за малки извадки W>LR>LM.

MAXIMIN е фокусиран върху получаване на гарантирана печалба при най-лошото състояние на външната среда (песимистичен подход, критерий на Wald). В съответствие с него за оптимална се избира алтернативата, която има максимална стойност на очаквания резултат при най-неблагоприятното състояние на околната среда. Тук решението е отказ от строителство.

Така критерият за гарантиран резултат (максималния критерий на Wald) се записва като

  • 2. Етапи на процеса на вземане на рационално управленско решение
  • 3. Методи за оптимизиране на решението
  • Лекция 3 Стратегически решения
  • 1. Стратегическо управление, основни принципи на стратегическото управление
  • 2.Технология за разработване на стратегически решения
  • Стратегически интереси в основата на разработването на стратегията на организацията
  • 3. Класификация на стратегиите
  • Лекция 4 Системен подход в процеса на разработване на управленски решения
  • 1. Концепцията за системен подход, неговите основни характеристики и принципи.
  • 2. Стойността на системния подход към управлението
  • 3. Системен подход при вземане на управленски решения, системен анализ
  • Лекция 5 Ситуационен анализ в процеса на разработване на управленски решения
  • 1. Ситуационен подход към управлението
  • 2. Етапи на ситуационен анализ
  • 3. Методи за ситуационен анализ
  • Лекция 6 Целева насоченост на управленските решения
  • 1. Целеполагане при избор на управленско решение
  • 2. Оценка на целите
  • 3. Инициативно-целенасочена технология
  • 4. Програмно-насочена технология
  • 5.Редовна технология
  • Лекция 7 Процесорни технологии за вземане на управленски решения
  • 1. Управление по резултати
  • 2. Управление на база потребности и интереси
  • 3.Управление чрез постоянни проверки и инструкции
  • Лекция 8 Информация за вземане на управленски решения
  • 1. Ролята на информацията в процеса на вземане на решения
  • 2. Същност на информационните системи и подходи за тяхното развитие
  • 3. Автоматизирана система за подпомагане вземането на управленски решения
  • Лекция 9 Методи за анализ и прогнозиране на управленски решения
  • 1. Концепцията за анализ, класификация на методите за анализ
  • 2. Методи за анализ
  • 3. Понятието прогноза и нейните задачи
  • 4. Видове прогнози, класификация на прогнозите
  • 5. Класификация на основните методи за прогнозиране
  • Лекция 10 Вземане на управленски решения при условия на сигурност
  • 1. Изложение на проблема за обосноваване на решения при условия на сигурност, основните етапи на разработване на решения при условия на сигурност.
  • Лекция 11 Вземане на управленски решения при несигурност
  • 2. Методи и технологии за вземане на решения в условия на "естествена" неопределеност
  • 3. Критерий на Лаплас, Валд, Савидж, Хурвиц
  • Това е най-предпазливият подход при вземане на решения и най-чувствителният към всички възможни рискове.
  • 4. Метод на теорията на игрите при вземане на решения при несигурност
  • Лекция 12 Вземане на управленски решения при риск
  • 1. Риск и неговите разновидности
  • 2. Управление на риска, методи за оценка на риска
  • 3. Критерии за вземане на решение при рискови условия
  • 4. Дървото на решенията като метод за вземане на управленски решения при риск
  • Лекция 13 Моделиране на процеса на разработване на управленско решение
  • 1. Концепцията и видовете модели
  • 2. Модели на процеса на разработване на управленско решение
  • 3. Специални модели за вземане на решения
  • Лекция 14 Количествени експертни оценки в процеса на разработване на управленски решения
  • 1. Същността на метода на експертните оценки и неговия обхват
  • 2. Количествени експертни оценки, техните методи
  • 3. Скали на количествени експертни измервания
  • Лекция 15 Качествени експертни оценки в процеса на разработване на управленски решения
  • 1. Качествени експертни оценки, техните методи
  • 2. Колективни методи на експертни оценки
  • Скали за качествени измервания:
  • Лекция 16 Качество и ефективност на управленските решения
  • 1. Качество на управленските решения
  • 2. Ефективност на управленските решения
  • 2. Методи за оценка на ефективността на управленските решения
  • Лекция 17 Изпълнение и контрол на изпълнението на управленски решения
  • 1. Същността и видовете контрол върху изпълнението на управленските решения
  • 2. Процесът на наблюдение на изпълнението на управленските решения
  • 3. Инструменти и характеристики на ефективен контрол върху изпълнението на управленските решения
  • Лекция 18 Управленски решения и отговорност на мениджърите за ур
  • 1. Концепцията за отговорност за резултатите от приемането и изпълнението на управленско решение.
  • 2. Социална отговорност на лидера
  • 3. Видове алгоритми за управление и вземане на решения.
  • Препоръчителна литература за самостоятелна работа на студентите
  • Речник на понятията
  • 3. Критерий на Лаплас, Валд, Савидж, Хурвиц

    Има няколко критерия за избор на оптимална стратегия при вземане на решение в условията на риск и несигурност.

    Критерий на Лаплас:се прилага, ако може да се приеме, че всички варианти на външни условия са еднакво вероятни. За всяко решение има среден рейтингза всички варианти на външни условия (средна печалба):

    където N е броят на състоянията на околната среда.

    където Z е оптимална стратегия.

    Критерий на Wald:(критерий за краен песимизъм, максиминен критерий): решението се избира въз основа на най-лошите външни условия. Вероятностите на природните състояния са неизвестни и няма начин да се получи статистическа информация за тях. Като оценка на всяко решение се използва минималната печалба, която може да бъде получена чрез избора на това решение:

    Най-доброто решение е това с най-висок резултат.

    Най-доброто решение е това с най-висок резултат.

    Според критерия на Валд се избира стратегия, която дава гарантирана печалба в най-лошия случай на природно състояние.

    Критерият на Савидж,подобно на критерия на Wald, той е критерий за краен песимизъм, но само песимизмът тук се проявява във факта, че максималната загуба на печалба е сведена до минимум. За оценка на решенията се използва матрица на риска. Като оценка се използва максималният риск (максимално загубена печалба), съответстващ на това решение:

    Най-доброто решение е това с най-нисък резултат.

    Това е най-предпазливият подход при вземане на решения и най-чувствителният към всички възможни рискове.

    Критерий на Хурвиц:решението се взема, като се има предвид, че са възможни както благоприятни, така и неблагоприятни външни условия. При използването на този критерий се изисква да се посочи "коефициент на песимизъм" - число в диапазона от 0 до 1, което е субективна (т.е. не изчислена, а посочена от човек) оценка за възможността от неблагоприятни външни условия. Ако има основание да се смята, че външните условия ще бъдат неблагоприятни, тогава коефициентът на песимизъм се приписва близък до единица. Ако неблагоприятните външни условия са малко вероятни, тогава се използва коефициент на песимизъм, близък до нула. Оценките на решението се намират по следната формула:

    където a е коефициентът на песимизъм.

    Най-доброто решение е това с най-висок резултат:

    В допълнение към критериите за оптималност, които могат да се използват при вземане на решение в условията на риск и несигурност, има много добре познат и широко разпространен метод на теорията на игрите, използван в управленските дейности при несигурност.

    4. Метод на теорията на игрите при вземане на решения при несигурност

    При вземане на решения в условия на несигурност методът на теорията на игрите е много широко използван. Теорията на игрите е математическа теория на конфликтните ситуации. Задачата на тази теория е да разработи препоръки за рационалния начин на действие на участниците в конфликта. В същото време се изгражда опростен модел на конфликтна ситуация, наречена игра. Под "игра" се има предвид събитие, състоящо се от поредица от действия или "ходове". Играта се различава от реалната конфликтна ситуация по това, че се провежда по точно определени правила. Страните, участващи в конфликта, се наричат ​​играчи, изходът от конфликта се нарича победа и т.н.

    Ако в играта се сблъскат интересите на две страни, тогава играта се нарича игра по двойки, ако има повече страни - многократна. Множествената игра с две постоянни коалиции превръща играта в игра на двойки. Най-голямо практическо значение имат игрите по двойки. Да разгледаме ограничена игра, в която играч А има m стратегии, а играч B има n стратегии. Такава игра се нарича m x n. Стратегиите, съответно, означаваме: A 1 , A 2 , ..., A m - за играч A; B 1 , B 2 , ..., B n - за играч B. Ако играта се състои само от лични ходове, тогава изборът на стратегии A i и B j от играчите еднозначно определя резултата от играта - нашето изплащане a ij Ако a ij са известни за всички комбинационни стратегии, те образуват матрица на изплащане с размер m x n, където: m е броят на редовете на матрицата, а n е броят на нейните колони.

    Принципът на предпазливостта, който диктува на играчите избора на подходящи стратегии (максимум и минимакс), е основният принцип в теорията на игрите и се нарича принцип на минимакс. В матрицата на печалбите на такава игра има елемент, който е едновременно минимален в реда си и максимум в колоната. Такъв елемент се нарича седловиден тънък елемент. Стойността v=ą=þ се нарича нетна цена на играта. В този случай решението на играта (съвкупността от оптимални стратегии на играчите) има следното свойство: ако един от играчите се придържа към оптималната си стратегия, тогава не може да бъде изгодно за другия да се отклони от оптималната си стратегия. Ако горната цена на играта не съвпада с долната, тогава в този случай си струва да се говори за игра в смесени стратегии. Смесената S A е използването на чисти стратегии А 1 ,А 2 ,…,А n с вероятност p 1 ,p 2 ,…,p n , а смесената стратегия S B е използването на чисти стратегии B 1 ,B 2 ,…,B n с вероятност p 1 ,p 2 ,…,p m . Нека играта има размерност 2 на 2 и е дадена от матрицата на изплащане:

    За играч А оптималната стратегия ще има вероятности:

    ;
    ; цена на играта

    Споделете с приятели или запазете за себе си:

    Зареждане...