Методы выбора альтернатив в условиях неопределенности. Задачи теории статистических решений

Близкой по идеям и методам к теории игр является теория статистических решений. От теории игр она отличается тем, что ситуация неопределенности не имеет конфликтной окраски – никто ни кому не противодействует, но налицо элемент неопределенности. В задачах теории статистических решений неизвестные условия операции зависят не от сознательно действующего противника, а от объективной действительности, которую в теории статистических решений принято называть “природой”. Соответствующие ситуации часто называют играми с природой (статистическими играми).

Часто эти ситуации вообще относят к теории игр, оговариваясь в определении игры, что одним из участников может быть среда (природа), действующая как сумма дезорганизующих обстоятельств, весь комплекс внешних условий, в которых игроку приходится принимать решение. Назовем этого игрока – статистиком.

Природа безразлична к выигрышу и не стремится обратить в свою пользу промахи статистика. Пусть статистик имеет m стратегий, а природа может реализовать n своих состояний. Если статистик имеет возможность оценить численно последствия каждой своей чистой стратегии при любом состоянии природы, то игру можно задать платежной матрицей. При упрощении платежной матрицы имеется специфика: нельзя отбрасывать те или иные стратегии “природы”, так как она может реализовать их вне зависимости от того, выгодны они статистику или нет.

При решении таких игр могут быть 2 ситуации:

· игроку А неизвестны вероятности pj , с которыми природа реализует свои состояния;

· вероятности pj известны.

Для принятия решения в таких играх используют различные критерии.

Если вероятности pj состояний природы неизвестны, то можно пользоваться критериями Вальда, Лапласа, Сэвиджа, Гурвица и пр. Основное различие между названными критериями определяется стратегией поведения лица, принимающего решение в условиях неопределенности. Например, критерий Лапласа основан на более оптимистичных предположениях, чем критерий Вальда. Критерий Гурвица можно использовать при различных подходах: от наиболее оптимистичного до наиболее пессимистичного. Таким образом, перечисленные критерии, несмотря на их количественную природу, отражают субъективную оценку ситуации, в которой статистику приходится принимать решение. К сожаленью, не существует общих правил оценки применимости того или иного критерия, так как поведение лица, принимающего решение, по всей видимости, является наиболее важным фактором при выборе подходящего критерия. Сформулируем эти критерии.

1. Критерий Лапласа

Этот критерий опирается на принцип недостаточного обоснования , по которому считается, что наступление всех состояний природы равновероятно, то есть p 1 = p 2 =...= p n =1/ n , а оптимальной считается стратегия Ai , обеспечивающая

. (5.1)

2. Критерий Вальда (минимаксный или максминный критерий )

Этот критерий является наиболее осторожным, поскольку основан на выборе наилучшей из наихудших возможностей:

– в случае нахождения выигрыша;

– в случае нахождения потерь.

Это пессимистические критерии.

3. Критерий Сэвиджа (минимаксного риска)

Критерий Вальда настолько пессимистичен, что может привести к нелогичным выводам. Рассмотрим следующую матрицу потерь, которая обычно приводится в качестве классического примера для обоснования “менее пессимистичного” критерия Сэвиджа.

11000

10000

10000

Применение минимаксного критерия приводит к выбору стратегии А2, хотя интуитивно можно выбрать А1, так как при этом выборе можно надеется проиграть 90, тогда как выбор А2 всегда приводит к потерям в 10000 единиц при любом состоянии погоды..

Критерий Сэвиджа “исправляет” положение введением новой матрицы потерь, в которой заменяются на font-size:14.0pt;line-height: 150%">, определяемые следующим образом:

Это означает, что есть разность между наилучшим значением в столбце j и значением .

По существу, выражает сожаление лица, принимающего решение, по поводу того, что он не выбрал наилучшего действия относительно состояния j . Матрица R =() ê называется матрицей сожаления или матрицей риска.

Найдем оптимальную стратегию предыдущей задачи по этому критерию:

.

Применим к матрице “сожаления” R минимаксный критерий. Получим, что оптимальной стратегией будет– А1.

Отметим, что независимо от того, – доход или потери, – всегда потери. Поэтому к матрице “сожаления” всегда применяется минимаксный критерий.

4. Критерий Гурвица (пессимизма-оптимизма)

Этот критерий охватывает ряд различных подходов к принятию решений: от наиболее оптимистичного до наиболее пессимистичного.

При оптимистичном подходе выбирают стратегию, дающую :

, если – выигрыш, и

, если – потери.

Аналогично при наиболее пессимистичных предположениях выбираемое решение соответствует : , если – выигрыш, и

font-size:14.0pt;line-height: 150%">, если – потери.

Критерий Гурвица устанавливает баланс между случаями крайнего оптимизма и пессимизма взвешиванием обоих способов поведения с соответствующими весами a и 1- a , где 0 £ a £ 1.

Если – прибыль, то выбирается стратегия по правилу:

Если – затраты, критерий выбирает стратегию, дающую

Параметр a интерпретируется как показатель оптимизма; при a =1 критерий слишком оптимистичный, при a =0 он слишком пессимистичный. Значение a между 0 и 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или оптимизму. a =0,5 представляется наиболее разумным.

Анализ практических ситуаций обычно проводится на основе нескольких критериев, что позволяет глубже исследовать суть явления.

Пример.

Одно из предприятий должно определить уровень предложения услуг так, чтобы удовлетворить потребности клиентов. Точное число клиентов не известно, но ожидается, что оно может принимать одно из следующих значений: 200, 250, 300, 350. Для каждого из этих возможных значений существует наилучший уровень предложения (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения предложения над спросом, либо из-за неполного удовлетворения спроса.

Потери в зависимости от ситуации приведены в следующей таблице:


Клиенты

Предложен.

a 1

a 2

a 3

a 4

· Критерий Вальда . Так как – потери, применяем минимаксный критерий.

Оптимальной стратегией будет А3.

· Критерий Лапласа . Пусть стратегии 2-го игрока равновероятны. Следовательно . Тогда:

EN-US">EN-US">EN-US">font-size:14.0pt;line-height:150%">Таким образом, наилучшим уровнем предложения в соответствии с критерием Лапласа будет стратегия А2.

· Критерий Сэвиджа . Построим матрицу риска:

position:absolute; z-index:2;left:0px;margin-left:68px;margin-top:21px;width:213px;height:2px">

Лучшая стратегия А2.

· Критерий Гурвица. Пусть a =1 / 2.

5/2+25/2=15

7/2+23/2=15

12/2+21/2=16,5

15/2+30/2=22,5

Лучшие стратегии А1 и А2.

Если находить решение методами теории игр, то сначала ищем наличие седловой точки:

Эта игра имеет седловую точку и оптимальной будет стратегия А3.

5. Критерий Байеса

Если вероятности состояний природы – pj известны, то можно пользоваться критерием Байеса, согласно которому:

оптимальной считается чистая стратегия, соответствующая максимальному среднему выигрышу: , если – выигрыш и минимальным средним потерям: , если –потери.

Если в предыдущем примере известны вероятности спроса font-size:14.0pt;line-height: 150%">, то для нахождения оптимальной стратегии необходимо найти средние потери для каждой чистой стратегии предприятия и выбрать ту, которая обеспечивает минимум средних потерь: font-size:14.0pt;line-height: 150%;font-family:Symbol">® стратегия А2.

Можно показать, что та стратегия, которая обращает в максимум средний выигрыш, обращает в минимум и средний риск.

Все рассмотренные критерии были сформулированы для чистых стратегий, но каждый из них может быть распространен и на смешанные стратегии, подобно тому, как это делается в теории игр. В теории статистических решений смешанные стратегии имеют смысл при многократном повторении игры.

Но многократно повторяя игру, можно определить частоты повторений той или иной ситуации и в дальнейшем применять стохастический подход к задаче принятия решений.

Если использовать смешанные стратегии, то критерий Вальда формулируется следующим образом: оптимальной будет смешанная стратегия , обеспечивающая , т. е. максимизирующая средний выигрыш (если –выигрыш)

Критерий Сэвиджа для смешанных стратегий : оптимальной считается та смешанная стратегия, при которой максимальный средний риск статистика минимален, то есть стратегия , найденная из условия .

Оптимальные смешенные стратегии в этом случае находятся также, как в обычной матричной игре.

Глава 2. Принятие решений в условиях неопределенности

2.7. Критерий Вальда

Критерий Вальда является самым "осторожным". Согласно ему, оптимальной альтернативой будет та, которая обеспечивает наилучший исход среди всех возможных альтернатив при самом плохом стечении обстоятельств.

Если исходы отражают подлежащие минимизации показатели (убытки, расходы, потери и т.д.), то критерий Вальда ориентируется на "минимакс" (минимум среди максимальных значений потерь всех альтернатив).

Если в качестве исходов альтернатив фигурируют показатели прибыли, дохода и других показателей, которые надо максимизировать (по принципу "чем больше, тем лучше"), то ищется "максимин" выигрыша (максимум среди минимальных выигрышей). Здесь и далее для всех критериев в тексте мы будем рассматривать именно такой случай, когда исход показывает некий выигрыш.

По критерию Вальда оценкой i -й альтернативы является ее наименьший выигрыш:

W i = min (x ij ) , j = 1..M

Оптимальной признается альтернатива с максимальным наихудшим выигрышем:

Х* = Х k , W k = max (W i ) , i = 1..N

Пример применения критерия Вальда

Есть два проекта Х 1 и Х 2 , которые при трех возможных сценариях развития региона (j=1..3) обеспечивают разную прибыль. Значения прибыли приведены в таблице 2.2. Необходимо выбрать проект для реализации.

Среди возможных проектов нет доминирующих ни абсолютно, ни по состояниям. Поэтому решение придется принимать по критериям.

Если выбор оптимального проекта осуществляется по критерию Вальда, то ЛПР должен выполнить следующие действия:

1. Найти минимальные исходы для каждой альтернативы. Это и будут значения критерия Вальда:

W 1 = min (x 1j), j = 1..3 => W 1 = min (45, 25, 50) = 25

W 2 = min (x 2j), j = 1..3 => W 2 = min (20, 60, 25) = 20

2. Сравнить значения критерия Вальда и найти наибольшую величину. Альтернатива с максимальным значением критерия будет считаться оптимальной:

25 > 20 => W 1 > W 2 => X* = X 1

Если бы решение принималось только по критерию Вальда, ЛПР выбрал для реализации проект Х 1 , поскольку прибыль, которую обеспечит данный проект при самом плохом развитии ситуации, выше.

Выбрав оптимальную альтернативу по критерию Вальда, ЛПР гарантирует себе, что при самом плохом стечении обстоятельств он не получит меньше, чем значение критерия. Поэтому данный показатель еще называют критерием гарантированного результата .

Основной проблемой критерия Вальда является его излишняя пессимистичность, и, как следствие, не всегда логичный результат. Так, например, при выборе по данному критерию между альтернативами А{100; 500} и В{90; 1000} следует остановиться на варианте А . Однако в жизни логичнее было бы выбрать В , так как в худшем случае В лишь немного хуже А , тогда как при хорошем стечении обстоятельств В обеспечивает гораздо больший выигрыш.

Критерий сожаления. Критерий математического ожидания . Психология поведения ЛИР в ситуациях риска и неопределенности. Использование теории полезности для выбора оптимального варианта решения. Интуитивный выбор оптимального варианта.  


КРИТЕРИЙ ВАЛЬДА (критерий максимина")  

Как видно из приведенной таблицы, оптимальная альтернатива рискового решения в условиях неопределенности по критерию Вальда (критерию "максимина") находится в затененном поле и соответствует 140 усл. ден. ед. (это значение эффективности является максимальным из всех минимальных ее значений при наихудших вариантах ситуаций).  

Критерием Вальда (критерием "максимина") руководствуется при выборе рисковых решений в условиях неопределенности , как правило, субъект, не склонный к риску или рассматривающий возможные ситуации как пессимист.  

Величина W - это такое значение показателя W(x, у), которое мы можем гарантировать себе при наихудшем для нас поведении природы (гарантированный результат). Если мы применим управление х е X, отличное от найденного в сформулированной задаче, природа -может наказать нас за легкомыслие, выбрав наихудшее значение параметра у, при котором мы получим показатель W, меньший W. Этот критерий выбора решения иногда называют также критерием Вальда.  

Максиминная оценка по критерию Вальда является единственной абсолютно надежной при принятии решения в условиях неопределенности.  

Стратегия S называется максиминной, т.е. при любом из условий конъюнктуры рынка результат будет не хуже, чем W = 49310,03 тыс. руб. Поэтому эту величину называют нижней ценой игры , или максимином, а также принципом наибольшего гарантированного результата на основе критерия Вальда, в соответствии с которым оптимальной стратегией при любом состоянии среды, позволяющем получить максимальный выигрыш в наихудших условиях, является максиминная стратегия.  

Критерий Вальда представляет собой критерий крайнего пессимизма и ориентирует лицо, принимающее решение, на наихудшие условия реализации проекта.  

Максиминный критерий Вальда. Здесь выбирается решение торговой организации, при котором гарантируется максимальный выигрыш в наихудших условиях внешней среды (состояния природы)  

Стратегия, соответствующая максимальному значению среди минимумов строк, называется максиминной стратегией . Соответствующий критерий (критерий Вальда) записывается так  

Другими словами, оптимальной по критерию Вальда будет та стратегия, при которой наименьший выигрыш является наибольшим среди наименьших выигрышей всех стратеги и. Величину W(, i = 1...m назовем показателем оптимальности стратегии А по критерию Вальда. Значит,  

Один из методов заключается в выборе наилучшей из худших возможностей (критерий Вальда). При этом для каждой из стратегий выбирается худший результат, а затем из них - лучший. 108  

Если при этом получаются стратегии с одинаковыми критериями Вальда, то из них выбирают стратегию, которая имеет наименьшую чувствительность ко внешним условиям "  

Его также называют максиминным критерием Вальда. Сущность данного критерия заключается в следующем. ЛПР располагает множеством стратегий (вариантов, альтернатив) решения проблемы  

Поэтому возникает необходимость определения возможных отклонений полученных результатов от их оптимальных значений. Здесь находит применение критерий Сэвиджа . Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей Е, а матрицей рисков R, построенной по формуле (2.2.2).  

Наибольшая осторожность Ег = max min е i j Критерий гарантированного результата (Вальда)  

А. Вальд также доказал, что его критерий существенно выгоднее (по среднему числу наблюдений), чем наилучший из классических критериев - критерий Неймана-Пирсона.  

В частности, максиминный критерий Вальда обеспечивает максимизацию минимального выигрыша или, что то же самое, минимизацию максимальных потерь , которые могут быть при реализации одной из стратегий. Данный критерий прост и четок, но консервативен в том смысле, что ориентирует принимающего решение на слишком осторожную линию поведения. Величина, соответствующая максиминному критерию, называется нижней ценой игры , под которой следует подразумевать максимальный выигрыш, гарантируемый в игре с данным противником выбором одной из своих стратегий при минимальных результатах.  

Критерий Вальда (или критерий "максимина") предполагает, что из всех возможных вариантов "матрицы решений " выбирается та альтернатива, которая из всех самых неблагоприятных ситуаций развития события (минимизирующих значение эффективности) имеет наибольшее из минимальных значений (т.е. значение эффективности, луч-  

Максиминный критерий Вальда используется в случаях, когда требуется гарантия, чтобы выигрыш в любых условиях оказывался не менее чем наибольший из возможных в худших условиях.  критерии Гурвица . Его значение находится в пределах 0

В формуле этого критерия присутствует коэффициент а, значение которого устанавливается в зависимости от степени уверенности лица, принимающего решение, в правильности своего выбора, какому сценарию реализации проекта следует отдать предпочтение). Значение а выбирается в интервале от 0 до 1. При ос=0 критерий Гурвица превращается в критерий крайнего оптимизма при ос=1 - в критерий Вальда. При 0, тем большее желание "подстраховаться", тем ближе к 1 выбирается коэффициент.  

Критерий правдоподобия является несмещенным и состоятельным, при больших выборках -2-log X имеет распределение хи-квадрат (hi-squared distribution) с г степенями свободы , где / - число параметров р, конкретные значения которых определяет Н0. Критерий правдоподобия (LK) эквивалентен критерию Вальда (W) и критерию множителя Лагранжа (LM) при асимптотическом приближении, однако при малых выборках W>LR>LM.  

MAXIMIN- ориентирован на получение гарантированного выигрыша при наихудшем состоянии внешней среды (подход пессимиста, критерий Вальда). В соответствии с ним в качестве оптимальной выбирается альтернатива, имеющая максимальное значение ожидаемого результата в наименее благоприятном состоянии среды. Здесь решение - отказ от строительства.  

Таким образом, критерий гарантированного результата (мак-симинный критерий Вальда) записывается в виде  

  • 2. Этапы процесса принятия рационального управленческого решения
  • 3. Методы оптимизации решений
  • Лекция 3 Стратегические решения
  • 1. Стратегическое управление, основные принципы стратегического управления
  • 2.Технология выработки стратегических решений
  • Стратегические интересы, лежащие в основе выработки стратегии организации
  • 3. Классификация стратегий
  • Лекция 4 Системный подход в процессе разработки управленческих решений
  • 1. Понятие системного подхода, его основные черты и принципы.
  • 2. Значение системного подхода в управлении
  • 3. Системный подход при принятии управленческих решений, системный анализ
  • Лекция 5 Ситуационный анализ в процессе разработки управленческих решений
  • 1. Ситуационный подход в управлении
  • 2. Этапы ситуационного анализа
  • 3.Методы сиуационного анализа
  • Лекция 6 Целевая ориентация управленческих решений
  • 1. Целеполагание при выборе управленческого решения
  • 2. Оценивание целей
  • 3. Инициативно-целевая технология
  • 4. Программно-целевая технология
  • 5.Регламентная технология
  • Лекция 7 Процессорные технологии принятия управленческих решений
  • 1. Управление по результатам
  • 2. Управление на базе потребностей и интересов
  • 3.Управление путем постоянных проверок и указаний
  • Лекция 8 Информация для принятия управленческих решений
  • 1. Роль информации в процессе принятия решения
  • 2. Сущность информационных систем и подходы к их разработке
  • 3. Автоматизированная система поддержки управленческих решений
  • Лекция 9 Методы анализа и прогнозирования управленческих решений
  • 1. Понятие анализа, классификация методов анализа
  • 2. Приемы анализа
  • 3. Понятие прогнозирования и его задачи
  • 4. Виды прогнозов, классификация прогнозов
  • 5. Классификация основных методов прогнозирования
  • Лекция 10 Принятие управленческих решений в условиях определенности
  • 1. Постановка задачи обоснования решений в условиях определенности, основные этапы разработки решений в условиях определенности.
  • Лекция 11 Принятие управленческих решений в условиях неопределенности
  • 2. Методы и технологии принятия решений в условиях «природной» неопределенности
  • 3. Критерий Лапласа, Вальда, Сэвиджа, Гурвица
  • Это наиболее осторожный подход к принятию решений и наиболее учитывающий все возможные риски.
  • 4. Метод теории игр при принятии решений в условиях неопределенности
  • Лекция 12 Принятие управленческих решений в условиях риска
  • 1. Риск и его разновидности
  • 2.Управления рисками, способы оценки рисков
  • 3. Критерии принятия решения в условиях риска
  • 4. Дерево решений как метод принятия управленческих решений в условиях риска
  • Лекция 13 Моделирование процесса разработки управленческого решения
  • 1. Понятие и виды моделей
  • 2. Модели процесса разработки управленческого решения
  • 3. Специальные модели принятия решений
  • Лекция 14 Количественные экспертные оценки в процессе разработки управленческих решений
  • 1. Сущность метода экспертных оценок и его область применения
  • 2. Количественные экспертные оценки, их методы
  • 3. Шкалы количественных экспертных измерений
  • Лекция 15 Качественные экспертные оценки в процессе разработки управленческих решений
  • 1. Качественные экспертные оценки, их методы
  • 2.Коллективные методы экспертных оценок
  • Шкалы качественных измерений:
  • Лекция 16 Качество и эффективность управленческих решений
  • 1.Качество управленческих решений
  • 2. Эффективность управленческих решений
  • 2. Методы оценки эффективности управленческих решений
  • Лекция 17 Реализация и контроль выполнения управленческих решений
  • 1. Сущность и виды контроля реализации управленческих решений
  • 2.Процесс контроля реализации управленческих решений
  • 3. Инструменты и характеристики эффективного контроля реализации управленческих решений
  • Лекция 18 Управленческие решения и ответственность руководителей за ур
  • 1.Понятие ответственности за результаты принятия и исполнения управленческого решения.
  • 2. Социальная ответственность руководителя
  • 3. Типы менеджмента и алгоритмы принятия решений.
  • Рекомендуемая литература для самостоятельной работы студентов
  • Словарь понятий
  • 3. Критерий Лапласа, Вальда, Сэвиджа, Гурвица

    Существует несколько критериев для выбора оптимальной стратегии при принятии решения в условиях риска и неопределенности.

    Критерий Лапласа: применяется, если можно предполагать, что все варианты внешних условий одинаково вероятны. Для каждого решения находится средняя оценка по всем вариантам внешних условий (средний выигрыш):

    где N– количество состояний внешней среды.

    где Z – оптимальная стратегия.

    Критерий Вальда: (критерий крайнего пессимизма, максиминный критерий): решение выбирается в расчете на наихудшие внешние условия. Вероятности состояний природы неизвестны и нет возможности получить о них какую-либо статистическую информацию. В качестве оценки каждого решения используется минимальный выигрыш, который можно получить при выборе этого решения:

    Лучшим является решение с максимальной оценкой.

    Лучшим является решение с максимальной оценкой.

    По критерию Вальда выбирают стратегию, которая дает гарантированный выигрыш при наихудшем варианте состояния природы.

    Критерий Сэвиджа, как и критерий Вальда, - это критерий крайнего пессимизма, но только пессимизм здесь проявляется в том, что минимизируется максимальная поте­ря в выигрыше. Для оценки решений используется матрица рисков. В качестве оценки используется максимальный риск (максимальный потерянный выигрыш), соответствующий данному решению:

    Лучшим является решение с минимальной оценкой.

    Это наиболее осторожный подход к принятию решений и наиболее учитывающий все возможные риски.

    Критерий Гурвица: решение принимается с учетом того, что возможны как благоприятные, так и неблагоприятные внешние условия. При использовании этого критерия требуется указать «коэффициент пессимизма» – число в диапазоне от 0 до 1, представляющее собой субъективную (т.е. не рассчитанную, а указанную человеком) оценку возможности неблагоприятных внешних условий. Если есть основания предполагать, что внешние условия будут неблагоприятными, то коэффициент пессимизма назначается близким к единице. Если неблагоприятные внешние условия маловероятны, то используется коэффициент пессимизма, близкий к нулю. Оценки решений находятся по следующей формуле:

    где a – коэффициент пессимизма.

    Лучшим является решение с максимальной оценкой:

    Кроме критериев оптимальности, которые можно применять при принятии решения в условиях риска и неопределенности, существует очень известный и распространенный метод теории игр, используемый в управленческой деятельности в условиях неопределенности.

    4. Метод теории игр при принятии решений в условиях неопределенности

    При принятии решений в условиях неопределенности очень широко используется метод теории игр. Теория игр – это математическая теория конфликтных ситуаций. Задача этой теоpии – выработка рекомендаций по рациональному образу действий участников конфликта. При этом строят упрошенную модель конфликтной ситуации, называемую игрой. Под «игрой» понимают мероприятие, состоящее из ряда действий или «ходов». От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Сторо­ны, участвующие в конфликте, называют игроками, исход конфликта - выигрышем и т.д.

    Если в игре сталкиваются интересы двух сторон, то игра называется парной, если сторон больше - множествен­ной. Множественная игра с двумя постоянными коалициями обращает игру в парную. Наибольшее практическое значе­ние имеют парные игры. Рассматрим конечную игру, в которой игрок А имеет m стратегий, а игрок В - n стратегий. Та­кая игра называется m x n. Стратегии, соответственно, обозначим: А 1 , А 2 , ..., А m - для игрока А; В 1 , В 2 , ..., В n - для игрока В. Если игра состоит только из личных ходов, то выбор стратегий А i и В j игроками однозначно определяет исход игры - наш выигрыш a ij Если известны a ij для всех сочетаний стратегий, то они образуют платежную матрицу размером m x п, где: m - число строк матрицы, а n - число его столбцов.

    Принцип осторожности, диктующий игрокам выбор соответствующих стратегий (максиминной и минимаксной), является в теории игр основным принципом и называется принципом минимакса. В платежной матрице такой игры существует элемент, являющийся одновременно минимальным в своей строке и максимальным в своем столбце. Такой элемент назы­вают седловой тонкой. При этом значение v=ą=þ назы­вают чистой ценой игры. В этом случае решение игры (совокупность оптимальных стратегий игроков) обладает следующим свойством: если один из игроков придерживает­ся своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной страте­гии . Если верхняя цена игры не совпадает с нижней, то в этом случае стоит говорить об игре в смешанных стратегиях. Смешанной S A называется применение чистых стратегий А 1 ,А 2 ,…,А n с вероятностью p 1 ,p 2 ,…,p n , а смешанной стратегией S B - применение чистых стратегий B 1 ,B 2 ,…,B n с вероятностью p 1 ,p 2 ,…,p m . Пусть игра имеет размерность 2 на 2 и задается платежной матрицей:

    Для игрока А оптимальная стратегия будет иметь вероятности:

    ;
    ; цена игры

    Поделитесь с друзьями или сохраните для себя:

    Загрузка...