Методи вибору альтернатив за умов невизначеності. Завдання теорії статистичних рішень

Близькою за ідеями та методами до теорії ігор є теорія статистичних рішень. Від теорії ігор вона відрізняється тим, що ситуація невизначеності не має конфліктного забарвлення - ніхто ні кому не протидіє, але є елементом невизначеності. У завданнях теорії статистичних рішень невідомі умови операції залежать немає від свідомо чинного противника, як від об'єктивної дійсності, що у теорії статистичних рішень прийнято називати “природою”. Відповідні ситуації часто називають іграми із природою (статистичними іграми).

Часто ці ситуації взагалі відносять до теорії ігор, застерігаючи у визначенні гри, що з учасників може бути середовище (природа), що діє як сума дезорганізуючих обставин, весь комплекс зовнішніх умов, у яких гравцю доводиться приймати рішення. Назвемо цього гравця – статистиком.

Природа байдужа до виграшу і прагне звернути на користь промахи статистика. Нехай статистика маєmстратегій, а природа може реалізуватиnсвоїх станів. Якщо статистик має можливість оцінити чисельно наслідки кожної своєї чистої стратегії за будь-якого стану природи, гру можна задати платіжної матрицею. При спрощенні платіжної матриці є специфіка: не можна відкидати ті чи інші стратегії “природи”, оскільки може реалізувати їх незалежно від цього, вигідні вони статистику чи ні.

При вирішенні таких ігор можуть бути 2 ситуації:

· гравцю А невідомі ймовірностіpj, з якими природа реалізує свої статки;

· ймовірності pjвідомі.

Для ухвалення рішення у таких іграх використовують різні критерії.

Якщо ймовірностіpj станів природи невідомі, можна користуватися критеріями Вальда, Лапласа, Севіджа, Гурвіца тощо. Основне різницю між названими критеріями визначається стратегією поведінки особи, приймає рішення за умов невизначеності. Наприклад, критерій Лапласа ґрунтується на більш оптимістичних припущеннях, ніж критерій Вальда. Критерій Гурвіца можна використовувати при різних підходах: від найбільш оптимістичного до песимістичного. Отже, перелічені критерії, попри їх кількісну природу, відбивають суб'єктивну оцінку ситуації, у якій статистику доводиться приймати рішення. На жаль, не існує загальних правилоцінки застосовності тієї чи іншої критерію, оскільки поведінка особи, приймає рішення, очевидно, є найважливішим чинником під час виборів відповідного критерію. Сформулюємо ці критерії.

1. Критерій Лапласа

Цей критерій спирається на принцип недостатнього обґрунтування, за яким вважається, що настання всіх станів природи рівноймовірне, тобтоp 1 = p 2 =...= p n = 1/ n, а оптимальною вважається стратегія Ai , що забезпечує

. (5.1)

2. Критерій Вальда (мінімаксний чи максмінний критерій) )

Цей критерій є найбільш обережним, оскільки ґрунтується на виборі найкращої з найгірших можливостей:

– у разі перебування виграшу;

– у разі знаходження втрат.

Це песимістичні критерії.

3. Критерій Севіджа (мінімаксного ризику)

Критерій Вальда настільки песимістичний, що може призвести до нелогічних висновків. Розглянемо наступну матрицю втрат, яка зазвичай наводиться як класичний приклад для обґрунтування “менш песимістичного” критерію Севіджа.

11000

10000

10000

Застосування мінімаксного критерію призводить до вибору стратегії А2, хоча інтуїтивно можна вибрати А1, тому що при цьому виборі можна сподіватися програти 90, тоді як вибір А2 завжди призводить до втрат 10000 одиниць за будь-якого стану погоди.

Критерій Севіджа “виправляє” положення запровадженням нової матриці втрат, у якійзамінюються на font-size:14.0pt;line-height: 150%">, що визначаються таким чином:

Це означає, щоє різниця між найкращим значенняму стовпціj і значенням.

По суті, висловлює співчуття особи, яка приймає рішення, з приводу того, що вона не вибрала найкращої дії щодо стануj . Матриця R =() ê називається матрицею жалю чи матрицею ризику.

Знайдемо оптимальну стратегію попереднього завдання за цим критерієм:

.

Застосуємо до матриці “жалі” R мінімаксний критерій. Отримаємо, що оптимальною стратегією буде - А1.

Зазначимо, що незалежно від того,- Дохід або втрати,- Завжди втрати. Тому до матриці "жалю" завжди застосовується мінімаксний критерій.

4. Критерій Гурвіца (песимізму-оптимізму)

Цей критерій охоплює низку різних підходів до прийняття рішень: від найоптимістичнішого до найбільш песимістичного.

При оптимістичному підході вибирають стратегію, що дає :

, якщо – виграш, та

якщо – втрати.

Аналогічно при найбільш песимістичних припущеннях вибирається рішення відповідає: , якщо – виграш, та

font-size:14.0pt;line-height: 150%">, якщо – втрати.

Критерій Гурвіца встановлює баланс між випадками крайнього оптимізму та песимізму зважуванням обох способів поведінки з відповідними вагами a і 1- a , де 0 £ a £ 1.

Якщо - Прибуток, то вибирається стратегія за правилом:

Якщо - Витрати, критерій вибирає стратегію, що дає

Параметр a інтерпретується як показник оптимізму;при a =1 критерій занадто оптимістичний, при a =0 він занадто песимістичний. Значення a між 0 і 1 може визначатися в залежності від схильності особи, яка приймає рішення, до песимізму або оптимізму. a =0,5 є найбільш розумним.

Аналіз практичних ситуацій зазвичай проводиться з урахуванням кількох критеріїв, що дозволяє глибше досліджувати суть явища.

приклад.

Одне з підприємств має визначити рівень пропозиції послуг, щоб задовольнити потреби клієнтів. Точне число клієнтів невідоме, але очікується, що може приймати одне з наступних значень: 200, 250, 300, 350. Для кожного з цих можливих значень існує найкращий рівень пропозиції (з точки зору можливих витрат). Відхилення від цих рівнів призводять до додаткових витрат через перевищення пропозиції над попитом, або через неповне задоволення попиту.

Втрати в залежності від ситуації наведені в таблиці:


Клієнти

Запропоновано.

a 1

a 2

a 3

a 4

· Критерій Вальда. Так як - Втрати, застосовуємо мінімаксний критерій.

Оптимальною стратегією буде А3.

· Критерій Лапласа. Нехай стратегії 2-го гравця є рівноймовірними. Отже. Тоді:

EN-US">EN-US">EN-US">font-size:14.0pt;line-height:150%">Таким чином, найкращим рівнемпропозиції відповідно до критерію Лапласа буде стратегія А2.

· Критерій Севіджа . Побудуємо матрицю ризику:

position:absolute; z-index:2;left:0px;margin-left:68px;margin-top:21px;width:213px;height:2px">

Найкраща стратегія А2.

· Критерій Гурвіца. Нехай a = 1/2.

5/2+25/2=15

7/2+23/2=15

12/2+21/2=16,5

15/2+30/2=22,5

Найкращі стратегії А1 та А2.

Якщо знаходити рішення методами теорії ігор, то спочатку шукаємо наявність сідлової точки:

Ця гра має сідлову точку та оптимальною буде стратегія А3.

5. Критерій Байєса

Якщо ймовірність станів природи– pj відомі, то можна користуватися критерієм Байєса, згідно з яким:

оптимальною вважається чиста стратегія, що відповідає максимальному середньому виграшу: , якщо – виграш та мінімальні середні втрати: , якщо -Втрати.

Якщо у попередньому прикладі відомі ймовірності попиту font-size:14.0pt;line-height: 150%">, то для знаходження оптимальної стратегії необхідно знайти середні втрати для кожної чистої стратегії підприємства та вибрати ту, яка забезпечує мінімум середніх втрат: font-size:14.0pt;line-height : 150%;font-family:Symbol">® стратегія А2.

Можна показати, що та стратегія, яка обертає максимум середній виграш, звертає в мінімум і середній ризик.

Всі розглянуті критерії були сформульовані для чистих стратегій, але кожен з них може бути поширений і на змішані стратегії, подібно до того, як це робиться в теорії ігор. Теоретично статистичних рішень змішані стратегії мають сенс при багаторазовому повторенні гри.

Але багаторазово повторюючи гру, можна визначити частоти повторень тієї чи іншої ситуації та надалі застосовувати стохастичний підхід до завдання прийняття рішень.

Якщо використати змішані стратегії, то критерій Вальдаформулюється так: оптимальною буде змішана стратегія , що забезпечує , Т. е. максимізує середній виграш(якщо -Виграш)

Критерій Севіджа для змішаних стратегій : оптимальною вважається та змішана стратегія, за якої максимальний середній ризик статистика мінімальний, тобто стратегія , знайдена з умови .

Оптимальні змішані стратегії в цьому випадку знаходяться так само, як у звичайній матричній грі.

Глава 2. Прийняття рішень за умов невизначеності

2.7. Критерій Вальда

Критерій Вальдає "обережним". Згідно з ним, оптимальною альтернативою буде та, яка забезпечує найкращий результат серед усіх можливих альтернатив при найгіршому збігу обставин.

Якщо результати відображають показники, що підлягають мінімізації (збитки, витрати, втрати і т.д.), то критерій Вальда орієнтується на "мінімакс"(Мінімум серед максимальних значень втрат усіх альтернатив).

Якщо як результати альтернатив фігурують показники прибутку, доходу та інших показників, які треба максимізувати (за принципом "чим більше, тим краще"), то шукається "максимін"виграшу (максимум серед мінімальних виграшів). Тут і надалі для всіх критеріїв у тексті ми розглядатимемо саме такий випадок, коли результат показує якийсь виграш.

За критерієм Вальда оцінкою i-ї альтернативи є її найменший виграш:

W i = min (x ij), j = 1..M

Оптимальною визнається альтернатива з максимальним найгіршим виграшем:

Х * = Х k , W k = max (W i ) , i = 1.

Приклад застосування критерію Вальда

Є два проекти Х 1 і Х 2 які при трьох можливих сценаріях розвитку регіону (j=1..3 ) забезпечують різний прибуток. Значення прибутку наведено у таблиці 2.2. Потрібно вибрати проект для реалізації.

Серед можливих проектів немає домінуючих ані абсолютно, ані за станами. Тому рішення доведеться ухвалювати за критеріями.

Якщо вибір оптимального проекту здійснюється за критерієм Вальда, то ЛПР має виконати такі дії:

1. Знайти мінімальні результати кожної альтернативи. Це і будуть значення критерію Вальда:

W 1 = min (x 1j), j = 1..3 => W 1 = min (45, 25, 50) = 25

W 2 = min (x 2j), j = 1..3 => W 2 = min (20, 60, 25) = 20

2. Порівняти значення критерію Вальда та знайти найбільшу величину. Альтернатива з максимальним значенням критеріюбуде вважатися оптимальною:

25 > 20 => W 1 > W 2 => X * = X 1

Якби рішення приймалося лише за критерієм Вальда, ЛПР вибрав для реалізації проект Х 1 , оскільки прибуток, який забезпечить цей проект за самого поганий розвитокситуації вище.

Вибравши оптимальну альтернативу за критерієм Вальда, ЛПР гарантує собі, що при найгіршому збігу обставин він не отримає менше, ніж значення критерію. Тому цей показник ще називають критерієм гарантованого результату.

Основною проблемою критерію Вальда є його зайва песимістичність і, як наслідок, не завжди логічний результат. Так, наприклад, при виборі даного критерію між альтернативами А(100; 500) і В(90; 1000) слід зупинитися на варіанті А . Однак у житті логічніше було б вибрати В, тому що в гіршому випадку лише трохи гірше А, тоді як при хорошому збігу обставин В забезпечує набагато більший виграш.

Критерій жалю. Критерій математичного очікування. Психологія поведінки ЛІР у ситуаціях ризику та невизначеності. Використання теорії корисності для вибору оптимального варіанта розв'язання. Інтуїтивний вибір оптимального варіанта.


КРИТЕРІЙ ВАЛЬДА (критерій максиміну)

Як очевидно з наведеної таблиці, оптимальна альтернатива ризикового рішення за умов невизначеності за критерієм Вальда (критерію " максимина " ) перебуває у затіненому полі відповідає 140 ум. ден. од. (Це значення ефективності є максимальним із усіх мінімальних її значень при найгірших варіантах ситуацій).

Критерієм Вальда (критерієм "максиміну") керується при виборі ризикових рішень в умовах невизначеності, як правило, суб'єкт, який не схильний до ризику або розглядає можливі ситуації як песиміст.

Величина W - це значення показника W(x, у), що ми можемо гарантувати собі за найгіршому нам поведінці природи (гарантований результат). Якщо ми застосуємо управління х е X, відмінне від знайденого у сформульованій задачі, природа може покарати нас за легковажність, вибравши найгірше значення параметра у, при якому ми отримаємо показник W, менший W. Цей критерій вибору рішення іноді називають також критерієм Вальда.

Максиминна оцінка за критерієм Вальда є єдиною абсолютно надійною при ухваленні рішення за умов невизначеності.

Стратегія S називається максимінною, тобто. за будь-якої з умов кон'юнктури ринку результат буде не гірше, ніж W = 49310,03 тис. руб. Тому цю величину називають нижньою ціною гри або максиміном, а також принципом найбільшого гарантованого результату на основі критерію Вальда, відповідно до якого оптимальною стратегією за будь-якого стану середовища, що дозволяє отримати максимальний виграш у найгірших умовах, є максиминна стратегія.

Критерій Вальда є критерієм крайнього песимізму і орієнтує особу, яка приймає рішення, на найгірші умови реалізації проекту.

Максимальний критерій Вальда. Тут вибирається рішення торгової організації, у якому гарантується максимальний виграш у найгірших умовах довкілля (стану природи)

Стратегія, що відповідає максимальному значенню серед мінімумів рядків, називається максимінною стратегією. Відповідний критерій (критерій Вальда) записується так

Іншими словами, оптимальною за критерієм Вальда буде та стратегія, за якої найменший виграш є найбільшим серед найменших виграшів усіх стратегій. Величину W(, i = 1...m назвемо показником оптимальності стратегії А за критерієм Вальда. Значить,

Один з методів полягає у виборі найкращої з найгірших можливостей (критерій Вальда). При цьому для кожної зі стратегій вибирається найгірший результат, а потім з них – найкращий. 108

Якщо при цьому виходять стратегії з однаковими критеріями Вальда, то їх вибирають стратегію, яка має найменшу чутливість до зовнішніх умов.

Його також називають максимінним критерієм Вальда. Сутність цього критерію полягає в наступному. ЛПР має у своєму розпорядженні безліч стратегій (варіантів, альтернатив) вирішення проблеми

Тому виникає необхідність визначення можливих відхилень отриманих результатів від них оптимальних значень. Тут знаходить застосування критерій Севіджа. Вибір стратегії аналогічний до вибору стратегії за принципом Вальда з тією відмінністю, що гравець керується не матрицею виграшів Е, а матрицею ризиків R, побудованою за формулою (2.2.2).

Найбільша обережність Ег = max min е i j Критерій гарантованого результату (Вальда)

А. Вальд також довів, що його критерій значно вигідніше (за середнім числом спостережень), ніж найкращий із класичних критеріїв - критерій Неймана-Пірсона.

Зокрема, максимінний критерій Вальда забезпечує максимізацію мінімального виграшу або, що те саме, мінімізацію максимальних втрат, які можуть бути при реалізації однієї зі стратегій. Цей критерій простий і чіткий, але консервативний тому, що орієнтує приймаючого рішення надто обережну лінію поведінки. Величина, що відповідає максимінному критерію, називається нижньою ціною гри, під якою слід мати на увазі максимальний виграш, що гарантується у грі з цим противником вибором однієї зі своїх стратегій за мінімальних результатів.

Критерій Вальда (або критерій "максиміна") припускає, що з усіх можливих варіантів"матриці рішень" вибирається та альтернатива, яка з усіх найбільш несприятливих ситуацій розвитку події (що мінімізують значення ефективності) має найбільше з мінімальних значень (тобто значення ефективності, промінь-

Максимальний критерій Вальда використовується у випадках, коли потрібна гарантія, щоб виграш у будь-яких умовах виявлявся не менш ніж найбільший із можливих у найгірших умовах. критерії Гурвіца. Його значення знаходиться в межах 0

У формулі цього критерію є коефіцієнт а, значення якого встановлюється залежно від ступеня впевненості особи, яка приймає рішення, у правильності свого вибору, якому сценарію реалізації проекту слід віддати перевагу). Значення а вибирається в інтервалі від 0 до 1. При ос = 0 критерій Гурвіца перетворюється на критерій крайнього оптимізму при ос = 1 - на критерій Вальда. При 0 тим більше бажання "підстрахуватися", тим ближче до 1 вибирається коефіцієнт.

Критерій правдоподібності є незміщеним і заможним, при великих вибірках -2-log X має розподіл хі-квадрат (hi-squared distribution) з ступенями свободи , де / - число параметрів р, конкретні значення яких визначає Н0. Критерій правдоподібності (LK) еквівалентний критерію Вальда (W) та критерію множника Лагранжа (LM) при асимптотичному наближенні, проте при малих вибірках W>LR>LM.

MAXIMIN- орієнтований отримання гарантованого виграшу при найгіршому стані довкілля (підхід песиміста, критерій Вальда). Відповідно до нього як оптимальну вибирається альтернатива, що має максимальне значення очікуваного результату в найменш сприятливому стані середовища. Тут рішення – відмова від будівництва.

Таким чином, критерій гарантованого результату (мак-симінний критерій Вальда) записується у вигляді

  • 2. Етапи процесу прийняття раціонального управлінського рішення
  • 3. Методи оптимізації рішень
  • Лекція 3 Стратегічні рішення
  • 1. Стратегічне управління, основні засади стратегічного управління
  • 2.Технологія вироблення стратегічних рішень
  • Стратегічні інтереси, що лежать в основі вироблення стратегії організації
  • 3. Класифікація стратегій
  • Лекція 4 Системний підхід у процесі розробки управлінських рішень
  • 1. Поняття системного підходу, його основні риси та принципи.
  • 2. Значення системного підходу в управлінні
  • 3. Системний підхід під час прийняття управлінських рішень, системний аналіз
  • Лекція 5 Ситуаційний аналіз у процесі розробки управлінських рішень
  • 1. Ситуаційний підхід в управлінні
  • 2. Етапи ситуаційного аналізу
  • 3.Методи сіуаційного аналізу
  • Лекція 6 Цільова орієнтація управлінських рішень
  • 1. Цілепокладання при виборі управлінського рішення
  • 2. Оцінювання цілей
  • 3. Ініціативно-цільова технологія
  • 4. Програмно-цільова технологія
  • 5.Регламентна технологія
  • Лекція 7 Процесорні технології прийняття управлінських рішень
  • 1. Управління за результатами
  • 2. Управління з урахуванням потреб та інтересів
  • 3.Управління шляхом постійних перевірок та вказівок
  • Лекція 8 Інформація для ухвалення управлінських рішень
  • 1. Роль інформації у процесі прийняття рішення
  • 2. Сутність інформаційних систем та підходи до їх розробки
  • 3. Автоматизована система підтримки управлінських рішень
  • Лекція 9 Методи аналізу та прогнозування управлінських рішень
  • 1. Поняття аналізу, класифікація методів аналізу
  • 2. Прийоми аналізу
  • 3. Поняття прогнозування та його завдання
  • 4. Види прогнозів, класифікація прогнозів
  • 5. Класифікація основних методів прогнозування
  • Лекція 10 Прийняття управлінських рішень за умов визначеності
  • 1. Постановка завдання обґрунтування рішень за умов визначеності, основні етапи розробки рішень за умов визначеності.
  • Лекція 11 Прийняття управлінських рішень за умов невизначеності
  • 2. Методи та технології прийняття рішень в умовах «природної» невизначеності
  • 3. Критерій Лапласа, Вальда, Севіджа, Гурвіца
  • Це найбільш обережний підхід до прийняття рішень і той, що найбільше враховує всі можливі ризики.
  • 4. Метод теорії ігор після прийняття рішень за умов невизначеності
  • Лекція 12 Прийняття управлінських рішень за умов ризику
  • 1. Ризик та його різновиди
  • 2.Управління ризиками, способи оцінки ризиків
  • 3. Критерії прийняття рішення в умовах ризику
  • 4. Дерево рішень як метод прийняття управлінських рішень в умовах ризику
  • Лекція 13 Моделювання процесу розробки управлінського рішення
  • 1. Поняття та види моделей
  • 2. Моделі процесу розробки управлінського рішення
  • 3. Спеціальні моделі прийняття рішень
  • Лекція 14 Кількісні експертні оцінки у процесі розробки управлінських рішень
  • 1. Сутність методу експертних оцінок та його сфера застосування
  • 2. Кількісні експертні оцінки, їх методи
  • 3. Шкали кількісних експертних вимірів
  • Лекція 15 Якісні експертні оцінки у процесі розробки управлінських рішень
  • 1. Якісні експертні оцінки, їх методи
  • 2. Колективні методи експертних оцінок
  • Шкали якісних вимірів:
  • Лекція 16 Якість та ефективність управлінських рішень
  • 1.Якість управлінських рішень
  • 2. Ефективність управлінських рішень
  • 2. Методи оцінки ефективності управлінських рішень
  • Лекція 17 Реалізація та контроль виконання управлінських рішень
  • 1. Сутність та види контролю реалізації управлінських рішень
  • 2.Процес контролю реалізації управлінських рішень
  • 3. Інструменти та характеристики ефективного контролю реалізації управлінських рішень
  • Лекція 18 Управлінські рішення та відповідальність керівників за ур
  • 1. Поняття відповідальності за результати прийняття та виконання управлінського рішення.
  • 2. Соціальна відповідальність керівника
  • 3. Типи менеджменту та алгоритми прийняття рішень.
  • Рекомендована література для самостійної роботи студентів
  • Словник понять
  • 3. Критерій Лапласа, Вальда, Севіджа, Гурвіца

    Існує кілька критеріїв для вибору оптимальної стратегії при ухваленні рішення в умовах ризику та невизначеності.

    Критерій Лапласа:застосовується, якщо можна припускати, що це варіанти зовнішніх умов однаково можливі. Для кожного рішення знаходиться Середня оцінказа всіма варіантами зовнішніх умов (середній виграш):

    де N-кількість станів зовнішнього середовища.

    де Z - оптимальна стратегія.

    Критерій Вальда:(Критерій крайнього песимізму, максимінний критерій): рішення вибирається для найгірших зовнішніх умов. Імовірності станів природи невідомі і немає можливості отримати про них будь-яку статистичну інформацію. Як оцінка кожного рішення використовується мінімальний виграш, який можна отримати при виборі цього рішення:

    Найкращим є рішення з максимальною оцінкою.

    Найкращим є рішення з максимальною оцінкою.

    За критерієм Вальда вибирають стратегію, яка дає гарантований виграш за найгіршого варіанту стану природи.

    Критерій Севіджа,як і критерій Вальда, це критерій крайнього песимізму, але тільки песимізм тут проявляється в тому, що мінімізується максимальна втрата у виграші. Для оцінки рішень використовується матриця ризиків. Як оцінка використовується максимальний ризик (максимальний втрачений виграш), що відповідає даному рішенню:

    Найкращим є рішення з мінімальною оцінкою.

    Це найбільш обережний підхід до прийняття рішень і той, що найбільше враховує всі можливі ризики.

    Критерій Гурвіца:рішення приймається з урахуванням того, що можливі як сприятливі, і несприятливі зовнішні умови. При використанні цього критерію потрібно вказати «коефіцієнт песимізму» – число в діапазоні від 0 до 1, що є суб'єктивною (тобто не розрахованою, а зазначеною людиною) оцінкою можливості несприятливих зовнішніх умов. Якщо є підстави припускати, що умови будуть несприятливими, то коефіцієнт песимізму призначається близьким до одиниці. Якщо несприятливі зовнішні умови малоймовірні, використовується коефіцієнт песимізму, близький до нуля. Оцінки рішень знаходяться за такою формулою:

    де a – коефіцієнт песимізму.

    Найкращим є рішення з максимальною оцінкою:

    Крім критеріїв оптимальності, які можна застосовувати при ухваленні рішення в умовах ризику та невизначеності, існує дуже відомий та поширений метод теорії ігор, що використовується в управлінській діяльності в умовах невизначеності.

    4. Метод теорії ігор після прийняття рішень за умов невизначеності

    При ухваленні рішень в умовах невизначеності дуже широко використовується метод теорії ігор. Теорія ігор – це математична теорія конфліктних ситуацій. Завдання цієї теорії - вироблення рекомендацій щодо раціонального образу дій учасників конфлікту. При цьому будують запитану модель конфліктної ситуації, яку називають грою. Під «грою» розуміють захід, що складається з низки дій чи «ходів». Від реальної конфліктної ситуації гра відрізняється тим, що ведеться за певними правилами. Сторони, що у конфлікті, називають гравцями, результат конфлікту - виграшем тощо.

    Якщо у грі зіштовхуються інтереси двох сторін, то гра називається парною, якщо сторін більше – множинною. Множинна гра з двома постійними коаліціями звертає гру до парної. Найбільше практичного значення мають парні гри. Розглянемо кінцеву гру, в якій гравець має m стратегій, а гравець В - n стратегій. Така гра називається m x n. Стратегії, відповідно, позначимо: А1, А2, ..., Аm - для гравця А; Якщо гра складається тільки з особистих ходів, то вибір стратегій А i і В j гравцями однозначно визначає результат гри - наш виграш a ij Якщо відомі a ij для всіх поєднань стратегій, вони утворюють платіжну матрицю розміром m x п, де: m - число рядків матриці, а n - число його стовпців.

    Принцип обережності, що диктує гравцям вибір відповідних стратегій (максимінної та мінімаксної), є в теорії ігор основним принципом і називається принципом мінімаксу. У платіжній матриці такої гри існує елемент, що є одночасно мінімальним у своєму рядку та максимальним у своєму стовпці. Такий елемент називають сідловою тонкою. У цьому значення v=ą=þ називають чистою ціною гри. У цьому випадку рішення гри (сукупність оптимальних стратегій гравців) має таку властивість: якщо один із гравців дотримується своєї оптимальної стратегії, то для іншого не може бути вигідним відхилятися від своєї оптимальної стратегії. Якщо верхня ціна гри не збігається з нижньою, то в цьому випадку варто говорити про гру у змішаних стратегіях. Змішаною S A називається застосування чистих стратегій А 1 ,А 2 ,…,А n з ймовірністю p 1 ,p 2 ,…,p n , а змішаною стратегією S B - застосування чистих стратегій B 1 ,B 2 ,…,B n з ймовірністю p 1 , p 2, ..., p m. Нехай гра має розмірність 2 на 2 і задається платіжною матрицею:

    Для гравця А оптимальна стратегія матиме ймовірність:

    ;
    ; ціна гри

    Поділіться з друзями або збережіть для себе:

    Завантаження...