Приклади розв'язання задач. Матричні ігри: приклади розв'язання задач

Математична теорія ігор, що виникла в сорокових роках XX століття, найчастіше застосовується саме в економіці. Але як за допомогою концепції ігор змоделювати поведінку людей у ​​суспільстві? Навіщо економісти вивчають, у який кут частіше б'ють пенальті футболісти, та як виграти у «Каміні, ножиці, папір» у своїй лекції розповів старший викладач кафедри мікроекономічного аналізу ВШЕ Данило Федорова.

Джон Неш і блондинка в барі

Гра - це будь-яка ситуація, у якій прибуток агента залежить тільки від його власних дій, а й від поведінки інших учасників. Якщо ви розкладаєте вдома пасьянс, з погляду економіста та теорії ігор, це не гра. Вона має на увазі обов'язкову наявність зіткнення інтересів.

У фільмі «Ігри розуму» про Джона Неша, нобелівському лауреатіз економіки, є сцена з білявкою в барі. У ній показана ідея, за яку вчений і отримав премію, - це ідея рівноваги по Нешу, яку він сам називав динамікою, що управляє.

Гра- будь-яка ситуація, у якій виграші агентів залежать друг від друга.

Стратегія – опис дій гравця у всіх можливих ситуаціях.

Вихід – комбінація обраних стратегій.

Отже, з погляду теорії, гравцями у цій ситуації є лише чоловіки, тобто ті, хто ухвалює рішення. Їхні переваги прості: блондинка краща за брюнетку, а брюнетка краща, ніж нічого. Діяти можна двома способами: піти до білявки або до своєї брюнетки. Гра складається з єдиного ходу, рішення приймаються одночасно (тобто не можна подивитися, куди пішли інші, і потім бути схожим самому). Якщо якась дівчина відкидає чоловіка, гра закінчується: неможливо повернутись до неї або вибрати іншу.

Яким є ймовірний фінал цієї ігрової ситуації? Тобто якою є її стійка конфігурація, з якої всі зрозуміють, що зробили кращий вибір? По-перше, як правильно зауважує Неш, якщо всі підуть до білявки, нічим добрим це не скінчиться. Тому далі вчений припускає, що всім потрібно піти до брюнеток. Але тоді, якщо відомо, що всі підуть до брюнеток, йому слід йти до білявки, адже вона краща.

У цьому полягає справжня рівновага - результат, у якому один йде до блондинці, інші - до брюнеткам. Може здатися, що це несправедливо. Але в ситуації рівноваги ніхто не може пошкодувати про свій вибір: ті, хто піде до брюнеток, розуміють, що від блондинки вони все одно нічого не отримали б. Таким чином, рівновага по Нешу - це конфігурація, за якої ніхто окремо не хоче змінювати обрану всіма стратегію. Тобто, рефлексуючи наприкінці гри, кожен учасник розуміє, що навіть знаючи, як сходяться інші, він зробив би те саме. Інакше можна назвати це результатом, де кожен учасник оптимально відповідає на дії інших.

"Камінь ножиці папір"

Розглянемо інші ігри щодо рівноваги. Наприклад, у «Каміні, ножицях, папері» немає рівноваги по Нешу: у всіх її можливих наслідках немає варіанта, в якому обидва учасники були б задоволені своїм вибором. Тим не менш, існує Чемпіонат світу та World Rock Paper Scissors Society, що збирає ігрову статистику. Очевидно, що ви можете підвищити свої шанси на перемогу, якщо будете щось знати про звичайну поведінку людей у ​​цій грі.

Чиста стратегія у грі - це така стратегія, коли людина завжди грає однаково, вибираючи одні й самі ходи.

За даними World RPS Society, камінь є ходом, що найчастіше вибирається (37,8%). Папір ставлять 32,6%, ножиці – 29,6%. Тепер ви знаєте, що потрібно вибирати папір. Однак, якщо ви граєте з тим, хто теж це знає, вам уже не треба вибирати папір, тому що від вас очікується те саме. Є знаменитий випадок: у 2005 році два аукціонні будинки Sotheby's та Christie's вирішували, кому дістанеться дуже великий лот - колекція Пікассо та Ван Гога зі стартовою ціною 20 мільйонів доларів. Власник запропонував їм зіграти в Камінь, ножиці, папір, і представники будинків відправили йому свої варіанти електронною поштою. Sotheby“s, як вони пізніше розповіли, особливо не замислюючись, вибрали папір. Виграв Christie”s. Ухвалюючи рішення, вони звернулися до експерта - 11-річної дочки одного з топ-менеджерів. Вона сказала: «Камінь здається найсильнішим, тому більшість людей його обирають. Але якщо ми граємо не з зовсім дурним новачком, він камінь не викине, чекатиме, що ми зробимо, і сам викине папір. Але ми думатимемо на хід уперед, і викинемо ножиці».

Таким чином, ви можете думати на хід вперед, але це не обов'язково призведе до перемоги, адже ви можете не знати про компетенцію вашого суперника. Тому іноді замість чистих стратегій краще вибирати змішані, тобто приймати рішення випадково. Так, у «Каміні, ножицях, папері» рівновага, яку ми до цього не знайшли, знаходиться якраз у змішаних стратегіях: вибирати кожен із трьох варіантів ходу із ймовірністю в одну третю. Якщо ви обиратимете камінь частіше, суперник скоригує свій вибір. Знаючи це, ви скоректуєте свій, і рівноваги не вийде. Але ніхто з вас не почне змінювати поведінку, якщо кожен просто вибиратиме камінь, ножиці або папір з однаковою ймовірністю. Все тому, що в змішаних стратегіях по попередніх діях неможливо передбачити ваш наступний хід.

Змішані стратегії та спорт

Більше серйозних прикладів змішаних стратегій дуже багато. Наприклад, куди подавати у тенісі чи бити/приймати пенальті у футболі. Якщо ви нічого не знаєте про вашого суперника або просто постійно граєте проти різних, найкращою стратегієюнадходитиме більш-менш випадково. Професор Лондонської школи економіки Ігнасіо Паласіос-Уерта в 2003 році опублікував в American Economic Review роботу, суть якої полягала в пошуку рівноваги Нешу в змішаних стратегіях. Предметом дослідження Паласіос-Уерта обрав футбол і у зв'язку з цим переглянув понад 1400 ударів пенальті. Зрозуміло, у спорті все влаштовано хитріші, ніж у «Каміні, ножицях, папері»: там враховується сильна нога спортсмена, попадання в різні кути при ударі з усієї сили тощо. Рівновага по Нешу тут полягає в розрахунку варіантів, тобто, наприклад, визначенні кутів воріт, в які треба бити, щоб виграти з більшою ймовірністю, знаючи свої слабкі і сильні сторони. Статистика щодо кожного футболіста і знайдена в ній рівновага в змішаних стратегіях показала, що футболісти роблять приблизно так, як передбачають економісти. Навряд чи варто стверджувати, що люди, які б'ють пенальті, читали підручники з теорії ігор та займалися досить непростою математикою. Швидше за все, є різні способинавчитися оптимально поводитися: можна бути геніальним футболістом, і відчувати, що робити, а можна - економістом, і шукати рівновагу в змішаних стратегіях.

2008 року професор Ігнасіо Паласіос-Уерта познайомився з Авраамом Грантом, тренером «Челсі», який грав тоді у фіналі Ліги чемпіонів у Москві. Вчений написав записку тренеру з рекомендаціями щодо серії пенальті, які стосувалися поведінки воротаря суперника – Едвіна ван дер Сара з «Манчестер Юнайтед». Наприклад, за статистикою, він майже завжди відбивав удари на середньому рівні і частіше кидався в природний для пенальті бік. Як ми визначили вище, правильніше все-таки рандомізувати свою поведінку з урахуванням знань про суперника. Коли рахунок із пенальті був уже 6:5, Ніколя Анелька, нападник «Челсі», мав забивати. Показуючи перед ударом у правий кут, ван дер Сар ніби запитав Анелька, чи не збирається він бити туди.

Суть у тому, що всі попередні удари «Челсі» були завдані саме у правий від кута, що пробиває. Ми не знаємо точно чому, можливо, через консультацію економіста бити в неприродний для них бік, адже за статистикою до цього менш готовий ван дер Сар. Більшість футболістів «Челсі» були правшами: ударяючи в неприродний для себе правий кут, вони, крім Террі, забивали. Мабуть, стратегія була в тому, щоб Анелька пробив туди. Але ван дер Сар, мабуть, це зрозумів. Він вчинив геніально: показав у лівий кут мовляв «туди зібрався бити?», від чого Анелька, напевно, жахнувся, адже його розгадали. В останній момент він прийняв рішення діяти по-іншому, вдарив у природний для себе бік, що й потрібне було ван дер Сару, який взяв цей удар і забезпечив «Манчестеру» перемогу. Ця ситуація вчить випадковому вибору, адже інакше ваше рішення може бути прораховано, і ви програєте.

«Дилема ув'язненого»

Напевно, сама відома гра, з якої починаються університетські курси з теорії ігор, - це «Дилема ув'язненого». За легендою двох підозрюваних у серйозному злочині спіймали та замкнули у різні камери. Є доказ, що вони зберігали зброю, і це дає змогу посадити їх на якийсь невеликий термін. Однак доказів, що вони скоїли цей страшний злочин, немає. Кожному окремо слідчий розповідає про умови гри. Якщо обидва злочинці зізнаються, обидва сядуть на три роки. Якщо зізнається один, а спільник мовчатиме, той, хто зізнається, вийде відразу, а другого посадять на п'ять років. Якщо, навпаки, перший не зізнається, а другий його здасть, перший сяде на п'ять років, а другий вийде одразу. Якщо ж ніхто не зізнається, обидва сядуть на рік за зберігання зброї.

Рівновага по Нешу тут полягає в першій комбінації, коли обидва підозрювані не мовчать і обидва сідають на три роки. Міркування кожного такі: «якщо я говоритиму, я сяду на три роки, якщо мовчати – на п'ять років. Якщо другий мовчатиме, мені теж краще говорити: не сісти краще, ніж сісти на рік». Це домінуюча стратегія: говорити вигідно незалежно від того, що робить інший. Однак у ній є проблема – наявність варіанта кращого, адже сісти на три роки гірше, ніж сісти на рік (якщо розглядати історію лише з погляду учасників та не враховувати питання моралі). Але сісти на рік неможливо, адже, як ми зрозуміли вище, мовчати обом злочинцям невигідно.

Поліпшення по Парето

Є відома метафора про невидиму руку ринку, що належить Адаму Сміту. Він казав, що якщо м'ясник сам для себе намагатиметься заробити гроші, від цього буде найкраще: він зробить смачне м'ясо, яке купить булочник на гроші від продажу булок, які він, у свою чергу, теж повинен буде робити смачними, щоб вони продавалися. . Але виявляється, ця невидима рука не завжди працює і таких ситуацій, коли кожен діє за себе, а всім погано, дуже багато.

Тому іноді економісти та фахівці з теорії ігор думають не про оптимальну поведінку кожного гравця, тобто не про рівновагу по Нешу, а про результат, при якому буде краще всьому суспільству (у «Ділемі» суспільство складається з двох злочинців). З цієї точки зору, результат ефективний, коли в ньому немає покращення за Парето, тобто неможливо зробити комусь краще, не зробивши при цьому гіршим за інших. Якщо люди просто змінюються товарами та послугами, то це Парето-покращення: вони роблять це добровільно, і навряд чи комусь від цього погано. Але іноді, якщо просто дати людям взаємодіяти і навіть не втручатися, то, до чого вони прийдуть, не буде оптимальним за Парето. Це і відбувається у «Дилемі ув'язненого». У ній, якщо ми даємо кожному діяти так, як їм вигідно, виявляється, що всім це погано. Усім було б краще, якби кожен діяв не оптимально для себе, тобто мовчав.

Трагедія громади

«Дилема ув'язненого» – це іграшкова стилізована історія. Навряд чи ви очікуєте опинитися в подібній ситуації, але схожі ефекти є навколо нас. Розглянемо «Ділему» з великою кількістюгравців, її іноді називають трагедією громади. Наприклад, на дорогах – пробки, і я вирішую, як їхати на роботу: машиною чи автобусом. Це ж роблять решта. Якщо я поїду на машині, і все вирішать зробити те саме, буде пробка, але ми доїдемо з комфортом. Якщо я поїду на автобусі, пробка все одно буде, але їхати я буду некомфортно і не особливо швидше, тому такий результат ще гірший. Якщо ж у середньому всі їздять автобусом, то я, зробивши те саме, досить швидко доїду без пробки. Але якщо за таких умов поїхати машиною, я теж доїду швидко, але ще й з комфортом. Отже, наявність пробки залежить від моїх дій. Рівнавага по Нешу тут - у ситуації, коли всі обирають їхати машиною. Що б не робили решта, мені краще вибрати машину, бо буде там пробка чи ні, невідомо, але я у будь-якому разі доїду з комфортом. Це домінуюча стратегія, тому у результаті всі їдуть машиною, і ми маємо те, що маємо. Завдання держави - зробити подорож автобусом найкращим варіантомхоча б для деяких, тому з'являються платні в'їзди до центру, паркування тощо.

Інша класична історія- Раціональне незнання виборця. Уявіть, що ви не знаєте результату виборів заздалегідь. Ви можете вивчити програму всіх кандидатів, послухати дебати та після проголосувати за найкращого. Друга стратегія - прийти на дільницю і проголосувати абияк або за того, кого частіше показували по телевізору. Яка поведінка є оптимальною, якщо від мого голосу ніколи не залежить, хто виграє (а в 140-мільйонній країні один голос ніколи нічого не вирішить)? Звичайно, я хочу, щоб у країні був добрий президент, але ж я знаю, що ніхто більше не вивчатиме програми кандидатів уважно. Тому не витрачати на цей час – домінуюча стратегія поведінки.

Коли вас закликають прийти на суботник, ні від кого окремо не залежатиме, стане двір чистим чи ні: якщо я вийду один, я не зможу прибрати все, або, якщо вийдуть усі, то не вийду я, бо все і без мене приберуть. Інший приклад – перевезення вантажів у Китаї, про який я дізнався у чудовій книзі Стівена Ландсбурга «Економіст на дивані». 100-150 років тому в Китаї був поширений спосіб перевезення вантажів: все складалося у великий кузов, який тягли сім людей. Замовники платили, якщо вантаж доставлявся вчасно. Уявіть, що ви – один із цих шести. Ви можете докладати зусиль, і тягнути щосили, і якщо всі так робитимуть, вантаж доїде вчасно. Якщо хтось один так не робитиме, всі теж доїдуть вчасно. Кожен думає: «Якщо всі інші тягнуть як слід, навіщо це робити мені, а якщо решта тягне не з усієї сили, то я нічого не зможу змінити». У результаті, з часом доставки все було дуже погано, і самі вантажники знайшли вихід: вони стали наймати сьомого і платити йому гроші за те, щоб він хльопав батогом батогом. Сама наявність такої людини змушувала всіх працювати щосили, бо інакше всі потрапляли в погану рівновагу, з якої нікому окремо з вигодою не вийти.

Такий приклад можна спостерігати в природі. Дерево, що росте в саду, відрізняється від того, що росте в лісі своєю кроною. У першому випадку вона оточує весь стовбур, у другому – знаходиться лише вгорі. У лісі це є рівновагою Нешем. Якби всі дерева домовилися і виросли однаково, вони порівну розподілили б кількість фотонів, і всім було б краще. Але нікому окремо робити так невигідно. Тому кожне дерево хоче вирости трохи вище за оточуючих.

Commitment device

У багатьох ситуаціях одному з учасників гри може знадобитися інструмент, який переконає решту, що той не блефує. Він називається commitment device. Наприклад, закон деяких країн забороняє платити викуп викрадачам людей, щоб зменшити мотивацію злочинців. Однак це законодавство часто не працює. Якщо вашого родича захопили, і ви маєте можливість врятувати його, обійшовши закон, ви це зробите. Уявімо ситуацію, що закон можна оминути, але родичі виявилися бідними і викуп їм платити нема чим. У злочинця у цій ситуації два шляхи: відпустити чи вбити жертву. Вбивати він не любить, але в'язницю не любить більше. Відпущений постраждалий, своєю чергою, може або дати свідчення, щоб викрадач було покарано, або мовчати. Найкращий результат для злочинця: відпустити жертву, яка його не здасть. Жертва хоче бути відпущеною і дати свідчення.

Рівновага тут у тому, що терорист не хоче бути спійманим, а отже, жертва гине. Але це не рівновага щодо Парето, тому що існує варіант, при якому всім краще – жертва на волі зберігає мовчання. Але для цього треба зробити так, щоб мовчати їй було вигідно. Десь я прочитав варіант, коли вона може попросити терориста влаштувати еротичну фотосесію. Якщо злочинця посадять, його спільники викладуть фотографії в інтернет. Тепер, якщо викрадач залишиться на волі – це погано, але фотографії у відкритому доступі – ще гірші, тому виходить рівновага. Для жертви це спосіб залишитися живим.

Інші приклади ігор:

Модель Бертрана

Якщо вже ми говоримо про економіку, розглянемо економічний приклад. У моделі Бертрана два магазини продають той самий товар, купуючи його у виробника за однією ціною. Якщо ціни в магазинах однакові, то приблизно однаковий і їхній прибуток, адже тоді покупці вибирають магазин випадково. Єдина рівновага по Нешу тут – продавати товар за собівартістю. Але магазини хочуть заробляти. Тому якщо один поставить ціну 10 рублів, другий знизить її на копійку, збільшивши тим самим свою виручку вдвічі, оскільки до неї підуть усі покупці. Тому учасникам ринку вигідно знижувати ціни, розподіляючи цим прибуток між собою.

Роз'їзд на вузькій дорозі

Розглянемо приклади вибору між двома можливими рівновагами. Уявіть, що Петя та Маша їдуть назустріч один одному вузькою дорогою. Дорога настільки вузька, що їм обом потрібно з'їхати на узбіччя. Якщо вони вирішать повернути ліворуч чи праворуч від себе, вони просто роз'їдуться. Якщо ж один поверне праворуч, а інший ліворуч від себе, або навпаки, трапиться аварія. Як вибрати, куди поїхати? Щоб допомагати шукати рівновагу в подібних іграх, існують, наприклад, правила дорожнього руху. У Росії кожному треба повернути праворуч.

У забаві Chiken, коли дві людини їдуть на великій швидкості назустріч один одному, також є дві рівноваги. Якщо обоє повертають на узбіччя, виникає ситуація, яка називається Chiken out, якщо обоє не повертають, то гинуть у страшній аварії. Якщо я знаю, що мій суперник їде прямо, то мені вигідно з'їхати, щоб вижити. Якщо я знаю, що мій суперник з'їде, то мені вигідно їхати прямо, щоб одержати 100 доларів. Важко передбачити, що трапиться насправді, однак, кожен з гравців має свій метод виграти. Уявіть, що я закріпив кермо так, що його не можна повернути і показав це своєму супернику. Знаючи, що я не маю вибору, суперник відскочить.

QWERTY-ефект

Іноді буває дуже складно перейти з однієї рівноваги до іншої, навіть якщо вона означає користь для всіх. Розкладка QWERTY була створена, щоб уповільнити швидкість друку. Оскільки якби всі друкували надто швидко, головки друкарської машинки, які б'ють по паперу, чіплялися б один за одного. Тому Крістофер Шоулз розмістив літери, що часто стоять поруч, на максимально далекій відстані. Якщо ви зайдете в налаштування клавіатури на своєму комп'ютері, ви зможете вибрати розкладку Dvorak і друкувати набагато швидше, оскільки зараз немає проблеми аналогових друкарських машин. Дворак розраховував, що світ перейде на його клавіатуру, але ми живемо з QWERTY. Звичайно, якби ми перейшли на розклад Дворака, майбутнє покоління було б нам вдячне. Всі ми доклали б зусиль і перевчилися, в результаті вийшла б рівновага, в якій всі друкують швидко. Зараз ми теж у рівновазі – у поганому. Але нікому не вигідно бути єдиним, хто перевчиться, бо за будь-яким комп'ютером, окрім особистого, працювати буде незручно.

Якщо є кілька конфліктуючих сторін (осіб), кожна з яких приймає деяке рішення, яке визначається заданим набором правил, і кожному з осіб відомий кінцевий стан конфліктної ситуаціїіз заздалегідь визначеними для кожної із сторін платежами, то кажуть, що має місце гра.

Завдання теорії ігор полягає у виборі такої лінії поведінки даного гравця, відхилення від якої може лише зменшити його виграш.

Деякі визначення гри

Кількісна оцінка результатів гри називається платежем.

Парна гра (Дві особи) називається грою з нульовою сумою, якщо сума платежів дорівнює нулю, тобто. якщо програш одного гравця дорівнює виграшу іншого.

Однозначний опис вибору гравця в кожній із можливої ​​ситуацій, при якій він повинен зробити особистий хід, називається стратегією гравця .

Стратегія гравця називається оптимальною, якщо при багаторазовому повторенні гри вона забезпечує гравцеві максимально можливий середній виграш (або, що - те саме, мінімально можливий середній виграш).

Гра, що визначається матрицею А, що має mрядків та nстовпців, називається кінцевою парною грою розмірності m* n;

де i=
- стратегія першого гравця, що має стратегій; j=- стратегія другого гравця, що має стратегій; ij- Виграш першого гравця по i-ї стратегії при використанні другим j-ї стратегії (або, що те саме, програш другого за своєю j-ї стратегії, при використанні першим i-й);

А =  ij– платіжна матриця гри.

1.1 Гра із чистими стратегіями

Нижня ціна гри (для першого гравця)

= max (min ij). (1.2)

i j

Верхня ціна гри (для другого гравця):

= min (max ij) . (1.3)

J i

Якщо = гра називається з сідловою точкою (1.4), або гра з чистими стратегіями. При цьому V = = називають цінної гри ( V- Ціна гри).

приклад.Дано платіжну матрицю гри 2 осіб А. Визначити оптимальні стратегіїдля кожного з гравців та ціну гри:

(1.4)

max 10 9 12 6

i

min 6

j

- Стратегія першого гравця (рядки).

Стратегія другого гравця (стовпці).

- Ціна гри.

Таким чином, гра має сідлову точку. Стратегія j = 4 – оптимальна для другого гравця, стратегія i=2 – для першого. Маємо гру із чистими стратегіями.

1.2 Ігри зі змішаними стратегіями

Якщо платіжна матриця немає сідлової точки, тобто.
, і жоден з учасників гри не може вибрати один план як свою оптимальну стратегію, гравці переходять на «змішані стратегії». При цьому кожен із гравців використовує в процесі гри кілька разів кожну зі своїх стратегій.

Вектор, кожен з компонентів якого показує відносну частоту використання гравцем відповідної чистої стратегії, називається змішаною стратегією даного гравця.

Х= (х 1 …х i …х m) - Змішана стратегія першого гравця.

У= (у 1 …у j …у n) - Змішана стратегія другого гравця.

xi , у j- Відносні частоти (ймовірності) використання гравцями своїх стратегій.

Умови використання змішаних стратегій

. (1.5)

Якщо Х* = (х 1 * ….х i * … х m*) - оптимальна стратегія, обрана першим гравцем; Y* = (у 1 * …у j * … у n*) – оптимальна стратегія, обрана другим гравцем, число є ціною гри.

(1.6)

Для того, щоб число Vбуло ціною гри, а х* і у* - оптимальними стратегіями, необхідно і достатньо виконання нерівностей

(1.7)

Якщо один із гравців застосовує оптимальну змішану стратегію, то його виграш дорівнює ціні гри. Vнезалежно від того, з якими частотами буде застосовувати другий гравець стратегії, що увійшли до оптимальної, у тому числі чистих стратегій.

Відомості задач теорії ігор до задач лінійного програмування.

приклад. Знайти рішення гри, яка визначається платіжною матрицею А.

А = (1.8)

y 1 y 2 y 3

Рішення:

Складемо подвійну пару завдань лінійного програмування.

Для першого гравця

(1.9)

у 1 +у 2 +у 3 = 1 (1.10)

Звільняючись від змінної V(ціна гри), розділимо ліву та праву частину виразів (1.9), (1.10) на V. Прийнявши у j /Vза нову змінну z i, отримаємо нову систему обмежень (1.11) та цільову функцію (1.12)

(1.11)

. (1.12)

Аналогічно отримаємо модель гри для другого гравця:

(1.13)

х 1 +х 2 +х 3 = 1 . (1.14)

Привівши модель (1.13), (1.14) до форми без змінної V, отримаємо

(1.15)

, (1.16)

де
.

Якщо необхідно визначити стратегію поведінки першого гравця, тобто. відносну частоту використання його стратегій ( х 1 ….х i …х m), ми використовуватимемо модель другого гравця, т.к. ці змінні перебувають у його моделі виграшу (1.13), (1.14).

Наведемо (1.15), (1.16) до канонічної форми

(1.17)

Зміст 1 Загальні відомості 2 1.1 Ігри. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Ходи. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Стратегії. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 Матрична гра. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 Слідова точка. Чисті стратегії 7 2.1 Приклади. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Приклад 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Приклад 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 Змішані стратегії 9 3.1 Гра 2×2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 Приклади. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Приклад 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Приклад 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 Геометрична інтерпретація. . . . . . . . . . . . . . . . . . . . 12 3.2 Ігри 2×n та m×2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Приклад 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. Загальні відомості з теорії ігор 1.1. Теорія ігор - це математична теорія конфліктних ситуацій, тобто. таких ситуацій, у яких стикаються інтереси двох або більше сторін, що мають різні цілі. Гра – це конфліктна ситуація, регламентована певними правилами, у яких мають бути зазначені: можливі варіанти дій учасників кількісний результат гри або платіж (виграш, програш), до якого приводить дана сукупність ходів обсяг інформації кожної сторони про поведінку іншої. Парна гра - гра в якій беруть участь лише дві сторони (два гравці). Парна гра з нульової сумою - парна гра, у якій сума платежів дорівнює нулю, тобто. програш одного гравця дорівнює виграшу другого. Залежно від ставлення кожного з гравців до значення функції виграшу парні ігри поділяються: Парна гра з нульовою сумою (антагоністична) - парна гра, у якій сума платежів дорівнює нулю, тобто. програш одного гравця дорівнює виграшу другого. Неантагоністична гра - парна гра, в якій гравці мають різні, але не прямо протилежні цілі. 2 1.2. Ходи Хід - вибір одного з передбачених правил гри дій здійснення цього вибору Ходи бувають двох типів: Особистий хід - + свідомий вибір одного з передбачених правил гри дій + здійснення цього вибору Випадковий хід - Випадковим ходом називається вибір з ряду можливостей, що здійснюється не рішенням гравця, а якимось механізмом випадкового вибору. Нижче розглядаються парні ігри з нульовою сумою, що містять лише особисті ходи. Кожна сторона не має інформації про поведінку іншої. 3 1.3. Стратегії Стратегія гравця - сукупність правил, що визначають вибір дій при кожному особистому ході цього гравця в залежності від ситуації, що склалася в процесі гри. Залежно від кількості можливих стратегій гри діляться на кінцеві та нескінченні. Нескінченна гра - гра, в якій хоча б один з гравців має нескінченну кількість стратегій. Кінцева гра - гра, у якій кожен гравець має лише кінцеве число- стратегій. Число послідовних ходів у будь-якого з гравців визначає підрозділ ігор на одноходові та багатоходові, або позиційні. + В одноходовій грі кожен гравець робить лише один вибір із можливих варіантів і після цього встановлює результат гри. + Багатоходова, або позиційна, гра розвивається в часі, являючи собою ряд послідовних етапів, кожен з яких настає після перебігу одного з гравців та відповідної зміни обстановки. В одноходовій грі кожен гравець робить тільки один вибір з можливих варіантіві після цього встановлює результат гри. Оптимальна стратегія гравця - стратегія, яка за багаторазового повторення гри забезпечує даному гравцеві максимально можливий середній виграш (або, що те саме, мінімально можливий середній програш). Теоретично ігор всі рекомендації виробляються з припущення про розумному поведінці гравців. Прорахунки та помилки гравців, неминучі в кожній конфліктній ситуації, а також елементи азарту та ризику в теорії ігор не враховуються. 4 1.4. Матрична гра Матрична гра - одноходова кінцева гра з нульовою сумою. Матрична гра є теоретико-ігровою моделлю конфліктної ситуації, в якій противники для досягнення діаметрально протилежних цілей роблять за одним вибором (ходом) з кінцевого числа можливих способів дій. Відповідно до обраних способів дій (стратегіями) визначається результат, що досягається. Розглянемо з прикладу. Нехай є два гравці A та B, один з яких може вибрати i-ю стратегію з m своїх можливих стратегій A1, A2, ... Am, а другий вибирає j-ю стратегію зі своїх можливих стратегій B1, B2, ... Bm. В результаті перший гравець виграє величину aij, а другий програє цю величину. З чисел aij , складемо матрицю   a11 a11 ··· a1n  a21 a22 ··· a2n    A = (aij) =  .. .. .. ..   . . . .  am1 am2 · · · amn Матриця A = (aij), i = 1, m, j = 1, n називається платіжною матрицею або матрицею гри m × n. У цій матриці рядки завжди для стратегій гравця, що виграє (максимізує), тобто гравця, який прагне максимізації свого виграшу. Стовпці відводяться для стратегій гравця B, що програє, тобто гравця, який прагне мінімізації критерію ефективності. Нагадаємо, що позиційна багатоходова гра є теоретико-ігровою моделлю конфліктної ситуації, в якій противники для досягнення своїх цілей послідовно роблять за одним вибором (ходом) з кінцевого числа можливих способів дій на кожному етапі розвитку цієї ситуації. Рішення гри - знаходження оптимальних стратегій обох гравців та визначення ціни гри Ціна гри - очікуваний виграш (програш) гравців. Рішення гри може бути знайдено або в чистих стратегіях - коли гравець повинен дотримуватися однієї єдиної стратегії, або в змішаних, коли гравець повинен з певними ймовірностями застосовувати дві чисті стратегії або більше. Останні у разі називаються активними. 5 Змішана стратегія одного гравця - вектор, кожен з компонентів якого показує частоту використання гравцем відповідної чистої стратегії. Максимін або нижня ціна гри - число α = max min aij i j Максиминна стратегія (рядок) - стратегія, яку вибрав гравець, щоб максимізувати свій мінімальний виграш. Очевидно, що при виборі найбільш обережної максимінної стратегії гравець A забезпечує собі (незалежно від поведінки супротивника) гарантований виграш не менше ніж α. Максимін або верхня ціна гри - число β = min max aij j i Мінімаксна стратегія (стовпець) - стратегія, яку вибрав гравець, щоб мінімізувати свій максимальний програш. Очевидно, що при виборі найбільш обережної мінімаксної стратегії гравець B не дає можливості за жодних обставин гравцеві A виграти більше, ніж β. Нижня ціна гри завжди не перевищує верхню ціну гри α = max min aij 6 min max aij = β i j j i Теорема 1 (основна теорема теорії матричних ігор). Кожна кінцева гра має по Крайній міріодне рішення, можливо, у сфері змішаних стратегій. 6 2. Ігри з сідловою точкою. Розв'язання в чистих стратегіях Гра з сідловою точкою - гра, для якої α = max min aij = min max aij = β i j j i Для ігор з сідловою точкою знаходження рішення полягає у виборі максимінної та міні-макcної стратегій, які є оптимальними. Чиста ціна гри - загальне значеннянижньої та верхньої ціни гри α=β=ν 2.1. Приклади Приклад 1 Знайти рішення у чистих стратегіях гри, заданої матрицею   8 4 7 A= 6 5 9  7 7 8 Рішення: визначимо верхню та нижню ціну гри. Для цього знайдемо мінімальне чисел aij в i-му рядкуαi = min aij j і максимальне із чисел aij в j-му стовпці βj = max aij i Числа αi (мінімуми рядків) випишемо поруч із платіжною матрицею праворуч у вигляді додаткового стовпця. Числа βi (максимуми стовпців) випишемо під матрицею у вигляді додаткового рядка: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 Знаходимо максимальне з чисел αi α = max αi = 7 i та мінімальне з чи βj β = min βj = 7 j α = β - гра має сідлову точку. Оптимальною стратегією для гравця є стратегія A3 , а для гравця B - стратегія B2 , чиста ціна гри ν = 7 Приклад 2 Задано платіжну матрицю:   2 2 1 1 2  0 1 1 1 1  A=  1 1 2   1 2 1 1 2 Знайти рішення гри у чистих стратегіях. Рішення: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. Гра має шість сідлових точок. Оптимальними стратегіями будуть: A1 і B3 або B4 A3 і B3 або B4 A4 і B3 або B4 8 3. Рішення гри у змішаних стратегіях При α = β. у випадку, коли при виборі своїх стратегій обидва гравці не мають інформації про вибір іншого, гра має рішення у змішаних стратегіях. SA = (p1, p2, ..., pm) - змішана стратегія гравця A, в якій стратегії A1, A2, ..., Am застосовуються про ймовірності ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, mi = 1 SB = (q1 , q2 , ..., qn) - змішана стратегія гравця B , в якій стратегії B1 , B2 , ..., Bm застосовуються про ймовірності ∑ n q1 , q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 Якщо: SA∗ - оптимальна стратегія гравця A , SB∗ - - оптимальна стратегія гравця B , то ціна гри - ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 Наступна теорема дає відповідь на питання, як знайти рішення для ігор 2×2, 2×n, m×2 Теоремма 2 (як знайти рішення для ігор 2×2, 2×n, m×2). Якщо один із гравців застосовує оптимальну змішану стратегію, то його виграш дорівнює ціні гри ν незалежно від того, з якими ймовірностями буде застосовувати другий гравець стратегії, що увійшли до оптимальної (в тому числі й чистої стратегії). 9 3.1. Гра 2×2 Розглянемо гру 2×2 про матрицю: () a11 a21 a21 a22 Нехай гра не має рішення у чистих стратегіях. Знайдемо оптимальні стратегії SA∗ та SB∗. Спочатку визначимо стратегію SA∗ = (p∗1, p∗2). Відповідно до теореми, якщо сторона A дотримуватиметься стратегії ν, то незалежно від способу дій сторони B виграш залишатиметься рівним ціні гри ν. Отже, якщо сторона A дотримується оптимальної стратегії SA∗ = (p∗1 , p∗2), то сторона B може, не змінюючи виграшу, застосовувати будь-яку зі своїх стратегій. Тоді при застосуванні гравцем B чистої стратегії B1 або B2 гравці отримає середній виграш рівний ціні гри: a11 p∗1 + a21 p∗2 = ν ← при стратегії B1 a12 p∗1 + a22 p∗2 = ν ← при стратегії B2 Приймаючи у увага, що p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 Ціна гри: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 Аналогічно знаходиться оптимальна стратегія гравця B: SB∗ = (q1∗ , q2∗). Зважаючи на те, що q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1. Приклади Приклад 3 Знайти рішення гри з матрицею () −1 1 A= 1 −1 10 Рішення: гра не має сідлової точки, оскільки α= -1, β = 1, α ̸= β. Шукаємо рішення у змішаних стратегіях. За формулами для p∗ та q ∗ отримуємо p∗1 = p∗2 = 0.5 і q1∗ = q2∗ = 0.5, ν = 0 Таким чином, SA∗ = (0.5, 0.5) SB∗ = (0.5, 0.5) Приклад 4 Знайти рішення гри з матрицею () 2 5 A= 6 4 Рішення: гра не має сідлової точки, оскільки α= 4, β = 5, α ̸= β. Шукаємо рішення у змішаних стратегіях. За формулами для p∗ та q ∗ отримуємо p∗1 = 0.4, p∗2 = 0.6 та q1∗ = 0.2 q2∗ = 0.8, ν = 4.4 Таким чином, SA∗ = (0.4, 0.6) SB∗ = (0.2, 0.8) 11 3.1.2. Геометрична інтерпретація Ігри 2×2 можна дати просту геометричну інтерпретацію. Візьмемо одиничну ділянку осі абсцис, кожній точці якого поставимо у відповідність деяку змішану стратегію S = (p1 , p2) = (p1 , 1 − p1) причому ймовірність p1 стратегії A1 дорівнюватиме відстані від точки SA до правого кінця ділянки, а ймовірність p2, стратегії A2 - відстані до лівого кінця. .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ Зокрема, лівий кінець ділянки (крапка з абсцисою = 0) відповідає стратегії A1 , правий кінець ділянки (x = 1) - стратегії A2 На кінцях ділянки відновлюються два перпендикуляри до осі абсцис: вісь I - I - відкладається виграш при стратегії A1 вісь II - II - відкладається виграш за стратегії A2 Нехай гравець B застосовує стратегію B1; вона дає на осях I - I і II - II відповідно точки з ординатами a11 і a21. Проводимо через ці точки пряму B1−B1′. За будь-якої змішаної стратегії SA = (p1 , p2) виграш гравця визначається точкою N на прямій B1 −B1′ , що відповідає точці SA на осі абсцис, що ділить відрізок щодо p2: p1 . Очевидно, таким же способом може бути побудована і пряма B2 − B2′ , що визначає виграш при стратегії B2 . 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ Необхідно знайти оптимальну стратегію SA∗ , тобто. таку, за якої мінімальний виграш гравця A (за найгіршої для нього поведінки гравця B) звертався б у максимум. І тому будуватися нижня межа виграшу гравця A при стратегіях B1 , B2 , тобто. ламана B1 N B2′;. На цьому кордоні лежатиме мінімальний виграш гравця A за будь-якої його змішаної стратегії, точка N , в якій цей виграш досягає максимуму та визначає рішення та ціну гри. .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S . 1∗ P Ордината точки N є нічим іншим, як ціна гри ν, її абсцис дорівнює ∗2 , а відстань до правого кінця відрізка дорівнює ∗1 , тобто. відстань від точки SA∗ до кінців відрізка дорівнюють ймовірностям ∗2 і ∗1 стратегій A2 та A1 оптимальної змішаної стратегії гравця A. в даному випадку рішення гри визначалося точкою перетину стратегій B1 та B2. Нижче наведено випадок, коли оптимальною стратегією гравця є чиста стратегія A2 . Тут стратегія A2 (при будь-якій стратегії противника) вигідніша за стратегію A1 , 13 .y .y .I .I I .I I. I .B2′ . 1′ B .B1′ B . 2 .B2′ B . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I.I. .x.I. .x. 2∗ P . A∗ S = A2. 2∗ P . A∗ S = A2 Правіше показаний випадок, коли явно невигідна стратегія є у гравця B. Геометрична інтерпретація дає можливість наочно зобразити також нижню ціну гри α і верхню β .y .I .I .I I .B2 .B1′ .N .B1 . B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . A∗ S . 1∗ P На тому ж графіку можна дати і геометричну інтерпретацію оптимальних стратегій гравця B . Неважко переконатися, що частка q1∗ стратегії B1 оптимальної змішаної стратегії SB∗ = (q1∗ , q2∗) дорівнює відношенню довжини, відрізка KB2 до суми довжин відрізків KB1 і KB2 на осі I −I: .y .I .I . B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S . 1∗ P 14 KB2 q1∗ = KB2 + KB1 або LB2′ q1∗ = LB2′ + LB1′ Оптимальну стратегію SB∗ = (q1∗ , q2∗) можна знайти й іншим способом, якщо поміняти місцями гравців B та B, а замість максимуму нижньої межі виграшу розглянути мінімум верхньої межі. .y .I .I I .A2 .A′1 .N .A1 .A′2 .I I .I . .x .q2∗ . B∗ S .q1∗ 15 3.2. Ігри 2×n та m×2 Розв'язання ігор 2×n та m×2 ґрунтується на наступній теоремі. Теоремма 3. Будь-яка кінцева гра m × n має рішення, в якому число активних стратегій кожної сторони не перевищує найменшого з чисел m і n. Відповідно до цієї теореми у гри 2 × n завжди є рішення, в якому кожен гравець має не більше двох активних стратегій. Варто тільки знайти ці стратегії, і гра 2×n перетворюється на гру 2×2, яка вирішується елементарно. Знаходження активних стратегій може виконуватися графічним способом: 1) будується графічна інтерпретація; 2) визначається нижня межа виграшу; 3) виділяються на нижній межі виграшу дві стратегії другого гравця, яким відповідають дві прямі, що перетинаються в точці з максимальною ординатою (якщо в ній перетинаються більше двох прямих, береться будь-яка пара) - ці стратегії є активними стратегіями гравця B. Таким чином , гра 2 × n зведена до гри 2 × 2. Також може бути вирішена гра m × 2 з тією різницею, що будується не нижня, а верхня межа виграшу і на ній шукається не максимум, а мінімум. Приклад 5 Знайти рішення гри () 7 9 8 A= 10 6 9 Рішення: використовуючи геометричний метод, виділяємо активні стратегії. Прямі B1 − B1′, B2 − B2′ та B3 − B3′ відповідають стратегіям B1, B2, B3. Ламана B1 N B2 – нижня межа виграшу гравця. Гра має рішення S∗A = (23, 31); S∗B = (0.5; 0.5; 0); v = 8. 16 .y .I .I I . 1′ B B . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . .x. 2∗ P . A∗ S . 1∗ P 17 Предметний покажчик гра, 2 хід, 3 2 × 2, 10 особистий, 3 2 × 2, 9 випадковий, 3 геометрія, 12 чиста ціна гри, 7 приклади, 10 2 × n, 9, 16 m × 2, 9, 16 нескінченна, 4 у нормальній формі, 5 кінцева, 4 багатоходова, 4 одноходова, 4 матрична, 5 парна, 2 c нульовою сумою, 2 антагоністична, 2 неантагоністична, 2 рішення, 5 у змішаних стратегіях, 5, 9 у чистих стратегіях , 5 з сідловою точкою, 7 ціна, 5 верхня, 6 нижня, 6 чиста, 7 максимін, 6 матриця гри, 5 платіжна, 5 мінімакс, 6 нормалізація гри, 5 стратегія, 4 максимінна, 6 мінімаксна, 6 оптимальна, 4 змішана 5 теорія ігор, 2 18

  • Змішана стратегія гравців. Знайти змішану стратегію гравців.
  • Моделювання ігрової схеми в теорії ігор. Підприємство має можливість самостійно планувати обсяги випуску сезонної продукції П1, П2, П3.
  • Рішення матричної гри з використанням графічного методу

    Вирішення матричної гри з використанням методів лінійного програмування

    1. Матрична гра. Використання симплексного методу. Знаходимо гарантований виграш, який визначається нижньою ціною гри a = max(a i) = 2, яка вказує на максимальну чисту стратегію A 1 .
    2. Приклад рішення матричної гри методом лінійного програмування. Вирішити матричну гру методом лінійного програмування.

    Дайте графічну виставу, приведіть до нормальної форми і знайдіть точне рішення позиційної гри з наступною функцією виграшів:
    1-й хід робить гравець А: він вибирає число x з двох чисел.
    2-й хід робить гравець: не знаючи про вибір гравця А на 1-му ході, він вибирає число y з безлічі двох чисел.
    3-й хід робить гравець А: він вибирає число z з двох чисел, знаючи значення y, обране гравцем В на 2-му ході, але не пам'ятаючи власного вибору x на 1-му ході.

    Ігри із природою

    1. Статистичні ігри
      Сільськогосподарське підприємство може реалізувати деяку продукцію:
      А1) відразу після збирання;
      А2) у зимові місяці;
      А3) у весняні місяці.
      Прибуток залежить від ціни реалізації в даний період часу, витратами на зберігання та можливих втрат. Розмір прибутку, розрахований для різних станів-співвідношень доходу та витрат (S1, S2 та S3), протягом усього періоду реалізації, представлений у вигляді матриці (млн.руб.)
    2. Фірма виробляє сукні та костюми, реалізація яких залежить від стану погоди. Витрати фірми протягом квітня-травня на одиницю продукції становитимуть...
    3. Розв'язання задачі про запаси сировини. За деякий період часу на підприємстві споживання вихідної сировини в залежності від її якості становить 1 , 2 , 3 і 4 .
    4. Стратегії крайнього песимізму, крайнього оптимізму та оптимізму-песимізму

    Біматричні ігри

    Дерево розв'язків у теорії ігор (приклад розв'язання задачі).

    див. також збірник рішень з теорії ігор (вирішення матричних ігор), типові завдання з ЕММ (лінійне програмування, теорія ігор).

    У місті працюють три телекомпанії: АВС, СВSі NВС. Ці компанії можуть розпочинати програму вечірніх новин о 6.30 або о 7.00. 60% телеглядачів вважають за краще дивитися вечірні новини о 6.30, а 40% — о 7.00. Найбільш популярна програма вечірніх новин у компанії АВСНайменшою популярністю користуються новини, підготовлені компанією NВС. Частка телеглядачів вечірніх новинних програмпредставлена ​​в таблиці (NBС, СВS, АВС)

    АВС: 6.30

    NНД

    СВS

    АВС: 7.00

    NBЗ

    СВS

    Знайти оптимальні стратегії компаній за часом показу програм новин

    Вказівка ​​до рішення: у грі існує домінована стратегія

    Із популярного американського блогу Cracked.

    Теорія ігор займається тим, що вивчає способи зробити найкращий хід і в результаті отримати якомога більший шматок виграшного пирога, відчепивши частину його в інших гравців. Вона вчить аналізувати безліч факторів і робити логічно зважені висновки. Я вважаю, що її потрібно вивчати після цифр і до алфавіту. Просто тому, що надто багато людей приймають важливі рішення, ґрунтуючись на інтуїції, таємних пророцтвах, розташуванні зірок та інших подібних. Я ретельно вивчив теорію ігор, і тепер хочу розповісти вам про її засади. Можливо, це додасть здорового глуздуу ваше життя.

    1. Дилема ув'язненого

    Берто і Роберт заарештували за пограбування банку, не зумівши правильно використовувати для втечі викрадений автомобіль. Поліція не може довести, що саме вони пограбували банк, але спіймала їх на місці злочину в вкраденому автомобілі. Їх розвели по різних кімнатах і кожному запропонували угоду: здати спільника та відправити його за ґрати на 10 років, а самому вийти на волю. Але якщо вони обидва здадуть один одного, то кожен отримає по 7 років. Якщо ж ніхто нічого не скаже, то обидва сядуть на 2 роки тільки за викрадення автомобіля.

    Виходить, що коли Берто мовчить, але Роберт здає його, Берто сідає у в'язницю на 10 років, а Роберт виходить на волю.

    Кожен ув'язнений - гравець, і вигода кожного може бути представлена ​​у вигляді "формули" (що отримають вони обидва, що отримає інший). Наприклад, якщо я вдарю тебе, моя виграшна схема буде виглядати так (я отримую грубу перемогу, ти страждаєш від сильного болю). Оскільки кожен в'язень має два варіанти, ми можемо представити результати в таблиці.

    Практичне застосування: Виявлення соціопатів

    Тут ми бачимо основне застосування теорії ігор: виявлення соціопатів, які думають лише себе.Справжня теорія ігор - це потужний аналітичний інструмент, а дилетантство часто служить червоним прапором, що з головою видає людину, позбавлену поняття честі. Люди, які роблять розрахунки інтуїтивно, вважають, що краще вчинити некрасиво, тому що це призведе до більш короткого терміну в'язниці незалежно від того, як надійде інший гравець. Технічно це правильно, але тільки якщо ви недалекоглядна людина, яка ставить цифри вище людських життів. Саме тому теорія гра така популярна у сфері фінансів.

    Справжня проблема дилеми ув'язненого у цьому, що вона ігнорує дані.Наприклад, у ній не розглядається можливість вашої зустрічі з друзями, родичами, або навіть кредиторами людини, яку ви ув'язнили на 10 років.

    Найгірше те, що всі учасники дилеми ув'язненого діють так, ніби ніколи не чули її.

    А найкращий хід - зберігати мовчання, і через два роки разом із добрим другомкористуватися загальними грошима.

    2. Домінуюча стратегія

    Це ситуація, за якої ваші дії дають найбільший виграшнезалежно від дій опонента.Що б не відбувалося – ви все зробили правильно. Ось чому багато людей при «дилемі ув'язненого» вважають: зрада призводить до «найкращого» результату незалежно від того, що робить інша людина, а ігнорування дійсності, властиве цьому методу, змушує виглядати супер-просто.

    Більшість ігор, в які ми граємо, не мають строго домінуючих стратегій, бо інакше вони були б просто жахливими. Уявіть, що ви завжди робили б те саме. У грі «камінь-ножиці-папір» немає домінуючої стратегії. Але якби ви грали з людиною, у якої на руках одягнені прихватки, і вона могла показати тільки камінь або папір, у вас була б домінуюча стратегія: папір. Ваш папір оберне його камінь або приведе до нічиєї, і ви не зможете програти, тому що суперник не може показати ножиці. Тепер, коли у вас є домінуюча стратегія, потрібно бути дурнем, щоб спробувати щось інше.

    3. Битва статей

    Ігри цікавіші, коли у них немає строго домінуючої стратегії. Наприклад, битва статей. Анджалі та Борислав йдуть на побачення, але не можуть вибрати між балетом та боксом. Анджалі любить бокс, тому що їй подобається, коли ллється кров на радість глядачів, які кричать натовпу, які вважають себе цивілізованими тільки тому, що вони заплатили за чиїсь розбиті голови.

    Борислав хоче дивитися балет, тому що він розуміє, що балерини проходять через величезну кількість травм та найскладніших тренувань, знаючи, що одна травма може покласти край усьому. Артисти балету – найбільші спортсмени на Землі. Балерина може вдарити вас ногою в голову, але ніколи цього не зробить, тому що її нога коштує набагато дорожче за ваше обличчя.

    Кожен з них хоче піти на свій улюблений захід, але вони не хочуть насолоджуватися ним наодинці, таким чином отримуємо схему їхнього виграшу: найбільше значення- робити те, що їм подобається, найменше значення- просто бути з іншою людиною, і нуль – бути на самоті.

    Деякі люди пропонують вперто балансувати на межі війни: якщо ви, незважаючи ні на що, робите те, що хочете, інша людина має підлаштуватися на вибір або втратити все. Як я вже казав, спрощена теорія ігор добре виявляє дурнів.

    Практичне застосування: Уникайте гострих кутів

    Звичайно, і ця стратегія має свої значні недоліки. Насамперед, якщо ви ставитеся до ваших побачень як до «битви підлог», вона не спрацює. Розлучіться, щоб кожен з вас міг знайти людину, яка їй сподобається. А друга проблема полягає в тому, що у цій ситуації учасники настільки не впевнені у собі, що не можуть цього зробити.

    По-справжньому виграшна стратегія для кожного – робити те, що вони хочуть,а потім, або наступного дня, коли вони будуть вільні, піти разом до кафе. Або чергувати бокс і балет, поки у світі розваг не відбудеться революція і не буде винайдено боксерський балет.

    4. Рівновага Неша

    Рівновага Неша - це набір ходів, де ніхто не хоче зробити щось по-іншому після доконаного факту.І якщо ми зможемо змусити це працювати, теорія ігор замінить всю філософську, релігійну і фінансову системуна планеті, тому що «бажання не прогоріти» стало для людства потужнішою рушійною силою, ніж вогонь.

    Давайте швидко поділимо 100 $. Ви і я вирішуємо, скільки з сотні ми вимагаємо та одночасно озвучуємо суми. Якщо наша Загальна сумаменше ста, кожен одержує те, що хотів. Якщо загальна кількість більше ста, той, хто попросив найменшу кількість, отримує бажану суму, а жадібніша людина отримує те, що залишилося. Якщо ми просимо однакову суму, кожен отримує 50$. Скільки ви попросите? Як ви поділите гроші? Існує єдиний виграшний перебіг.

    Вимога 51$ дасть вам максимальну суму незалежно від того, що вибере ваш супротивник. Якщо він попросить більше, ви отримаєте 51$. Якщо він попросить 50$ або 51$, ви отримаєте 50$. І якщо він попросить менше 50$, ви отримаєте 51$. У будь-якому випадку немає жодного іншого варіанту, який принесе вам більше грошейніж цей. Рівновага Неша - ситуація, в якій ми обидва вибираємо 51$.

    Практичне застосування: спочатку думайте

    У цьому суть теорії ігор. Не обов'язково виграти і тим більше нашкодити іншим гравцям, але обов'язково зробити найкращий для себе хід незалежно від того, що підготують для вас оточуючі. І навіть краще, якщо цей хід буде вигідним і для інших гравців. Це свого роду математика, яка б змінити суспільство.

    Цікавий варіант цієї ідеї – розпиття спиртного, яке можна назвати Рівновагою Неша з тимчасовою залежністю. Коли ви досить багато п'єте, то не дбаєте про вчинки інших людей незалежно від того, що вони роблять, але наступного дня ви дуже шкодуєте, що не вчинили інакше.

    5. Гра в орлянку

    В орлянці беруть участь Гравець 1 та Гравець 2. Кожен гравець одночасно вибирає орла чи решку. Якщо вони вгадують, Гравець 1 отримує пенс Гравця 2. Якщо ж ні – Гравець 2 отримує монету Гравця 1.

    Виграшна матриця проста…

    …оптимальна стратегія: грайте повністю навмання.Це складніше, ніж ви думаєте, тому що вибір має бути абсолютно випадковим. Якщо у вас є переваги орла або решки, противник може використовувати його, щоб забрати гроші.

    Звичайно, справжня проблема тут полягає в тому, що було б набагато краще, якби вони просто кидали один пенс один одному. В результаті їх прибуток був би таким самим, а отримана травма могла б допомогти цим нещасним людям відчути щось, крім жахливої ​​нудьги. Адже це найгірша граз існуючих будь-коли. І це ідеальна модель для пенальті серії.

    Практичне застосування: Пенальті

    У футболі, хокеї та багатьох інших іграх, додатковий час – це серія пенальті. І вони були б цікавішими, якби будувалися на тому, скільки разів гравці в повній формізможуть зробити «колесо», бо це принаймні було б показником їхніх фізичних здібностей і на це було б смішно подивитися. Воротарі не можуть чітко визначити рух м'яча або шайби на самому початку їхнього руху, тому що, на превеликий жаль, у наших спортивних змаганнях роботи все ще не беруть участі. Воротар повинен вибрати лівий або правий напрямок і сподіватися, що його вибір збігається з вибором супротивника, який б'є по воротах. У цьому є щось спільне із грою в монетку.

    Однак зверніть увагу, що це не ідеальний прикладподібності з грою в орла і решку, тому що навіть за правильному виборінапрямки воротар може не зловити м'яч, а нападник може не влучити у ворота.

    Отже, який наш висновок відповідно до теорії ігор? Ігри з м'ячем повинні закінчуватися способом «мультим'ячу», де кожну хвилину гравцям віч-на-віч виводиться додатковий м'яч/шайба, до отримання однієї зі сторін певного результату, який був показником справжньої майстерності гравців, а не ефектним випадковим збігом.

    Зрештою, теорія ігор повинна використовуватися для того, щоб зробити гру розумнішою. Отже краще.

    Дар'я Золотих 09.02.2015

    Сподобався піст?
    Підтримай Фактрум, натисніть:





    Поділіться з друзями або збережіть для себе:

    Завантаження...