Експертни оценки на минимаксния метод и методите на Байс-Лаплас и Савидж. Критерии на Бейс, Лаплас, Савидж, Валд, Хурвиц

Предполага се, че находищата са разпределени равномерно по цялата територия. Този подход едва ли може да се счита за легитимен, тъй като изводите, получени с негова помощ, нямат логическа основа. Критерият на Bayes-Laplace обаче не е по-произволен от критерия на Hurwitz.


Оптимистичният подход, подходите, базирани на критерия на Хурвиц, критерия на Байс-Лаплас и критерия на Савидж в този случай имат следната форма

Байесов (Лаплас) критерий 27, 224 Байесов подход 27 Баланс 27 Балансиране (или равновесие)

Сред тези критерии и правила специално място заемат правилата и критериите, основани на добре известната теорема на Байс. Подходът, основан на тази теорема, позволява, първо, да се използват някои методологични принципи природни наукив управлението, и второ, да се гарантира, че преценките и вземането на решения се коригират с натрупания опит. Последното означава да се научим да управляваме (в смисъл на вземане на решения) в процеса на самото управление 1.

Понякога по време на операцията несигурността се разкрива постепенно, когато информацията става достъпна. В този случай, за да се обосноват решенията, е удобно да се използва такъв обективен критерий като последващата вероятност от събитие. Самата тази вероятност се изчислява най-лесно с помощта на формулата на Bayes по отношение на шансове. Нека да разгледаме същността на този подход.

Бейсовият критерий се използва в случаите, когато е известно вероятностното разпределение на възможните състояния. Ако това дискретно разпределение на вероятностите е дадено от набора от вероятности, тогава, съгласно критерия на Байес, стратегията Si е за предпочитане пред Sj (s > ако

Частни случаи на този критерий са байесовият критерий (за A = 1) и критерият на Wald (за A = 0).

Критерият Bayes-Laplace, за разлика от критерия Wald, взема предвид всяка от възможните последици от всички варианти на решение

Критерият на Байс-Лаплас налага следните изисквания към ситуацията, в която се взема решението

При z = 1 критерият се преобразува в критерия на Байс-Лаплас, а при z = O се преобразува в критерия на Валд. Следователно изборът на параметър z е субективен. В допълнение, броят на реализациите също се игнорира. Следователно този критерий рядко се използва при вземане на технически решения.

Разгледахме няколко основни подхода за вземане на решения в случай на несигурни фактори в изследвания модел. Могат да се дадат примери, когато всички критерии за решение водят до избора на едно и също решение x e X, но обикновено това не се случва, всеки критерий води до собствено решение (пример от този вид е разгледан в следващата глава). Затова се водят дискусии кой критерий и кога е за предпочитане. правят се опити да се конструира уникален въз основа на няколко критерия. По-специално, критерият на Хурвиц е такова обединение на два критерия. Правени са и опити за комбиниране на теста на Hurvpetz и теста на Bayes-Laplace. Всички получени критерии имат висока степенпроизвол. Според нас единственият начин за преодоляване на тези трудности е многокритериалният подход, при който вземащият решение може да разгледа ефективни от съвкупността от показатели варианти за вземане на решение и да избере най-подходящия от тях. Този подход се използва в примера, даден в следващата глава. Разбира се, съвкупността от показатели в този случай не трябва да бъде твърде голяма.

Обикновено се пробват няколко конфигурации с различен брой елементи и структура на свързване. Един от най-важните показатели е обемът на обучителния набор и осигуряването на способност за обобщаване по време на по-нататъшна работа, като желаният резултат може да бъде постигнат по различни схеми. Най-често използваните процедури са последователно спускане (с набор за потвърждение) или N-кратно кръстосано валидиране. Могат да се прилагат и по-мощни информационни критерии (1) генерализирано кръстосано валидиране (G V), обща грешка при прогнозиране на Akaike (FPE), тестове на Bayesian (BI) и Akaike (AI) (вижте ). За да се подобрят способностите за обобщение и да се елиминира опасността от прекомерно оборудване, се прилагат и намаляване на теглото и елиминиране (изтъняване на дърветата). Това променя архитектурата на мрежата, премахва някои връзки и изследва какъв ефект имат върху ефективността. >,

КРИТЕРИЙ НА БАЙЕС (ЛАПЛАС) - в теорията на решенията, критерий за вземане на решение при липса на каквато и да е информация за относителните вероятности на стратегиите на "природата". (Вж. Неопределени задачи.) Според Б.(Л.)к. предлага се да се дадат равни вероятности на всички разглеждани стратегии и след това да се приеме тази, за която очакваната печалба ще бъде най-голяма. Недостатъкът му е, че обхватът на оценените алтернативи в една и съща задача може да бъде различен и съответно различни могат да бъдат относителна вероятноствсеки от тях.

Критерий на Ходжес-Леман. При прилагането на този критерий се използват два субективни показателя, първо, вероятностното разпределение, използвано в байесовия критерий, и второ, "параметърът на оптимизъм" от критерия на Хурвиц

Критерият на Ходж-Леман се основава едновременно на критериите на Уолд и Байс-Лаплас

Ако вероятностите Рj на състоянията Пj са известни при вземане на решение на ОПР, тогава ще приемем, че ситуацията се разглежда в условията на частична несигурност.

Играчът взема i-то решение (да използва стратегия Аi) в условия на частична несигурност. Той очаква да получи доход aij при реализиране на състоянието Pj, което е случайна променлива Qi с поредица от разпределения, представени в табл. 3.9.

Таблица 3.9. Серия на разпределение на случайната променлива Qi

В този случай за вземане на решение може да се използва един от следните критерии.

Критерий на Бейс

Това е критерий за максимизиране на средната очаквана доходност. Критерият на Bayes се нарича още критерий за максимална средна печалба.

Както е известно, очаквана стойност M (Qi) на случайната променлива Qi е средният очакван доход, който също влияе върху Qi, може да се намери по формулата (3.21):

За всяка стратегия Аi (i-тият вариант на решение) трябва да се изчисли средният очакван доход (математическо очакване) по формулата (3.21) и в съответствие с критерия на Бейс трябва да се избере опцията (стратегия Аi), за която се постига най-висока стойност:

Критерият на Бейс се използва в ситуация, в която е взето решение, което отговаря на следните условия:

вероятността за възникване на състоянието Пj е известна и не зависи от времето; взетото решение теоретично позволява безкрайно голям брой реализации;

известен риск е разрешен за малък брой реализации.

решение постига най-висок среден доход и каква е стойността на този доход.

Решение. Нека напишем матрицата на изплащане с допълнителен ред с вероятностите на състоянията Пj под формата на таблица 3.10.

Таблица 3.10. Матрица за изплащане на играта

Да намерим за всяка стратегия Аi средния очакван доход по формулата (3.21):

При прилагане на стратегията Ai ORP може да получи доход, който се различава от максимума, който се приема като размер на риска. Рискът на случайна величина Ri с поредица от разпределения, която е дадена в табл. 3.11.

Таблица 3.11. Серията на разпределение на случайната променлива Ri

За всяка стратегия Аi (i-тия вариант на решение) трябва да се изчисли средният очакван риск (математическо очакване) по формулата (3.23) и в съответствие с критерия на Байес да се избере опцията, за която най-малката стойност е постигнати:

В този случай критерият на Bayes действа като критерий за минимизиране на средния очакван риск. Критерият на Bayes може да се нарече критерий за минимална средна загуба.

Пример 3.9. За резултата от Пример 3.8, базиран на байесовата матрица на риска, открийте коя опция за решение постига най-малък среден риск и каква е величината на този риск.

Ангажимент за разтоварване. Нека напишем матрицата на риска на играта с допълнителен ред с вероятностите за Pi състояния под формата на таблица 3.12.

Таблица 3.12. Матрица на риска на играта

Да намерим за всяка стратегия Аi средния очакван риск по формулата (3.23):

Критерий на Бернули-Лаплас

Критерият на Бернули-Лаплас се използва, когато може да се предположи, че нито един от вариантите на околната среда не е по-вероятен от другия. Тук се приема, че всички състояния на средата (всички варианти на реалната ситуация) са еднакво вероятни.

За всяка стратегия Ai (и опцията за решение), средният очакван доход (математическо очакване) трябва да се изчисли по формулата (3.25) и в съответствие с критерия на Бернули-Лаплас, опцията (стратегия Ai) трябва да бъде избрана за коя е постигната най-висока стойност:

Пример 3.10. Да предположим, че за играта, дадена от матрицата на изплащане в Пример 3.2, ODP счита всички природни състояния за точно вероятни

разберете при кой вариант на решение се постига най-голям среден доход и каква е стойността на този доход.

Решение. Нека напишем матрицата на изплащане с допълнителен ред с вероятностите на състоянията Пj под формата на таблица 3.13.

Таблица 3.13

Да намерим за всяка стратегия Аi средния очакван доход по формулата (3.25):

Обмислете риска като случайна величина Ri с поредица от разпределения, която е дадена в табл. 3.14.

Таблица 3.14. Серията на разпределение на случайната променлива Ri

Математическото очакване M (Ri) на случайната величина Ri е средният очакван риск, който се изчислява по формулата (3.27)

За всяка стратегия Аi (i-тия вариант на решение) трябва да се изчисли средният очакван риск (математическо очакване) по формулата (3.27) и в съответствие с критерия Бернули-Лаплас да се избере стратегията (опцията) за коя най-малка стойност се постига:

Пример 3.11. За резултата от Пример 3.10, въз основа на матрицата на риска, използвайки критерия на Бернули-Лаплас, открийте коя опция за решение постига най-малък среден риск и каква е величината на този риск.

Решение. Нека запишем матрицата на риска на играта с допълнителен ред с вероятностите на състоянията Пj под формата на таблица 3.15.

Таблица 3.15. Матрица на риска на играта

Да намерим за всяка стратегия Аi средния очакван риск по формулата (3.27):

Трябва да се отбележи, че критерият на Бернули-Лаплас не се прилага пряко в случай на частична несигурност и се използва при условия на пълна несигурност.

Критерият за изплащане на Bayes е основният критерий за оптималност на стратегиите, който се използва при вземане на решения при риск (вижте §2.1).

Помислете за игра с природата, дадена от матрицата на изплащане НО(виж (2.1.2)). Позволявам р= е вероятностният вектор на състоянията на природата, които отговарят на условията (2.1.1), които са удобно разположени в добавения ред на матрицата (2.1.2):


Референт Томас Байс

(1702 - 17.04.1761)

Критерий за победа на Бейс за оптималност на чисти стратегии с вектора h на вероятностите на природните състояния (B 1 ’ (q) -критерий 2) се нарича критерий, според който:

- индикатор (B’’ (q) -показател) за ефективността на чистата стратегия

A-(i = 1,2.....T)се нарича количеството

- на цената на (B 1 ’(q)-цената) на играта в чистите стратегии(комплекти S c), се нарича най-големият от показателите за ефективност Bj'(q), /" = 1,2..., T,чисти стратегии:

- оптимален (В 1 ’ (q) -оптимално) в множеството S c от чисти стратегиинаречена стратегия Акд S1с максимална ефективност

Оптималната стратегия се нарича още Байесова стратегия.Тъй като показателят за ефективност Bj'(q)стратегии A къме среднопретеглена стойност на печалбите за тази стратегия, тогава оптималната стратегия е оптимална според този критерий не във всеки отделен случай, а в среднопретеглена стойност.

Равенството (2.5.2) може да бъде записано във векторна форма:

където "r" е иконата за транспониране.

Както се вижда от (2.5.3) и (2.5.4), в набора от чисти стратегии индексът на ефективност на оптималната стратегия съвпада с цената на играта.

Тълкуване на чиста стратегия НО-като дискретна случайна променлива със стойности a n ,a i2 ,...,a irl, които приема съответно с вероятности q u q 2 ,...,q n ,разбираме това B"‘(q)- индикатор за ефективността на стратегията НО-мрежата е нейното математическо очакване. Ето защо критерият за изплащане на Бейс се нарича още " критерий за очакване.

От (2.5.2) и (2.5.3) следват следните оценки: където a" = min а, i"" = проверка а n, a a "ttt= макс мин а,и max max l, -съотв

Е jSn 1 1 Klfimisy&i 1j 1

естествено максимини макси игри в чисти стратегии.Подчертаваме, че лявата и дясната част на неравенствата (2.5.5) и (2.5.6) не зависят от вектора р.

Нарича се чиста стратегия, чиято минимална печалба съвпада с максимина максиминстратегия. Ако играчът НОсе придържа към стратегията maximin НО k, тогава за всяко състояние на природата R имаме неравенството a k1 > a "” t \u003d a" uhtt, y = 1,2,..., u, което означава, че максиминът е икономичен

е гарантираната най-малка печалба на играча НОза всякакви вероятности от природни състояния, освен ако играчът НОсе придържа към стратегията maximin.

Наборът от чисти стратегии, които са оптимални в комплекта S cчисти стратегии за Bp(q)-критерий, означаван с (? с) 0(а "'»_ общо решениеигрите с природата в чистите стратегии могат да се интерпретират като набор от два елемента ((S c) 0 , ?(()).

Конкретно решение на игра с природата в чисти стратегии може да се разбира като набор от два елемента, единият от които е непразна непълна колекция от чисти стратегии, които са оптимални в набора от чисти стратегии, а другият е цена на игра в чисти стратегии.

Нека да преминем към областта на смесените стратегии 5.

от В 1 '(q)-критерий за оптималност на смесените стратегии:

- индикатор (В 1 ’ (q) -показател) на ефективността на смесената стратегия Р = (р 1 ,р 2 ,...,р t)наричаме среднопретеглената стойност на изплащанията (2.2.3) с тегла ql ,q2 ,...,qll:

- на цената (B p (q) -price) игри в смесени стратегиинека назовем най-големия от показателите за ефективност (2.5.7):

- оптимална (В''(q) -оптимална) в множеството S от смесени стратегиинека наречем стратегията =(p", с най-високият показателефективност:

Лесно е да се види, че ако, по-специално, смесената стратегия Ре чисто, напр. А до, до e (1,2,...,от), тогава неговият показател за ефективност Bp(P;q)като смесена стратегия, изразена с формула (2.5.7), се превръща в своя индикатор за ефективност B p (A t ;q) = Bj'(q)като чиста стратегия, изчислена по формула (2.5.2).

Лесно е да се види, че показателят за ефективност B p (Pq)могат да бъдат представени в матрична форма:

където НОе матрицата на играта.

Във връзка с безкрайността на множеството от 5 смесени стратегии възниква въпросът за съществуванеоптимална стратегия в този набор. Положителен отговор дава следната теорема.

Теорема 2.5.1. Във всяка игра с природата с всеки вероятностен вектор на нейните състояния има стратегия, която е оптимална в набора от смесени стратегии според критерия за изплащане на Bayes.

Доказателство. От (2.2.3) и (2.5.7) заключаваме, че показателят за ефективност B 1 '(P,q)като функция на смесена стратегия Ре линеен и следователно непрекъснат на множеството S, което, тъй като е симплекс, е ограничено и затворено в многомерно евклидово пространство R"".Следователно, съгласно теоремата на Вайерщрас (, стр. 298), функцията Bp(P;q)достига горната си повърхност на симплекс 5, т.е. има стратегия = (/>,", p") e 5, удовлетворяващ равенството (2.5.9)?

Множеството от S""(su)-оптимални стратегии в множеството Ссмесените стратегии ще бъдат означени с s 0(B (h)) .

Следващата теорема установява връзка между показателите за ефективност на чистите и смесените стратегии.

Теорема 2.5.2. Индекс на ефективност B"Pq)смесена стратегия P = (Pi'PiP m) 1.0 В p(q)-критерия е претеглена средна стойност на показателите за ефективност Bj'(q) на чистите стратегии D, / = 1,2,...,от, по същия критерий с тегла p (,/ = 1,2,...,от:

Доказателство.Прилагайки последователно равенства (2.5.7), (2.2.3) и (2.5.2), получаваме:

Нека Р = (/; | , p 2 ,...,p t)- произволна смесена стратегия. Умножавайки всички части на двойното неравенство (2.5.5) по Р, и сумирайки получените неравенства с числото /" от 1 до от, получаваме на базата на (2.5.11) диапазона на изменение на показателя за ефективност B p (Pq)за всякакви вероятностни вектори на природни състояния:

Следващата теорема установява връзка между цените на играта в чистите и смесените стратегии.

Теорема 2.5.3. Според критерия за печалба на Bayes цените на игрите в чистите и смесените стратегии са равни.

Доказателство.Позволявам P = (p l ,p 2 ,...,p m)д С.Използвайки (2.5.11), (2.5.3) и условието за нормализиране на вероятностите /?, аз= 1,2,...,от, получаваме:

Тъй като това неравенство е вярно за всяка смесена стратегия R,тогава важи включително и за стратегията R°,оптимален в набора от смесени стратегии 5: В р Р°q Но лявата част на последното неравенство,

по дефиниция (2.5.9) на оптимална смесена стратегия е равна на цената на играта при смесени стратегии. По този начин,

От друга страна, тъй като c5, тогава макс Bf(q)макс В 1' (П:р)или какво е същото

Неравенствата (2.5.13) и (2.5.14) доказват търсеното равенство B p c (q) = B p (q) ,

По силата на тази теорема не можем да говорим поотделно за цените в чистите и смесените стратегии, но техните общо значениепросто го обади цената на играта според критерия за изплащане на Bayesи се обозначава с B p )

Споделете с приятели или запазете за себе си:

Зареждане...