Экспертные оценки минимаксного метода и методов Байеса — Лапласа и Сэвиджа. Критерии Байеса, Лапласа, Сэвиджа, Вальда, Гурвица

Предполагалось бы, что месторождения расположены равномерно по всей территории. Такой подход навряд ли можно считать правомерным, поскольку выводы, полученные с его помощью, не имеют под собой логической основы. Впрочем, критерий Байеса - Лапласа не произвольнее критерия Гурвица.  


Оптимистичный подход, подходы на основе критерия Гурвица , критерия Байеса - Лапласа и критерия Сэвиджа имеют в данном случае следующий вид  

Байеса (Лапласа) критерий 27, 224 Байесовский подход 27 Баланс 27 Балансирующая (или равновесная)  

Среди этих критериев и правил особое место занимают правила и критерии, основанные на известной теореме Байеса. Подход, основанный на этой теореме, позволяет, во-первых, использовать некоторые методологические принципы естественных наук в управлении, а во-вторых, обеспечить корректировку суждений и принятия решений по мере накопления опыта. Последнее означает обучение управлению (в смысле принятия решений) в процессе самого управления 1.  

Иногда в ходе операции неопределенность раскрывается постепенно, по мере поступления информации. В этом случае для обоснования решений удобно использовать такой объективный критерий, как апостериорная вероятность события. Саму эту вероятность проще всего вычислять с использованием формулы Байеса в терминах шансов. Рассмотрим суть этого подхода.  

Критерий Байеса применяется в тех случаях, когда известно распределение вероятностей возможных состояний. Если это дискретное распределение вероятностей задано набором вероятностей , то по критерию Байеса стратегия Si предпочтительнее Sj (s > если  

Частными случаями этого критерия являются критерий Байеса (при А = 1) и критерий Вальда (при А = 0).  

Критерий Байеса-Лапласа в отличие от критерия Вальда учитывает каждое из возможных следствий всех вариантов решений  

Критерий Байеса-Лапласа предъявляет к ситуации, в которой принимается решение , следующие требования  

При z = 1 критерий преобразуется в критерий Байеса-Лапласа, а при z = О превращается в критерий Вальда . Таким образом, выбор параметра z подвержен влиянию субъективизма. Кроме того, без внимания остается и число реализаций. Поэтому этот критерий редко применяется при принятии технических решений.  

Мы рассмотрели несколько основных подходов к принятию решения в случае неопределенных факторов в изучаемой модели. Можно привести примеры, когда все критерии принятия решения приводят к выбору одного и того же решения x e X, обычно же этого не происходит, каждый критерий приводит к своему решению (пример такого рода рассмотрен в следующей главе). Поэтому возникают дискуссии о том, какой критерий и когда предпочтительнее,. делаются попытки построить на основе нескольких критериев единственный. В частности, критерий Гурвица является таким объединением двух критериев. Предпринимались также попытки объединить критерий Гурвпца и критерий Байеса - Лапласа. Все получаемые критерии имеют высокую степень произвольности. По нашему мнению, единственным путем преодоления этих трудностей является многокритериальный подход, в котором ЛПР смогло бы рассмотреть варианты принимаемого решения, эффективные с точки зрения совокупности показателей, и выбрать среди них наиболее подходящий. Такой подход использован в примере, приведенном в следующей главе. Конечно, совокупность показателей при этом должна, быть не слишком велика.  

Обычно опробуется несколько конфигураций с различным числом элементов и структурой соединений. Одними из наиболее важных показателей являются объем обучающего множества и обеспечение способности к обобщению при дальнейшей работе, и нужного результата можно достичь на различных схемах. Чаще всего используются процедуры последовательного спуска (с подтверждающим множеством) или N-кратного перекрестного подтверждения . Могут быть применены и более мощные информационные критерии (1) обобщенное перекрестное подтверждение (G V), итоговая ошибка предсказания Акаике (FPE), критерии Байеса (BI) и Акаике (AI) (см. ). Для того чтобы улучшить способности к обобщению и устранить опасность переобучения, применяются также уменьшение весов и их исключение (прореживание дерева). При этом изменяется архитектура сети удаляются некоторые связи и изучается, какое влияние они оказывали на эффективность. >,  

БАЙЕСА (ЛАПЛАСА) КРИТЕРИЙ - в теории решений критерий принятия решений в условиях отсутствия какой-либо информации об относительных вероятностях стратегий "природы". (См. Неопределенные задачи .) По Б.(Л.)к. предлагается придать равные вероятности всем рассматриваемым стратегиям, после чего принять ту из них, при которой ожидаемый выигрыш окажется наибольшим. Имеет тот недостаток, что круг оцениваемых альтернатив в одной и той же задаче может быть различным и соответственно различной может быть также относительная вероятность каждой из них.  

Критерий Ходжеса - Лемана. При реализации этого критерия используются два субъективных показателя во-первых, распределение вероятностей , используемое в критерии Байеса, во-вторых, "параметр оптимизма" из критерия Гурвица  

Критерий Ходжа-Лемана базируется одновременно на критериях Вальда и Байеса-Лапласа  

Если при принятии решения ОПР известны вероятности Рj состояний Пj, то будем считать, что рассматривается ситуация в условиях частичной неопределенности.

Игрок принимает i-то решение (использовать стратегию Аi) в условиях частичной неопределенности. Он ожидает получить доход aij при реализации состояния Пj, который является случайной величиной Qi с рядом распределения, представленных в табл. 3.9.

Таблица 3.9. Ряд распределения случайной величины Qi

В этом случае для принятия решения можно использовать один из следующих критериев.

Критерий Байеса

Это критерий максимизации среднего ожидаемого дохода. Критерий Байеса называется также критерию максимума среднего выигрыша.

Как известно, математическое ожидание М (Qi) случайной величины Qi представляет собой средний ожидаемый доход, который сказывается также Qi можно найти по формуле (3.21):

Для каждой стратегии Аi (i-го варианта решения) следует рассчитать средний ожидаемый доход (математическое ожидание) по формуле (3.21), и в соответствии с критерием Байеса следует выбирать вариант (стратегию Аi), для которого достигается наибольшее значение:

Критерий Байеса используют в ситуации, в которой принимается решение, задовальняе следующим условиям:

вероятность появления состояния Пj известна и не зависит от времени; принято решение теоретически допускает бесконечную большое количество реализаций;

допускается некоторый риск при малых числах реализаций.

варианте решения достигается наибольший средний доход и какова величина этого дохода.

Решение. Запишем матрицу выигрышей с дополнительным строкой с вероятностями состояний Пj в виде таблицы 3.10.

Таблица 3.10. Матрица выигрышей игры

Найдем для каждой стратегии Аi средний ожидаемый доход по формуле (3.21):

При применении стратегии Аи ОПР может получить доход, который отличается от максимального, что и принимается за величину риска. Риск случайной величиной Ri с рядом распределения, который приведен в табл. 3.11.

Таблица 3.11. Ряд распределения случайной величины Ri

Для каждой стратегии Аi (i-го варианта решения) следует рассчитать средний ожидаемый риск (математическое ожидание) по формуле (3.23), и в соответствии с критерием Байеса следует выбирать вариант, для которого достигается наименьшее значение:

В этом случае критерий Байеса выступает как критерий минимизации среднего ожидаемого риска. Критерий Байеса можно назвать как критерий минимума среднего проигрыша.

Пример 3.9. Для выходных данных примера 3.8 на основе матрицы рисков по критерию Байеса выяснить, при каком варианте решения достигается наименьший средний риск и какова величина этого риска.

Разгрузка Обязательства. Запишем матрицу рисков игры с дополнительным строкой с вероятностями состояний Пи в виде таблицы 3.12.

Таблица 3.12. Матрица рисков игры

Найдем для каждой стратегии Аi средний ожидаемый риск по формуле (3.23):

Критерий Бернулли-Лапласа

Критерий Бернулли-Лапласа используют в случае, когда можно предположить, что любой из вариантов среды не более вероятен, чем другой. Здесь предполагается, что все состояния среды (все варианты реальной ситуации) равновероятны.

Для каждой стратегии Аи (и го варианта решения) следует рассчитать средний ожидаемый доход (математическое ожидание) по формуле (3.25), и в соответствии с критерием Бернулли-Лапласа следует выбирать вариант (стратегию Аi), для которого достигается наибольшее значение:

Пример 3.10. Пусть для игры, которую задано матрицей выигрышей в примере 3.2, ОПР считает ровно вероятными все состояние природы

выяснить при каком варианте решения достигается наибольший средний доход и какова величина этого дохода.

Решение. Запишем матрицу выигрышей с дополнительным строкой с вероятностями состояний Пj в виде таблицы 3.13.

Таблица 3.13

Найдем для каждой стратегии Аi средний ожидаемый доход по формуле (3.25):

Рассмотрим риск как случайную величину Ri с рядом распределения, который приведен в табл. 3.14.

Таблица 3.14. Ряд распределения случайной величины Ri

Математическое ожидание М (Ri) случайной величины Ri представляет собой средний ожидаемый риск, что вычисляется по формуле (3.27)

Для каждой стратегии Аi (i-го варианта решения) следует рассчитать средний ожидаемый риск (математическое ожидание) по формуле (3.27), и в соответствии с критерием Бернулли-Лапласа следует выбирать стратегию (вариант), для которой достигается наименьшее значение:

Пример 3.11. Для выходных данных примера 3.10 на основе матрицы рисков по критерию Бернулли-Лапласа выяснить, при каком варианте решения достигается наименьший средний риск и какова величина этого риска.

Решение. Запишем матрицу рисков игры с дополнительным строкой с вероятностями состояний Пj в виде таблицы 3.15.

Таблица 3.15. Матрица рисков игры

Найдем для каждой стратегии Аi средний ожидаемый риск по формуле (3.27):

Следует отметить, что критерий Бернулли-Лапласа непосредственно не относится к случаю частичной неопределенности, и его применяют в условиях полной неопределенности.

Выигрыш-критерий Байеса является основным критерием оптимальности стратегий, который используется при принятии решений в условиях риска (см. §2.1).

Рассмотрим игру с природой, задаваемой платежной матрицей А (см. (2.1.2)). Пусть q = - вектор вероятностей состояний природы, удовлетворяющих условиям (2.1.1), которые удобно расположить в добавленной строке матрицы (2.1.2):


Референд Томас Байес

(1702 - 17.04.1761)

Выигрыш-критерием Байеса оптимальности чистых стратегий с вектором ч вероятностей состояний природы (В 1 ’ (q) -критерием 2 ) называется критерий, по которому:

- показателем (В’’ (q) -показателем) эффективности чистой стратегии

A-(i = 1,2.....т) называется величина

- ценой (В 1 ’(q)-ценой) игры в чистых стратегиях (множества S c ), называется наибольший из показателей эффективности Bj’{q), /" = 1,2..., т, чистых стратегий:

- оптимальной (В 1 ’ (q) -оптимальной) во множестве S c чистых стратегий называется стратегия A k е S 1 с максимальным показателем эффективности

Оптимальную стратегию также называют байесовской стратегией. Так как показатель эффективности Bj’(q) стратегии А к есть взвешенная средняя выигрышей при этой стратегии, то оптимальная стратегия является по этому критерию оптимальной не в каждом отдельном случае, а во взвешенно среднем.

Равенство (2.5.2) можно записать в векторной форме:

где « г » - значок транспонирования.

Как видно из (2.5.3) и (2.5.4) во множестве чистых стратегий показатель эффективности оптимальной стратегии совпадает с ценой игры.

Интерпретируя чистую стратегию А- как дискретную случайную величину со значениями a n ,a i2 ,...,a irl , которые она принимает с вероятностями соответственно q u q 2 ,...,q n , получаем, что B"‘(q) - показатель эффективности стратегии А- сеть ее математическое ожидание. Именно поэтому выигрыш-критерий Байеса называют также «критерием математического ожидания».

Из (2.5.2) и (2.5.3) следуют оценки: где а™" = min а, я"“ = шах а п, а а " ттт = max min а, и max max л, -соот-

ISjSn 1 1 Klfimisy&i 1 j 1

встственно максимин и максияшкс игры в чистых стратегиях. Подчеркнем, что левые и правые части неравенств (2.5.5) и (2.5.6) нс зависят от вектора q.

Чистая стратегия, наименьший выигрыш при которой совпадает с максими- ном, называется максиминной стратегией. Если игрок А придерживается макси- минной стратегии А к, то при любом состоянии природы Я имеет место неравенство а к1 >а"” т =а" юхтт, у = 1,2,..., и, означающее, что максимин экономически

представляет собой гарантированный наименьший выигрыш игрока А при любых вероятностях состояний природы, если только игрок А придерживается максиминной стратегии.

Множество чистых стратегий, оптимальных во множестве S c чистых стратегий по B p (q) -критерию, обозначим через (? с) 0(а "’»_ общее решение игры с природой в чистых стратегиях можно интерпретировать как двухэлементное множество {(S c) 0 , ?"(()}.

Под частным решением игры с природой в чистых стратегиях можно понимать двухэлементное множество, одним из элементов которого является непустая неполная совокупность чистых стратегий, оптимальных во множестве чистых стратегий, а другим - цена игры в чистых стратегиях.

Перейдем в область смешанных стратегий 5.

По В 1 ’(q) -критерию оптимальности смешанных стратегий:

- показателем (В 1 ’ (q) -показателем) эффективности смешанной стратегии Р = (р 1 ,р 2 ,...,р т) назовем взвешенно среднее значение выигрышей (2.2.3) с весами q l ,q 2 ,...,q ll:

- ценой (B p (q) -ценой) игры в смешанных стратегиях назовем наибольший из показателей эффективности (2.5.7):

- оптимальной (В’’(q) -оптимальной) во множестве S смешанных стратегий назовем стратегию Р° =(р", с наибольшим показателем эффективности:

Легко видеть, что если, в частности, смешанная стратегия Р является чистой, например, А к, к е {1,2,...,от}, то её показатель эффективности B p (P;q) как смешанной стратегии, выражаемый формулой (2.5.7), превращается в ее показатель эффективности B p (A t ;q) = Bj’(q) как чистой стратегии, вычисляемый по формуле (2.5.2).

Нетрудно убедиться в том, что показатель эффективности B p (Pq) можно представить в матричной форме:

где А - матрица игры.

В связи с бесконечностью множества 5 смешанных стратегий встает вопрос о существовании оптимальной стратегии в этом множестве. Положительный ответ дает следующая теорема.

Теорема 2.5.1. В любой игре с природой с любым вектором вероятностей ее состояний существует стратегия, оптимальная во множестве смешанных стратегий по выигрыш-критерию Байеса.

Доказательство. Из (2.2.3) и (2.5.7) заключаем, что показатель эффективности В 1 ’ (P,q) как функция смешанной стратегии Р линейна и, следовательно, непрерывна на множестве 5, которое, будучи симплексом, ограничено и замкнуто в от-мерном евклидовом пространстве R"". Следовательно, по теореме Вейерштрасса (, с. 298) функция B p (P;q) достигает на симплексе 5 своей верхней грани, т.е. найдется стратегия Р° = (/>,",р") е 5, удовлетворяющая равенству (2.5.9) ?

Множество S""(су)-оптимальных стратегий во множестве S смешанных стратегий обозначим через s 0(B (ч)) .

В следующей теореме устанавливается связь между показателями эффективности чистых и смешанных стратегий.

Теорема 2.5.2. Показатель эффективности B"Pq) смешанной стратегии Р = (Pi’PiP m) 1,0 В р (q)-критерию представляет собой взвешенное среднее показателей эффективности Bj’(q) чистых стратегий Д, / = 1,2,...,от, по тому же критерию с весами р (, / = 1,2,...,от:

Доказательство. Применяя последовательно равенства (2.5.7), (2.2.3) и (2.5.2), получим:

Пусть Р = (/; | ,р 2 ,...,р т) - произвольная смешанная стратегия. Умножая все части двойного неравенства (2.5.5) на р , и суммируя полученные неравенства по номеру /" от 1 до от, получим на основании (2.5.11) диапазон изменения показателя эффективности B p (Pq) при любых векторах вероятностей состояний природы:

Следующая теорема устанавливает связь между ценами игры в чистых и смешанных стратегиях.

Теорема 2.5.3. По выигрыш-критерию Байеса цены игры в чистых и в смешанных стратегиях равны.

Доказательство. Пусть P = (p l ,p 2 ,...,p m) е S. Используя (2.5.11), (2.5.3) и нормировочное условие вероятностей /?, i = 1,2,...,от, получим:

Так как это неравенство справедливо для любой смешанной стратегии Р, то оно справедливо, в том числе и для стратегии Р°, оптимальной во множестве смешанных стратегий 5: В р Р°q Но левая часть последнего неравенства,

по определению (2.5.9) оптимальной смешанной стратегии, равна цене игры в смешанных стратегиях. Таким образом,

С другой стороны, поскольку с5, то max Bf (q) max В 1 ’ (P:q) или, что то же

Неравенства (2.5.13) и (2.5.14) доказывают требуемое равенство B p c (q) = B p (q) ,

В силу этой теоремы можно нс говорить поотдельности о ценах в чистых и в смешанных стратегиях, а их общее значение назвать просто ценой игры по выигрыш-критерию Байеса и обозначить через B p }

Поделитесь с друзьями или сохраните для себя:

Загрузка...