Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. — КиберПедия 

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков.

2018-01-13 378
Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. 0.00 из 5.00 0 оценок
Заказать работу

В играх с природой игроку приходится не только выбирать стратегии для достижения оптимального выигрыша, но и учитывать риски принимаемых решений. Таким образом, критерий Гурвица можно определить относительно рисков, в данном случае, критерий будет представлять собой комбинацию критерия Сэвиджа и миниминного критерия. Этот критерий будем называть критерием пессимизма-оптимизма Гурвица относительно рисков, или (Hur)r (λ)-критерием, где λ [0,1] – показатель оптимизма.

В качестве показателя неэффективности чистой стратегии Ai по критерию Гурвица относительно рисков

[ (Hur)r (λ) ] рассматривается число: , i=1,2,…,m (1.1)

где (Sav)i и µi – показатели неэффективности стратегии Ai соответственно по критерию Сэвиджа и по миниминному критерию.

Показатели неэффективности чистой стратегии можно записать в следующей форме:

, λ [0,1], i=1,2,…,m (1.2)

Из которой понятно, что является линейной функцией аргумента λ [0,1] с угловым коэффициентом .

Ценой игры в чистых стратегиях () по критерию Гурвица относительно рисков является наименьший из показателей неэффективности всех чистых стратегий:

, λ [0,1] (1.3)

Чистую стратегию Ak с наименьшим показателем неэффективности называется оптимальной во множестве чистых стратегий по критерию Гурвица относительно рисков, т.е.:

, λ [0,1] (1.4)

Использую формулу (1.1), находим =(Sav)i и = . Таким образом видно, что критерий Гурвица оптимальности чистых стратегий относительно рисков при λ = 0 превращается в Критерий Сэвиджа оптимальности чистых стратегий, а при λ = 1 – в миниминный критерий оптимальности чистых стратегий.

Критерий Гермейера оптимальности чистых стратегий

При использовании этого критерия исходная платёжная матрица заменяется матрицей Гермейера. Каждый элемент матрицы мы домножаем на соответствующую вероятность j состояния природы.

для матрицы выигрышей,

для матрицы потерь.

 

Критерий Гермейера применяют игроки не склонные к риску, т.к. каждая стратегия оценивается с точки зрения min по гарантиров. результата.

  , q=0,4 , q=0,2 , q=0,1
     
     
     

Состояние природы образует минимум а затем игрок выбирает стратегию которая принесёт ему максимальный результат. Т.е. он защищает себя.

Пример.

  , q=0,4 , q=0,2 , q=0,1 VGi в. VGi п.
3,6 0,8 0,1 0,1 3,6
2,8 0,2 0,8 0,2 2,8
4,4 0,6 0,7 0,6 4,4

Исходная матрица

Далее умножаем каждый элемент в столбце на соответствующий коэффициент q. Получим следующую таблицу:

В столбце VGi в. Находим миним. Элементы по строкам, а в столбце VGi п. находим макс. Элементы.

Далее находим VGi в (maxmin), и VGi п. (minmax)

Получаем следующий ответ: S*=S3, V*=0,6 - выигрыш S*=S2, V*=2,8 - потеря

41. Критерий Ходжа – Лемана оптимальности чистых стратегий относительно выигрышей. матрица выигрышей

матрица потерь

y- параметр отражающий степень доверия ЛПР к оценкам вероятностей состояния природы. y [0,1] Чем выше у, тем выше доверие игрока А к оценкам вероятности. А следовательно от того как У зависит доминирует первое слагаемое или второе.

Критерий Ходжа-Лемана

1) Предположим, что матрицей выигрышей игрока А является матрица А.

2) Известны вероятности q i= p (Пj), j =1,…, n, состояний природы Пj, j =1,…, n, удовлетворяющие условию (1).Таким образом, игроку А надлежит принимать решение в условиях риска.

3) Пусть l =2,

(11)

· показатель эффективности стратегии Аi по критерию Вальда,

(12)

· показатель эффективности стратегии Аi по критерию Байеса.

Матрица В примет вид

В =

т.е. bi 1= Wi, bi 2= Bi, i =1,…, m.

4) Коэффициенты l1, l2 выбираются следующим образом:

l1=1-l, l2=l, где lÎ[0, 1]. (13)

Очевидно, что эти коэффициенты удовлетворяют условию (2).

5) По формуле (3), с учетом (11), (12), и (13), показатель эффективности стратегии Аi по критерию Ходжа-Лемана равен:

Gi=libi1 + l2bi2= (1 -l) Wi + lBi= (1- l) aij+l qiaji =1,…, m. (14)
   

В правой части формулы (14) коэффициент l Î[0, 1] есть количественный показатель степени доверия игрока А данному распределению вероятностей qi = p (Пj), j =1,…,n, состояний природы Пj, j =1,…, n, а коэффициент (1- l) характеризует количественно степень пессимизма игрока А. Чем больше доверия игрока А данному распределению вероятностей состояний природы, тем меньше пессимизма и наоборот.

6) Цену игры по критерию Ходжа-Лемана находим по формуле (4):

7) Оптимальной стратегией по критерию Ходжа-Лемана является стратегия Аk с наибольшим показателем эффективности:

Gk = G.

Отметим, что критерий Ходжа-Лемана является как-бы промежуточным критерием между критериями Байеса и Вальда. При l =1, из (14) имеем: Gi = Bi и потому критерий Ходжа-Лемана превращается в критерий Байеса. А при l =0, из (14): Gi = Wi и, следовательно, из критерия Ходжа-Лемана получаем критерий Вальда.

Пример.

Исходная матрица

  q=0,4 П1 q=0,3 П2 q=0,1 П3 q=0,2 П4
S1        
S2        

Далее используя формулы –

матрица выигрышей

матрица потерь

каждый элемент в столбце на соответствующий коэффициент q. Получим следующую таблицу:

 

Vi1*q1 Vi2*q2 Vi3*q3 Vi4*q4  

 

2,4 0,9 0,8 0,5 4,6
1,6 0,9 1,2 0,5 4,2

Принимая =0,6

Получим итоговые данные, для выйгрыша выберем макс. Элемент, для потерь – мин.

 

HL(выйгрыш) HL (потеря)
4,02 5,22
3,66 4,86

 

 

Получаем следующий ответ: S*=S1, V*=4,02 - выигрыш

S*=S2, V*=4,86 - потеря

42.Основные понятия и определения в теории неантагонистических (бескоалиционных) игр. Способы задания неантагонистической игры.

Некооперативная или бескоалиционная игра, это система Г= (aij,bij)=(Ha(Ai,Bj), Hb(Ai,Bj)), где Ai и Bj принадлежат Sa и Sb соответственно, а Ha и Hb функции выигрыша. Sa и Sb – множество стратегий игрока А и В Sa= {A1,A2, …, Am}, Sb = {B1,B2, …, Bn}.

Бескоалиционное поведение, когда соглашения между участниками запрещены правилами, а кооперативное поведение разрешается в форме выбора совместных стратегий.

Интересы игроков могут пересекаться, быть взаимовыгодными обоим игрокам, в то время как в антагонистическом конфликте это не представляется возможным.

Матрица выигрышей двух игроков в бескоалиционной игре имеет следующий вид S= SaxSb:

А\В B1 Bn
A1 (a11,b11) (a1n,b1n)
Am (am1,bm1) (amn,bmn)

 

Неантагонистические игры, как и антагонистические, могут быть как конечные, так и бесконечные. Эта характеристика игры зависит от количества чистых стратегий игроков (S1, S2, …,Sk где k- количество игроков, конечны)

Способы задания игр:

· стратегическая(нормальная, матричная)

· позиционная форма(форма дерева)

 


Поделиться с друзьями:

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.008 с.