Тема 3. Лекция 7. Антагонистические игры (игры с нулевой суммой). Платежная матрица. Чистые стратегии. Цена игры. Седловая точка платежной матрицы. Теорема о минимаксе. — КиберПедия 

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

Тема 3. Лекция 7. Антагонистические игры (игры с нулевой суммой). Платежная матрица. Чистые стратегии. Цена игры. Седловая точка платежной матрицы. Теорема о минимаксе.

2018-01-13 336
Тема 3. Лекция 7. Антагонистические игры (игры с нулевой суммой). Платежная матрица. Чистые стратегии. Цена игры. Седловая точка платежной матрицы. Теорема о минимаксе. 0.00 из 5.00 0 оценок
Заказать работу

Определение. Игра двух лиц, в которой в каждом исходе выигрыш одного из игроков равен проигрышу другого, называется антагонистической (матричной) игрой или игрой с нулевой суммой. При этом

-множество игроков состоит из двух элементов {A,B};

- FA (или FB) – функции выигрыша;

- матрица А выигрышей игрока А (она же – матрица проигрышей игрока В) называется платежной матрицей: aij=FA(y(i)A,y(j)B),

- SA,SB – множества стратегий игроков (чистых стратегий) представляют собой множества номеров строк {1,2,,m}(игрок А) и столбцов {1,2,,n}(игрок B) матрицы А.

Таким образом, конечная антагонистическая игра полностью задается платежной матрицей.

Замечание: Рассмотренные ранее конечные игры называются биматричными.

Вид матрицы биматричной игры:

  yВ (1) ... yВ (n)
yА (1) f1 f2        
         
yА(m)          

 

 

Пример 1. Фирма А производит сезонный товар, который поставляется на рынок в момент времени i. Фирма В конкурирует с фирмой А (цель фирмы В – разорить фирму А) и поставляет на рынок товар в момент времени j=1,…,n – в начале каждого периода времени. Размеры фирм равны, цена товара фиксирована, а качество определяется моментом времени его поступления (чем позже товар поступил, тем он качественней). На рынке продается только более качественный товар. Доход от продаж в единицу времени равен С, число периодов времени n=4.

Строим платежную матрицу игры:

В

         
  С
  3/2С С
  С С
  С С С С/2

 

 

А
Табл. Платежная матрица (доход фирмы А равен убытку фирмы В).

 

Принципы оптимальности.

Пусть задана платежная матрица. Строки – стратегии игрока А; Столбцы – стратегии игрока В;

Пример 2.

  В1 В2 В3 В4
А1        
А2        
А3        

 

 

А=

 

 

Добавим к ней строку и столбец:

  В1 В2 В3 В4 min aij
А1         2
А2         1
А3         2
maxaij 10 6 5 9 minmax aij =5\maxmin aij =2

 

 

Определение:

α – нижняя цена игры (максимин)

β – верхняя цена игры (минимакс)

Теорема:

Доказательство: (очевидно)

Определение:

Если , игра имеет цену; если , игра цены не имеет/

Игра в Примеtр 2. не имеет цены.

Определение. Седловой точкой матрицы А называется такой элемент , что .

Теорема. Пусть и - седловые точки матрицы А, тогда , также являются седловыми точками и при этом =

Доказательство: Рассмотрим , и , .

Теорема. Игра имеет цену, тогда и только тогда, когда существует седловая точка у матрицы А, т.е. (седловая точка А) и при этом . Соответствующие чистые стратегии игроков (максиминная и минимаксная) являются оптимальными.

Доказательство: Пусть (игра имеет цену), Ai0 – максиминная стратегия А, Aj0 – минимаксная стратегия В, тогда

Пусть существует седловая точка, докажем, что . и , тогда следует, что . А так как и , и значит .

Пример 3. Две конкурирующие финансовые компании ведут переговоры с организаторами трех проектов. Задача фирмы В – профинансировать любой проект. Задача фирмы А – сорвать переговоры. Стратегии фирмы А:

1) предложить более выгодные условия;

2) опорочить фирму В.

Стратегия фирмы В: выбрать проект для финансирования.

Платежная матрица содержит значения вероятности срыва переговоров.

  В1 В2 В3 min aij
А1 0,7 0,5 0,3 0,3
А2 0,6 0,9 0,4 0,4
max aij 0,7 0,9 0,4 0,4\0,4

 

Находим =0,4 и =0,4. ().

 



Поделиться с друзьями:

История развития пистолетов-пулеметов: Предпосылкой для возникновения пистолетов-пулеметов послужила давняя тенденция тяготения винтовок...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.013 с.