Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...
Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...
Топ:
Методика измерений сопротивления растеканию тока анодного заземления: Анодный заземлитель (анод) – проводник, погруженный в электролитическую среду (грунт, раствор электролита) и подключенный к положительному...
Установка замедленного коксования: Чем выше температура и ниже давление, тем место разрыва углеродной цепи всё больше смещается к её концу и значительно возрастает...
Проблема типологии научных революций: Глобальные научные революции и типы научной рациональности...
Интересное:
Аура как энергетическое поле: многослойную ауру человека можно представить себе подобным...
Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...
Отражение на счетах бухгалтерского учета процесса приобретения: Процесс заготовления представляет систему экономических событий, включающих приобретение организацией у поставщиков сырья...
Дисциплины:
2018-01-13 | 333 |
5.00
из
|
Заказать работу |
|
|
Теорема фон Неймана.
Пусть задана антагонистическая игра с платежной матрицей A (m, n) = (| aij |)
Определение. Смешанной стратегией игрока А называется дискретная случайная величина, принимающая значения 1,2,3,…m с определенной вероятностью;. смешанной стратегией игрока В называется дискретная случайная величина, принимающая значения 1,2,3,… n с определенной вероятностью.
m | |||||
P1 | P2 | pm |
P = (p1, p2 … pm), pi ≥ 0, ∑ pi = 1. Q = (q1, q2 … qn) (аналогично для Q).
Чистые стратегии игроков являются частными случаями смешанных, при этом
А1=(1,0,0,……0), А2=(0,1,0,……0) ….. Аm=(0,0,….0,1);
В1=(1,0,0,……0), В2=(0,1,0,……0) ….. Вn=(0,0,….0,1);
Тогда смешанные стратегии можно представить в виде
, Ai - базисные векторы
Проанализируем структуру множества смешанных стратегий. Пусть у игрока А есть две чистые стратегии.
- это множество называется одномерным симплексом.
Для трех чистых стратегий имеем 2-мерный симплекс смешанных стратегий – треугольник с вершинами (1,0,0), (0,1,0), (0,0,1) (концы векторов P принадлежат треугольнику) и т.д.
Определение. Пара (P, Q) – образует исход игры (или игровую ситуацию). В которой выигрыш игрока A, равный aij, достигается с вероятностью piqj. H(P,Q) есть математическое ожидание выигрыша (средний выигрыш) при избранных стратегиях игроков - средний выигрыш A (проигрыш B) при (P,Q). В матричном виде:
Пример. Пусть задана платежная матрица и стратегии игроков:
, . Считаем векторы P, Q столбцами.
- нижняя цена игры.
Определение. - показатель эффективности стратегии P игрока A относительно смешанной стратегии Q игрока B. (SB - множество смешанных стратегий игрока B.)
- показатель неэффективности стратегии Q игрока B.
|
Теорема. Показатели α и β достижимы.Т.е.
Доказательство:
Рассмотрим функцию α(P,SB). Для фиксированной стратегии P H(P,Q) - есть функция одной векторной переменной Q на ограниченном замкнутом контуре.
Ограниченность:
, ∑qi = 1, qi≥ 0
Замкнутость.
Вспомним, что множество называется замкнутым, если оно содержит все свои предельные точки
. Если каждый элемент сходящейся числовой последовательности неотрицателен, то и ее предел (очевидно) также неотрицателен, т.е. Далее: . Это доказывает, что симплекс – замкнутое множество.
Теорема.
- множество чистых стратегий является подмножеством смешанных стратегий.
Верно для H(P, Q0) = α(P, SB)
Определение. Нижней ценой игры в смешанных стратегиях называется величина:
Верхней ценой игры в смешанных стратегиях называется величина:
Теорема.
где α, β - цены игры в чистых стратегиях.
Доказательство:
Докажем, что : Для произвольных стратегий P и Q имеем:
Определение. Если , то игра имеет цену в смешанных стратегиях => Максиминная и минимаксная стратегии тогда являются оптимальными.
Теорема. (Основная теорема антагонистических игр.) Для любой матричной игры существует решение в смешанных стратегиях (, минимаксные стратегии оптимальны).
Без доказательства.
Тема 3. Лекция 9. Антагонистические игры.
|
|
Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...
Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...
Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...
Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!