Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Процедура выполнения команд. Рабочий цикл процессора: Функционирование процессора в основном состоит из повторяющихся рабочих циклов, каждый из которых соответствует...

Методика измерений сопротивления растеканию тока анодного заземления: Анодный заземлитель (анод) – проводник, погруженный в электролитическую среду (грунт, раствор электролита) и подключенный к положительному...

Определение места расположения распределительного центра: Фирма реализует продукцию на рынках сбыта и имеет постоянных поставщиков в разных регионах. Увеличение объема продаж...

Интересное:

Принципы управления денежными потоками: одним из методов контроля за состоянием денежной наличности является...

Наиболее распространенные виды рака: Раковая опухоль — это самостоятельное новообразование, которое может возникнуть и от повышенного давления...

Что нужно делать при лейкемии: Прежде всего, необходимо выяснить, не страдаете ли вы каким-либо душевным недугом...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспруденция

Матричная игра как модель конкуренции и сотрудничества.

2017-12-21

240

0.00 из 5.00 0 оценок

Заказать работу

⇐ ПредыдущаяСтр 6 из 6

Пусть игроки – Первый и Второй, играют в матричную игру с матрицей A=a_i _j. Пусть стратегия Первого есть Р, а Второго Q. Тогда выигрыш Первого ксть с.в. W(P,Q) c рядом распределения:

W(P,Q):

a_{1 1}	...	a_{i j}	...	a_{m n}
p₁q₁*	...	p_ip_j*	...	p_mq_n*

Математическое ожидание этой с.в., т.е. есть средний выигрыш Первого. Пусть D[W(P,Q)] есть дисперсия этой с.в. Естественно назвать среднее квадратическое отклонение с.в. W(P,Q) т.е.

риском для Первого при игре со стратегиями P,Q. Поскольку выигрыш Первого есть проигрыш для Второго, то W(P,Q) есть случайный проигрыш Второго и r вполне естественно можно назвать риском игры с такими стратегиями: P*=(p₁*,...,p_m*) –Первый игрок и

Q*=(q₁*,...,q_n *) –Второй.

Математическое ожидание с.в. W(P,Q) называется ценой игры, обозначим ее v.

Но что же назвать риском всей игры?

Вычислим дисперсию выигрыша Первого при оптимальных стратегиях игроков.

Так как, а через T_j сумма обозначена.

Заметим, что в сумме можно оставить лишь те

слагаемые, у которых q_j *>0.

Заметим теперь, что если Первый играет со стратегией P*, а второй отвечает j- ой чистой стратегией, то выигрыш первого есть с.в. с рядом распределения:

W(P*,Q*):

a_{1 1}	...	a_{i j}	...	a_{m n}
p₁`	...	p_i `	...	p_m `

Если Р* есть оптимальная стратегия Первого, а q_j *>0, то из теории матричных игр с нулевой суммой известно, что выигрыш Первого при таких стратегиях по-прежнему равен цене игры v, а дисперсия выигрыша Первого при этом равна ,то есть равна T_j -v². Таким образом, что происходит с риском выигрыша Первого, можно понять, сравнив дисперсию при оптимальных стратегиях и дисперсию D_j =T_j - v² или величины и D'=T_j_. Пусть mT = min{T_j:q^*_j > 0}. Как легко понять, если среди {T_j:q_j^* >0} есть разные числа, то mT < D ’.

Теперь можно сделать следующий вывод: чуть-чуть обойдя от своей оптимальной стратегии и таким образом почти не уменьшив свой выигрыш, Первый может значительно уменьшить свой риск. При этом уменьшается и риск Второго, что отвечает и его интересам.

Чисто математически можно сказать, что в описанной ситуации риск выигрыша Первого не зависит от его стратегии непрерывно.

Рассмотрим решение игры 2*4 с матрицей a_i _j. Обозначим искомую оптимальную стратегию Первого (x,1-x) —это вектор столбец, но для удобства записывают его в виде строки. Обозначим v(x,j) –средний выигрыш 1-го в расчете на партию, когда Первый использует стратегию (x,1-x), а Второй- j-ую чистую стратегию, j=1,...4. Возьмем на плоскости систему координат, по горизонтали вправо откладываем х, а вертикальной оси – значение функции v(x,j). Масштаб по осям сделаем разный – ведь графики нужны только над отрезком [0,1]. Функция v(x,j) j=1,...4 линейные, значит, их графики – прямые линии I, II, III, IV соответственно. Находим нижнюю огибающую семейства этих четырех прямых над отрезком [0,1]. Находим самую высшую точку этой кривой. Она и дает решение этой игры. Эта точка есть пересечение двух прямых, откуда находим ее координаты – (х₀, v). Теперь оптимальная стратегия Первого есть [x₀,1-x₀], цена игры есть v. Оптимальная стратегия Второго находится так: берем указанные две прямые и обозначаем y,1-y –вероятности выборы Вторым столбца. Их чисел x₀,1-x₀ находим строго положительное. Теперь математическое ожидание проигрыша Второго против чистой стратегии Первого есть цена игры.

Матрица игры

Седловой точки в матрице нет.

Чтобы найти V и Р приравняем уравнения II и III прямых:

2-ой игрок не выбирает I и IVстолбец

Дисперсия выигрыша Первого при оптимальных стратегиях игроков:

r ≈ 2,3

2,3

7/13

Рис.1

Как видно из рисунка 1, при отходе Первого от своей оптимальной стратегии вправо, т.е. при увеличении вероятности х выбора им 1-й строки Второй начинает отвечать 2-й чистой стратегией и риск Первого скачком увеличивается до r₁⁽²⁾≈2,4, а при отходе Первого от своей оптимальной стратегии влево второй переходит на свою 1-ю чистую стратегию и риск Первого скачком снижается до r₁⁽¹⁾≈2,1.

2,3

24/39

Рис.2

Аналогичное верно и в отношении Второго. Примерная, но достаточно точная зависимость риска Второго в малой окрестности его оптимальной стратегии показана на рис.2. Как видно из рисунка 2, при отходе Второго от своей оптимальной стратегии вправо, т.е. при увеличении вероятности у выбора им 1-й строки Первый начинает отвечать 2-й чистой стратегией и риск Первого скачком уменьшается до r₂⁽²⁾≈1,9, а при отходе Второго от своей оптимальной стратегии влево Первый переходит на свою 1-ю чистую стратегию и риск Второго скачком увеличивается до r₂⁽¹⁾≈2,4.

Пусть r = min{r₁⁽¹⁾, r₁⁽²⁾, r₂⁽¹⁾, r₂⁽²⁾}. Эту величину и можно назвать риском всей игры. Но играть с таким риском можно лишь при согласии обеих сторон. Для данной игры r^*» 1,9, и игроки для достижения такого риска должны играть так: Первый играет со своей оптимальной стратегией Р* (7/13; 6/13), а Второй должен использовать 2-ю чистую стратегию.

⇐ Предыдущая 1 2 3 4 56

Поделиться с друзьями:

История развития пистолетов-пулеметов: Предпосылкой для возникновения пистолетов-пулеметов послужила давняя тенденция тяготения винтовок...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...