Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Когда производится ограждение поезда, остановившегося на перегоне: Во всех случаях немедленно должно быть ограждено место препятствия для движения поездов на смежном пути двухпутного...

Отражение на счетах бухгалтерского учета процесса приобретения: Процесс заготовления представляет систему экономических событий, включающих приобретение организацией у поставщиков сырья...

Техника безопасности при работе на пароконвектомате: К обслуживанию пароконвектомата допускаются лица, прошедшие технический минимум по эксплуатации оборудования...

Интересное:

Финансовый рынок и его значение в управлении денежными потоками на современном этапе: любому предприятию для расширения производства и увеличения прибыли нужны...

Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспунденкция

Критерий Байеса относительно выигрыша (К1).

2018-01-13

920

0.00 из 5.00 0 оценок

Заказать работу

Содержание

⇐ ПредыдущаяСтр 15 из 27Следующая ⇒

Пусть задана игра ис природой

	П₁	…	Пn
A₁
…		a_ij
A_n
q_i	q₁		q_n

Определение:

Показателем эффективности стратегии А_i называется величина

Стратегия игрока называется максимальной, если показатель эффективности ее максимален. A_i₀ – оптимальна (в соответствии с К1) => max ā_i = ā_i₀.

Определение:

Выигрыш игрока при использовании им смешанной стратегии P=

Равен

Определение:

Показателем эффективности игрока А (в соответствии с К1) называется величина

Определение:

Стратегия P⁰ игрока А назыается оптимальной на множестве S_a (в соответствии с К1) если

Теорема.

Если стратегия А_io оптимальна на множестве чистых стратегий S^c_a (в соответствии с К1), то она оптимальна и на множестве смешанных стратегий S_a (в соответствии с К1).

Доказательство.

Если верно, что , то =>

Т.к. .

Критерий Байеса относительно риска (К2).

Определение:

Показателем неэффективности А_i (в соответствии с К2) есть величина

, ║r_ij║ = R_a_.

Стратегия А_i₀ игрока А называется оптимальной, если

Определение:

Риском, при использовании игроком А стратегии P и при П_i называется:

Определение:

Показатель эффективности стратегии В игрока А (в соответствии с К2) называется величина:

Определение:

Смешанные стратегии P₀ игрока А называется оптимальной (в соответствии с К2), если

Теорема.

Стратегия А_io игрока А, оптимальная (в соответствии с К2) на множестве S^c_А(множество рисков), будет оптимальной и на S_А(множество смешанных стратегий).

Доказательство:

Докажем это неравенство в другую сторону.

Пусть ,

Итак,

≤

Теорема об эквивалентности К1 и К2.

Рассмотрим показатели эффективности стратегий относительно риска:

достигает своего минимума если достигает своего максимума.

Критерий Лапласса относительно выигрыша/риска.

Все состояния природы считаются равновероятными.

, j = 1,..., n

Далее, все формулировки аналогичны критериям Байеса.

Критерий относительных значений вероятностей состояний природы с учетом рисков. Так же, как и в случае предыдущего критерия располагаем неизвестные вероятности состояний природы в виде монотонной последовательности пропорционально последовательности положительных чисел τ₁,..., τ_n, т.е. имеем равенство (2.20.27), из которого для вероятностей q_i, i=1,…, n, выводим формулу (2.20.31)

Критерий Байеса относительно рисков при вероятностях состояний природы (2.20.31) назовем критерием относительных значений вероятностей состояний природы с учетом рисков. При этом показатель неэффективности стратегии подсчитывается по формуле (2.20.10), вероятности q_i,..., q_n в которой представлены формулой (2.20.31):

(2.20.38)

где r_ij - риски, заполняющие матрицу (2.20.9).

Поскольку величина не зависит от номера i=l,..., n, то в качестве показателя неэффективности стратегии А_i,- поданному критерию можно рассматривать величину

(2.30.29)

Оптимальной среди чистых стратегий по обсуждаемому критерию является
стратегия с минимальным показателем неэффективности (2.20.39).

Показателем неэффективности смешанной стратегии P=(p_i,..., р_m) по рассматриваемому критерию является величина , определяемая формулой (2.20.13), в которой вероятности q_j, j=l,.., n, задаются формулой (2.20.31):

(2.20.40)

где риск r(P, П_j) применения смешанной стратегий Р при состоянии природы П_j определяется формулой (2.20.12).

Оптимальной среди всех смешанных стратеги Р множества S_A по данному критерию является стратегия, для которой показатель неэффективности (2.20.40) минимален.

Теорема 2.20.2 при вероятностях состояний природы (2.20.31) говорит о том, что чистая стратегия, оптимальная среди чистых по критерию относительных значений вероятностей состояний природы с учетом рисков является оптимальной по тому же критерию и среди всех смешанных стратегий.

Пример 2.20.6. В условиях примера 2.20.5 найдем оптимальную стратегию по критерию относительных значений вероятностей состояний природы с учетом рисков.

Выпишем матрицу рисков (2.20.26) (без последнего столбца) для платежной матрицы (2.20.37) (без последнего столбца) и добавим к ней столбец показателей неэффективности стратегий r_i, вычисленных по формуле (2.20.39):

A_{i \}П_j	П₁	П₂	П₃	П₄
A₁
A₂
A₃
A₄

(2.20.41)

Так, например, =4*7+3*1+2*6+1*4=47.

Из последнего столбца матрицы (2.20.41) мы видим, что

минимальным показателем неэффективности =12 обладает стратегия А₃ и, значит, она по критерию относительных значении вероятностей состояний природы с учетом рисков является оптимальной.

Результаты в примерах 2.20.5 и 2.20.6 совпадают. Теорема 2.20.3 при вероятностях состояний природы, вычисляемых по формуле (2.20.31), показывает, что это не случайность, а именно показывает, что критерии относительных значений вероятностей состояний природы с учетом выигрышей и с учетом рисков эквивалентны. Для лучшей обозримости сведем рассмотренные в этом параграфе критерии в таблице.

Таблица 2.20.1

Критерии относительно выигрышей

№№ п/п	Критерий	Вероятности состояний природы	Показатель эффективности стратегии
1_B	Критерий Бейса относительно выигрышей
2_B	Критерий Лапласа относительно выигрышей
3_B	Критерий относительный значений вероятностей

По каждому из этих критериев оптимальной является стратегия , показатель эффективности которой , т.е. = . Очевидно, что каждый из этих критериев является по существу критерием Байеса относительно выигрышей и отличаются они друг от друга лишь способом добывания информации о вероятностях состояний природы.

По каждому из этих критериев является стратегия показатель

неэффективности который минимален, т.е. = .

Каждый из этих критериев является критерием Байеса относительно рисков и отличаются они друг от друга только способом получения информации о вероятностях состояний природы.

Таблица 2.20.21

Критерии относительно рисков состояний природы с учетом рисков

№№ п/п	Критерий	Вероятности состояний природы	Показатель эффективности стратегии
1_P	Критерий Бейса относительно рисков
2_P	Критерий Лапласа относительно рисков
3_P	Критерий относительный значений вероятностей состояний природы с учетом рисков

Наконец, напомним, что, как следует из теоремы 2.20.3, критерии 1_В, 2_В, 3_В эквивалентны соответственно критериям 1_р,2_р,3_р.

Заканчивая обсуждение способов принятия решения в условиях риска, мы видим, что информация о вероятностях состояний природы может быть как объективной, так и субъективной. Оптимальные стратегии, определенные на основе субъективной оценки вероятностей состояний природы, в общем случае также оказываются субъективными. Степень субъективности оптимальных решений можно уменьшить, если вероятности состояний природы, назначенные одним экспертом, заменить на средние вероятностей, назначенных различными экспертами независимо друг от друга.

ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

В предыдущей лекции мы рассмотрели подходы к принятию решений в условиях риска, т.е. в условиях, когда мы существенно использовали вероятности состояний природы, добытые тем или иным путем.

В настоящем параграфе мы обсудим некоторые критерии принятия оптимальных решений в условиях неопределенности, т.е. когда вероятности, с которыми природа может принимать то или иное состояние, неизвестны и отсутствует всякая возможность получения о них какой-либо статистической информации.

Пусть в игре с природой П игрок А обладает m возможными чистыми стратегиями А₁...,А_m, а природа П может находится в одном из n состояний П₁..., П_n. Пусть (20.1) является матрицей выигрышей игрока А.

Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами λ₁,λ₂,λ₃,…λ_n.

Переставим выигрыши а_i₁,а_i₂,...,а_in при каждой стратегии A_i, (т.е. элементы каждой строки матрицы (2.20.1)), расположив их в неубывающем порядке, и обозначим элементы полученной матрицы через b_ij, а саму матрицу — через B:

B_{i \}j			…	n
B₁	b₁₁	b₁₂	…	b_1n
B₂	b₂₁	b₂₁	…	b_2n
…	…	…	…	…
B_m	b_m1	b_m2	…	b_mn

B =

Таким образом,

(2.21.1)

Каждая строка B _i матрицы В является перестановкой выигрышей при стратегии A_i, (i = 1,..., m). Не исключена возможность, что для некоторых номеров i и j будет иметь место равенство b_ij = a_ij. В силу неравенств (2.21.1), в первом столбце матрицы В стоят минимальные выигрыши при каждой стратегии

(2.21.2)

а в последнем n-м столбце — максимальные выигрыши при каждой стратегии

(2.21.3)

Пусть числа λ₁,λ₂,λ₃,…λ_n, удовлетворяют условиям

и (2.21.4)

Показателем эффективности стратегии А_i по рассматриваемому критерию назовем число

(2.21.5)

Из этого определения видно, что показатель эффективности стратегии А_i, учитывает все выигрыши при этой стратегии b_i₁,..., b_in и зависит от чисел λ_i,j=1,..., n, удовлетворяющих условиям (2.21.4).

Выражение (2.21.5) является выпуклой комбинацией выигрышей ни строки матрицы В с коэффициентами λ_i,j=1,..., n,. В обозначении можно было бы не указывать один из коэффициентов, например, λ₁, поскольку он однозначно определяется остальными n-1 коэффициентами из нормировочного равенства (2.21.4).

Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами назовем критерий, по которому оптимальной среди чистых стратегий считается стратегия . с максимальным показателем эффективности (2.21.5), т.е.

Числа

и (2.21.6)

назовем показателями соответственно пессимизма и оптимизма. В обозначениях (2.21.6) индекс «р» — первая буква английского pessimism [, pesi'mizm], индекс «о» — первая буква английского optimism ['optimizm], a — целая часть числа , т.е. наибольшее целое число, непревосходящее числа n/2; очевидно, что

, если n-число четное ( 2)

, если n-число нечетное ( 2)

Коэффициенты λ₁,λ₂,λ₃,…λ_n выбираются из субъективных соображений следующим образом: чем опаснее ситуация, тем больше возникает желание в ней подстраховаться, тем больше, т.е. ближе к единице, должен быть коэффициент пессимизма λ_p (см. 2.21.6) и, следовательно, тем меньше, т.е. ближе к нулю, будет коэффициент оптимизма λ_o. В безопасной ситуации коэффициенты λ₁,λ₂,λ₃,…λ_n выбираются так, чтобы показатель пессимизма λ_p был ближе к нулю, а показатель оптимизма λ_o— ближе к единице. Таким образом, показатели пессимизма λ_p и оптимизма λ_o в данном критерии выражают количественную меру соответственно пессимизма и оптимизма игрока A, выбирающего коэффициенты λ₁,…λ_n.

Если показатель оптимизма λ_o > 1/2 и, следовательно показатель пессимизма λ_p< < 1/2, то критерий более «оптимистический», чем «пессимистический»; если, наоборот, показатель оптимизма λ_o < ½ и, следовательно показатель пессимизма λ_р > ½, то критерий более пессимистический чем оптимистический; если же показатели оптимизма и пессимизма равны: λ_o=λ_р=1/2, то критерий можно считать реалистическим.

Чуть позже мы предложим некоторый формализованный метод выбора коэффициентов λ₁,λ₂,λ₃,…λ_n, учитывающий все выигрыши игрока А.

Если b_i_j=a_ijдля всех i=1,...,n и j=1,...,n, т.е. если матрица В совпадает с матрицей (2.20.1), то коэффициенты λ₁,…λ_n, можно формально интерпретировать как вероятности состояний природы: q₁=λ₁...,q_n=λ_n, и тогда показатель эффективности стратегии A_i, по обобщенному критерию Гурвица относительно выигрышей, определяемый формулой (2.21.5), превращается в показатель эффективности стратегии A_i по критерию Байеса относительно выигрышей, вычисляемый по формуле (2.20.2): . Следовательно, в этом случае, обобщенный критерий Гурвица относительно выигрышей превращается в критерий Байеса относительно выигрышей.

Если коэффициенты , то их можно формально трактовать как вероятности равновероятных состояний природы и из (2.21.5) получим:

Но поскольку b_i₁,...,b_in есть перестановка элементов a_i₁,...,a_in i-строки матрицы (2.20.1), то и, следовательно,

т.е. показатель эффективности стратегии A_i по обобщенному критерию Гурвица относительно выигрышей совпадает, как это следует из равенства (2.20.23), с показателем эффективности стратегии A_i - по критерию Лапласа относительно выигрышей. Значит, обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с равными коэффициентами λ₁=…= λ_n=1/2, превращается в критерий Лапласа относительно выигрышей.

Критерий Вальда (критерий крайнего пессимизма).

Критерий Вальда есть частный случай обобщенного критерия Гурвица относительно выигрышей со специальными коэффициентами

λ₁=1,λ₂=0…= λ_n=0 (2.21.7)

которые, очевидно, удовлетворяют условиям (21.4).

Подставляя значения коэффициентов (2.21.7) в формулу (2.21.5) и учитывая (2.21.2), получим показатель эффективности стратегии А_i- по критерию Вальда:

(2.21.8)

представляющий собой минимальный выигрыш игрока А при применении им стратегии A_i. Оптимальной среди чистых стратегий по критерию Вальда является, таким образом, стратегия , имеющая максимальный показатель эффективности (2.21.8):

Другими словами, оптимальной среди чистых стратегий по критерию Вальда считается та чистая стратегия, при которой минимальный выигрыш является максимальным среди минимальных выигрышей всех чистых стратегий. Таким образом, оптимальная стратегия по критерию Вальда гарантирует при любых состояниях природы выигрыш, не меньший, чем максимин

Из (2.21.7) и (2.21.6) получаем, что для критерия Вальда показатель пессимизма λ_р=1 а показатель оптимизма λ_о=0. Это говорит о том, что критерий Вальца является критерием крайнего пессимизма, ибо ориентирует игрока А на наихудшие для него состояния природы и, следовательно, на крайне осторожное, осмотрительное поведение при выборе стратегий. Хотя арабская пословица и гласит «Кто боится собственной тени, тому нет места под солнцем», тем не менее этот критерий уместен в тех случаях, когда игрок А не столько хочет выиграть, сколько не хочет проиграть. Принципом критерия Вальда часто пользуются в обиходе, что подтверждается такими поговорками, как «Семь раз отмерь—один раз отрежь», «Береженного бог бережет», «Лучше синица в руках, чем журавль в небе».

Максимаксный критерий (критерий крайнего оптимизма). Противоположностью критерию Вальда является так называемый максимаксный критерий, представляющий собой также частный случай обобщенного критерия Гурвица относительно выигрышей, когда коэффициенты λ₁,λ₂,…, λ_n выбираются следующим образом:

λ₁=…=λ_n_-1=0, λ_n=1 (2.21.9)

Коэффициенты (2.21.9) удовлетворяют условиям (2.21.4). Если эти коэффициенты подставить в (2.21.5) и учесть (2.21.3), то получим формулу для показателя эффективности стратегии A_i, по максимаксному критерию:

(2.21.10)

Значит, в качестве показателя эффективности стратегии A_i по максимаксному критерию выбирается максимальный выигрыш при этой стратегии.

Тогда оптимальной среди чистых стратегий по максимаксному критерию является стратегия с максимальным показателем эффективности„(2.21.10):

т.е. стратегия, максимальный выигрыш при которой максимален среди максимальных выигрышей всех чистых стратегий. По-другому можно сказать, что оптимальной будет та чистая стратегия, при которой (хотя-бы) один из выигрышей

является максимальным среди выигрышей всех чистых стратегии. Оптимальная по максимаксному критерию стратегия гарантирует игроку А возможность наибольшего выигрыша, равного максимаксу

Подставляя коэффициенты (2.21.9) в (2.21.6), найдем для максимаксного критерия показатель пессимизма λ _p =0 и показатель оптимизма λ _o =1. Таким образом, максимаксный критерий является критерием крайнего оптимизма, так как ориентирует лицо, принимающее решение, (игрока А) на наилучшие, благоприятнейшие для него состояния природы и, как следствие отсюда — на порой неоправданно легкомысленное, шапкозакидательское поведение при выборе стратегий. Вместе с тем, в некоторых случаях этим критерием пользуются осознанно, например, в ситуации, когда перед игроком А стоит дилемма: либо получить наибольший выигрыш, либо стать банкротом.

Критерий пессимизма-оптимизма Гурвица относительно выигрышей, с показателем оптимизма

Данный критерий является как бы промежуточным между критериями крайнего пессимизма и крайнего оптимизма и представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей с коэффициентами

(2.21.11)

удовлетворяющими, очевидно, условиям (2.21.4).

Из (2.21.11), (2.21.5), (2.21.2) и (2.21.3) следует, что показателем эффективности стратегии А, по рассматриваемому критерию является величина

(2.21.12)

Оптимальной же стратегией по этому критерию считается стратегия А _i ₀ с максимальным показателем эффективности (2.21.12):

Из (2.21.11) и (2.21.6) получаем, что показатели пессимизма и оптимизма в этом критерии равны соответственно λ _р =1-λ и λ _o =λ. При λ=0 мы из критерия Гурвица получаем критерий Вальда, а при λ=1 — максимаксный критерий. Чем ближе к нулю показатель оптимизма λ, тем ближе к единице показатель пессимизма 1-λ, и тем меньше оптимизма и больше пессимизма. И наоборот, чем ближе λ к единице, тем больше оптимизма и меньше пессимизма. Если показатель оптимизма , то и показатель пессимизма . В этом случае показатель эффективности стратегии А_i, как следует из формулы (2.21.12), примет вид:

(2.21.13)

а так как множитель 1/2 в правей части этого равенства не зависит oт номера i, то в качестве показателя эффективности стратегии А _i по критерию пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма λ=1/2 можно рассмотреть правую часть равенства (2.21.13) без коэффициента 1/2:

Отметим, что критерий Вальда, максимаксный критерий и критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма не учитывают всех выигрышей игрока А при каждой его стратегии: критерий Вальда принимает во внимание только минимальные выигрыши при каждой стратегии, максимаксный критерий учитывает лишь максимальные выигрыши при каждой стратегии, а критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма опирается на минимальные и максимальные выигрыши. В отличие от этого обобщенный критерий Гурвица учитывает все выигрыши при каждой стратегии игрока А, используя тем самым полную информацию об игре, поскольку вся имеющаяся информация об игре с природой в условиях неопределенности содержится в матрице выигрышей игрока A.

Перейдем к вопросу о формализации метода выбора коэффициентов λ₁, λ₂,..., λ _n в обобщенном критерии Гурвица относительно выигрышей.

Пусть

(2.21.14)

— сумма выигрышей, стоящих в j -м столбце матрицы В;

(2.21.15)

— среднее значение выигрышей b_i _j, стоящих в j-м столбце матрицы В;

(2.21.16)

— сумма всех выигрышей матрицы В, или, что то же, сумма всех выигрышей матрицы А (см. (2.20.1)).

Просуммировав неравенства (2.21.1) по индексу i от 1 до m, получим с учетом обозначений (2.21.14):

откуда, в обозначениях (2.21.15):

(2.21.17)

В случае опасной ситуации выбор стратегии игроком А должен быть осторожным, «направленным» в сторону убывания выигрышей. Поэтому коэффициенты λ _j по мере убывания выигрышей должны возрастать. Учитывая (2.21.17), эти коэффициенты можно выбрать обратно пропорциональными средним выигрышам (21.15):

(2.21.18)

Так как неравенства (2.21.17) можно переписать так:

то принцип (2.21.18) выбора коэффициентов λ _j, j =1,..., n, можно назвать «принципом невозрастания средних выигрышей».

Выразим коэффициенты λ _j, j =1,..., n, через выигрыши b_ij.

Из (2.21.18):

откуда

(2.21.19)

Подставляя эти выражения в нормировочное равенство (2.21.4), получим

откуда

или, в силу (2.21.15) и (2.21.16):

Подставляя найденное значение λ₁ в (2.21.19) и используя (2.21.15), будем иметь:

(2.21.20)

Таким образом, выбирая в опасной ситуации коэффициенты λ _j, j =1,..., n, в соответствии с принципом невозрастания средних выигрышей, мы видим, что j -й коэффициент λ _j представляет собой отношение суммы b_n _- _j ₊₁элементов b_i _, _n _- _j ₊₁, i =1,.... m, стоящих в (n - j +1)-м столбце матрицы B, к сумме b всех ее элементов, т.е. коэффициент λ _j есть доля суммы элементов (n - j +1)-го столбца в сумме всех элементов матрицы В.

В случае безопасной ситуации коэффициенты λ _j при возрастании выигрышей должны возрастать; поэтому их можно выбрать по «принципу неубывания средних выигрышей» прямо пропорционально средним выигрышам (2.21.15):

Аналогичным способом можно показать, что в данном случае коэффициенты λ _j выражаются через выигрыши следующим образом:

(2.21.21)

Распространим критерий Гурвица относительно выигрышей, а значит и его частные случаи — критерии Вальда и максимаксный критерий, на смешанные стратегии.

Пусть S_A - множество всех смешанных (в том числе и чистых) стратегий игрока A и Р =(р ₁,…, p_m) — некоторая смешанная стратегия игрока А из множества . Тогда выигрыш игрока А при применении им смешанной стратегии P =(p ₁,…, p_m), соответствующий состоянию природы П_j, равен

(2.21.26)

где a_{i j}, i =1,…, m; j =1,…, n, — элементы матрицы (2.20.1).

Показателем эффективности смешанной стратегии Р = (p ₁,..., p_m) по критерию пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма назовем число

(2.21.27)

где

— соответственно минимальный и максимальный выигрыши игрока А при использовании им смешанной стратегии Р.

Так как каждой смешанной стратегии Р соответствуют единственные значения минимального и максимального выигрышей, то W(P) и М(Р), а, следовательно, и G(P; λ), являются числовыми функциями векторного аргумента Р = (p ₁,..., p_m) определенными на множестве S_A.

Если, в частности, смешанная стратегия Р = (p ₁,..., p_m) является чистой А_k, то p_i = 0 при i ≠ к, и р_k =1; следовательно, по формуле (2.21.26), H (P, П_j) = Н (А_к, П_j) = a_kj и показатель эффективности G (P; λ) превращается в показатель эффективности G_k(λ) чистой стратегии А_k, определяемый формулой (2.21.12) при i = k.

Оптимальной среди всех смешанных стратегий множества S_A по критерию пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма назовем стратегию с максимальным показателем эффективности G(P; λ):

(2.21.28)

В связи с бесконечностью множества S_A встает вопрос о существовании определяемой формулой (2.21.28) оптимальной стратегии Р ⁰, т.е. о достижимости функцией G (P; λ) своей верхней грани на множестве S_A. Ответ на этот вопрос положителен. Для доказательства этого сначала докажем непрерывность функций W (P) и М (Р) на множестве S_A.

Функция H (P, П_j), задаваемая формулой (2.21.26), линейна и, следовательно, непрерывна по аргументу P на множестве S_A, т.е. для любого ɛ>0 найдется δ _j >0, зависящее от ɛ, номера j и точки P, такое, что для любой точки , отстоящей от точки P на расстоянии, не большем чем δ _j: ρ(P, U) ≤ δ _j, справедливо неравенство

которое можно переписать так _:

или так:

. (2.21.29)

Под paccтоянием понимается обычное евклидово paccтояние в пространстве Rm, определяемое формулой

Eсли точка такова, что

(2.21.30)

то неравенство ,будет выполняться для каждого j = 1,..., n, и, следовательно, для каждого j = 1,..., n, 6yдут выполняться неравенства (2.21.29).

Taк как

то из левого неравенства (2.21.29) получим:

B частности последнее неравенство будет выполняться для того номера j, который доставляет функции минимум, т.е.

Из этого неравенства и правого неравенства (2.21.29) будем иметь:

В частности, справедливы неравенства

которые можно переписать следующим образом:

или

(2.21.31)

Taким o6paзом, mы noказали, что для любого найдётся такое, что из неравенства (2.21.30) следует неравенство (2.21.31). Это означает, что функция W(P) нeпpepывна b каждой точке P множества S _A, T.e. нeпpepывна нa мhoжестве S_A.

Доказательство непрерывности на множестве S_A функции M(P) проводиться аналогично, в силу непрерывности функции H(P, n_j) пo apryментy P нa мнoжестве S_A, для любого найдётся тaкoe, что для любой точки , удовлетворяющей нepaвeнствy (2.21.30), 6yдут выполняться нepaвeнствa (2.21.29) для каждого j = 1,..., n. Из пpaвoгo нepaвeнствa (2.21.29) получим:

Так как это неравенство верно для любого j = 1,..., n, to, b частности, имеем

Отсюда и из левого неравенства (2.21.29) получим:

Поскольку полученное неравенство имеет место для каждого j = 1,..., n, to справедливо неравенство

из котoporo вытекает неравенство

Этим доказана непрерывность функции M(P) нa множестве S_A. Из Heпpepывности функций W(P) h M(P) следует нeпpepывность функции кaк cyммы нeпpepывых функций и .

Taк кaк мнoжество S_A является симплексом (cm. § 2.7), то oho замкнуто и ограничено (o6ocновaние этого факта cm. b доказательстве теоремы 2.8.1). Следовательно, по теореме Вейерштрасса [6. C. 274], нeпpepывная функция достигает на множестве S_A своей верхней грани, т.e. найдётся стратегия , удовлетворяющая равенству (2.21.28).

При из формулы (2.21.27) полу

⇐ Предыдущая 10 11 12 13 141516 17 18 19 Следующая ⇒

Поделиться с друзьями:

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...