Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Процедура выполнения команд. Рабочий цикл процессора: Функционирование процессора в основном состоит из повторяющихся рабочих циклов, каждый из которых соответствует...

Проблема типологии научных революций: Глобальные научные революции и типы научной рациональности...

Устройство и оснащение процедурного кабинета: Решающая роль в обеспечении правильного лечения пациентов отводится процедурной медсестре...

Интересное:

Как мы говорим и как мы слушаем: общение можно сравнить с огромным зонтиком, под которым скрыто все...

Наиболее распространенные виды рака: Раковая опухоль — это самостоятельное новообразование, которое может возникнуть и от повышенного давления...

Национальное богатство страны и его составляющие: для оценки элементов национального богатства используются...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспруденция

Описание метода «критерий Келли» и его свойства

2017-09-10

263

0.00 из 5.00 0 оценок

Заказать работу

⇐ ПредыдущаяСтр 4 из 5Следующая ⇒

В этой главе рассматриваются свойства критерия Келли. Для простоты, проиллюстрируем его на примере самого простейшего случая - подбрасывания монеты, но концепция и выводы легко обобщаются.

Допустим, мы играем с бесконечно богатым противником, который будет делать повторяющиеся ставки на независимые события – броски монеты. Далее, предположим, что при каждом броске наша вероятность победы p> 1/2, а вероятность потери q = 1 - p. Наш начальный капитал - X_O. Предположим, что наша цель – максимизация ожидаемой величины E (X_n) через n попыток. Сколько мы поставим, B_k _, на k -ой попытке? Пусть T_k = 1, если k -я попытка - выигрышная и T_k = -1, если она проиграна, тогда X_k =X_k-1+ T_k B_k для k = 1,2,3.., и X_n = X_O + Σⁿ_k=1T_kB_k. Тогда

Так как игра имеет положительное ожидание, то есть p-q> 0, в этой ситуации равных выплат, для того, чтобы максимизировать Е(Х_n), мы должны были бы максимизировать E(B_k) для каждой попытки. Таким образом, чтобы максимизировать ожидаемый рост мы должны ставить все наши ресурсы в каждой попытке. Таким образом, B₁ = X₀, и, если мы выигрываем первую ставку, B₂ = 2X₀, и т.д. Однако, вероятность краха при этом будет 1 - p^N и при p < 1, lim _n→∞ [1 —рⁿ] = 1, так что крах почти неизбежен. Таким образом, "смелый" критерий ставок для максимизации ожидаемого роста обычно нежелателен.

Аналогично, если наша стратегия состоит в том, чтобы минимизировать вероятность возможного краха (а "крах" происходит, если X_K = 0 на k-ой попытке), мы должны делать минимальную ставку на каждой попытке, но это, к сожалению, также минимизирует и ожидаемый рост. Таким образом, "робкая" система ставок также непривлекательна.

Это предполагает существование промежуточной стратегия, которая лежит где-то между максимизацией E (X_n) (и верным крахом) и уменьшением вероятности краха (и уменьшением E (Х_n)). Асимптотически оптимальная стратегия была впервые предложена Джном Келли в 1956 году.

Так как вероятности и выплаты при каждой ставке в описанной игре с подбрасыванием монеты одинаковы, кажется вполне правдоподобно, что "оптимальная" стратегия потребует всегда делать ставки на одну и ту же долю f вашего капитала. Чтобы это было возможным сделать, мы предполагаем далее, что капитал может бесконечно дробиться.

Стратегия, в которой ставки делаются согласно B_i = f X_i-1, где 0 ≤ f ≤ 1, иногда называется стратегией "фиксированной доли". Пусть S и F - числа успехов и проигрышей в n попытках соответственно, тогда наш капитал после n попыток равен X_n = X_o(1+ f)^S (1-f)^F, где S + F = n. При f в интервале 0 < f < 1, Рr (Х_n = 0) = 0. Таким образом, "краха", понимаемом в техническом смысле как разорение игрока, произойти не может. "Крах" будет означать, что для произвольно маленького положительного ε, lim_n→∞[Рr(X_n ≤ ε)] = 1. В этом смысле, как мы увидим, крах все-таки может случиться при некоторых обстоятельствах.

Отметим, что так как

величина

измеряет экспоненциальную скорость роста за попытку. Келли максимизировал ожидаемую величину коэффициента скорости роста, g(f), где

Получается, что g(f) = (1/n)E[logX_n]- (1/n)logX₀, поэтому, для фиксированного n, максимизация g(f) - то же самое, что максимизация E[logX_n]. Вычислим производную:

когда f = f ^* = p — q.

Так как

то g' (f) убывает строго монотонно на [0, 1],

так как g' (0) = p-q > 0 и lim _f→1- g'(f) = - ∞. Вследствие непрерывности g'(f), g (f) имеет единственный максимум в точке f=f *,

где g(f *) = p log p + q log q + log 2 > 0. Более того, поскольку g(0) = 0 и lim _f→1- g{f) = - ∞, то существует единственное f_C > 0, такое что 0 < f* < f_C < 1 и g(f_C) = 0.

Построим график функции g(f) от f (рисунок 3.1).

Рисунок 3.1. График функции g(f)

Исходя из максимизации функции g(f), Джоном Келли были сформулированы следующие свойства:

- Если g(f) > 0, тогда почти достоверно, что lim_n→∞Х_n = ∞, то есть для каждого М, Pr [lim_n→∞ inf Х_n> М] = 1. Это свойство показывает что, если бы не конечное время, благосостояние игрока X_N превысило бы любой установленный предел М, когда f выбрано в интервале (0, f _с).

- Если g(f) < 0, тогда почти достоверно, что lim_n→∞Х_n = 0, то есть для каждого ε>0, Pr [lim_n→∞ sup Х_n < ε] = 1, получается, что крах неизбежен.

- Если g(f) = 0, тогда почти достоверно, что lim_n→∞ sup Х_n= ∞ и lim_n→∞ inf Х_n = 0. Это утверждение демонстрирует, что, е сли g(f) = 0, тогда почти достоверно, что lim_n→∞ sup Х_n= ∞ и lim_n→∞ inf Х_n = 0.

- Для заданной стратегии Ф*, которая максимизирует E[log X_n] и любой другой "существенно иной" стратегии Ф (не обязательно стратегии фиксированных дробных ставок) почти достоверно, что lim_n→∞ Х_n(Ф*)/Х_n (Ф) = ∞.

- Ожидаемое время, необходимое чтобы текущий капитал X_n достиг заранее установленного значения С будет, асимптотически, наименьшим при стратегии, которая максимизирует E[log X_n].

- Если предположить, что отдача от одной ставки на i-ой попытке - биноминальная случайная переменная U_i, далее предположим, что вероятность успеха p_i, где 1/2 < p_i < 1. Тогда E[log X_n] максимизируется выбором значением для ставки при каждой попытке доли f *_i = p_i - q_i которая максимизирует E[ log (1+f_iU_i)]. Эта часть устанавливает справедливость использования метода Kelly выбора f_i* при каждой попытке (даже если от одной попытки к следующей меняется вероятность) для максимизации E[log X_n].

Пример использования свойств «критерия Келли». Обобщающая формула Келли

Разберем пример:

Игрок А играет против бесконечно богатого противника. Игрок выигрывает одну и ту же сумму при последовательных независимых бросках монеты с вероятностью p =0,53 (независимые события). Игрок А имеет начальный капитал X₀, и капитал может бесконечно делиться. Если мы применим шестое свойство, то получаем * = p - q = 0,53 – 0,47 = 0,06, Таким образом, в каждой игре он должен ставить 6 % текущего капитала, чтобы X_n рос с максимальной скоростью и с нулевой вероятностью краха. Если Игрок А постоянно ставит меньшую долю, чем 6 %, X_n также будет расти до бесконечности, но медленнее.

Если Игрок A постоянно ставит долей большей чем 6 %, но меньше f_с, возникает то же самое. Решая уравнение g(f) = 0,53log (l +f) + 0,47log (l - f) = 0 численно на компьютере получаем fc = 0,11973^¯. Так, если ставка больше чем примерно 12 %, то даже при том, что Игрок А может временно наслаждаться быстрой скоростью роста, возможные колебания вниз непременно приведут величину X_n к нулю. Вычисление дает коэффициент роста g(f*)= f (0,06) = 0,001801 так, что после n последовательных ставок логарифм среднего величины капитала Игрока А будет стремиться к значению в 0,001801*n раз превышающему стартовый капитал. Приравнивая 0,001801n = log 2, получаем ожидаемое время, необходимое для удвоения капитала примерно равное n = 385.

Выше рассматривались игры с равномерными выплатами. Но, Критерий Кэлли может легко быть расширен на игры с неравными выплатами. Предположим, Игрок А выигрывает b единиц на каждую единицу ставки. Далее предположим, что на каждой попытке вероятность победы p> 0 и pb - q> 0, так что игра выгодна для Игрока А. Методы, подобные рассмотренным, могут использоваться для максимизации:

Вычисления дают f* = (bp — q)/(b - 1), эта формула является обобщенной формулой Келли, показывающей какую долю от текущего количества денег нужно выделять для каждой отдельной ставки, чтобы максимизировать коэффициент роста g(f). Если адаптировать эту формулу для ставок на спорт, то она приобретает следующий вид:

С = (K*V) – 1)/(K – 1), где

С — коэффициент размера следующей ставки,

K — коэффициент букмекера,

V – оценка вероятности проходимости события игроком.

⇐ Предыдущая 1 2 345 Следующая ⇒

Поделиться с друзьями:

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...