Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...
Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...
Топ:
История развития методов оптимизации: теорема Куна-Таккера, метод Лагранжа, роль выпуклости в оптимизации...
Особенности труда и отдыха в условиях низких температур: К работам при низких температурах на открытом воздухе и в не отапливаемых помещениях допускаются лица не моложе 18 лет, прошедшие...
Оценка эффективности инструментов коммуникационной политики: Внешние коммуникации - обмен информацией между организацией и её внешней средой...
Интересное:
Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...
Наиболее распространенные виды рака: Раковая опухоль — это самостоятельное новообразование, которое может возникнуть и от повышенного давления...
Уполаживание и террасирование склонов: Если глубина оврага более 5 м необходимо устройство берм. Варианты использования оврагов для градостроительных целей...
Дисциплины:
2017-10-01 | 344 |
5.00
из
|
Заказать работу |
|
|
С принципом максимума
Существует связь между функцией будущих потерь и сопряженными переменными . Рассмотрим задачу Лагранжа:
, , , .
Перепишем уравнение Беллмана в следующем виде
.
Введем в рассмотрение расширенный вектор , где и определяются уравнениями
, .
Расширенная вектор-функция правых частей имеет вид:
, где .
Введем вектор , где , т.е.
, , .
Тогда уравнение Беллмана можно переписать в виде
,
где .
Таким образом, мы пришли к принципу максимума: оптимальное управление обеспечивает максимум гамильтониану , значение которого на оптимальной траектории равно нулю.
Получим каноническую систему уравнений. Уравнение для вектора может быть записано сразу: .
Уравнения для получим, предположив, что функция дважды дифференцируема, тогда
.
Для любого фиксированного момента времени могут быть найдены оптимальные значения , , для которых гамильтониан обращается в нуль. Отсюда следует, что при фиксированных и оптимальном управлении величина гамильтониана достигает максимума по в точке оптимальной траектории. Поэтому
.
Откуда получаем, что , и учитывая, что , имеем: .
Таким образом, вектор , участвующий в принципе максимума, является антиградиентом функции , связанной с функцией будущих потерь. Уравнение Беллмана эквивалентно необходимым условиям в форме принципа максимума. Результатом решения уравнения Беллмана является оптимальное управление в форме синтеза, в то время как при использовании принципа максимума определяется лишь программа оптимального управления. Однако численно решить краевую задачу и тем самым определить программу управления проще, чем решить уравнение в частных производных, т.е. построить синтез. Аналитическое решение уравнения Беллмана можно получить лишь в некоторых частных случаях.
|
Связь уравнения Беллмана с уравнением Гамильтона-Якоби классического вариационного исчисления
Запишем уравнение Беллмана
.
Обозначим . Отметим, что отличается от гамильтониана только знаком перед . При поиске минимума эти записи гамильтониана эквивалентны. Имеем
- уравнение Беллмана,
- уравнение Гамильтона-Якоби.
Гамильтониан содержит управление , которое получалось бы из необходимого условия простого экстремума . Уравнение Беллмана является развитием результатов классического вариационного исчисления, распространяющим их на системы с ограничением на управление .
Геометрическая интерпретация решения
Уравнения Беллмана
Рассмотрим решение задачи минимизации, когда функционал содержит только терминальный член: .
Пусть доказано существование функции Беллмана, удовлетворяющей уравнению
.
Минимум скалярного произведения двух векторов, достигается, если они направлены в противоположные стороны. Поскольку , можно сделать вывод, что оптимальное движение точки должно быть направлено против градиента функции .
Рис.4.2. Семейство линий уровней функции
На рис. 4.2 для двухмерной задачи показано семейство линий уровней функции и положение ее минимального значения, равного 0, а также одна из траекторий движения, приводящая к этому минимуму.
|
|
Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначенные для поддерживания проводов на необходимой высоте над землей, водой...
Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...
Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...
Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!