История развития пистолетов-пулеметов: Предпосылкой для возникновения пистолетов-пулеметов послужила давняя тенденция тяготения винтовок...
История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...
Топ:
Выпускная квалификационная работа: Основная часть ВКР, как правило, состоит из двух-трех глав, каждая из которых, в свою очередь...
Особенности труда и отдыха в условиях низких температур: К работам при низких температурах на открытом воздухе и в не отапливаемых помещениях допускаются лица не моложе 18 лет, прошедшие...
Устройство и оснащение процедурного кабинета: Решающая роль в обеспечении правильного лечения пациентов отводится процедурной медсестре...
Интересное:
Уполаживание и террасирование склонов: Если глубина оврага более 5 м необходимо устройство берм. Варианты использования оврагов для градостроительных целей...
Как мы говорим и как мы слушаем: общение можно сравнить с огромным зонтиком, под которым скрыто все...
Аура как энергетическое поле: многослойную ауру человека можно представить себе подобным...
Дисциплины:
|
из
5.00
|
Заказать работу |
Содержание книги
Поиск на нашем сайте
|
|
|
|
С принципом максимума
Существует связь между функцией будущих потерь
и сопряженными переменными
. Рассмотрим задачу Лагранжа:
,
,
,
.
Перепишем уравнение Беллмана в следующем виде
.
Введем в рассмотрение расширенный вектор
, где
и
определяются уравнениями
,
.
Расширенная вектор-функция правых частей имеет вид:
, где
.
Введем вектор
, где
, т.е.
,
,
.
Тогда уравнение Беллмана можно переписать в виде
,
где
.
Таким образом, мы пришли к принципу максимума: оптимальное управление обеспечивает максимум гамильтониану
, значение которого на оптимальной траектории равно нулю.
Получим каноническую систему уравнений. Уравнение для вектора
может быть записано сразу:
.
Уравнения для
получим, предположив, что функция
дважды дифференцируема, тогда
.
Для любого фиксированного момента времени могут быть найдены оптимальные значения
,
, для которых гамильтониан обращается в нуль. Отсюда следует, что при фиксированных
и оптимальном управлении
величина гамильтониана достигает максимума по
в точке оптимальной траектории. Поэтому

.
Откуда получаем, что
, и учитывая, что
, имеем:
.
Таким образом, вектор
, участвующий в принципе максимума, является антиградиентом функции
, связанной с функцией будущих потерь. Уравнение Беллмана эквивалентно необходимым условиям в форме принципа максимума. Результатом решения уравнения Беллмана является оптимальное управление в форме синтеза, в то время как при использовании принципа максимума определяется лишь программа оптимального управления. Однако численно решить краевую задачу и тем самым определить программу управления проще, чем решить уравнение в частных производных, т.е. построить синтез. Аналитическое решение уравнения Беллмана можно получить лишь в некоторых частных случаях.
Связь уравнения Беллмана с уравнением Гамильтона-Якоби классического вариационного исчисления
Запишем уравнение Беллмана
.
Обозначим
. Отметим, что
отличается от гамильтониана
только знаком перед
. При поиске минимума эти записи гамильтониана эквивалентны. Имеем
- уравнение Беллмана,
- уравнение Гамильтона-Якоби.
Гамильтониан
содержит управление
, которое получалось бы из необходимого условия простого экстремума
. Уравнение Беллмана является развитием результатов классического вариационного исчисления, распространяющим их на системы с ограничением на управление
.
Геометрическая интерпретация решения
Уравнения Беллмана
Рассмотрим решение задачи минимизации, когда функционал содержит только терминальный член:
.
Пусть доказано существование функции Беллмана, удовлетворяющей уравнению
.
Минимум скалярного произведения двух векторов, достигается, если они направлены в противоположные стороны. Поскольку
, можно сделать вывод, что оптимальное движение точки должно быть направлено против градиента функции
.
|
|
|
|
|
|
|
|
|
|
Рис.4.2. Семейство линий уровней функции 
На рис. 4.2 для двухмерной задачи показано семейство линий уровней функции
и положение ее минимального значения, равного 0, а также одна из траекторий движения, приводящая к этому минимуму.
|
|
|
Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...
Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...
Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...
Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...
© cyberpedia.su 2017-2026 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!