Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...
Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...
Топ:
Когда производится ограждение поезда, остановившегося на перегоне: Во всех случаях немедленно должно быть ограждено место препятствия для движения поездов на смежном пути двухпутного...
Проблема типологии научных революций: Глобальные научные революции и типы научной рациональности...
Методика измерений сопротивления растеканию тока анодного заземления: Анодный заземлитель (анод) – проводник, погруженный в электролитическую среду (грунт, раствор электролита) и подключенный к положительному...
Интересное:
Искусственное повышение поверхности территории: Варианты искусственного повышения поверхности территории необходимо выбирать на основе анализа следующих характеристик защищаемой территории...
Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...
Мероприятия для защиты от морозного пучения грунтов: Инженерная защита от морозного (криогенного) пучения грунтов необходима для легких малоэтажных зданий и других сооружений...
Дисциплины:
2017-10-01 | 299 |
5.00
из
|
Заказать работу |
|
|
Условия оптимальности, которые дают метод динамического программирования, могут быть положены в основу создания приближенных методов решения задач определения оптимального управления.
Метод последовательных приближений.
Пусть требуется найти оптимальную программу управления системой
, , , , .
В соответствии с методом динамического программирования оптимальное управление должно удовлетворять уравнению Беллмана
при условии . Уравнение Беллмана можно представить в следующей форме:
,
.
Так как при оптимальном управлении функция обращается в нуль, то полная производная функции будущих потерь, вычисленная вдоль оптимальной траектории, равна
, .
Допустим, что на итерации имеем - некоторое допустимое управление и - соответствующую ему траекторию. Тогда можно вычислить функцию :
,
так как при .
Теперь построим функцию
.
Минимизируя эту функцию, найдем новое приближение для управления . Можно показать, что если указанное построение оказывается возможным, то последовательность управлений является минимизирующей, т.е. .
Аппроксимация функции будущих потерь. Метод параметров.
Основное рекуррентное соотношение дает формальный алгоритм численного решения. Однако аналитическое выражение для функции будущих потерь получить в общем виде не удается. Задачу можно решить приближенно, если функцию будущих потерь на каждом шаге аппроксимировать некоторой зависимостью вида
,
где - некоторые заданные функции, - параметры, которые определяются типом аппроксимации. Например, можно определить из условия обращения в минимум следующей квадратичной ошибки:
.
Здесь под понимаются некоторые характерные точки из допустимого множества векторов , через обозначены значения функции будущих потерь, вычисленные для точек согласно основному рекуррентному соотношению. Дифференцируя последнее выражение по и приравнивая производные к нулю, получаем
|
или ,
где , .
Искомый вектор параметров, обеспечивающий наилучшее приближение функции будущих потерь в смысле квадратичной ошибки , определяется следующим образом:
.
При выборе структуры функций необходимо учитывать ограничение, в силу которого должно иметь место условие
.
Приближенное решение уравнения Беллмана.
Метод параметров легко распространяется и на непрерывный случай, т.е. он может быть применен для приближенного решения уравнения Беллмана:
, .
Представим в виде
,
где - заданные функции, - функции времени, определяемые из условия
,
где - множество допустимых векторов .
Отсюда получаем
,
, .
Продифференцировав по времени, получим
.
Производную можно приближенно определить из уравнения Беллмана, тогда
.
Граничное условие для получается из условия
.
|
|
Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...
Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...
Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...
Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!