Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Когда производится ограждение поезда, остановившегося на перегоне: Во всех случаях немедленно должно быть ограждено место препятствия для движения поездов на смежном пути двухпутного...

Проблема типологии научных революций: Глобальные научные революции и типы научной рациональности...

Методика измерений сопротивления растеканию тока анодного заземления: Анодный заземлитель (анод) – проводник, погруженный в электролитическую среду (грунт, раствор электролита) и подключенный к положительному...

Интересное:

Искусственное повышение поверхности территории: Варианты искусственного повышения поверхности территории необходимо выбирать на основе анализа следующих характеристик защищаемой территории...

Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...

Мероприятия для защиты от морозного пучения грунтов: Инженерная защита от морозного (криогенного) пучения грунтов необходима для легких малоэтажных зданий и других сооружений...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспруденция

Метода динамического программирования

2017-10-01

299

0.00 из 5.00 0 оценок

Заказать работу

⇐ ПредыдущаяСтр 12 из 19Следующая ⇒

Условия оптимальности, которые дают метод динамического программирования, могут быть положены в основу создания приближенных методов решения задач определения оптимального управления.

Метод последовательных приближений.

Пусть требуется найти оптимальную программу управления системой

, , , , .

В соответствии с методом динамического программирования оптимальное управление должно удовлетворять уравнению Беллмана

при условии . Уравнение Беллмана можно представить в следующей форме:

Так как при оптимальном управлении функция обращается в нуль, то полная производная функции будущих потерь, вычисленная вдоль оптимальной траектории, равна

, .

Допустим, что на итерации имеем - некоторое допустимое управление и - соответствующую ему траекторию. Тогда можно вычислить функцию :

так как при .

Теперь построим функцию

Минимизируя эту функцию, найдем новое приближение для управления . Можно показать, что если указанное построение оказывается возможным, то последовательность управлений является минимизирующей, т.е. .

Аппроксимация функции будущих потерь. Метод параметров.

Основное рекуррентное соотношение дает формальный алгоритм численного решения. Однако аналитическое выражение для функции будущих потерь получить в общем виде не удается. Задачу можно решить приближенно, если функцию будущих потерь на каждом шаге аппроксимировать некоторой зависимостью вида

где - некоторые заданные функции, - параметры, которые определяются типом аппроксимации. Например, можно определить из условия обращения в минимум следующей квадратичной ошибки:

Здесь под понимаются некоторые характерные точки из допустимого множества векторов , через обозначены значения функции будущих потерь, вычисленные для точек согласно основному рекуррентному соотношению. Дифференцируя последнее выражение по и приравнивая производные к нулю, получаем