Метод динамического программирования, функция состояния, уравнение Беллмана — КиберПедия 

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

Метод динамического программирования, функция состояния, уравнение Беллмана

2017-12-21 454
Метод динамического программирования, функция состояния, уравнение Беллмана 0.00 из 5.00 0 оценок
Заказать работу

Динамическое программирование представляет собой математический аппарат, разработанный для решения некоторого класса задач математического программирования путем их разложения на относительно небольшие и, следовательно, менее сложные задачи. Специфика метода динамического программирования состоит в том, что для отыскания оптимального управления планируемая операция разделяется на ряд последовательных шагов или этапов. Соответственно и сам процесс планирования операции становится многошаговым и развивается последовательно, от этапа к этапу, причем каждый раз оптимизируется управление только на одном шаге.

В основе динамического программирования лежат 2 принципа:

Первый- принцип оптимальности Беллмана: каковы бы ни были начальное состояние системы и принятое решение, все последующие решения на остальных шагах должны составлять оптимальную стратегию относительно состояния, возникающего в результате первого решения.

Второй- принцип вложения: природа задачи, допускающая использование метода динамического программирования, не меняется при изменении числа шагов.

Структура процессов, исследуемых методом динамического программирования, должна удовлетворять следующим условиям:

· небольшое число переменных

· * управляемый процесс- Марковский, т.е. предыстория не имеет значения при определении будущих действий

· * критерий эффективности J является аддитивным.

Состояние на каждом шаге характ-ся некоторой переменной величиной, кот. называется параметром состояния. Наилучший эффект на данном этапе вместе с уже рассмотренными шагами хар-ся функцией состояния. Решение конкретной задачи методом динамич. программирования сводится к выбору параметра состояния, составлению ф-ии состояния и рекурентных соотношений, связывающих ф-ии состояния для двух соседних последовательных этапов, и их применению для выбора оптимального управления.

 

72. Составить математическую модель и записать функциональное уравнение Беллмана (рекуррентное соотношение), расшифровать все переменные и функции, входящие в него для следующей задачи:

Предприятие производит некоторое изделие, на которое оно имеет заказ на п месяцев.

Необходимо спланировать объем выпуска и хранения

продукции для каждого месяца его работы при условии, что суммарные затраты на производство и хранение продукции за п месяцев будут минимальными при полном удовлетворении спроса на продукцию. При этом уровень запасов к началу первого месяца задан, а к концу последнего . Известны также спрос на продукцию в каждом j -м месяце и затраты на производство и хранение единиц продукции в каждом j- ммесяце.

F(x1, x2, x3, x4) =f1(x1) + f2(x2) + f3(x3) + f4(x4)

x1+x2+x3+x4= Z(700)

gk= max(fk(xk) + gk-1 (Z-xk)) F= g4(Z)

xk= 0, 100, 200, 300, 400

G3 F3   0 100 200 300 400
   

g3(400) =105

 

73.Составить математическую модель и записать функциональное уравнение Беллмана
(рекуррентное соотношение), расшифровать все переменные и функции, входящие в него
для следующей задачи:

Предполагается, что принимают целые неотрицательные значения.

2). Пусть требуется загрузить в самолет грузоподъемностью W тоннгруз, состоящий из предметов п различных типов, таким образом, чтобы стоимость всего груза была

максимальной. Для каждого предмета j -го типа, j= 1,2,...,п, заданы вес в тоннах и

стоимость в тысячах рублей одного предмета этого типа, где все и -целые

положительные числа. Причем предметов каждого типа можно загружать в самолет по несколько штук.

Ур-ние Беллмана: Fk*(ξ) = max {fk (xk) + Fk-1(ξ-xk)} = fk() + F(ξ- )

0 xk ξ xk

0 ξ b

Fk*(ξ) – max приращение прибыли по k предприятиям.

 

74.Составить математическую модель и записать функциональное уравнение Беллмана
(рекуррентное соотношение), расшифровать все переменные и функции, входящие в него
для следующей задачи:

Средства в размере b млн. рублей распределяются между п предприятиями в количествах,

кратных а млн. руб., причем - целое число. При выделении j -му предприятию млн. рублей оно приносит доход млн. рублей.Требуется распределить выделенные средства так, чтобы суммарный доход по всем предприятиям был максимальным.

Ур-ние Беллмана: Fk*(ξ) = max {fk (xk) + Fk-1(ξ-xk)} = fk() + F(ξ- )

0 xk ξ xk

0 ξ b

Fk*(ξ) – max приращение прибыли по k предприятиям.

 

Обозначим через прирост мощности или прибыли на i-м предприятии, если оно получит рублей капитальных вложений. Требуется найти такое распределение капитальных вложений между предприятиями, которое максимизирует суммарный прирост мощности или прибыли

при ограничении по общей сумме капитальных вложений причем будем считать, что все переменные принимают только целые неотрицательные значения: или или или

Функции мы считаем заданными, заметив, что их определение – довольно трудоемкая экономическая задача. Введем параметр состояния и определим функцию состояния. За параметр состояния примем количество рублей, выделяемых нескольким предприятиям, а функцию состояния определим как максимальную прибыль на первых предприятиях, если они вместе получают рублей. Параметр может изменяться от до . Если из рублей -е предприятие получит рублей, то каково бы ни было это значение, остальные рублей естественно распределить между предприятиями от первого до -го так, чтобы была получена максимальная прибыль . Тогда прибыль предприятий будет равна . Надо выбрать такое значение между и , чтобы эта сумма была максимальной, и мы приходим к рекуррентному соотношению для . Если же , то (при условии, что функция возрастающая).

 

 

75. Составить математическую модель и записать функциональное уравнение Беллмана
(рекуррентное соотношение), расшифровать все переменные и функции, входящие в него
для следующей задачи:

Предприятие может производить п видов изделий, располагая некоторым ресурсом в объеме

b единиц (b - целое положительное число). Известны затраты ресурса на изготовление

одного изделия j -го вида, а также известна ожидаемая прибыль сj от реализации одного

изделия j -го вида (. - целые положительные числа), j = 1, 2,..., п.

Требуется составить план выпуска изделий, максимизирующий суммарную прибыль.

Требуется найти такой план выпуска изделий (x1,x2,..., xn), которое максимизирует суммарную прибыль: z = c1x1 + c2х2 +... + cnxn

при ограниченности ресурсов:

причем все переменные xj принимают только целые неотрицательные значения: xj = 0, 1, 2...

За параметр состояния x принимаем количество ресурсов, выделяемых для производства нескольких видов изделий, а функцию состояния Сk(x) определим как максимальную прибыль при производстве k видов изделий, если для их производства имеется x единиц ресурса, функцию Аk(x) как издержки при производстве k видов изделий, если для их производства имеется x единиц ресурса. Параметр x может изменяться от 0 до b.

Fk(x)=max{(c k-ak) x k + Сk-1(x- x k)-A k-1(x- x k)}, 0 £ x k £ x

 

76. Составить математическую модель и записать функциональное уравнение Беллмана
(рекуррентное соотношение), расшифровать все переменные и функции, входящие в него
для следующей задачи:

Пусть п предприятиями некоторого объединения должен быть произведен определенный

продукт в количестве bединиц. При изготовлении хj единиц продукта на j -м предприятии

издержки составляют денежных единиц. Требуется спланировать производство


Поделиться с друзьями:

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.021 с.