Построение D-оптимальных моделей пространства состояний — КиберПедия 

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Построение D-оптимальных моделей пространства состояний

2017-11-17 465
Построение D-оптимальных моделей пространства состояний 0.00 из 5.00 0 оценок
Заказать работу

ПРОЦЕДУРА ПОСЛЕДОВАТЕЛЬНОЙ D-ОПТИМАЛЬНОЙ ИДЕНТИФИКАЦИИ (ДППИ).

Зададим линейно-комбинационную модель следующим образом:

Задача сводится к нахождению вектора , а точнее его оптимального значения и его ковариационной матрицы.

Поскольку модель нелинейно-параметризованная, будем опираться на теорию последовательного планирования эксперимента, а именно на D-оптимальную процедуру последовательной идентификации (ДППИ).

D-оптимальная процедура последовательной идентификации может быть сформулирована следующим образом: объект исследования возбуждается в момент времени путем подачи на его вход некоторого "затравочного" тестирующего сигнала протяженностью . Затравочный тестирующий сигнал должен обеспечивать возможность оценивания элементов вектора , причем при оценке опираемся на теорию нелинейного оценивания статических моделей.

Начиная с момента времени () в течение времени вычисляются оценки элементов вектора и синтезируется первичный участок локального D-оптимального тестирующего сигнала. С момента времени . Протяженность участка после будет либо равна , если производится планирование одного измерения, либо больше , если производится планирование более одного измерения.

После окончания реализации первого участка сигнала и проведения всех запланированных измерений выхода необходимо уточнить НМНК оценки вектора и синтезировать второй участок локального D-оптимального плана, проверив перед этим правило останова ДППИ. Уточнение производится с учетом всех ранее произведенных измерений выхода, включая измерения этапа затравочного тестирования.

После синтеза второго участка сигнала он подается на вход объекта, и процедура повторяется вплоть до выполнения правила останова. Правило останова ДППИ то же, что и для моделей статики. Таким образом, в процессе реализации в реальном времени осуществляется синтез участков локального D-оптимального тестирующего сигнала и поэтапное уточнение НМНК оценок параметров модели. По окончании ДППИ получается близкая к D-оптимальной нелинейно-параметризованная динамическая регрессионная модель.

В результате эксперимента имеем неоптимальные участки (). Для обеспечения непрерывности сигнала необходимо заполнить эти неоптимальные интервалы длительностью каждый. Возможно несколько подходов.

I подход применим, если время расчета меньше шага дискретизации ()., Тогда, если симметричные участки локального D-оптимального тестирующего сигнала эквивалентны, то на вход объектов в течение интервалов можно подавать сигнал либо верхнего, либо нижнего уровня, если синтезируемый сигнал двухуровневый. Однако предварительно нужно доказать двухуровневость сигнала и эквивалентность его симметричных участков.

При этом обеспечивается сокращение длины сигнала на , где N - общее число реализованных этапов за счет исключения из реализации участков расчета планирование каждого этапа. То есть уточнение оценок и синтез каждого участка сигнала производится параллельно с тестированием объекта в начале реализации планируемого этапа.

II подход применим, если время расчета больше шага дискретизации (). При этом непрерывность тестирующего сигнала может быть обеспечен, если планирование каждого этапа ДППИ производить в конце реализации предыдущего этапа, и использовать при этом прогнозируемое значение вектора НМНК оценок к моменту окончания реализации предыдущего этапа. В этом случае планирование каждого этапа осуществляется в конце реализации предыдущего в отличие от первого подхода, когда планирование осуществляется в начале следующего этапа. В данном случае сигнал хуже, так как предполагает планирование не строго локальных D-оптимальных участков из-за замены НМНК оценоких прогнозируемыми значениями.

ОСОБЕННОСТИ РЕАЛИЗАЦИИ ДППИ.

Вычисление начальной оценки по результатам затравочного тестирования производится по методике пассивного эксперимента методом Гаусса-Ньютона. Начальное приближение определяется из предположения, что  известно.

Планирование этапов осуществляется путем решения следующей аргументной задачи:

При планировании эксперимента в задачах нелинейного оценивания нормирование факторов не производится, поэтому в данной задаче пространство планирования определяется следующей системой неравенств:

При этом предполагается, что: ,

где и - значения входа и выхода объекта в исходном статическом состоянии;

и - истинные дискретные значения входа и выхода;

и - отклонения.

Для того, чтобы решить задачу проанализируем дисперсионную функцию:

Покажем, что квадратичная форма относительно вектора является квадратичной формой относительно вектора факторов планирования.

Таким образом, участки локальных D-оптимальных тестирующих сигналов для линейно-комбинационной модели являются двухуровневыми (), а симметричные участки сигнала эквивалентны.

Эти свойства позволяют обеспечить непрерывность синтезируемого D-оптимального тестирующего сигнала (за счет того, что мы можем подавать произвольный сигнал ), а также упростить задачу склеивания участков сигнала.

Известна теорема, что участки локального D-оптимального тестирующего сигнала, предполагающие одно измерение выхода, имеют не более k переключений, то есть при синтезе такого участка сигнала достаточно просмотреть лишь те вершины пространства , которым соответствуют участки сигнала, имеющие не более k переключений. Эта теорема позволяет ускорить планирование этапов ДППИ.

Рассмотрим II случай, когда время расчета больше шага дискретизации (). В этом случае синтез очередного участка сигнала производится с использованием прогнозируемых значений НМНК оценок элементов вектора неизвестных коэффициентов .

Рассмотрим задачу планирования n+1 этапа ДППИ на основе оценки .

 

Прогнозирование НМНК-оценок неизвестных параметров

Прогнозирование возможно, если на каждом этапе процедуры производится несколько запланированных измерений выхода. Синтез участка, предполагающего несколько измерений выхода, производится по следующему алгоритму:

где - порядковый номер синтезируемого участка сигнала;

- i-тая точка плана, которая должна быть реализована на (N+1) этапе процедуры. Эта точка определяет i-тый участок сигнала, определяющий предысторию для i-того измерения выхода (N+1) этапа;

- число планируемых измерений;

- ковариационная матрица вектора , если его

Для формализации данной процедуры необходимо получить рекуррентное выражение, связывающее ковариационную матрицу c ковариационной матрицей для

Для получения рекуррентной формулы можно воспользоваться известной теоремой из матричной алгебры:

Тогда получим:

Искомая рекуррентная процедура синтеза участков локального D-оптимального тестирующего сигнала (N+1) этапа, предполагающего измерение определяется следующими матричными выражениями:

где .

Прогнозирование оценок неизвестных параметров производится на интервале времени между и измерениями выхода N -ого этапа ДППИ.

Если интервал между и измерениями больше , то можно производить прогнозирование. При этом предполагается, что интервал между этими измерениями не меньше .

Оценка , то есть прогнозирование вектора к моменту реализации N -ого этапа вычисляется из следующего условия:

- это критерий взвешенного МНК.

- функция веса;

- параметр функции веса.

Функция веса вводится для того, чтобы уменьшить влияние на прогноз старых измерений, то есть измерений, удаленных от момента прогнозирования. Обычно функция веса записывается в виде:

Параметр  априори неизвестен и должен оцениваться на каждом этапе процедур. Оценка коэффициента  находится из условия:

,

где - прогнозируемое значение оценок к моменту i-того измерения выхода.

Можно показать, что оценка вычисляется с помощью следующей рекуррентной процедуры, которая является взвешенным НМНК:



 

ОСОБЕННОСТИ СИНТЕЗА
НЕЛИНЕЙНЫХ D-ОПТИМАЛЬНЫХ МОДЕЛЕЙ ДИНАМИКИ.

Построение D-оптимальных нелинейных моделей осуществляется на основе ДППИ аналогично процедуре, рассмотренной для моделей линейных систем.

При реализации данной процедуры необходимо учитывать следующие особенности, присущие нелинейным системам:

1)Для нелинейных систем не выполняется принцип суперпозиции (принцип суперпозиции - когда выходной сигнал объекта равен сумме реакций всех входных сигналов), поэтому модели таких систем связывают не отклонения значения входа и выхода от исходного статистического состояния, а истинного значения входа-выхода. Таким образом, производство планирования для нелинейных систем может быть задано системой неравенств:

2) Участки локального D-оптимального тестирующего сигнала для нелинейных систем не являются двухуровневыми, поскольку ни одна из соответствующих им дисперсионных функций не может быть представлена в виде квадратичной формы относительно вектора .

Например, для модели Винера:

Таким образом, локальные D-оптимальные тестирующие сигналы для нелинейных систем являются многоуровневыми, причем число уровней априори неизвестно.

При анализе участков сигнала в общем случае необходимо просмотреть все пространство планирования , что резко усложняет задачу планирования участков ДППИ.

На практике обычно задают три уровня сигнала: и синтезируется сигнал в классе трехуровневых сигналов:

Пространство в этом случае будет квадратом, кубом, гиперкубом и так далее, так как для каждого сигнала ограничительные условия одинаковые.

3) Поскольку число уровней априори неизвестно, симметричные участки не эквивалентны, то планирование этапов ДППИ должно всегда производиться в конце реализации предыдущего этапа на основе прогнозируемых значений оценок.

ПОСТРОНИЕ D-ОПТИМАЛЬНЫХ МОДЕЛЕЙ ПРОСТРАНСТВА СОСТОЯНИЙ.

Рассмотрим модель пространства состояний:

При нулевых начальных условиях перейдем к модели типа "вход-выход":

Планирование этапов ДППИ для моделей пространства состояний производится путем решения аргументной задачи: , полученной из выражения:


Мы получили модель, представленную в виде ряда Тейлора:

Пространство планирования , так как объект линейный.

Поскольку максимизированная квадратичная форма является квадратичной формой относительно вектора U, синтезируемые участки локального D-оптимального тестирующего сигнала для этой модели являются двухуровневыми, а симметричные участки эквивалентны.

Известна теорема, согласно которой синтезируемые участки сигнала имеют не более 2n-1 переключений.

При построении непрерывного тестирующего сигнала на основе точек плана можно использовать те же два подхода, что и для моделей типа "вход-выход".

 

 

Тема 17. Планирование эксперимента в условиях неоднородностей


Поделиться с друзьями:

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.039 с.