Адаптивная оптимальная робастная стабилизация авторегрессионного объекта со смещенным внешним возмущением

Соколов В. Ф.

doi:doi:10.19110/1994-5655-2022-5-20-27

Главная / Журналы / Известия Коми научного центра УрО РАН / Номер 5 / Адаптивная оптимальная робастная стабилизация авторегрессионного объекта со смещенным внешним возмущением

Адаптивная оптимальная робастная стабилизация авторегрессионного объекта со смещенным внешним возмущением

Отправить рукопись Скачать PDF
Текст

Цитировать

Цитирований:

АДАПТИВНАЯ ОПТИМАЛЬНАЯ РОБАСТНАЯ СТАБИЛИЗАЦИЯ АВТОРЕГРЕССИОННОГО ОБЪЕКТА СО СМЕЩЕННЫМ ВНЕШНИМ ВОЗМУЩЕНИЕМ

Журнал: ИЗВЕСТИЯ КОМИ НАУЧНОГО ЦЕНТРА УРО РАН № 5 , 2022

Рубрики: БЕЗ РУБРИКИ

УДК 517.977 Математическая теория управления. Оптимальное управление. Дифференциальные игры

Соколов В. Ф. ¹

Информация об авторах и публикации

Авторы:

1. Россия

Тип:

Статья

DOI:

https://doi.org/10.19110/1994-5655-2022-5-20-27

Страницы:

с 20 по 27

Статус:

Опубликован

Получено:

14.09.2022

Одобрено:

20.12.2022

Опубликовано:

20.12.2022

Классификаторы:

УДК 517.977 Математическая теория управления. Оптимальное управление. Дифференциальные игры

Язык материала:

русский

Ключевые слова:

адаптивное управление, оптимальное управление, робаст- ное управление, неопределенность, ограниченное возму- щение, множественное оценивание

Аннотация и ключевые слова

Аннотация (русский):
В статье рассматривается задача адаптивного оптималь- ного робастного управления дискретным объектом с неиз- вестными параметрами авторегрессионной номинальной модели, неизвестными верхней границей и смещением внешнего возмущения и неизвестными коэффициентами усиления возмущений по выходу и управлению. Показа- телем качества управления служит наихудшая установив- шаяся верхняя граница выхода. Решение задачи основа- но на оптимальном полиэдральном оценивании неизвест- ных неидентифицируемых параметров, где идентифика- ционным критерием является показатель качества управ- ления. Предложена замена неизвестных параметров, мо- дифицирующая модель объекта в модель без возмущения по управлению. Эта замена преобразует невыпуклый пока- затель качества в дробно-линейный и делает возможным онлайн вычисление текущих оптимальных оценок.

Ключевые слова:
адаптивное управление, оптимальное управление, робаст- ное управление, неопределенность, ограниченное возму- щение, множественное оценивание

Текст

Текст произведения (PDF): Читать Скачать

Введение
Предметом математической теории адаптивного управ-
ления, зародившейся в начале 1960-х гг., на первом этапе
были задачи управления линейными стационарными объ-
ектами управления с неизвестными параметрами переда-
точной функции и внешними возмущениями. Для систем со
случайными возмущениями фундаментальные результаты
по синтезу адаптивного оптимального управления на осно-
ве онлайн оценивания неизвестных параметров были по-
лучены уже к концу 1970-х гг. на основе градиентных алго-
ритмов [1, 2] и к началу 1990-х гг. — на основе метода наи-
меньших квадратов [3,4]. Градиентные алгоритмы оценива-
ния широко использовались и в задачах адаптивной ста-
билизации систем с ограниченными детерминированными
внешними возмущениями. В начале 1980-х гг. в знамени-
тых статьях [5,6] было показано, что известные к тому вре-
мени алгоритмы адаптивного управления не гарантируют
устойчивости адаптивных систем при наличии даже малых
детерминированных внешних возмущений или немодели-
руемой динамики. Это стимулировало разработку в после-
дующие два десятилетия теории робастного адаптивного
управления, в которой рассматривались задачи стабили-
зации адаптивных систем. Результаты теории в основном
базировались на применении функций Ляпунова [7,8] и от-
носились к системам с достаточно малой немоделируемой
динамикой. Параллельно в эти же годы активно разраба-
тывалась теория робастного управления в H∞ постанов-
20
Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022
www.izvestia.komisc.ru
ке [9]. Однако результаты данной теории трудно исполь-
зовать в задачах адаптивного управления, и исследова-
ния возможностей применения H∞-подхода хотя бы для
идентификации систем продолжаются до настоящего вре-
мени.
В настоящей статье для относительно простого дис-
кретного объекта с авторегрессионной номинальной моде-
лью, ограниченным и смещенным внешним возмущением
и операторными возмущениями (неопределенностями) по
выходу и управлению рассматривается существенно бо-
лее сложная по сравнению с адаптивной стабилизаци-
ей задача адаптивного оптимального робастного управ-
ления. Предполагаются неизвестными параметры номи-
нальной модели, верхняя граница и смещение внешнего
возмущения, а также коэффициенты усиления неопреде-
ленностей. Цель управления заключается в минимизации
верхнего предела модуля выхода объекта в классе ука-
занных возмущений. Решение задачи базируется на ре-
зультатах теории робастного управления в ℓ1-постанов-
ке, основы которой были заложены в [10–12]. Их развитие
для задач адаптивного управления изложено в [13]. Реше-
ние оптимальной задачи в условиях неидентифицируемо-
сти управляемого объекта оказывается теоретически воз-
можным при использовании показателя качества управ-
ления как идентификационного критерия и множествен-
ного онлайн оценивания неизвестных параметров [14]. Од-
нако в общем случае показатель качества является невы-
пуклой функцией оцениваемых неизвестных параметров, и
соответствующее оптимальное оценивание затруднитель-
но в онлайн режиме. Для рассматриваемого в статье объ-
екта управления предлагается замена неизвестных пара-
метров, позволяющая свести модель объекта к модели с
неопределенностью только по выходу, для которой пока-
затель качества становится дробно-линейной функцией
неизвестных параметров, и оптимальное оценивание сво-
дится к задаче линейного программирования. Оптималь-
ность предлагаемого адаптивного управления доказана
при дополнительном техническом предположении о дина-
мике замкнутой системы. В отличие от всех традиционных
алгоритмов адаптивного управления предлагаемое в ста-
тье решение оптимальной задачи обеспечивает верифи-
кацию настроенной оптимальной модели благодаря при-
менению метода рекуррентных целевых неравенств [15] и
использованию полиэдральных оценок неизвестных пара-
метров.
Мы будем придерживаться следующих обозначений:
|φ| — евклидова норма вектора φ ∈ Rn;
ℓe — пространство вещественных последовательностей
x = (· · · , x−2, x−1, x0, x1, x2, · · · ),
xt
s = (xs, xs+1, . . . , xt) для x ∈ ℓe;
|xt
s
| = maxs⩽k⩽t |xk|;
ℓ∞ — нормированное пространство ограниченных веще-
ственных последовательностей x = (x0, x1, x2, . . .) с
нормой ∥x∥ = supt
|xt|;
∥x∥ss = lim supt→+∞ |xt|;
ℓ1 — нормированное пространство абсолютно суммируе-
мых последовательностей с нормой ∥x∥1 =
P+∞
k=0
|xk|;
∥G∥ =
P+∞
k=0
|gk| = ∥g∥1 — индуцированная норма
устойчивой линейной стационарной системы G : ℓ∞ →
ℓ∞ с передаточной функцией G(λ) =
P+∞
k=0 gkλk.
1. Постановка задачи
Пусть объект управления с дискретным временем опи-
сывается моделью вида
a(q
−1)yt = b1ut−1 + vt , t = 1, 2, 3, . . . , (1)
где yt ∈ R— выход объекта в момент времени t, ut ∈ R—
управление, vt ∈ R — суммарное возмущение в объекте,
a(q
−1) = 1 + a1q
−1 + . . . + anq
−n
и q−1 — оператор сдвига назад (q−1yt = yt−1) на ли-
нейном пространстве ℓe. Начальные значения y0
1−n =
(y1−n, . . . , y0) произвольные, yk = 0 при k < 1 − n
и uk = 0 при k < 0.
Модель (1) без возмущения (т.е. при v = 0 ∈ ℓe) назы-
вается номинальной моделью объекта (1). Она характери-
зуется вектором параметров
ξ := (a1, . . . , an, b1)T .
Априорная информация об объекте (1) состоит из несколь-
ких априорных предположений.
Предположение 1. Вектор параметров ξ неизвестен и
принадлежит известному ограниченному многограннику
ξ ∈ Ξ = { ˆξ | P ˆξ ⩾ p } ⊂ Rn+1 , (2)
где P ∈ Rl×(n+m), p ∈ Rl и b1 ̸= 0 для любого ξ ∈ Ξ.
Предположение 2. Суммарное возмущение v имеет вид
vt = cw + δwwt + δyΔ1(y)t + δuΔ2(u)t , (3)
где w ∈ ℓ∞ — неизвестное нормализованное (∥w∥∞ ⩽
1) внешнее возмущение, δw ⩾ 0 — неизвестная нор-
ма (верхняя граница) внешнего несмещенного возмущения
и cw — неизвестное смещение суммарного ограниченного
внешнего возмущения, ограниченное по модулю известной
постоянной Cw:
|cw| ⩽ Cw .
Операторы Δ1 и Δ2 в (3) на пространстве последователь-
ностей ℓe удовлетворяют при всех t ограничениям
|Δ1(y)t| ⩽ py
t := |yt−1
t−μ
|,
|Δ2(u)t| ⩽ put
:= |ut−1
t−μ
|, (4)
с неизвестными коэффициентами δy ⩾ 0 и δu ⩾ 0.
Операторы Δ1 и Δ2 называются операторными возму-
щениями (или неопределенностями) по выходу и управле-
нию соответственно и описывают линейные нестационар-
ные или нелинейные строго причинные операторы, имею-
щие известную ограниченную память μ и нормированные
на подпространстве ℓ∞ (т.е. их коэффициенты усиления
равны 1). Коэффициенты δy ⩾ 0 и δu ⩾ 0 характери-
зуют коэффициенты усиления неопределенностей (опера-
торных возмущений) по выходу и управлению в суммарном
возмущении v. Управление системами с неопределенно-
стью называют робастным. Память неопределенностей μ
Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022
www.izvestia.komisc.ru 21
выбирается конструктором исходя из априорной информа-
ции об управляемой системе и может быть выбрана сколь
угодно большой, но не бесконечной, без ущерба для каче-
ства синтезируемого ниже адаптивного управления (см. за-
мечание в конце раздела 2). Необходимые для стабилизи-
руемости объекта ограничения на коэффициенты усиления
неопределенностей будут сформулированы в разделе 3.
Введем обозначение θ для вектора всех неизвестных
параметров объекта (1)
θ = (ξT , cw, δw, δy, δu)T .
Задача. Рассматриваемая в статье задача заклю-
чается в построении обратной связи вида ut =
Ut(yt0
, ut−1
0 ,Ξ,Cw), гарантирующей как можно мень-
шую верхнюю границу для асимптотического показателя
качества
Jμ(θ) = sup
v
lim sup
t→+∞
|yt| , (5)
где sup берется на множестве возмущений v, удовлетво-
ряющих предположению 2. На обратную связь налагается
трудно формализуемое в точных терминах требование ее
вычислительной реализуемости в онлайн режиме.
Уточненная формулировка задачи и необходимое до-
полнительное априорное предположение о робастной ста-
билизируемости объекта (1) приведены в конце раздела 2.
2. Оценка показателя качества оптимальной
системы при известных параметрах
Для объекта с известным вектором коэффициентов ξ и
при известном смещении cw регулятор
ut =
1
b1
[(a(q
−1) − 1)yt+1 − cw] (6)
гарантирует при всех t равенство
yt+1 = vt+1 − cw =
= δwwt+1 + δyΔ1(y)t+1 + δuΔ2(u)t+1. (7)
Поскольку будущие значения неопределенностей и воз-
мущения wt непредсказуемы, регулятор (6) является
оптимальным для показателя качества (5). Введем обозна-
чения для передаточной функции регулятора (6) :
Gξ(λ) =
a(λ) − 1
b1λ
=
1
b1
nX−1
k=0
ak+1 λk .
Тогда
∥Gξ∥ =
1
|b1|
Xn
k=1
|ak| . (8)
Замкнутая система, включающая объект (1) и некото-
рый регулятор, называется робастно устойчивой в клас-
се неопределенностей (4), если значение показателя ка-
чества (5) для этой системы конечно.
Робастное качество оптимальной системы (1), (6) опи-
сывается в следующей теореме.
Теорема 1. 1. Система (1), (6) робастно устойчива при
μ = +∞тогда и только тогда, когда
δy + δu∥Gξ∥ < 1 . (9)
2. Если выполнено условие робастной устойчивости (9),
то
Jμ(θ) ↗ J(θ) =
δw + δu|cw/b1|
1 − δy − δu∥Gξ∥ (μ → +∞) ,
(10)
где знак ↗ означает монотонную сходимость снизу при
μ → +∞.
Доказательство. Условие робастной устойчивости (9)
следует из теоремы 7 [16], примененной к системе (1), (6).
Значение J(θ), определенное в (10), является значени-
ем показателя качества (5) при μ = +∞, т.е. J(θ) =
J+∞(θ) и получается из общей теоремы 5 в [16] путем со-
ответствующих алгебраических вычислений. Монотонная
сходимость в (10) прямо следует из теоремы 6 в [16].
Последнее априорное предположение диктуется усло-
вием робастной стабилизируемости (9) объекта с извест-
ными параметрами.
Предположение 3. Неизвестный вектор параметров θ
удовлетворяет неравенству
δy + δu∥Gξ∥ ⩽ ¯δ < 1 (11)
с известным числом ¯δ.
Предположение об известной верхней границе ¯δ в (11)
не является ограничительным. Число ¯δ выбирается кон-
структором адаптивного регулятора и может быть выбрано
сколь угодно близким к единице. При этом исключаются из
рассмотрения неприемлемые для практических приложе-
ний модели, слишком близкие к границе области робастно
стабилизируемых объектов. Замена открытого множества
параметров θ, удовлетворяющих (9) сколь угодно близким к
нему закрытым множеством (11), дает возможность сформу-
лировать строгие результаты о качестве адаптивного суб-
оптимального управления.
Замечание. Базовые результаты ℓ1-теории робастного
управления относились к системам со структурированной
неопределенностью с бесконечной памятью (μ = +∞) и
только с нулевыми начальными данными [10]. В то же время
модель возмущений с бесконечной памятью слишком кон-
сервативна и не соответствует реальным задачам управ-
ления. Предположение об ограниченной памяти возмуще-
ний позволяет исключить зависимость показателя каче-
ства от слишком далекой предыстории со сколь угодно ма-
лыми потерями для показателя качества J(θ) и, кроме то-
го, предоставляет возможность онлайн верификации моде-
ли объекта, включая квантификацию (оценку параметров)
неопределенностей и внешнего возмущения.
Уточненная постановка задачи. Требуется при априор-
ных предположениях 1-3 построить обратную связь, гаран-
тирующую при любых начальных данных и любом возму-
щении v выполнение с заданной точностью неравенства
lim sup
t→+∞
|yt| ⩽ J(θ) . (12)
22
Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022
www.izvestia.komisc.ru
3. Преобразование к модели с неопределен-
ностью по выходу
Решение поставленной оптимальной задачи базиру-
ется на использовании множественных (полиэдральных)
оценок неизвестных параметров и оптимальном оценива-
нии, в котором идентификационным критерием является
показатель качества J(θ). В данном разделе описывается
замена неизвестных параметров, позволяющая преобразо-
вать модель управляемого объекта к модели с неопреде-
ленностью только по выходу. После преобразования нели-
нейный и невыпуклый показатель качества J(θ) стано-
вится дробно-линейным, а ограничение (11) - линейным.
Благодаря этому вычисление текущих оптимальных оценок
сводится к задаче линейного программирования.
Следующее простое утверждение позволяет использо-
вать метод рекуррентных целевых неравенств для оценки
неизвестного вектора параметров θ.
Лемма 1. Если для некоторой оценки
ˆθ = (ˆξT , ˆcw, ˆδw, ˆδy, ˆδu)T ,
ˆξ ∈ Ξ, ˆδw ⩾ 0, ˆδy ⩾ 0, ˆδu ⩾ 0 ,
неизвестного вектора θ при всех t справедливы неравен-
ства
|ˆa(q
−1)yt − ˆb1ut−1 − ˆcw| ⩽ ˆδw + ˆδypy
t + ˆδuput
, (13)
то объект управления (1) с вектором параметров ˆθ удовле-
творяет уравнению (1) и априорным предположениям 1 и 2
при всех t.
Доказательство. Априорное предположение 1 выполне-
но в силу включения ˆξ ∈ Ξ. Определим возмущение ˆvt =
ˆa(q−1)yt −ˆb1ut−1 для всех t. Тогда объект управления с
вектором параметров ˆθ и суммарным возмущением ˆv удо-
влетворяет уравнению (1), и в силу (13) возмущение ˆv удо-
влетворяет неравенствам
|ˆvt − ˆcw| ⩽ ˆδw + ˆδypy
t + ˆδuput
. (14)
Значения ˆvt можно представить в виде (3), выбрав под-
ходящие значения wt,Δ1(y)t,Δ2(u)t, удовлетворяющие
неравенствам (4). Это гарантирует справедливость апри-
орного предположения 2. □
В силу леммы 1 при любом управлении объектом (1) пол-
ная информация о векторе неизвестных параметров θ к мо-
менту времени t имеет вид
θ ∈ Θt = {ˆθ ∈ Θ0

|ˆa(q−1)yk − ˆb1uk−1 − ˆcw| ⩽
ˆδw + ˆδypy
k + ˆδupuk
∀k ⩽ t },
где
Θ0 = { ˆθ = (ˆξT , ˆcw, ˆδw, ˆδy, ˆδu)T

ˆξ ∈ Ξ , ˆδw ⩾ 0 ,
ˆδy ⩾ 0 , ˆδu ⩾ 0 , ˆδy + ˆδu∥G
ˆξ∥ ⩽ ¯δ }
— априорное множество допустимых параметров.
Из леммы 1 следует неидентифицируемость параметров
ξ и cw оптимального регулятора (6) при любом управле-
нии объектом (1). Действительно, множества Θt состоят из
векторов ˆθ ∈ Θ0, которые удовлетворяют уравнению (1) и
априорным предположениям 1-3 вплоть до момента време-
ни t, и любой вектор ˆθ с достаточно большой компонентой
ˆδw лежит в Θt, каким бы ни было управление объектом до
момента t.
Метод рекуррентных целевых неравенств заключает-
ся в построении сходящейся последовательности оценок
θt, достаточно точно удовлетворяющих целевым неравен-
ствам (13) при всех достаточно больших t. Однако этого
недостаточно для решения поставленной оптимальной за-
дачи, и для предельной оценки θ∞ необходимо допол-
нительно обеспечить выполнение с заданной точностью
неравенства
J(θ∞) ⩽ J(θ)
с неизвестным и не идентифицируемым вектором θ. Это об-
стоятельство диктует необходимость использования пока-
зателя качества J в качестве идентификационного крите-
рия, т.е. вычисления текущих оптимальных оценок по фор-
муле
θt = argmin
ˆθ∈Θt
J(ˆθ) = argmin
ˆθ∈Θt
ˆδw + ˆδu|ˆcw/ˆb1|
1 − ˆδy − ˆδu∥Gˆξ∥
. (15)
Однако вычисление по формуле (15) не релизуемо в ре-
жиме онлайн, поскольку, во-первых, число целевых нера-
венств в описании множествΘt может неограниченно воз-
растать и, во-вторых, показатель качества J и условие ро-
бастной стабилизируемости (11) невыпуклы. Первую труд-
ность можно преодолеть использованием верхних поли-
эдральных оценок множеств Θt. Для преодоления второй
трудности далее описывается замена неизвестных пара-
метров, позволяющая перейти к модели с неопределенно-
стью только в канале выхода.
Пусть объект (1) управляется так, что для всех t выпол-
нены неравенства
|ut| ⩽ C1 + C2|yt
t−n+1
| (16)
с некоторыми постоянными C1,C2. Из (1), (16) и предполо-
жения 2 следует
|a(q
−1)yt − b1ut−1 − cw| ⩽
⩽ δw + δy|yt−1
t−μ
| + δu|ut−1
t−μ
| ⩽
⩽ δw + δuC1 + (δy + δuC2)|yt−1
t−μ−n
| (17)
и, следовательно, для любого ¯μ ⩾ μ + n
|a(q
−1)yt − b1ut−1 − cw| ⩽
⩽ δw + δuC1 + (δy + δuC2)|yt−1
t−¯μ
|. (18)
Введем новые параметры ˜ζ, ˜δe и ˜δ:
˜ζ = (ξ, cw, ˜δe, ˜δ),
˜δe = δw + δuC1 , ˜δ = δy + δuC2 . (19)
Неравенства (18) относительно новых параметров прини-
мают вид
|a(q
−1)yt − b1ut−1 − cw| ⩽ ˜δe + ˜δ|yt−1
t−¯μ
| , (20)
Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022
www.izvestia.komisc.ru 23
эквивалентный неравенствам (13) для модифицированного
вектора параметров
˜θm = (ξT , cw, ˜δe, ˜δ, 0)T .
В силу леммы 1 неравенства (20) означают, что при вы-
полнении неравенств (16) выход y можно считать выходом
объекта (1) с модифицированным вектором параметров ˜θm
(без неопределенности по управлению), и для этого объек-
та из теоремы 1 имеем
lim sup
t→+∞
|yt| ⩽ J(˜θm) =
˜δe
1 − ˜δ
. (21)
Если объект (1) управляется оптимальным регулятором (6),
то
|ut + cw/b1| ⩽ ∥Gξ∥|yt
t−n+1
| ,
и, следовательно,
|ut| ⩽ |cw/b1| + ∥Gξ∥|yt
t−n+1
∥ . (22)
Неравенства (22) гарантируют неравенства (16) и (18) с по-
стоянными C1 = |cw/b1| и C2 = ∥Gξ∥, для которых па-
раметры ˜δe и ˜δ из (19) принимают вид
δe = δw + δu|cw/b1| , δ = δy + δu∥Gξ∥ . (23)
Тогда для вектора
ζ = (ξT , cw, δe, δ)T (24)
получаем
I(ζ) :=
δe
1 − δ
= J(θ) . (25)
4. Адаптивное оптимальное управление
Адаптивное оптимальное управление будет основано
на вычислении оценок ζt = (ξT
t , cwt
, δe
t , δt)T неизвест-
ного вектора параметров ζ модифицированной модели с
неопределенностью только по выходу с использованием
вместо целевых неравенств (13) модифицированных целе-
вых неравенств
|ˆa(q
−1)yt − ˆb1ut−1 − ˆcw| ⩽ ˆδe + ˆδpy
t . (26)
Вместе с векторными оценками ζt будут вычисляться по-
лиэдральные оценкиZt, составленные из априорных огра-
ничений и нескольких линейных неравенств, порожден-
ных модифицированными целевыми неравенствами (26).
Начальные оценки Z0 и ζ0 имеют вид
Z0 = { ˆζ = (ˆξT , ˆcw, ˆδe, ˆδ)T | ˆξ ∈ Ξ, |ˆcw| ⩽ Cw
ˆδe ⩾ 0, 0 ⩽ ˆδ ⩽ ¯δ } ,
ζ0 = (ξT
0 , 0, 0, 0)T ,
где ξ0 — любой вектор из априорного многогранника Ξ и
¯δ — верхняя оценка параметра δ из предположения 3.
Выберем любое число ¯μ ⩾ μ + n запоминаемых вы-
ходов yt
t−¯μ+1 и параметр ε > 0 мертвой зоны, который
будет гарантировать конечное число обновлений оценок.
Управление ut в момент t определяется адаптивным регу-
лятором
ut =
1
bt
1
(at
1yt +at
2yt−1 +. . .+at
nyt−n+1 −cwt
) . (27)
Алгоритм обновления векторных оценок ζt и полиэд-
ральных оценок Zt имеет следующий вид. После измере-
ния выхода yt+1 в момент t + 1 положим
φTt
= (−yt,−yt−1, . . . ,−yt−n+1, ut),
ηt+1 = sign(yt+1 − φTt
ξt − cwt
) ,
pt+1 = |yt
t−¯μ+1
| , νt+1 = ηt+1yt+1 ,
ψt+1 = (ηt+1φTt
, ηt+1, 1, pt+1)T .
В этих обозначениях уравнение адаптивного регулятора
(27) эквивалентно равенству φTt
ξt + cwt
= 0, так что
ηt+1 = sign(yt+1), а целевое неравенство (26) в момент
t + 1 для текущей оценки ζt эквивалентно неравенству
ψT
t+1ζt ⩾ νt+1 . (28)
Положим
ζt+1 := ζt , Zt+1 := Zt,
если ψT
t+1ζt ⩾ νt+1 − ε|ψt+1| . (29)
В противном случае, положим
Zt+1 := Zt ∩ Ωt+1 , (30)
Ωt+1 := { ˆζ

ψT
t+1
ˆζ ⩾ νt+1 } ,
ζt+1 := argmin
ˆζ∈Zt+1
I(ˆζ) , (31)
где показатель качества I определен в (25).
Алгоритм оптимального оценивания (29)–(31) имеет
простую геометрическую интерпретацию. В силу (29) оцен-
ки Zt и ζt обновляются, когда расстояние от вектора ζt
до полупространства Ωt+1 больше ε (это обеспечивает-
ся добавлением слагаемого −ε|ψt+1| в условие обновле-
ния оценок в (29)). Обновление Zt в (30) заключается в
добавлении линейного неравенства (28), которое являет-
ся тем из двух линейных неравенств, составляющих целе-
вое неравенство (26), которое нарушается для оценки ζt.
Вычисление оптимальной оценки ζt+1 согласно (31) пред-
ставляет собой задачу дробно-линейного программирова-
ния, стандартным образом сводящуюся к задаче линейного
программирования введением вспомогательной перемен-
ной [17].
Теорема 2. Пусть объект (1) с неизвестным вектором па-
раметров θ = (ξT , cw, δw, δy, δu)T удовлетворяет пред-
положениям 1, 2 и управляется адаптивным регулятором
(27) с алгоритмом оценивания (29)–(31) и с параметром
мертвой зоны ε, удовлетворяющим неравенствам
0 < ε <
1 − ¯ √ δ
n + 1 + Gu
, Gu = sup
ξ∈Ξ
∥Gξ∥ . (32)
Тогда при любых начальных значениях y0
1−n и любом воз-
мущении v, удовлетворяющем предположению 2, справед-
ливы утверждения:
24
Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022
www.izvestia.komisc.ru
1) если параметры δy и δu удовлетворяют неравенству
δy + δuGu ⩽ ¯δ < 1 , (33)
то множественные оценки Zt и векторные оценки ζt схо-
дятся за конечное время и
lim sup
t→+∞
|yt| ⩽ I(ζε∞
) < I(ζ∞) + Kζ∞ε , (34)
I(ζ∞) ⩽ ¯I =
δw + δu maxt |cwt
/bt
1
|
1 − δy − δu maxt ∥Gξt∥ ⩽
⩽ δw + δu maxt |cwt
/bt
1
|
1 − δy − δuGu
, (35)
где ζ∞ = (ξT∞
, cw
∞, δe∞
, δ∞) — предельное значение ζt,
ζε∞
= ( ξT∞
, cw
∞, δe∞
+ ε(
√
2 + |cw
∞/b
∞
1
|) ,
δ∞ + ε(
√
n + 1 + ∥Gξ∞∥))T , (36)
Kζ∞ =
√
2 + |cw
∞/b∞
1
| + δe∞
(
√
n + 1 + ∥Gξ∞∥)
(1 − δ∞ − ε(
√
n + 1 + ∥Gξ∞∥))2
;
2) если параметры δy и δu удовлетворяют предполо-
жению 3 и при всех t справедливы неравенства
|ut| ⩽ ¯ut = |cw/b1| + ∥Gξ∥|yt
t−¯μ+1
| , (37)
то множественные оценки Zt и векторные оценки ζt схо-
дятся за конечное время и
lim sup
t→+∞
|yt| ⩽ I(ζε∞
) < I(ζ∞) + Kζ∞ε ⩽
⩽ J(θ) + Kζ∞ε , (38)
где ζ∞ = (ξT∞
, cw
∞, δe∞
, δ∞) — предельное значение ζt и
ζε∞
, Kζ∞ имеют вид (36).
Теорема 2 приводится без доказательства.
Утверждение 1 теоремы 2 обеспечивает устойчивость
адаптивной системы на сильно суженном (так как Gu ⩾
∥Gξ∥) множестве (33) параметров (δy, δu) по сравнению
с множеством (11). Гарантируемые верхние оценки ¯I в (35)
являются грубыми и сильно завышенными по сравнению
с вычисляемыми онлайн и сходящимися к I(ζε∞
) за ко-
нечное время верхними оценками I(ζε
t ), согласованными
с данными измерений. Тем не менее уникальным достоин-
ством этих грубых оценок является то, что они соответ-
ствуют “настоящим” значениям не идентифицируемых ко-
эффициентов усиления неопределенностей δy и δu. Заме-
тим, что даже такие области робастной устойчивости и та-
кие оценки качества адаптивных систем недостижимы при
использовании стандартных градиентных алгоритмов оце-
нивания, способных гарантировать только грубые оценки,
одинаковые для всех допустимых объектов.
Утверждение 2 теоремы 2 базируется на дополнитель-
ном условии (37), которое не верифицируемо данными из-
мерений, так как параметры cw, b1 и ξ неизвестны. Адап-
тивный регулятор (27) гарантирует справедливость этих
неравенств для текущих оценок cwt
, bt
1 и ξt. Поскольку в
цепочке неравенств (17) и (18) каждое из неравенств яв-
ляется существенно огрубленным и текущие оптимальные
оценки ζt минимизируют показатель качества I, неравен-
ства (37), как показывают многочисленные численные экс-
перименты, фактически выполняются. Их строгое доказа-
тельство остается открытой проблемой.
Важнейшим дополнительным достоинством использо-
вания полиэдральных оценок является верифицируемость
априорных предположений об управляемом объекте. Ин-
дикатором приемлемости априорных предположений и те-
кущих оценок неизвестных параметров управляемого объ-
екта служит неубывающая последовательность наимень-
ших согласованных с априорными предположениями и
данными измерений значений I(ζt). Если текущая оценка
ζt не изменяется на длительном промежутке времени, то
она удовлетворяет целевым неравенствам и тем самым га-
рантирует эту наилучшую верхнюю границу I(ζt) для вы-
хода |yt| после затухания переходных процессов. Неиз-
менность оценки ζt на длительном промежутке времени
гарантирует также соответствие априорных предположе-
ний данным измерений при текущем гарантируемом и наи-
лучшем асимптотическом качестве управления I(ζt). Тра-
диционные методы синтеза адаптивного управления как
в детерминированной, так и в стохастической постанов-
ке оставляют проблемы верификации модели и априорных
предположений вне рассмотрения.
Заключение
Рассмотрена задача оптимально робастной стабилиза-
ции объекта с авторегрессионной номинальной моделью
в условиях сильной априорной неопределенности. Пред-
полагаются неизвестными не только коэффициенты пе-
редаточной функции номинального объекта, но и верхняя
граница и смещение внешнего возмущения и коэффициен-
ты усиления неопределенностей по выходу и управлению,
что влечет неидентифицируемость неизвестных парамет-
ров. Показателем качества управления служит наихудшая
в классе возмущений асимптотическая верхняя граница
модуля выхода управляемого объекта. Решение задачи ба-
зируется на результатах ℓ1-теории робастного управле-
ния и использования показателя качества задачи управле-
ния как идентификационного критерия. Предложена заме-
на неизвестных параметров, позволяющая свести задачу
вычисления текущих оптимальных оценок к задаче дроб-
но-линейного программирования. Полиэдральное оцени-
вание неизвестных параметров дополнительно решает за-
дачу онлайн верификации настраиваемой модели и апри-
орных предположений.

Список литературы

1. Goodwin, G. Discrete-time multivariable adaptive control / G. Goodwin, P. Ramadge, P. Caines // IEEE Transactions on Automatic Control. - 1980. - Vol. 25. - № 3. - P. 449-456.

2. Goodwin, G. Discrete time stochastic adaptive control / G. Goodwin, P. Ramadge, P. Caines // SIAM Journal on Control and Optimization. - 1981. - Vol. 19. - № 6. - P. 829-853.

3. Guo, L. The Åström-Wittenmark self-tuning regulator revisited and ELS-based adaptive trackers / L. Guo, H.- F. Chen // IEEE Transactions on Automatic Control. - 1991. - Vol. 36. - № 7. - P. 802-812.

4. Guo, L. Further results on least squares based adaptive minimum variance control / L. Guo // SIAM Journal on Control and Optimization. - 1994. - Vol. 32. - № 1. - P. 187-212.

5. Rohrs, C. Robustness of adaptive control algorithms in the presence of unmodeled dynamics / C. Rohrs, L. Valavani, M. Athans, G. Stein // The 21st IEEE Conference on Decision and Control. - 1882. - P. 3-11.

6. Rohrs, C.E. Robustness of continuous-time adaptive control algorithms in the presence of unmodeled dynamics / C.E. Rohrs, L. Valavani, M. Athans, G. Stein // IEEE Transactions on Automatic Control. - 1985. - Vol. 30. - № 9. - P. 881-889.

7. Narendra, K. Stable adaptive systems / K. Narendra, A. Annaswamy. - Dover, 2005. - 512 p.

8. Ioannou, P.A. Robust adaptive control / P.A. Ioannou, J. Sun. - New Jersey: PTR Prentice-Hall, Upper Saddle River, 1996. - 852 p.

9. Zhou, K. Robust and Optimal Control / K. Zhou, J.C. Doyle, K. Glover. - New Jersey: Prentice-Hall, Upper Saddle River, 1996. - 616 p.

10. Khammash, M. Performance robustness of discrete-time systems with structured uncertainty / M. Khammash, J. Pearson // IEEE Transactions on Automatic Control. - 1991. - Vol. 36. - № 4. - P. 398-412.

11. Khammash, M. Robust steady-state tracking / M. Khammash // IEEE Transactions on Automatic Control. - 1995. - Vol. 40. - № 11. - P. 1872-1880.

12. Khammash, M. Robust performance: unknown disturbances and known fixed inputs / M. Khammash // IEEE Transactions on Automatic Control. - 1997. - Vol. 42. - № 12. - P. 1730-1734.

13. Соколов, В.Ф. Робастное управление при ограниченных возмущениях / В.Ф. Соколов. - Сыктывкар: Коми научный центр УрО РАН, 2011. - 218 с.

14. Sokolov, V.F. Adaptive ℓ1 robust control for SISO system / V.F. Sokolov // Systems and Control Letters. - 2001. - Vol. 42. - № 5. - P. 379-393.

15. Фомин, В.Н. Адаптивное управление динамическими бъектами / В.Н. Фомин, А.Л. Фрадков, В.А. Якубович. - Москва: Наука, 1981. - 447 c.

16. Sokolov, V.F. ℓ1 robust performance of discrete-time systems with structured uncertainty / V.F. Sokolov // Syst. Control Lett. - 2001. - V. 42 - № 5. - P. 363-377.

17. Boyd, S. Convex optimization / S. Boyd, L. Vandenberghe. - New York: Cambridge University Press, 2004. - 742 p.

Отправить рукопись Скачать PDF
Текст

Цитировать

Цитирований:

Подтверждение

Регистрация