Proceedings of the Komi Science Centre of the Ural Division of the Russian Academy of Sciences

Известия Коми научного центра УрО РАН

1994-5655

69660

10.19110/1994-5655-2023-4-10-17

Научные статьи

Science articles

Научные статьи

Optimal ℓ1-robust tracking for autoregressive plant with unknown nominal model

Оптимальное ℓ1-робастное слежение для авторегрессионного объекта с неизвестной номинальной моделью

Соколов

В. Ф.

Sokolov

V. F.

sokolov@ipm.komisc.ru

Физико-математический институт ФИЦ Коми НЦ УрО РАН Сыктывкар Россия Institute of Physics and Mathematics, Federal Research Centre Komi Science Centre, Ural Branch, RAS Syktyvkar Russian Federation

21 09 2023

4 10 17 03 07 2023

https://komisc.editorum.ru/en/nauka/article/69660/view

В статье рассматривается задача оптимального робаст- ного слежения для дискретного объекта с неизвестны- ми параметрами авторегрессионной номинальной моде- ли и неизвестным смещением внешнего ограниченного возмущения. Верхние границы несмещенного внешнего возмущения и норм операторных возмущений по выходу и управлению предполагаются известными. Задача опти- мального слежения заключается в минимизации наихуд- шей гарантированной асимптотической верхней границы ошибки отслеживания заданного ограниченного сигнала. Решение задачи основано на оптимальном множественном оценивании неизвестных и неидентифицируемых пара- метров и использовании показателя качества задачи сле- жения как идентификационного критерия. Численная ре- ализация оптимального множественного оценивания в ре- жиме онлайн оказывается возможной благодаря тому, что показатель качества слежения в рассматриваемой задаче является дробно-линейной функцией оцениваемых пара- метров.

This paper addresses the problem of adaptive optimal robust tracking for a discrete-time plant with unknown parameters of autoregressive nominal model and unknown bias of bounded external disturbance. Upper bounds of unbiased external disturbance and gains of uncertainties in output and control are assumed to be know. The optimal tracking problem is to minimize the guaranteed worst-case steady-state upper bound of the tracking error for a given bounded reference signal. Solution of the problem is based on optimal set-membership estimation of unknown non-identifiable parameters and treating the control criterion as the identification criterion. Optimal on-line set-membership estimation becomes computationally tractable due to a linear-fractional representation of the control criterion.

оптимальное управление робастное управление адаптив- ное управление неопределенность ограниченное возму- щение множественное оценивание

optimal control robust control adaptive control uncertainty bounded disturbance set-membership estimation

ВведениеПредметом теории адаптивного управления, зародив-шейся в 1960-х гг., являются задачи управления система-ми с неизвестными параметрами. Один из двух известныхподходов к синтезу адаптивного управления заключает-ся в прямой настройке по данным измерений параметроврегулятора и называется прямым адаптивным управлени-ем. Другой подход базируется на онлайн оценивании неиз-вестных параметров объекта управления с последующейнастройкой регулятора. Этот подход называют идентифи-кационным или непрямым адаптивным управлением. Алго-ритмами оценивания в рамках идентификационного под-хода служат различные модификации градиентного (про-екционного) алгоритма минимизации невязки в уравнениимодели управляемого объекта или модификации методанаименьших квадратов. В середине 1980-х гг. в знамени-той статье [1] было показано, что полученные к тому вре-мени алгоритмы адаптивной стабилизации не гарантируютустойчивости даже при малых внешних или операторныхвозмущениях (немоделируемой динамике). Это стимулиро-вало, с одной стороны, разработку модификаций алгорит-мов оценивания для обеспечения устойчивости адаптив-ных систем при наличии возмущений и, с другой стороны,развитие теории робастного управления, посвященной си-стемам с операторными возмущениями и ставшей главнымнаправлением теории автоматического управления с кон-ца 1970-х гг. на последующие два десятилетия [2]. Одна-10Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ruко последующие результаты в теории робастного адап-тивного управления базировались в основном на аппа-рате функций Ляпунова, ограничивались задачами обес-печения устойчивости и не коррелировали с результата-ми теории робастного управления, в основе которой лежа-ла теорема о малом коэффициенте усиления (small gaimtheorem).Модель внешних ограниченных возмущений породиланаправление в теории идентификации систем, основан-ное на использовании множественных оценок неизвестныхпараметров. Почти все многочисленные публикации это-го направления относятся к системам, аффинным относи-тельно неизвестных параметров, и предполагают извест-ными верхние границы возмущений. Множества не сфаль-сифицированных данными измерений неизвестных пара-метров таких систем описываются ограниченными много-гранниками. Поскольку число линейных неравенств в опи-сании этих многогранников может неограниченно возрас-тать с ростом числа измерений, основные усилия в этомподходе направлены на получение верхних по включениюмножественных оценок, имеющих описание ограниченнойсложности (параллелотопы, зонотопы, многогранники с за-данными направлениями граней, эллипсоиды и т.п.). Одна-ко до настоящего времени нет приложений этих исследо-ваний к адаптивному управлению со строгим математиче-ским обоснованием.В начале 1990-х гг. были получены фундаментальныерезультаты по устойчивости и робастному качеству системс неопределенностью и ограниченным внешним возмуще-нием [3]. Позднее были получены явные представлениядля асимптотических показателей качества таких систем,в том числе для систем слежения [4–7]. Теория робастногоуправления для таких систем получила название ℓ1-тео-рии, поскольку индуцированные нормы линейных стацио-нарных операторов на пространстве ограниченных после-довательностей ℓ∞ выражаются через ℓ1-нормы их им-пульсных характеристик. Полученные результаты позво-лили сформулировать общий метод синтеза адаптивногооптимального робастного управления, основанный на иде-ях множественного оценивания и использования показа-теля качества задачи управления как идентификацион-ного критерия [8]. Трудность применения метода заключа-ется в сложности онлайн минимизации невыпуклого в об-щем случае показателя качества на текущих оценках мно-жеств не сфальсифицированных измерениями неизвест-ных параметров. Однако такая минимизация оказываетсявозможной для специальных систем.В статье [9] решалась задача адаптивной оптимальнойстабилизации авторегрессионного объекта с неизвестны-ми параметрами номинального объекта, внешнего возму-щения и неопределенностей по выходу и управлению приспециальном дополнительном предположении о непред-намеренности неопределенности по управлению. Болеесложная по сравнению со стабилизацией задача опти-мального слежения решалась в работе [10] для объек-та с дробно-рациональной передаточной функцией безнеопределенности по управлению. Для указанных объ-ектов показатель качества задачи управления являетсядробно-линейной функцией неизвестных параметров, чтоделает возможной его онлайн минимизацию. В настоящейстатье более сложная задача адаптивного слежения рас-сматривается для авторегрессионного объекта с неизвест-ными параметрами номинального объекта и неизвестнымсмещением внешнего возмущения. Для обеспечения дроб-но-рационального вида показателя качества верхние гра-ницы внешнего несмещенного возмущения и коэффициен-ты усиления неопределенностей предполагаются извест-ными. Известно, что задача минимизации дробно-рацио-нальных функций при линейных ограничениях сводится клинейному программированию [11], что позволяет приме-нять современное программное обеспечение для синтезаадаптивного оптимального управления для рассматривае-мого объекта управления.Используемые обозначения:|φ| — евклидова норма вектора φ ∈ Rn;ℓe — линейное пространство вещественных последова-тельностей x = (. . . , x−2, x−1, x0, x1, x2, . . .),xts = (xs, xs+1, . . . , xt) для x ∈ ℓe;|xts| = maxs⩽k⩽t |xk|;ℓ∞ — нормированное пространство ограниченных веще-ственных последовательностей x = (x0, x1, x2, . . .)с нормой ∥x∥∞ = supt|xt|;∥x∥ss = lim supt→+∞ |xt|;ℓ1 — нормированное пространство абсолютно суммируе-мых последовательностей с нормой ∥x∥1 =P+∞k=0|xk|;∥G∥ =P+∞k=0|gk| = ∥g∥1 — индуцированная нормаустойчивой линейной стационарной системы G : ℓ∞ →ℓ∞ с передаточной функцией G(λ) =P+∞k=0 gkλk.1. Постановка задачиРассмотрим объект управления с дискретным време-нем, описываемый уравнениемa(q−1)yt = b1ut−1 + vt , t = 1, 2, 3, . . . , (1)где yt ∈ R— выход объекта в момент времени t, ut ∈ R—управление, vt ∈ R — суммарное возмущение в объекте,a(q−1) = 1 + a1q−1 + . . . + anq−nи q−1 — оператор сдвига назад (q−1yt = yt−1) на ли-нейном пространстве ℓe. Начальные значения y01−n =(y1−n, . . . , y0) произвольные, yk = 0 при k < 1 − nи uk = 0 при k < 0.Априорная информация об объекте управления состоитиз четырех априорных предположений АП1–АП4.АП1. Вектор коэффициентовξ := (a1, . . . , an, b1)T (2)номинальной модели (т.е. модели без суммарного возмуще-ния v) принадлежит известному ограниченному многогран-нику Ξ,ξ ∈ Ξ = { ˆξ | P ˆξ ⩾ p } ⊂ Rn+1 , (3)где P ∈ Rl×(n+m), p ∈ Rl и b1 ̸= 0 для любого ξ ∈ Ξ.АП2. Суммарное возмущение v имеет видvt = cw + δwwt + δyΔ1(y)t + δuΔ2(u)t , (4)Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ru11где w ∈ ℓ∞ — неизвестная последовательность,∥w∥∞ ⩽ 1 , (5)δw ⩾ 0 — верхняя граница несмещенного внешнего возму-щения δww, cw — смещение ограниченного внешнего воз-мущения cw+δww. ОператорыΔ1 : ℓe → ℓe иΔ2 : ℓe →ℓe удовлетворяют при всех t ограничениям|Δ1(y)t| ⩽ |yt−1t−μ|, |Δ2(u)t| ⩽ |ut−1t−μ| . (6)Параметры δy ⩾ и δu ⩾ 0 в (4) — верхние границы ин-дуцированных норм (коэффициентов усиления) оператор-ных возмущений (неопределенностей) Δ1 и Δ2 по выходуи управлению соответственно. Параметр μ в неравенствах(6) характеризует память неопределенностей. Она можетбыть выбрана конструктором сколь угодно большой, но небесконечной, без ущерба для качества синтезируемого ни-же адаптивного управления.АП3. Набор верхних границδ = (δw, δy, δu) (7)предполагается известным, вектор параметровθ = (ξT, cw)T ∈ Rn+2 (8)— неизвестным, и |cw| ⩽ Cw с известной верхней грани-цей Cw > 0.Предположение об известной верхней границе Cwв АП3 используется только для упрощения доказательстви не ограничительно, поскольку Cw может быть выбраносколь угодно большим.В разделе 2 будет сформулировано дополнительноенеобходимое априорное предположение о робастной ста-билизируемости объекта (1).Априорное предположение АП2 сформулировано в тер-минах теории робастного управления в ℓ1 постановкедля удобства последующих ссылок. Согласно этой тео-рии, предположение АП2 для классов линейных нестаци-онарных или нелинейных операторов Δ1 и Δ2 может бытьпредставлено в следующем компактном виде:|vt − cw| ⩽ δw + δypyt + δuput, (9)гдеpyt = |yt−1t−μ|, put= |ut−1t−μ| . (10)Содержательная постановка рассматриваемой в ста-тье задачи заключается в построении причинной обратнойсвязи вида ut = Ut(yt1−n, ut−10 ) (но с конечной памятью),гарантирующей как можно меньшую верхнюю границу дляасимптотического показателя качестваJμ(θ, δ) = supvlim supt→+∞|yt − rt| , (11)где r — заданный командный сигнал, т.е. желаемая по-следовательность выходов объекта управления (1), и supберется на множестве возмущений v, удовлетворяющихпредположению АП2. То есть задача заключается в мини-мизации гарантированной асимптотической верхней гра-ницы для модуля ошибки слеженияet = yt − rt (12)в классе возмущений, удовлетворяющих неравенствам (9).Главная сложность сформулированной оптимальнойзадачи заключается в неидентифицируемости неизвест-ного вектора параметров θ.Строгая формулировка задачи приведена в конце раз-дела 2 после получения представления для неконсерва-тивной верхней оценки показателя качества Jμ.2. Оптимальная система с известной номи-нальной модельюДля объекта с известным вектором ξ параметров номи-нальной модели и при известном смещении cw регуляторut =1b1[(a(q−1) − 1)yt+1 + rt+1 − cw] (13)гарантирует при всех t равенстваyt+1 − rt+1 = vt+1 − cw == δwwt+1 + δyΔ1(y)t+1 + δuΔ2(u)t+1 . (14)Из непредсказуемости и произвольности значений правойчасти (14) в момент вычисления управления ut следует, чторегулятор (13) является оптимальным для показателя ка-чества (11). Введем обозначение для передаточной функ-ции от y к u регулятора (13) :Gξ(λ) =a(λ) − 1b1λ=1b1Xnk=1ak λk−1 ,благодаря чему регулятор (13) принимает видut = Gξ(q−1)yt + rt+1/b1 − cw/b1 , (15)и∥Gξ∥ =1|b1|Xnk=1|ak| . (16)Определение 1. Замкнутая система (1), (13) называетсяробастно устойчивой в классе возмущений (4), если значе-ние показателя качества (11) конечно.Определение 2. Будем говорить, что последователь-ность |r| равномерно часто попадает в окрестности верх-него предела ∥r∥ss, если для любого ε > 0 существуютT > 0 и возрастающая последовательность (t1, t2, . . .)такие, что∀j ∈ N 0 < tj+1 − tj ⩽ T ∧ |rtj+1| ⩾ ∥r∥ss − ε .Качество оптимальной системы (1), (13) представленов теореме 1.Теорема 1. Для замкнутой системы (1), (13) справедливыследующие утверждения.1. Система робастно устойчива при μ = +∞ тогдаи только тогда, когдаδy + δu∥Gξ∥ < 1 . (17)12Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ruДля системы с нулевыми начальными данными y01−nJ+∞(θ, δ) =δw + δy∥r∥ss +δu|b1| (|cw| + ∥r∥ss)1 − δy − δu∥Gξ∥ .(18)2. Для системы с любыми начальными данными y01−nJμ(θ, δ) ⩽ J+∞(θ, δ)для любой памяти μ > 0. Если в любую окрестность верх-него предела ∥r∥ss последовательность |r| попадает рав-номерно часто, то при любых начальных данныхJμ(θ, δ) ↗ J+∞(θ, δ) =: J(θ, δ) , (19)где знак ↗ означает монотонную сходимость снизу приμ → +∞.Доказательство теоремы 1. Для доказательства теоре-мы представим замкнутую систему (1), (13) в стандартнойM − Δ форме, изображенной на рис. 1 и описываемойуравнениямиez= M0@fwξ1A , ξ = Δz , (20)где e — ошибка слежения (12), z и ξ — соответственно входи выход структурированной неопределенности Δ,zt =ytut, ξ =Δ1 00 Δ2z =Δ1(y)Δ2(u),f — фиксированный входной сигнал, включающий отсле-живаемый сигнал r и постоянный сигнал, равный 1 :f =r1, 1 := (1, 1, . . .) ∈ ℓ∞ .Рисунок 1.M − Δ форма системы (1), (13).Figure 1. M − Δ form of system (1), (13)Матрицу M в (20) представим в блочной форме, соот-ветствующей входным и выходным сигналам на рис. 1:M =Mef Mew MeξMzr Mzw Mzξ. (21)Для системы (1), (13) эта блочная форма имеет видM =0B@0 0 δw δy δu1 0 δw δy δuqb1−cwb1δwGξ δyGξ δuGξ1CA, (22)где q — оператор сдвига вперед (qrt = rt+1). Первая стро-ка матрицы M в (22) соответствует правой части равен-ства (14), а вторая строка получается переносом rt в пра-вую часть этого равенства. Третья строкаM соответствуетпредставлению оптимального регулятора в виде (15).Необходимое и достаточное условие робастной устой-чивости (17) следует из теоремы 7 в [6], примененной к си-стеме (1), (13).Для доказательства представления (18) для показателякачества J+∞(θ, δ) достаточно применить теоремы 5 и 6из статьи [6] (или теоремы 2.18 и 2.22 работы [7]). Введемобозначение[A]1 :=0B@∥A11∥1 · · · ∥A1q∥1 .........∥Ap1∥1 · · · ∥Apq∥11CAдля произвольной p × q матрицы A импульсных откликовAij ∈ ℓ1. Для блочной матрицыM из (21) положимMss(f) :=[Mef f]ss + [Mew]1 [Meξ]1[Mzf r]ss + [Mzw]1 [Mzξ]1.Согласно теореме 5 из [6],J+∞(θ, δ) = [Merr]ss + [Mew]1+ (23)+ [Myξ]1(I − [Mzξ]1)−1([Mzrr]ss + [Mzw]1) .Для рассматриваемой системы с матрицей (22) матрицаMss(f) принимает вид0@δw δy δu∥r∥ss + |δw| δy δu(∥r∥ss + |cw|)/b1 + δw∥Gξ∥ δy∥Gξ∥ δu∥Gξ∥1A.(24)Применив формулу (23) к матрице (24), получаемJ(θ, δ) ==δw + (δy δu)I −δy δuδy∥Gξ∥ δu∥Gξ∥−1××∥rss∥ + δw(∥r∥ss + |cw|)/b1 + δw∥Gξ∥==δw +11 − δy − δu∥Gξ∥ (δy δu)××1 − δu∥Gξ∥ δuδy∥Gξ∥ 1 − δy××∥rss∥ + δw(∥r∥ss + |cw|)/b1 + δw∥Gξ∥.Учитывая, что(δy δu)1 − δu∥Gξ∥ δuδy∥Gξ∥ 1 − δy= (δy δu) ,получаем представление (18)J(θ, δ) = δw +11 − δy − δu∥Gξ∥×× (δy δu)∥rss∥ + δw(∥r∥ss + |cw|)/b1 + δw∥Gξ∥==δw + δy∥r∥ss + δu∥r∥ss/|b1| + δu|cw/b1|)1 − δy − δu∥Gξ∥ .(25)Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ru13Неравенство Jμ(θ, δ) ⩽ J+∞(θ, δ) во втором утвер-ждении теоремы 1 очевидно следует из того, что множествооператорных возмущений с ограниченной памятью μ явля-ется подмножеством операторных возмущений с бесконеч-ной памятью. Монотонность последовательности Jμ(θ, δ)относительно μ следует из строгого возрастания по μ мно-жеств допустимых операторных возмущений. Наконец, схо-димость Jμ(θ, δ) к J(θ, δ) гарантируется теоремой 6 из [6].Теорема 1 доказана.Последнее априорное предположение АП4 об управля-емом объекте диктуется условием робастной стабилизиру-емости (17).АП4. Неизвестный вектор параметров θ удовлетворяетнеравенствуδy + δu∥Gξ∥ ⩽ ¯δ < 1 (26)с известным числом ¯δ.Число ¯δ > 0 может быть сколь угодно близким к1 и выбирается конструктором на основе априорной ин-формации или вовсе без нее и исключает из рассмотре-ния неприемлемые для практических приложений модели,слишком близкие к границе области робастно стабилизи-руемых объектов.Задача. Требуется построить обратную связь вида ut =Ut(yt1−n, ut−10 ), имеющую конечную память и гарантиру-ющую выполнение с заданной точностью неравенстваlim supt→+∞|yt − rt| ⩽ J(θ, δ) (27)при справедливости априорных предположений АП1–АП4.Главная сложность задачи заключается в неидентифи-цируемости вектора коэффициентов ξ номинальной моде-ли и смещения cw, необходимых для использования опти-мального регулятора (13).3. Субоптимальное слежениеРешение поставленной задачи базируется на опти-мальном оценивании, в котором показатель качества за-дачи управления используется как идентификационныйкритерий и минимизируется на текущих оценках множе-ства неизвестных параметров, согласованных с даннымиизмерений. Вычисление множественных оценок основанона следующем простом утверждении.Лемма 1. Если для некоторой оценкиˆθ = (ˆξT , ˆcw)T , ˆξ = (ˆa1, . . . , ˆan,ˆb1)T ∈ Ξнеизвестного вектора θ при всех t справедливы неравен-ства|ˆa(q−1)yt − ˆb1ut−1 − ˆcw| ⩽ δw + δypyt + δuput, (28)то объект управления (1) с вектором параметров ˆθ удовле-творяет уравнению (1) и априорным предположениям АП1,АП2 при всех t.Лемма 1 является частным случаем Леммы 1 работы [9],в которой дополнительно предполагаются неизвестнымипараметры δw, δy, δu.Из Леммы 1 следует, что при любом управлении объек-том (1) полная информация о векторе неизвестных пара-метров θ к моменту времени t имеет вид включенияθ ∈ St = { ˆθ ∈ Θ0|ˆa(q−1)yk −ˆb1uk−1 − ˆcw| ⩽⩽ δw + δypyk + δupuk∀k ⩽ t } ,гдеΘ0 = { ˆθ = (ˆξT , ˆcw)Tˆξ ∈ Ξ , |cw| ⩽ Cw,ˆδy + ˆδu∥Gˆξ∥ ⩽ ¯δ } (29)— априорное множество допустимых параметров θ.Заметим, что никаким ограниченным управлениемнельзя обеспечить сходимости множеств St к множествус одним элементом θ, поскольку априорные верхние гра-ницы δw, δy, δu, как правило, являются неточными, и кон-кретные реализации всех возмущений даже при точныхверхних границах только в исключительных случаях неод-нократно и одновременно принимают значения, соответ-ствующие их верхним границам. Это означает, что векторнеизвестных параметров θ не идентифицируем с помощьюограниченного управления.Метод рекуррентных целевых неравенств синтезаадаптивного управления заключается в построении схо-дящейся последовательности оценок θt → θ∞ при t →+∞, достаточно точно удовлетворяющих целевым нера-венствам (28) при всех достаточно больших t. В отличие отзадач адаптивной стабилизации, этого недостаточно длярешения поставленной оптимальной задачи. Действитель-но, если θt → θ∞ и выполнены целевые неравенства, тов силу теоремы 1 и непрерывности функции J(θ, δ) следу-ет неравенствоlim supt→+∞|yt| ⩽ J(θ∞, δ) .Однако для решения поставленной оптимальной зада-чи этого неравенства недостаточно и необходимо гаранти-ровать выполнение с заданной точностью дополнительно-го неравенстваJ(θ∞, δ) ⩽ J(θ, δ) (30)с неизвестным и не идентифицируемым вектором θ. Из это-го следует необходимость использования показателя ка-чества J(θ, δ) задачи управления в роли идентификаци-онного критерия, т.е. использования оптимального оцени-вания видаθt = argminˆθ∈StJ(ˆθ) . (31)Непосредственное использование оптимальной иден-тификации (31) в режиме онлайн невозможно, ввиду воз-можного неограниченного роста числа целевых нера-венств в описании множеств St. Для преодоления этойтрудности будут использованы верхние по включениюоценки множеств St с ограниченным числом обновленийза счет введения мертвой зоны при обновлении оценок.Выберем число ε > 0 в качестве параметра мертвойзоны, при этом точность решения поставленной оптималь-ной задачи слежения будет пропорциональна ε. В каждый14Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ruмомент времени t будут вычисляться векторные оценкиθt = (ξTt , cwt)T , ξt = (at1, . . . , atn, bt1)и множественные оценки Θt неизвестного вектора ξ.Адаптивный регулятор. Управление ut в момент t опре-деляется адаптивным регуляторомut =1bt1(at1yt + . . . + atnyt−n+1 + rt+1 − cwt) . (32)Выберем в качестве начальной множественной оценкимножество Θ0, определенное в (29), а качестве начальнойвекторной оценкиθ0 = argminˆθ∈Θ0J(ˆθ, δ) .Введем следующие обозначения. После подачи управле-ния ut в момент времени t и измерения выхода yt+1 в мо-мент t + 1 положимφTt= (−yt,−yt−1, . . . ,−yt−n+1, ut),ηt+1 = sign(yt+1 − φTtξt − cwt) ,ψt+1 = (ηt+1φTt, ηt+1)T ,ht+1 = δw + δypyt+1 + δuput+1 .Заметим, что значения всех введенных переменных вы-числяются по данным измерений, доступных к моментуt + 1. Во введенных обозначениях целевое неравенство(28) в момент t + 1 для текущей оценки θt принимает вид|yt+1 − φTtξt − cwt| == ηt+1yt+1 − ψTt+1θt ⩽ ηt+1ht+1 ,что эквивалентноψTt+1θt ⩾ ηt+1(yt+1 − ht+1) . (33)Алгоритм обновления векторных оценок θt и множе-ственных оценок Θt имеет следующий вид:θt+1 = θt , Θt+1 = Θt , (34)если ψTt+1θt ⩾ ηt+1(yt+1 − ht+1) − ε|ψt+1| . (35)В противном случае положимΘt+1 = Θt ∩ Ωt+1 , (36)Ωt+1 = { ˆθψTt+1ˆθ ⩾ ηt+1(yt+1 − ht+1 } , (37)θt+1 = argminˆθ∈Θt+1J(ˆθ, δ) . (38)Алгоритм оптимального оценивания (34)–(38) имеетпростую геометрическую интерпретацию. Каждое целевоенеравенство (28) представляет собой полоску в Rn+1, за-данную парой линейных неравенств относительно векто-ра ˆθ. Только одно из этих неравенств, именно неравенство(33), может нарушаться для вектора θt. Неравенство в (35)означает, что евклидово расстояние от вектора θt до по-лупространства Ωt+1, определенного в (37), не больше ε,и тогда, согласно (34), векторная оценка θt и множествен-ная оценкаΘt не обновляются. В противном случае желае-мое неравенство (37) добавляется к списку неравенств, за-дающих множественную оценку Θt, образуя обновленнуюоценку Θt+1. При этом некоторые неравенства из старо-го списка могут оказаться лишними. Один из эффективныхалгоритмов удаления лишних неравенств описан в рабо-те [12].Замечание 1. Введение мертвой зоны с параметром εгарантирует ограниченность числа возможных обновленийоценок θt и Θt и тем самым сходимость оценок за конеч-ное время. Формула (38) вычисления оптимальной оценкиθt+1 является главной в задаче синтеза адаптивного оп-тимального управления в условиях неидентифицируемо-сти вектора параметров θ. Она обеспечивает выполнениетребуемого неравенства (30) с заданной точностью, про-порциональной параметру мертвой зоны ε.Субоптимальность адаптивного регулятора (32) уста-навливается следующей теоремой.Теорема 2. Пусть выполнены априорные предположе-ния А1-А4, и параметр мертвой зоны ε в (35) выбран из ин-тервала0 < ε <1 − ¯ √ δn + Gu, Gu = maxξ∈Ξ∥Gξ∥ .Тогда для замкнутой системы управления, включающейобъект (1), адаптивный регулятор (32) и алгоритм оценива-ния (34)–(38) справедливы утверждения:1) Множественные оценки Θt и векторные оценки θtсходятся к своим предельным значениям Θ∞ и θ∞ за ко-нечное время иJ(θ∞, δ) ⩽ J(θ, δ) , (39)2)lim supt→+∞|yt| ⩽ J(θ∞, δ) + O(ε) , (40)где O(ε) → 0 при ε → 0.Доказательство Теоремы 2 аналогично доказательствуТеоремы 2 в статье [10]. Приведем его краткую схему. Со-гласно данной выше геометрической интерпретации ал-горитма оценивания, при нарушениях неравенства (35) измножественных оценок Θt заведомо удаляются шары ра-диуса ε с центрами θt и в описание Θt+1 добавляютсянеравенства из (37). В результате этого шары радиуса ε/2с центрами θt не пересекаются. В силу оптимизации (38)J(θt, δ) ⩽ J(θ, δ)при всех t, так что оценки θt остаются в ограниченном мно-жестве в Rn+2 . Поэтому число исключаемых из оценокΘt не пересекающихся шаров радиуса ε/2 конечно ввидуограниченности множества векторов ˆθ, удовлетворяющихнеравенству J(ˆθt, δ) ⩽ J(θ, δ). Следовательно конечнои число возможных обновлений оценок Θt и θt.Для доказательства неравенства (40) заметим, что по-сле сходимости θt к θ∞ за конечное время для оценки θ∞выполняются неравенства (35). Нетрудно показать, чтоε|ψt+1| ⩽ ε(√n pyt+1 + put+1 + 1) . (41)Из (41) и (35) теперь следует, что для оценки θ∞ выполня-ются неравенства (28) с правой частьюδw + ε + (δy + ε√n)pyt + (δu + ε)put, (42)Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ru15которой соответствует набор верхних границ возмущенийδε = (δw + ε, δy + ε√n, δu + ε) .Тогда в силу Леммы 1 выход yt можно считать выходом объ-екта (1) с вектором параметров θ∞ = (ξT∞, cw∞)T , наборомверхних границ δε и управляемого соответствующим оцен-ке θ∞ оптимальным регулятором. Далее по Теореме 1lim supt→+∞|yt − rt| ⩽ Jθ∞, δε) . (43)Остается заметить, что J(θ∞, δε) = Jθ∞, δ)+O(ε). Ана-логично [10] можно вычислить постояннуюK, представля-ющую величину O(ε) в прямой форме Kε.Замечание 2. Показатель качества J(θ, δ), определен-ный в (18), запишем, используя (16), в видеJ(θ, δ) =(δw + δy∥r∥ss)|b1| + δu∥r∥ss + δu|cw|)(1 − δy)|b1| − δuPnk=1|ak| .(44)Нетрудно заметить, что этот показатель является дроб-но-линейной функцией оцениваемого вектора θ (для этогокаждую абсолютную величину |x| следует записать в видеx = x+ − x−, где x+ ⩾ 0, x− ⩾ 0. Из этого следует,что оптимизация (38) представляет собой задачу дробно-линейного программирования при линейных ограничениях.Эта задача стандартным образом сводится к задаче ли-нейного программирования [11], для решения которой име-ется высокоэффективное современное программное обес-печение. В статье [10] приведены примеры численного мо-делирования, иллюстрирующие эффективность алгорит-мов множественного оценивания для объектов управленияс девятью неизвестными параметрами. Заметим, что он-лайн уменьшение параметра ε для повышения гарантиро-ванной точности решения оптимальной задачи (38) влечетрост числа возможных обновлений оценок и числа нера-венств в описании множественных оценок Θt, т.е. к повы-шению вычислительной сложности оптимальной задачи.Замечание 3. Главное достоинство рассмотренногоадаптивного управления заключается в обеспечении оп-тимальной с заданной точностью асимптотической верх-ней оценки показателя качества для любого допустимо-го и не идентифицируемого вектора θ. Главный же недо-статок заключается в единой области допустимых значе-ний коэффициентов усиления неопределенностей δy и δuв виде неравенства (26). В то же время эта единая (универ-сальная) для всех допустимых θ область является скольугодно близкой к оптимальной универсальной области засчет выбора достаточно близкого к единице параметра ¯δ.Традиционные алгоритмы оценивания на базе градиентно-го алгоритма или метода наименьших квадратов не тольконе могли гарантировать никакой оптимальности адаптив-ного управления, но и допускали только достаточно ма-лые области робастной устойчивости, поскольку обосно-вывались с помощью метода функций Ляпунова, вносив-шего значительный консерватизм в результаты по устой-чивости по сравнению с ℓ1-теорией робастного управле-ния. Это проявлялось, в частности, и в том, что в тради-ционном робастном адаптивном управлении вместо струк-турированной неопределенности по выходу и управлениюрассматривалась неструктурированная неопределенностьδ = max(δy, δu), вносившая дополнительный консерва-тизм. Для такой неструктурированной неопределенностинаиболее продвинутый результат на основе градиентно-го алгоритма оценивания был получен в статье [13] именнов контексте ℓ1-теории при центрированном внешнем воз-мущении (т.е. при cw = 0) для авторегрессионного объектас запаздыванием в управлении.ЗаключениеТрадиционные алгоритмы оценивания неизвестных па-раметров объекта управления с детерминированными воз-мущениями представляют собой модификации градиент-ного алгоритма или алгоритма метода наименьших квадра-тов и не могут гарантировать оптимальности адаптивно-го управления. Более сложные алгоритмы множественно-го оценивания открывают возможности синтеза адаптив-ного оптимального управления при использовании пока-зателя качества задачи управления как идентификацион-ного критерия. В данной работе рассмотрена задача оп-тимального робастного слежения для авторегрессионногообъекта с неизвестной номинальной моделью и неизвест-ным смещением ограниченного внешнего возмущения, нос известными коэффициентами усиления неопределенно-стей по выходу и управлению и известной верхней грани-цей несмещенного внешнего возмущения. Благодаря дроб-но-линейному виду показателя качества в виде асимпто-тически наихудшего возможного отклонения выхода объ-екта от отслеживаемого сигнала, вычисление текущих оп-тимальных оценок сводится к линейному программирова-нию и реализуемо в режиме онлайн по крайней мере дляобъектов невысокого порядка.

Rohrs, C.E. Robustness of continuous-time adaptive control algorithms in the presence of unmodeled dynamics / C.E. Rohrs, L. Valavani, M. Athans, G. Stein // IEEE Transactions on Automatic Control. - 1985. - Vol. 30. - № 9. - P. 881-889.

Zhou, K. Essentials of robust control / K. Zhou, G.C. Doyle // Prentice Hall, 1998. - 430 p.

Khammash, M. Performance robustness of discrete-time systems with structured uncertainty / M. Khammash, J. Pearson // IEEE Transactions on Automatic Control. -1991. - Vol. 36, № 4. - P. 398-412.

Khammash, M. Robust steady-state tracking / M. Khammash // IEEE Transactions on Automatic Control. - 1995. - Vol. 40, № 11. - P. 1872-1880.

Khammash, M. Robust performance: unknown disturbances and known fixed inputs / M. Khammash // IEEE Transactions on Automatic Control. - 1997. - Vol. 42, № 12. - P. 1730-1734.

Sokolov, V.F. ℓ1 robust performance of discrete-time systems with structured uncertainty / V.F. Sokolov // Syst. Control Lett. - 2001. - Vol. 42, № 5. - P. 363-377.

Соколов, В.Ф. Робастное управление при ограниченных возмущениях / В.Ф. Соколов. - Сыктывкар: Коми научный центр УрО РАН, 2011. - 218 с.

Sokolov, V.F. Robastnoe upravlenie pri ogranichennyh vozmuscheniyah / V.F. Sokolov. - Syktyvkar: Komi nauchnyy centr UrO RAN, 2011. - 218 s.

Sokolov, V.F. Adaptive ℓ1 robust control for SISO system / V.F. Sokolov // Systems and Control Letters. - 2001. - Vol. 42, № 5. - P. 379-393.

Соколов, В.Ф. Адаптивная оптимальная робастная ста- билизация авторегрессионного объекта со смещенным внешним возмущением / В.Ф. Соколов // Известия Коми научного центра Уральского отделения Российской академии наук. Серия «Физико-математические науки». - 2022. - № 5 (57). - С. 20-27.

Sokolov, V.F. Adaptivnaya optimal'naya robastnaya sta- bilizaciya avtoregressionnogo ob'ekta so smeschennym vneshnim vozmuscheniem / V.F. Sokolov // Izvestiya Komi nauchnogo centra Ural'skogo otdeleniya Rossiyskoy akademii nauk. Seriya «Fiziko-matematicheskie nauki». - 2022. - № 5 (57). - S. 20-27.

10.

Соколов, В.Ф. Адаптивное оптимальное слежение для дискретного минимально-фазового объекта с неопределенностью в канале выхода / В.Ф. Соколов // Авто матика и телемеханика. - 2021. - № 8. - C. 108-128.

Sokolov, V.F. Adaptivnoe optimal'noe slezhenie dlya diskretnogo minimal'no-fazovogo ob'ekta s neopredelennost'yu v kanale vyhoda / V.F. Sokolov // Avto matika i telemehanika. - 2021. - № 8. - C. 108-128.

11.

Boyd, S. Convex optimization / S. Boyd, L. Vandenberghe. - New York: Cambridge University Press, 2004. - 742 p.

12.

Walter, E. Exact recursive polyhedral description of the feasible parameter set for bounded error / E. Walter, H. Piet-Lahanier // IEEE Transactions on Automatic Control. 1989. - Vol. 34, № 8. - P. 911-915.

13.

Weyer, E. Limitations of robust adaptive pole placement control / E. Weyer, I. Mareels, J. Polderman // IEEE Transactions on Automatic Control. - 1994.- Vol. 39, № 8. - P. 1665-1671.