Proceedings of the Komi Science Centre of the Ural Division of the Russian Academy of Sciences

Известия Коми научного центра УрО РАН

1994-5655

55725

10.19110/1994-5655-2022-5-20-27

Без рубрики

Without rubric

Без рубрики

Adaptive optimal robust stabilization of autoregressive plant under biased external disturbance

Адаптивная оптимальная робастная стабилизация авторегрессионного объекта со смещенным внешним возмущением

Соколов

В. Ф.

Sokolov

V. F.

20 12 2022

5 20 27 14 09 2022

https://komisc.editorum.ru/en/nauka/article/55725/view

В статье рассматривается задача адаптивного оптималь- ного робастного управления дискретным объектом с неиз- вестными параметрами авторегрессионной номинальной модели, неизвестными верхней границей и смещением внешнего возмущения и неизвестными коэффициентами усиления возмущений по выходу и управлению. Показа- телем качества управления служит наихудшая установив- шаяся верхняя граница выхода. Решение задачи основа- но на оптимальном полиэдральном оценивании неизвест- ных неидентифицируемых параметров, где идентифика- ционным критерием является показатель качества управ- ления. Предложена замена неизвестных параметров, мо- дифицирующая модель объекта в модель без возмущения по управлению. Эта замена преобразует невыпуклый пока- затель качества в дробно-линейный и делает возможным онлайн вычисление текущих оптимальных оценок.

This paper addresses the problem of adaptive optimal robust control of a discrete-time plant with unknown parameters of autoregressive nominal model, unknown upper bound and bias of external disturbance, and unknown gains of coprime factor perturbations. The control criterion is the worst-case steady-state upper bound of the output. Solution of the problem is based on an optimal polyhedral estimation of unknown non-identifiable parameters with the control criterion treated as the identification criterion. A replacement of unknown parameters is proposed that modifies the plant model to a model without perturbation in control. This transforms the nonconvex control criterion to a linear fractional one and thus makes possible online computation of optimal estimates.

адаптивное управление оптимальное управление робаст- ное управление неопределенность ограниченное возму- щение множественное оценивание

adaptive control optimal control robust control uncertainty bounded disturbance set-membership estimation

ВведениеПредметом математической теории адаптивного управ-ления, зародившейся в начале 1960-х гг., на первом этапебыли задачи управления линейными стационарными объ-ектами управления с неизвестными параметрами переда-точной функции и внешними возмущениями. Для систем сослучайными возмущениями фундаментальные результатыпо синтезу адаптивного оптимального управления на осно-ве онлайн оценивания неизвестных параметров были по-лучены уже к концу 1970-х гг. на основе градиентных алго-ритмов [1, 2] и к началу 1990-х гг. — на основе метода наи-меньших квадратов [3,4]. Градиентные алгоритмы оценива-ния широко использовались и в задачах адаптивной ста-билизации систем с ограниченными детерминированнымивнешними возмущениями. В начале 1980-х гг. в знамени-тых статьях [5,6] было показано, что известные к тому вре-мени алгоритмы адаптивного управления не гарантируютустойчивости адаптивных систем при наличии даже малыхдетерминированных внешних возмущений или немодели-руемой динамики. Это стимулировало разработку в после-дующие два десятилетия теории робастного адаптивногоуправления, в которой рассматривались задачи стабили-зации адаптивных систем. Результаты теории в основномбазировались на применении функций Ляпунова [7,8] и от-носились к системам с достаточно малой немоделируемойдинамикой. Параллельно в эти же годы активно разраба-тывалась теория робастного управления в H∞ постанов-20Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ruке [9]. Однако результаты данной теории трудно исполь-зовать в задачах адаптивного управления, и исследова-ния возможностей применения H∞-подхода хотя бы дляидентификации систем продолжаются до настоящего вре-мени.В настоящей статье для относительно простого дис-кретного объекта с авторегрессионной номинальной моде-лью, ограниченным и смещенным внешним возмущениеми операторными возмущениями (неопределенностями) повыходу и управлению рассматривается существенно бо-лее сложная по сравнению с адаптивной стабилизаци-ей задача адаптивного оптимального робастного управ-ления. Предполагаются неизвестными параметры номи-нальной модели, верхняя граница и смещение внешнеговозмущения, а также коэффициенты усиления неопреде-ленностей. Цель управления заключается в минимизацииверхнего предела модуля выхода объекта в классе ука-занных возмущений. Решение задачи базируется на ре-зультатах теории робастного управления в ℓ1-постанов-ке, основы которой были заложены в [10–12]. Их развитиедля задач адаптивного управления изложено в [13]. Реше-ние оптимальной задачи в условиях неидентифицируемо-сти управляемого объекта оказывается теоретически воз-можным при использовании показателя качества управ-ления как идентификационного критерия и множествен-ного онлайн оценивания неизвестных параметров [14]. Од-нако в общем случае показатель качества является невы-пуклой функцией оцениваемых неизвестных параметров, исоответствующее оптимальное оценивание затруднитель-но в онлайн режиме. Для рассматриваемого в статье объ-екта управления предлагается замена неизвестных пара-метров, позволяющая свести модель объекта к модели снеопределенностью только по выходу, для которой пока-затель качества становится дробно-линейной функциейнеизвестных параметров, и оптимальное оценивание сво-дится к задаче линейного программирования. Оптималь-ность предлагаемого адаптивного управления доказанапри дополнительном техническом предположении о дина-мике замкнутой системы. В отличие от всех традиционныхалгоритмов адаптивного управления предлагаемое в ста-тье решение оптимальной задачи обеспечивает верифи-кацию настроенной оптимальной модели благодаря при-менению метода рекуррентных целевых неравенств [15] ииспользованию полиэдральных оценок неизвестных пара-метров.Мы будем придерживаться следующих обозначений:|φ| — евклидова норма вектора φ ∈ Rn;ℓe — пространство вещественных последовательностейx = (· · · , x−2, x−1, x0, x1, x2, · · · ),xts = (xs, xs+1, . . . , xt) для x ∈ ℓe;|xts| = maxs⩽k⩽t |xk|;ℓ∞ — нормированное пространство ограниченных веще-ственных последовательностей x = (x0, x1, x2, . . .) снормой ∥x∥ = supt|xt|;∥x∥ss = lim supt→+∞ |xt|;ℓ1 — нормированное пространство абсолютно суммируе-мых последовательностей с нормой ∥x∥1 =P+∞k=0|xk|;∥G∥ =P+∞k=0|gk| = ∥g∥1 — индуцированная нормаустойчивой линейной стационарной системы G : ℓ∞ →ℓ∞ с передаточной функцией G(λ) =P+∞k=0 gkλk.1. Постановка задачиПусть объект управления с дискретным временем опи-сывается моделью видаa(q−1)yt = b1ut−1 + vt , t = 1, 2, 3, . . . , (1)где yt ∈ R— выход объекта в момент времени t, ut ∈ R—управление, vt ∈ R — суммарное возмущение в объекте,a(q−1) = 1 + a1q−1 + . . . + anq−nи q−1 — оператор сдвига назад (q−1yt = yt−1) на ли-нейном пространстве ℓe. Начальные значения y01−n =(y1−n, . . . , y0) произвольные, yk = 0 при k < 1 − nи uk = 0 при k < 0.Модель (1) без возмущения (т.е. при v = 0 ∈ ℓe) назы-вается номинальной моделью объекта (1). Она характери-зуется вектором параметровξ := (a1, . . . , an, b1)T .Априорная информация об объекте (1) состоит из несколь-ких априорных предположений.Предположение 1. Вектор параметров ξ неизвестен ипринадлежит известному ограниченному многогранникуξ ∈ Ξ = { ˆξ | P ˆξ ⩾ p } ⊂ Rn+1 , (2)где P ∈ Rl×(n+m), p ∈ Rl и b1 ̸= 0 для любого ξ ∈ Ξ.Предположение 2. Суммарное возмущение v имеет видvt = cw + δwwt + δyΔ1(y)t + δuΔ2(u)t , (3)где w ∈ ℓ∞ — неизвестное нормализованное (∥w∥∞ ⩽1) внешнее возмущение, δw ⩾ 0 — неизвестная нор-ма (верхняя граница) внешнего несмещенного возмущенияи cw — неизвестное смещение суммарного ограниченноговнешнего возмущения, ограниченное по модулю известнойпостоянной Cw:|cw| ⩽ Cw .Операторы Δ1 и Δ2 в (3) на пространстве последователь-ностей ℓe удовлетворяют при всех t ограничениям|Δ1(y)t| ⩽ pyt := |yt−1t−μ|,|Δ2(u)t| ⩽ put:= |ut−1t−μ|, (4)с неизвестными коэффициентами δy ⩾ 0 и δu ⩾ 0.Операторы Δ1 и Δ2 называются операторными возму-щениями (или неопределенностями) по выходу и управле-нию соответственно и описывают линейные нестационар-ные или нелинейные строго причинные операторы, имею-щие известную ограниченную память μ и нормированныена подпространстве ℓ∞ (т.е. их коэффициенты усиленияравны 1). Коэффициенты δy ⩾ 0 и δu ⩾ 0 характери-зуют коэффициенты усиления неопределенностей (опера-торных возмущений) по выходу и управлению в суммарномвозмущении v. Управление системами с неопределенно-стью называют робастным. Память неопределенностей μИзвестия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ru 21выбирается конструктором исходя из априорной информа-ции об управляемой системе и может быть выбрана скольугодно большой, но не бесконечной, без ущерба для каче-ства синтезируемого ниже адаптивного управления (см. за-мечание в конце раздела 2). Необходимые для стабилизи-руемости объекта ограничения на коэффициенты усилениянеопределенностей будут сформулированы в разделе 3.Введем обозначение θ для вектора всех неизвестныхпараметров объекта (1)θ = (ξT , cw, δw, δy, δu)T .Задача. Рассматриваемая в статье задача заклю-чается в построении обратной связи вида ut =Ut(yt0, ut−10 ,Ξ,Cw), гарантирующей как можно мень-шую верхнюю границу для асимптотического показателякачестваJμ(θ) = supvlim supt→+∞|yt| , (5)где sup берется на множестве возмущений v, удовлетво-ряющих предположению 2. На обратную связь налагаетсятрудно формализуемое в точных терминах требование еевычислительной реализуемости в онлайн режиме.Уточненная формулировка задачи и необходимое до-полнительное априорное предположение о робастной ста-билизируемости объекта (1) приведены в конце раздела 2.2. Оценка показателя качества оптимальнойсистемы при известных параметрахДля объекта с известным вектором коэффициентов ξ ипри известном смещении cw регуляторut =1b1[(a(q−1) − 1)yt+1 − cw] (6)гарантирует при всех t равенствоyt+1 = vt+1 − cw == δwwt+1 + δyΔ1(y)t+1 + δuΔ2(u)t+1. (7)Поскольку будущие значения неопределенностей и воз-мущения wt непредсказуемы, регулятор (6) являетсяоптимальным для показателя качества (5). Введем обозна-чения для передаточной функции регулятора (6) :Gξ(λ) =a(λ) − 1b1λ=1b1nX−1k=0ak+1 λk .Тогда∥Gξ∥ =1|b1|Xnk=1|ak| . (8)Замкнутая система, включающая объект (1) и некото-рый регулятор, называется робастно устойчивой в клас-се неопределенностей (4), если значение показателя ка-чества (5) для этой системы конечно.Робастное качество оптимальной системы (1), (6) опи-сывается в следующей теореме.Теорема 1. 1. Система (1), (6) робастно устойчива приμ = +∞тогда и только тогда, когдаδy + δu∥Gξ∥ < 1 . (9)2. Если выполнено условие робастной устойчивости (9),тоJμ(θ) ↗ J(θ) =δw + δu|cw/b1|1 − δy − δu∥Gξ∥ (μ → +∞) ,(10)где знак ↗ означает монотонную сходимость снизу приμ → +∞.Доказательство. Условие робастной устойчивости (9)следует из теоремы 7 [16], примененной к системе (1), (6).Значение J(θ), определенное в (10), является значени-ем показателя качества (5) при μ = +∞, т.е. J(θ) =J+∞(θ) и получается из общей теоремы 5 в [16] путем со-ответствующих алгебраических вычислений. Монотоннаясходимость в (10) прямо следует из теоремы 6 в [16].Последнее априорное предположение диктуется усло-вием робастной стабилизируемости (9) объекта с извест-ными параметрами.Предположение 3. Неизвестный вектор параметров θудовлетворяет неравенствуδy + δu∥Gξ∥ ⩽ ¯δ < 1 (11)с известным числом ¯δ.Предположение об известной верхней границе ¯δ в (11)не является ограничительным. Число ¯δ выбирается кон-структором адаптивного регулятора и может быть выбраносколь угодно близким к единице. При этом исключаются израссмотрения неприемлемые для практических приложе-ний модели, слишком близкие к границе области робастностабилизируемых объектов. Замена открытого множествапараметров θ, удовлетворяющих (9) сколь угодно близким кнему закрытым множеством (11), дает возможность сформу-лировать строгие результаты о качестве адаптивного суб-оптимального управления.Замечание. Базовые результаты ℓ1-теории робастногоуправления относились к системам со структурированнойнеопределенностью с бесконечной памятью (μ = +∞) итолько с нулевыми начальными данными [10]. В то же времямодель возмущений с бесконечной памятью слишком кон-сервативна и не соответствует реальным задачам управ-ления. Предположение об ограниченной памяти возмуще-ний позволяет исключить зависимость показателя каче-ства от слишком далекой предыстории со сколь угодно ма-лыми потерями для показателя качества J(θ) и, кроме то-го, предоставляет возможность онлайн верификации моде-ли объекта, включая квантификацию (оценку параметров)неопределенностей и внешнего возмущения.Уточненная постановка задачи. Требуется при априор-ных предположениях 1-3 построить обратную связь, гаран-тирующую при любых начальных данных и любом возму-щении v выполнение с заданной точностью неравенстваlim supt→+∞|yt| ⩽ J(θ) . (12)22Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ru3. Преобразование к модели с неопределен-ностью по выходуРешение поставленной оптимальной задачи базиру-ется на использовании множественных (полиэдральных)оценок неизвестных параметров и оптимальном оценива-нии, в котором идентификационным критерием являетсяпоказатель качества J(θ). В данном разделе описываетсязамена неизвестных параметров, позволяющая преобразо-вать модель управляемого объекта к модели с неопреде-ленностью только по выходу. После преобразования нели-нейный и невыпуклый показатель качества J(θ) стано-вится дробно-линейным, а ограничение (11) - линейным.Благодаря этому вычисление текущих оптимальных оценоксводится к задаче линейного программирования.Следующее простое утверждение позволяет использо-вать метод рекуррентных целевых неравенств для оценкинеизвестного вектора параметров θ.Лемма 1. Если для некоторой оценкиˆθ = (ˆξT , ˆcw, ˆδw, ˆδy, ˆδu)T ,ˆξ ∈ Ξ, ˆδw ⩾ 0, ˆδy ⩾ 0, ˆδu ⩾ 0 ,неизвестного вектора θ при всех t справедливы неравен-ства|ˆa(q−1)yt − ˆb1ut−1 − ˆcw| ⩽ ˆδw + ˆδypyt + ˆδuput, (13)то объект управления (1) с вектором параметров ˆθ удовле-творяет уравнению (1) и априорным предположениям 1 и 2при всех t.Доказательство. Априорное предположение 1 выполне-но в силу включения ˆξ ∈ Ξ. Определим возмущение ˆvt =ˆa(q−1)yt −ˆb1ut−1 для всех t. Тогда объект управления свектором параметров ˆθ и суммарным возмущением ˆv удо-влетворяет уравнению (1), и в силу (13) возмущение ˆv удо-влетворяет неравенствам|ˆvt − ˆcw| ⩽ ˆδw + ˆδypyt + ˆδuput. (14)Значения ˆvt можно представить в виде (3), выбрав под-ходящие значения wt,Δ1(y)t,Δ2(u)t, удовлетворяющиенеравенствам (4). Это гарантирует справедливость апри-орного предположения 2. □В силу леммы 1 при любом управлении объектом (1) пол-ная информация о векторе неизвестных параметров θ к мо-менту времени t имеет видθ ∈ Θt = {ˆθ ∈ Θ0|ˆa(q−1)yk − ˆb1uk−1 − ˆcw| ⩽ˆδw + ˆδypyk + ˆδupuk∀k ⩽ t },гдеΘ0 = { ˆθ = (ˆξT , ˆcw, ˆδw, ˆδy, ˆδu)Tˆξ ∈ Ξ , ˆδw ⩾ 0 ,ˆδy ⩾ 0 , ˆδu ⩾ 0 , ˆδy + ˆδu∥Gˆξ∥ ⩽ ¯δ }— априорное множество допустимых параметров.Из леммы 1 следует неидентифицируемость параметровξ и cw оптимального регулятора (6) при любом управле-нии объектом (1). Действительно, множества Θt состоят извекторов ˆθ ∈ Θ0, которые удовлетворяют уравнению (1) иаприорным предположениям 1-3 вплоть до момента време-ни t, и любой вектор ˆθ с достаточно большой компонентойˆδw лежит в Θt, каким бы ни было управление объектом домомента t.Метод рекуррентных целевых неравенств заключает-ся в построении сходящейся последовательности оценокθt, достаточно точно удовлетворяющих целевым неравен-ствам (13) при всех достаточно больших t. Однако этогонедостаточно для решения поставленной оптимальной за-дачи, и для предельной оценки θ∞ необходимо допол-нительно обеспечить выполнение с заданной точностьюнеравенстваJ(θ∞) ⩽ J(θ)с неизвестным и не идентифицируемым вектором θ. Это об-стоятельство диктует необходимость использования пока-зателя качества J в качестве идентификационного крите-рия, т.е. вычисления текущих оптимальных оценок по фор-мулеθt = argminˆθ∈ΘtJ(ˆθ) = argminˆθ∈Θtˆδw + ˆδu|ˆcw/ˆb1|1 − ˆδy − ˆδu∥Gˆξ∥. (15)Однако вычисление по формуле (15) не релизуемо в ре-жиме онлайн, поскольку, во-первых, число целевых нера-венств в описании множествΘt может неограниченно воз-растать и, во-вторых, показатель качества J и условие ро-бастной стабилизируемости (11) невыпуклы. Первую труд-ность можно преодолеть использованием верхних поли-эдральных оценок множеств Θt. Для преодоления второйтрудности далее описывается замена неизвестных пара-метров, позволяющая перейти к модели с неопределенно-стью только в канале выхода.Пусть объект (1) управляется так, что для всех t выпол-нены неравенства|ut| ⩽ C1 + C2|ytt−n+1| (16)с некоторыми постоянными C1,C2. Из (1), (16) и предполо-жения 2 следует|a(q−1)yt − b1ut−1 − cw| ⩽⩽ δw + δy|yt−1t−μ| + δu|ut−1t−μ| ⩽⩽ δw + δuC1 + (δy + δuC2)|yt−1t−μ−n| (17)и, следовательно, для любого ¯μ ⩾ μ + n|a(q−1)yt − b1ut−1 − cw| ⩽⩽ δw + δuC1 + (δy + δuC2)|yt−1t−¯μ|. (18)Введем новые параметры ˜ζ, ˜δe и ˜δ:˜ζ = (ξ, cw, ˜δe, ˜δ),˜δe = δw + δuC1 , ˜δ = δy + δuC2 . (19)Неравенства (18) относительно новых параметров прини-мают вид|a(q−1)yt − b1ut−1 − cw| ⩽ ˜δe + ˜δ|yt−1t−¯μ| , (20)Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ru 23эквивалентный неравенствам (13) для модифицированноговектора параметров˜θm = (ξT , cw, ˜δe, ˜δ, 0)T .В силу леммы 1 неравенства (20) означают, что при вы-полнении неравенств (16) выход y можно считать выходомобъекта (1) с модифицированным вектором параметров ˜θm(без неопределенности по управлению), и для этого объек-та из теоремы 1 имеемlim supt→+∞|yt| ⩽ J(˜θm) =˜δe1 − ˜δ. (21)Если объект (1) управляется оптимальным регулятором (6),то|ut + cw/b1| ⩽ ∥Gξ∥|ytt−n+1| ,и, следовательно,|ut| ⩽ |cw/b1| + ∥Gξ∥|ytt−n+1∥ . (22)Неравенства (22) гарантируют неравенства (16) и (18) с по-стоянными C1 = |cw/b1| и C2 = ∥Gξ∥, для которых па-раметры ˜δe и ˜δ из (19) принимают видδe = δw + δu|cw/b1| , δ = δy + δu∥Gξ∥ . (23)Тогда для вектораζ = (ξT , cw, δe, δ)T (24)получаемI(ζ) :=δe1 − δ= J(θ) . (25)4. Адаптивное оптимальное управлениеАдаптивное оптимальное управление будет основанона вычислении оценок ζt = (ξTt , cwt, δet , δt)T неизвест-ного вектора параметров ζ модифицированной модели снеопределенностью только по выходу с использованиемвместо целевых неравенств (13) модифицированных целе-вых неравенств|ˆa(q−1)yt − ˆb1ut−1 − ˆcw| ⩽ ˆδe + ˆδpyt . (26)Вместе с векторными оценками ζt будут вычисляться по-лиэдральные оценкиZt, составленные из априорных огра-ничений и нескольких линейных неравенств, порожден-ных модифицированными целевыми неравенствами (26).Начальные оценки Z0 и ζ0 имеют видZ0 = { ˆζ = (ˆξT , ˆcw, ˆδe, ˆδ)T | ˆξ ∈ Ξ, |ˆcw| ⩽ Cwˆδe ⩾ 0, 0 ⩽ ˆδ ⩽ ¯δ } ,ζ0 = (ξT0 , 0, 0, 0)T ,где ξ0 — любой вектор из априорного многогранника Ξ и¯δ — верхняя оценка параметра δ из предположения 3.Выберем любое число ¯μ ⩾ μ + n запоминаемых вы-ходов ytt−¯μ+1 и параметр ε > 0 мертвой зоны, которыйбудет гарантировать конечное число обновлений оценок.Управление ut в момент t определяется адаптивным регу-ляторомut =1bt1(at1yt +at2yt−1 +. . .+atnyt−n+1 −cwt) . (27)Алгоритм обновления векторных оценок ζt и полиэд-ральных оценок Zt имеет следующий вид. После измере-ния выхода yt+1 в момент t + 1 положимφTt= (−yt,−yt−1, . . . ,−yt−n+1, ut),ηt+1 = sign(yt+1 − φTtξt − cwt) ,pt+1 = |ytt−¯μ+1| , νt+1 = ηt+1yt+1 ,ψt+1 = (ηt+1φTt, ηt+1, 1, pt+1)T .В этих обозначениях уравнение адаптивного регулятора(27) эквивалентно равенству φTtξt + cwt= 0, так чтоηt+1 = sign(yt+1), а целевое неравенство (26) в моментt + 1 для текущей оценки ζt эквивалентно неравенствуψTt+1ζt ⩾ νt+1 . (28)Положимζt+1 := ζt , Zt+1 := Zt,если ψTt+1ζt ⩾ νt+1 − ε|ψt+1| . (29)В противном случае, положимZt+1 := Zt ∩ Ωt+1 , (30)Ωt+1 := { ˆζψTt+1ˆζ ⩾ νt+1 } ,ζt+1 := argminˆζ∈Zt+1I(ˆζ) , (31)где показатель качества I определен в (25).Алгоритм оптимального оценивания (29)–(31) имеетпростую геометрическую интерпретацию. В силу (29) оцен-ки Zt и ζt обновляются, когда расстояние от вектора ζtдо полупространства Ωt+1 больше ε (это обеспечивает-ся добавлением слагаемого −ε|ψt+1| в условие обновле-ния оценок в (29)). Обновление Zt в (30) заключается вдобавлении линейного неравенства (28), которое являет-ся тем из двух линейных неравенств, составляющих целе-вое неравенство (26), которое нарушается для оценки ζt.Вычисление оптимальной оценки ζt+1 согласно (31) пред-ставляет собой задачу дробно-линейного программирова-ния, стандартным образом сводящуюся к задаче линейногопрограммирования введением вспомогательной перемен-ной [17].Теорема 2. Пусть объект (1) с неизвестным вектором па-раметров θ = (ξT , cw, δw, δy, δu)T удовлетворяет пред-положениям 1, 2 и управляется адаптивным регулятором(27) с алгоритмом оценивания (29)–(31) и с параметроммертвой зоны ε, удовлетворяющим неравенствам0 < ε <1 − ¯ √ δn + 1 + Gu, Gu = supξ∈Ξ∥Gξ∥ . (32)Тогда при любых начальных значениях y01−n и любом воз-мущении v, удовлетворяющем предположению 2, справед-ливы утверждения:24Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ru1) если параметры δy и δu удовлетворяют неравенствуδy + δuGu ⩽ ¯δ < 1 , (33)то множественные оценки Zt и векторные оценки ζt схо-дятся за конечное время иlim supt→+∞|yt| ⩽ I(ζε∞) < I(ζ∞) + Kζ∞ε , (34)I(ζ∞) ⩽ ¯I =δw + δu maxt |cwt/bt1|1 − δy − δu maxt ∥Gξt∥ ⩽⩽ δw + δu maxt |cwt/bt1|1 − δy − δuGu, (35)где ζ∞ = (ξT∞, cw∞, δe∞, δ∞) — предельное значение ζt,ζε∞= ( ξT∞, cw∞, δe∞+ ε(√2 + |cw∞/b∞1|) ,δ∞ + ε(√n + 1 + ∥Gξ∞∥))T , (36)Kζ∞ =√2 + |cw∞/b∞1| + δe∞(√n + 1 + ∥Gξ∞∥)(1 − δ∞ − ε(√n + 1 + ∥Gξ∞∥))2;2) если параметры δy и δu удовлетворяют предполо-жению 3 и при всех t справедливы неравенства|ut| ⩽ ¯ut = |cw/b1| + ∥Gξ∥|ytt−¯μ+1| , (37)то множественные оценки Zt и векторные оценки ζt схо-дятся за конечное время иlim supt→+∞|yt| ⩽ I(ζε∞) < I(ζ∞) + Kζ∞ε ⩽⩽ J(θ) + Kζ∞ε , (38)где ζ∞ = (ξT∞, cw∞, δe∞, δ∞) — предельное значение ζt иζε∞, Kζ∞ имеют вид (36).Теорема 2 приводится без доказательства.Утверждение 1 теоремы 2 обеспечивает устойчивостьадаптивной системы на сильно суженном (так как Gu ⩾∥Gξ∥) множестве (33) параметров (δy, δu) по сравнениюс множеством (11). Гарантируемые верхние оценки ¯I в (35)являются грубыми и сильно завышенными по сравнениюс вычисляемыми онлайн и сходящимися к I(ζε∞) за ко-нечное время верхними оценками I(ζεt ), согласованнымис данными измерений. Тем не менее уникальным достоин-ством этих грубых оценок является то, что они соответ-ствуют “настоящим” значениям не идентифицируемых ко-эффициентов усиления неопределенностей δy и δu. Заме-тим, что даже такие области робастной устойчивости и та-кие оценки качества адаптивных систем недостижимы прииспользовании стандартных градиентных алгоритмов оце-нивания, способных гарантировать только грубые оценки,одинаковые для всех допустимых объектов.Утверждение 2 теоремы 2 базируется на дополнитель-ном условии (37), которое не верифицируемо данными из-мерений, так как параметры cw, b1 и ξ неизвестны. Адап-тивный регулятор (27) гарантирует справедливость этихнеравенств для текущих оценок cwt, bt1 и ξt. Поскольку вцепочке неравенств (17) и (18) каждое из неравенств яв-ляется существенно огрубленным и текущие оптимальныеоценки ζt минимизируют показатель качества I, неравен-ства (37), как показывают многочисленные численные экс-перименты, фактически выполняются. Их строгое доказа-тельство остается открытой проблемой.Важнейшим дополнительным достоинством использо-вания полиэдральных оценок является верифицируемостьаприорных предположений об управляемом объекте. Ин-дикатором приемлемости априорных предположений и те-кущих оценок неизвестных параметров управляемого объ-екта служит неубывающая последовательность наимень-ших согласованных с априорными предположениями иданными измерений значений I(ζt). Если текущая оценкаζt не изменяется на длительном промежутке времени, тоона удовлетворяет целевым неравенствам и тем самым га-рантирует эту наилучшую верхнюю границу I(ζt) для вы-хода |yt| после затухания переходных процессов. Неиз-менность оценки ζt на длительном промежутке временигарантирует также соответствие априорных предположе-ний данным измерений при текущем гарантируемом и наи-лучшем асимптотическом качестве управления I(ζt). Тра-диционные методы синтеза адаптивного управления какв детерминированной, так и в стохастической постанов-ке оставляют проблемы верификации модели и априорныхпредположений вне рассмотрения.ЗаключениеРассмотрена задача оптимально робастной стабилиза-ции объекта с авторегрессионной номинальной модельюв условиях сильной априорной неопределенности. Пред-полагаются неизвестными не только коэффициенты пе-редаточной функции номинального объекта, но и верхняяграница и смещение внешнего возмущения и коэффициен-ты усиления неопределенностей по выходу и управлению,что влечет неидентифицируемость неизвестных парамет-ров. Показателем качества управления служит наихудшаяв классе возмущений асимптотическая верхняя границамодуля выхода управляемого объекта. Решение задачи ба-зируется на результатах ℓ1-теории робастного управле-ния и использования показателя качества задачи управле-ния как идентификационного критерия. Предложена заме-на неизвестных параметров, позволяющая свести задачувычисления текущих оптимальных оценок к задаче дроб-но-линейного программирования. Полиэдральное оцени-вание неизвестных параметров дополнительно решает за-дачу онлайн верификации настраиваемой модели и апри-орных предположений.

Goodwin, G. Discrete-time multivariable adaptive control / G. Goodwin, P. Ramadge, P. Caines // IEEE Transactions on Automatic Control. - 1980. - Vol. 25. - № 3. - P. 449-456.

Goodwin, G. Discrete time stochastic adaptive control / G. Goodwin, P. Ramadge, P. Caines // SIAM Journal on Control and Optimization. - 1981. - Vol. 19. - № 6. - P. 829-853.

Guo, L. The Åström-Wittenmark self-tuning regulator revisited and ELS-based adaptive trackers / L. Guo, H.- F. Chen // IEEE Transactions on Automatic Control. - 1991. - Vol. 36. - № 7. - P. 802-812.

Guo, L. Further results on least squares based adaptive minimum variance control / L. Guo // SIAM Journal on Control and Optimization. - 1994. - Vol. 32. - № 1. - P. 187-212.

Rohrs, C. Robustness of adaptive control algorithms in the presence of unmodeled dynamics / C. Rohrs, L. Valavani, M. Athans, G. Stein // The 21st IEEE Conference on Decision and Control. - 1882. - P. 3-11.

Rohrs, C.E. Robustness of continuous-time adaptive control algorithms in the presence of unmodeled dynamics / C.E. Rohrs, L. Valavani, M. Athans, G. Stein // IEEE Transactions on Automatic Control. - 1985. - Vol. 30. - № 9. - P. 881-889.

Narendra, K. Stable adaptive systems / K. Narendra, A. Annaswamy. - Dover, 2005. - 512 p.

Ioannou, P.A. Robust adaptive control / P.A. Ioannou, J. Sun. - New Jersey: PTR Prentice-Hall, Upper Saddle River, 1996. - 852 p.

Zhou, K. Robust and Optimal Control / K. Zhou, J.C. Doyle, K. Glover. - New Jersey: Prentice-Hall, Upper Saddle River, 1996. - 616 p.

10.

Khammash, M. Performance robustness of discrete-time systems with structured uncertainty / M. Khammash, J. Pearson // IEEE Transactions on Automatic Control. - 1991. - Vol. 36. - № 4. - P. 398-412.

11.

Khammash, M. Robust steady-state tracking / M. Khammash // IEEE Transactions on Automatic Control. - 1995. - Vol. 40. - № 11. - P. 1872-1880.

12.

Khammash, M. Robust performance: unknown disturbances and known fixed inputs / M. Khammash // IEEE Transactions on Automatic Control. - 1997. - Vol. 42. - № 12. - P. 1730-1734.

13.

Соколов, В.Ф. Робастное управление при ограниченных возмущениях / В.Ф. Соколов. - Сыктывкар: Коми научный центр УрО РАН, 2011. - 218 с.

Sokolov V.F. Robastnoye upravleniye pri ogranichennykh vozmushcheniyakh [Robust control under bounded dicturbances] / V.F. Sokolov. - Syktyvkar: Komi Sience Center

14.

Sokolov, V.F. Adaptive ℓ1 robust control for SISO system / V.F. Sokolov // Systems and Control Letters. - 2001. - Vol. 42. - № 5. - P. 379-393.

UrD RAS, 2011. - 218 p.Sokolov, V.F. Adaptive ℓ1 robust control for SISO system / V.F. Sokolov // Systems and Control Letters. - 2001. - Vol. 42. - № 5. - P. 379-393.

15.

Фомин, В.Н. Адаптивное управление динамическими бъектами / В.Н. Фомин, А.Л. Фрадков, В.А. Якубович. - Москва: Наука, 1981. - 447 c.

Fomin, V.N. Adaptivnoye upravleniye dinamicheskimi ob”yektami [Adaptive control of dynamic plants] / V.N. Fomin, A.L. Fradkov, V.A. Yakubovich. - Moscow: Nauka, 1981. - 447 p.

16.

Sokolov, V.F. ℓ1 robust performance of discrete-time systems with structured uncertainty / V.F. Sokolov // Syst. Control Lett. - 2001. - V. 42 - № 5. - P. 363-377.

17.

Boyd, S. Convex optimization / S. Boyd, L. Vandenberghe. - New York: Cambridge University Press, 2004. - 742 p.