<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="EDITORIAL" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Proceedings of the Komi Science Centre of the Ural Division of the Russian Academy of Sciences</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Proceedings of the Komi Science Centre of the Ural Division of the Russian Academy of Sciences</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Известия Коми научного центра УрО РАН</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">1994-5655</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">69660</article-id>
   <article-id pub-id-type="doi">10.19110/1994-5655-2023-4-10-17</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Научные статьи</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>Science articles</subject>
    </subj-group>
    <subj-group>
     <subject>Научные статьи</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">Optimal ℓ1-robust tracking for autoregressive plant with unknown nominal model</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Оптимальное ℓ1-робастное слежение для авторегрессионного объекта с неизвестной номинальной моделью</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Соколов</surname>
       <given-names>В. Ф.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Sokolov</surname>
       <given-names>V. F.</given-names>
      </name>
     </name-alternatives>
     <email>sokolov@ipm.komisc.ru</email>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">Физико-математический институт ФИЦ Коми НЦ УрО РАН</institution>
     <city>Сыктывкар</city>
     <country>Россия</country>
    </aff>
    <aff>
     <institution xml:lang="en">Institute of Physics and Mathematics, Federal Research Centre Komi Science Centre, Ural Branch, RAS</institution>
     <city>Syktyvkar</city>
     <country>Russian Federation</country>
    </aff>
   </aff-alternatives>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2023-09-21T13:48:28+03:00">
    <day>21</day>
    <month>09</month>
    <year>2023</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2023-09-21T13:48:28+03:00">
    <day>21</day>
    <month>09</month>
    <year>2023</year>
   </pub-date>
   <issue>4</issue>
   <fpage>10</fpage>
   <lpage>17</lpage>
   <history>
    <date date-type="received" iso-8601-date="2023-07-03T00:00:00+03:00">
     <day>03</day>
     <month>07</month>
     <year>2023</year>
    </date>
   </history>
   <self-uri xlink:href="https://komisc.editorum.ru/en/nauka/article/69660/view">https://komisc.editorum.ru/en/nauka/article/69660/view</self-uri>
   <abstract xml:lang="ru">
    <p>В статье рассматривается задача оптимального робаст-&#13;
ного слежения для дискретного объекта с неизвестны-&#13;
ми параметрами авторегрессионной номинальной моде-&#13;
ли и неизвестным смещением внешнего ограниченного&#13;
возмущения. Верхние границы несмещенного внешнего&#13;
возмущения и норм операторных возмущений по выходу&#13;
и управлению предполагаются известными. Задача опти-&#13;
мального слежения заключается в минимизации наихуд-&#13;
шей гарантированной асимптотической верхней границы&#13;
ошибки отслеживания заданного ограниченного сигнала.&#13;
Решение задачи основано на оптимальном множественном&#13;
оценивании неизвестных и неидентифицируемых пара-&#13;
метров и использовании показателя качества задачи сле-&#13;
жения как идентификационного критерия. Численная ре-&#13;
ализация оптимального множественного оценивания в ре-&#13;
жиме онлайн оказывается возможной благодаря тому, что&#13;
показатель качества слежения в рассматриваемой задаче&#13;
является дробно-линейной функцией оцениваемых пара-&#13;
метров.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>This paper addresses the problem of adaptive optimal robust&#13;
tracking for a discrete-time plant with unknown parameters&#13;
of autoregressive nominal model and unknown bias of&#13;
bounded external disturbance. Upper bounds of unbiased external&#13;
disturbance and gains of uncertainties in output and&#13;
control are assumed to be know. The optimal tracking problem&#13;
is to minimize the guaranteed worst-case steady-state&#13;
upper bound of the tracking error for a given bounded reference&#13;
signal. Solution of the problem is based on optimal&#13;
set-membership estimation of unknown non-identifiable parameters&#13;
and treating the control criterion as the identification&#13;
criterion. Optimal on-line set-membership estimation&#13;
becomes computationally tractable due to a linear-fractional&#13;
representation of the control criterion.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>оптимальное управление</kwd>
    <kwd>робастное управление</kwd>
    <kwd>адаптив- ное управление</kwd>
    <kwd>неопределенность</kwd>
    <kwd>ограниченное возму- щение</kwd>
    <kwd>множественное оценивание</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>optimal control</kwd>
    <kwd>robust control</kwd>
    <kwd>adaptive control</kwd>
    <kwd>uncertainty</kwd>
    <kwd>bounded disturbance</kwd>
    <kwd>set-membership estimation</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p>ВведениеПредметом теории адаптивного управления, зародив-шейся в 1960-х гг., являются задачи управления система-ми с неизвестными параметрами. Один из двух известныхподходов к синтезу адаптивного управления заключает-ся в прямой настройке по данным измерений параметроврегулятора и называется прямым адаптивным управлени-ем. Другой подход базируется на онлайн оценивании неиз-вестных параметров объекта управления с последующейнастройкой регулятора. Этот подход называют идентифи-кационным или непрямым адаптивным управлением. Алго-ритмами оценивания в рамках идентификационного под-хода служат различные модификации градиентного (про-екционного) алгоритма минимизации невязки в уравнениимодели управляемого объекта или модификации методанаименьших квадратов. В середине 1980-х гг. в знамени-той статье [1] было показано, что полученные к тому вре-мени алгоритмы адаптивной стабилизации не гарантируютустойчивости даже при малых внешних или операторныхвозмущениях (немоделируемой динамике). Это стимулиро-вало, с одной стороны, разработку модификаций алгорит-мов оценивания для обеспечения устойчивости адаптив-ных систем при наличии возмущений и, с другой стороны,развитие теории робастного управления, посвященной си-стемам с операторными возмущениями и ставшей главнымнаправлением теории автоматического управления с кон-ца 1970-х гг. на последующие два десятилетия [2]. Одна-10Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ruко последующие результаты в теории робастного адап-тивного управления базировались в основном на аппа-рате функций Ляпунова, ограничивались задачами обес-печения устойчивости и не коррелировали с результата-ми теории робастного управления, в основе которой лежа-ла теорема о малом коэффициенте усиления (small gaimtheorem).Модель внешних ограниченных возмущений породиланаправление в теории идентификации систем, основан-ное на использовании множественных оценок неизвестныхпараметров. Почти все многочисленные публикации это-го направления относятся к системам, аффинным относи-тельно неизвестных параметров, и предполагают извест-ными верхние границы возмущений. Множества не сфаль-сифицированных данными измерений неизвестных пара-метров таких систем описываются ограниченными много-гранниками. Поскольку число линейных неравенств в опи-сании этих многогранников может неограниченно возрас-тать с ростом числа измерений, основные усилия в этомподходе направлены на получение верхних по включениюмножественных оценок, имеющих описание ограниченнойсложности (параллелотопы, зонотопы, многогранники с за-данными направлениями граней, эллипсоиды и т.п.). Одна-ко до настоящего времени нет приложений этих исследо-ваний к адаптивному управлению со строгим математиче-ским обоснованием.В начале 1990-х гг. были получены фундаментальныерезультаты по устойчивости и робастному качеству системс неопределенностью и ограниченным внешним возмуще-нием [3]. Позднее были получены явные представлениядля асимптотических показателей качества таких систем,в том числе для систем слежения [4–7]. Теория робастногоуправления для таких систем получила название ℓ1-тео-рии, поскольку индуцированные нормы линейных стацио-нарных операторов на пространстве ограниченных после-довательностей ℓ∞ выражаются через ℓ1-нормы их им-пульсных характеристик. Полученные результаты позво-лили сформулировать общий метод синтеза адаптивногооптимального робастного управления, основанный на иде-ях множественного оценивания и использования показа-теля качества задачи управления как идентификацион-ного критерия [8]. Трудность применения метода заключа-ется в сложности онлайн минимизации невыпуклого в об-щем случае показателя качества на текущих оценках мно-жеств не сфальсифицированных измерениями неизвест-ных параметров. Однако такая минимизация оказываетсявозможной для специальных систем.В статье [9] решалась задача адаптивной оптимальнойстабилизации авторегрессионного объекта с неизвестны-ми параметрами номинального объекта, внешнего возму-щения и неопределенностей по выходу и управлению приспециальном дополнительном предположении о непред-намеренности неопределенности по управлению. Болеесложная по сравнению со стабилизацией задача опти-мального слежения решалась в работе [10] для объек-та с дробно-рациональной передаточной функцией безнеопределенности по управлению. Для указанных объ-ектов показатель качества задачи управления являетсядробно-линейной функцией неизвестных параметров, чтоделает возможной его онлайн минимизацию. В настоящейстатье более сложная задача адаптивного слежения рас-сматривается для авторегрессионного объекта с неизвест-ными параметрами номинального объекта и неизвестнымсмещением внешнего возмущения. Для обеспечения дроб-но-рационального вида показателя качества верхние гра-ницы внешнего несмещенного возмущения и коэффициен-ты усиления неопределенностей предполагаются извест-ными. Известно, что задача минимизации дробно-рацио-нальных функций при линейных ограничениях сводится клинейному программированию [11], что позволяет приме-нять современное программное обеспечение для синтезаадаптивного оптимального управления для рассматривае-мого объекта управления.Используемые обозначения:|φ| — евклидова норма вектора φ ∈ Rn;ℓe — линейное пространство вещественных последова-тельностей x = (. . . , x−2, x−1, x0, x1, x2, . . .),xts = (xs, xs+1, . . . , xt) для x ∈ ℓe;|xts| = maxs⩽k⩽t |xk|;ℓ∞ — нормированное пространство ограниченных веще-ственных последовательностей x = (x0, x1, x2, . . .)с нормой ∥x∥∞ = supt|xt|;∥x∥ss = lim supt→+∞ |xt|;ℓ1 — нормированное пространство абсолютно суммируе-мых последовательностей с нормой ∥x∥1 =P+∞k=0|xk|;∥G∥ =P+∞k=0|gk| = ∥g∥1 — индуцированная нормаустойчивой линейной стационарной системы G : ℓ∞ →ℓ∞ с передаточной функцией G(λ) =P+∞k=0 gkλk.1. Постановка задачиРассмотрим объект управления с дискретным време-нем, описываемый уравнениемa(q−1)yt = b1ut−1 + vt , t = 1, 2, 3, . . . , (1)где yt ∈ R— выход объекта в момент времени t, ut ∈ R—управление, vt ∈ R — суммарное возмущение в объекте,a(q−1) = 1 + a1q−1 + . . . + anq−nи q−1 — оператор сдвига назад (q−1yt = yt−1) на ли-нейном пространстве ℓe. Начальные значения y01−n =(y1−n, . . . , y0) произвольные, yk = 0 при k &lt; 1 − nи uk = 0 при k &lt; 0.Априорная информация об объекте управления состоитиз четырех априорных предположений АП1–АП4.АП1. Вектор коэффициентовξ := (a1, . . . , an, b1)T (2)номинальной модели (т.е. модели без суммарного возмуще-ния v) принадлежит известному ограниченному многогран-нику Ξ,ξ ∈ Ξ = { ˆξ | P ˆξ ⩾ p } ⊂ Rn+1 , (3)где P ∈ Rl×(n+m), p ∈ Rl и b1 ̸= 0 для любого ξ ∈ Ξ.АП2. Суммарное возмущение v имеет видvt = cw + δwwt + δyΔ1(y)t + δuΔ2(u)t , (4)Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ru11где w ∈ ℓ∞ — неизвестная последовательность,∥w∥∞ ⩽ 1 , (5)δw ⩾ 0 — верхняя граница несмещенного внешнего возму-щения δww, cw — смещение ограниченного внешнего воз-мущения cw+δww. ОператорыΔ1 : ℓe → ℓe иΔ2 : ℓe →ℓe удовлетворяют при всех t ограничениям|Δ1(y)t| ⩽ |yt−1t−μ|, |Δ2(u)t| ⩽ |ut−1t−μ| . (6)Параметры δy ⩾ и δu ⩾ 0 в (4) — верхние границы ин-дуцированных норм (коэффициентов усиления) оператор-ных возмущений (неопределенностей) Δ1 и Δ2 по выходуи управлению соответственно. Параметр μ в неравенствах(6) характеризует память неопределенностей. Она можетбыть выбрана конструктором сколь угодно большой, но небесконечной, без ущерба для качества синтезируемого ни-же адаптивного управления.АП3. Набор верхних границδ = (δw, δy, δu) (7)предполагается известным, вектор параметровθ = (ξT, cw)T ∈ Rn+2 (8)— неизвестным, и |cw| ⩽ Cw с известной верхней грани-цей Cw &gt; 0.Предположение об известной верхней границе Cwв АП3 используется только для упрощения доказательстви не ограничительно, поскольку Cw может быть выбраносколь угодно большим.В разделе 2 будет сформулировано дополнительноенеобходимое априорное предположение о робастной ста-билизируемости объекта (1).Априорное предположение АП2 сформулировано в тер-минах теории робастного управления в ℓ1 постановкедля удобства последующих ссылок. Согласно этой тео-рии, предположение АП2 для классов линейных нестаци-онарных или нелинейных операторов Δ1 и Δ2 может бытьпредставлено в следующем компактном виде:|vt − cw| ⩽ δw + δypyt + δuput, (9)гдеpyt = |yt−1t−μ|, put= |ut−1t−μ| . (10)Содержательная постановка рассматриваемой в ста-тье задачи заключается в построении причинной обратнойсвязи вида ut = Ut(yt1−n, ut−10 ) (но с конечной памятью),гарантирующей как можно меньшую верхнюю границу дляасимптотического показателя качестваJμ(θ, δ) = supvlim supt→+∞|yt − rt| , (11)где r — заданный командный сигнал, т.е. желаемая по-следовательность выходов объекта управления (1), и supберется на множестве возмущений v, удовлетворяющихпредположению АП2. То есть задача заключается в мини-мизации гарантированной асимптотической верхней гра-ницы для модуля ошибки слеженияet = yt − rt (12)в классе возмущений, удовлетворяющих неравенствам (9).Главная сложность сформулированной оптимальнойзадачи заключается в неидентифицируемости неизвест-ного вектора параметров θ.Строгая формулировка задачи приведена в конце раз-дела 2 после получения представления для неконсерва-тивной верхней оценки показателя качества Jμ.2. Оптимальная система с известной номи-нальной модельюДля объекта с известным вектором ξ параметров номи-нальной модели и при известном смещении cw регуляторut =1b1[(a(q−1) − 1)yt+1 + rt+1 − cw] (13)гарантирует при всех t равенстваyt+1 − rt+1 = vt+1 − cw == δwwt+1 + δyΔ1(y)t+1 + δuΔ2(u)t+1 . (14)Из непредсказуемости и произвольности значений правойчасти (14) в момент вычисления управления ut следует, чторегулятор (13) является оптимальным для показателя ка-чества (11). Введем обозначение для передаточной функ-ции от y к u регулятора (13) :Gξ(λ) =a(λ) − 1b1λ=1b1Xnk=1ak λk−1 ,благодаря чему регулятор (13) принимает видut = Gξ(q−1)yt + rt+1/b1 − cw/b1 , (15)и∥Gξ∥ =1|b1|Xnk=1|ak| . (16)Определение 1. Замкнутая система (1), (13) называетсяробастно устойчивой в классе возмущений (4), если значе-ние показателя качества (11) конечно.Определение 2. Будем говорить, что последователь-ность |r| равномерно часто попадает в окрестности верх-него предела ∥r∥ss, если для любого ε &gt; 0 существуютT &gt; 0 и возрастающая последовательность (t1, t2, . . .)такие, что∀j ∈ N 0 &lt; tj+1 − tj ⩽ T ∧ |rtj+1| ⩾ ∥r∥ss − ε .Качество оптимальной системы (1), (13) представленов теореме 1.Теорема 1. Для замкнутой системы (1), (13) справедливыследующие утверждения.1. Система робастно устойчива при μ = +∞ тогдаи только тогда, когдаδy + δu∥Gξ∥ &lt; 1 . (17)12Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ruДля системы с нулевыми начальными данными y01−nJ+∞(θ, δ) =δw + δy∥r∥ss +δu|b1| (|cw| + ∥r∥ss)1 − δy − δu∥Gξ∥ .(18)2. Для системы с любыми начальными данными y01−nJμ(θ, δ) ⩽ J+∞(θ, δ)для любой памяти μ &gt; 0. Если в любую окрестность верх-него предела ∥r∥ss последовательность |r| попадает рав-номерно часто, то при любых начальных данныхJμ(θ, δ) ↗ J+∞(θ, δ) =: J(θ, δ) , (19)где знак ↗ означает монотонную сходимость снизу приμ → +∞.Доказательство теоремы 1. Для доказательства теоре-мы представим замкнутую систему (1), (13) в стандартнойM − Δ форме, изображенной на рис. 1 и описываемойуравнениямиez= M0@fwξ1A , ξ = Δz , (20)где e — ошибка слежения (12), z и ξ — соответственно входи выход структурированной неопределенности Δ,zt =ytut, ξ =Δ1 00 Δ2z =Δ1(y)Δ2(u),f — фиксированный входной сигнал, включающий отсле-живаемый сигнал r и постоянный сигнал, равный 1 :f =r1, 1 := (1, 1, . . .) ∈ ℓ∞ .Рисунок 1.M − Δ форма системы (1), (13).Figure 1. M − Δ form of system (1), (13)Матрицу M в (20) представим в блочной форме, соот-ветствующей входным и выходным сигналам на рис. 1:M =Mef Mew MeξMzr Mzw Mzξ. (21)Для системы (1), (13) эта блочная форма имеет видM =0B@0 0 δw δy δu1 0 δw δy δuqb1−cwb1δwGξ δyGξ δuGξ1CA, (22)где q — оператор сдвига вперед (qrt = rt+1). Первая стро-ка матрицы M в (22) соответствует правой части равен-ства (14), а вторая строка получается переносом rt в пра-вую часть этого равенства. Третья строкаM соответствуетпредставлению оптимального регулятора в виде (15).Необходимое и достаточное условие робастной устой-чивости (17) следует из теоремы 7 в [6], примененной к си-стеме (1), (13).Для доказательства представления (18) для показателякачества J+∞(θ, δ) достаточно применить теоремы 5 и 6из статьи [6] (или теоремы 2.18 и 2.22 работы [7]). Введемобозначение[A]1 :=0B@∥A11∥1 · · · ∥A1q∥1 .........∥Ap1∥1 · · · ∥Apq∥11CAдля произвольной p × q матрицы A импульсных откликовAij ∈ ℓ1. Для блочной матрицыM из (21) положимMss(f) :=[Mef f]ss + [Mew]1 [Meξ]1[Mzf r]ss + [Mzw]1 [Mzξ]1.Согласно теореме 5 из [6],J+∞(θ, δ) = [Merr]ss + [Mew]1+ (23)+ [Myξ]1(I − [Mzξ]1)−1([Mzrr]ss + [Mzw]1) .Для рассматриваемой системы с матрицей (22) матрицаMss(f) принимает вид0@δw δy δu∥r∥ss + |δw| δy δu(∥r∥ss + |cw|)/b1 + δw∥Gξ∥ δy∥Gξ∥ δu∥Gξ∥1A.(24)Применив формулу (23) к матрице (24), получаемJ(θ, δ) ==δw + (δy δu)I −δy δuδy∥Gξ∥ δu∥Gξ∥−1××∥rss∥ + δw(∥r∥ss + |cw|)/b1 + δw∥Gξ∥==δw +11 − δy − δu∥Gξ∥ (δy δu)××1 − δu∥Gξ∥ δuδy∥Gξ∥ 1 − δy××∥rss∥ + δw(∥r∥ss + |cw|)/b1 + δw∥Gξ∥.Учитывая, что(δy δu)1 − δu∥Gξ∥ δuδy∥Gξ∥ 1 − δy= (δy δu) ,получаем представление (18)J(θ, δ) = δw +11 − δy − δu∥Gξ∥×× (δy δu)∥rss∥ + δw(∥r∥ss + |cw|)/b1 + δw∥Gξ∥==δw + δy∥r∥ss + δu∥r∥ss/|b1| + δu|cw/b1|)1 − δy − δu∥Gξ∥ .(25)Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ru13Неравенство Jμ(θ, δ) ⩽ J+∞(θ, δ) во втором утвер-ждении теоремы 1 очевидно следует из того, что множествооператорных возмущений с ограниченной памятью μ явля-ется подмножеством операторных возмущений с бесконеч-ной памятью. Монотонность последовательности Jμ(θ, δ)относительно μ следует из строгого возрастания по μ мно-жеств допустимых операторных возмущений. Наконец, схо-димость Jμ(θ, δ) к J(θ, δ) гарантируется теоремой 6 из [6].Теорема 1 доказана.Последнее априорное предположение АП4 об управля-емом объекте диктуется условием робастной стабилизиру-емости (17).АП4. Неизвестный вектор параметров θ удовлетворяетнеравенствуδy + δu∥Gξ∥ ⩽ ¯δ &lt; 1 (26)с известным числом ¯δ.Число ¯δ &gt; 0 может быть сколь угодно близким к1 и выбирается конструктором на основе априорной ин-формации или вовсе без нее и исключает из рассмотре-ния неприемлемые для практических приложений модели,слишком близкие к границе области робастно стабилизи-руемых объектов.Задача. Требуется построить обратную связь вида ut =Ut(yt1−n, ut−10 ), имеющую конечную память и гарантиру-ющую выполнение с заданной точностью неравенстваlim supt→+∞|yt − rt| ⩽ J(θ, δ) (27)при справедливости априорных предположений АП1–АП4.Главная сложность задачи заключается в неидентифи-цируемости вектора коэффициентов ξ номинальной моде-ли и смещения cw, необходимых для использования опти-мального регулятора (13).3. Субоптимальное слежениеРешение поставленной задачи базируется на опти-мальном оценивании, в котором показатель качества за-дачи управления используется как идентификационныйкритерий и минимизируется на текущих оценках множе-ства неизвестных параметров, согласованных с даннымиизмерений. Вычисление множественных оценок основанона следующем простом утверждении.Лемма 1. Если для некоторой оценкиˆθ = (ˆξT , ˆcw)T , ˆξ = (ˆa1, . . . , ˆan,ˆb1)T ∈ Ξнеизвестного вектора θ при всех t справедливы неравен-ства|ˆa(q−1)yt − ˆb1ut−1 − ˆcw| ⩽ δw + δypyt + δuput, (28)то объект управления (1) с вектором параметров ˆθ удовле-творяет уравнению (1) и априорным предположениям АП1,АП2 при всех t.Лемма 1 является частным случаем Леммы 1 работы [9],в которой дополнительно предполагаются неизвестнымипараметры δw, δy, δu.Из Леммы 1 следует, что при любом управлении объек-том (1) полная информация о векторе неизвестных пара-метров θ к моменту времени t имеет вид включенияθ ∈ St = { ˆθ ∈ Θ0|ˆa(q−1)yk −ˆb1uk−1 − ˆcw| ⩽⩽ δw + δypyk + δupuk∀k ⩽ t } ,гдеΘ0 = { ˆθ = (ˆξT , ˆcw)Tˆξ ∈ Ξ , |cw| ⩽ Cw,ˆδy + ˆδu∥Gˆξ∥ ⩽ ¯δ } (29)— априорное множество допустимых параметров θ.Заметим, что никаким ограниченным управлениемнельзя обеспечить сходимости множеств St к множествус одним элементом θ, поскольку априорные верхние гра-ницы δw, δy, δu, как правило, являются неточными, и кон-кретные реализации всех возмущений даже при точныхверхних границах только в исключительных случаях неод-нократно и одновременно принимают значения, соответ-ствующие их верхним границам. Это означает, что векторнеизвестных параметров θ не идентифицируем с помощьюограниченного управления.Метод рекуррентных целевых неравенств синтезаадаптивного управления заключается в построении схо-дящейся последовательности оценок θt → θ∞ при t →+∞, достаточно точно удовлетворяющих целевым нера-венствам (28) при всех достаточно больших t. В отличие отзадач адаптивной стабилизации, этого недостаточно длярешения поставленной оптимальной задачи. Действитель-но, если θt → θ∞ и выполнены целевые неравенства, тов силу теоремы 1 и непрерывности функции J(θ, δ) следу-ет неравенствоlim supt→+∞|yt| ⩽ J(θ∞, δ) .Однако для решения поставленной оптимальной зада-чи этого неравенства недостаточно и необходимо гаранти-ровать выполнение с заданной точностью дополнительно-го неравенстваJ(θ∞, δ) ⩽ J(θ, δ) (30)с неизвестным и не идентифицируемым вектором θ. Из это-го следует необходимость использования показателя ка-чества J(θ, δ) задачи управления в роли идентификаци-онного критерия, т.е. использования оптимального оцени-вания видаθt = argminˆθ∈StJ(ˆθ) . (31)Непосредственное использование оптимальной иден-тификации (31) в режиме онлайн невозможно, ввиду воз-можного неограниченного роста числа целевых нера-венств в описании множеств St. Для преодоления этойтрудности будут использованы верхние по включениюоценки множеств St с ограниченным числом обновленийза счет введения мертвой зоны при обновлении оценок.Выберем число ε &gt; 0 в качестве параметра мертвойзоны, при этом точность решения поставленной оптималь-ной задачи слежения будет пропорциональна ε. В каждый14Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ruмомент времени t будут вычисляться векторные оценкиθt = (ξTt , cwt)T , ξt = (at1, . . . , atn, bt1)и множественные оценки Θt неизвестного вектора ξ.Адаптивный регулятор. Управление ut в момент t опре-деляется адаптивным регуляторомut =1bt1(at1yt + . . . + atnyt−n+1 + rt+1 − cwt) . (32)Выберем в качестве начальной множественной оценкимножество Θ0, определенное в (29), а качестве начальнойвекторной оценкиθ0 = argminˆθ∈Θ0J(ˆθ, δ) .Введем следующие обозначения. После подачи управле-ния ut в момент времени t и измерения выхода yt+1 в мо-мент t + 1 положимφTt= (−yt,−yt−1, . . . ,−yt−n+1, ut),ηt+1 = sign(yt+1 − φTtξt − cwt) ,ψt+1 = (ηt+1φTt, ηt+1)T ,ht+1 = δw + δypyt+1 + δuput+1 .Заметим, что значения всех введенных переменных вы-числяются по данным измерений, доступных к моментуt + 1. Во введенных обозначениях целевое неравенство(28) в момент t + 1 для текущей оценки θt принимает вид|yt+1 − φTtξt − cwt| == ηt+1yt+1 − ψTt+1θt ⩽ ηt+1ht+1 ,что эквивалентноψTt+1θt ⩾ ηt+1(yt+1 − ht+1) . (33)Алгоритм обновления векторных оценок θt и множе-ственных оценок Θt имеет следующий вид:θt+1 = θt , Θt+1 = Θt , (34)если ψTt+1θt ⩾ ηt+1(yt+1 − ht+1) − ε|ψt+1| . (35)В противном случае положимΘt+1 = Θt ∩ Ωt+1 , (36)Ωt+1 = { ˆθψTt+1ˆθ ⩾ ηt+1(yt+1 − ht+1 } , (37)θt+1 = argminˆθ∈Θt+1J(ˆθ, δ) . (38)Алгоритм оптимального оценивания (34)–(38) имеетпростую геометрическую интерпретацию. Каждое целевоенеравенство (28) представляет собой полоску в Rn+1, за-данную парой линейных неравенств относительно векто-ра ˆθ. Только одно из этих неравенств, именно неравенство(33), может нарушаться для вектора θt. Неравенство в (35)означает, что евклидово расстояние от вектора θt до по-лупространства Ωt+1, определенного в (37), не больше ε,и тогда, согласно (34), векторная оценка θt и множествен-ная оценкаΘt не обновляются. В противном случае желае-мое неравенство (37) добавляется к списку неравенств, за-дающих множественную оценку Θt, образуя обновленнуюоценку Θt+1. При этом некоторые неравенства из старо-го списка могут оказаться лишними. Один из эффективныхалгоритмов удаления лишних неравенств описан в рабо-те [12].Замечание 1. Введение мертвой зоны с параметром εгарантирует ограниченность числа возможных обновленийоценок θt и Θt и тем самым сходимость оценок за конеч-ное время. Формула (38) вычисления оптимальной оценкиθt+1 является главной в задаче синтеза адаптивного оп-тимального управления в условиях неидентифицируемо-сти вектора параметров θ. Она обеспечивает выполнениетребуемого неравенства (30) с заданной точностью, про-порциональной параметру мертвой зоны ε.Субоптимальность адаптивного регулятора (32) уста-навливается следующей теоремой.Теорема 2. Пусть выполнены априорные предположе-ния А1-А4, и параметр мертвой зоны ε в (35) выбран из ин-тервала0 &lt; ε &lt;1 − ¯ √ δn + Gu, Gu = maxξ∈Ξ∥Gξ∥ .Тогда для замкнутой системы управления, включающейобъект (1), адаптивный регулятор (32) и алгоритм оценива-ния (34)–(38) справедливы утверждения:1) Множественные оценки Θt и векторные оценки θtсходятся к своим предельным значениям Θ∞ и θ∞ за ко-нечное время иJ(θ∞, δ) ⩽ J(θ, δ) , (39)2)lim supt→+∞|yt| ⩽ J(θ∞, δ) + O(ε) , (40)где O(ε) → 0 при ε → 0.Доказательство Теоремы 2 аналогично доказательствуТеоремы 2 в статье [10]. Приведем его краткую схему. Со-гласно данной выше геометрической интерпретации ал-горитма оценивания, при нарушениях неравенства (35) измножественных оценок Θt заведомо удаляются шары ра-диуса ε с центрами θt и в описание Θt+1 добавляютсянеравенства из (37). В результате этого шары радиуса ε/2с центрами θt не пересекаются. В силу оптимизации (38)J(θt, δ) ⩽ J(θ, δ)при всех t, так что оценки θt остаются в ограниченном мно-жестве в Rn+2 . Поэтому число исключаемых из оценокΘt не пересекающихся шаров радиуса ε/2 конечно ввидуограниченности множества векторов ˆθ, удовлетворяющихнеравенству J(ˆθt, δ) ⩽ J(θ, δ). Следовательно конечнои число возможных обновлений оценок Θt и θt.Для доказательства неравенства (40) заметим, что по-сле сходимости θt к θ∞ за конечное время для оценки θ∞выполняются неравенства (35). Нетрудно показать, чтоε|ψt+1| ⩽ ε(√n pyt+1 + put+1 + 1) . (41)Из (41) и (35) теперь следует, что для оценки θ∞ выполня-ются неравенства (28) с правой частьюδw + ε + (δy + ε√n)pyt + (δu + ε)put, (42)Известия Коми научного центра Уральского отделения Российской академии наук № 4 (62), 2023Серия «Физико-математические науки»www.izvestia.komisc.ru15которой соответствует набор верхних границ возмущенийδε = (δw + ε, δy + ε√n, δu + ε) .Тогда в силу Леммы 1 выход yt можно считать выходом объ-екта (1) с вектором параметров θ∞ = (ξT∞, cw∞)T , наборомверхних границ δε и управляемого соответствующим оцен-ке θ∞ оптимальным регулятором. Далее по Теореме 1lim supt→+∞|yt − rt| ⩽ Jθ∞, δε) . (43)Остается заметить, что J(θ∞, δε) = Jθ∞, δ)+O(ε). Ана-логично [10] можно вычислить постояннуюK, представля-ющую величину O(ε) в прямой форме Kε.Замечание 2. Показатель качества J(θ, δ), определен-ный в (18), запишем, используя (16), в видеJ(θ, δ) =(δw + δy∥r∥ss)|b1| + δu∥r∥ss + δu|cw|)(1 − δy)|b1| − δuPnk=1|ak| .(44)Нетрудно заметить, что этот показатель является дроб-но-линейной функцией оцениваемого вектора θ (для этогокаждую абсолютную величину |x| следует записать в видеx = x+ − x−, где x+ ⩾ 0, x− ⩾ 0. Из этого следует,что оптимизация (38) представляет собой задачу дробно-линейного программирования при линейных ограничениях.Эта задача стандартным образом сводится к задаче ли-нейного программирования [11], для решения которой име-ется высокоэффективное современное программное обес-печение. В статье [10] приведены примеры численного мо-делирования, иллюстрирующие эффективность алгорит-мов множественного оценивания для объектов управленияс девятью неизвестными параметрами. Заметим, что он-лайн уменьшение параметра ε для повышения гарантиро-ванной точности решения оптимальной задачи (38) влечетрост числа возможных обновлений оценок и числа нера-венств в описании множественных оценок Θt, т.е. к повы-шению вычислительной сложности оптимальной задачи.Замечание 3. Главное достоинство рассмотренногоадаптивного управления заключается в обеспечении оп-тимальной с заданной точностью асимптотической верх-ней оценки показателя качества для любого допустимо-го и не идентифицируемого вектора θ. Главный же недо-статок заключается в единой области допустимых значе-ний коэффициентов усиления неопределенностей δy и δuв виде неравенства (26). В то же время эта единая (универ-сальная) для всех допустимых θ область является скольугодно близкой к оптимальной универсальной области засчет выбора достаточно близкого к единице параметра ¯δ.Традиционные алгоритмы оценивания на базе градиентно-го алгоритма или метода наименьших квадратов не тольконе могли гарантировать никакой оптимальности адаптив-ного управления, но и допускали только достаточно ма-лые области робастной устойчивости, поскольку обосно-вывались с помощью метода функций Ляпунова, вносив-шего значительный консерватизм в результаты по устой-чивости по сравнению с ℓ1-теорией робастного управле-ния. Это проявлялось, в частности, и в том, что в тради-ционном робастном адаптивном управлении вместо струк-турированной неопределенности по выходу и управлениюрассматривалась неструктурированная неопределенностьδ = max(δy, δu), вносившая дополнительный консерва-тизм. Для такой неструктурированной неопределенностинаиболее продвинутый результат на основе градиентно-го алгоритма оценивания был получен в статье [13] именнов контексте ℓ1-теории при центрированном внешнем воз-мущении (т.е. при cw = 0) для авторегрессионного объектас запаздыванием в управлении.ЗаключениеТрадиционные алгоритмы оценивания неизвестных па-раметров объекта управления с детерминированными воз-мущениями представляют собой модификации градиент-ного алгоритма или алгоритма метода наименьших квадра-тов и не могут гарантировать оптимальности адаптивно-го управления. Более сложные алгоритмы множественно-го оценивания открывают возможности синтеза адаптив-ного оптимального управления при использовании пока-зателя качества задачи управления как идентификацион-ного критерия. В данной работе рассмотрена задача оп-тимального робастного слежения для авторегрессионногообъекта с неизвестной номинальной моделью и неизвест-ным смещением ограниченного внешнего возмущения, нос известными коэффициентами усиления неопределенно-стей по выходу и управлению и известной верхней грани-цей несмещенного внешнего возмущения. Благодаря дроб-но-линейному виду показателя качества в виде асимпто-тически наихудшего возможного отклонения выхода объ-екта от отслеживаемого сигнала, вычисление текущих оп-тимальных оценок сводится к линейному программирова-нию и реализуемо в режиме онлайн по крайней мере дляобъектов невысокого порядка.</p>
 </body>
 <back>
  <ref-list>
   <ref id="B1">
    <label>1.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Rohrs, C.E. Robustness of continuous-time adaptive control algorithms in the presence of unmodeled dynamics / C.E. Rohrs, L. Valavani, M. Athans, G. Stein // IEEE Transactions on Automatic Control. - 1985. - Vol. 30. - № 9. - P. 881-889.</mixed-citation>
     <mixed-citation xml:lang="en">Rohrs, C.E. Robustness of continuous-time adaptive control algorithms in the presence of unmodeled dynamics / C.E. Rohrs, L. Valavani, M. Athans, G. Stein // IEEE Transactions on Automatic Control. - 1985. - Vol. 30. - № 9. - P. 881-889.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B2">
    <label>2.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Zhou, K. Essentials of robust control / K. Zhou, G.C. Doyle // Prentice Hall, 1998. - 430 p.</mixed-citation>
     <mixed-citation xml:lang="en">Zhou, K. Essentials of robust control / K. Zhou, G.C. Doyle // Prentice Hall, 1998. - 430 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B3">
    <label>3.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Khammash, M. Performance robustness of discrete-time systems with structured uncertainty / M. Khammash, J. Pearson // IEEE Transactions on Automatic Control. -1991. - Vol. 36, № 4. - P. 398-412.</mixed-citation>
     <mixed-citation xml:lang="en">Khammash, M. Performance robustness of discrete-time systems with structured uncertainty / M. Khammash, J. Pearson // IEEE Transactions on Automatic Control. -1991. - Vol. 36, № 4. - P. 398-412.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B4">
    <label>4.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Khammash, M. Robust steady-state tracking / M. Khammash // IEEE Transactions on Automatic Control. - 1995. - Vol. 40, № 11. - P. 1872-1880.</mixed-citation>
     <mixed-citation xml:lang="en">Khammash, M. Robust steady-state tracking / M. Khammash // IEEE Transactions on Automatic Control. - 1995. - Vol. 40, № 11. - P. 1872-1880.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B5">
    <label>5.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Khammash, M. Robust performance: unknown disturbances and known fixed inputs / M. Khammash // IEEE Transactions on Automatic Control. - 1997. - Vol. 42, № 12. - P. 1730-1734.</mixed-citation>
     <mixed-citation xml:lang="en">Khammash, M. Robust performance: unknown disturbances and known fixed inputs / M. Khammash // IEEE Transactions on Automatic Control. - 1997. - Vol. 42, № 12. - P. 1730-1734.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B6">
    <label>6.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Sokolov, V.F. ℓ1 robust performance of discrete-time systems with structured uncertainty / V.F. Sokolov // Syst. Control Lett. - 2001. - Vol. 42, № 5. - P. 363-377.</mixed-citation>
     <mixed-citation xml:lang="en">Sokolov, V.F. ℓ1 robust performance of discrete-time systems with structured uncertainty / V.F. Sokolov // Syst. Control Lett. - 2001. - Vol. 42, № 5. - P. 363-377.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B7">
    <label>7.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Соколов, В.Ф. Робастное управление при ограниченных возмущениях / В.Ф. Соколов. - Сыктывкар: Коми научный центр УрО РАН, 2011. - 218 с.</mixed-citation>
     <mixed-citation xml:lang="en">Sokolov, V.F. Robastnoe upravlenie pri ogranichennyh vozmuscheniyah / V.F. Sokolov. - Syktyvkar: Komi nauchnyy centr UrO RAN, 2011. - 218 s.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B8">
    <label>8.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Sokolov, V.F. Adaptive ℓ1 robust control for SISO system / V.F. Sokolov // Systems and Control Letters. - 2001. - Vol. 42, № 5. - P. 379-393.</mixed-citation>
     <mixed-citation xml:lang="en">Sokolov, V.F. Adaptive ℓ1 robust control for SISO system / V.F. Sokolov // Systems and Control Letters. - 2001. - Vol. 42, № 5. - P. 379-393.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B9">
    <label>9.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Соколов, В.Ф. Адаптивная оптимальная робастная ста- билизация авторегрессионного объекта со смещенным внешним возмущением / В.Ф. Соколов // Известия Коми научного центра Уральского отделения Российской академии наук. Серия «Физико-математические науки». - 2022. - № 5 (57). - С. 20-27.</mixed-citation>
     <mixed-citation xml:lang="en">Sokolov, V.F. Adaptivnaya optimal'naya robastnaya sta- bilizaciya avtoregressionnogo ob'ekta so smeschennym vneshnim vozmuscheniem / V.F. Sokolov // Izvestiya Komi nauchnogo centra Ural'skogo otdeleniya Rossiyskoy akademii nauk. Seriya «Fiziko-matematicheskie nauki». - 2022. - № 5 (57). - S. 20-27.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B10">
    <label>10.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Соколов, В.Ф. Адаптивное оптимальное слежение для дискретного минимально-фазового объекта с неопределенностью в канале выхода / В.Ф. Соколов // Авто матика и телемеханика. - 2021. - № 8. - C. 108-128.</mixed-citation>
     <mixed-citation xml:lang="en">Sokolov, V.F. Adaptivnoe optimal'noe slezhenie dlya diskretnogo minimal'no-fazovogo ob'ekta s neopredelennost'yu v kanale vyhoda / V.F. Sokolov // Avto matika i telemehanika. - 2021. - № 8. - C. 108-128.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B11">
    <label>11.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Boyd, S. Convex optimization / S. Boyd, L. Vandenberghe. - New York: Cambridge University Press, 2004. - 742 p.</mixed-citation>
     <mixed-citation xml:lang="en">Boyd, S. Convex optimization / S. Boyd, L. Vandenberghe. - New York: Cambridge University Press, 2004. - 742 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B12">
    <label>12.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Walter, E. Exact recursive polyhedral description of the feasible parameter set for bounded error / E. Walter,  H. Piet-Lahanier // IEEE Transactions on Automatic Control. 1989. - Vol. 34, № 8. - P. 911-915.</mixed-citation>
     <mixed-citation xml:lang="en">Walter, E. Exact recursive polyhedral description of the feasible parameter set for bounded error / E. Walter,  H. Piet-Lahanier // IEEE Transactions on Automatic Control. 1989. - Vol. 34, № 8. - P. 911-915.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B13">
    <label>13.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Weyer, E. Limitations of robust adaptive pole placement control / E. Weyer, I. Mareels, J. Polderman // IEEE Transactions on Automatic Control. - 1994.- Vol. 39, № 8. - P. 1665-1671.</mixed-citation>
     <mixed-citation xml:lang="en">Weyer, E. Limitations of robust adaptive pole placement control / E. Weyer, I. Mareels, J. Polderman // IEEE Transactions on Automatic Control. - 1994.- Vol. 39, № 8. - P. 1665-1671.</mixed-citation>
    </citation-alternatives>
   </ref>
  </ref-list>
 </back>
</article>
