<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Proceedings of the Komi Science Centre of the Ural Division of the Russian Academy of Sciences</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Proceedings of the Komi Science Centre of the Ural Division of the Russian Academy of Sciences</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Известия Коми научного центра УрО РАН</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">1994-5655</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">55725</article-id>
   <article-id pub-id-type="doi">10.19110/1994-5655-2022-5-20-27</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Без рубрики</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>Without rubric</subject>
    </subj-group>
    <subj-group>
     <subject>Без рубрики</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">Adaptive optimal robust stabilization of autoregressive plant under biased external disturbance</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Адаптивная оптимальная робастная стабилизация авторегрессионного объекта со смещенным внешним возмущением</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Соколов</surname>
       <given-names>В. Ф.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Sokolov</surname>
       <given-names>V. F.</given-names>
      </name>
     </name-alternatives>
    </contrib>
   </contrib-group>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2022-12-20T11:01:21+03:00">
    <day>20</day>
    <month>12</month>
    <year>2022</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2022-12-20T11:01:21+03:00">
    <day>20</day>
    <month>12</month>
    <year>2022</year>
   </pub-date>
   <issue>5</issue>
   <fpage>20</fpage>
   <lpage>27</lpage>
   <history>
    <date date-type="received" iso-8601-date="2022-09-14T00:00:00+03:00">
     <day>14</day>
     <month>09</month>
     <year>2022</year>
    </date>
   </history>
   <self-uri xlink:href="https://komisc.editorum.ru/en/nauka/article/55725/view">https://komisc.editorum.ru/en/nauka/article/55725/view</self-uri>
   <abstract xml:lang="ru">
    <p>В статье рассматривается задача адаптивного оптималь-&#13;
ного робастного управления дискретным объектом с неиз-&#13;
вестными параметрами авторегрессионной номинальной&#13;
модели, неизвестными верхней границей и смещением&#13;
внешнего возмущения и неизвестными коэффициентами&#13;
усиления возмущений по выходу и управлению. Показа-&#13;
телем качества управления служит наихудшая установив-&#13;
шаяся верхняя граница выхода. Решение задачи основа-&#13;
но на оптимальном полиэдральном оценивании неизвест-&#13;
ных неидентифицируемых параметров, где идентифика-&#13;
ционным критерием является показатель качества управ-&#13;
ления. Предложена замена неизвестных параметров, мо-&#13;
дифицирующая модель объекта в модель без возмущения&#13;
по управлению. Эта замена преобразует невыпуклый пока-&#13;
затель качества в дробно-линейный и делает возможным&#13;
онлайн вычисление текущих оптимальных оценок.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>This paper addresses the problem of adaptive optimal robust&#13;
control of a discrete-time plant with unknown parameters&#13;
of autoregressive nominal model, unknown upper bound and&#13;
bias of external disturbance, and unknown gains of coprime&#13;
factor perturbations. The control criterion is the worst-case&#13;
steady-state upper bound of the output. Solution of the problem&#13;
is based on an optimal polyhedral estimation of unknown&#13;
non-identifiable parameters with the control criterion treated&#13;
as the identification criterion. A replacement of unknown parameters&#13;
is proposed that modifies the plant model to a model&#13;
without perturbation in control. This transforms the nonconvex&#13;
control criterion to a linear fractional one and thus makes&#13;
possible online computation of optimal estimates.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>адаптивное управление</kwd>
    <kwd>оптимальное управление</kwd>
    <kwd>робаст- ное управление</kwd>
    <kwd>неопределенность</kwd>
    <kwd>ограниченное возму- щение</kwd>
    <kwd>множественное оценивание</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>adaptive control</kwd>
    <kwd>optimal control</kwd>
    <kwd>robust control</kwd>
    <kwd>uncertainty</kwd>
    <kwd>bounded disturbance</kwd>
    <kwd>set-membership estimation</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p>ВведениеПредметом математической теории адаптивного управ-ления, зародившейся в начале 1960-х гг., на первом этапебыли задачи управления линейными стационарными объ-ектами управления с неизвестными параметрами переда-точной функции и внешними возмущениями. Для систем сослучайными возмущениями фундаментальные результатыпо синтезу адаптивного оптимального управления на осно-ве онлайн оценивания неизвестных параметров были по-лучены уже к концу 1970-х гг. на основе градиентных алго-ритмов [1, 2] и к началу 1990-х гг. — на основе метода наи-меньших квадратов [3,4]. Градиентные алгоритмы оценива-ния широко использовались и в задачах адаптивной ста-билизации систем с ограниченными детерминированнымивнешними возмущениями. В начале 1980-х гг. в знамени-тых статьях [5,6] было показано, что известные к тому вре-мени алгоритмы адаптивного управления не гарантируютустойчивости адаптивных систем при наличии даже малыхдетерминированных внешних возмущений или немодели-руемой динамики. Это стимулировало разработку в после-дующие два десятилетия теории робастного адаптивногоуправления, в которой рассматривались задачи стабили-зации адаптивных систем. Результаты теории в основномбазировались на применении функций Ляпунова [7,8] и от-носились к системам с достаточно малой немоделируемойдинамикой. Параллельно в эти же годы активно разраба-тывалась теория робастного управления в H∞ постанов-20Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ruке [9]. Однако результаты данной теории трудно исполь-зовать в задачах адаптивного управления, и исследова-ния возможностей применения H∞-подхода хотя бы дляидентификации систем продолжаются до настоящего вре-мени.В настоящей статье для относительно простого дис-кретного объекта с авторегрессионной номинальной моде-лью, ограниченным и смещенным внешним возмущениеми операторными возмущениями (неопределенностями) повыходу и управлению рассматривается существенно бо-лее сложная по сравнению с адаптивной стабилизаци-ей задача адаптивного оптимального робастного управ-ления. Предполагаются неизвестными параметры номи-нальной модели, верхняя граница и смещение внешнеговозмущения, а также коэффициенты усиления неопреде-ленностей. Цель управления заключается в минимизацииверхнего предела модуля выхода объекта в классе ука-занных возмущений. Решение задачи базируется на ре-зультатах теории робастного управления в ℓ1-постанов-ке, основы которой были заложены в [10–12]. Их развитиедля задач адаптивного управления изложено в [13]. Реше-ние оптимальной задачи в условиях неидентифицируемо-сти управляемого объекта оказывается теоретически воз-можным при использовании показателя качества управ-ления как идентификационного критерия и множествен-ного онлайн оценивания неизвестных параметров [14]. Од-нако в общем случае показатель качества является невы-пуклой функцией оцениваемых неизвестных параметров, исоответствующее оптимальное оценивание затруднитель-но в онлайн режиме. Для рассматриваемого в статье объ-екта управления предлагается замена неизвестных пара-метров, позволяющая свести модель объекта к модели снеопределенностью только по выходу, для которой пока-затель качества становится дробно-линейной функциейнеизвестных параметров, и оптимальное оценивание сво-дится к задаче линейного программирования. Оптималь-ность предлагаемого адаптивного управления доказанапри дополнительном техническом предположении о дина-мике замкнутой системы. В отличие от всех традиционныхалгоритмов адаптивного управления предлагаемое в ста-тье решение оптимальной задачи обеспечивает верифи-кацию настроенной оптимальной модели благодаря при-менению метода рекуррентных целевых неравенств [15] ииспользованию полиэдральных оценок неизвестных пара-метров.Мы будем придерживаться следующих обозначений:|φ| — евклидова норма вектора φ ∈ Rn;ℓe — пространство вещественных последовательностейx = (· · · , x−2, x−1, x0, x1, x2, · · · ),xts = (xs, xs+1, . . . , xt) для x ∈ ℓe;|xts| = maxs⩽k⩽t |xk|;ℓ∞ — нормированное пространство ограниченных веще-ственных последовательностей x = (x0, x1, x2, . . .) снормой ∥x∥ = supt|xt|;∥x∥ss = lim supt→+∞ |xt|;ℓ1 — нормированное пространство абсолютно суммируе-мых последовательностей с нормой ∥x∥1 =P+∞k=0|xk|;∥G∥ =P+∞k=0|gk| = ∥g∥1 — индуцированная нормаустойчивой линейной стационарной системы G : ℓ∞ →ℓ∞ с передаточной функцией G(λ) =P+∞k=0 gkλk.1. Постановка задачиПусть объект управления с дискретным временем опи-сывается моделью видаa(q−1)yt = b1ut−1 + vt , t = 1, 2, 3, . . . , (1)где yt ∈ R— выход объекта в момент времени t, ut ∈ R—управление, vt ∈ R — суммарное возмущение в объекте,a(q−1) = 1 + a1q−1 + . . . + anq−nи q−1 — оператор сдвига назад (q−1yt = yt−1) на ли-нейном пространстве ℓe. Начальные значения y01−n =(y1−n, . . . , y0) произвольные, yk = 0 при k &lt; 1 − nи uk = 0 при k &lt; 0.Модель (1) без возмущения (т.е. при v = 0 ∈ ℓe) назы-вается номинальной моделью объекта (1). Она характери-зуется вектором параметровξ := (a1, . . . , an, b1)T .Априорная информация об объекте (1) состоит из несколь-ких априорных предположений.Предположение 1. Вектор параметров ξ неизвестен ипринадлежит известному ограниченному многогранникуξ ∈ Ξ = { ˆξ | P ˆξ ⩾ p } ⊂ Rn+1 , (2)где P ∈ Rl×(n+m), p ∈ Rl и b1 ̸= 0 для любого ξ ∈ Ξ.Предположение 2. Суммарное возмущение v имеет видvt = cw + δwwt + δyΔ1(y)t + δuΔ2(u)t , (3)где w ∈ ℓ∞ — неизвестное нормализованное (∥w∥∞ ⩽1) внешнее возмущение, δw ⩾ 0 — неизвестная нор-ма (верхняя граница) внешнего несмещенного возмущенияи cw — неизвестное смещение суммарного ограниченноговнешнего возмущения, ограниченное по модулю известнойпостоянной Cw:|cw| ⩽ Cw .Операторы Δ1 и Δ2 в (3) на пространстве последователь-ностей ℓe удовлетворяют при всех t ограничениям|Δ1(y)t| ⩽ pyt := |yt−1t−μ|,|Δ2(u)t| ⩽ put:= |ut−1t−μ|, (4)с неизвестными коэффициентами δy ⩾ 0 и δu ⩾ 0.Операторы Δ1 и Δ2 называются операторными возму-щениями (или неопределенностями) по выходу и управле-нию соответственно и описывают линейные нестационар-ные или нелинейные строго причинные операторы, имею-щие известную ограниченную память μ и нормированныена подпространстве ℓ∞ (т.е. их коэффициенты усиленияравны 1). Коэффициенты δy ⩾ 0 и δu ⩾ 0 характери-зуют коэффициенты усиления неопределенностей (опера-торных возмущений) по выходу и управлению в суммарномвозмущении v. Управление системами с неопределенно-стью называют робастным. Память неопределенностей μИзвестия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ru 21выбирается конструктором исходя из априорной информа-ции об управляемой системе и может быть выбрана скольугодно большой, но не бесконечной, без ущерба для каче-ства синтезируемого ниже адаптивного управления (см. за-мечание в конце раздела 2). Необходимые для стабилизи-руемости объекта ограничения на коэффициенты усилениянеопределенностей будут сформулированы в разделе 3.Введем обозначение θ для вектора всех неизвестныхпараметров объекта (1)θ = (ξT , cw, δw, δy, δu)T .Задача. Рассматриваемая в статье задача заклю-чается в построении обратной связи вида ut =Ut(yt0, ut−10 ,Ξ,Cw), гарантирующей как можно мень-шую верхнюю границу для асимптотического показателякачестваJμ(θ) = supvlim supt→+∞|yt| , (5)где sup берется на множестве возмущений v, удовлетво-ряющих предположению 2. На обратную связь налагаетсятрудно формализуемое в точных терминах требование еевычислительной реализуемости в онлайн режиме.Уточненная формулировка задачи и необходимое до-полнительное априорное предположение о робастной ста-билизируемости объекта (1) приведены в конце раздела 2.2. Оценка показателя качества оптимальнойсистемы при известных параметрахДля объекта с известным вектором коэффициентов ξ ипри известном смещении cw регуляторut =1b1[(a(q−1) − 1)yt+1 − cw] (6)гарантирует при всех t равенствоyt+1 = vt+1 − cw == δwwt+1 + δyΔ1(y)t+1 + δuΔ2(u)t+1. (7)Поскольку будущие значения неопределенностей и воз-мущения wt непредсказуемы, регулятор (6) являетсяоптимальным для показателя качества (5). Введем обозна-чения для передаточной функции регулятора (6) :Gξ(λ) =a(λ) − 1b1λ=1b1nX−1k=0ak+1 λk .Тогда∥Gξ∥ =1|b1|Xnk=1|ak| . (8)Замкнутая система, включающая объект (1) и некото-рый регулятор, называется робастно устойчивой в клас-се неопределенностей (4), если значение показателя ка-чества (5) для этой системы конечно.Робастное качество оптимальной системы (1), (6) опи-сывается в следующей теореме.Теорема 1. 1. Система (1), (6) робастно устойчива приμ = +∞тогда и только тогда, когдаδy + δu∥Gξ∥ &lt; 1 . (9)2. Если выполнено условие робастной устойчивости (9),тоJμ(θ) ↗ J(θ) =δw + δu|cw/b1|1 − δy − δu∥Gξ∥ (μ → +∞) ,(10)где знак ↗ означает монотонную сходимость снизу приμ → +∞.Доказательство. Условие робастной устойчивости (9)следует из теоремы 7 [16], примененной к системе (1), (6).Значение J(θ), определенное в (10), является значени-ем показателя качества (5) при μ = +∞, т.е. J(θ) =J+∞(θ) и получается из общей теоремы 5 в [16] путем со-ответствующих алгебраических вычислений. Монотоннаясходимость в (10) прямо следует из теоремы 6 в [16].Последнее априорное предположение диктуется усло-вием робастной стабилизируемости (9) объекта с извест-ными параметрами.Предположение 3. Неизвестный вектор параметров θудовлетворяет неравенствуδy + δu∥Gξ∥ ⩽ ¯δ &lt; 1 (11)с известным числом ¯δ.Предположение об известной верхней границе ¯δ в (11)не является ограничительным. Число ¯δ выбирается кон-структором адаптивного регулятора и может быть выбраносколь угодно близким к единице. При этом исключаются израссмотрения неприемлемые для практических приложе-ний модели, слишком близкие к границе области робастностабилизируемых объектов. Замена открытого множествапараметров θ, удовлетворяющих (9) сколь угодно близким кнему закрытым множеством (11), дает возможность сформу-лировать строгие результаты о качестве адаптивного суб-оптимального управления.Замечание. Базовые результаты ℓ1-теории робастногоуправления относились к системам со структурированнойнеопределенностью с бесконечной памятью (μ = +∞) итолько с нулевыми начальными данными [10]. В то же времямодель возмущений с бесконечной памятью слишком кон-сервативна и не соответствует реальным задачам управ-ления. Предположение об ограниченной памяти возмуще-ний позволяет исключить зависимость показателя каче-ства от слишком далекой предыстории со сколь угодно ма-лыми потерями для показателя качества J(θ) и, кроме то-го, предоставляет возможность онлайн верификации моде-ли объекта, включая квантификацию (оценку параметров)неопределенностей и внешнего возмущения.Уточненная постановка задачи. Требуется при априор-ных предположениях 1-3 построить обратную связь, гаран-тирующую при любых начальных данных и любом возму-щении v выполнение с заданной точностью неравенстваlim supt→+∞|yt| ⩽ J(θ) . (12)22Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ru3. Преобразование к модели с неопределен-ностью по выходуРешение поставленной оптимальной задачи базиру-ется на использовании множественных (полиэдральных)оценок неизвестных параметров и оптимальном оценива-нии, в котором идентификационным критерием являетсяпоказатель качества J(θ). В данном разделе описываетсязамена неизвестных параметров, позволяющая преобразо-вать модель управляемого объекта к модели с неопреде-ленностью только по выходу. После преобразования нели-нейный и невыпуклый показатель качества J(θ) стано-вится дробно-линейным, а ограничение (11) - линейным.Благодаря этому вычисление текущих оптимальных оценоксводится к задаче линейного программирования.Следующее простое утверждение позволяет использо-вать метод рекуррентных целевых неравенств для оценкинеизвестного вектора параметров θ.Лемма 1. Если для некоторой оценкиˆθ = (ˆξT , ˆcw, ˆδw, ˆδy, ˆδu)T ,ˆξ ∈ Ξ, ˆδw ⩾ 0, ˆδy ⩾ 0, ˆδu ⩾ 0 ,неизвестного вектора θ при всех t справедливы неравен-ства|ˆa(q−1)yt − ˆb1ut−1 − ˆcw| ⩽ ˆδw + ˆδypyt + ˆδuput, (13)то объект управления (1) с вектором параметров ˆθ удовле-творяет уравнению (1) и априорным предположениям 1 и 2при всех t.Доказательство. Априорное предположение 1 выполне-но в силу включения ˆξ ∈ Ξ. Определим возмущение ˆvt =ˆa(q−1)yt −ˆb1ut−1 для всех t. Тогда объект управления свектором параметров ˆθ и суммарным возмущением ˆv удо-влетворяет уравнению (1), и в силу (13) возмущение ˆv удо-влетворяет неравенствам|ˆvt − ˆcw| ⩽ ˆδw + ˆδypyt + ˆδuput. (14)Значения ˆvt можно представить в виде (3), выбрав под-ходящие значения wt,Δ1(y)t,Δ2(u)t, удовлетворяющиенеравенствам (4). Это гарантирует справедливость апри-орного предположения 2. □В силу леммы 1 при любом управлении объектом (1) пол-ная информация о векторе неизвестных параметров θ к мо-менту времени t имеет видθ ∈ Θt = {ˆθ ∈ Θ0|ˆa(q−1)yk − ˆb1uk−1 − ˆcw| ⩽ˆδw + ˆδypyk + ˆδupuk∀k ⩽ t },гдеΘ0 = { ˆθ = (ˆξT , ˆcw, ˆδw, ˆδy, ˆδu)Tˆξ ∈ Ξ , ˆδw ⩾ 0 ,ˆδy ⩾ 0 , ˆδu ⩾ 0 , ˆδy + ˆδu∥Gˆξ∥ ⩽ ¯δ }— априорное множество допустимых параметров.Из леммы 1 следует неидентифицируемость параметровξ и cw оптимального регулятора (6) при любом управле-нии объектом (1). Действительно, множества Θt состоят извекторов ˆθ ∈ Θ0, которые удовлетворяют уравнению (1) иаприорным предположениям 1-3 вплоть до момента време-ни t, и любой вектор ˆθ с достаточно большой компонентойˆδw лежит в Θt, каким бы ни было управление объектом домомента t.Метод рекуррентных целевых неравенств заключает-ся в построении сходящейся последовательности оценокθt, достаточно точно удовлетворяющих целевым неравен-ствам (13) при всех достаточно больших t. Однако этогонедостаточно для решения поставленной оптимальной за-дачи, и для предельной оценки θ∞ необходимо допол-нительно обеспечить выполнение с заданной точностьюнеравенстваJ(θ∞) ⩽ J(θ)с неизвестным и не идентифицируемым вектором θ. Это об-стоятельство диктует необходимость использования пока-зателя качества J в качестве идентификационного крите-рия, т.е. вычисления текущих оптимальных оценок по фор-мулеθt = argminˆθ∈ΘtJ(ˆθ) = argminˆθ∈Θtˆδw + ˆδu|ˆcw/ˆb1|1 − ˆδy − ˆδu∥Gˆξ∥. (15)Однако вычисление по формуле (15) не релизуемо в ре-жиме онлайн, поскольку, во-первых, число целевых нера-венств в описании множествΘt может неограниченно воз-растать и, во-вторых, показатель качества J и условие ро-бастной стабилизируемости (11) невыпуклы. Первую труд-ность можно преодолеть использованием верхних поли-эдральных оценок множеств Θt. Для преодоления второйтрудности далее описывается замена неизвестных пара-метров, позволяющая перейти к модели с неопределенно-стью только в канале выхода.Пусть объект (1) управляется так, что для всех t выпол-нены неравенства|ut| ⩽ C1 + C2|ytt−n+1| (16)с некоторыми постоянными C1,C2. Из (1), (16) и предполо-жения 2 следует|a(q−1)yt − b1ut−1 − cw| ⩽⩽ δw + δy|yt−1t−μ| + δu|ut−1t−μ| ⩽⩽ δw + δuC1 + (δy + δuC2)|yt−1t−μ−n| (17)и, следовательно, для любого ¯μ ⩾ μ + n|a(q−1)yt − b1ut−1 − cw| ⩽⩽ δw + δuC1 + (δy + δuC2)|yt−1t−¯μ|. (18)Введем новые параметры ˜ζ, ˜δe и ˜δ:˜ζ = (ξ, cw, ˜δe, ˜δ),˜δe = δw + δuC1 , ˜δ = δy + δuC2 . (19)Неравенства (18) относительно новых параметров прини-мают вид|a(q−1)yt − b1ut−1 − cw| ⩽ ˜δe + ˜δ|yt−1t−¯μ| , (20)Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ru 23эквивалентный неравенствам (13) для модифицированноговектора параметров˜θm = (ξT , cw, ˜δe, ˜δ, 0)T .В силу леммы 1 неравенства (20) означают, что при вы-полнении неравенств (16) выход y можно считать выходомобъекта (1) с модифицированным вектором параметров ˜θm(без неопределенности по управлению), и для этого объек-та из теоремы 1 имеемlim supt→+∞|yt| ⩽ J(˜θm) =˜δe1 − ˜δ. (21)Если объект (1) управляется оптимальным регулятором (6),то|ut + cw/b1| ⩽ ∥Gξ∥|ytt−n+1| ,и, следовательно,|ut| ⩽ |cw/b1| + ∥Gξ∥|ytt−n+1∥ . (22)Неравенства (22) гарантируют неравенства (16) и (18) с по-стоянными C1 = |cw/b1| и C2 = ∥Gξ∥, для которых па-раметры ˜δe и ˜δ из (19) принимают видδe = δw + δu|cw/b1| , δ = δy + δu∥Gξ∥ . (23)Тогда для вектораζ = (ξT , cw, δe, δ)T (24)получаемI(ζ) :=δe1 − δ= J(θ) . (25)4. Адаптивное оптимальное управлениеАдаптивное оптимальное управление будет основанона вычислении оценок ζt = (ξTt , cwt, δet , δt)T неизвест-ного вектора параметров ζ модифицированной модели снеопределенностью только по выходу с использованиемвместо целевых неравенств (13) модифицированных целе-вых неравенств|ˆa(q−1)yt − ˆb1ut−1 − ˆcw| ⩽ ˆδe + ˆδpyt . (26)Вместе с векторными оценками ζt будут вычисляться по-лиэдральные оценкиZt, составленные из априорных огра-ничений и нескольких линейных неравенств, порожден-ных модифицированными целевыми неравенствами (26).Начальные оценки Z0 и ζ0 имеют видZ0 = { ˆζ = (ˆξT , ˆcw, ˆδe, ˆδ)T | ˆξ ∈ Ξ, |ˆcw| ⩽ Cwˆδe ⩾ 0, 0 ⩽ ˆδ ⩽ ¯δ } ,ζ0 = (ξT0 , 0, 0, 0)T ,где ξ0 — любой вектор из априорного многогранника Ξ и¯δ — верхняя оценка параметра δ из предположения 3.Выберем любое число ¯μ ⩾ μ + n запоминаемых вы-ходов ytt−¯μ+1 и параметр ε &gt; 0 мертвой зоны, которыйбудет гарантировать конечное число обновлений оценок.Управление ut в момент t определяется адаптивным регу-ляторомut =1bt1(at1yt +at2yt−1 +. . .+atnyt−n+1 −cwt) . (27)Алгоритм обновления векторных оценок ζt и полиэд-ральных оценок Zt имеет следующий вид. После измере-ния выхода yt+1 в момент t + 1 положимφTt= (−yt,−yt−1, . . . ,−yt−n+1, ut),ηt+1 = sign(yt+1 − φTtξt − cwt) ,pt+1 = |ytt−¯μ+1| , νt+1 = ηt+1yt+1 ,ψt+1 = (ηt+1φTt, ηt+1, 1, pt+1)T .В этих обозначениях уравнение адаптивного регулятора(27) эквивалентно равенству φTtξt + cwt= 0, так чтоηt+1 = sign(yt+1), а целевое неравенство (26) в моментt + 1 для текущей оценки ζt эквивалентно неравенствуψTt+1ζt ⩾ νt+1 . (28)Положимζt+1 := ζt , Zt+1 := Zt,если ψTt+1ζt ⩾ νt+1 − ε|ψt+1| . (29)В противном случае, положимZt+1 := Zt ∩ Ωt+1 , (30)Ωt+1 := { ˆζψTt+1ˆζ ⩾ νt+1 } ,ζt+1 := argminˆζ∈Zt+1I(ˆζ) , (31)где показатель качества I определен в (25).Алгоритм оптимального оценивания (29)–(31) имеетпростую геометрическую интерпретацию. В силу (29) оцен-ки Zt и ζt обновляются, когда расстояние от вектора ζtдо полупространства Ωt+1 больше ε (это обеспечивает-ся добавлением слагаемого −ε|ψt+1| в условие обновле-ния оценок в (29)). Обновление Zt в (30) заключается вдобавлении линейного неравенства (28), которое являет-ся тем из двух линейных неравенств, составляющих целе-вое неравенство (26), которое нарушается для оценки ζt.Вычисление оптимальной оценки ζt+1 согласно (31) пред-ставляет собой задачу дробно-линейного программирова-ния, стандартным образом сводящуюся к задаче линейногопрограммирования введением вспомогательной перемен-ной [17].Теорема 2. Пусть объект (1) с неизвестным вектором па-раметров θ = (ξT , cw, δw, δy, δu)T удовлетворяет пред-положениям 1, 2 и управляется адаптивным регулятором(27) с алгоритмом оценивания (29)–(31) и с параметроммертвой зоны ε, удовлетворяющим неравенствам0 &lt; ε &lt;1 − ¯ √ δn + 1 + Gu, Gu = supξ∈Ξ∥Gξ∥ . (32)Тогда при любых начальных значениях y01−n и любом воз-мущении v, удовлетворяющем предположению 2, справед-ливы утверждения:24Известия Коми научного центра УрО РАН, серия «Физико-математические науки» № 5 (57), 2022www.izvestia.komisc.ru1) если параметры δy и δu удовлетворяют неравенствуδy + δuGu ⩽ ¯δ &lt; 1 , (33)то множественные оценки Zt и векторные оценки ζt схо-дятся за конечное время иlim supt→+∞|yt| ⩽ I(ζε∞) &lt; I(ζ∞) + Kζ∞ε , (34)I(ζ∞) ⩽ ¯I =δw + δu maxt |cwt/bt1|1 − δy − δu maxt ∥Gξt∥ ⩽⩽ δw + δu maxt |cwt/bt1|1 − δy − δuGu, (35)где ζ∞ = (ξT∞, cw∞, δe∞, δ∞) — предельное значение ζt,ζε∞= ( ξT∞, cw∞, δe∞+ ε(√2 + |cw∞/b∞1|) ,δ∞ + ε(√n + 1 + ∥Gξ∞∥))T , (36)Kζ∞ =√2 + |cw∞/b∞1| + δe∞(√n + 1 + ∥Gξ∞∥)(1 − δ∞ − ε(√n + 1 + ∥Gξ∞∥))2;2) если параметры δy и δu удовлетворяют предполо-жению 3 и при всех t справедливы неравенства|ut| ⩽ ¯ut = |cw/b1| + ∥Gξ∥|ytt−¯μ+1| , (37)то множественные оценки Zt и векторные оценки ζt схо-дятся за конечное время иlim supt→+∞|yt| ⩽ I(ζε∞) &lt; I(ζ∞) + Kζ∞ε ⩽⩽ J(θ) + Kζ∞ε , (38)где ζ∞ = (ξT∞, cw∞, δe∞, δ∞) — предельное значение ζt иζε∞, Kζ∞ имеют вид (36).Теорема 2 приводится без доказательства.Утверждение 1 теоремы 2 обеспечивает устойчивостьадаптивной системы на сильно суженном (так как Gu ⩾∥Gξ∥) множестве (33) параметров (δy, δu) по сравнениюс множеством (11). Гарантируемые верхние оценки ¯I в (35)являются грубыми и сильно завышенными по сравнениюс вычисляемыми онлайн и сходящимися к I(ζε∞) за ко-нечное время верхними оценками I(ζεt ), согласованнымис данными измерений. Тем не менее уникальным достоин-ством этих грубых оценок является то, что они соответ-ствуют “настоящим” значениям не идентифицируемых ко-эффициентов усиления неопределенностей δy и δu. Заме-тим, что даже такие области робастной устойчивости и та-кие оценки качества адаптивных систем недостижимы прииспользовании стандартных градиентных алгоритмов оце-нивания, способных гарантировать только грубые оценки,одинаковые для всех допустимых объектов.Утверждение 2 теоремы 2 базируется на дополнитель-ном условии (37), которое не верифицируемо данными из-мерений, так как параметры cw, b1 и ξ неизвестны. Адап-тивный регулятор (27) гарантирует справедливость этихнеравенств для текущих оценок cwt, bt1 и ξt. Поскольку вцепочке неравенств (17) и (18) каждое из неравенств яв-ляется существенно огрубленным и текущие оптимальныеоценки ζt минимизируют показатель качества I, неравен-ства (37), как показывают многочисленные численные экс-перименты, фактически выполняются. Их строгое доказа-тельство остается открытой проблемой.Важнейшим дополнительным достоинством использо-вания полиэдральных оценок является верифицируемостьаприорных предположений об управляемом объекте. Ин-дикатором приемлемости априорных предположений и те-кущих оценок неизвестных параметров управляемого объ-екта служит неубывающая последовательность наимень-ших согласованных с априорными предположениями иданными измерений значений I(ζt). Если текущая оценкаζt не изменяется на длительном промежутке времени, тоона удовлетворяет целевым неравенствам и тем самым га-рантирует эту наилучшую верхнюю границу I(ζt) для вы-хода |yt| после затухания переходных процессов. Неиз-менность оценки ζt на длительном промежутке временигарантирует также соответствие априорных предположе-ний данным измерений при текущем гарантируемом и наи-лучшем асимптотическом качестве управления I(ζt). Тра-диционные методы синтеза адаптивного управления какв детерминированной, так и в стохастической постанов-ке оставляют проблемы верификации модели и априорныхпредположений вне рассмотрения.ЗаключениеРассмотрена задача оптимально робастной стабилиза-ции объекта с авторегрессионной номинальной модельюв условиях сильной априорной неопределенности. Пред-полагаются неизвестными не только коэффициенты пе-редаточной функции номинального объекта, но и верхняяграница и смещение внешнего возмущения и коэффициен-ты усиления неопределенностей по выходу и управлению,что влечет неидентифицируемость неизвестных парамет-ров. Показателем качества управления служит наихудшаяв классе возмущений асимптотическая верхняя границамодуля выхода управляемого объекта. Решение задачи ба-зируется на результатах ℓ1-теории робастного управле-ния и использования показателя качества задачи управле-ния как идентификационного критерия. Предложена заме-на неизвестных параметров, позволяющая свести задачувычисления текущих оптимальных оценок к задаче дроб-но-линейного программирования. Полиэдральное оцени-вание неизвестных параметров дополнительно решает за-дачу онлайн верификации настраиваемой модели и апри-орных предположений.</p>
 </body>
 <back>
  <ref-list>
   <ref id="B1">
    <label>1.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Goodwin, G. Discrete-time multivariable adaptive control / G. Goodwin, P. Ramadge, P. Caines // IEEE Transactions on Automatic Control. - 1980. - Vol. 25. - № 3. - P. 449-456.</mixed-citation>
     <mixed-citation xml:lang="en">Goodwin, G. Discrete-time multivariable adaptive control / G. Goodwin, P. Ramadge, P. Caines // IEEE Transactions on Automatic Control. - 1980. - Vol. 25. - № 3. - P. 449-456.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B2">
    <label>2.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Goodwin, G. Discrete time stochastic adaptive control / G. Goodwin, P. Ramadge, P. Caines // SIAM Journal on Control and Optimization. - 1981. - Vol. 19. - № 6. - P. 829-853.</mixed-citation>
     <mixed-citation xml:lang="en">Goodwin, G. Discrete time stochastic adaptive control / G. Goodwin, P. Ramadge, P. Caines // SIAM Journal on Control and Optimization. - 1981. - Vol. 19. - № 6. - P. 829-853.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B3">
    <label>3.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Guo, L. The Åström-Wittenmark self-tuning regulator revisited and ELS-based adaptive trackers / L. Guo, H.- F. Chen // IEEE Transactions on Automatic Control. - 1991. - Vol. 36. - № 7. - P. 802-812.</mixed-citation>
     <mixed-citation xml:lang="en">Guo, L. The Åström-Wittenmark self-tuning regulator revisited and ELS-based adaptive trackers / L. Guo, H.- F. Chen // IEEE Transactions on Automatic Control. - 1991. - Vol. 36. - № 7. - P. 802-812.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B4">
    <label>4.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Guo, L. Further results on least squares based adaptive minimum variance control / L. Guo // SIAM Journal on Control and Optimization. - 1994. - Vol. 32. - № 1. - P. 187-212.</mixed-citation>
     <mixed-citation xml:lang="en">Guo, L. Further results on least squares based adaptive minimum variance control / L. Guo // SIAM Journal on Control and Optimization. - 1994. - Vol. 32. - № 1. - P. 187-212.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B5">
    <label>5.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Rohrs, C. Robustness of adaptive control algorithms in the presence of unmodeled dynamics / C. Rohrs, L. Valavani, M. Athans, G. Stein // The 21st IEEE Conference on Decision and Control. - 1882. - P. 3-11.</mixed-citation>
     <mixed-citation xml:lang="en">Rohrs, C. Robustness of adaptive control algorithms in the presence of unmodeled dynamics / C. Rohrs, L. Valavani, M. Athans, G. Stein // The 21st IEEE Conference on Decision and Control. - 1882. - P. 3-11.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B6">
    <label>6.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Rohrs, C.E. Robustness of continuous-time adaptive control algorithms in the presence of unmodeled dynamics / C.E. Rohrs, L. Valavani, M. Athans, G. Stein // IEEE Transactions on Automatic Control. - 1985. - Vol. 30. - № 9. - P. 881-889.</mixed-citation>
     <mixed-citation xml:lang="en">Rohrs, C.E. Robustness of continuous-time adaptive control algorithms in the presence of unmodeled dynamics / C.E. Rohrs, L. Valavani, M. Athans, G. Stein // IEEE Transactions on Automatic Control. - 1985. - Vol. 30. - № 9. - P. 881-889.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B7">
    <label>7.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Narendra, K. Stable adaptive systems / K. Narendra, A. Annaswamy. - Dover, 2005. - 512 p.</mixed-citation>
     <mixed-citation xml:lang="en">Narendra, K. Stable adaptive systems / K. Narendra, A. Annaswamy. - Dover, 2005. - 512 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B8">
    <label>8.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Ioannou, P.A. Robust adaptive control / P.A. Ioannou, J. Sun. - New Jersey: PTR Prentice-Hall, Upper Saddle River, 1996. - 852 p.</mixed-citation>
     <mixed-citation xml:lang="en">Ioannou, P.A. Robust adaptive control / P.A. Ioannou, J. Sun. - New Jersey: PTR Prentice-Hall, Upper Saddle River, 1996. - 852 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B9">
    <label>9.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Zhou, K. Robust and Optimal Control / K. Zhou, J.C. Doyle, K. Glover. - New Jersey: Prentice-Hall, Upper Saddle River, 1996. - 616 p.</mixed-citation>
     <mixed-citation xml:lang="en">Zhou, K. Robust and Optimal Control / K. Zhou, J.C. Doyle, K. Glover. - New Jersey: Prentice-Hall, Upper Saddle River, 1996. - 616 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B10">
    <label>10.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Khammash, M. Performance robustness of discrete-time systems with structured uncertainty / M. Khammash, J. Pearson // IEEE Transactions on Automatic Control. - 1991. - Vol. 36. - № 4. - P. 398-412.</mixed-citation>
     <mixed-citation xml:lang="en">Khammash, M. Performance robustness of discrete-time systems with structured uncertainty / M. Khammash, J. Pearson // IEEE Transactions on Automatic Control. - 1991. - Vol. 36. - № 4. - P. 398-412.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B11">
    <label>11.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Khammash, M. Robust steady-state tracking / M. Khammash // IEEE Transactions on Automatic Control. - 1995. - Vol. 40. - № 11. - P. 1872-1880.</mixed-citation>
     <mixed-citation xml:lang="en">Khammash, M. Robust steady-state tracking / M. Khammash // IEEE Transactions on Automatic Control. - 1995. - Vol. 40. - № 11. - P. 1872-1880.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B12">
    <label>12.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Khammash, M. Robust performance: unknown disturbances and known fixed inputs / M. Khammash // IEEE Transactions on Automatic Control. - 1997. - Vol. 42. - № 12. - P. 1730-1734.</mixed-citation>
     <mixed-citation xml:lang="en">Khammash, M. Robust performance: unknown disturbances and known fixed inputs / M. Khammash // IEEE Transactions on Automatic Control. - 1997. - Vol. 42. - № 12. - P. 1730-1734.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B13">
    <label>13.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Соколов, В.Ф. Робастное управление при ограниченных возмущениях / В.Ф. Соколов. - Сыктывкар: Коми научный центр УрО РАН, 2011. - 218 с.</mixed-citation>
     <mixed-citation xml:lang="en">Sokolov V.F. Robastnoye upravleniye pri ogranichennykh vozmushcheniyakh [Robust control under bounded dicturbances] / V.F. Sokolov. - Syktyvkar: Komi Sience Center</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B14">
    <label>14.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Sokolov, V.F. Adaptive ℓ1 robust control for SISO system / V.F. Sokolov // Systems and Control Letters. - 2001. - Vol. 42. - № 5. - P. 379-393.</mixed-citation>
     <mixed-citation xml:lang="en">UrD RAS, 2011. - 218 p.Sokolov, V.F. Adaptive ℓ1 robust control for SISO system / V.F. Sokolov // Systems and Control Letters. - 2001. - Vol. 42. - № 5. - P. 379-393.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B15">
    <label>15.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Фомин, В.Н. Адаптивное управление динамическими бъектами / В.Н. Фомин, А.Л. Фрадков, В.А. Якубович. - Москва: Наука, 1981. - 447 c.</mixed-citation>
     <mixed-citation xml:lang="en">Fomin, V.N. Adaptivnoye upravleniye dinamicheskimi ob”yektami [Adaptive control of dynamic plants] / V.N. Fomin, A.L. Fradkov, V.A. Yakubovich. - Moscow: Nauka, 1981. - 447 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B16">
    <label>16.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Sokolov, V.F. ℓ1 robust performance of discrete-time systems with structured uncertainty / V.F. Sokolov // Syst. Control Lett. - 2001. - V. 42 - № 5. - P. 363-377.</mixed-citation>
     <mixed-citation xml:lang="en">Sokolov, V.F. ℓ1 robust performance of discrete-time systems with structured uncertainty / V.F. Sokolov // Syst. Control Lett. - 2001. - V. 42 - № 5. - P. 363-377.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B17">
    <label>17.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Boyd, S. Convex optimization / S. Boyd, L. Vandenberghe. - New York: Cambridge University Press, 2004. - 742 p.</mixed-citation>
     <mixed-citation xml:lang="en">Boyd, S. Convex optimization / S. Boyd, L. Vandenberghe. - New York: Cambridge University Press, 2004. - 742 p.</mixed-citation>
    </citation-alternatives>
   </ref>
  </ref-list>
 </back>
</article>
