Оптимальное управление поведением решений начально-краевой задачи, возникающей в механике дискретно-континуальных систем

Обложка

Цитировать

Полный текст

Аннотация

Рассматривается начально-краевая задача для системы из двух дифференциальных уравнений, одно из которых является обыкновенным, а другое уравнением с частными производными, связь между которыми осуществляется через интегральный функционал. При этом краевые условия содержат старшие производные по времени от искомых функций. Начальнокраевая задача моделирует поворот механической системы, состоящей из двух твердых тел, соединенных упругим стержнем, вокруг центра масс одного из твердых тел. Поворот осуществляется моментом внешних сил (моментом управления), приложенным к оси вращения твердого тела. Для начально-краевой задачи введено понятие обобщенного решения, доказана теорема существования и единственности обобщенного решения, корректности постановки задачи. Решены задачи оптимального управления поворотом механической системы из начального состояния в конечное в заданный момент времени, минимизируя значение управляющего момента и минимизируя функционал энергии от управляющего момента. В указанной постановке также решены задачи быстродействия при ограничениях на значение управляющего момента и на величину интеграла энергии от управляющего момента.

Полный текст

ОГЛАВЛЕНИЕ 1. Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488 2. Математическая постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490 3. Построение решения начально-краевой задачи (2.1)-(2.4) . . . . . . . . . . . . . . . . . 491 4. Построение оптимальных управлений . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501 Список литературы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506 1. Введение Дискретно-континуальными принято называть механические системы, содержащие как твердые тела, так и упругие элементы. Такие системы являются механическими моделями манипуляционных роботов, руки которых обладают упругой податливостью, космических аппаратов, имеющих упругие элементы конструкций, гибких роторов турбин, несущих бандажные диски лопаток, центрифуг и др. конструкций. Математическими моделями таких систем являются, как правило, начально-краевые задачи для систем дифференциальных уравнений, содержащих как уравнения обыкновенные, так и уравнения с частными производными, связь между которыми осуществляется через функционалы и операторы. Начально-краевые задачи могут содержать старшие производные по времени в краевых условиях. В связи с этим встает задача математически корректной постановки начально-краевых задач для такого класса дифференциальных уравнений. Даже для математических моделей достаточно простых механических систем рассматриваемого вида эта задача зачастую не выглядит просто. Изучению таких систем посвящена © Российский университет дружбы народов, 2022 This work is licensed under a Creative Commons Attribution 4.0 International License https://creativecommons.org/licenses/by-nc/4.0/legalcode 488 обширная литература, в основном прикладного характера. Рассматриваются задачи управления движением, устойчивости и стабилизации, колебаний таких систем. Активно такие системы стали изучаться в 80-х годах прошлого века, что было обусловлено интенсивным развитием робототехники, созданием больших космических станций и других сложных систем, имеющих упругоподатливые элементы конструкций. Отметим некоторые работы. Во-первых, монографию [21], в которой наряду со многими другими рассмотрена задача управления поворотом упругого стержня с точечным грузом на конце как механическая модель руки манипулятора. Для такой системы получены уравнения движения. Постановка задачи позволяет найти точное решение начально-краевой задачи, что дает возможность построить программное управление, обеспечивающие поворот системы с гашением колебаний. Близкие по постановке задачи изучались в монографии [3], где построены уравнения движения дискретно-континуальных систем, моделирующих роботов, манипуляторы, шагающие аппараты, а также рассмотрены различные проблемы динамики, управления и оптимизации таких систем. Основной метод исследования в монографии - это замена распределенной составляющей конечномерной по методу Галеркина. В качестве базисных функций берутся балочные функции. Для конечномерного аналога строятся оптимальные управления, которые и берутся в качестве управлений дискретно-континуальных систем. В работе [25], где рассматривается задача поворота гибкой руки манипулятора с полным гашением поперечной вибрации в конце процесса управления, также используется метод приближений Галеркина. В работах [22-24] изучается задача управления медленным вращением диска с балкой Тимошенко. Авторы используют представление решения распределенной части системы через собственные функции спектральной краевой задачи, соответствующей балке Тимошенко, закрепленной с одного конца, считая при этом угол поворота системы известной функцией. Такой подход потребовал ограничений на счетное число значений радиусов диска, при которых рассматриваемая система является неуправляемой (нестабилизируемой). Эта же модель при упомянутых ограничениях рассмотрена в работе [6] при решении задачи стабилизации поведения решений. Как следует из результатов [16], эти ограничения обусловлены методом исследования. Задачи стабилизации углового положения твердого тела с упругими стержнями рассматривались также в [1, 7, 8, 19]. В настоящей работе рассматривается начально-краевая задача, моделирующая поворот механической системы, состоящей их двух твердых тел, соединенных упругим стержнем, вокруг оси, проходящей через центр масс одного из твердых тел перпендикулярно средней линии недеформированного стержня. Упругий стержень рассматривается в рамках гипотез Эйлера-Бернулли малого изгиба стержней, имеет постоянное сечение и равномерно распределенную по длине массу. Точки заделки стержня в твердые тела и их центры масс находятся на одной прямой со средней линией недеформированного стержня. Поворот осуществляется моментом внешних сил, приложенным к оси вращения. Для начально-краевой задачи определено понятие обобщенного решения, доказана теорема существования и единственности обобщенного решения, непрерывной зависимости решения от начальных условий и параметров начально-краевой задачи. Решена задача оптимального перевода решения начально-краевой задачи из начального фазового состояния в конечное в заданный момент времени, минимизируя значение управляющего момента, и аналогичная задача с минимизацией функционала энергии от управляющего момента. В указанной постановке также решены задачи быстродействия при ограничениях на значение управляющего момента и на величину интеграла энергии от управляющего момента. Рассматриваемая система может служить механической моделью руки манипулятора, переносящей груз и обладающей упругой податливостью, или космической станции, состоящей из двух модулей, соединенных упругим переходом, осуществляющей поворот в плоскости орбиты вокруг центра масс одного из модулей. Вывод уравнений движения и краевых условий рассматриваемой механической системы приведен в работе автора [13]. Там же приведен алгоритм решения одной из сформулированных задач управления. При этом многие математические вопросы решения задач управления либо остались не изложенными, либо приведены без доказательств. Настоящая работа призвана восполнить этот пробел. В работе используется идеология работ [5, 12, 14, 15], в которых рассматриваются в различных постановках задачи оптимального управления поворотом твердого тела с упругим и наследственно вязкоупругим стержнем. Работа выполнена в рамках реализации программы развития регионального научно-образовательного математического центра (ЯрГУ) при финансовой поддержке Министерства науки и высшего образования РФ (соглашение о предоставлении из федерального бюджета субсидии № 075-02-2022-886) и Программы развития ЯрГУ, проект № П2-К-1-Г-4/2021 П2-ГМ4-2021. 2. Математическая постановка задачи Рассматривается начально-краевая задача ytt + yxxxx = -(x + a1)θ,¨ (2.2) y(0,t) = yx(0,t) = 0, , (2.3) θ(0) = θ0, θ˙(0) = θ˙0, y(x,0) = y0(x), yt(x,0) = y1(x), (2.4) относительно функций θ(t),y(x,t) в области . В (2.1)- (2.4) J,J1,J2,a1,a2,m2 - положительные параметры, M(t) - известная функция, функциональные пространства для начальных условий y0(x),y1(x) и функции M(t) будут определены ниже. При этом Начально-краевая задачи (2.1)-(2.5) приведена в безразмерных переменных. При этом функции θ(t),y(x,t) определяют соответственно угол поворота системы относительно инерциального пространства и величину деформации стержня; параметры J1 и J2 определяют моменты инерции твердых тел относительно осей, проходящих через их центры масс перпендикулярно плоскости вращения системы; a1 и a2 определяют расстояния от центров масс твердых тел до точек заделки упругого стержня; m2 характеризует массу второго твердого тела. Функция M(t) определяет момент вращения (управления). Выражение (2.5) определяет момент инерции всей системы относительно оси вращения. В дальнейшем, как обычно, L2(0,T) - пространство определенных на (0,T) вещественнозначных интегрируемых по Лебегу функций u(t), для которых L∞(0,T) - подпространство функций из L2(0,T), для которых (существенный supremum). Для начально-краевой задачи (2.1)-(2.4) рассмотрены следующие задачи оптимального управления. Задача 2.1. Определить функцию управления M(t) ∈ L2(0,T), переводящую решение начально-краевой задачи (2.1)-(2.4) из начального состояния (2.4) в конечное θ(T) = θ0T , θ˙(T) = θ1T , y(x,T) = y0T (x), yt(x,T) = y1T (x) (2.6) в заданный момент времени T и минимизирующую функционал . Задача 2.2 (задача быстродействия). Определить функцию управления M(t) ∈ L2(0,T), , переводящую решение начально-краевой задачи (2.1)-(2.4) из начального состояния (2.4) в конечное (2.6) за минимальное время T. Задача 2.3. Определить функцию управления M(t) ∈ L∞(0,T), переводящую решение начально-краевой задачи (2.1)-(2.4) из начального состояния (2.4) в конечное (2.6) в заданный момент времени T и минимизирующую функционал . Задача 2.4 (задача быстродействия). Определить функцию управления M(t) ∈ L∞(0,T), , переводящую решение начально-краевой задачи (2.1)-(2.4) из начального состояния (2.4) в конечное (2.6) за минимальное время T. Ниже для начально-краевой задачи (2.1)-(2.4) сформулировано понятие обобщенного решения, определены функциональные пространства для начальных условий и решения, доказана теорема существования и единственности решения. Показана корректность поставленной начальнокраевой задачи, получена аналитическая формула решения. Для оптимальных управлений сформулирован принцип максимума, предложены эффективные алгоритмы построения оптимальных управлений. В задачах 2.2 и 2.4 значения минимального времени определяются как корни некоторых нелинейных алгебраических уравнений. 3. Построение решения начально-краевой задачи (2.1)-(2.4) Выразим ytt(x,t) из (2.2) и подставим в уравнение (2.1). В результате имеем , (3.1) где использованы обозначения . Вычислив в равенстве (3.1) второй интеграл по частям при учете краевых условий (2.3), получим для θ дифференциальное уравнение J1θ¨+ a1yxxx(0,t) - yxx(0,t) = M(t). (3.2) Это позволяет выписать для определения y(x,t) две эквивалентные начально-краевые задачи: и ytt + yxxxx - J1-1(x + a1)(a1yxxx(0) - yxx(0)) = -J1-1(x + a1)M(t), (3.6) y(0,t) = yx(0,t) = 0, yxx(1,t) - J1-1J2∗(a1yxxx(0,t) - yxx(0,t)) = -(J2 + m2a22)yxtt(1,t) - m2a2ytt(1,t) - J1-1J2∗M(t), yxxx(1,t) + J1-1m∗2(a1yxxx(0,t) - yxx(0,t)) = m2ytt(1,t) + m2a2yxtt(1,t) + J1-1m∗2M(t), (3.7) y(x,0) = y0(x), yt(x,0) = y1(x). (3.8) Положим сначала M(t) ≡ 0. Определяя решение y(x,t) в виде y(x,t) = v(x)s(t), подставим его в краевую задачу (3.6)-(3.8). В результате получим для определения v(x) спектральную краевую задачу (3.9) , (3.10) a для s(t) -следующее уравнение: s¨(t) + λs(t) = 0. Спектральная краевая задача (3.9)-(3.10) подробно рассмотрена в работе [4]. Ниже приведены основные результаты. Запишем спектральную краевую задачу (3.9)-(3.10) в матричной форме Введем гильбертово пространство H = L2 ⊕ R ⊕ R с элементами . Здесь и в дальнейшем для сокращения записи используется обозначение L2 пространства L2(0;1), а соответствующее скалярное произведение обозначено (∗,∗). Введем в H операторы , Скалярное произведение в H определено равенством . Интегрируя по частям, замечаем, что , где. Кроме того, Таким образом, (3.11), (3.12) может быть записано в виде . (3.13) Покажем, что оператор A является симметричным и положительно определенным. Действительно, для v, Кроме того, для , т. е. оператор A положительный. Применяя теперь к (3.13) неравенство Фридрихса [18], получим положительную определенность оператора A. Расширяя его (по Фридрихсу) до самосопряженного положительно определенного оператора, получаем . Согласно теоремам вложения Соболева [17], H компактно вложено в исходное простран- H A A 1 существует и является компактным ство . Отсюда непосредственно следует, что оператор - в H. Оператор B = B∗ > 0 является ограниченным и ограниченно обратимым оператором в H. Таким образом, из (3.13) следует, что . Обозначив, перепишем последнее равенство следующим образом: . Очевидно, является ортопроектором на одномерное подпространство sp, поэтому ограничен в H. Имеем задачу . (3.14) Здесь, очевидно, оператор C = C∗ > 0 ограничен и ограниченно обратим. На решениях задачи (3.14) имеем, поэтому, сделав замену , получим уравнение . Оператор K-1 является положительным компактным самосопряженным в H. Согласно теореме Гильберта-Шмидта, σ(K-1) состоит из изолированных конечнократных положительных собственных значений с предельной точкой +0, а из соответствующих собственных элементов можно составить ортонормированный базис в H. Тогда спектр исходной спектральной задачи состоит из изолированных положительных собственных значений конечной кратности, а система собственных элементов является полной в гильбертовом пространстве H. Она образует ортонормированный базис в энергетическом пространстве оператора A, при этом справедливы формулы ортогональности . (3.15) Перейдем к выводу конкретного вида скалярного произведения (3.15) в терминах собственных функций vk(x) спектральной краевой задачи (3.9)-(3.10). Подставив теперь y(x,t) = v(x)s(t) в начально-краевую задачу (3.3)-(3.5), получим для определения v(x) следующую спектральную краевую задачу: (3.16) , , (3.17) эквивалентную (3.9)-(3.10). Пусть vk(x) и vl(x) - собственные функции спектральной краевой задачи (3.16)-(3.17), отвечающие собственным значениям λk и λl соответственно. Подставим теперь vk(x) и λk в (3.16). Полученное равенство умножим на vl(x) и проинтегрируем по отрезку [0, 1]. В результате имеем (3.18) Вычисляя интеграл в левой части (3.18) по частям, с учетом краевых условий (3.17) будем иметь Поменяв vk(x) и vl(x) местами, получим . (3.20) При , вычтя из (3.19) выражение (3.20), имеем . Имеем также , . Перейдем теперь к выводу характеристического уравнения для определения λk и построению собственных функций vk(x). Положим в уравнении (3.9) λ = β4, а выражение будем рассматривать как параметр. Тогда общее решение (3.9) запишется в виде , (3.21) где A,B,C,D - произвольные постоянные. Отсюда получаем , что в результате дает Подставляя теперь (3.22) в краевые условия (3.10), получаем следующую систему линейных уравнений для определения A,B,C,D: )A J1β J1β J1β ⎧⎪⎪⎪⎪⎪⎪⎪⎪(1 +1 Aa+ (1 2 β -- aa121 )BB+ (1- 1-2 Ca1+ (2 )Cβ ++JJaa111β12β)DD= 0= 0,, ⎪⎪J1β2 J1β J1β ⎪⎪⎪ ⎨(chβ(1 + β2a2m2) + β3 shβ(J2 + a22m2))A + (shβ(1 + β2a2m2) + β3 chβ(J2 + a22m2))B+ ⎪⎪⎪⎪⎪ + (cosβ(-1+β2a2m2)-β3 sinβ(J2+a22m2))C+(sinβ(-1+β2a2m2)+β3 cosβ(J2+a22m2))D = 0, ⎪⎪⎪⎪⎪(shβ(1 + β2a2m2) + βm2 chβ)A + (chβ(1 + β2a2m2) + βm2 shβ)B+ ⎩⎪ + (sinβ(1 β ⎪⎪ - 2a2m2) + βm2 cosβ)C + (cosβ(-1 + β2a2m2) + βm2 sinβ)D = 0. Эта система имеет нетривиальное решение, если ее определитель равен нулю. Этот факт и дает характеристическое уравнение p(β) ≡ J1β-4 - J1J2m2 + (((J1 - 2(J2 + (a22 - a12)m2))β-4 + J1J2m2)cosβ+ +(β-7 + 2a1m2β-5 + (m2(J2 - J1) + a1(a1 + 2J2 + 2a22m2))β-3+ +(J1J2 + m2(a22J1 + a21J2))β-1)sinβ)chβ+ +((-β-7 + 2a1m2β-5 + (m2(J1 - J2) + a1(a1 - 2J2 - 2a22m2))β-3+ +(J1J2 + m2(a22J1 + a21J2))β-1)cosβ+ +2((a1 + m2)β-6 + a21(J2 + a22m2)β-3 + a1J2m2β-2)sinβ)shβ = 0, (3.23) положительные корни которого βn > 0 однократны и определяют собственные значения λn = βn4 спектральной краевой задачи (3.9)-(3.10). При этом нормированные собственные функции будут иметь явный вид , (3.24) где , - - - Между функциями vn(x) выполнены условия ортогональности , (3.25) где δkl - символ Кронекера. Рассмотрим вопрос построения решения начально-краевой задачи (3.3)-(3.5). Введем некоторые функциональные пространства, необходимые для корректной постановки начально-краевой задачи. Обозначим через H(0,1) гильбертово пространство функций y(x), полученное замыканием в норме (3.26) линейной оболочки функций vn(x) (n = 1,2,...), т. е. . (3.27) Для y1(x),y2(x) ∈ H(0,1) определено скалярное произведение согласно (3.19). Из (3.26), (3.27) для y(x) ∈ H(0,1) следует , т. е. равенство (3.19) удовлетворяет всем аксиомам скалярного произведения. Очевидно, что H(0,1) ⊂ L2(0,1). Через Hj(0,1) ⊂ H(0,1) (j = 1,2,3) обозначим пространства функций вида . Отметим, что эти пространства являются соответственно замкнутыми подпространствами пространств Соболева Через H(QT ) обозначим гильбертово пространство функций y(x,t), полученное замыканием множества функций y(x,t) ∈ C1,0(Q¯T ) в норме Очевидно, что H(QT ) ⊂ L2(QT ). Через H2(QT ) обозначим гильбертово пространство функций y(x,t), полученное замыканием множества функций y(x,t) ∈ C2,1(Q¯T ), y(0,t) = yx(0,t) = 0 в норме . Умножим обе части уравнение (3.3) на функцию v(x,t) ∈ H2(QT ), v(x,T) ≡ 0 (3.28) и проинтегрируем по (x,t) ∈ QT . В результате будем иметь равенство (3.29) Вычисляя интегралы, входящие в (3.29), по частям с учетом краевых и начальных условий (3.4), (3.5), а также условия (3.28), получим выражения (3.30) (3.31) (3.32) (3.33) (3.34) Объединяя (3.30)-(3.34), получим выражение (3.35) Пусть y0(x) ∈ H2(0,1), y˙0(x) ∈ H(0,1). (3.36) Под обобщенным решением начально-краевой задачи (3.3)-(3.5), определенным в области Q(T) с начальными условиями (3.36), будем понимать функцию y(x,t) ∈ H2(QT ), y(x,0) = y0(x), удовлетворяющую интегральному соотношению (3.35) для любой функции v(x,t) вида (3.28). Покажем, что обобщенное решение начально-краевой задачи (3.3)-(3.5) существует, единственно, а также получим формулу, его определяющую. Докажем сначала следующую теорему. Теорема 3.1. Решение начально-краевой задачи (3.3)-(3.5) единственно. Доказательство. Предположив существование двух решений y1(x,t) и y2(x,t). Для их разности y(x,t) получим интегральное соотношение (yt(x,t),vt(x,t))H(QT) - (yxx(x,t),vxx(x,t))L2(QT) = 0. (3.37) Необходимо показать, что существует лишь одна, тождественно равная нулю в Q(T) функция y(x,t), удовлетворяющая соотношению (3.37) для любой функции v(x,t) вида (3.28). Выберем в качестве v(x,t) функцию (3.38) зависящую от параметра Отметим, что Подставив (3.38) в (3.37), имеем , В итоге равенство (3.37) примет вид , из которого в силу произвольности τ следует, что y(x,t) ≡ 0. Отсюда следует единственность решения. Перейдем теперь к доказательству существования обобщенного решения начально-краевой задачи (3.3)-(3.5). Представим , (3.39) (3.40) Справедлива следующая теорема. Теорема 3.2. Величины при n → ∞. (3.41) Доказательство. Подставим vn(x) и λn = ωn2 в (3.9)-(3.10), умножим уравнение (3.9) на x + a1 и проинтегрируем по отрезку [0, 1] с учетом краевых условий (3.10). В результате получим равенство . (3.42) Предположим, что dn = 0 для некоторого n. Тогда из (3.42) следует равенство. Учитывая это в (3.21) и используя первое краевое условие (3.10), получим равенства An + Cn = 0, Bn + Dn = 0. Подставив найденные в (3.24) выражения для An и Cn в (3.43), имеем равенство (3.43) 2a1(chβn + cosβn) + 2a1βn2m2(a1 + a2)(chβn - cosβn) + + 2a1βn(m2 + a1)(shβn - sinβn) + βn2m2a1a2(shβn + sinβn) = 0. (3.44) Так как при положительных βn выполнены неравенства shβn + sinβn > 0, chβn + cosβn > 0, shβn - sinβn > 0 и chβn - cosβn > 0, левая часть (3.44) строго больше нуля. Это означает ошибочность предположения dn = 0 для некоторого n. При β → ∞ левая часть уравнения (3.23) стремится к выражению p(β) ≡ cosβ + O(β-1). В связи с этим βn ∼ π(2n + 1)/2 при n → ∞, а функции vn(x) стремятся к балочным функциям [20] , соответствующим условиям защемления с обоих концов, в которых exp(βn)/2(1 + O(βn-1)) при n → ∞. C учетом этого имеем справедливость второго утверждения теоремы. В результате справедливо представление . (3.45) Выберем в качестве y0(x) = a0nvn(x)ωn-1, y˙0(x) = b0nvn(x), и пусть в правой части уравнения (3.3) вместо функции x + a1 стоит функция dnvn(x). Здесь a0n,b0n - некоторые постоянные. Полагаем также M(t) ∈ L2(0,T). Тогда функция является обобщенным решением начально-краевой задачи (3.3)-(3.5), удовлетворяющим вышеназванным начальным условиям. Это проверяется непосредственной подстановкой (3.46) в (3.35) с учетом разложения , Аналогичное утверждение справедливо, если и в правой части уравнения (3.3) вместо функции x + a1 стоит ряд. В этом случае обобщенное решение начально-краевой задачи (3.3)-(3.5) будет представлено суммой yN(x,t) = . Покажем теперь, что ряд вида , (3.47) где a0n,b0n,dn определен в (3.39), (3.40) и (3.45) и дает обобщенное решение начально-краевой задачи (3.3)-(3.5), принадлежащее H2(QT ) и удовлетворяющее начальным условиям y(x,0) = y0(x), yt(x,0) = y˙0(x). Отметим, что согласно (3.39), (3.40) решение (3.47) удовлетворяет начальным условиям. Любой конечный отрезок ряда (3.47) является обобщенным решением начально-краевой задачи (3.3)-(3.5), т. е. (3.47) является формальным обобщенным решением. Докажем сходимость (3.47) в норме пространства H2(QT ). Формально дважды дифференцируя по x, имеем . C учетом равенств (3.20), (3.25) оценим . (3.48) В (3.48) использовано неравенство . Согласно (3.39), (3.40), (3.45) величина (3.48) может быть сделана за счет выбора N и m меньше любого заданного ε > 0. Аналогично для имеем . (3.49) Величина (3.49) также согласно (3.39), (3.40), (3.45) за счет выбора N и m может быть сделана меньше любого заданного ε > 0. Это означает, что последовательность частичных сумм ряда (3.47) фундаментальна в пространстве H2(QT ). В силу полноты этого пространства ряд (3.47) сходится к функции y(x,t) ∈ H2(QT ). Существование обобщенного решения начально-краевой задачи (3.3)-(3.5) доказано. Из (3.39), (3.40), (3.45) и (3.48), (3.49) для решения (3.47) вытекает оценка , (3.50) где C > 0- некоторая постоянная. Неравенство (3.50) доказывает корректность поставленной задачи. Построим теперь обобщенное решение уравнения (2.1), удовлетворяющее начальным условиям (2.4). Пусть функция . (3.51) Умножим уравнение (2.1) на p(t) и проинтегрируем по t ∈ [0,T]: (3.52) Вычисляя интегралы, входящие в (3.52), по частям, будем иметь что эквивалентно равенству . (3.53) Под обобщенным решением уравнения (2.1) будем понимать функцию θ(t) ∈ W21(0,T), θ(0) = θ0, удовлетворяющую интегральному равенству (3.53) для любой функции p(t) вида (3.51). Легко видеть, что искомым решением уравнения (2.1) будет функция Сформулируем сказанное в виде итоговой теоремы. Теорема 3.3. Обобщенное решение θ(t),y(x,t) начально-краевой задачи (2.1)-(2.4) в области QT с начальными условиями θ(0) = θ0, θ˙(0) = θ˙0, y0(x) ∈ H2(0,1), y˙0(x) ∈ H(0,1) существует, единственно и представимо в виде (3.47), (3.54). При этом θ(t) ∈ W21(0,T), y(x,t) ∈ H2(QT ), и для решения справедлива оценка (3.50). 4. Построение оптимальных управлений Выберем y0(x),yT (x) ∈ H3(0,1), y˙0(x),y˙T (x) ∈ H1(0,1) (4.1) и переформулируем задачу 2.1 с учетом (3.47), (3.54) следующим образом: найти минимум функционала (2.5) при ограничениях (4.2) . Отметим, что первое условие (3.41) является необходимым условием управляемости поведением решений начально-краевой задачи (2.1)-(2.4). Преобразуем равенства (4.2) к следующему виду: , (4.3) Отметим, что согласно (3.41) и свойств функций (4.1) справедливо неравенство . (4.4) Обозначим через Q2(0,T) подпространство L2(0,T), являющееся замкнутой (в норме этого пространства) линейной оболочкой функций ϕ1(t) = 1, ϕ2(t) = t, ϕ2n+1(t) = sin(ωnt), ϕ2n+2(t) = cos(ωnt) (n = 1,2...). (4.5) Теорема 4.1. Функции (4.5) образуют базис Рисса в Q2(0,T). Доказательство. Покажем сначала, что для некоторого N функции ϕ2(N+j)+1(t), ϕ2(N+j)+2(t) (j = 1,2,...) (4.6) образуют базис Рисса в подпространстве, являющимся замкнутой линейной оболочкой в L2(0,T) функций (4.6). Согласно [2, c. 48], для этого необходимо и достаточно, чтобы собственные значения матриц Грамма GNm = {gpq}, gpq = (ϕp(t),ϕq(t))L2(0,T), p,q = 2(N + j) + 1, 2(N + j) + 2, j = 1,2,... ,m, (4.7) были в совокупности отделены от нуля и бесконечности. Из вида функции (4.7) c учетом соотношения ωn ∼ [π/2(2n + 1)]2 при n → ∞ имеем g2(N+j)+1 2(N+j)+1,g2(N+j)+2 2(N+j)+2 = T/2 + O((N + j)-2),g2(N+j)+1 2(N+j)+2 = O((N + j)-2) при (N + j) → ∞, и при В связи с этим характеристическое уравнение матрицы порядка 2m будет иметь вид (T/2 - λ)2m + O(N-1). Отсюда следует совокупная отделенность от нуля и бесконечности собственных значений матриц. Таким образом, функции (4.6) образуют базис Рисса в. Добавление к функциям (4.6) конечного числа линейно независимых функций не меняет свойства базиса. Следовательно, функции (4.5) образует базис Рисса в Q2(0,T). Это означает, что собственные значения λj > 0 бесконечной матрицы Грамма G, построенной по системе функций (4.5), в совокупности отделены от нуля и бесконечности, т. е. существуют постоянные mg,Mg > 0, для которых mg < λj < Mg (j = 1,2,...). Таким образом, справедливо неравенство (4.8) для любого Произвольный линейный непрерывный функционал в пространстве L2(0,T) запишем в виде . (4.9) Задача 2.1 построения оптимального управления на основании (2.1), (4.3), (4.9) сводится к следующей проблеме моментов в пространстве L2(0,T). Задача. Найти функционал вида (4.9), удовлетворяющий условиям (4.10) и имеющий минимальную норму По системе функций ϕj(t) построим ортонормированную в L2(0,T) систему функций ψj(t), используя ортогонализацию Шмидта (см., например, [2, c. 26]). Для этого положим . Введем в рассмотрение величины βn(T) по следующей схеме: . Эти соотношения определяют бесконечномерную нижнюю треугольную матрицу B(T) = {Bij(T)}i,j=1,...,∞, которая задает ограниченный и ограниченно обратимый в пространстве l2 оператор β(T) = B(T)α(T), β(T) = (β1(T),β2(T),...), α(T) = (α1(T),α2(T),...). Непосредственно вычисляя, находим ψ1(t) = T-1/2,ψ2(t) = 31/2(-T-1/2 + 2 · T-3/2t),... β1(T) = T-1/2α1(T),β2(T) = 31/2(-T-1/2α1(T) + 2T-3/2α2(T)),... Отметим, что остальные βn(T) имеют аналогичную зависимость от T: lim βn(T) = ∞, T→0 lim βn(T) = 0. В связи с этим и (4.4) T→∞ . (4.11) Теорема 4.2. Существует единственная функция , (4.12) дающая решение задачи 2.1. Доказательство. Представим L2(0,T) = Q2(0,T) ⊕ P2(0,T), где P2(0,T) = {u(t) ∈ L2(0,T), (u(t),ψj(t))L2(0,T) = 0, j = 1,2...}. Условия (4.10) эквивалентны условиям F2(ψj(t)) = βj(T) (j = 1,2,...). (4.13) Произвольная функция M(t) ∈ L2(0,T), определяющая функционал (4.9), удовлетворяющий условиям (4.13), имеет вид M(t) = M∗(t) + P(t), где P(t) ∈ P2(0,T), но . Отсюда Обозначим через S(m2(T)) множество функционалов вида (4.9), имеющих норму m2(T), каждый из которых характеризуется функцией M(t). Имеющий единичную норму элемент e0(t) = назовем экстремальным. Обобщением функционального подхода к задачам оптимального управления, предложенного в монографии [10], на рассматриваемый бесконечномерный случай является следующее из вышесказанного утверждение. Теорема 4.3 (принцип максимума). Оптимальный функционал вида (4.9), определяемый функцией M∗(t), выделяется из всех функционалов вида (4.9), имеющих ту же норму m2(T), следующим свойством максимума на экстремальном элементе: . Обозначим через T∗ первый положительный корень уравнения m(T) = L1, существование которого следует из (4.11). Теорема 4.4. Решение задачи 2.2 дает пара (T∗,M∗(t)), где M∗(t) определяется формулой (4.12). Рассмотрим теперь решение задач 2.3 и 2.4. Запишем произвольный линейный непрерывный функционал в пространстве L1(0,T) в виде . (4.14) С учетом (2.3), (4.3), (4.14) задача 2.3 может быть сформулирована как следующая проблема моментов в L1(0,T). Задача. Найти функционал вида (4.14), удовлетворяющий условиям F1(ϕj(t)) = αj(T) (j = 1,2,...) (4.15) и имеющий минимальную норму . Отметим, что указанная проблема моментов при конечном числе ограничений (4.15) рассмотрена в [11]. Некоторые результаты [11] могут быть перенесены на рассматриваемый случай. Обозначим через Q1(0,T) подпространство L1(0,T), полученное замыканием в норме простран- N ства L1(0,T) множества функций вида. В силу соотношения и неравенства (4.8), Q1(0,T) является замкнутым линейным подпространством L1(0,T). Введем двойственную к проблеме моментов задачу. Задача. Найти (4.16) при условии Теорема 4.5. m1(T) = l1(T). Доказательство. Для любых ξ = (ξ1,ξ2,...) ∈ l2 и N > 0 согласно (4.15) . Отсюда . Таким образом, . Определим в Q1(0,T) функционал . Норма Φ(u) в Q1(0,T) равна . (4.17) Продолжим функционал Φ(u) на все пространство L1(0,T) с сохранением нормы (теорема Хана- Банаха, см., например, [9, c. 236]). Этот функционал обозначим . Соответственно имеем . Следовательно, m1(T) = l1(T). Отсюда на основании (4.14), (4.16) имеем следующее утверждение. Теорема 4.6. Решение задачи 2.3 дается формулой . (4.18) Отметим, что согласно (4.16) . (4.19) Очевидно, что справедливо и обратное. Если для некоторого элемента u∗(t) ∈ Q1(0,T) выполнено (4.19), то для u∗(t) выполнено (4.17) и u∗(t) является решением двойственной задачи. Пространство L1(0,T) не является строго нормированным. Поэтому равенство (4.19) и соответственно решение двойственной задачи (4.16) справедливо не для единственного элемента. Пусть u∗(t) и v∗(t) - решения задачи (4.16). Тогда для функционала F1(u) вида (4.14), дающего решение проблемы моментов (4.15), в котором M∗(t) определяется согласно (4.18), справедливы на основании (4.17), (4.19) равенства |F1(u∗)| = |F1(v∗)| = 1. Но тогда на основании (4.14) почти всюду l(T)sign(u∗(t)) = l(T)sign(v∗(t)). Таким образом, решение задачи 2.3 единственно. Обозначим через S(m1(T)) множество функционалов вида (4.14), имеющих норму m1(T), каждый из которых характеризуется функцией M1(t). Имеющий единичную норму элемент назовем экстремальным. Теорема 4.7 (принцип максимума). Оптимальный функционал вида (4.14), определяемый функцией , выделяется из всех функционалов вида (4.14), имеющих ту же норму m1(T), следующим свойством максимума на любом экстремальном элементе: . Из (4.16) следует lim m1(T) = ∞, lim m1(T) = 0. (4.20) T→0 T→∞ Обозначим через T∗ первый положительный корень уравнения m1(T) = L2. Теорема 4.8. Решение задачи 2.4 дает пара , где определяется формулой (4.18). Остановимся на практическом вычислении элемента u∗(t). Отметим, что Q2(0,T) ⊂ Q1(0,T). Рассмотрим функцию , (4.21) где M∗(t),m2(T) определены согласно (4.12). В результате имеем . Таким образом, v∗(t) является решением (4.14) и . Следовательно, . (4.22) Таким образом, выражения (4.21), (4.22) устанавливают взаимосвязь между решениями задач 2.1 и 2.3. Отметим, что в работе [14] приведены примеры использования изложенной схемы построения решений задачи 2.3. Показано, что функция может иметь большое число переключений.
×

Об авторах

Е. П. Кубышкин

Ярославский государственный университет им. П.Г. Демидова

Автор, ответственный за переписку.
Email: kubysh.t@yandex.ru
Ярославль, Россия

Список литературы

  1. Андрейченко Д.К., Андрейченко К.П. К теории стабилизации спутников с упругими стержнями// Изв. РАН. Теор. и сист. управ.-2004.-№ 6.-С. 150-163.
  2. Ахиезер Н.И., Глазман И.М. Теория линейных операторов в гильбертовом пространстве.-М.: Наука, 1966.
  3. Бербюк В.Е. Динамика и оптимизация робототехнических систем. -Киев: Наукова думка, 1989.
  4. Войтицкий В.И., Злобина М.Ю., Кубышкин Е.П. О спектральной задаче, возникающей в механике манипуляционных роботов// Модел. и анализ инф. сист.- 2009.- 16, № 3.-С. 22-28.
  5. Гарнихина М.Ю., Кубышкин Е.П. Оптимальное управление поворотом твердого тела с наследственно вязкоупругим стержнем// Изв. РАН. Мех. тв. тела.-2006.-№ 5.-С. 29-41.
  6. Зеликин М.И., Манита Л.А. Накопление переключений управления в задачах с распределенными параметрами// Соврем. мат. Фундам. Направл.-2006.-19.-С. 78-113.
  7. Злочевский С.И., Кубышкин Е.П. О влиянии колебаний упругих элементов с распределенными массами на ориентацию спутника// Косм. исслед. -1987.- 25, № 4.- С. 537-544.
  8. Злочевский С.И., Кубышкин Е.П. О стабилизации спутника с гибкими стержнями// Косм. исслед.- 1989.-27, № 5.- С. 643-651.
  9. Канторович Л.В., Акилов Г.П. Функциональный анализ.-СПб.: Нев. диалект, 2004.
  10. Красовский Н.Н. Теория управления движением. -М.: Наука, 1968.
  11. Крейн М.Г., Нудельман А.А. Проблема моментов Маркова и экстремальные задачи.- М.: Наука, 1973.
  12. Кубышкин Е.П. Оптимальное управление поворотом твердого тела с гибким стержнем// Прикл. мат. мех. -1992.- 56, № 2. -С. 240-249.
  13. Кубышкин Е.П. Оптимальное управление поворотом системы двух тел, соединенных упругим стержнем// Прикл. мат. мех. -2014.-78, № 5.- С. 656-670.
  14. Кубышкин Е.П., Солодовников П.А. Об одном алгоритме оптимального управления поворотом твердого диска с упругим стержнем // Динам. сист. -2016.- 6, № 2.-С. 95-108.
  15. Кубышкин Е.П., Тряхов М.С. Оптимальное управление поведением решений начально-краевой задачи, моделирующей вращение твердого тела с упругим стержнем// Модел. и анализ инф. сист.- 2014.-21, № 5.- С. 72-92.
  16. Кубышкин Е.П., Хребтюгова О.А. Обобщенное решение одной начально-краевой задачи, возникающей в механике дискретно-континуальных систем// Модел. и анализ инф. сист.- 2012.- № 1.- С. 84-96.
  17. Ладыженская О.А. Краевые задачи математической физики. -М.: Наука, 1973.
  18. Михлин С.Г. Вариационные методы в математической физике.- М.: Наука, 1970.
  19. Русских С.В. Управляемый поворот космического аппарата с упругими панелями солнечных батарей// Изв. вузов. Сер. Машиностр.- 2016.-12.-С. 97-105.
  20. Челомей В.Н. (гл. ред.) и др. Вибрации в технике. Справочник. Т. 1.- М.: Машиностроение, 1978.
  21. Черноусько Ф.Л., Болотник Н.Н., Градецкий В.Г. Манипуляционные роботы.- М.: Наука, 1989.
  22. Gugat M. Controllability of a slowly rotating Timoshenko beam// ESAIM Control Optim. Calc. Var.- 2001.-6.- С. 333-360.
  23. Krabs W., Sklyar G.M. On the stabilizability of a slowly rotating Timoshenko beam// Z. Anal. Anwend.- 2000.-19. № 1.- С. 131-145.
  24. Krabs W., Sklyar G.M., Wozniak J. On the set of reachable states in the problem of controllability of rotating Timoshenko beams// J. Anal. Appl. - 2003.- 22, № 1.-С. 215-228.
  25. Sakawa Y., Ito R., Fujii N. Optimal control of rotation of a flexible arm// В сб.: «Control Theory for Distributed Parameter Systems and Applications». -1983.-С. 175-187.

© Современная математика. Фундаментальные направления, 2022

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах