Оптимальный синтез в задаче управления n-звенным перевернутым маятником на движущемся основании
- Авторы: Манита Л.А.1,2, Ронжина М.И.3
-
Учреждения:
- Национальный исследовательский университет «Высшая школа экономики»
- Московский институт электроники и математики
- Московский государственный университет им. М. В. Ломоносова
- Выпуск: Том 56, № (2015)
- Страницы: 129-144
- Раздел: Статьи
- URL: https://journals.rudn.ru/CMFD/article/view/32653
Цитировать
Полный текст
Аннотация
Рассмотрена задача стабилизации n-звенного перевернутого маятника на движущемся основании (тележке), которое может перемещаться вдоль горизонтальной оси. Управление - сила, приложенная к тележке. Задача состоит в минимизации среднеквадратичного отклонения маятника от вертикальной оси. Для линеаризованной модели доказано, что для малых отклонений от верхнего неустойчивого положенияравновесияоптимальный режим содержит траектории с учащающимисяпе-реключениями. Именно, доказано, что оптимальные траектории с бесконечным числом переключений за конечное время выходят на особую поверхность, а затем продолжают движение с особым управлением по особой поверхности, приближаясь к началу координат за бесконечное время. Показано, что построенные решения глобально оптимальны.
Полный текст
Задачами стабилизации перевернутого маятника занимались многие исследователи. Для него верхнее вертикальное положение, очевидно, является неустойчивым. Однако, оказалось, что можно это положение превратить в устойчивое, если, например, точка подвеса совершает вертикальные колебания (см. [8]). Впоследствии появилось большое количество работ о перевернутом маятнике, в которых изучались различные методы его стабилизации в вертикальном положении (см. [1, 11, 15, 16]). В [14] рассматривается однозвенный нелинейный маятник. Изучается задача перевода за мини- мальное время маятника из нижнего (устойчивого) положения равновесия в верхнее (неустойчи- вое) положение равновесия. Оптимальный синтез строится на основе принципа максимума Понт- рягина и численного моделирования. Задаче стабилизации перевернутого двухзвенного маятника с неподвижной точкой подвеса по- священа работа [15]. Движением маятника можно управлять с помощью ограниченного момента, приложенного в шарнире, соединяющем точку подвеса и первое звено маятника, или в меж- звенном шарнире. Для линеаризованной модели изучаются области управляемости. Предлагается управление, которое обеспечивает асимптотическую устойчивость маятника. Как и в [14], в [16] изучается задача перевода маятника из нижнего положения равновесия в неустойчивое верхнее. Маятник нелинейный, состоит из двух звеньев, точка подвеса неподвижна. Управление осуществляется с помощью ограниченного по абсолютной величине момента, прило- женного во внутреннем межзвенном шарнире. Строится управление, которое переводит маятник Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект № 14-01-00784). Qc 2015 РУДН 129 130 Л. А. МАНИТА, М. И. РОНЖИНА в малую окрестность верхнего неустойчивого положения равновесия и обеспечивает асимптоти- ческую устойчивость маятника. Приводятся численные исследования предложенного алгоритма управления. Многозвенный маятник на движущемся основании исследуется в [11]. Управление - момент, приложенный к шарниру, соединяющему основание и первое звено маятника. Для системы с одно- звенным маятником построены фазовые траектории системы при отсутствии управления. Постро- ено управление, стабилизирующее систему в верхнем положении равновесия. Строится численное решение задачи быстродействия для однозвенного (нелинейного) маятника. В настоящей работе рассматривается задача стабилизации на бесконечном интервале времени перевернутого n-звенного маятника на движущейся тележке. Управлением является ограниченная по модулю сила, приложенная к тележке. Мы докажем, что для малых начальных отклонений маятника от верхнего положения равновесия оптимальное решение существует и единственно, оптимальный синтез содержит особые участки и траектории с учащающимися переключениями. Неособые оптимальные траектории выходят на особую поверхность за конечное время с бесконеч- ным числом переключений управления. Затем движение продолжается по особой поверхности с особым управлением, за бесконечное время оптимальная траектория попадает в начало координат. Заметим, что синтез, содержащий особые траектории и траектории с учащающимися переклю- чениями, достаточно типичное явление при управлении механическими системами [3-5, 7, 9, 10, 13, 17, 19]. Наличие режимов с учащающимися переключениями управления доказано для задач стабилизации твердого тела [3, 5], управления манипуляторами [3, 13], колебаниями струны [10], балок [4] и др. Постановка задачи. Рассмотрим задачу управления n-звенным перевернутым маятником. Маятник прикреп- лен к движущейся тележке, тележка может перемещаться вдоль некоторой прямой. По предположению звенья маят- ника абсолютно твердые, соединены между собой шарнира- ми, трение в шарнирах отсутствует. В качестве управления рассматриваем силу, приложенную к тележке. Введем следующие обозначения: M - масса тележки, s - положение тележки, g - ускорение свободного паде- ния, u - сила, приложенная к тележке, γi - угол отклоне- ния i-го звена от вертикали (см. рис.), mi - масса i-го зве- на, ri - расстояние от нижнего конца i-го звена до его цен- тра масс, Ii - момент инерции относительно центра масс i-го стержня, li - длина i-го стержня (i = 1,..., n). Кинетическая T и потенциальная U энергия системы имеют вид ⎡ ⎤ 1 n n n ⎢ ⎥ T = ⎢a11s˙2 + s˙ 2a1,i+1γ˙i cos γi + 2 2ai+1,j+1γ˙iγ˙j cos((-1)i+j+1γi + γj )+ ai+1,i+1γ˙i2⎥ , ⎣ i=1 i,j=1, i<j n i=1 ⎦ где a11 = M + m1 + ··· + mn, U = bi cos γi, i=1 2 2 2 aii = mi-1ri-1 + mili-1 + ··· + mnli-1 + Ii-1, 2 i n, n + I an+1,n+1 = mnr2 n, a1i = (-1)i(mi 1r + m l + ··· + m l ), 2 i n, - i-1 i-1 n i-1 a1,n+1 = (-1)n+1mnrn, aij = (-1)i+j (mj 1l r + m l l + ··· + m l l ), 2 i<j n, - i-1 j-1 i-1 j-1 n i-1 j-1 - ai,n+1 = (-1)i+n+1mnli 1rn , 2 i n, ОПТИМАЛЬНЫЙ СИНТЕЗ В ЗАДАЧЕ УПРАВЛЕНИЯ ПЕРЕВЕРНУТЫМ МАЯТНИКОМ 131 bi = g(miri + mi+1li + ··· + mnli), 1 i< n, bn = gmnrn. Запишем уравнения движения системы: n n a11s¨ + a1,i+1γ¨i cos γi - a1,i+1γ˙i2 sin γi = u, i=1 i=1 n a1,i+1s¨ cos γi + ai+1,i+1γ¨i + ai+1,j+1γ¨j cos((-1)i+j+1γi + γj )- j=1 (1.1) n - j=1 j sin((-1) ai+1,j+1γ˙ 2 i+j+1γi + γj ) - bi sin γi = 0, i = 1,..., n. Считаем, что в начальный момент времени система находится в достаточно малой окрестности верхнего неустойчивого положения равновесия γ1 = γ˙ 1 = ··· = γn = γ˙ n ≡ 0. (1.2) Будем изучать задачу стабилизации маятника в окрестности положения (1.2) в смысле мини- мизации квадратичного функционала: r∞ (γ, γ) dt → min, (1.3) 0 где γ = (γ1,..., γn)T ∈ Rn; угловыми скобками обозначено скалярное произведение. Переход к линеаризованной модели. Линеаризуя систему (1.1) в окрестности (1.2), полу- чим: n a11s¨ + a1,j+1γ¨j = u, j=1 n a1,i+1s¨ + ai+1,j+1γ¨j - biγi = 0, i = 1,..., n. j=1 Заметим, что можно исключить переменную s, выразив ее из 1-го уравнения системы (2.1): n s¨ = - a1,i+1 γ¨ + u (2.1) i=1 a11 i a11 и подставив во все остальные уравнения полученное выражение. Далее будем рассматривать по- следние n уравнений из системы (2.1), в которые входят только переменные γi: n Aij γ¨j - biγi = ciu, i = 1,..., n. j=1 Здесь 1 a Aij = ai+1,j+1 - 11 a1,i+1a1,j+1, i, j = 1,..., n, (2.2) ci = - a1,i+1 a11 , i = 1,..., n. Запишем линеаризованную систему в матричной форме: Aγ¨ - Bγ = cu, (2.3) где c = (c1,..., cn)T ∈ Rn, B - диагональная матрица размера n × n, B = diag{b1,..., bn}, все bi > 0. i,j=1 Утверждение 2.1. Матрица A = (Aij )n симметрична и положительно определена. 132 Л. А. МАНИТА, М. И. РОНЖИНА i,j=1 Доказательство. Симметричность вытекает из определения (2.2) матрицы A и симметричности матрицы квадратичной формы кинетической энергии A = (aij )n+1 . Покажем, что A - положи- тельно определенная матрица. Так как матрица A положительно определена, то для любого нену- левого вектора v ∈ Rn+1 выполняется неравенство (Av, v) > 0. Запишем это в координатной форме: n+1 n+1 ⎛n+1 ⎞ n+1 n+1 1 (Av, v) = aij vivj = a11v2 + 2v1 ⎝ a1j vj ⎠ + aij vivj . (2.4) i=1 j=1 j=2 i=2 j=2 Рассмотрим выражение (2.4) как квадратный трехчлен по переменной v1. Так как (Av, v) > 0, то соответствующий дискриминант должен быть отрицательным: ⎛n+1 ⎞2 ⎛n+1 n+1 ⎞ Отсюда 4 ⎝ a1j vj ⎠ j=2 - 4a11 ⎝ aij vivj ⎠ < 0. i=2 j=2 n+1 n+1 ⎛n+1 ⎞2 aij vivj > ⎝ a1j vj ⎠ /a11. (2.5) i=2 j=2 j=2 Теперь покажем, что (Ap, p) > 0 для всех ненулевых p ∈ Rn: n n n n ( 1 \\ (Ap, p) = Aij pipj = ai+1,j+1 - a11 a1,i+1a1,j+1 pipj = i=1 j=1 i=1 j=1 n n 1 n n = ai+1,j+1pipj - i=1 j=1 a11 a1,i+1a1,j+1pipj = i=1 j=1 2 n n 1 ⎛ n ⎞ = ai+1,j+1pipj - i=1 j=1 a11 ⎝ a1,j+1pj ⎠ j=1 . (2.6) Определим вектор v ∈ Rn+1: v1 = 0, vi+1 = pi, i = 1,..., n, и перепишем выражение (2.6): n n 1 ⎛ n ⎞2 n+1 n+1 ⎛n+1 ⎞2 1 ai+1,j+1pipj - i=1 j=1 в силу (2.5). a11 ⎝ a1,j+1pj ⎠ j=1 = aij vivj - i=2 j=2 a11 ⎝ a1j vj ⎠ > 0 j=2 Утверждение 2.2. Существует такая невырожденная замена координат, что систе- ма (2.3) приводится к виду x¨ - Λx = ud, (2.7) где x, d ∈ Rn, Λ - матрица размера n × n, Λ = diag{λ1, λ2,..., λn}, λ1 > 0,..., λn > 0. Доказательство. Так как A и B - симметричные положительно определенные матрицы, то су- i,j=1 ществует (см. [6]) такая невырожденная матрица L = (lij )n , что LT AL = E и LT BL = Λ, Λ = diag{λ1, λ2,..., λn}. Рассмотрим невырожденное преобразование γ = Lx. В координатах γ система (2.3) будет иметь вид По определению Λ = LT BL; отсюда x¨ - Λx = ud, d = LT c. n ji λi = l2 bj . j=1 Следовательно, λi > 0, так как bj > 0 для всех j = 1,..., n. Замечание. Если найдется di = 0 или λk = λl, k ⊕= l, то система (2.7) будет неуправляемой. В дальнейшем будем предполагать, что d1 ... dn ⊕= 0 и все λi, i = 1,..., n, различны. Без ограничения общности, в дальнейшем будем полагать, что di = 1, i = 1,..., n. ОПТИМАЛЬНЫЙ СИНТЕЗ В ЗАДАЧЕ УПРАВЛЕНИЯ ПЕРЕВЕРНУТЫМ МАЯТНИКОМ 133 При замене координат γ = Lx квадратичная форма в целевом функционале (1.3) примет вид (Kx, x), где K = (L)T L - симметричная положительно определенная матрица. Таким образом, будем исследовать решения следующей задачи оптимального управления. Задача оптимального управления. Существование и единственность решения. Миними- зировать функционал r∞ (Kx(t), x(t)) dt → min (3.1) на траекториях системы с начальными условиями 0 x¨(t) - Λx(t) = Iu(t), (3.2) x(0) = x0, x˙ (0) = y0. (3.3) Здесь управление u(t) - ограниченная скалярная управляющая функция: |u(t)| 1, (3.4) фазовые переменные x ∈ Rn, I - вектор, состоящий из единиц, K - постоянная симметричная положительно определенная матрица размера n × n, Λ - постоянная диагональная положительно определенная (n × n)-матрица, Λ = diag{λ1, λ2,..., λn}, λ1,..., λn > 0. Утверждение 3.1. Существует такая окрестность начала координат в пространстве R2n, что для всех начальных условий (x0, y0) из этой окрестности оптимальное решение в зада- че (3.1)-(3.4) существует и единственно и обладает следующим свойством: lim x(t) = 0, lim y(t) = 0. (3.5) t→∞ t→∞ Доказательство. Перепишем систему (3.2) следующим образом: (x˙ = y, y˙ = Λx + Iu. (3.6) Заметим, что для системы (3.6) выполнено свойство полной локальной управляемости, а именно, rk /b, Db,..., D(2n-1)b где b ∈ R2n, D - (2n × 2n)-матрица: = 2n, (3.7) b = (0,... 0,I)T , D = ( O E Λ O \\ ; (3.8) здесь O - нулевая, а E - единичная (n × n)-матрицы. Тогда найдется (см. [2]) такая окрестность B0 начала координат пространства R2n, что длявсех точек (x0, y0) из этой окрестности существует допустимое управление, которое переводит точку (x0, y0) в начало координат за конечное время. Повторяя рассуждения, проведенные в [19] для задачи минимизации интегрального функциона- ла на траекториях линейной управляемой системы, обладающей группой симметрий, получаем требуемое утверждение. Необходимые условия оптимальности. Применим к задаче (3.1)-(3.4) принцип максимума Понтрягина. Если (x(t), y(t), u(t)) - оптимальное решение, то существуют такие постоянная λ0 0 и непрерывные функции φ(t), ψ(t) со значениями в Rn (сопряженные переменные), что для почти всех u выполняется H(x(t), φ(t), ψ(t), u(t)) = max -1 u 1 H(x(t), φ(t), ψ(t), u), (4.1) где H - функция Понтрягина: λ0 H(x, y, φ, ψ) = - 2 (Kx, x) + (y, φ) + (Λx, ψ) + (I, ψ)u. 134 Л. А. МАНИТА, М. И. РОНЖИНА При этом сопряженные функции φ, ψ удовлетворяют системе ( φ˙ = λ0Kx - ΛT ψ, ψ˙ = -φ. (4.2) В дальнейшем мы будем пользоваться тем, что матрицы K и Λ симметричные, и знак транспони- рования опустим. Так как время T не фиксировано, то на оптимальной траектории H(x(t), y(t), φ(t), ψ(t)) = 0. Введем обозначения Тогда 0 2 1 H = - λ0 (Kx, x) + (y, φ) + (Λx, ψ), H = (I, ψ). H = H0 + uH1. Так как функция Понтрягина H линейна по управлению, то из условия максимума (4.1) следует, что оптимальное управление принимает значение -1 или +1 в зависимости от знака коэффи- циента H1 при управлении в функции Понтрягина. Если же найдется такой интервал времени (t1, t2), t1 < t2, на котором H1 ≡ 0, то соответствующее управление называется особым и для его определения необходимы дополнительные вычисления. Таким образом, наша задача - исследовать решения системы принципа максимума Понтрягина: ∂H x˙ = ∂φ ∂H y˙ = ∂ψ = y, = Λx + Iu, (4.3) φ˙ = - ∂H = λ Kx - Λψ ∂x 0 где - - ψ˙ = ∂H = φ, ∂y u(t) = sgn H1(t) = sgn(I, ψ(t)). (4.4) Утверждение 4.1. В задаче (3.1)-(3.4) множитель λ0 ⊕= 0. Доказательство. Предположим, что λ0 = 0. Выпишем систему принципа максимума Понтряги- на (4.3): ⎧ x˙ = y, ⎪ ⎪⎨ y˙ = Λx + Iu, φ˙ = -Λψ, ⎪ ⎪⎩ ψ˙ = -φ. (4.5) Если оптимальное решение не содержит особых участков, то оптимальное управление принимает значения ±1 и соответствующие траектории имеют вид x±(t) = c+(t)+ c-(t) ∓ Λ-1I, где / c±(t) = 1 c±e± 2 √ λ1t, c±e± n √ √ λ2t, ..., c±e± λnt T i и c± ∈ R. Но тогда не выполняются условия (3.5) утверждения 3.1. Предположим, что имеется особый участок с особым управлением uoc(t). В этом случае H1(t) = (I, ψ(t)) = 0, t ∈ (t1, t2), t1 < t2. ОПТИМАЛЬНЫЙ СИНТЕЗ В ЗАДАЧЕ УПРАВЛЕНИЯ ПЕРЕВЕРНУТЫМ МАЯТНИКОМ 135 Заметим, что систему (4.5) можно записать в виде ( x˙ y˙ \\ ( x \\ = D y + ub, ( φ˙ ψ˙ \\ = -D T ( φ \\ , ψ где b и D определены в (3.8). Поэтому условие (I, ψ(t)) = 0 эквивалентно условию / ( φ(t) b, ψ(t) \\\\ = 0. Так как на (t1, t2) все производные H1(t) в силу системы (4.5) обращаются в нуль, получим d / ( φ(t) dt b, ψ(t) \\\\ / = b, -DT ( φ(t) ψ(t) \\\\ / = - Db, ( φ(t) ψ(t) \\\\ = 0, d2 / ( φ(t) \\\\ d / ( φ(t) \\\\ dt2 b, ψ(t) = - dt / Db, ψ(t) = ( φ(t) \\\\ / ( φ(t) \\\\ = - ... Db, -DT ψ(t) = D2b, ψ(t) = 0, d2n-1 / ( φ(t) \\\\ d / (2n 2) ( φ(t) \\\\ dt2n-1 b, ψ(t) = D - b, dt / ψ(t) = ( φ(t) \\\\ / ( φ(t) \\\\ = D(2n-2)b, -DT ψ(t) = - D(2n-1)b, ψ(t) = 0. В силу условия локальной управляемости (3.7) получаем φ(t) = ψ(t) = 0, t ∈ (t1, t2), противоречие с принципом максимума Понтрягина. Следовательно, наше предположение не вы- полнено, и потому на оптимальной траектории λ0 ⊕= 0. В дальнейшем полагаем λ0 = 1. Особые режимы. Выход экстремалей на особую поверхность. Покажем, что в зада- че (3.1)-(3.4) имеются особые экстремали второго порядка. Напомним, что экстремаль z(t) = (x(t), y(t), φ(t), ψ(t)), т.е. решение системы (4.3) с управлением, удовлетворяющим условию мак- симума (4.4), является особой на интервале (t1,t2), если H1(z(t)) = 0, при всех t ∈ (t1,t2). Для того чтобы найти управление на особой экстремали (особое управление), будем дифференцировать тождество H1(z(t)) = H1(t) = 0, t ∈ (t1, t2) в силу системы (4.3) до первого появления управления: 2 3 dH1 = -(I, φ), d H1 = -(I, Kx - Λψ), d H1 = -(I, Ky + Λφ), dt d4H1 dt2 dt3 2 dt4 = -(I, K (Λx + Iu)+Λ (Kx - Λψ)) = = -(I, (KΛ+ ΛK) x) + (I, Λ ψ)- u(KI, I). (5.1) Управление с ненулевым коэффициентом появилось на четвертом шаге дифференцирования, сле- довательно, [19] особая экстремаль имеет порядок 2. Заметим, что коэффициент при управлении строго отрицателен, так как матрица K положительно определена. Поэтому выполнено необходи- мое условие Келли-Коппа-Мойера оптимальности особых экстремалей (см. [18]): 2q 1 k(z(t)) = (-1)q ∂ d 1 H (z(t)) 0, где q - порядок особой траектории. ∂u dt2q 1 1 1(4.3) Обозначим через S поверхность особых экстремалей второго порядка в задаче (3.1)-(3.4): S = { (I, ψ) = 0, (I, φ) = 0, (I, Kx - Λψ) = 0, (I, Ky + Λφ) = 0 } . (5.2) 136 Л. А. МАНИТА, М. И. РОНЖИНА Из последнего уравнения (5.1) определим управление на особых экстремалях: u (t) = -(I, (KΛ+ΛK) , x(t)) + (I, Λ2ψ(t)) σ oc где σ = (KI, I). Особое управление должно удовлетворять ограничению |u(t)| 1, поэтому будем рассматривать только ту часть особой поверхности S, для которой 1 1 1-(I, (KΛ+ ΛK) x) + (I, Λ2ψ)1 σ. (5.3) Заметим, что в окрестности начала координат условие (5.3) выполнено. Известно следующее утверждение о типе сопряжения особых и неособых экстремалей. Теорема 5.1 (Келли, Копп, Мойер [18]). Пусть особая экстремаль z(t) системы (4.3) имеет порядок 2 и выполнено условие Келли-Коппа-Мойера в строгой форме: k(z(t)) < 0. Если управление u(t) на экстремали z(t) является C∞-гладкой функцией, то экстремаль z(t) не может сопрягаться с неособой кусочно-гладкой траекторией системы (4.3), если управление разрывно в точке сопряжения особого и неособого участков. Для задачи (3.1)-(3.4) все условия теоремы Келли-Коппа-Мойера выполняются, следователь- но, если неособая и особая экстремали сопрягаются, то неособая дуга должна содержать беско- нечное число точек переключения управления. Покажем, что для начальных условий из некоторой окрестности начала координат неособые оптимальные траектории задачи (3.1)-(3.4) выходят на особую поверхность. Предположим, что систему уравнений принципа максимума (4.3) можно привести к следующему виду: z˙1 = z2, z˙2 = z3, w˙ = F (z, w, u), z˙3 = z4, z˙4 = α(z, w)+ uβ(z, w), u = sgn z1, (5.4) где система функций z1, z2, z3, z4, w функционально независима. Теорема 5.2 (о расслоении, [7]). Пусть в окрестности особой траектории второго порядка система уравнений принципа максимума Понтрягина может быть приведена к виду (5.4). Пусть в некоторой области выполнены неравенства β(0, w0) < 0, |α(0, w0)| < -β(w0). w Тогда существует такая открытая окрестность O точки w0, что для любого w ∈ O че- рез точку (0, w) проходит некоторое однопараметрическое семейство решений системы (5.4). Траектории этого семейства заполняют двумерное многообразие N +, гомеоморфное R2. Каж- w дая траектория внутри N + при ходит в точку (0, w) за конечное время после счетного числа решений (5.4) w пересечений с поверхностью разрыва z1 = 0. Кроме того, другое семейство N - выходит из точки (0, w0), также имея счетное число переключений на конечном интервале времени. Точки переключения N ± заполняют две кусочно-гладкие кривые Γ±. Объединение всех под- w w N w многообразий J ± w∈O гладкими слоями. наделено структурой расслоения с базой O и двумерными кусочно- Покажем, что задача (3.1)-(3.4) удовлетворяет условиям теоремы о расслоении. Введем следующие переменные: n n n n z1 = ψi, z3 = - kij xi + λiψi, i=1 i=1 j=1 i=1 n n n n (5.5) z2 = - φi, z4 = - kij yi - λiφi, i=1 i=1 j=1 i=1 ОПТИМАЛЬНЫЙ СИНТЕЗ В ЗАДАЧЕ УПРАВЛЕНИЯ ПЕРЕВЕРНУТЫМ МАЯТНИКОМ 137 - 1 1 ω1 = x1, ω2n 1 = λ2ψ , . . . ... 2 ωn-1 = xn-1, ω3n-3 = λn-1ψn-1, - 1 1 ωn = y1, ω3n 2 = -λ2φ , (5.6) . . . ... 2 ω2n-2 = yn-1, ω4n-4 = -λn-1φn-1. Функции zi, i = 1, 2, 3, 4, функционально независимы в окрестности особого решения второго порядка, а ωj , j = 1,..., 4n - 4, дополняют z1, z2, z3, z4 так, чтобы матрица Якоби отображения (x, y, φ, ψ) → (z, ω) была невырожденной. В координатах (z, ω) система (4.3)-(4.4) перепишется в следующем виде: z˙1 = z2, n-1 z˙2 = z3, z˙3 = z4, z˙4 = (ciωi + c2n-2+iω2n-2+i)+ s1z1 + s3z3 - σu, i=1 ω˙ i = ωn-1+i, ω˙ n-1+i = λiωi + u, i = 1,...,n - 1, ω˙ 2n-2+i = ω3n-3+i, i = 1,...,n - 1, n-1 ω˙ 3n-3+i = (c˜ij ωj + c˜i(2n j=1 -2+j)ω2n-2+j )+ s˜i1z1 + s˜i3z3, i = 1,...,n - 1, u = sgn z1, где постоянные ci, c2n-2+i, s1, s3, c˜ij , c˜i(2n-2+j), s˜i1, s˜i3, i, j = 1,...,n - 1, определяются из (5.5)-(5.6). Обозначим n-1 α(z, ω) = (ciωi + c2n-2+iω2n-2+i)+ s1z1 + s3z3, β(z, ω) = -σ. i=1 При ω0, достаточно близком к нулю, выполняется 1n 1 - 1 |α(0, ω0)| = 1 1 - - 1 (ciω0,i + c2n 2+iω0,2n 2+i 1 0 1 1 i=1 )1 <σ = -β(0,ω ). 1 Поэтому применима теорема 5.2 о расслоении. Следовательно, в некоторой окрестности начала координат пространства (z, ω) существует расслоение с базой S с двумерными кусочно гладкими слоями, заполненными траекториями с учащающимися переключениями, т.е. в достаточно ма- лой окрестности начала координат решения системы уравнений принципа максимума за конечное время с бесконечным числом переключений выходят на особую поверхность. Движение по особой поверхности. Перепишем уравнения, определяющие особую поверх- ность S, в координатной форме: n ψi = 0, i=1 n φi = 0, i=1 n n n - i=1 j=1 kij xi + i=1 λiψi = 0, (6.1) n n n - i=1 j=1 kij yi - i=1 λiφi = 0. 138 Л. А. МАНИТА, М. И. РОНЖИНА Выразим из системы (6.1) ψ1,2 и φ1,2: 1 n 1 n λ ψ1 = 1 - λ2 i=3 λ (λ2 - λi)ψi + 1 - λ2 i,j=1 kij xi, 1 n 1 n λ ψ2 = - 1 - λ2 i=3 λ (λ1 - λi)ψi - 1 - λ2 i,j=1 kij xi, (6.2) 1 n 1 n λ φ1 = 1 - λ2 i=3 λ (λ2 - λi)φi - 1 - λ2 i,j=1 kij yi, 1 n 1 n λ φ2 = - 1 - λ2 i=3 λ (λ1 - λi)φi + 1 - λ2 i,j=1 kij yi. Подставим полученные выражения в формулу для особого управления: ⎛ n n n ⎞ 1 uoc = σ ⎝- i=1 j=1 kij (λi + λj - (λ1 + λ2))xi + i=3 (λ1 - λi)(λ2 - λi)ψi⎠ . (6.3) Запишем гамильтонову систему (4.3) на особой поверхности, используя (6.2)-(6.3): ⎧ x˙ k = yk , ⎛ ⎞ ⎪ n n n ⎪ ⎪ 1 ⎪ ⎪ σ y˙k = λk xk + ⎝- ⎪ ⎪ ⎨ i=1 j=1 kij (λi + λj - (λ1 + λ2))xi + i=3 (λ1 - λi)(λ2 - λi)ψi⎠ , k = 1,..., n, (6.4) ψ ⎪ ⎪ ˙ = -φ , k k ⎪ n ⎪ ⎪ φ˙ = ⎪⎪ k ⎩ j=1 kkj xj - λk ψk , k = 3,..., n. Можно записать матрицу системы (6.4) в виде On×n En On×(n-2) On×(n-2) Ω On×n Y On×(n-2) ⎛ ⎜ ⎜O(n-2)×n O(n-2)×n O(n-2)×(n-2) -En-2 ⎞ ⎟ ⎟ , (6.5) ⎝ K¯ O (n-2)×n -Λ¯ O ⎠ (n-2)×(n-2) где Oi×j - нулевая матрица размера i × j, En - единичная (n × n)-матрица, ⎛(λ1 - λ3)(λ2 - λ3) ... (λ1 - λn)(λ2 - λn) ⎞ ⎜ σ σ ⎟ ⎛λ1 + b1 b2 ... bn ⎞ ⎜ ⎟ ⎜(λ - λ )(λ - λ ) (λ - λ )(λ - λ ) ⎟ ⎟ Ω = ⎜ b1 λ2 + b2 ... bn ⎜ 1 , Y = ⎜ 3 2 3 ... 1 n 2 n ⎟ ⎟ ⎜ . ⎜ .. ⎝ . . . ⎟ . ⎜ . ⎟ ⎜ σ . ⎠ ⎜ .. ⎟ o , ⎟ . . . .. ⎟ ⎜ ⎟ b1 b2 ... λn + bn ⎜ . . ⎟ ⎜ ⎟ ⎝(λ1 - λ3)(λ2 - λ3) σ 1 n ... (λ1 - λn)(λ2 - λn) ⎠ σ σ bi = - j=1 kij (λj - (λ1 + λ2)+ λi), ⎛k13 ... k3n ⎞ ⎛-λ3 0 ⎞ K¯ = ⎜ .. . . .. ⎟ ⎜ . . ⎟ ⎝ . . ⎝ . ⎠ , -Λ¯ = . ⎠ . k1n ... knn 0 -λn ОПТИМАЛЬНЫЙ СИНТЕЗ В ЗАДАЧЕ УПРАВЛЕНИЯ ПЕРЕВЕРНУТЫМ МАЯТНИКОМ 139 Утверждение 6.1. Характеристический многочлен матрицы (6.5) имеет вид 1 где P (μ) = σ ⎛ (Km (μ) ,m (μ)), ⎞T n n n-1 ⎜ m (μ) = ⎜тт(λk - μ2), ⎟ тт(λk - μ2), ..., тт(λk - μ2)⎟ . ⎝k=2 Доказательство. По определению 1 k=1 k±=2 1 k=1 ⎠ 1 1 P (μ) = 1 -μEn En On×(n-2) On×(n-2)1 1 Ω -μEn Y On×(n-2)1 = 1 1 1O(n-2)×n O(n-2)×n -μEn-2 -En-2 1 1 1 1 K¯ O(n-2)×n -Λ¯ 1 -μEn-2 1 1 1 -μEn En On×(n-2) On×(n-2) 1 = 1 1Ω - μ2En On ×n Y On ×(n 1 -2) 1 = 1 1 1 O(n-2)×n O(n-2)×n -μEn-2 -En-2 1 - × - K 1 1 ¯ O(n 2) n μ2En 2 - Λ¯ 1 O(n-2)×(n-2)1 1 1Ω - μ2En Y On ×(n 1 -2) 1 1Ω - μ2En Y 1 = (-1)n 1 O(n 2) n -μE -E 1 = - 1 1 . 1 - × n-2 n-2 1 1 2 1 K 1 1 ¯ μ2En -2 - Λ¯ 1 O(n-2)×(n-2)1 1 K¯ μ En-2 - Λ¯ 1 Следовательно, с точностью до знака, определитель P (μ) имеет вид 1 1 1λ1 + b1 - μ2 b2 ... bn (λ1 - λ3)(λ2 - λ3) ... 1 (λ1 - λn)(λ2 - λn) 1 1 1 σ σ 1 1 1 1 b1 λ2 + b2 - μ2 ... bn (λ1 - λ3)(λ2 - λ3) ... 1 (λ1 - λn)(λ2 - λn) 1 1 1 1 1 1 ... 1 1 ... . . . ... σ ... 1 o 1 1 1 . . . ... 1 1 . 1 1 1 b1 b2 ... λn + bn - μ2 (λ1 - λ3)(λ2 - λ3) ... 1 (λ1 - λn)(λ2 - λn) 1 1 1 σ σ 1 1 1 2 1 1 1 k13 k23 ... k3n μ - λ3 0 1 . . . 1 . . 1 . . 1 . . . .. ... . . . 1 . .. 1 1 1 k1n k2n ... knn 0 μ2 - λn 1 Вычтем n-ю строку из первых n - 1 строк; получим 1 1 - μ2 0 ... μ2 - λn 0 ... 0 0 ... λ2 - μ2 ... ... . . . μ2 - λn ... 0 ... ... ... 0 ... 1λ1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 ... μ2 1 1 1 - λn 0 ... 0 1 1 P (μ) = 1 1 1 b1 b2 ... λn + bn - μ2 (λ1 - λ3)(λ2 - λ3) ... 1 (λ1 - λn)(λ2 - λn) 1 . 1 1 σ σ 1 1 2 1 1 k13 k23 ... k3n μ 1 1 - λn 0 1 . . . 1 . . 1 . . 1 . . . .. . . . 1 . . . . . . 1 1 1 k1n k2n ... knn 0 μ2 - λn 1 Применим теорему Лапласа о вычислении определителей (см. [12]): n n n (λ1 - λi)(λ2 - λi) σ P (μ) = |M0| тт(μ2 - λj ) - |Mi| тт(μ2 - λj ), (6.6) j=3 i=3 j=1 j±=i 140 Л. А. МАНИТА, М. И. РОНЖИНА где 1 1 1 1 1λ1 - μ2 0 ... μ2 - λn 1 1λ1 - μ2 0 ... μ2 - λn1 1 1 1 0 λ2 - μ2 ... μ2 - λn 1 1 1 1 0 λ2 - μ2 ... μ2 - λn1 1 .. .. . . . .. 1 1 .. .. . . .. 1 |M0| = 1 . . . 1 1 . . . . 1 1 1 , |Mi| = 1 1 . 1 1 1 0 0 ... μ2 - λn 1 1 1 1 0 0 ... μ2 - λn1 1 1 1 b1 b2 ... λn + bn - μ21 1 1 1 ki1 ki2 ... kin 1 Вычислим |Mi|, последовательно раскладывая по первому столбцу: 1 1 1λ2 - μ2 ... μ2 - λn1 1 1 1 1 0 ... 0 - μ2 ... ... . . . 0 . . . 0 ... 2 λn-1 - μ 1 0 ... μ2 - λn1 1 1λ2 μ2 - λn1 μ2 - λn1 |Mi| = (λ1 - μ2) 1 . . 1 + (-1)n+1ki1 1 1 = 1 .. 1 . . . .. 1 1 1 1 1 .. 1 1 0 ... μ2 - λn1 1 . 1 1 1 1 1 1 1 1 ki2 ... kin 1 1 1 1 μ2 - λn1 1λ2 - μ2 ... μ2 - λn1 1 1 1 0 ... μ2 - λn1 = (λ1 - μ2) . + ki1(λ2 - μ2) ··· (λn - μ2) = . 1 1 1 1 1 . . . . ... 1 1 1 1 0 ... μ2 - λn1 1 1 1 ki2 ... kin 1 1 1 1λ3 - μ2 ... μ2 - λn1 1 1 1 0 ... μ2 - λn1 = (λ1 - μ2)(λ2 - μ2) . . 1 1 1 . . . . ... 1 1 1 + ki2(λ1 - μ2)(λ3 - μ2) ... (λn - μ2)+ 1 1 1 0 ... μ2 - λn1 1 1 1 ki3 ... kin 1 + ki1(λ2 - μ2) ... (λn - μ2) = ··· = kin(λ1 - μ2)(λ2 - μ2) ··· (λn - 1 - μ2)+ Таким образом, + ··· + ki2(λ1 - μ2)(λ3 - μ2) ··· (λn - μ2)+ ki1(λ2 - μ2) ··· (λn - μ2). n n |Mi| = kij тт (λl - μ2) . j=1 l=1 l±=j Так как M0 и Mi отличаются только последней строкой, то |M0| получается из |Mi| заменой kij на 1 n и kin на σ bj = - i=1 kij (λj - (λ1 + λ2)+ λi), j = 1,...,n - 1, Следовательно, λn + bn - μ2 = λn - μ2 - 1 n σ kij (λn - (λ1 + λ2)+ λi). i=1 n 1 n n σ |M0| = тт(λl - μ2) - kij (λj - (λ1 + λ2)+ λi) тт(λl - μ2). l=1 i,j=1 l=1 l±=j n Подставляя в (6.6) выражения для |M0| и |Mi| и домножая все на σ = ), i,j=1 kij , получим n n σP (μ) = kij (λ1 - μ2)(λ2 - μ2) тт(λk - μ2)2- i,j=1 k=3 ОПТИМАЛЬНЫЙ СИНТЕЗ В ЗАДАЧЕ УПРАВЛЕНИЯ ПЕРЕВЕРНУТЫМ МАЯТНИКОМ 141 n n n - kij (λj + λi - (λ1 + λ2))(λ1 - μ2)(λ2 - μ2)(λi - μ2) тт(λk - μ2)2- j=1 i=3 n - k2j (λj - λ1)(λ1 - μ2) n тт(λk - μ2)2 - k=3 k±=i n k1j (λj - λ2)(λ2 - μ2) n тт(λk - μ2)2+ j=1 k=3 n n j=1 k=3 n + kij (λ1 - λi)(λ2 - λi)(λi - μ2)(λj - μ2) j=1 i=3 Заметим, что выражение (6.7) можно представить в виде n kij rij , i,j=1 тт (λk - μ2)2. (6.7) k=1 k±=i,j где rij - некоторые коэффициенты, зависящие от λ1,..., λn и μ2. Прямые вычисления дают n n rii = тт(λk - μ2)2, rij = (λi - μ2)(λj - μ2) тт(λk - μ2)2. k=1 k±=i Так как матрица K симметрична, то можно записать k=1 k±=i k±=j n n n n σP (μ) = kii тт(λk - μ2)2 +2 kij (λi - μ2)(λj - μ2) тт(λk - μ2)2. (6.8) Положим i=1 k=1 k±=i ⎛ n i,j=1 i<j n n-1 k=1 k±=i k±=j ⎞T ⎜ m(μ) = ⎜тт(λk - μ2), ⎟ тт(λk - μ2), ..., тт(λk - μ2)⎟ . ⎝k=2 Тогда σP (μ) = (Km (μ) ,m (μ)). k=1 k±=2 k=1 ⎠ Утверждение 6.2. У матрицы системы (6.5) собственные значения симметричны относи- тельно мнимой оси, среди собственных значений нет чисто мнимых и чисто вещественных. Доказательство. Рассмотрим характеристическое уравнение для матрицы (6.5): P (μ) = 0. Если μ ∈ R, то m(μ) ∈ Rn и m(μ) ⊕= 0, так как все λk различны. В силу утверждения 6.1 и положи- тельной определенности матрицы K имеем P (μ) = (Km(μ), m(μ)) > 0, т.е. у характеристического уравнения нет вещественных корней. Покажем, что нет и чисто мнимых корней. Пусть μ = iν, ν ∈ R; тогда ⎛ ⎞ n n n-1 ⎜ m(μ) = ⎜тт(λk + ν2), ⎟ тт(λk + ν2), ..., тт(λk + ν2)⎟ ∈ Rn ⎝k=2 k=1 k±=2 k=1 ⎠ и m(μ) ⊕= 0, так как все λk > 0. Отсюда, аналогично предыдущему, P (μ) = (Km(μ), m(μ)) >, 0 т.е. у характеристического уравнения нет чисто мнимых корней. Симметричность собственных значений относительно мнимой оси очевидна из представле- ния (6.8). 142 Л. А. МАНИТА, М. И. РОНЖИНА Таким образом, ровно 2n-2 собственных значений имеют строго положительную вещественную часть и 2n - 2 собственных значений имеют строго отрицательную вещественную часть (мнимые части отличны от нуля). Рассмотрим только те собственные значения, которым соответствуют устойчивые решения (6.4), т.е. с отрицательной вещественной частью. i Обозначим через h+, i = 1,..., 2n - 2, собственные векторы системы (6.4), соответствующие i собственным значениям с положительной вещественной частью, а через h-, i = 1,..., 2n - 2,- собственные векторы системы (6.4), соответствующие собственным значениям с отрицательной вещественной частью. - Пусть N ∗ - (2n 2)-мерное инвариантное подпространство, порожденное собственными векто- - рами {h- 2n-2. Подпространство N ∗ заполнено траекториями системы (6.4), которые имеют вид i i=1 - спиралей и при возрастании времени асимптотически приближаются к началу координат. Инвариантное подпространство N ∗ , порожденное собственными векторами {h+ 2n-2, также + i i=1 имеет размерность 2n - 2 и заполнено траекториями системы (6.4), которые при возрастании времени удаляются от начала координат. Таким образом, для начальных условий, достаточно близких к нулю, мы построили траекто- рии, удовлетворяющие принципу максимума Понтрягина и стремящиеся к началу координат при t → +∞. Допустимые экстремали состоят из неособого участка, который за конечное время с бес- конечным числом переключений управления выходит на особую поверхность, а затем движение продолжается по особому участку. Глобальная оптимальность решений. Покажем, что для задачи (3.1)-(3.4) при дополни- тельном предположении принцип максимума Понтрягина является достаточным условием. Всюду ниже мы предполагаем, что для рассматриваемых начальных условий оптимальное решение суще- ствует. Утверждение 7.1. Если (x∗(t), y∗(t), φ∗(t), ψ∗(t), u∗(t)) - решение системы уравнений прин- ципа максимума Понтрягина, x∗(0) = x0, y∗(0) = y0 и при t → +∞ x∗(t) → 0, y∗(t) → 0, φ∗(t) → 0, ψ∗(t) → 0, то (x∗(t), y∗(t), u∗(t)) - оптимальное решение задачи (3.1)-(3.4). Доказательство. Предположим, что дляначальной точки (x0, y0) оптимальным является решение y(t), u(t)). Докажем, что 1 r∞ x, x - Kx∗, x∗ ) dt 0. Легко видеть, что Δ = 2 ( K 0 x, x - Kx∗, x∗ 2 Kx∗, - x∗ . Поэтому K x r∞ r∞ x x Δ 0 Интегрируем по частям: Kx∗, - x∗ dt = 0 r∞ φ˙∗ + Λψ∗, - x∗ dt. r∞ x 1∞ - - Δ φ∗, x∗ 1 10 0 y x φ∗, - y∗ dt + 0 Λψ∗, - x∗ dt. x(0) Внеинтегральные слагаемые обращаются в нуль, так как x∗(0) = x( = x0 и функции x∗(t), t), ∗ ˙∗ φ (t) стремятся к нулю при t → ∞. Теперь воспользуемся тем, что ψ интеграл по частям: = -φ∗, и вычислим первый ∞ Δ ψ∗, - y∗ 10 - r∞ ψ∗, Λ( - x∗)+ (u - u∗)I dt + r∞ Λψ∗, - x∗ dt. y 1 x x 0 0 ОПТИМАЛЬНЫЙ СИНТЕЗ В ЗАДАЧЕ УПРАВЛЕНИЯ ПЕРЕВЕРНУТЫМ МАЯТНИКОМ 143 y(0) Внеинтегральные слагаемые обращаются в нуль, поскольку y∗(0) = = y0 и функции y∗(t), y(t), ψ∗(t) стремятся к нулю при t → ∞. Отсюда получаем r∞ u) Δ ψ∗, (u∗ - I dt. 0 Так как u∗(t) удовлетворяет условию максимума (4.4) для экстремали (x∗(t), y∗(t), φ∗(t), ψ∗(t)), то Δ 0. Таким образом, значение функционала (3.1) на траектории (x∗(t), y∗(t)) не хуже, чем на оптимальной траектории ( t), t)). x( y( ( ) В силу утверждения 3.1 решение (t),y (t),u (t) является оптимальным для задачи (3.1)- (3.4). x∗ ∗ ∗ Результаты, полученные в разделах 3-7, приводят к следующей теореме. Теорема 7.1. Для начальных положений из малой окрестности начала координат опти- мальные решения в задаче (3.1)-(3.4) устроены следующим образом: за конечное время неосо- бые траектории с бесконечным числом переключений управления за конечное время выходят на особую поверхность второго порядка, затем траектория с особым управлением остает- ся на особой поверхности, асимптотически приближаясь к началу координат, когда время стремится к бесконечности.×
Об авторах
Л. А. Манита
Национальный исследовательский университет «Высшая школа экономики»; Московский институт электроники и математики
Email: lmanita@hse.ru
Москва, Россия
М. И. Ронжина
Московский государственный университет им. М. В. Ломоносова
Email: maryaronzhina@gmail.com
Москва, Россия
Список литературы
- Аврейцевич Я., Василевский Г., Кудра Г., Решмин С. А. Эксперимент по раскачиванию двойного маятника управлением с обратной связью// Изв. РАН. Сер. Теор. и сист. управл. - 2012. - 2. - С. 10-16.
- Болтянский В. Г. Математические методы оптимального управления. - M.: Наука, 1969.
- Борисов В. Ф., Зеликин М. И. Режимы учащающихся переключений в задачах оптимального управления// Тр. МИАН. - 1991. - 197. - С. 85-166.
- Борисов В. Ф., Зеликин М. И., Манита Л. А. Оптимальный синтез в бесконечномерном пространстве. Дифференциальные уравнения и топология. II// Тр. МИАН. - 2010. - 271. - С. 40-58.
- Боршевский М. З., Иослович И. В. К задаче оптимального по быстродействию торможенияосесимметричного твердого тела около центра масс// Прикл. мат. мех. - 1985. - 49, вып. 1. - С. 35-42.
- Гельфанд И. М. Лекции по линейной алгебре. - M.: Наука, 1971.
- Зеликин М. И., Борисов В. Ф. Особые оптимальные режимы в задачах математической экономики// Совр. мат. и ее прилож. - 2003. - 11. - С. 3-161.
- Капица П. Л. Маятник с вибрирующим подвесом// Усп. физ. наук. - 1951. - 44, вып. 5. - С. 7-20.
- Локуциевский Л. В. Гамильтоновость потока особых траекторий// Мат. сб. - 2014. - 205, № 3. - С. 133-160.
- Манита Л. А. Оптимальный особый режим и режим с учащающимися переключениями в задаче управления колебаниями струны с закрепленными концами// Прикл. мат. мех. - 2010. - 74, № 5. - С. 873-880.
- Мартыненко Ю. Г., Формальский А. М. Управляемый маятник на подвижном основании// Изв. РАН. Сер. Мех. тв. тела. - 2013. - 1.- С. 9-23.
- Михалев А. ., Михалев А. В. Начала алгебры. Ч. I. - М., 2009.
- Осипов С. Н., Формальский А. М. Задача о быстрейшем повороте манипулятора// Прикл. мат. мех. - 1988. - 52, вып. 6. - С. 929-933.
- Решмин С. А., Черноусько Ф. Л. Оптимальное по быстродействию управление перевернутым маятником в форме синтеза// Изв. РАН. Сер. Теор. сист. управл. - 2006. - 3. - С. 51-62.
- Формальский А. М. О стабилизации двойного перевернутого маятника при помощи одного управляющего момента// Изв. РАН. Сер. Теор. сист. управ. - 2006. - 3. - С. 5-12.
- Формальский А. М. О глобальной стабилизации двойного перевернутого маятника с управлением в межзвенном шарнире// Изв. РАН. Сер. Мех. тв. тела. - 2008. - 5.- С. 3-14.
- Cherkasov O. Yu., Yakushev A. G. Singular arcs in the optimal evasion against a proportional navigation vehicle// J. Optim. Theory Appl. - 2002. - 113, № 2. - С. 211-226.
- Kelley H. J., Kopp R. E., Moyer H. G. Singular extremals// В сб.: «Topics in optimization». - N.Y.: Acad. Press, 1967. - С. 63-103.
- Zelikin M. I., Borisov V. F. Theory of chattering control with applications to astronautics, robotics, economics and engineering. - Boston-Basel-Berlin: Birkha¨user, 1994.