Efficient control of the direction of thrust during highspeed maneuver in the plane

Cover Page

Cite item

Full Text

Abstract

The controlled motion of an inertial object during a high-speed maneuver in a vertical plane is investigated. The generated thrust is limited in magnitude, the control is the angle that sets its direction, the initial velocity is generally non-zero, and external forces are not considered. The goal is to maximize the horizontal velocity projection at a given final moment of time with the simultaneous fulfillment of two terminal conditions: bringing the object to a given height and damping the vertical velocity projection. Similar tasks often arise when controlling mechanical objects with modulo-limited thrust. The research is relevant, as it is aimed at ensuring both the efficiency of the desired algorithm and the simplicity of its calculation and implementation. In this case, the methods of the mathematical theory of optimal control are used. As a result, a solvability condition for the problem posed is obtained, which is related to the minimum possible time of motion in the dual timeoptimal control problem. In the law of optimal control, based on the so-called law of fractional linear tangent, an analytical relationship between two integration constants is found, which makes it possible to reduce the procedure for determining these constants to the numerical solution of only one transcendental equation. An appropriate comparative analysis of the trajectories was carried out and conclusions were drawn that one of the proposed suboptimal strategies is more effective.

Full Text

Введение В данной работе в качестве объекта управления рассматривается материальная точка постоянной массы в плоскости при выведении ее на прямолинейную траекторию (рис. 1), предметом исследования являются особенности управлениями такого рода объектами при использовании закона дробно-линейного тангенса, дополнительно приводятся релейные субоптимальные законы. В общем случае считается, что начальные скорости не равны нулю, то есть требуется выбрать управление таким образом, чтобы перевести объект на указанную выбранную прямую и по возможности максимизировать продольную скорость. Поэтому при решении целесообразно использовать принцип максимума [1; 2]. Ранее оптимальное решение аналогичной задачи в случае нулевой начальной скорости ипостоянной тяги было получено в [3; 4]. В [5] приведена задача с переменной реактивной тягой. Существует множество алгоритмов и законов, которые могут быть использованы для управления ракеты-носителя, максимизации скорости или минимизации топливных затрат, однако не все из них возможно реализовать [6]. Одним из часто используемых оптимальных законов управления является закон дробно-линейного тангенса (bilinear tangent steering law) [7]. Несмотря на то, что применение ограничивается моделью плоской Земли и плоского движения, его действительно можно использовать для задач наведения ракет [8, 9]. Так, в [10] подробно изложено практическое применение на примере управления системой CentaurD1A. В явном виде уравнения были впервые показаны в [11; 12], а учет гравитационных эффектов разобран в [13]. Отметим, что существует связь рассматриваемой задачи управления тягой с другими известными задачами оптимального управления механическими системами с одной степенью свободы [14]. Также закон дробно-линейного тангенса может появляться в некоторых других задачах механики [15]. Вместе с тем литература, посвященная рассмотрению закона дробно-линейного тангенса, обделена подробными теоретическими выкладками с точки зрения математических ограничений, например условия разрешимости для ненулевых начальных условий; кроме этого, в нашей работе в качестве замены оптимального законы были введены релейные управления, имеющие более простую структуру и не уступающие в эффективности на больших временах. При этом исследованы две возможные стратегии. В первом случае объект сначала переводился за минимальное время на заданную высоту с нулевой проекцией вертикальной скорости, а только потом разгонялся вдоль горизонтали. Такое управление имеет максимум два переключения. Во втором случае допустимая величина вертикальной проекции тяги намеренно уменьшалась так, чтобы заданное время процесса управления совпало с минимально возможным временем, которое необходимо для выполнения двух рассматриваемых граничных условий. Соответствующее управление имеет максимум одно переключение, причем разгон вдоль горизонтали происходит на всех временных участках. Оно оказалось более эффективным. Рис. 1. Схема движения Figure 1. Movement scheme 1. Цель Рассматривается система уравнений (1) совместно с граничными условиями (2), моделирование траектории движения проводилось путемчисленного решения этой системы. Функционал, который характеризует качество управления и траектории, задан выражением (3). = , = , = cos ( ), = sin ( ), (1) (0) = = 0, (0) = = 0, (0) = , (0) = , ( ) = ℎ, ( ) = 0, (2) = ( ) → max, (3) где , - координаты, , - соответствующие проекции скорости, - постоянное ускорение системы, ( ) - направление тяги (искомая кусочно-непрерывная функция времени), - начальная горизонтальная проекция скорости, - начальная вертикальная проекция скоро- сти, ℎ - требуемая высота подъема, ( ) - значение функционала в конечный момент времени . Тяга велика, поэтому влиянием силы тяжести на динамику пренебрегли. Задача состоит в управлении направлением тяги ( ) таким образом, чтобы перевести объект на траекторию, параллельную оси Ox и отстоящую от нее на расстояние ℎ, и по возможности максимизировать продольную скорость ( ). 2. Материалы и методы исследования Использовались методы исследования: теоретическая часть включает анализ литературных источников; эмпирическая - создание программного кода на языке Python для нахождения параметров управления и численного решения системы дифференциальных уравнений с использованием встроенных математических и научных библиотек. 3. Результаты В (1), (2) перейдем к безразмерным переменным: = ℎ, = ℎ , , ′, = ′ ℎ/ , = ′ ℎ/ . Если в полученной системе опустить штрих, то она совпадет с (1), (2), но будет выполнены дополнительные равенства ℎ = 1, = 1. Поэтому далее считаем существенными только два параметра: , . В ходе решения соотношений принципа максимума установлена связь между константами интегрирования в законе оптимального управления № 1 (т.е. в так называемом законе дробно-линейного тангенса [3; 4]): ( ) = arctg(- + tg ), = , ( (0) = ). Показано, что определение параметра сводится к численному решению всего лишь одного трансцендентного уравнения, как и в случае начальной нулевой скорости [3; 4]. Получено условие разрешимости задачи в виде неравенства ≥ (ℎ, , ), где - минимальное время, необходимое для выполнения граничных условий. Так как в предельном случае, когда = , тяга направлена вдоль вертикали, то выражение для функции определяется так же (см. (4)), как и выражение для функции Беллмана в задаче быстродействия для одномерного объекта, движущегося вдоль прямой и приводимого в начало координат фазовой плоскости при помощи ограниченного по модулю управления [2]. Для определения минимального времени вводится вспомогательная функция ψ , = - ℎ + ⋅ , при этом ψ , = 0 задает кривую переключений. при ψ , v ≥ 0, = (4) при ψ , v < 0. Субоптимальное управление № 2 релейное (максимум с двумя переключениями) и представляет собой синтез двух управлений: сначала за время система наискорейшим образом перево- дится в требуемое состояние yT( min ) =h v T, y( min ) = 0 (( ) =π/2, t∈[0,Tmin]), причем на этом этапе может быть максимум одно переключение, а потом, после дополнительного переключения внуль, обеспечивается равноускоренный разгон вдоль горизонтальной оси ( ( ) = 0, ∈ [ , ]). Результаты численных расчетов представлены на рис. 2 в виде графика зависимости функционала от начальной вертикальной проекции скорости и времени движения. При этом начальная горизонтальная проекция скорости предполагалась нулевой; синяя линия - граница области допустимых значений аргументов, которая определяется равенствами = , = 0. Рис. 2. Зависимость от параметров , при субоптимальном управлении № 2: = 0,5 м/с , ℎ = 100 м, = 200 с Figure 2. Dependence on parameters , under suboptimal control № 2: = 0.5 m/s , ℎ = 100 m, = 200 s Рассмотрим субоптимальное управление № 3 релейное (максимум с одним переключением). Структуру зададим в следующем виде, предварительно введя обозначение = sin и функцию переключения | | ψ ( , , ) = ( - ℎ) + ; - ( ) = , , 0 ≤ ≤ , < ≤ , при ψ , , ≥ 0, = , = ; (5) при ψ , , < 0, = , = -. (6) Субоптимальное управление № 3 позволяет ограничить проекцию тяги на вертикальную ось и обеспечить равноускоренный разгон вдоль горизонтальной оси в течение всего процесса. Приведем лемму без доказательств. Лемма 1. Пусть X - параметр субоптимального закона управления (5), (6), соответствующий заданному времени процесса T. Тогда функция T(X) монотонно убывает, а следовательно 0 < ≤ , ≥ . (7) Также приведем теорему для правильного выбора последовательности знаков управления и процедуру определения значений параметра X для трех разных диапазонов начальных скоростей: Теорема 1. В случае малых положительных начальных скоростей существует пороговая длительность процесса , (8) разбивающая полубесконечный интервал допустимых значений ≥ на две части с разными вариантами переключения управления (5), (6): - , если ≥ ∗, (0) = , если < ∗, при 0 < < -2 ( - ℎ). (9) В случае больших положительных начальных скоростей существует только один вариант переключения: (0) = - при В случае неположительных начальных скоростей также существует только один вариант переключения: (0) = при ≤ 0. (11) Формулы (16) и (20) позволяют найти параметр X в случаях, когда должно быть (0) = - и (0) = соответственно. Доказательство. Предположим, что ψ ( , , ) ≥ 0. (12) (В области неположительных начальных скоростей (11) предположение (12) не выполнено в силу ограничения (7)). Тогда из (5) следует равенство - = 2. (13) Левая его часть неотрицательна, если vy0 X ≥ , (vy0 > 0). (14) T Возведем в квадрат обе части равенства (13) и получим квадратное относительно X уравнение: - 2 [ + 2( - ℎ)] - = 0. (15) По теореме Виета корни уравнения (15) имеют разные знаки. Положительный корень находится по формуле =. (16) Из (14), (16) следует ограничение ≥∗, которое, в отличие от (14), уже не зависит от X (см. (8)) и гарантирует выполнение предположения (12). Его следует учитывать в области малых положительных начальных скоростей (9). В области больших положительных начальных скоростей (10) неравенство (14) выполнено при всех допустимых Т, так как T T* ≤ min, (vy0 ≥ -2 (a y h0 - )). Предположим теперь, что ( , , ) < 0. (17) (В области больших положительных начальных скоростей (10) предположение (17) не выполнено в силу ограничения (7).) Тогда из (6) следует равенство + = 2. (18) При 0 положительность его левой части обеспечивается. Возведем в квадрат обе части (18) и получим квадратное относительно X уравнение: + 2 [ + 2( - ℎ)] - = 0. (19) По теореме Виета корни уравнения (19) имеют разные знаки. Положительный корень находится по формуле =. (20) Это решение должно удовлетворять дополнительному условию < ( 0), (21) которое следует из (17). Из (20), (21) вытекает неравенство <∗, которое, в отличие от (21), уже не зависит от X (см. (8)). Его следует учитывать в области малых положительных начальных скоростей (9). В области неположительных начальных скоростей (11) согласно (20) при всех допустимых Т выполнено неравенство ≥ - ( ≤ 0), (22) которое гарантирует, что левая часть (18) положительна, а также, что предположение (17) выполнено. Наконец, существование порогового значения ∗ в области малых положительных начальных скоростей (9) вытекает из соотношения T T* > min, (0< < -vy0 2 (a y h0 - )). Результаты численных расчетов представлены на рис. 3 в виде графика зависимости функционала от начальной вертикальной проекции скорости и времени движения. Зеленая область описывается уравнением (11), красная область - уравнением (10), случай малых положительных скоростей состоит из розовой области ( min ≤ ≤ ∗) и голубой области ( ∗), к ним применяется (9). Рис. 3. Зависимость от параметров , при субоптимальном управлении № 3: = 0,5 м/с , ℎ = 100 м, = 200 с Figure 3. Dependence on parameters , under suboptimal control № 3: = 0.5 m/s , ℎ = 100 m, = 200 s 4. Обсуждение В данной работе мы исследовали оптимальное и субоптимальное управление тягой инерционного объекта при последующем выведении на прямолинейный участок. В отличие от работ [3; 4], где получены аналитические выражения для случая нулевой начальной скорости при оптимальном управлении с дробно-линейным тангенсом, результаты расширены на случай начальной ненулевой скорости. Показано, что процедура определения констант интегрирования сводится к численному решению только одного трансцендентного уравнения. Аналогично [2] получено выражение для . Также представлены субоптимальные управления, которые обеспечивают практически тот же функционал при многократном увеличении времени движения, при этом управление № 3 имеет дополнительное пороговое значение в виде ∗, которое пропадает при рассмотрении больших скоростей. Результаты имеют важное значение для проектирования и оптимизации систем с ограниченной тягой, закон дробно-линейного тангенса может быть реализован без необходимости сложных численных вычислений или заменен субоптимальным. Тем не менее исследование имеет ограничение в виде отсутствия внешних сил в уравнениях движения, которые будут учтены в дальнейших работах. Заключение Исследовано движение инерционного объекта при оптимальном скоростном маневре в вертикальной плоскости, при этом предложены дополнительные субоптимальные управления. В уравнениях проварьированы основные параметры (скорость , время движения ≥ ), исследовано допустимое время движения, зависящее от начальных условий, найдены значения горизонтальной проекции скорости в конце процесса. Аналогичные результаты могут быть получены в безразмерных величинах, предложенных выше. Рис. 4. Зависимость - от параметров , : = 0,5 м/с , ℎ = 100 м, = 200 с Figure 4. Dependence - on parameters , : = 0.5 m/s , ℎ = 100 m, = 200 s В результате сопоставления двух субоптимальных управлений было выяснено, что второе имеет более сложную структуру, зависящую от выбора отрезка времени движения и начальной скорости . При всех равных условиях оно более эффективно (рис. 4) и является обобщением управления, указанного в [3]. Отличие состоит в исследовании движения при ненулевой начальной скорости. При рассмотрении разности функционалов оказалось, что при больших временах предел стремится к конечному значению (рис. 5). Аналогично при сравнении оптимального и субоптимальных управлений предел отношений стремится к конечному значению, единице. В дальнейшем планируется учет внешних сил. Рис. 5. Зависимость - от параметров = 0,5 м/с , ℎ = 100 м, = 10 000 с , : Figure 5. Dependence - on parameters = 0.5 m/s , ℎ = 100 m, = 10 000 s
×

About the authors

Sergey A. Reshmin

Ishlinsky Institute for Problems in Mechanics RAS

Email: reshmin@ipmnet.ru
ORCID iD: 0000-0003-4817-159X

Dr. Phys.-Math. Sci., Corresponding Member of RAS

Moscow, Russian Federation

Madina T. Bektybaeva

Ishlinsky Institute for Problems in Mechanics RAS; RUDN University

Author for correspondence.
Email: madi8991@mail.ru
ORCID iD: 0000-0002-8875-4610

Engineer, Laboratory of Mechanics of Systems, Ishlinsky Institute for Problems in Mechanics of the Russian Academy of Sciences ; PhD student of the Department of Mechanics and Control Processes, RUDN University

Moscow, Russian Federation

References

  1. Pontryagin LS, Boltyansky VG, Gamkrelidze RV, Mishchenko EF. Mathematical theory of optimal processes. New York: Gordon and Breach; 1986.
  2. Roitenberg YaN. Automatic control. Moscow: Nauka Publ.; 1971:396. (In Russ.)
  3. Bryson AE, Ho Y-C. Applied optimal control: optimization, estimation, and control. Waltham, Mass.: Blaisdell Pub. Co; 1969.
  4. Afanasyev VN, Kolmanovsky VB, Nosov VR. Mathematical theory of control system design. Moscow: Vysshaya shkola Publ.; 2003. (In Russ.)
  5. Isaev VK. L.S. Pontryagins’s maximum principle and optimal programming of rocket thrust. Automation and Remote Control. 1961;22(8):881–893. (In Russ.)
  6. Rose MB, Geller D. Linear covariance techniques for powered ascent. AIAA guidance, navigation, and control conference. 2–5 August, Toronto, Ontario, Canada. 2010:8175. https://doi.org/10.2514/6.2010-8175
  7. Markl AW. An initial guess generator for launch and reentry vehicle trajectory optimization. PhD thesis, Institut für Flugmechanik und Flugregelung der Universität Stuttgart, Germany; 2001. http://doi.org/10.18419/opus3655
  8. Boelitz FW. Guidance, steering, load relief and control of an asymmetric launch vehicle. Report №. NAS 1.26:185598;1989.
  9. Brusch R. Bilinear tangent yaw guidance. Guidance and Control Conference. 06 August, Boulder, CO, U.S.A. 1979. https://doi.org/10.2514/6.1979–1730
  10. Gordan AL. Centaur D-1A guidance/software system. Ann. Rocky Mountain Guidance and Control Conf. Report № NASA-TM-83552. Keystone, Colorado; 1983.
  11. Perkins FM. Derivation of linear-tangent steering laws. Aerospace Corporation, El Segundo, California; TR-1001 (99990)-1, Nov. 1966. https://doi.org/10.21236/ad0643209
  12. Riatti P. Optimal control and near-optimal guidance for the ascent of ARIANE 5. Master’s Thesis, IFR. University of Stuttgart; 1997.
  13. Townsend GE, Abbott AS, Palmer RR. Guidance, flight mechanics and trajectory optimization. National Aeronautics and Space Administration. Boost Guidance Equations. 1968;7–23.
  14. Bektybaeva MT, Reshmin SA. Methods for solving problems of optimal control of mechanical systems with a restriction on the modulus of the control force. Modern European Researches. 2023;1(1):38–44. (In Russ.)
  15. Rosenblat GM. Mechanics in problems and solutions. Moscow: Editorial URSS; 2004.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2023 Reshmin S.A., Bektybaeva M.T.

License URL: https://creativecommons.org/licenses/by-nc/4.0/legalcode