Типичность фрактально-хаотической структуры интегральных воронок в гамильтоновых системах с разрывной правой частью
- Авторы: Зеликин М.И.1, Локуциевский Л.В.1, Хильдебранд Р.2
-
Учреждения:
- Московский государственный университет им. М. В. Ломоносова
- Институт прикладного анализа и стохастики им. К.Вейерштрасса
- Выпуск: Том 56, № (2015)
- Страницы: 5-128
- Раздел: Статьи
- URL: https://journals.rudn.ru/CMFD/article/view/32652
Цитировать
Полный текст
Аннотация
В работе рассмотрена линейно-квадратичная задача оптимального управления, в которой управление принимает значения в некотором двумерном треугольнике. Фазовый портрет оптимального синтеза содержит особые экстремали второго порядка, а управление на любой оптимальной траектории имеет счетное число точек разрыва - так называемый чаттеринг-режим. Обнаружен абсолютно новый феномен, а именно, хаотическое поведение оптимальных траекторий на конечных промежутках времени. Оптимальная траектория при любых фиксированных начальных условиях, конечно же, фиксирована; тем не менее, картина оптимального синтеза в целом содержит хаотические структуры канторовского типа, наподобие подковы Смейла, генерируемые гомоклинической точкой. Динамика переключений управления описывается с помощью топологической цепи Маркова. Вычислены оценки размерности множества неблуждающих точек и энтропия. Во второй части работы доказано, что подобное поведение решений типично для кусочно гладких гамильтоновых систем в окрестности специальных особых точек на стыке трех гиперповерхностей разрыва правой части системы.
Полный текст
ВВЕДЕНИЕ Основным инструментом для решения детерминированных задач оптимального управления яв- ляется принцип максимума Понтрягина (см. [17]). Он позволяет свести задачу управления к отысканию решений гамильтоновой динамической системы. Предположим, управление u принима- ет значения в некотором множестве Ω. Тогда гамильтониан H, определяющий динамику, задается как максимум H(x, p) = max H(x, p, u) u∈Ω по всем управлениям u ∈ Ω функции Понтрягина H, а оптимальное управление (если оно суще- ствует) доставляет максимум H. На открытом всюду плотном подмножестве параметров (x, p) максимум функции H по u ∈ Ω достигается в единственной точке и гладко зависит от этих параметров. На этом подмножестве гамильтониан H является гладким, однако на границе этого подмножества производные H могут, вообще говоря, испытывать разрыв. Чаще всего гамильтониан H является непрерывной кусочно гладкой функцией, причем кокасательное расслоение разбивается на непересекающиеся области A1,..., Ak , на которых гамильтониан задается гладкими функциями H1,..., Hk соответственно. Динамическая система описывается обыкновенными дифференциальными уравнениями с разрыв- ной правой частью. В статье рассмотрена ситуация, когда множество Ω является выпуклым мно- гогранником, а области Ai - это в точности те области, где управление обязано находиться в соответствующей вершине vi многогранника Ω. Множество точек, где производная H разрывна, является стратифицированным многообразием, каждая страта которого отвечает некоторой грани многогранника Ω. Траектория гамильтоновой системы, которая не покидает область гладкости гамильтониана, на- зывается регулярной. Если траектория переходит из одной области гладкости Ai в другую Aj , тогда соответствующее оптимальное управление меняется скачком с вершины vi многогранни- ка Ω на вершину vj . Этот процесс называется переключением, а поверхность разрыва правой части системы называется поверхностью переключения. Обычно оптимальная траектория пересе- кает поверхность переключения трансверсально, в этом случае оптимальное управление называют бэнг-бэнг управлением. Тем не менее, иногда возникают траектории, двигающиеся вдоль поверх- ности разрыва правой части системы. Их принято называть особыми траекториями. Обычно единственность решения теряется в окрестности особых траекторий и множество регулярных тра- екторий может соединиться с особой в одной и той же точке, или, наоборот, сойти с нее. Такая ситуация возможна из-за того, что правая часть гамильтоновой системы обыкновенных дифферен- циальных уравнений терпит разрыв. Для особых траекторий, лежащих на гиперповерхности переключения1, возможно определить порядок, в зависимости от того, какого порядка скобки Пуассона от присоединенных гладких ча- стей Hi обращаются в нуль на особой траектории. Порядок может быть локальным или глобаль- ным, в зависимости от того, обратились ли в нуль скобки на самой особой траектории или целиком в ее окрестности (см. [25]). Хорошее обобщение этих определений (так называемый натуральный порядок) приведено в [26] (краткий обзор можно найти в приложении В к настоящей статье). Ес- ли натуральный порядок траектории является четным числом, то регулярные траектории не могут соединяться с особой кусочно гладким образом. В этом случае регулярные траектории вращаются вокруг особой и пересекают поверхность переключения в счетном числе точек за конечное время таким образом, что точка соединения неособой траектории и особой является точкой накопления. Этот феномен называется чаттерингом; он достаточно хорошо изучен для случая, когда ровно две области гладкости гамильтониана смыкаются по гладкой гиперповерхности (см. [28, 30]). 1Это эквивалентно рассмотрению задачи с одномерным управлением в окрестности особой траектории (см. [22]). 8 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД В настоящей работе рассматривается ситуация, когда три области гладкости A1, A2 и A3 смы- каются по многообразию S123 коразмерности 2. Эта ситуация эквивалентна задаче оптимального управления с двумерным управлением из треугольника1. В общем случае особые экстремали для n-мерного управления были изучены в [8]. В этом случае вместо порядка правильно говорить о флаге порядков. В настоящей работе мы рассматриваем особую траекторию полного второго по- рядка. Эту работу можно рассматривать как продолжение работы [10], в которой данная задача была впервые рассмотрена и было доказано наличие феномена чаттеринга2. Здесь же мы рас- сматриваем еще один феномен, возникающий в данной задаче, а именно, хаотическое поведение ограниченных частей оптимальных траекторий системы. Данный феномен не был ранее обна- ружен в задачах оптимального управления и является совершенно новым. Основным элементом доказательства является важный новый математический объект: система обыкновенных диффе- ренциальных уравнений на все скобки Пуассона до четвертого порядка между ограничениями Hi гамильтониана H на области гладкости Ai. Мы называем такую систему ниспадающей системой скобок Пуассона. Наше исследование не ограничивается только задачами оптимального управления, но также включает в себя весь класс кусочно гладких гамильтоновых систем в случае, когда на стыке трех областей гладкости гамильтониана H лежит особая траектория второго порядка3. В частности, будет рассмотрена максимально подробно линейно-квадратичная задача оптимального управления, оптимальный синтез в которой является прототипом для общего случая. Эта задача является модельной для общей гамильтоновой системы с кусочно гладким гамильтонианом, потому что их ниспадающие системы совпадают. В конце работы авторы сочли необходимым поместить в качестве приложений некоторые свои уже известные к настоящему времени результаты, касающиеся строения особых траекторий и возможных соединений неособых траекторий с особыми. ПРОСТЕЙШИЕ СВОЙСТВА МОДЕЛЬНОЙ ЭКСТРЕМАЛЬНОЙ ЗАДАЧИ В данной главе будет дана постановка модельной задачи оптимального управления и описаны ее базовые свойства. Поведение оптимальных траекторий в этой задаче обладает хаотичной при- родой. Эта задача также примечательна тем, что, с одной стороны, обладает достаточно богатой группой симметрий, и потому ее оптимальный синтез может быть изучен достаточно полно; с другой стороны, она моделирует поведение траекторий в широком классе гамильтоновых систем с разрывной правой частью. В следующих главах будет доказано, что поведение траекторий в системах из этого класса сопряжено оптимальному синтезу в модельной задаче. Постановка задачи. Рассмотрим следующую задачу: +∞ 1 r J (x) = 2 0 (x(t), x(t) dt → inf, (2.1) с начальными данными x¨ = u, u ∈ Ω ⊂ U, x(0) = x0, x˙ (0) = y0. (2.2) Здесь x и u лежат в двумерном евклидовом пространстве U ± R2 со скалярным произведени- ем (·, · , а Ω является (замкнутым) треугольником, и 0 ∈ Int Ω (такие треугольники мы будем называть допустимыми). Замечание 2.1. Основное исследование задачи (2.1) мы будем проводить для случая, когда Ω является правильным треугольником с центром в начале координат, однако некоторые результа- ты, связанные с хаотическим поведением оптимальных траекторий, будут получены и для более общего случая, когда треугольник Ω не обязательно является правильным. 1Случай, когда множество допустимых управлений Ω является шаром, удивительным образом оказался тесно связан с теорией Галуа (см. [7, 8] или приложение А к настоящей статье) 2Краткое изложение результатов статьи [10] можно найти в приложении Б к настоящей статье. 3О структуре окрестностей особых траекторий первого порядка см. [14] или приложении Г к настоящей статье. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 9 Введем обозначение y = x˙ . Пусть φ, ψ - сопряженные к x и y переменные из принципа мак- симума Понтрягина. Иногда для сокращения записи мы будем писать q = (x, y) и p = (φ, ψ). Для фазового пространства мы будем использовать обозначение M = U ⊕ U = {(x, y)}, а для расширенного - M = T ∗M = {(p, q)}. Гамильтониан (функция Понтрягина) имеет вид λ0 H = - 2 (x, x + (φ, y + (ψ, u , т.е. φ˙ = λ0x и ψ˙ = -φ. Если λ0 = 0, то функция ψ линейна, и мы немедленно приходим к противоречию с конечностью интеграла (2.1). Полагая λ0 = 1, получаем гамильтонову систему с разрывной правой частью: ⎨ ⎧ ψ˙ = -φ, φ˙ = x, x˙ = y, y˙ = u, ⎩ (ψ, u → max . u∈Ω (2.3) В задаче (2.3) существует ровно одна особая по Ω траектория: x ≡ y ≡ φ ≡ ψ ≡ u ≡ 0. Она имеет второй порядок (см. [8]). Как будет показано во второй части работы, поведение оптимальных траекторий задачи (2.1) в окрестности этой траектории (начала координат) является типичным для гамильтоновых систем с разрывной правой частью. Поэтому мы произведем максимально полный и подробный анализ оптимального синтеза для задачи (2.1). Симметрии задачи. Гамильтонова система (2.3) обладает двумя важными группами сим- метрий. Первая масштабирующая группа R \\ 0 одномерна и позволяет уменьшить размерность фазового пространства системы. Вторая группа S3 дискретна, имеется лишь в случае, когда Ω является правильным треугольником, и ведет к доказательству хаотичности. Пусть λ ∈ R \\ 0. Рассмотрим следующее преобразование g(λ) ∈ GL(8, R) расширенного фазового пространства M: x 1→ λ2x, y 1→ λy, φ 1→ λ3φ, ψ 1→ λ4ψ. Преобразование g(λ) изменяет гамильтониан H в λ4 раз и симплектическую форму ω = dp ∧ dq = dφ ∧ dx + dψ ∧ dy в λ5 раз. Поэтому g(λ) переводит траектории системы (2.3) в траектории, однако меняет скорость движения по ним в λ раз. Если при этом λ > 0, то оптимальные траектории переходят в оптимальные, так как функционал J изменяется в λ5 раз. Если треугольник Ω является правильным, то в группе ортогональных преобразований плос- кости U имеется дискретная подгруппа S3 ⊂ O(2, R) симметрий треугольника Ω. Одновремен- ное действие S3 на векторах x, y, φ и ψ определяет преобразование расширенного фазового пространства, сохраняющее оптимальные траектории, гамильтониан H и симплектическую структуру ω. Теорема о переходе к сопряженным переменным. Одним из основных инструментов при исследовании оптимального синтеза в задаче (2.1) является теорема 2.1 о переходе к сопряженным переменным. Эта теорема позволяет описать структуру поверхности M+ ⊂M = T ∗M , сотканной из траекторий системы (2.3), которые являются оптимальными в задаче (2.1). 0 Обозначим q = (x, y) ∈ M = R4 = U ⊕ U и p = (φ, ψ) ∈ T ∗M = R4. Теорема 2.1. Предположим, что Ω - выпуклое компактное множество (возможно, даже не треугольник) и 0 ∈ Int Ω. Тогда для любой начальной точки q0 = (x0, y0) справедливы следующие утверждения. q( Существует единственная оптимальная траектория t, q0) задачи (2.1). Сопряженная p( функция t, q0) также единственна. Найдется такой момент времени T (q0) ) 0, что q(t, q0) = 0, t, q0) = 0 при t ) T (q0), p( q(t, q0) /= 0, p(t, q0) /= 0 при t< T (q0). 10 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД При этом функция T (·) непрерывна и C1 max x0|, |y0| T (q0) C2 max x0|, |y0| | | для некоторых C1 > 0 и C2 > 0. Отображение E : q0 1→ , q0) = (φ0, ψ0) является локально липшицевым и биективным. Более того, p(0 | C3 max x0|, |y0| max 3 для некоторых C3 > 0 и C4 > 0. |φ0|, 4 |ψ0| C4 max |x0|, |y0| Доказательство теоремы состоит из нескольких лемм. q( Лемма 2.1. Для любого q0 оптимальное решение t, q0) задачи (2.1) существует и един- ственно. Доказательство. Поскольку каждому измеримому управлению u(t) ∈ Ω соответствует единствен- ная траектория q(t) с начальными условиями q(0) = q0, мы можем рассматривать функционал J как функционал на пространстве управлений L∞(0; +∞). Множество всех допустимых управ- 1 лений U ограничено, замкнуто и выпукло в L∞(0; +∞) в силу ограниченности, замкнутости и выпуклости Ω. Следовательно, по теореме Банаха-Алаоглу множество U слабо∗ предкомпактно (L∞(0; +∞) = L∗(0; +∞)). Слабая∗ замкнутость U тривиально следует из выпуклости и компакт- ности Ω. Покажем, что функционал J полунепрерывен снизу относительно слабой∗ Рассмотрим оператор K : L∞(0; +∞) → AC[0, +∞) следующего вида: t топологии. r x(t) = (Ku (t) = x0 + y0t + 0 (t - τ )u(τ ) dτ. (2.4) Оператор K переводит управление u(t) в соответствующее решение x(t). Таким образом, необхо- w ∗ димо доказать, что для любой последовательности управлений un u выполнено неравенство +∞ +∞ r r -→ lim inf n→+∞ 0 ((Kun (t), (Kun (t) dt ) 0 ((Ku (t), (Ku (t) dt. Можно переписать (2.4) в виде (Ku (t) = x0 + y0t + +∞ r (t - τ )u(τ )θ(t - τ ) dτ, 0 u где θ(·) - функция Хевисайда. Поскольку θ(t - τ ) ∈ L1(0; +∞), то (Kun (t) сходится к (K (t) поточечно. Искомое неравенство следует из теоремы Фату. Единственность оптимального решения немедленно следует из строгой выпуклости функционала J . Обозначим через B(q0) функцию Беллмана: ⎧ ⎨ 1 B(q0) = B(x0, y0) = inf ⎩ 2 +∞ ⎫ ∈ 0 0 r (x(t), x(t) dt, где x¨ Ω и x(0) = x , x˙ (0) = y ⎬ . 0 ⎭ Очевидно, 0 B(q0) < +∞ для любого q0. Лемма 2.2. Функция Беллмана B строго выпукла. Доказательство. Пусть x1(t) и x2(t) - две произвольные траектории. Для любого λ ∈ R с помо- щью прямой выкладки получаем: J (λx1 + (1 - λ)x2 = λJ (x1)+ (1 - λ)J (x2) - λ(1 - λ)J (x2 - x1). ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 11 Если x1(t) и x2(t) - оптимальные траектории с начальными условиями в q1 = (x1, y1) и q2 = 0 0 0 0 (x2, y2) соответственно, то, в силу неотрицательности J , для 0 <λ< 1 получаем 0 0 λ B(q1)+ (1 - λ) B(q2) ) J (λx1 + (1 - λ)x2 ) B(λq1 + (1 - λ)q2 , 0 0 0 0 причем равенство может выполняться только в случае J (x2 - x1) = 0, т.е. если x1 ≡ x2, что и требовалось. Следствие 2.1. Функция Беллмана B непрерывна. u( Следствие 2.2. Отображение q0 1→ ·, q0) ∈ L∞(0; +∞), которое ставит в соответствие u( начальной точке q0 оптимальное управление ·, q0) из этой точки, является непрерывным в слабой∗ топологии. ∗ u( Доказательство. ddd Рассмотрим последовательность qk , стремящуюся к точке q0. Обозначим через uk (·) = ·, qk ) оптимальное управление из точки qk . Покажем, что последовательность uk (·) слабо сходится к оптимальному управлению в точке q0. Из последовательности uk можно вы- брать слабо∗ сходящуюся подпоследовательность ukm , так как множество U слабо∗ компактно. w∗ 0 Итак, ukm -→ u . Докажем, что траектория x0(t) = K(u0, q0)(t) является оптимальной для началь- ной точки q0. Действительно, обозначим через xk (t) = K(uk, qk )(t) оптимальную траекторию из точки qk . Тогда из непрерывности функции B и теоремы Фату получаем B (q0) = lim m→∞ m B(qkm ) = lim →∞ J (xkm ) ) J (x0). Поэтому траектория x0 оптимальна. Следовательно, существует единственная предельная точка последовательности uk - оптимальное управление u0 в точке q0, т.е. последовательность uk слабо∗ сходится к u0. q( Следствие 2.3. Отображение q0 1→ ·, q0) ∈ C[0; τ ] непрерывно при любой τ ) 0. x( Доказательство. Покажем, что отображение q0 1→ ·, q0) ∈ C[0; τ ] непрерывно. Рассмотрим по- u( следовательность qk → q0. Тогда ·, qk ) w u( ∗ -→ ·, q0). Осталось заметить, что из формулы (2.4) x( x( немедленно следует, что t, qk ) → t, q0) для всех t, и эта сходимость равномерна при t ∈ [0; τ ]. Аналогично доказывается сходимость ·, qk ) → ·, q0). y( y( Лемма 2.3. Для любых начальных данных q0 найдется такой момент времени T (q0), что q(t, q0) = 0 при всех t ) T (q0), причем | T (q0) C2 max x0|, |y0| для некоторой константы C2 > 0. q( Доказательство. Сначала покажем, что оптимальное решение t, q0) стремится к 0 при t → +∞ q( в силу убывания функции B. Действительно, предположим противное: пусть | tk, q0)| > ε для некоторого ε> 0 и tk →∞ при k → ∞. Поскольку функция B непрерывна, M = min B(q) > 0. |q|=ε q( Поэтому B(q) ) M для любого |q| ) ε в силу выпуклости функции B (т.к. 0 - ее абсолютный минимум). Значит, B( tk, q0)) ) M > 0 для любого k, противоречие. Теперь докажем само утверждение леммы. Введем обозначение | ρ(x, y) = max{ x|/a, |y|/b}, где константы a > 0 и b > 0 будут выбраны позже. Пусть ρ(x0, y0) = δ. Так как оптимальная траектория стремится к началу координат, то за конечное время она пересечет границу шара ρ(x, y) = δ/2. Оставшаяся часть доказательства леммы посвящена оценке этого времени. Точнее, наша цель - связать через оценки время уменьшения ρ(x, y) вдвое на оптимальной траектории и значение функции Беллмана. Начнем с оценки снизу интеграла от ( t), t) на оптимальной траектории t) на промежутке x( x( x( [0; δ]. Воспользуемся формулой (2.4): если |x0| = aδ2, то при t ∈ [0; δ] имеем x(t)| ) max ( 0, aδ2 - bδt - 1 δ2 max |u| , | 2 u∈Ω 12 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД а если |y0| = bδ, то x(t)| ) max ( 0, bδt - aδ2 - 1 δ2 max |u| . | 2 u∈Ω | | ∈ Обозначим c = 1 max u и положим a = 5c, b = 12c и τ = t/δ [0; 1]. Тогда выполнено одно из 2 u∈Ω двух неравенств Г cδ2 max{0, 4 - 12τ }, если |x0| = aδ2, | x(τδ)| ) cδ2 max 0, 12τ 6 , если y = bδ. { - } | 0| x( В любом случае либо при τ ∈ [0, 1/3], либо при τ ∈ [1/2, 1] получаем не вырождающуюся оценку снизу на | t)|. Поэтому для некоторой константы c1 > 0 имеем δ 1 r (x(t), x(t) dt = δ r (x(τδ), x(τδ) dτ ) c δ5. (2.5) 1 0 0 Пусть теперь ρ(q0) = ρ(x0, y0) = Δ. Обозначим для краткости ρ(t) = ρ( t), t)). Пусть x( y( t 1 (q0) > 0 - такой минимальный момент времени, что ρ(t 1 (q0)) = 1 Δ = δ. Последовательно вы- 2 ч2ислим 2 t0 = 0, t1 = t0 + τ1, t2 = t1 + τ2, ..., tn+1 = tn + τn+1, ..., τ1 = ρ(t0), τ2 = ρ(t1), τ3 = ρ(t2), ..., τn+1 = ρ(tn), .... Пусть N - такой номер, что tN -1 t 1 (q0), но tN > t 1 (q0). Номер N конечен, так как tn+1 -tn ) δ, 2 2 если tn t 1 (q0). Поскольку τn ) δ при n N , то согласно неравенству (2.5) получаем 2 tN ( ) N N N r τ 5 τ B(q0) ) t, q0), t, q0) dt ) c1 τk = c1δ ) ) c1δ ) ) c1δ t 1 (q0). Поэтому x( x( 0 5 k=1 5 k δ k=1 5 k 4 δ 2 k=1 где t 1 (Δ) c2 2 β(Δ) Δ4 , t 1 (Δ) = sup t 1 (q0), β(Δ) = max B(q0). 2 ρ(q0)=Δ 2 ρ(q0)=Δ Теперь заметим, что t 1 (λΔ) = λt 1 (Δ) и β(λΔ) = λ5β(Δ) для любого λ > 0 в силу наличия 2 2 симметрии g группы R+. Поэтому ( 1 1 \\ что и требовалось. T (q0) 1+ + + ... 2 4 t 1 (ρ(q0)) = c3ρ(q0), 2 q( Далее через T (q0) будем обозначать такой минимальный момент времени, что t, q0) = 0 при t ) T (q0). Замечание 2.2. Оценка снизу вида T (q0) ) C1 max{ |x0|, |y0|} на время прихода в начало координат немедленно получается из рассмотрения задачи быстродействия T → inf при x˙ = y, y˙ = u, u ∈ Ω , x(0) = x0, y(0) = y0, x(T ) = y(T ) = 0, где Ω ⊂ Ω , а Ω - квадрат с центром в начале координат и стороной 2 diam Ω. Следствие 2.4. Функция T (q0) непрерывна по q0. Доказательство. Функция T (q0) непрерывна в точке q0 = 0 по теореме о промежуточной функ- ции («о двух милиционерах»). Покажем непрерывность в точке q0 /= 0. Рассмотрим последователь- ность qk → q0. Введем обозначения T - = lim inf T (qk ), T + = lim sup T (qk ). k→∞ k→∞ ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 13 q( Заметим, что T (q0) T -. Действительно, если t > T -, то согласно следствию 2.3 выполнено соотношение t, q0) = 0. Покажем, что (q0) ) T +. Согласно следствию 2.3 имеем T (q0), qk ) → T (q0), q0) = 0, T q( q( т.е. за время T (q0) оптимальные траектории из точек qk окажутся в сколь угодно малой окрестности начала координат. Но в начале координат функция T (·) непрерывна. Поэтому q( T ( T (q0), qk ) → 0. Осталось заметить, что для любого k имеем либо T (qk ) T (q0), либо q( T (qk ) = T (q0 )+ T ( T (q0 ), qk ) , что и завершает доказательство. p( Следствие 2.5. Для любого q0 сопряженная функция t, q0) единственна. Ω u( p( Доказательство. Поскольку t, q0) = 0 при t ) T (q0), то (ψ, u достигает максимума во внут- ренней точке (0 ∈ Int Ω). Поэтому ψ (t, q0) = 0 при t ) T (q0), и, следовательно, φ (t, q0) = 0 при t ) T (q0). При t< T (q0) функция t, q0) может быть найдена единственным образом: T (q0) r φ (t, q0) = - t 0 x(τ, q ) dτ, (2.6) Утверждение доказано. ψ (t, q0) = T (q0) r φ (τ, q0) dτ. t Лемма 2.4. Функция Беллмана является функцией класса C1 и B±(q0) = - , q0). p(0 Под B±(q0) ∈ U ∗ здесь и далее подразумевается дифференциал функции Беллмана в точке q0. q( Доказательство. Начнем со случая q0 /= 0. Мы докажем, что субдифференциал функции Белл- мана состоит из одной точки: из этого факта немедленно будет следовать, что B∈ C1. Рассмотрим задачу (2.1), в которой условие q(0) = q0 заменено условием q(0) ∈ l, где l - любая опорная ги- перплоскость в точке q0 к множеству {q : B(q) B(q0)}. В силу строгой выпуклости функции B(q) траектория t, q0) является решением и новой задачи при любом выборе l. Согласно прин- ципу максимума Понтрягина, должна существовать сопряженная функция pl(t), удовлетворяющая уравнениям (2.3) и условиям трансверсальности pl(0) ⊥ l. Рассуждая, как в доказательстве след- ствия 2.5, мы немедленно получаем, что pl(t) = t, q0). Поэтому вектор , q0) ортогонален любой p( p(0 опорной гиперплоскости l. Если , q0) /= 0, то поверхность уровня функции B является гладкой, p(0 а дифференцируемость функции Беллмана B вытекает из ее однородности: B(g(λ)q) = λ5 B(q) при λ > 0. В этом случае , q0) = λ(q0) B±(q0), где λ(q0) - коэффициент пропорциональности. Покажем, что p(0 , q0) /= 0. В противном случае 0 ∈ ∂ B(q0), так как субдифференциал выпуклой p(0 функции полунепрерывен сверху. Но функция Беллмана является строго выпуклой с минимумом в 0, противоречие. Покажем теперь, что λ(q0) = -1. Согласно уравнению Беллмана 1 (x ,x + ( ± (q ), y(0,q ) + (B± (q ), u(0,q ) = 0. 2 0 0 Bx 0 0 y 0 0 С другой стороны, поскольку ˙ = 0, а t, q0) и t, q0) обращаются в нуль при t > T (q0), то H = 0. Значит, H 1 ( ( q( p( y(0,q ) + (ψ (0,q ), u(0,q ) = 0. - 2 x0, x0 + φ (0, q0), 0 0 0 Поэтому λ(q0) = -1 и B±(q0) = - , q0) при q0 /= 0. p(0 Покажем дифференцируемость в точке 0. Пусть C = max{B(x, y)||x|2 + |y|4 = 1}. 5 Тогда из равенства B(g(λ)q) = λ5 B(q) при λ> 0 получаем, что 0 B(q) C(|x|2 + |y|4) 4 . Лемма 2.5. Отображение E : q0 1→ , q0) = - B±(q0) является гомеоморфизмом (непрерыв- ной биекцией). p(0 14 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД √ Доказательство. Отображение E непрерывно, так как B ∈ C1. Инъективность отображения E немедленно следует из строгой выпуклости B. Сюръективность вытекает из следующих сообра- жений. Рассмотрим строго выпуклое множество B1 = {q : B(q) 1} с гладкой границей. По- скольку для каждого направления v ∈ U ∗ существует ровно две различные перпендикулярные v касательные гиперплоскости к ∂B1, то дифференциалы функции B(q) в точках касания q1 и q2 па- раллельны и противоположно направлены. Следовательно, в одной из этих точек дифференциал к функции B(q) направлен противоположно v, скажем, v = -λ B±(q1) для некоторого λ> 0. Значит, 5 v = - B±(g( λ)q1). Замечание 2.3. Согласно определению T (q0) при всех t < T (q0) имеет место неравенство q(t, q0) /= 0. Поскольку отображение E является гомеоморфизмом и E(0, 0) = (0, 0), то p(t, q0) /= 0 при t< T (q0). Следствие 2.6. Для значений сопряженных переменных в начальный момент времени вы- полнены оценки | C3 max x0|, |y0| max 3 для некоторых C3 > 0 и C4 > 0. |φ0|, 4 |ψ0| C4 max |x0|, |y0| Доказательство. Воспользуемся тем, что отображение E : q0 1→ , q0) является непрерывным. Введем обозначения 3 C = min √ max 3 |φ0|, 4 p(0 |ψ0| , max{ |x0|,|y0|}=1 4 C = max √ max 3 |φ0|, 4 |ψ0| . max{ |x0|,|y0|}=1 Очевидно, C4 ) C3 ) 0. Однако E-1(0, 0) = (0, 0) согласно лемме 2.5. Осталось воспользоваться действием g группы R+: C3λ max 3 |φ0|, 4 |ψ0| C4λ, если max{ |x0|, |y0|} = λ, что и требовалось. Осталось доказать липшицевость отображения E. Разобьем доказательство на две леммы. Лемма 2.6. Для любой точки q0 ∈ U найдутся такие δ > 0 и C > 0, что для всех Δq = (Δx, Δy), |Δq| <δ выполнены неравенства 0 B(q0 + Δq) - B(q0) - B±(q0)Δq) C|Δq|2. При этом константы C и δ могут быть выбраны непрерывно зависящими от q0. Доказательство. Определим q(t) = (x(t), y(t)) и p(t) = (φ(t), ψ(t)) следующим образом: при t ∈ [0; T (q0)] они находятся из условий u( ⎧ y˙(t) = t, q0), y(0) = y0 + Δy, ⎪ ⎪⎨ x˙ (t) = y(t), x(0) = x0 + Δx, ˙ φ(t) = x(t), φ(0) = φ(0, q0), ⎪ ⎪ ψ˙ (t) = -φ(t), ψ(0) = ψ (0,q ), ⎩ 0 а после момента времени t = T (q0) траектория q(t) совпадает с оптимальной из точки q(T (q0)), т.е. q( q(t) = t - T (q0), q(T (q0)) (траектория p(t) не важна при t> T (q0)). Фактически траектория q(t) начинается в q0 + Δq и движется с управлением, оптимальным для точки q0, пока оно не станет тождественным нулем, а потом переключается на настоящее оптимальное управление. Интегрируя два раза по частям, получаем T (q0) 1 r B(q0 + Δq) - B(q0) 2 0 ; \\ x(t) - xˆ(t, q0), x(t)+ xˆ(t, q0) dt + B Δx + T (q0)Δy, Δy = ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 15 = 1 ; 2 φ(t)+ φˆ(t, q0), Δx + tΔy \\ T (q0) 0 + ˆ 1 ; 2 ψ(t)+ ψ(t, q0), Δy \\ T (q0) 0 + B Δx + T (q0)Δy, Δy = 1 ; \\ = 2 φ(T (q0)), Δx + T (q0)Δy - ;φˆ(0, q0), Δx\\+ T (q0) + 1 ; 2 ψ(T (q0)), Δy\\ T 2(q0) - ;ψˆ(0, q0), Δy\\ + B T 3(q0) Δx + T (q0)Δy, Δy = 2 = Δx 2 + 2 (Δy, Δx≡ + 6 Δy 2 + ;B±(q0), Δq\\ + B Δx + T (q0)Δy, Δy . Здесь мы использовали соотношения x φ(0) = φˆ(0, q0) = -B± (q0), φ(T (q0)) = T (q0)Δx + Δy, ψ(0) = ψˆ(0, q0) = -B± (q0), T 2(q0) 2 y Введем константу ψ(T (q0)) = - T 2(q0) - Δx 2 T 3(q0) Δy, 6 pˆ(T (q0), q0) = 0. Тогда C5 = max B(q) | x 5/2 . = 1 + y 5 1 15/2 B Δx + T (q0)Δy, Δy C5 1Δx + T (q0)Δy1 + Δy 5 , и мы получаем оценку 5 B(q0 + Δq) - B(q0) - (B±(q0), Δq C6 Δq 2 + C± Δx 5/2 + Δy 5/2 + Δy 5 , 5 где константы C± , C6 > 0, вообще говоря, зависят от T (q0). Полученное неравенство дает заявлен- ную в условии леммы оценку сверху. Неотрицательность этого выражения следует из выпуклости функции Беллмана B(q). Основная трудность в оставшемся доказательстве липшицевости B±(q) заключается в том, что функция Беллмана B(q) может не быть дважды дифференцируемой (и это по существу так, если, скажем, Ω - многогранник). Поэтому завершим доказательство теоремы 2.1 следующей леммой. Лемма 2.7. Пусть g ∈ C1(Rn, R) - произвольная функция. Если для некоторых констант 0 C± C и для всех q1, q2 из некоторой открытой выпуклой области в Rn выполнены неравенства C±|Δq2| g(q2) - g(q1) - (g±(q1), Δq C|Δq2|, где Δq = q2 - q1, то g± : Rn → Rn∗ является липшицевым отображением в этой области с константой Липшица C. Если к тому же C± > 0, то отображение g± является билипшицевым в этой области. Доказательство. Без ограничения общности будем считать, что выпуклая открытая область из условия есть Rn. Также будем считать, что в Rn задано скалярное произведение, и, следовательно, g±(q) ∈ Rn. Пусть ω(q) ) 0 - «шапочка», т.е. ω - неотрицательная бесконечно гладкая функция с компактным носителем supp ω ⊆ {|q| 1} и { ω(q) dq = 1. Введем обозначения ωk (q) = knω(kq) и k gk = g ∗ ωk (свертка). Тогда gk - бесконечно гладкая функция, g± = g± ∗ ωk и r k Λn(q1, q2) = gk (q2) - gk (q1) - g± (q1)Δq = Rn (g(q2 - y) - g(q1 - y) - g±(q1 - y)Δq ωk (y) dy. Значит, C±|Δq|2 Λk (q1, q2) = k 1 2 g±±(q1)[Δq; Δq]+ o(|Δq|2) C|Δq|2. Подставив λΔq вместо Δq в это неравенство и устремив λ к нулю, получаем, что для всех k, q, Δq выполнены неравенства C±|Δq|2 1 g±±(q)[Δq; Δq] C|Δq|2. 2 k 16 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД k Итак, для всех k и q имеем g±±(q) 2C. Следовательно, |g± (q2) - g± (q1)| sup g±±(q1 + θ(q2 - q1)) · |Δq| 2C|Δq|. k k k θ∈[0, 1] Устремив k к бесконечности (при фиксированных q1 и q2) получаем искомое: |g±(q2) - g±(q1)| 2C|Δq|. Пусть теперь C± > 0. Покажем билипшицевость отображения g: 1 r k (q2) - gk (q1) = gk (q1 + tΔq)Δq dt. Поэтому g± ± ±± 0 1 1 r k (q2) - gk (q1), Δq = r gk (q1 + tΔq)[Δq, Δq] dt = gk (q1 + tΔq)[Δq, Δq] dt ) 2C |Δq| . (g± ± ±± ±± ± 2 0 0 Итак, при любых k, q2, q1 выполнено неравенство (g± ± ± 2 k (q2) - gk (q1), Δq ) 2C |Δq| . Устремив k к бесконечности (при фиксированных q1 и q2), получаем ( 2 Учитывая, что g±(q2) - g±(q1), Δq ) 2C±|Δq| . g±(q2) - g±(q1) · |Δq| ) (g±(q2) - g±(q1), Δq , получаем g±(q2) - g±(q1) ) 2C±|Δq|, что означает билипшицевость отображения g, если C± > 0. Теорема 2.1 доказана. В качестве первого применения теоремы 2.1 мы немедленно получаем (здесь и далее M = {(x, y)} = U ⊕ U - фазовое пространство) следующее утверждение. Следствие 2.7. Множество всех пар (q0, E(q0)) образует в расширенном фазовом простран- стве M = T ∗M липшицево многообразие M+, однозначно проектирующееся на плоскость {p = 0}. Все оптимальные траектории (и только они) лежат в M+ и приходят в начало координат за конечное время. Других попадающих в начало координат траекторий гамиль- тоновой системы (2.3) не существует, иначе они были бы оптимальны в силу выпуклости исходной задачи. Отметим, что не трудно найти траектории системы (2.3), выходящие из начала координат. Действительно, отображение g(-1) сохраняет систему (2.3), но изменяет направление движения на противоположное. Поэтому траектории, выходящие из начала координат, образуют липшицево многообразие M-: M- = g(-1)M+. Фактор-пространства M/g и M/g. Основополагающую роль при изучении оптимального синтеза (существование которого доказано в теореме 2.1) играет переход к фактор-пространству по действию g группы R+ и перенос оптимального синтеза на него. Замечание 2.4. Поскольку оба описанных выше действия групп R+ (для любого треугольни- ка Ω) и S3 (только в случае правильного треугольника) переводят оптимальные траектории в оптимальные, то отображение E, построенное в теореме 2.1, коммутирует с этими действиями: E((λ2x, λy) = (λ3φ, λ4ψ) ∀λ> 0, E(x, y = (φ, ψ) ⇒ E(αx, αy) = (αφ, αψ) ∀α ∈ S3. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 17 После факторизации фазового пространства M = R4 (без начала координат) по действию g группы R+ получается трехмерная сфера S3, на которую корректно переносятся оптимальные тра- ектории задачи (2.1) и направление движения по ним. Однако скорость движения теряется. После факторизации сферы {M \\ 0}/g(R+) = S3 по действию группы S3 получается пространство типа линзового1. По действию g группы R+ можно также профакторизовать расширенное фазовое про- странство M = T ∗M = R8 без начала координат. Поучится семимерная сфера S7 = {M\\0}/g(R+), на которую корректно переносятся траектории гамильтоновой системы (2.3) с сохранением направ- ления движения. π Обозначим через π каноническую проекцию M \\ 0 → {M \\ 0}/g(R+), а через - каноническую проекцию M\\ 0 → {M \\ 0}/g(R+). В тех случаях, когда это не вызовет путаницы, мы будем π писать π вместо . Допуская некоторую вольность, в дальнейшем мы будем писать M/g вместо {M \\ 0}/g(R+) и M/g вместо {M \\ 0}/g(R+), всегда подразумевая, что начало координат не участвует в факторизации. Теорема 2.1 позволяет перенести оптимальный синтез из пространства M = {(x, y)} в про- странство N = {(φ, ψ)}. Более того, с помощью отображения E мы можем отождествить M , M+ и N (или после факторизации M/g, M+/g и N/g). Это оказывается очень полезным при изу- чении поверхности переключения управления S, так как наиболее простой вид она принимает в пространстве сопряженных переменных N . Поскольку E коммутирует с g(λ) при λ > 0, то пространства M/g, M+/g и N/g также отождествляются. Одномерные задачи Фуллера внутри. В этом пункте будет рассмотрен важный частный случай, когда начало координат лежит на одной из высот треугольника Ω. В этом случае в опти- мальном синтезе задачи (2.1) удается найти такую двумерную плоскость в M , что оптимальная траектория системы, начавшись на этой плоскости, не может ее покинуть и поведение оптимальных траекторий на этой плоскости эквивалентно одномерной задаче Фул- лера с несимметричным отрезком управлений. Лемма 2.8. Пусть аффинная прямая A, содержащая одну из высот Ω, проходит через на- чало координат. Предположим, что выполнено одно из двух условий: начальные условия лежат в A: x0, y0 ∈ A; значения сопряженных переменных в начальный момент времени лежат в A, т.е. φ0, ψ0 ∈ A, где (φ0, ψ0) = E(x0, y0). Тогда оптимальная траектория не покидает A при всех t: x(t, q0) ∈ A, t, q0) ∈ A, φ (t, q0) ∈ A, ψ (t, q0) ∈ A, t, q0) ∈ A y( u( (напомним, что q0 = (x0, y0)). q( Доказательство. Пусть выполнено условие 1. По теореме 2.1 оптимальная траектория t, q0) существует и единственна. Рассмотрим траекторию q(t), которая получена из оптимальной с помо- щью ортогональной проекции на A. Траектория q(t) допустима, так как A является высотой в Ω. Поскольку при проектировании на любое одномерное линейное подпространство длина вектора не может увеличиться, то J (q) J ( . Осталось заметить, что q(t) и t, q0) начинаются в од- q) q( q( q( ной точке, поэтому t, q0) ≡ q(t) в силу единственности оптимального решения (по теореме 2.1). Следовательно, t, q0) ∈ A при всех t. Траектории φ (t, q0) и ψ (t, q0) лежат в A по формулам (2.6). В ограничении на подпространство A ⊕ A ⊂ M мы получаем одномерную задачу Фуллера, отрезком управления в которой выступает высота треугольника (см. [30, § 3.5]). Ω. Поэтому E(A ⊕ A) = A ⊕ A Пусть теперь выполнено условие 2. По теореме 2.1 найдутся такие x0 и y0 (и притом единствен- ные), что E(x0, y0) = (φ0, ψ0). При этом x0 и y0 должны лежать в A (так как отображение E биективно, а E(A ⊕ A) = A ⊕ A). Поэтому утверждение леммы при выполнении условия 2 следует из доказанного утверждения для условия 1. Отметим, что в условиях леммы 2.8 особое управление по ребру (ij), содержащему основание высоты A, может быть использовано только на оптимальной траектории, целиком лежащей в A. 1Точнее, получится фактор линзового пространства L(3; 1, 1) по несвободному действию Z2. 18 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Действительно, если максимум по u скалярного произведения (ψ, u достигается одновременно во всех точках ребра (ij), то вектор ψ перпендикулярен ребру (ij). Следовательно, для особого управ- ления необходимо, чтобы вектор ψ на оптимальной траектории был перпендикулярен ребру (ij) в течении некоторого промежутка времени t ∈ (t1, t2). Дифференцируя ψ(t) в силу системы (2.3), немедленно получаем, что векторы φ(t), x(t), y(t) и u(t) также перпендикулярны ребру (ij). Определение 2.1. Будем называть оптимальную траекторию полуособой по ребру (ij) треуголь- ника Ω, если в течении всего времени эта траектория лежит на прямой A, содержащей высоту Ω к ребру (ij). Барицентрические координаты в случае правильного треугольника. Доказательство теорем о хаотичности опирается на ключевые элементы оптимального синтеза в задаче (2.1) в случае, когда треугольник Ω является правильным. Поэтому основной целью до конца главы будет являться выделение ключевых элементов оптимального синтеза в этом важном частном случае, а треугольник Ω будет предполагаться правильным и центрированным относительно нача- ла координат (в дальнейшем для краткости этот случай мы будем называть «случай правильного треугольника»). Более подробное исследование ключевых элементов оптимального синтеза в мо- дельной задаче (2.1) в случае правильного треугольника можно найти в [10] или в дополнении Б к настоящей статье. Для того, чтобы в явном виде описать некоторые важные примеры оптимальных траекторий, нам потребуется удобная система координат. Поскольку множество Ω - правильный треугольник с центром в начале координат, то в этой задаче удобнее всего использовать барицентрическую систему координат1: ⎧ x = (x1, x2, x3), x1 + x2 + x3 = 0; y = (y1, y2, y3), y1 + y2 + y3 = 0; ⎪⎨ φ = (φ ,φ ,φ ), φ + φ + φ = 0; ψ = (ψ ,ψ ,ψ ), ψ + ψ + ψ = 0; 1 2 3 1 2 3 1 2 3 1 2 3 ⎪⎩ u = (u1, u2, u3), u1 + u2 + u3 = 0; ui 1, i = 1, 2, 3. Вершинами треугольника Ω являются точки2 (-2, 1, 1), (1, -2, 1) и (1, 1, -2). Мы будем их на- зывать соответственно первой, второй и третьей вершинами треугольника Ω. Условие максиму- ма (2.3) переписывается в барицентрических координатах в виде ui = -2, uj = uk = 1, если ψi < min(ψj, ψk ), где {i, j, k} = {1, 2, 3}, за исключением случаев ψi = ψj ψk . Действие дискретной группы S3 в барицентрической системе координат - это просто переста- новка индексов. Обозначим через Aij прямую в U , симметричную относительно транспозиции (ij) ∈ S3. Из леммы 2.8 следует, что в ограничении на каждую из трех прямых A12, A13 и A23 мы получаем одномерную задачу Фуллера с несимметричным отрезком управления: +∞ r x2 dt → min, 0 x˙ = y, y˙ = u, u ∈ -√6, √6/2 . Здесь x, y и u одномерны. Такие задачи очень хорошо изучены, оптимальный синтез построен и может быть явно выписан в координатах, функция Беллмана и отображение E выписаны в явном виде (см. [30]). Опишем геометрические свойства оптимального синтеза. На плоскости R2 определено одно- параметрическое семейство траекторий, переходящих друг в друга при действии g масштабной группы R+. Каждая оптимальная траектория за конечное времяпопадаетв начало координат. При этом оптимальное управление совершает счетное число переключений с левого конца отрезка на правый и обратно. После факторизации фазового пространства R2 (без начала координат) по дей- ствию масштабной группы g получается окружность S1, а все оптимальные траектории переходят 1Вообще говоря, в барицентрической системе сумма координат равна 1. Тем не менее, мы будем употреблять слово «барицентрический» по аналогии, допуская некоторую вольность речи. 2Здесь рассмотрен случай, когда расстояние от вершин Ω до начала координат равно √6. Случай, когда треугольник Ω имеет другие размеры, сводится к рассмотренному очевидной линейной заменой. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 19 в единственно возможный цикл Z ± S1. При этом цикл Z разбивается точками переключения управления на два (открытых) интервала Zl и Zr ; управление на Zl - левый конец отрезка, а на Zr - правый. Счетное число переключений управления на оптимальной траектории соответствует счетному числу оборотов по циклу Z. При отображении оптимального синтеза исходной задачи (2.1) на фактор-пространство M/g ± S3 все оптимальные траектории из Aij переходят в одну и ту же траекторию Zij ± S1. Траектория Zij является циклом, который разбит точками переключения управления на два гладких интервала Zs n n ij и Zij . На Zij используется управление в k-й вершине треугольника Ω, т.е. ui = uj = 1, uk = -2, ij k /= i, j,а на Zs - середина ребра (ij), ui = uj = -1/2, uk = 1. Будем называть первое управление неособым, а второе - полуособым по ребру1 (ij) треугольника Ω. Таким образом, на фактор-пространстве M/g определены три взаимно зацепленных цикла Zij . Нетрудно подсчитать, что коэффициенты взаимного зацепления равны 1. Важнейшие примеры периодических траекторий на M/g. Огромную роль при построе- нии полного оптимального синтеза в задаче (2.1) играют автомодельные траектории - это такие траектории, которые являются периодическими, с точностью до подкрутки на действие g. Определение 2.2. Мы будем назвать траекторию (x(t), y(t), φ(t), ψ(t)) системы (2.3) автомо- дельной, если существуют такие момент времени t0 > 0 и число λ0 > 0, что g(λ0)(x(t), y(t), φ(t), ψ(t) = (x(t0 + λ0t), y(t0 + λ0t), φ(t0 + λ0t), ψ(t0 + λ0t) . 1 Замечание 2.5. Если λ0 < 1, то автомодельная траектория за конечное время 1 λ t0 попа- дает в начало координат и, следовательно, по теореме 2.1 лежит в M и являетс - 0 альной. + я оптим Если λ0 > 1, то автомодельная траектория лежит в M- и выходит из начала координат за ко- нечное время. Если же λ0 = 1, то автомодельная траектория является настоящей периодической траекторией и не стремится в нуль ни при t → +∞, ни при t → -∞. Поскольку действие g уважает оптимальный синтез в задаче, то g(λ) при λ > 0 переводит любую автомодельную траекторию с λ0 < 1 в автомодельную с тем же λ0, и все траектории из этого семейства проектируются в одну и ту же периодическую траекторию на фактор-пространстве M+/g. Как будет доказано ниже, на M+/g существует счетное число периодических траекторий; следовательно, в исходной задаче имеется счетное число типов семейств автомодельных траекто- рий. В этом пункте будут найдены некоторые примеры периодических траекторий на M+/g, описание которых лежит в основе доказательства хаотичности оптимального синтеза на M+/g. Начнем с точного определения отображения последования Пуанкаре и поверхности переключения. Под поверхностью переключения обычно подразумевают множество точек, на которых управление на траекториях системы принципа максимума Понтрягина терпит разрыв. Однако, ввиду наличия траекторий с полуособым управлением в середине ребра, мы расширим это определение. Определение 2.3. Поверхностью переключения S в задаче (2.1) будем называть множество точек расширенного фазового пространства M = T ∗M , на которых максимум по u скалярного произведения (ψ, u из (2.3) достигается не в единственной точке треугольника Ω, т.е. S = S12 ∪ S23 ∪ S13 ⊂ M. Здесь Sij ⊂M - множество тех точек, на которых arg max(ψ, u содержит ребро (ij) треугольника u∈Ω Ω (в этом случае ковектор ψ необходимо перпендикулярен ребру (ij) треугольника Ω). Через S123 будем обозначать пересечение S123 = S12 ∩ S23 ∩ S13 = {ψ = 0}⊂ M. Если треугольник Ω является правильным, то в барицентрических координатах Sij = {ψi = ψj ψk }, k /= i, j. ij 1Символы s и n в Zs ij и Zn выбраны по ассоциации с singular и nonsingular 20 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Множество S\\ S123 является гладким некомпактным многообразием без края коразмерности 1. В любой точке S \\ S123 скорость системы (2.3) терпит касательный скачок, т.е. в любой точке S\\ S123 разность пределов скоростей системы (2.3) с обеих сторон от S\\ S123 является касатель- ным вектором к S\\ S123. Если скорость в некоторой точке S\\ S123 трансверсальна S\\ S123 (с обеих сторон), то траектория системы (2.3), начинающаяся в этой точке, в течение некоторого проме- жутка времени не пересекает S. Рассмотрим те точки многообразия S\\ S123,в которых определено отображение последования Пуанкаре, переводящее точку q ∈ S \\ S123 в первое пересечение с S траектории гамильтоновой системы (2.3), начинающейся в q. Обозначим образ q через Φ(q) ∈ S, а Φ будем называть отображением последования Пуанкаре поверхности переключения на себя. Если точка q лежит на оптимальной траектории, то и образ Φ(q) тоже лежит на оптимальной траектории. Отметим, что отображение Φ определено не во всех точках (S\\ S123) ∩ M+. Исследуем теперь периодические оптимальные траектории на M+/g для случая правильного треугольника. Конечно, траектории Zij являются периодическими на M+/g. Все остальные оп- тимальные траектории системы пересекают поверхность переключения S \\ S123 трансверсально. Точнее, если в момент t1 ∈ (0; T (q0) в точке (x1, y1, φ1, ψ1) пересечения некоторой оптимальной траектории с поверхностью переключения Sij выполнено не только условие пересечения ψ1 = ψ1, i j но и условие касания φ1 = φ1, то согласно лемме 2.8 часть этой траектории при t ) t1 целиком i j лежит в Aij . Поэтому, если оптимальная траектория не пересекается с S123 вплоть до момента выхода в начало координат, то она обязана пересекать поверхности Sij с обеих сторон только трансверсально. Таким образом, доказано следующее утверждение. Лемма 2.9. Все периодические оптимальные траектории на M+/g системы (2.3), не пе- ресекающие S123/g, являются периодическими точками отображения Пуанкаре поверхности переключения на себя. Более того, каждая такая траектория в каждой точке пересечения с поверхностью переключения1 Sij /g управления трансверсальна ей с обеих сторон. Отметим, что отрезок траектории γ, соединяющий q и Φ(q), является гладкой кривой, а век- торы x(t), y(t), φ(t) и ψ(t) на траектории γ являются полиномами степеней 2, 1, 3 и 4 по t соответственно. Поскольку действие g уважает гамильтонову систему (2.3), то оно коммутирует с отображени- ем последования Пуанкаре Φ и индуцирует отображение (S ∩ M+)/g в себя, которое мы будем обозначать так же: Φ : (S∩ M+)/g → (S∩ M+)/g. Рассмотрим периодическую траекторию (цикл) на M+/g, имеющую k звеньев гладкости, т.е. пересекающую S/g последовательно в точках z0, z1,..., zk-1, zk = z0. Такую траекторию можно найти из следующих очевидных соображений: - 0 Φ(z0) = z1, ..., Φ(zk 1) = z ⇐⇒ Φk (z0) = z0. Лемма 2.10 (см. [10]). На M+/g существуют следующие периодические траектории: два трехзвенных цикла Z±; управление на каждом из них чередует по очереди все вер- шины треугольника Ω по часовой стрелке 1 → 2 → 3 → 1 и против часовой стрелки 1 → 3 → 2 → 1 соответственно; три четырехзвенных цикла Qi, i = 1, 2, 3; управление на Qi чередует все вершины тре- угольника Ω в порядке i → j → i → k → i, где j, k /= i; два шестизвенных цикла R±; управление на R+ чередует все вершины треугольника Ω в порядке 1 → 2 → 3 → 1 → 2 → 3 → 1, а на R- - в обратном порядке. Доказательство. Сначала докажем пункт 1. Уравнение Φ3(z) = z, z ∈ S/g, решать в явном виде неудобно, так как возникающие в результате полиномы имеют высокую степень. Для упрощения вычислений воспользуемся дискретной группой симметрий S3 оптимального синтеза, описанной в п. 2.2. Пусть α = (123) ∈ S3. Найдем решение упрощенного уравнения (α ◦ Φ (z) = z. (2.7) 1Мы опять для удобства пишем Sij/g вместо (Sij \\ 0)/g. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 21 Трехзвенный цикл Z± (b) Четырехзвенный цикл Qi (c) Шестизвенный цикл R± Рис. 1. Схематичное изображение периодических траекторий Z±, Qi и R± на сфере M+/g Очевидно, решение упрощенного уравнения будет и решением исходного уравнения Φ3(z) = z, так как α и Φ коммутируют. Пусть прообраз ∈ π-1(z) имеет координаты = (x0, y0, φ0, ψ0) и - траектория системы (2.3) z z γ z γ z. Опишем теперь переключения управления. Пусть в точке управление переключается с третьей вершины треугольника Ω на первую. Это означает, что ψ0 0 0 0 0 1 = ψ3 < ψ2 , φ1 > φ3. (2.8) Поскольку управление постоянно от точки z до точки Φ(z) и u0 = (u1, u2, u3) = (-2, 1, 1), то имеет вид (до первого переключения управления) ⎧ y(t) = y0 + u0t, ⎪ 0 0 0 γ 1 ⎪ ⎪ x(t) = x0 + y0t + ⎪⎨ u0t2, 2 0 ⎪ φ(t) = φ ⎪ ⎪ + x0t + 1 2 2 y0t + 1 u0t3, 6 (2.9) ⎪ ψ(t) = ψ0 - φ0t - 1 x t - 1 y t2 - 1 u t3. ⎩ 2 0 6 0 24 0 γ Если траектория пересекает поверхность переключения управления в момент времени t0 > 0, то 0 α(π(γ(t )) = z, поскольку z удовлетворяет уравнению (2.7). Другими словами, существует такое γ z. Последнее условие можно переписать с помощью (2.9) в виде число λ0 > 0, что α( (t0)) = g(λ0) t z 0 системы алгебраических уравнений, линейных по x0, y0, φ0 и ψ0 и полиномиальных по t0 и λ0. Решение этой системы определено не однозначно, а лишь с точностью до действия g. Это связано с тем, что точка ∈ π-1(z) определена тоже с точностью до действия g. Поэтому без ограничения общности можем положить = 1. Разрешая полученную систему относительно линейно входящих x0, y0, φ0 и ψ0 и подставляя в равенство ψ0 = ψ0 из (2.8), получаем полиномиальное уравнение 1 3 на λ0: 0 0 0 0 PZ (λ0) = λ6 - 4λ4 - 7λ3 - 4λ2 +1 = 0. Методом Штурма немедленно получаем, что полином PZ (λ0) имеет ровно один корень на про- межутке (0, 1). Этому корню отвечает такая точка z, что выполняются неравенства (2.8). Та- ким образом, на M+/g определена ровно одна периодическая траектория Z+. Вторая траектория Z- ∈ M+/g получается из Z+ с помощью отражения (12) ∈ S3, или заменой цикла α = (123) на α = (132). Пункты 2 и 3 доказываются аналогично пункту 1. Для получения четырехзвенных циклов на M+/g необходимо решать уравнение (α ◦ Φ2)(z) = z, где α - одна из трех транспозиций (12), (23) или (13) из S3. Описанный выше метод приводит к полиному PQ(λ0) = 1 + 4λ + 60λ2 + 220λ3 - 607λ4 - 5080λ5 - 19700λ6 - 73944λ7 - 192258λ8- 22 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД - 416272λ9 - 918956λ10 - 1609184λ11 - 2528300λ12 - 4868880λ13 - 5019696λ14- - 10839184λ15 - 8659545λ16 - 18568404λ17 - 12399696λ18 - 27180572λ19- - 14695579λ20 - 31988656λ21 - 16556344λ22 - 31988656λ23 - 14695579λ24- - 27180572λ25 - 12399696λ26 - 18568404λ27 - 8659545λ28 - 10839184λ29- - 5019696λ30 - 4868880λ31 - 2528300λ32 - 1609184λ33 - 918956λ34 - 416272λ35- - 192258λ36 - 73944λ37 - 19700λ38 - 5080λ39 - 607λ40 + 220λ41 + 60λ42+ + 4λ43 + λ44 = 0, который имеет единственный корень на промежутке (0, 1). Координаты точек z и Φ(z) удовлетво- ряют неравенствам, аналогичным (2.8); следовательно, на M+/g определены три четырехзвенных периодических траектории. Для получения шестизвенных циклов на M+/g необходимо решить уравнение (α ◦ Φ2)(z) = z, где α -перестановка (123) или (132) из S3. В результате получаем PR(λ0) = λ20 - 12λ19 + 30λ18 + 66λ17 - 117λ16 - 504λ15 - 207λ14+ + 942λ13 + 1271λ12 - 390λ11 - 1599λ10 - 390λ9 + 1271λ8 + 942λ7- - 207λ6 - 504λ5 - 117λ4 + 66λ3 + 30λ2 - 12λ +1 = 0. Этот полином также имеет единственный корень на промежутке (0, 1), а координаты точек z и Φ(z) удовлетворяют неравенствам, аналогичным (2.8); следовательно, на M+/g определены две шестизвенных периодических траектории. Полиномы PZ , PQ и PR получились возвратными, так как примененный метод фактически поз- волял находить автомодельные траектории на M без учета условия λ0 < 1. Осталось лишь сказать, что отображение g(-1) переводит любую автомодельную траекторию на M в автомодельную, но меняет направление течения времени, поэтому λ0 переходит в 1/λ0. Поведение оптимальных траекторий в окрестности периодических траекторий. Пока- жем, что почти все оптимальные траектории задачи (2.1) в обратном времени притягиваются к одному из двух найденных в предыдущем пункте трехзвенных циклов Z±, а в прямом времени выходят за конечное время со счетным числом переключений на один из трех двузвенных циклов Zij . Выражение «почти все» означает, что на M/g определено множество точек полной лебеговской меры X, удовлетворяющих описанным свойствам. Циклы Qi и R± не лежат в множестве X. Бо- лее того, существует счетное число периодических траекторий, не лежащих в X, само множество (M/g) \\ X имеет нецелую размерность, а поведение траекторий на нем является хаотическим. Чтобы получить эти результаты, необходимо воспользоваться результатами статьи [10]. В этом пункте мы опишем полученные в [10] результаты, снабдив их необходимыми пояснениями. Начнем с изучения поведения оптимальных траекторий в окрестности циклов Z± и Zij . Най- денные в предыдущем пункте циклы Z± оказываются отталкивающими на сфере M/g. Дадим точную формулировку этого утверждения. Рассмотрим отображение Пуанкаре Φ поверхности пе- реключения на себя. Каждый из циклов Z± пересекает поверхность переключения в трех точках z± 3 i i , i = 1, 2, 3, и каждая из этих точек является неподвижной точкой отображения Φ . В [10] вычислены в явном виде собственные значения дифференциала отображения Φ3 в точках z± (коi нечно, эти числа не зависят от выбора точки z±), и все эти числа по модулю строго больше 1. Поэтому любая оптимальная траектория, оказавшись в окрестности Z±, при движении в попятном времени будет на M/g приближаться к одному из циклов Z±. Отметим, что это не доказывает, вообще говоря, что почти любая траектория на M/g в попятном времени стремится к Z±. Поведение оптимальных траекторий в окрестности циклов Zij устроено совершенно иначе. Как уже отмечалось выше, каждый двузвенный цикл Zij состоит из двух частей Zn и Zs . Управление ij ij ij на интервале Zn не особое и находится в k-ой вершине треугольника Ω, k /= i, j. Управление на Zs интервале ij является особым по противоположному ребру (ij) и находится в его середине. Рассмотрим точку (x0, y0) ∈ M на Aij , т.е. x0, y0 ∈ Aij . Следовательно, согласно лемме 2.8, π(x0, y0) ∈ Zij . Предположим сначала, что точка (x0, y0) не является точкой переключения и ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 23 ij ij π(x0, y0) лежит на Zn , т.е. управление - k-я вершина треугольника Ω, k /= i, j. Тогда, если точка (x1, y1) ∈ M достаточна близка к (x0, y0), то точка E(x1, y1) близка к E(x0, y0) по теореме 2.1, и, следовательно, управление на оптимальной траектории, начинающейся в (x1, y1), в течение некоторого промежутка времени совпадает с неособым управлением на Zn . ij Предположим теперь, что π(x0, y0) лежит на Zs , и, следовательно, оптимальное управление ij на Zs является серединой ребра (ij) треугольника Ω. Положим (φ0, ψ0) = E(x0, y0). Тогда ψ0 0 0 1 1 1 1 i = ψj > ψk . Если точка (x1, y1) лежит в окрестности (x0, y0), (φ ,ψ ) = E(x1, y1) и ψi /= ψj , то в силу непрерывности отображения E управление на оптимальной траектории, проходящей через точку x1, y1, должно быть либо i-й, либо j-й вершиной треугольника Ω. ij Более того, в [10] показано, что существует такая окрестность V интервала Zs в M/g, что ij оптимальная траектория, проходящая через любую точку (x1, y1), образ которой π(x1, y1) лежит в V , за конечное время выходит на π-1(Zs ), не покидая V . Оптимальное управление при этом совершает счетное число переключений между i-й и j-й вершинами треугольника Ω. Этотпроцесс аналогичен чаттеринг-режиму в одномерной задаче Фуллера с той лишь разницей, что в качестве отрезка допустимых управлений выступает ребро (ij) треугольника Ω. Подробное доказательство этого факта, а также точные аналитические формулы, описывающие этот процесс, можно найти в [10]. 3. ПЕРВАЯ ТЕОРЕМА О ХАОТИЧНОМ ПОВЕДЕНИИ ТРАЕКТОРИЙ В ИНТЕГРАЛЬНЫХ ВОРОНКАХ В этой главе будет доказана теорема 3.1 о наличии хаотического поведения траекторий в ин- тегральной воронке гамильтоновой системы (2.3) для случая, когда треугольник Ω в модельной задаче (2.1) не слишком сильно отличается от правильного треугольника. Эта теорема является первой из доказанной в этой работе серии теорем о наличии хаотического поведения траекторий в гамильтоновых системах с разрывной правой частью. Более того, основные результаты о структуре оптимального синтеза задачи (2.1), которые будут получены в этой главе, также лягут в основу доказательства теоремы о том, что подобное хаотическое поведение траекторий в интегральных воронках является общим для гамильтоновых систем высоких размерностей с разрывной правой частью. Для случая правильного треугольника в следующих главах будет доказана теорема 5.4, включающая в себя теорему 3.1, в которой помимо прочего будут найдены оценки на размерности по Хаусдорфу и Минковскому множеств неблуждающих точек и соответствующая топологическая энтропия. Формулировка первой теоремы о хаотичном поведении траекторий в модельной зада- че. Начнем с формулировки теоремы о хаотичном поведении оптимальных траекторий в экстре- мальной задаче (2.1), снабдив ее всеми необходимыми пояснениями. Первые три пункта теоремы описывают исследуемое множество точек Ξ на M+, сотканное из траекторий гамильтоновой си- стемы (2.3), а в последнем пункте теоремы описана хаотическая динамика траекторий на этом множестве. Множество Ξ является аналогом множества неблуждающих траекторий, естествен- ным для интегральных воронок. Поскольку любая траектория из множества Ξ пересекает стратифицированное многообразие S = S12 ∪S13 ∪S23 разрыва правой части системы (2.3) счетное число раз, то хаотическая динамика поведения этих траекторий описана в теореме 3.1 в терминах последовательности пересечения страт Sij . А именно, последовательность пересечения страт кодируется с помощью пространства Σ01 бесконечных в обе стороны слов из 0 и 1, снабженного стандартной топологией прямого произведения. Пространство Σ01 гомеоморфно подкове Смейла. Через l : Σ01 → Σ01 обозначена топологическая цепь Маркова бернуллиевского сдвига, т.е. l - отображение, сдвигающее каждое слово на одну позицию влево. Теорема 3.1. Существует такое число ε> 0, что если углы треугольника Ω в задаче (2.1) отличаются от π/3 не более чем на ε и расстояние от центра Ω до начала координат1 не 1В качестве центра треугольника Ω можно выбрать, например, любую из точек пересечения высот, биссектрис, медиан или серединных перпендикуляров, поскольку треугольник Ω близок к правильному и расстояния между ними не превосходят εC diam Ω для некоторого фиксированного C > 0. 24 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД превосходит ε diam Ω, то в расширенном фазовом пространстве M = T ∗M = {(x, y, φ, ψ)} гамильтоновой системы (2.3) определено множество точек Ξ, обладающее следующими свой- ствами: Для любой точки z ∈ Ξ определено такое время T (z) < ∞, что траектория X(t, z) гамильтоновой системы (2.3), проходящая через z, существует и единственна при t ∈ [-∞; T (z)]. Более того, траектория X(t, z) попадает в начало координат за время T (z), X(T (z), z) = 0. Множество Ξ соткано из траекторий гамильтоновой системы (2.3) и инвариантно относительно нее в следующем смысле: если z ∈ Ξ, то X(t, z) лежит в Ξ при всех t ∈ [-∞; T (z)). Проекция траектории X(t, z) на фазовое пространство M , продолженная нулем при t > T (z), является оптимальной при любом z ∈ Ξ (т.е. Ξ ⊂ M+). Более того, траекто- рия X(t, z) пересекает поверхность переключения S счетное (бесконечное) число раз в моменты ... < t-1 < t0 < t1 < t2 ... < T (z), X(tk, z) ∈ S и t0 0 < t1, причем tk → T (z) при k → +∞ и tk → -∞ при k → -∞. Рассмотрим динамическую систему Φ : Ξ ∩S → Ξ ∩ S, переводящую точку z ∈ Ξ на S в точку следующего пересечения траектории X(t, z) с S, т.е. Φ(z) = X(t1, z). Существует такое натуральное n > 0 (одинаковое для всех треугольников Ω), что отображение Φn полусопряжено с топологической марковской цепью бернуллиевского сдвига на несвязном объединении двух экземпляров подковы Смейла. Другими словами, существует такое 2 непрерывное сюръективное отображение Ψ01 из Ξ ∩S в пространство 1 Σ01, что следу- ющая диаграмма коммутативна: Ξ ∩ S ⏐ Ψ01⏐ Φn ----→ Ξ ∩ S ⏐ ⏐Ψ 01 2 2 l 1 Σ01 ----→ 1 Σ01 где l обозначает сдвиг влево на каждом экземпляре Σ01. Раздутие особенности в вершине интегральной воронки. Для доказательства теоре- мы 3.1 нам потребуется произвести модифицированную процедуру раздутия начала координат. С топологической точки зрения это означает вклеивание сферы S7 в начале координат. При постро- ении процедуры раздутия мы никак не будем использовать тот факт, что Ω является правильным треугольником: подойдет любой выпуклое компактное множество, лишь бы 0 ∈ Int Ω (т.е. должны выполняться условия теоремы 2.1). Однако отметим, что оптимальные траектории задачи (2.1) попадают в начало координат за конечное время, поэтому после раздутия начала координат векторное поле (2.3) будет вырождаться при приближении ко вклеенной сфере. Определение 3.1. Раздутием особенности в начале координат будем называть отображение B, устроенное следующим образом: x, y, ψ , φ , B : (x, y, φ, ψ) 1→ μ, где μ ∈ R+, а ∈ R2, ∈ R2, φ ∈ R2 и ψ ∈ R2 лежат на многообразии x y C0 = |y|24 + |x|12 + |φ |8 + |ψ |6 8 = 1 ⊂ R . (3.1) Отображение B задается следующими формулами: где x y x y = μ, = μ2 , φ φ = μ3 , ψ = 1 ψ , (3.2) μ4 | μ = ( y|24 + |x|12 + |φ|8 + |ψ|6 24 . (3.3) ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 25 Перенесем действие g группы R+ на цилиндр (μ, φ, ψ) естественным образом так, чтобы x, y, отображение B было эквивариантным относительно действия g: B ◦g(λ) =de=f g(λ) ◦ B =⇒ g(λ) μ, x, y, φ, ψ = λμ, x, y, ψ φ , ∀λ> 0. Мы задали процедуру раздутия особенности системы (2.3) в начале координат именно форму- лами (3.2), 3.3 потому, что в этом случае действие g группы R+ записывается в наиболее простом виде. Определение 3.2. Через C будем обозначать цилиндр C0 × {μ ∈ R} над C0. Само многообразие C0 будем отождествлять с нулевым сечением: C0 = C ∩ {μ = 0}. Поверхности переключения Sij мы продолжим на C0 естественным образом. Под вертикальным направлением будем понимать направление по вектору ∂/∂μ. Лемма 3.1. Отображение раздутия B представляет собой диффеоморфизм M \\ 0 на C∩ {μ> 0}. Доказательство. Из формул (3.2) и 3.3 легко видеть, что отображение B корректно определено на M\\ 0 и биективно отображает M\\ 0 на C ∩ {μ > 0}. Более того, отображение B является гладким на M\\ 0. Покажем, что дифференциал d B невырожден в точках сферы {|y|24 + |x|12 + |φ|8 + |ψ|6 = 1} = B-1{μ = 1}. В остальных точках невырожденность d B следует из эквивариантности B относительно дей- ствия g. Ограничение отображения B на сфероид B-1{μ = 1} является диффеоморфизмом соглас- но (3.2); следовательно, ограничение дифференциала d B |Tz B-1{μ=1} невырождено в любой точке z ∈ B-1{μ = 1}. С другой стороны, если z ∈M \\ 0, то d (B(g(λ)z) = μ ∂ ∈ TB(z)C. dλ λ=1 ∂μ B(z) B(z) Если z ∈ B-1{μ = 1}, то касательный вектор ∂/∂μ не лежит в касательном пространстве T (C∩ {μ = 1}). Поэтому отображение d B |z является сюръективным, и, следовательно невырож- денно. Отметим, что формально отображение B-1 определено только на C ∩ {μ > 0}, однако мы доопределим его естественным образом на C∩ {μ< 0} теми же формулами: B-1 : μ, x, y, φ , ψ 1→ (x, y, φ, ψ , где y = μy, x = μ2x, φ = μ3φ , ψ = μ4ψ . В этом случае B-1 становится двулистным накрытием над M\\ 0. Если множество Ω является треугольником, то на цилиндре C определена поверхность пе- реключения S . А именно, обозначим через S ij замыкание множества тех точек из C, которые при отображении B-1 переходят в Sij . Другими словами, множество S ij состоит из таких точек μ, x, y, φ , ψ , что arg max(ψ , u содержит ребро (ij) треугольника Ω. Положим также u∈Ω S 123 = S 12 ∩ S 23 ∩ S 13, S = S 12 ∪ S 23 ∪ S 13. Для упрощения записи мы будем опускать тильду в S ij , S 123 и S , так как это никогда не приводит к путанице. Репараметризация времени. Разрывное векторное поле в правой части системы (2.3) за- писывается в координатах μ, x, y, φ , ψ следующим образом (треугольник Ω не обязан быть 26 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД правильным): ⎧ y, φ , ψ , u = 1 y 22(y, u + 12 x 10(x, y +8 φ 6(φ , x 6 ψ 4(ψ , φ , ⎪ ⎪ ˙ x, 24 24| | | | | | - | | ⎪ ⎪ ψ = ⎪ ⎪ ⎪ ˙ μ 1 (-φ - 4Υψ , 1 ⎨ φ = μ ( - 3Υφ , ⎪ x (3.4) ⎪ x˙ = 1 (y - 2Υx , ⎪ μ ⎪ 1 ⎪ y = ⎪ ˙ ( - ⎪ Υy , ⎪ μ ⎪ ⎪ (ψ , u → max . ⎩ u∈Ω Решение систем (3.4) и (2.3) определяется классическим образом по Филиппову (см. [18]) как решение системы обыкновенных дифференциальных уравнений с разрывной правой частью. Обозначим векторное поле на C ∩ {μ > 0} в правой части (3.4) через ξ. Формально поле ξ определено при μ > 0, однако мы его продолжим теми же формулами на нижнюю половину цилиндра C ∩ {μ < 0}. В этом случае отображение B-1 отображает поле ξ в векторное поле системы (2.3) и при μ> 0, и при μ< 0. Отметим, что при μ → 0 поле ξ растет как 1/μ. Однако поле μξ уже может быть продолжено на сечение цилиндра C0 = C∩ {μ = 0} во всех точках, в которых ковектор ψ не перпендикулярен ни одному из ребер треугольника Ω. Траектории поля μξ либо не пересекают сечение C0, либо лежат в нем, так как вдоль поля μξ имеем μ˙ = μΥ и Υ не зависит от μ. Более того, компоненты поля μξ, отвечающие переменным x, y, φ, ψ , не зависят от μ. Поэтому любая траектория поля μξ на C0 может быть единственным образом поднята на C∩ {μ /= 0} при задании μ в начальный момент времени и наоборот. Таким образом, интегральные кривые полей ξ и μξ совпадают на C∩ {μ /= 0}, отличается лишь скорость движения по ним. Если обозначить через s параметр времени движения по траектории поля μξ, то s и t связаны соотношением ds = 1 dt. μ Параметр s движения по траектории оказывается удобен тем, что оптимальные траектории легко отслеживаются по стремлению к сечению C0 благодаря следующим двум леммам. В первой лемме доказано, что функция μ(s) экспоненциально быстро стремится к нулю на любой оптимальной траектории, а во второй доказано достаточное условие оптимальности в терминах стремления к нулю функции μ(s). 0 Лемма 3.2. Рассмотрим образ оптимальной траектории x(t, q ), 0 y(t, q ), φ (t, q0), ψ (t, q0) на C ∩ {μ > 0} при t < T (q0). Зафиксируем моменты времени t0 = t(s0) < T (q0) и t1 = t(s1) < T (q0). Тогда для некоторых положительных констант γ1 и γ2 (не зависящих от выбора траектории и времен t0 и t1) выполнено D1μ0e-γ1(s1-s0) μ1 D2μ0e-γ2(s1-s0), где μk = μ x(tk, q0), y(tk, q0), φ (tk , q0), ψ (tk , q0) , k = 0, 1, и 1 D D1 = 2 = γ2 . γ1 0 Доказательство. Введем обозначение μ(t) = μ x(t, q ), 0 y(t, q ), φ (t, q0), ψ (t, q0) . Из оценок, полученных в теореме 2.1, немедленно следует, что существуют такие γ1 > 0 и γ2 > 0, что для любой начальной точки q0 на оптимальной траектории выполнены неравенства γ2(T (q0) - t μ(t) γ1(T (q0) - t . (3.5) ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 27 Поэтому ⎧ t1 ⎪ 1 ln T (q0) - t0 , r s1 - s0 = 1 dt μ(t) ⎪⎨ γ2 1 T (q0) - t1 0 0 T (q ) - t t0 ⎪ ) ln . Следовательно, ⎩ γ1 T (q0) - t1 e-γ1(s1-s0) T (q0) - t1 e-γ2(s1-s0). T (q0) - t0 Для получения заявленных в условии леммы неравенств осталось еще раз воспользоваться оценками (3.5). Следствие 3.1. На оптимальной траектории при t → T (q0) - 0 имеем μ → +0 и s → +∞. z( Лемма 3.3. Рассмотрим траекторию s), s ∈ R, поля μξ на верхней половине цилиндра C∩ {μ> 0}. Если μ(s) → 0 при s → +∞ и T = +∞ r μ(s)ds < ∞, 0 z( то на траектории s) имеем s(t) → +∞ при t → T - 0 и s(t) → -∞ при t → -∞. Более того, B-1(z(s(t)) лежит в M+ и является оптимальной, если ее продолжить 0 при траектория t ) T . z( Доказательство. Так как dt = μds, то на траектории s) выполнено соотношение s r t = μ(σ)dσ. 0 В силу положительности μ(s) получаем, что t → T - 0 тогда и только тогда, когда s → +∞. Рассмотрим теперь траекторию z(t) = B-1(z(s(t)) , определенную при t < T . Согласно (3.3) получаем, что x, y, φ, ψ → 0 при t → T - 0. Та к как траектория z(t) является траекторией га- мильтоновой системы (2.3) то, согласно следствию 2.7, будучи продолженной нулем при t ) T , является оптимальной. По теореме 2.1 время достижения начала координат на оптимальной траектории оценивается сверху через расстояние до начала координат. Следовательно, существует окрестность нуля в M, в которую не заходит траектория z(t) при t < 0. Поэтому функция μ(s) отделена от нуля при s< 0; следовательно, r-∞ μ(s)ds = -∞, 0 т.е. t(s) → -∞ при s → -∞. Замечание 3.1. Отметим, что сечение C0 может быть отождествлено с фактор-пространством (M\\ 0)/g, а траектории поля μξ могут рассматриваться как образы траекторий системы (2.3) при естественном проектировании (M\\ 0) → (M\\ 0)/g. Однако конкретная реализация (M\\ 0)/g как сечения C0 дает принципиальные улучшения: дает систему обыкновенных дифференциальных уравнений поля μξ на всем цилиндре C, равномерное стремление к C0 оптимальных траекторий и возможность определения оптимальности траектории за счет предыдущих лемм. Грубость автомодельных траекторий. В этом пункте мы рассмотрим изменения, которые претерпевает гамильтонова система (2.3) при замене треугольника Ω на близкий треугольник Ω±. Итак, пусть каждая вершина треугольника Ω± находится в ε-окрестности соответствующей вер- шины треугольника Ω, а ε > 0 достаточно мало. Тогда 0 ∈ Int Ω± и Ω± является допустимым треугольником в задаче (2.1). Все описанные ранее объекты, отвечающие системе (2.3) с тре- угольником Ω±, будем снабжать штрихами. Например, поле (3.4), отвечающее треугольнику Ω±, будем обозначать через ξ±. 28 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Поскольку при любых i /= j ребра (ij) и (ij)± треугольников Ω и Ω± близки, то гиперплоско- ij сти переключения Sij и S± образуют в M угол αij , близкий к нулевому. Поэтому, когда нам и S± , мы будем отождествлять потребуется говорить о близости отображений, заданных на Sij ij ij гиперплоскости Sij и S± с помощью отображения pr, устроенного следующим образом: ij pr(x, y, φ, ψ) = (x, y, φ, Oαij ψ ∈ S± , где (x, y, φ, ψ) ∈ Sij, а Oαij ∈ O(2, R) обозначает поворот в плоскости на угол αij . Отображение pr коммутирует с действием g группы R+ и гладко продолжается на пересечение с нулевым сечением Sij ∩ C0. Лемма 3.4. Предположим, что на C0 некоторая траектория поля μξ с треугольником Ω пересекает последовательно поверхности Sij ∩ C0 и Sjk ∩ C0 в точках A и B соответственно, A, B ∈/ S123, и эти пересечения трансверсальны1 (возможно k = i, но j /= i, k). Тогда для любых r ∈ N и α > 0 найдется такое ε > 0, что если каждая вершина некоторого треугольника Ω± находится в ε-окрестности соответствующей вершины треугольника Ω, то отображе- ния последования Пуанкаре Φ и Φ± полей μξ и μξ± являются α-близкими диффеоморфизмами окрестностей A и A± = pr A в метрике Cr . Доказательство. Для того, чтобы работать в окрестностях Sij и Sjk , мы продолжим поле μξ глад- ким образом в их окрестность, например, удалив в (3.4) последнее условие, заменив управление u на постоянное в j-й вершине Ω. Полученное поле обозначим через μξ . Проделав аналогичную процедуру для треугольника Ω±, получим поле μξ ±. В силу замкнутости поверхностей переключения и трансверсальности поля μξ к Sij и Sjk в точках A и B, любая траектория, начинающаяся на Sij в окрестности A, в первый раз пересечет S в окрестности точки B. Поэтому можно заменить поле μξ полем μξ . При этом интересующие нас траектории, идущие без переключений из окрестности A на Sij в окрестность B на Sjk , не изменятся. Аналогичное утверждение верно при замене поля μξ± полем μξ ±. Поскольку поля μξ и μξ ± являются гладкими, то утверждение леммы немедленно следует из трансверсальности поля μξ в точках A и B поверхностям Sij и Sjk соответственно. Любой траектории z(t) системы (2.3) мы можем поставить в соответствие ее образ π(z(t)) на C0 = M/g при канонической проекции π : M → M/g. Явно этот образ можно найти так: отправить траекторию z(t) в цилиндр C с помощью отображения B и игнорировать координату μ. При этом автомодельные траектории перейдут в периодические траектории поля μξ на C0. В этом пункте мы изучим грубые периодические траектории на C0. Полученные результаты будем применять к найденным в лемме 2.10 шестизвенным траекториям R±. Определение 3.3. Будем называть оптимальную автомодельную траекторию z(t) системы (2.3) грубой, если она не является полуособой траекторией, не пересекается с S123, а ее образ π(z(t)) на C0 является грубой периодической траекторией, т.е. состоит из конечного числа гладких участков (звеньев), трансверсальных S; дифференциал соответствующей степени отображения последования Пуанкаре Φ/g в точках π(z(t)) ∩S не имеет единичных собственных значений. Предыдущее определение корректно в том смысле, что отображение последования Пуанкаре вдоль такой периодической траектории является гладким диффеоморфизмом, в силу лемм 2.9 и 3.4. Оказывается, что грубые автомодельные оптимальные траектории не могут разрушаться при малом изменении треугольника Ω: Лемма 3.5. Пусть z(t) ∈ M - некоторая грубая оптимальная автомодельная траектория задачи (2.1). Тогда для любых r ∈ N и α > 0 найдется такое число ε > 0, что если каждая вершина некоторого треугольника Ω± находится в ε-окрестности соответствующей вершины треугольника Ω, то для задачи (2.1) с треугольником Ω± найдется такая грубая оптимальная 1Трансверсальность в данном случае формально можно понимать так: скорость слева в точке A трансверсальна Sij , а скорость справав точке B трансверсальна Sjk . Хотя на самом деле скачок поля μξ, например, в точке A (или в B) на гиперповерхности Sij (соответственно, Sjk ) является тангенциальным к этой поверхности. Поэтому для определения трансверсальности не имеет значения, с какой стороны брать предел скоростей. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 29 автомодельная траектория z±(t), что периодические траектории π(z(t)) и π(z±(t)) являются α-близкими в метрике C0, а отображения последования Пуанкаре на цилиндре C вдоль обеих систем (2.3) с треугольниками Ω и Ω± в точках траекторий π(z(t)) и π(z±(t)) являются α- близкими в метрике Cr . z( z( z( Доказательство. Рассмотрим периодическую траекторию s) поля μξ, являющуюся вертикаль- ной проекцией образа B(z(t)) на C0. Пусть s0 - такой момент времени, что траектория s) явля- ется гладкой в окрестности s = s0, а L ⊂ s0) - малая гладкая площадка коразмерности 1 в C, s трансверсальная ). Так как z˙ (s) ∈ Tz(s)C0, то площадка L также трансверсальна C0. Обозначим z( z( через Φ отображение последования Пуанкаре Φ : L → L вдоль траекторий поля μξ. Точка s0) является неподвижной точкой отображения Φ . z( z( Пусть также s1 < . . .< sm - все точки негладкости траектории s), пронумерованные так, что s1 - первая точка негладкости после s0. Обозначим через Li пересечение малой δ-окрестности точ- ки si) с соответствующей поверхностью разрыва Sij поля μξ. Тогда отображение последования Пуанкаре Φ : L → L является композицией отображений последования Φ0 Φ1 Φ2 Φm-1 Φm Φ : L -→ L1 -→ L2 -→ ... ----→ Lm -→ L. Из этой схемы и леммы 3.4 вытекает, что отображение Φ является гладким диффеоморфизмом. Обозначим через Φ ограничение Φ на C0. По определению грубости автомодельной траектории z(t) дифференциал dΦ z( в точке s0) является грубым, т.е. не имеет единичных собственных значений. Отображение Φ явно выражается через Φ следующим образом: Φ μ, x, y, ψ = φ , λ0μ, Φ(x, y, φ, ψ , (3.6) где λ0 из определения автомодельности 2.2. Поэтому дифференциал dΦ |z(s0) по сравнению с dΦ |z(s0) содержит одно дополнительное собственное значение λ0. В силу оптимальности z(t) имеем 0 < λ0 < 1 (см. замечание 2.5). Таким образом, dΦ |z(s0) является грубым. Опишем теперь, как изменяется отображение Φ при замене треугольника Ω на близкий тре- угольник Ω±. Рассмотрим поле μξ±, полученное на C из системы (2.3) с треугольником Ω±. По- k скольку треугольники Ω и Ω± близки, немедленно получаем, что отображения Φk и Φ± близки в метрике Cr ; следовательно, близки и отображения Φ и Φ ±. Поскольку точка z(s0) ∈ L является грубой неподвижной точкой отображения Φ , то она не разрушается при малом шевелении Φ в C1 метрике (см., например, [12, предложение 1.1.4]). Добавим еще, что если треугольник Ω сжать в λ раз (λ > 0), то траектории системы (2.3) не изменятся; изменится в λ раз скорость движения по ним. Поворот треугольника Ω вокруг начала координат приводит к повороту всего оптимального синтеза на тот же угол. Поэтому условие предыдущей леммы можно переформулировать в терминах близости углов и центров треугольни- ков Ω и Ω± (как это сделано для правильного треугольника в формулировке теоремы 3.1). Гомоклиническая траектория на нулевом сечении цилиндра C. В данном пункте мы построим гомоклиническую траекторию в раздутой системе (3.4) для случая, когда треугольник Ω является правильным, и покажем, что она не разрушается при малом шевелении треугольника Ω. Итак, пусть Ω - правильный треугольник с центром в начале координат. В [10] показано, что автомодельные траектории Z±, Qi и R±, найденные в лемме 2.10, являются грубыми (см. [10, утверждения 6.3-6.5]). Более того, показано, что цикл Z± является отталкивающим (точнее, все собственные значения dΦ вещественны и по модулю строго больше 1), а циклы Qi и R± являются гиперболическими (точнее, ровно одно собственное значение dΦ по модулю строго меньше 1, а остальные - больше). Таким образом, если треугольник Ω близок к правильному и его центр близок к началу координат, то по лемме 3.5 для системы (2.3) на C0 по-прежнему определены циклы, близкие к Z±, Qi и R± (которые мы будем обозначать так же). Кроме того, близки отображения последования Пуанкаре вдоль этих циклов. Таким образом, в окрестности каждой точки Qi ∩S и R± ∩S на S∩ C0 определено одномерное гладкое устойчивое многообразие и пятимерное гладкое неустойчивое многообразие отображения 30 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД последования Пуанкаре Φ : S → S. Действительно, Φ : S → S является гладким в окрестности точек Qi ∩S и R± ∩S по лемме 3.4. Однако, вообще говоря, отображение Φ является разрывным на S. Более того, если продолжать одномерное устойчивое многообразие Φ за пределы окрестно- стей точек Qi ∩S и R± ∩ S, оно неизбежно встречается с поверхностью разрыва Φ . Тем не менее, верна следующая лемма. Лемма 3.6. Предположим, что треугольник Ω достаточно близок к правильному треуголь- нику с центром в начале координат. Тогда существует такая гомоклиническая точка z0 ∈ C0 на поверхности разрыва S, что итерации Φ n(z0) стремятся к шестизвенному циклу R+ ∩S при n → ±∞ (см. рис. 2). Более того, для любой достаточно малой ε-окрестности V ⊂ C0 точек R+ ∩S найдется такая δ-окрестность W ⊂ C0 точки z0 и целые числа m > 0 и l < 0, что образы Φ m(W ) и Φ l(W ) содержатся в одной связной компоненте V ; отображения Φ m и Φ l являются диффеоморфизмами в ограничении на W ; образ устойчивого многообразия периодической орбиты R+ ∩S в области Φ m(W ) при отображении Φ -m и образ неустойчивого многообразия в Φ l(W ) при отображении Φ -l пересекаются в гомоклинической точке z0, и это пересечение трансверсально. Аналогичное утверждение выполнено для орбиты R- ∩ S. Доказательство. Ввиду вышесказанного, достаточно показать существование трансверсальной гомоклинической точки z0 для случая правильного треугольника Ω и убедиться в том, что траек- тория, на которой она лежит, отделена от поверхности разрыва S123. Оба условия были проверены посредством численного анализа системы (3.4) для случая правильного треугольника. Пусть H5 ⊂ C0 ∩S - пятимерное неустойчи- вое многообразие отображения Φ˜ 6 в окрестности некоторой точки переключения z˜(s0) цикла R+,а H0 5 - компонента связности множества H5 \\ S123, в которой лежит точка z˜(s0). Тогда ограниче- ние Φ˜ -6|H0 будет гладким, Φ˜ -6[H0] ⊂ H0, и 5 5 5 5 z˜(s0) ∈ H0 будет единственной неподвижной точ- кой и аттрактором отображения Φ˜ -6. Обозначим через σ0, σ1,..., σ6 = σ0 од- номерные устойчивые многообразия отображе- ния Φ˜ 6, исходящие из точек переключения z˜(s0), z˜(s1),..., z˜(s6) = z˜(s0) цикла R+ соответ- ственно. Отметим, что отображение Φ˜ переводит Рис. 2. Схематичное изображение результатов леммы 3.6 кривую σk в кривую σk+1, одновременно прижи- мая образ к точке переключения z˜(sk+1). Множе- ство траекторий системы (3.4), проходящие через кривые σk , образуют некоторую цилиндрическую двумерную поверхность Σ, содержащую периоди- ческую траекторию R+. Кривые σk являются под- множеством пересечения Σ ∩ S. Рассмотрим поведение кривой σk в случае, когда она встречается с поверхностью разрыва S123 отображения Φ˜ . Напомним, что S123 является пересечением трех страт S12, S13, S23 поверхно- сти переключения S. Если траектории системы (3.4) пересекают поверхность переключения S трансверсально в некоторой точке z ∈ S123, то в окрестности этой точки они претерпевают одно переключение по одну сторону от S123 и два последовательных переключения по другую сторону. Эта ситуация схематически изображена на рис. 3a. Поэтому при пересечении поверхности кривая σk либо разветвляется на две ветви, либо две ветви сливаются в одну. Получаемая сетка кривых по-прежнему лежит на цилиндрической поверхности Σ и является ее пересечением с S. Отметим, что прообразы точек ветвления при отображении Φ˜ являются точками излома кривых, из которых состоит множество Σ ∩ S. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 31 Поведение траекторий в окрестности S123 Цилиндрическая поверхность Σ, кривые σk , гомо- клиническая точка z0 и проходящая через z0 траекто- рия системы (3.4) Рис. 3. Схематичное изображение кривых σk Прослеживая кривые σk по направлению от точек переключения z˜(sk ) цикла R+, находим, 5 что кривые σk с нечетным индексом k проходят через точку ветвления, а кривые σk с четным индексом k - через точку излома, которая является прообразом вышеназванных точек ветвления. Пройдя точку излома, кривая σ0 трансверсально пересекает многообразие H0, таким образом опре- деляя искомую гомоклиническую точку z0. Данная ситуация схематически изображена на рис. 3b. На рисунке изображена цилиндрическая поверхность Σ. При этом следует отождествить верх и низ рисунка. Штриховкой закодировано управление u в системе (3.4), принимающее значения в вершинах правильного треугольника Ω. Периодическая траектория R+ соответствует жирной вертикальной кривой, ветки σk - горизонтальным жирным кривым. Тонкая линия обозначает тра- екторию, проходящую через точку z0, штриховые линии символизируют отождествление точек на этой траектории на кривых σ0 и σ6. Периодичность всей картины есть следствие инвариантно- сти периодической траектории R+ по отношению к циклической перестановке порядка 3 группы симметрии S3. Из вышесказанного ясно, что числа m и l можно, например, положить равными m = 7 и l = 0. Более того, ясно, что траектория, проходящая через z0, отделена от поверхности разрыва S123. Для цикла R- доказательство аналогично. Отметим, что окрестность W в лемме 3.6 можно заменить на любую сколь угодно малую окрестность, в ней содержащуюся. Завершение доказательства первой теоремы о хаотичности. Хорошо известно, что го- моклиническая точка генерирует подкову в окрестности периодической точки. В нашей ситуации отображение последования формально не является гладким, но лемма 3.6 позволяет полностью иг- норировать разрывы отображения Пуанкаре и напрямую воспользоваться классической теоремой о том, что трансверсальная гомоклиническая точка генерирует подкову в любой сколь угодно малой окрестности периодической точки. Доказательство теоремы 3.1. Начнем с построения множества Ξ. Для этого необходимо перене- сти подкову в окрестности 6-периодической точки R+ ∩S отображения Φ из нулевого сечения C0 на весь цилиндр C и показать, что все полученные траектории будут стремиться к C0 и удовлетворять условиям леммы 3.3. 32 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Рассмотрим отображение Φ6, определенное на S ⊂ C в окрестности точек R+ ∩ S. Поскольку цикл R+ получен из автомодельной траектории с λ0 < 1, то из (3.6) получаем dΦ6 ∂ ∂μ = λ ∂ 0 ∂μ в точках R+ ∩ S. Зафиксируем любую из шести точек R+ ∩S и рассмотрим ее окрестность, в которой отображение Φ6 является сжимающим в вертикальном направлении. Эту окрестность можно выбрать как цилиндр над окрестностью в C0, так как согласно (3.6) свойство сжатия не зависит от выбора μ. Итак, пусть V0 ⊂ V - такая открытая окрестность одной из шести точек R+ ∩S в C0, что отображение Φ6 в V0 × {μ ∈ R} является сжимающим в λ 0 < 1 раз. Для окрестности V0, ввиду леммы 3.6, существует подкова Λ0 для некоторой итерации (Φ 6)N ! (см., например, [12, теоре- ма 6.5.5]). Обозначим N = 6N ±. Подкова Λ0 разделена на две части следующим образом. В окрестности V определены два открытых множества W0 и W1. Множество W0 есть Φl(W ), где окрестность W ⊂ z0 и степень l из леммы 3.6 (см. рис. 2). Таким образом, для любой точки z ∈ W0 выполнено Φm-l(z) ∈ V , 0 и отображение Φm-l|W является диффеоморфизмом. Множество W1 состоит из точек z ∈ V , не m-l покидающих окрестность R+ ∩S при итерациях Φk , 0 k m - l, W1 = П k=0 Φ-k (V ). Отображение Φm-l|W 1 является диффеоморфизмом. Очевидно, W0 ∩W1 = ∅. Подкова Λ0 состоит из двух частей: Λ0 = (Λ0 ∩ W0) ⊃ (Λ0 ∩ W1). Пусть z ∈ (W0 ⊃W1)∩Φ-N (W0 ⊃W1). Обозначим через S(z) время (попараметру s) движения по траектории поля μξ (см. систему (3.4)) из точки z при последовательном пересечении N страт Sij . Поскольку отображение Φm-l является диффеоморфизмом в ограничении на W0 и W1 и траектории поля μξ из (W0 ⊃ W1) ∩ Φ-N (W0 ⊃ W1) пересекают поверхность переключения S трансверсально, то для некоторых констант Smin и Smax выполнена оценка 0 < Smin S(z) Smax. (3.7) Отметим, что для любой точки подковы Λ0 существует и единственна траектория поля μξ при всех s ∈ (-∞; +∞). Действительно, любая степень Φn отображения последования Пуанкаре кор- ректно определена в точках Λ0, так как Λ0 ⊂ V0 ∩ Φ-N (V0) и ΦN (Λ0) = Λ0. Более того, траектория поля μξ, выпущенная из любой точки подковы Λ0, пересекает поверхность переключения толь- ко трансверсально и, следовательно, единственна. Существование при s ∈ (-∞; +∞) следует из полученных оценок на время перехода (3.7). Любой точке подковы z ∈ Λ0 мы стандартным образом поставим в соответствие бесконечную последовательность Ψ(z) ∈ Σ01 из нулей и единиц. На позиции с номером j ∈ Z в Ψ(z) стоит нуль, если все итерации Φk (z) при k между jN и (j +1)N лежат в V0, и единица в противном случае (т.е. если Φk (z) окажется в окрестности гомоклинической точки z0 при каком-либо k ∈ (jN, (J + 1)N )). Заметим, что итерации ΦjN (z) в любом случае лежат в V0. Ограничение ΦN на цилиндр в C над основанием Λ0 × {μ ∈ R}, вообще говоря, может не являться сжимающим в вертикальном направлении (несмотря на то, что Φ6 является сжимающим в окрестности R+ ∩ S). Это связано с тем, что при N итерациях ΦN точки из подковы Λ0 могут покинуть окрестность R+ ∩S и побывать в окрестности гомоклинической точки z0. Обозначим через λmax максимально возможное растяжение в вертикальном направлении отоб- ражения ΦN в точках этого цилиндра: λmax = max z∈Λ0×R\\0 μ(ΦN (z)) . μ(z) Максимум здесь корректно определен, так как множество Λ0 компактно, а непрерывная функция μ(ΦN (z))/μ(z) не изменяется, если заменить z на g(λ)z при любом λ /= 0. Таким образом, если в последовательности Ψ(z) на j-й позиции стоит нуль, то отображение ΦN 0 является сжимающим в вертикальном направлении в окрестности точки ΦjN (z) в λ N/6 раз, так ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 33 как итерации Φk (z) при k ∈ [jN ; (j + 1)N ] не покидают окрестности R+ ∩ S. Если же в последо- вательности Ψ(z) на j-й позиции стоит единица, то отображение ΦN растягивает в вертикальном направлении в окрестности ΦjN (z) не более чем в λmax раз. 0 λ1 = λ KN/6 Выберем K ∈ N, K > 2 так, чтобы λ KN/6λmax < 1. Рассмотрим подкову Λ1 ⊂ Λ0, состоящую из тех точек z ∈ Λ0, для которых в последовательности Ψ(z) на позициях с номерами, не кратными K, стоят нули (на позициях с номерами, кратными K, могут стоять как нули, так и единицы). Тогда отображение ΦKN , в ограничении на Λ1 × {μ ∈ R}, является сжимающим как минимум в 0 λmax < 1 раз. Обозначим n = KN (здесь n из пункта 4 теоремы 3.1). R+ μξ Множество Ξ1 определим так: необходимо рассмотреть верхнюю половину цилиндра Λ1 × , выпустить из каждой точки полученного множества траекторию поля при s ∈ (-∞; +∞) и перенести полученное множество с помощью отображения B-1 на исходное расширенное фазовое пространство M. - 2 В окрестности траектории R тоже существует подкова Λ для отображения Φn (без ограничения общности можно считать степени отображения Φ для подков Λ1 и Λ2 совпадающими). Определим множество Ξ2 аналогично множеству Ξ1. Эти множества не пересекаются. Действи- тельно, для любой точки z ∈ Λ1 большая часть итераций Φk (z) лежит в окрестности R+ ∩S (а именно, каждые (K - 1)N из каждых KN и K > 2). Поскольку аналогичное утверждение верно для подковы Λ2 в окрестности R- ∩ S, мы немедленно получаем, что Ξ1 ∩ Ξ2 = ∅. Определим Ξ = Ξ1 ⊃ Ξ2. Существование времени T (y) из пункта 1 теоремы 3.1 выполняется ввиду леммы 3.3. Дей- ствительно, при отображении Φn : Λ1 × {μ > 0} → Λ1 × {μ > 0} координата μ(z) любой точки (K-1)N/6 z ∈ Λ1 × {μ> 0} уменьшается не менее, чем в λ1 = λ-0 λmax < 1 раз, а параметр s на траектории X(z, s(t)) увеличивается на KS(z) ∈ [KSmin, KSmax]. Поэтому на траектории из точки z параметр μ(z(s)) экспоненциально убывает, и, следовательно, выполняются условия леммы 3.3. Единственность следует из определения отображения последования Пуанкаре. Пункты 2 и 3 теоремы 3.1 выполняются по построению множества Ξ (оптимальность также следует из леммы 3.3). Для доказательства пункта 4 теоремы необходимо для z ∈ Ξ1 в качестве последовательности Ψ01(z) ∈ Σ01 рассмотреть элементы Ψ(π(z)) на позициях с кратными K номе- рами: Ψ01(z)j = Ψ(z)jK при всех j ∈ Z. Для z ∈ Ξ2 последовательность Ψ01(z) лежит во втором экземпляре подковы Σ01 и определяется аналогично. Доказанная теорема 3.1 позволяет отыскивать в исходной модельной задаче (2.1) элементы ди- намической системы бернуллиевского сдвига l : Σ01 → Σ01 с положительной энтропией. Например, верно следующее утверждение. Следствие 3.2. Если треугольник Ω удовлетворяет условию теоремы 3.1, то в задаче (2.1) существует бесконечное (счетное) число различных однопараметрических семейств автомо- дельных траекторий. Доказательство. Рассмотрим любую периодическую траекторию бернуллиевского сдвига l. Оче- видно, их бесконечное счетное число. Прообраз любой такой траектории при отображении Ψ01 дает однопараметрическое (относительно действия g группы R+) семейство автомодельных траек- торий. ТОПОЛОГИЧЕСКИЕ СВОЙСТВА ОТОБРАЖЕНИЯ ПОСЛЕДОВАНИЯ ПУАНКАРЕ В доказанной теореме 3.1 получен полулокальный результат о существовании хаоса в опти- мальном синтезе задачи (2.1) с произвольным треугольником Ω, не сильно отличающимся от правильного треугольника с центром в начале координат. Для случая правильного треугольника оптимальный синтез может быть описан точно: в теореме 5.4 найдено множество всех неблуждаю- щих траекторий, описан точный граф топологической марковской цепи, полусопряженной с отобра- жением последования Пуанкаре Φ, найдены оценки на размерности по Хаусдорфу и Минковскому множества неблуждающих траекторий и соответствующая топологическая энтропия. Для получе- ния этих результатов необходимо начать с точного изучения глобальных топологических свойств отображения Φ последовательности переключения S на себя. 34 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД В этой главе мы будем предполагать (если не оговорено противного), что треугольник Ω явля- ется правильным и центрирован в начале координат. Топологическая структура поверхности переключения. В основе изучения глобальной структуры оптимального синтеза в модельной задаче (2.1) с правильным треугольником Ω лежит подробное изучение отображения последования Пуанкаре Φ. Как было сказано выше, отображение Φ определено на некотором подмножестве поверхности переключения. Поэтому в данном пункте мы дадим точное топологическое описание самой поверхности переключения и подмножества то- чек, на котором определено отображение Φ. Поскольку поверхность переключения S описывается через переменные ψi, то пересечение M+ ∩S проще всего описывать в пространстве сопряженных переменных N = {(φ, ψ)}, отож- дествив его с M и M+ при помощи отображения E. Пусть ε : N/g → N - правое обратное отоб- ражение к канонической проекции π : N \\ 0 → N/g. Зададим для удобства вложение ε следующим образом: (ε ◦ π (φ, ψ) = (μ-3φ, μ-4ψ), где μ = 1 2 |φ|4 + |ψ|3. Мы выбрали именно такой способ задания ε, так как ε коммутирует с действием g, и проекцию π можно себе представлять как отображение точки (φ0, ψ0) ∈ N \\ 0 в пересечение ее орбиты g(R+)(φ0, ψ0) со сфероидом ε(N/g) = {(φ, ψ) : |φ|4 + |ψ|3 = 1}. Пространство N/g автоматически наделяется структурой гладкого риманова многообразия, отоб- ражение π становится гладкой сюръекцией, а ε - гладким вложением. Пересечение S∩M+ состоит из трех двумерных по- лусфер Dk , определяемых соотношениями ψi = ψj ψk , пересекающихся по окружности ψ = 0: Dk = ε(N/g) ∩ {(φ, ψ) ∈ N : ψi = ψj ψk }, D1 ∩ D2 ∩ D3 = ε(N/g) ∩ {(φ, ψ) ∈ N : ψ = 0}. В свою очередь, каждая полусфера Dk делится плос- костью φi = φj на два диска: Dk = Dij ∪ Dji, где Dij = ε(N/g) ∩ {(φ, ψ) ∈ N : ψi = ψj ) ψk, φi φj }. Введем обозначение d˜k = Dij ∩ Dji = Dk ∩ {φi = φj }. В любой оптимальной траектории, проходящей через Рис. 4. Диск Dij поверхности переключения π(S) точку Dij , не лежащую на d k , управление совершает переключение с i-й вершины треугольника Ω на j-ю. Окружность ε(N/g) ∩ {ψ = 0} разбивается на шесть отрезков (см. рис. 4) d0 ijk = ε(N/g) ∩ {(φ, ψ) : ψ = 0, φi φj φk } точками d˜+ k = ε(N/g) ∩ {φk > φi = φj }, d k ˜- = ε(N/g) ∩ {φk < φi = φj }. Итак, образ поверхности переключения π(S) на фактор-пространстве N/g является двумерным ijk конечным CW-комплексом с клетками Dij , d0 k , d˜k и d±. Нетрудно заметить, что поверхность π(S) ijk гомотопически эквивалентна букету двух двумерных сфер. Ориентации отрезков d0 выберем в зависимости от четности перестановки (ijk), как показано на рис. 4 (их ориентации пригодятся при факторизации по дискретной группе S3). Как уже неоднократно отмечалось выше, отображение последования Пуанкаре Φ определено для всех точек π(S), кроме точек, лежащих на d k . Поскольку отображение последования Φ коммутирует с действием группы S3, для изучения различных его асимптотических свойств можно ограничиться рассмотрением одного диска Dij . Действие группы S3 на π(S) является клеточным и устроено следующим образом: группа S3 свободно и транзитивно действует на нульмерных клетках d+ и d-; i i ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 35 ijk группа S3 свободно и транзитивно действует на одномерных клетках d0 , сохраняя ориента- цию; нормальная подгруппа S3 свободно и транзитивно действует на одномерных клетках d k . Ста- билизатором клетки d k является подгруппа, порожденная транспозицией (ij) ∈ S3; группа S3 свободно и транзитивно действует на двумерных клетках Dij . Редукция по действию группы S3. Прежде чем приступить к описанию свойств отобра- жения Φ, мы введем несколько соглашений, которые позволят сделать текст значительно более легким для восприятия. Образ Φ(z) любой точки z ∈ Dij лежит в Djk или в Dji. Применением соответствующей перестановки из σ ∈ S3 можно получить (σ ◦ Φ)(z) ∈ Dij . Поэтому траекторию Φn(z) любой точки z ∈ Dij можно изображать только на Dij . Более того, говоря, что образ точки z ∈ Dij при отображении Φ есть точка z± ∈ Dij , в этом разделе мы всегда будем подразуме- вать применение соответствующей перестановки σ ∈ S3 и писать, допуская некоторую вольность, Φ(z) = z±. Вместо этого можно было бы перейти к фактор-пространству S/S3. Отображение Пуанкаре Φ корректно переносится на S/S3, так как оно коммутирует с действием S3. Однако описанный выше способ нам кажется более предпочтительным (хотя по сути эквивалентен), потому что не нарушает исходной топологии диска Dij . Мы будем производить вычисления в пространстве N/g, отождествив его с M/g и M+/g по теореме 2.1 с помощью отображения E. В этом случае диск Dij ⊂ (N/g) может быть задан как подмножество N , описываемое следующей системой неравенств: ⎧ 2 ⎪ |ψ| ⎪ + |φ|2 = 1; ⎪⎨ ψi = ψj ψk ; φi φj ; ⎪ φ1 + φ2 + φ3 = 0; ⎪ ⎪⎩ ψ1 + ψ2 + ψ3 = 0. Отметим, что в предыдущем пункте использовалась нормировка |ψ|3 +|φ|4 = 1, которая удобна тем, что согласована с действием g группы R+. Однако численные расчеты будет удобнее проводить именно в нормировке |ψ|2 + |φ|2 = 1. Введем следующие координаты на диске Dij : 1 χ1 = 2 (φi - φj ) - √ 3ψi, χ2 = 3 φk. 2 Тогда диск Dij отображается в эллипсоид 2χ2 + χ2 1, а координаты φ и ψ могут быть восста- 1 2 новлены по формулам ⎧ ( \\ 2 2 1 2 / ⎪ 2 2 χ1 + 1 - χ1 - χ2 i - φ = 3 ⎪ 2 ⎪ ⎪ χ2 - χ1 + 1 - χ1 - χ2 3 - , ψi = √ , 2 ⎨⎪ 1 ( 2 / \\ χ1 + 1 - χ2 - χ2 φj = - χ2 - χ1 + 1 2 1 - χ2 - χ2 , ψj = - √ 1 2 , ⎪ 2 3 2 3 ⎪ ⎪ 2 χ1 + 1 - χ2 - χ2 ⎪ 1 2 ⎪⎩ φk = χ2, ψk = 3 √3 . Известные элементы синтеза. В этом разделе мы опишем области в D31, соответствующие элементам синтеза, наличие которых было установлено в [10]. К дуге d˜2 примыкает такая область C, что из каждой соответствующей точки переключения с управления 3 на управление 1 траектория в прямом направлении времени, через бесконечное число переключений с управления 1 на управления 3 и обратно, попадает на особый режим по ребру [A1A3] (см. рис. 5). Эта область ограничена дугой 132 d˜2, частью дуги d0 и некоторой d 2 кривой c, соединяющей точку ˜- 132 и дугу d0 . Отображение Пуанкаре в прямом направлении времени переводит область C в подмножество C˜ самой себя; при этом точки дуги d˜2 остаются 2 неподвижными, а кривая c переходит в отрезок c˜ самой себя, примыкающий к точке d˜-. Кривая, 36 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД 2 отделяющая область C˜ от комплемента C \\ C˜, примыкает к точке d˜+. Эта кривая является образом 132 пересечения дуги d0 Комплемент C \\ C˜ с границей C при отображении Пуанкаре в прямом времени. на рис. 5 в обратном направлении времени переводится отображением Пу- анкаре последовательно в области, изображенные на рис. 5. Напомним, что при отображении 132 Пуанкаре в исходном пространстве дуги d0 и d 0 123 отождествляются. Поэтому граница области C \\ C˜ при отображении Пуанкаре в обратном направлении времени следующим образом переходит в границу области Φ-1(C \\ C˜). Кривая, отделяющая область C˜ от комплемента C \\ C˜, переходит в 123 отрезок дуги d0 132 . Отрезок дуги d0 213 переходит в отрезок дуги d0 , а пересечение границы C \\ C˜ с D31 переходит в пересечение границы области Φ-1(C \\ C˜) с D31. Отображение Пуанкаре из области Φ-1 (C \\ C˜) в область Φ-2 (C \\ C˜) в обратном направле- нии времени или из области Φ-2(C \\ C˜) в область Φ-1(C \\ C˜) в прямом направлении времени 132 и d претерпевает разрыв в топологии D31. Точнее, пересечения дуг d0 0 123 с границей области Φ-2(C \\ C˜) сшиваются и переводятся в прямом направлении времени в штрихованную кривую в 213 и d области Φ-1(C \\ C˜), а пересечения дуг d0 0 123 с границей области Φ-1(C \\ C˜) в обратном направлении времени сшиваются и переводятся в штрихованную кривую в области Φ-2 (C \\ C˜). Граница области Φ-2 (C \\ C˜) при отображении Пуанкаре в обратном направлении времени сле- 0 дующим образом переходит в границу области Φ-3 (C \\ C˜). Отрезок дуги d132 переходит в отрезок 213 дуги d0 , 123 а отрезок дуги d0 переходит в штрихованный отрезок границы области Φ-3(C \\ C˜). ˜ 2 Заметим еще, что в любой окрестности точки d- существуют точки, не принадлежащие обла- 2 стям Φ-r (C \\ C˜), r = 1, 2, 3. Из результатов [10] следует (см. приложение Б к настоящей работе), что все такие точки, лежащие в достаточно малой окрестности d˜-, в прямом направлении вре- мени конечным числом итераций отображения Пуанкаре переводятся в область Φ-3(C \\ C˜). Эти отображения соответствуют переключениям, в которых попеременно чередуются управления 1 и 3. Число переключений для каждой точки конечно, но по мере приближения к границе области C неограниченно возрастает. Таким образом, поведение отображения Пуанкаре в некоторой окрестности замыкания дуги d˜2 полностью описано. Опишем связь с областями фактора по группе Фуллера поверхности пере- ij ключения, обозначенных на рис. 4 в статье [10]. Страта Cij на указанном рисунке соответствует 2 области C, части области Φ-3(C \\ C˜) и другим точкам достаточно малой окрестности точки d˜-. Глобальная структура отображения Пуанкаре. Рассмотрим теперь образ окрестности дуг d0 0 132 и d123 при отображении Пуанкаре в прямом направлении времени. Напомним, что при этом отображении данные окрестности сшиваются по этим дугам, а образ дуг представляет собой некоторую кривую σb, соединяющую точки d˜+ и d˜+. Штрихованная линия в области Φ-1(C \\ C˜) и 2 3 граница между областями C \\ C˜ и C˜ являются частями этой кривой. Кривая σb разделяет область D31 на две части. Обозначим ту часть, которая содержит область C˜, через Tb, а ту часть, которая содержит область C \\ C˜,- через Rb. 213 Рассмотрим образ окрестности дуг d0 и d 0 123 при отображении Пуанкаре в обратном направле- нии времени. При этом отображении данные окрестности сшиваются по этим дугам, а образ дуг представляет собой некоторую кривую σf , соединяющую точки d˜- и d˜-. Штрихованная линия в 1 2 области Φ-2(C \\ C˜) и штрихованная часть границы области Φ-3(C \\ C˜) являются частями этой кривой. Кривая σf разделяет область D31 на две части. Обозначим ту часть, которая содержит область C, через Tf , а ту часть, которая содержит область Φ-1(C \\ C˜),- через Rf . Таким образом, отображение Пуанкаре непрерывно на областях Tf и Rf и переводит их биек- тивно в области Tb и Rb соответственно. Если продолжить отображение непрерывным образом на границу области Tf , то эта граница следующим образом переходит в границу области Tb. Дуга 132 d˜2 остается неподвижной, дуга d0 213 переходит в кривую σb, а кривая σf -в дугу d0 . Если про- должить отображение непрерывным образом на границу области Rf , то эта граница следующим 213 образом переходит в границу области Rb. Дуга d0 132 переходит в дугу d0 123 , дуга d0 переходит в 123 кривую σb,а кривая σf -в дугу d0 . Схематически структура отображения Пуанкаре изображена на рис. 6. Рис. 5. Известные области ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 37 38 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Рис. 6. Глобальная структура отображения Пуанкаре Кривые σf и σb пересекаются в одной точке. Координаты этой точки являются решением некоторой системы алгебраических уравнений, так как эта точка трехкратным применением отображения Пуанкаре переходит в область Φ-3(C \\ C˜). Численные значения координат равны χ1 ≈ 0.174146349178, χ2 ≈ 0.907326683652. Переходы циклического и осциллирующего типа. Рассмотрим отображение Пуанкаре, переводящее точку переключения с управления i на управление j в точку переключения с управ- ления j на управление k. Введем следующее определение. Если i = k, то будем называть данный переход осциллирующим; если же i /= k (и, таким образом, {i, j, k} = {1, 2, 3}), то будем называть данный переход циклическим. Введем для этих переходов обозначения T (transposition) и R (rotation). Преимущество описания последовательности управлений на какой-либо конкретной траектории в терминах этого определения заключается в том, что оно инвариантно по отношению действия группы перестановок S3, переставляющей вершины множества допустимых управлений Ω. Заметим, что отображение Пуанкаре области Tf в Tb осуществляется переходом осциллирующе- го типа, а отображение Пуанкаре области Rf в Rb - переходом циклического типа. Индексы b и f обозначают сокращения от английских слов backward и forward. Заметим также, что любая точка области C в ходе эволюции в прямом направлении времени претерпевает исключительно переходы осциллирующего типа, пока через бесконечное число переключений не попадает на особый режим. Аттрактор в обратном направлении времени. В [10] (см. также приложение Б) уста- новлено наличие отталкивающей неподвижной точки FR отображения Пуанкаре на области D31, соответствующей трехзвенным автомодельным циклам в факторпространстве по группе Фуллера R (теорема 3), а также гиперболической периодической траектории, состоящей из двух точек F 1 и F 2 R, и соответствующей шестизвенным автомодельным циклам (теорема 5). Расположения точки FR и пары точек F 1 , F 2 изображены на рис. 7. R R На всех вышеназванных автомодельных траекториях имеет место циклическая последователь- ность всех трех управлений. Таким образом, соответствующие переходы имеют циклический тип, и все три точки FR, F 1 , F 2 лежат в пересечении областей Rf и Rb. R R В силу того факта, что точка FR - отталкивающая в прямом направлении времени, а значит, притягивающая в обратном направлении времени, существует такая (связная) окрестность точки FR, что любая точка из этой окрестности стремится к FR в обратном направлении времени и при этом претерпевает исключительно переходы циклического типа. Определим область I как наибольшую из этих окрестностей. Ясно, что область I является подмножеством области Rb. Численными расчетами установлено, что одна из ветвей устойчивого уса гиперболической пе- риодической траектории (F 1 ,F 2 ) принадлежит области I. Из этого следует, что F 1 ,F 2 лежат R R R R на границе области I, а эта граница определяется неустойчивым усом периодической траектории (F 1 ,F 2 ). Таким образом, область I является пересечением полосы, находящейся между устойчи- R R выми усами периодической траектории (F 1 ,F 2 ), с областью Rb. Наряду с этими усами, ее граница 123 состоит из отрезков дуги d0 R R и кривой σb. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 39 Рис. 7. Пересечение областей I = Ia ∪ Ic и Ib с областями C, C˜ и Φ-r (C \\ C˜), r = 1, 2, 3 40 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Пересечения области I с областями Φ-r (C \\ C˜), r = 1, 2, 3, изображены на рис. 7 следующим образом. Обозначим прообраз области I при отображении Пуанкаре через Iс. Поскольку непо- движная точка является притягивающей в обратном направлении времени, то область Iс является подмножеством области I. Пересечения области Ic с областями Φ-r (C \\ C˜), r = 1, 2, 3, изображе- ны на рис. 7. Обозначим комплемент области Ic в области I через Ia. Пересечения области Ia с областями C \\ C˜ и Φ-2(C \\ C˜) также изображены на рис. 7. В качестве границы между областя- ми Ia и Ic выступает отрезок кривой σf . Этот отрезок при отображении Пуанкаре области Ic в 123 прямом направлении времени отображается на границу области I, а именно, в отрезок дуги d0 . Этот отрезок одновременно лежит на границе области Ic и при отображении Пуанкаре в прямом направлении времени отображается на границу области I, а именно, в отрезок кривой σb. В силу вышесказанного образом области I при отображении Пуанкаре (в прямом направлении времени) является объединение области I с образом области Ia. Обозначим образ области Ia че- рез Ib. Пересечения области Ib с областью Φ-1(C \\ C˜), частью области Φ-3(C \\ C˜) и областью C также изображены на рис. 7. При отображении Пуанкаре в прямом направлении времени обла- 213 сти Ia отрезок кривой σf переходит в отрезок дуги d0 , а отрезок кривой σb - во внутреннюю часть области C˜. Обратим внимание на то, что пересечение кривой σf с областью Ib полностью лежит на границе области Φ-3(C \\ C˜), но граница области Φ-3(C \\ C˜) не содержит пересечения кривых σf и σb. Промежуточные области. В предыдущих разделах мы установили, что точки, лежащие в областях Φ-1(C \\ C˜) и Φ-3(C \\ C˜), через одно или два переключения, соответственно, переходят в область C, а оттуда через бесконечное число переходов осциллирующего типа попадают на особый режим. С другой стороны, точки, лежащие в области Ib, (в обратном направлении времени) через одно переключение попадают в область I и далее стремятся к неподвижной точке FR, при этом претерпевая переходы исключительно циклического типа. В этом разделе мы рассмотрим остальные точки множества D31. Любая точка из D31, не лежащая в замыкании областей Φ-r (C \\ C˜), r = 1, 2, 3, или одной из областей I, Ib, должна лежать в замыкании одной из следующих четырех областей. 132 Область II ограничивается отрезком дуги d0 , отрезком границы области Φ-2(C \\ C˜), отрезком границы области Ic, и отрезком границы области Φ-1(C \\ C˜). Область III ограничивается отрез- ком границы области I, отрезком границы C, отрезком границы области Ib, и отрезком границы 123 области Φ-1(C \\ C˜). Область IV ограничивается отрезком дуги d0 , отрезком границы области C, отрезком границы области Ia и отрезком границы области Φ-2(C \\ C˜). Область V ограничивает- 213 ся отрезком границы области Ib, отрезком границы области C и отрезком дуги d0 . Взаимное расположение областей схематически изображено на рис. 8 (см. также рис. 9). Рассмотрим сейчас динамику системы, задаваемой отображением Пуанкаре, на промежуточных областях. Заметим, что обе кривые σf и σb разделяют область III на две части. Обозначим части области III, определяемые кривой σf , через IIIl и IIIr, а части, определяемые кривой σb,- че- рез IIIu и IIId. При этом область IIIl примыкает к области Φ-1(C \\ C˜), область IIIr - к области C, область IIIu - к области Ib, а область IIId - к области I. Заметим также, что кривая σf разделяет область V на две части. Обозначим эти части через Vl и Vr, при этом область Vl примыкает к 213 дуге d0 , а область Vr - к области C. Тогда отображение Пуанкаре биективно отображает область II на область IIId; при этом от- резок границы области Φ-1(C \\ C˜) переходит в отрезок границы области C, отрезок границы области Φ-2(C \\ C˜) переходит в отрезок границы области Φ-1(C \\ C˜), отрезок границы области Ic 132 переходит в отрезок границы области I, а отрезок дуги d0 - в отрезок кривой σb. Соответствую- щий переход имеет циклический тип. Отображение Пуанкаре также биективно отображает область IV на область IIIu, при этом отрезок границы области C \\ C˜ переходит в отрезок границы области C˜, отрезок границы обла- сти Φ-2(C \\ C˜) переходит в отрезок границы области Φ-1(C \\ C˜), отрезок границы области Ia 123 переходит в отрезок границы области Ib, а отрезок дуги d0 - в отрезок кривой σb. Соответству- ющий переход имеет осциллирующий тип. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 41 Рис. 8. Схематическое расположение областей 132 Как явствует из рис. 6, образ области Vl примыкает к дугам d0 и d 0 123 . При этом пересечение границы областей Ib и Vl переходит в кривую, соединяющую эти дуги. Эта кривая не может пере- секать область I, поскольку прообраз области I не пересекается с областью Vl. Концы этой кривой лежат соответственно в областях Φ-r (C \\ C˜), r = 1, 3, поэтому концы ее образа должны лежать соответственно в областях Φ-r (C \\ C˜), r = 0, 2. Таким образом, отображение Пуанкаре переводит область Vl в объединение подмножеств замыканий областей C и Φ-2(C \\ C˜) и подмножества области IV. Соответствующий переход имеет циклический тип. Для того чтобы выяснить, как отображается область Vr, рассмотрим прообраз области V при отображении Пуанкаре. Из вышесказанного следует, что этот прообраз ограничен границей обла- сти C, кривой σf , и границей области Ia. В частности, он содержит область Vr. Поэтому отоб- ражение Пуанкаре переводит область Vr в подмножество области V. Соответствующий переход имеет осциллирующий тип. Из предыдущего абзаца следует, что область IIIr содержится в прообразе области V, поэтому она переводится в подмножество области V. Соответствующий переход имеет осциллирующий тип. Рассмотрим теперь образ области IIIl. Пересечение границ области IIIl и области Φ-1(C \\ C˜) переводится в отрезок границы области C. Пересечение границ областей IIIl и Ic переводится в отрезок границы области I. Отрезок кривой σf , граничащий с областью IIIl, переводится в отрезок 123 дуги d0 . Так как концы этого отрезка кривой σf находятся соответственно в областях Φ-r (C \\C˜), , то концы отрезка дуги d0 должны находиться соответственно в областях Φ-r (C \\ C˜), r = 2, 3 123 r = 1, 2. Из этого следует, что образ области IIIl является объединением подмножеств замыканий областей Φ-r (C \\ C˜), r = 1, 2, области II и подмножества области IV. Соответствующий переход имеет циклический тип. Образы областей II, IIIl, IIIr, IV, Vl и Vr схематически изображены на рис. 10. На рис. 10 справа видно, что область IV делится образами областей III и V на три полоски IVa, IVb, и IVc. При этом определим множество IVa как пересечение области IV с образом замыкания области III, множество IVc - как пересечение области IV с образом замыкания области V, а множество IVb - как комплемент множеств IVa и IVc в области IV. Перейдем сейчас к прообразам областей II-V. При отображении Пуанкаре в обратном направ- 123 лении времени область II переходит в подмножество области IIIl. При этом отрезок дуги d0 , примыкающий к области II, переходит в отрезок кривой σf , отрезки границ областей Φ-r (C \\ C˜), Рис. 9. Области II, III, IV, V 42 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 43 Рис. 10. Образы областей II, III, IV, V Рис. 11. Прообразы областей II, III, IV, V r = 1, 2, переходят соответственно в отрезки границ областей Φ-r (C \\ C˜), r = 2, 3, а отрезок гра- ницы области Ic - в отрезок границы области Ic. Соответствующий переход имеет циклический тип. 132 Рассмотрим прообраз области IV. Отрезок дуги d0 , примыкающий к области II, переходит в 213 отрезок дуги d0 границ областей , отрезки границ областей C и Φ-2(C \\ C˜) переходят соответственно в отрезки (C \\C˜), r = 1, 3, а отрезок границы области Ia - в отрезок границы области Ic. Φ-r Таким образом, прообраз области IV является объединением замыканий подмножеств областей IIIl и Vl и подмножеством области Ib. Обозначим замыкание этого подмножества области Vl через Va. Соответствующий переход имеет циклический тип. Прообразами областей IIIu и IIId являются области IV и II, соответственно, а соответствующие переходы имеют осциллирующий и циклический тип соответственно. Наконец, прообраз области V был описан выше. Он является объединением областей IIIr и Vr и подмножеством замыкания области Ib. Соответствующий переход имеет осциллирующий тип. Прообразы областей II, IIId, IIIu, IV и V схематически изображены на рис. 11. Динамику отображения Пуанкаре на замыканиях областей II-V можно описать ориентирован- ным графом, представленным на рис. 12. При этом выходящие стрелки соответствуют переходам в точки областей Φ-r (C \\ C˜), r = 0, 1, 2, откуда они попадают в область притяжения особого режи- ма, а входящие стрелки - переходам из точек областей I или Ib, откуда они в обратном времени 44 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД r II III r r t r t t r IV r V r t Рис. 12. Граф переходов Рис. 13. Динамика на области V попадают в область притяжения неподвижной точки FR. Буквы t и r соответственно обозначают осциллирующий или циклический тип перехода. Разрешение динамики на области V. Рассмотрим пересечения области V с образами об- ластей III и V, с одной стороны, и с прообразами областей IV и V, с другой стороны. Эти пересечения схематически изображены на рис. 13 справа. Из рис. 13 явствует, что множество Va является подмножеством замыкания пересечения образа области III с областью V. Поэтому любая точка, приходящая в область V не из области III, уже никогда не может вернуться в одну из областей II, III или IV. Такая точка, если она не лежит в пересечении области V с областями Φ-r (C \\ C˜), r = 1, 3, обязательно через конечное число переходов осциллирующего типа попадает в область Φ-3(C \\ C˜), из которой через три перехода попадает в область C, т.е. область притяжения особого режима. Из графа, изображенного на рис. 12, тогда следует, что любая траектория, не попадающая в прямом направлении времени в область притяжения особого режима, а в обратном направлении времени - в область притяжения неподвижной точки FR, должна бесконечно много раз проходить через замыкание области III. Поэтому при изучении этих траекторий мы можем ограничиться изучением отображения замыкания области III на себя. Из графа 12 следует, что это отображение может происходить тремя способами: двумя пере- ходами циклического типа через область II, двумя переходами, циклического и осциллирующего типа соответственно, через область IV, и наконец, тремя переходами, осциллирующего, цикли- ческого и снова осциллирующего типа соответственно, через области V и IV. Обозначим эти способы отображения замыкания области III на себя через A, B, C, соответственно. Таким об- разом, любая траектория, не попадающая в прямом направлении времени в область притяжения ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 45 Рис. 14. Динамика на области III особого режима, а в обратном направлении времени - в область притяжения неподвижной точ- ки FR, может быть представлена двусторонне бесконечной последовательностью символов A, B, C. Точке замыкания области III, которая в прямом направлении времени претерпевает отображе- ния i1, i2,..., inf ∈ {A, B, C}, а в обратном направлении времени - отображения j1, j2,..., jnb , где nf , nb могут быть конечными или бесконечными, поставим в соответствие последовательность символов jnb , jnb-1,..., j1.i1, i2,..., inf . Здесь точка отделяет переходы, лежащие в будущем, от переходов, лежащих в прошлом. С другой стороны, последовательности jnb , jnb-1,..., j1.i1, i2,..., inf поставим в соответствие множество точек замыкания области III, которые в прямом направлении времени претерпева- ют отображения i1, i2,..., inf ∈ {A, B, C}, а в обратном направлении времени - отображения j1, j2,..., jnb . Таким образом, например, A.B соответствует пересечению замыкания области III с прообразом отображения B и образом отображения A. Таким образом, множество A. совпадает с замыканием области IIId, множество B. является образом определенного выше множества IVc, а множество C. - образом множества IVa. С другой стороны, множество .A является замыканием прообраза области II, множество .B - замыканием пересечения прообраза области IV с областью III, а множество .C - прообразом множества Va. Множества .A, .B, .C изображены на рис. 14 слева, а множества A., B., C. - справа. Отображения A, B, C переводят первые во вторые. Заметим, что множества .A и .C пересекаются с кривой σf в одном и том же отрезке, который одновременно является частью их границы. Оба множества также граничат с областью I и с областью Φ-2(C \\ C˜). Множество .A также граничит с областью Φ-3(C \\ C˜), а множество .C -с прообразом при отображении Пуанкаре пересечения Φ-3(C \\ C˜) с областью V. С другой стороны, множество .B граничит с областями I и Ib и областями Φ-r (C \\ C˜), r = 1, 3. Множество B. граничит с областью Ib, с областями Φ-1(C \\C˜) и C, а также с образом области IVb. Множество C. граничит c множеством A. по кривой σb, а также примыкает к областям Φ-1(C \\ C˜) и C ик образу области IVb. Отметим, что все три области на рис. 14 слева пересекаются со всеми тремя областями на рис. 14 справа. Поэтому возможны сочетания всех типов отображений A, B, C со всеми типами. Более того, каждое из отображений A, B, C имеет неподвижную точку. Эти точки отмечены на рис. 14 крестиками, и обозначены символами α, β и γ для отображений A, B и C соответственно. При этом первая и вторая неподвижные точки соответствуют шестизвенному и четырехзвенному циклу, соответственно, найденными в [10] (см. приложение Б), а третья - девятизвенному циклу (открытому в 2002 г.). Разрешение динамики отображений типа B. Как явствует из рис. 15, множества .AA, .AC, .CA, .CC с множеством B. не пересекаются. Таким образом, последовательность сим- волов, отвечающая траектории системы, не может содержать подпоследовательности Bij, где 46 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Рис. 15. Динамика с участием отображения B Рис. 16. Динамика с участием отображения B i, j ∈ {A, C}. По индукции из этого следует, что если в последовательности где-либо встреча- ются подряд два символа из множества {A, C}, то символ B может встретиться только справа от них. Множества .BA и .BC являются подмножествами B., а множества .BBA и .BBC пересекаются со всеми тремя множествами A., B., C.. Множества .BBBA и .BBBC также являются подмно- жествами B., а .BBBBA и .BBBBC - подмножествами A. (см. рис. 16). Множества .ABBBBA и .ABBBBC являются подмножествами A., в то время как .ABBA, .ABBC, .CBBA и .CBBC имеют непустое пересечение с множеством B. (см. рис. 15). Множества .BABBA, .BABBC, .BCBBA и .BCBBC (обозначенные на рис. 17 символом α) являются подмножеством объединения .BA ∪ .BC и поэтому также являются подмноже- ством B.. Однако .BBABBA, .BBABBC, .BBCBBA, .BBCBBC (обозначенные на рис. 17 сим- волом β) уже являются только подмножествами A., а .ABBABBA, .ABBABBC, .ABBCBBA, .ABBCBBC (обозначенные на рис. 17 символом γ) не пересекаются с B.. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 47 Рис. 17. Динамика с участием отображения B Из сказанного следует, что если в последовательности встречается подпоследовательность Bi, где i ∈ {A, C}, то эта подпоследовательность налево может продолжаться только одним из следу- ющих способов: . . . AABBBBi, . . . ABBjBBi, ... BBi, где j ∈ {A, C}, а многоточие обозначает последовательность любой длины, состоящую из символов A и C. В частности, бесконечная в обе стороны последовательность либо состоит только из символов B, и в этом случае она соответствует неподвижной точке отображения B, т.е. четырехзвенному циклу, либо она содержит подпоследовательность, состоящую только из символов B и продол- жающуюся бесконечно вправо, и подпоследовательность, не содержащую ни одного символа B и продолжающуюся бесконечно влево, а между этими подпоследовательностями расположено мак- симально 6 символов, либо она не содержит ни одного символа B. Таким образом, если соот- ветствующая траектория динамики на замыкании множества III не является неподвижной точкой отображения B, то она проходит через объединение множеств A.A, A.C, C.A, C.C и далее в обратном направлении времени остается в этом объединении. Динамика отображений типа A и C. В дальнейшем мы рассмотрим динамику отображе- ний A и C на объединении множеств A.A, A.C, C.A, C.C, а точнее, на замкнутом множестве IIIb, определяемом как объединение множеств A.A, A.C, C.A, C.C и замыкания пересечения обла- сти Φ-2(C \\ C˜) и области III. Таким образом, множество IIIb граничит с областью I, с областью Φ-3(C \\C˜), с образом множества IVb и с прообразом пересечения области Φ-3(C \\C˜) с областью V. Множество IIIb изображено на рис. 18 слева и на рис. 19 справа. Определим отображения F, F -1 : IIIb → D31 следующим образом. Для точки χ, расположенной в полосе между областью Φ-3(C \\ C˜) и кривой σf , определим F (χ) как образ χ при отобра- жении A, т.е., при двойном отображении Пуанкаре. При этом оба перехода имеют циклический тип. Для точки χ, расположенной в полосе между прообразом области Φ-3(C \\ C˜) и кривой σf , определим F (χ) как образ χ при отображении C, т.е. при тройном отображении Пуанкаре. При этом переходы имеют осциллирующий, циклический, и снова осциллирующий тип соответствен- но. Отображение F непрерывно продолжается на пересечение множества IIIb с кривой σf . Для точки χ, расположенной в полосе между областью I и кривой σb, определим F -1(χ) как прообраз χ при отображении A, т.е. при двойном отображении Пуанкаре в обратном направлении времени. При этом оба перехода имеют циклический тип. Для точки χ, расположенной в полосе между 48 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Рис. 18. Образ области IIIb Рис. 19. Прообраз области IIIb образом множества IVb и кривой σb, определим F -1(χ) как прообраз χ при отображении C, т.е. при тройном отображении Пуанкаре в обратном направлении времени. При этом переходы име- ют соответственно осциллирующий, циклический и снова осциллирующий тип. Отображение F -1 непрерывно продолжается на пересечение множества IIIb с кривой σb. Отображение F переводит отрезок кривой σf в отрезок кривой σb, а отображение F -1 - отрезок кривой σb в отрезок кривой σf . При этом образы этих отрезков не пересекаются с множеством IIIb, и пересечения этого множества со своими образами при отображениях F и F -1 состоят из двух компонент связности соответственно. Таким образом, топология отображения множества IIIb на себя эквивалентна топологии отображения в классической подкове Смейла. Образы множества IIIb при отображениях F и F -1 изображены на рис. 18 и 19. На рис. 18 и 19 неподвижные точки отображения F отмечены крестиками и обозначены сим- волами α и β. Эти две точки являются неподвижными точками отображений A и C соответ- ственно и были обозначены выше на рис. 14. Крестиками с символом β на рис. 18 и 19 обо- значена двухэлементная периодическая траектория отображения F , состоящая из неподвижных точек отображений A ◦ C и C ◦ A. Она соответствует семейству 15-звенных автомодельных цик- лов, инвариантному относительно элемента порядка 3 группы перестановок S3. Все три пери- одические траектории имеют гиперболический тип. Сжимающие собственные значения прибли- женно равны 0,789389405489713, -0,195427788394708, -0,064093706436160, а растягивающие - 25,416902415438734, -2,553017991174260, -73,29685207454 для неподвижных точек отображений A, C и A ◦ C соответственно. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 49 Отметим, что отображение F непрерывно дифференцируемо (и даже алгебраическое) на всюду плотном подмножестве множества IIIb. Это множество точек, которые в прямом направлении вре- мени переводятся многократным применением отображения Пуанкаре во внутренность области C, при этом не проходя через границу области D31. Поэтому любую такую точку можно получить, применяя отображение Пуанкаре в обратном направлении времени к некоторой точке области C, или, что эквивалентно, области Φ-1(C \\ C˜). ХАОТИЧЕСКАЯ ДИНАМИКА ОТОБРАЖЕНИЯ ПУАНКАРЕ В этом разделе мы докажем основную теорему первой части работы о полусопряженности дина- мики оптимального синтеза в модельной задаче (2.1) с некоторой топологической цепью Маркова (для случая правильного треугольника). Более того, будут найдены оценки на размерности по Хаусдорфу и по Минковскому множества неблуждающих точек и вычислена топологическая эн- тропия. Билипшицевость отображения последования Пуанкаре. Основным инструментом изуче- ния оптимального синтеза задачи (2.1) в предыдущих пунктах выступала теорема 2.1 о переходе к сопряженным переменным, точнее, отображение E. Поэтому для доказательства билипшицевости отображения Φ нам потребуется начать с исследования отображения E на билипшицевость. В теореме 2.1 было установлено, что в широком классе задач оптимального управления (в том числе в модельной задаче (2.1)) отображение E является (локально) липшицевым и биективным. Вообще говоря, обратное отображение E-1 в общей задаче (2.1) может уже не быть липшицевым даже локально. В следующей лемме мы докажем, что в модельной задаче (2.1) отображение E является локаль- но билипшицевым в окрестности любой точки, не лежащей на Aij . Лемма 5.1. Рассмотрим точку q0 = (x0, y0), не лежащую ни в одной из плоскостей Aij (т.е. x0 ∈/ ∪Aij или y0 ∈/ ∪Aij ). Тогда существует окрестность точки q0, в которой отображение E является билипшицевым. Доказательство. По сути доказательство заключается в получении нижней оценки на разность B(q1) - B(q0) - B±(q0)Δq и последующего применения леммы 2.7. Здесь, как обычно, qi = (xi, yi) и Δq = (Δx, Δy) = q1 - q0. Пусть X0(t) и X1(t) - две произвольные траектории, начинающиеся в точках x0 и x1 соот- ветственно. Для произвольного λ ∈ [0; 1] обозначим Xλ(t) = (1 - λ)X0(t) + λX1(t). Тогда для функционала J , определенного в (2.1), выполнено тождество (1 - λ)J (X0)+ λJ (X1) - J (Xλ) = λ(1 - λ)J (ΔX), где ΔX(t) = X1(t) - X0(t). Если же траектории X0 и X1 являются оптимальными и X˙ i(0) = yi, i = 1, 2, то (1 - λ) B(q0)+ λ B(q1) - B(qλ) ) λ(1 - λ)J (ΔX), где qλ = (1 - λ)q0 + λq1. Поскольку левая и правая часть написанного неравенства совпадают при λ = 0, то продифференцировав их по λ при λ = 0 получаем B(q1) - B(q0) - B±(q0)Δq ) J (ΔX). 5 Осталось оценить снизу J (ΔX). Простейший способ оценки J (ΔX) ) B(Δq) дает плохой резуль- тат слишком высокого порядка, так как B(Δq) ) AΔx 2 + BΔy5, и лучше оценить в произвольной точке функцию Беллмана, вообще говоря, нельзя. Однако если точка q0 не лежит на Aij , то оказывается, что значение функционала J (ΔX) можно оценить лучше. Пусть для начала точка q0 ∈/ ∪Aij × Aij не является точкой переключения управления. Это означает, что для некоторой достаточно малой окрестности V точки q0 определено такое время τ > 0, что в течение времени по крайней мере τ все оптимальные траектории из точек q1 ∈ V идут с одинаковым управлением u0 в одной и той же вершине треугольника Ω. Действительно, поднятие оптимальной траектории ( t), t), φ (t), ψ (t)) из (q0, E(q0) пересекает в первый раз поверхность переключения S x( y( = (q0, E(q0) в момент в некоторой точке (x±, y±, φ±, ψ±) / времени t0 > 0. Поскольку поверхность S замкнута, то для любого ε > 0 найдется такое δ > 0, 50 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД что если траектория гамильтоновой системы (2.3) начинается в δ-окрестности точки (q0, E(q0) , то она в первый раз пересечет S не ранее, чем в t0 - ε. Осталось отметить, что по теореме 2.1 отображение E непрерывно, поэтому если точка q1 близка к q0, то (q1, E(q1)) близка к (q0, E(q0)). Итак, при t ∈ [0; τ ] выполнено равенство ΔX(t) = Δx + tΔy, так как управление на опти- мальных траекториях из q0 и q1 в течение этого промежутка времени совпадает (если q1 лежит в окрестности q0). Поэтому для некоторого C± > 0 выполняется τ 1 r B(q1) - B(q0) - B±(q0)Δq ) J (ΔX) ) 2 0 (Δx + tΔy)2 dt ) C±(Δx2 + Δy2). Таким образом, после применения леммы 2.7 получаем доказательство утверждения леммы 5.1 для точек q0, не лежащих на поверхности переключения. Если же точка q0 лежит на поверхности переключения, то для оценки J (ΔX) снизу необходимо сдвинуться по всем оптимальным траек- ториям из окрестности q0 на одно и то же небольшое время t0 > 0 и повторить описанное выше доказательство. Таким образом1, справедливы следующие утверждения: отображение E : M → N представляет собой локально липшицев гомеоморфизм, являющийся билипшицевым в окрестности точек, не лежащих на ∪Aij × Aij ; отображение q 1→ (q, E(q)) является (локально) билипшицевым гомеоморфизмом M → M+; отображение (q, E(q)) 1→ E(q) представляет собой (локально) липшицев гомеоморфизм M+ → N , являющийся билипшицевым в окрестности точек, не лежащих на ∪Aij × Aij . В том числе все эти отображения сохраняют описанные выше свойства после факторизации по действию g. Исследуем теперь на билипшицевость отображение последования Пуанкаре Φ. Пусть точка ij x ∈ (S ∩ M+)/g не лежит ни в J A×4/g, ни на S123/g. Согласно лемме 2.8, определен образ (S∩ M+)/g. Предположим, что ij Φ(x) ∈/ S123/g, Φ(x) ∈/ 1 A×4/g. Тогда проекция траектории гамильтоновой системы (2.3), проходящая через x, пересекает по- верхность переключения и в точке x, и в точке Φ(x) трансверсально. Поэтому отображение Φ : S/g → S/g определено в окрестности x в S/g и является локальным диффеоморфизмом окрестности x в S/g на ее образ. Отсюда немедленно получаем, что ограничение Φ на (S∩ M+)/g является билипшицевым отображением в окрестности x. Воспользовавшись теперь билипшицево- стью отображения E, получаем следующее утверждение. Лемма 5.2. Отображение последования Пуанкаре Φ : (S ∩ M+)/g → (S ∩ M+)/g является билипшицевым в окрестности любой такой точки x, что x и Φ(x) не лежат ни на S123/g, ни ij на J A×4/g. Свойство локальной билипшицевости сохраняется у отображения Φ, записанного в терминах пространств M/g и N/g с помощью отождествления E. Следствие 5.1. Отображение F : A.A∪A.C ∪C.A∩C.C → A.A∪A.C ∪C.A∩C.C, определенное в п. 4.10, является билипшицевым. Условия липшицевой гиперболичности. Изучим подробно динамику отображения F . Вы- берем (как было показано в предыдущем пункте) непересекающиеся прямоугольные окрестно- сти B1, B2, B3, B4 множеств A.A, A.C, C.A, C.C соответственно и координаты (Xi, Yi) на Bi, i = 1, 2, 3, 4. Обозначим через Fij ограничение F на множество тех точек Bi, которые при одной итерации F попадают в Bj , т.е. Fij = F |Bi∩F -1(Bj ). Отображения Fij определены в соответствии с графом Γ (см. рис. 20): отображение Fij определено, если в графе Γ имеется стрелка, соединяющая соответствующие вершины. 1На множествах M , N и M+ естественным образом определены структуры метрических пространств, индуциро- ванные из объемлющего линейного пространства M = T∗M = M × N . Однако множество M+ не является, вообще говоря, гладким подмногообразием M. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 51 A.A A.C C.A C.C Рис. 20. Граф Γ F ux ux uy vy vy vx F11 21 25,6 0,57 0,739 0,792 0,15 F31 20,3 22,4 0,37 0,4 0,48 0,14 F12 22,5 34 3,1 0,72 0,785 0,5 F32 21 25 1,9 0,4 0,48 0,07 F23 3,08 3,28 0,06 0,07 0,18 0,06 F43 3,11 3,28 0,09 0,176 0,019 0,0591 F24 2,35 2,9 0,75 0,1 0,22 0,1 F44 2,3 2,9 0,8 0,175 0,21 0,1 F -1 yv yv yu xu xu xv F -1 11 1,26 1,36 0,098 0,039 0,049 0,37 F -1 31 2,09 2,51 0,16 0,0444 0,049 0,045 F -1 12 1,342 1,384 0,0195 0,029 0,045 0,18 F -1 32 2,1 2,5 0,0061 0,04 0,048 0,2 F -1 23 5,6 14,1 0,25 0,305 0,323 0,171 F -1 43 5,3 5,66 0,0094 0,303 0,323 0,151 F -1 24 5 14,4 0,4 0,37 0,394 1,41 F -1 44 4,6 5,6 0,21 0,364 0,381 1,55 Таблица 1. Константы ux, ux и т. д. для отображений F и F -1 B1 B2 B3 B4 c d 0,00743 0,146 0,0225 0,321 0,022 0,103 0,0488 0,374 Таблица 2. Константы ci и di отображений F и F -1 для прямоугольников Bi F σ1 σ2 σ3 σ4 σ5 σ6 λσ - 0,797 0,249 0,0748 0,0238 0,0201 0,0883 λ±- σ 0,734 0,137 0,0178 0,00462 0,0304 0,0271 ασ - 0,739 0,701 0,643 0,695 0,674 0,673 Таблица 3. Константы λ-, λ/- и α- для отображения F o σ F -1 σ1 σ2 σ3 σ4 σ5 σ6 λ+ σ 0,0484 0,46 0,000785 0,00829 0,000403 0,0162 λ±+ σ 0,0386 0,288 0,000341 0,00294 0,0000864 0,0117 α+ σ 0,931 0,625 0,895 0,822 0,835 0,927 Таблица 4. Константы λ+, λ/+ и α+ для отображения F -1 o σ 52 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Пусть Uij (Xi, Yi) и Vij (Xi, Yj ) обозначают первую и вторую координаты образа Fij (Xi, Yi) в прямоугольнике Bj соответственно: Fij (Xi, Yi) = (Uij (Xi, Yi), Vij (Xi, Yj ) . Согласно утверждению предыдущего пункта отображения Fij удовлетворяют следующим неравен- ствам, выполненным для любой точки (Xi, Yi) ∈ Bi ∩F -1(Bj ) и для любого допустимого смещения (ΔX, ΔY ): ( uxij |ΔX| Uij (Xi + ΔX, Yi) - Uij (Xi, Yi) uxij |ΔX|, Uij (Xi, Yi + ΔY ) - Uij (Xi, Yi) uyij |ΔY |, ( vyij |ΔY | Vij (Xi, Yi + ΔY ) - Vij (Xi, Yi)) vyij |ΔY |, Vij (Xi + ΔX, Yi) - Vij (Xi, Yi) vxij |ΔY |, ij где uxij , uxij и т. д. обозначают положительные константы (их точные значения приведены в левой таблице 11). Более того, обратные отображения F -1 удовлетворяют аналогичным соотношениям с константами xuij , xuij и т. д., точные значения которых приведены в правой таблице 1. Отметим, что точные значения констант ux, ux и т. п. зависят от выбора координат Xi и Yi. Данные в таблице 1 приведены для Xi и Yi, имеющих следующий явный вид: 1 X1 = X3 = 3636,746266824261χ1 - 4481,163862258486χ2 + 3855,150222649458χ2 - - 9508,946041171987χ1χ2 + 5858,268250499643χ2 + 1403,048095297728χ3 - 2 1 - 5062,144152379995χ2χ2 + 6220,813348898283χ1χ2 - 2553,628003178778χ3, 1 2 2 1 X2 = X4 = 15(-434,858450049792χ1 - 1178,182552029670χ2 - 120,018213318585χ2 + + 1034,238125839267χ1χ2 + 1197,949813776455χ2 + 294,581582485282χ3 - 2 1 - 56,750230435401χ2χ2 - 570,219924579354χ1χ2 - 401,871126962896χ3), 1 2 2 1 Y1 = Y2 = 3,239086633898χ1 - 908,305710474105χ2 - 19,706205900010χ2 - - 2,212072200027χ1χ2 + 1018,022649246405χ2 + 6,183323553959χ3 + 2 1 + 19,428876703623χ2χ2 - 1,286781359343χ1χ2 - 379,719994048579χ3, 1 2 2 1 Y3 = Y4 = 7714,46037676461χ1 + 57227,20693518666χ2 - 1394,23893421762χ2 - - 16419,64632698288χ1χ2 - 61359,76468135373χ2 + 68,70577470503χ3 + 2 1 + 1493,59693767978χ2χ2 + 8734,94321423633χ1χ2 + 21935,18377642208χ3. 1 2 2 Поскольку прямоугольники Bi образуют предмарковское разбиение множества2 B = ⊃iBi отно- сительно отображений Fij , мы можем воспользоваться техникой исследования липшицевых гипер- болических динамических систем, разработанной в [27]. Основным условием применимости этой техники для отображения F является условие липшицевой гиперболичности. Определение 5.1. Будем говорить, что липшицева динамическая система на предмарковском разбиении B = ⊃iBi удовлетворяет условиям липшицевой гиперболичности, если выполнены сле- дующие условия: существуют такие неотрицательные константы ci ) 0, i = 1, 2, 3, 4, что выполняются нера- венства ij ij i y x c v ij + v ij - u ij ij ux ci uy > 0, x - ci uy cj для каждой стрелки (ij) в графе Γ ; константы ci ) 0 можно выбрать так, что для каждого простого цикла3 σ = (i1i2 ... iki1), ir ∈ {1, 2, 3, 4}, выполняется условие σ = λi1i2 λi2i3 ... λik i1 < 1, (5.1) λ- - - - 1Численные значения, приведенные во всех таблицах, выписаны с округлением в нужную сторону, в зависимости от знаков неравенств, в которых они участвуют. 2За точным определением предмарковского разбиения мы отсылаем читателя к [27]. 3Цикл (i0,... iN , i0) в ориентированном графе Γ , не содержащий повторяющихся вершин, будем называть простым. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 53 где uxijvyij + uyijvxij - λij = uxij - ciuy ij . (5.2) Отображение F удовлетворяет условиям липшицевой гиперболичности на B = ⊃iBi с кон- стантами ci, приведенными в таблице 2. Действительно, условие 1 проверяется непосредствен- ной подстановкой, а условие 2 проверяется также прямой подстановкой по всем простым цик- лам (которых всего шесть: σ1 = (A.A; A.A), σ2 = (C.C; C.C), σ3 = (A.A; A.C; C.A; A.A), σ4 = (C.C; C.A; A.C; C.C), σ5 = (A.A; A.C; C.C; C.A; A.A) и σ6 = (A.C; C.A; A.C)). Численные значения произведений (5.1) для отображения F приведены в таблице 3. σ В дальнейшим для оценок размерностей нам еще потребуются константы α- и λ- - ±λ- ± ... λ- ±, где σ = λi1i2 i2i3 ik i1 λ-± = uxij vyij - uyij vxij σ ln λ- λ-, α- = . (5.3) ij uxij + ciuyij ij σ ln λ-σ ± Значения констант α- и λ±- также приведены в таблице 3. o σ Из липшицевой гиперболичности F следует, что B = ⊃iBi является предмарковским разбиением также и для обратного отображения F -1 (см. [27]). Отметим, что в общем случае, вообще говоря, из липшицевой гиперболичности F не следует, что обратное отображение F -1 удовлетворяет условиям 1 и 2 с какими-либо константами di ) 0. Однако в этом конкретном случае такие константы di для отображения F -1 действительно существуют (их точные значения приведено в таблице 2). Таким образом доказана, следующая лемма. Лемма 5.3. Отображения F и F -1 обладают предмарковским разбиением B = ⊃iBi и удо- влетворяют на нем условиям липшицевой гиперболичности с положительными константами ci и di, i = 1, 2, 3, 4, соответственно, значения которых приведены1 в таблице 2. Отметим, что для отображения F -1 константы λ+± = λ+ ±λ+ ± ... λ+ ±, λ+ = λ+ λ+ ... λ+ o i1i2 i2i3 ik i1 o i1i2 i2i3 ik i1 σ и α+, приведенные в таблице 4, вычислены по формулам y x ji λ+± = v u y ji - uji xvji y x ji λ+ = v u ji + yu ji xvji + , α+ = ln λσ . (5.4) ji yvji + djxvji ji yvji - djxvji o ± o ln λ+ Сопряженность с топологической марковской цепью. Для доказательства того факта, что липшицева гиперболическая динамическая система F : B→ B полусопряжена с двусторонней топологической марковской цепью Σ , мы воспользуемся теоремой, доказанной в [27] (через S(F ) обозначено множество точек x Γ раз которых Fn(x) лежит в при всех n Z). ∈ B, об B ∈ Теорема 5.1 (см. [27, Theorem 1]). Предположим, что липшицева динамическая система i=1 F : B → B обладает предмарковским разбиением B = ⊃N Bi с ориентированным графом Γ. Предположим также, что отображение F обратимо2: uxijvyij - uyijvxij > 0 для каждой стрелки (ij) в графе Γ, и для F и F -1 выполнены условия липшицевой гиперболичности3 с константами ci и di соответственно, причем cidi < 1 для 1 i N . Тогда существует гомеоморфизм ΨΓ : ΣΓ → S(F ), полусопрягающий F и левый марковский сдвиг: ΨΓ ◦ l = F ◦ ΨΓ. 1Явные значения констант ci и di были найдены на компьютере с помощью несложного алгоритма, который мы не считаем необходимым публиковать, так как заинтересованный читатель может убедиться в верности вычислений констант ci и di при помощи прямой подстановки. 2Написанное ниже условие гарантирует обратимость F . 3Согласно определению 5.1. 54 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Более того, множество неблуждающих точек NW(F ) содержится в S(F ), а если граф Γ сильно связен, то NW(F ) и S(F ) совпадают. В качестве прямого следствия этой теоремы мы получаем лемму о структуре множества неблуж- дающих точек исследуемого отображения F . Лемма 5.4. Липшицева динамическая система F : B→ B полусопряжена с левым сдвигом l на топологической марковской цепи ΣΓ бесконечных в обе стороны путей на графе Γ (см. рис. 20), т.е. существует такое непрерывное вложение что F ◦ ΨΓ = ΨΓ l. Более того, ΨΓ Γ : Σ → B, S(F ) = NW(F ) = Ψ (Σ ). Γ Γ Доказательство. Проверка условий теоремы для исследуемого отображения F тривиальна, по- скольку константы ci и di уже найдены (см. лемму 5.3), а сильная связность графа Γ очевидна. Оценка размерностей. В связи с тем, что отображение E является билипшицевым в окрестности точек B по лемме 5.1, мы можем говорить о размерности по Хаусдорфу (или по Минковскому) множества неблуждающих точек NW(F ), так как билипшицевы отображения не меняют размерностей множеств (см. [19]). Для оценки размерностей по Хаусдофру и Минковскому множества неблуждающих точек NW(F ) мы воспользуемся еще одной теоремой из [27]. Для ее использования достаточно знать только липшицевы константы ux, ux и т. д. и константы ci и di. Теорема 5.2 (см. [27, Theorem 5]). Предположим, что липшицева динамическая система i=1 F : B → B обладает предмарковским разбиением B = ⊃N Bi с ориентированным графом Γ. Предположим также, что F обратимо: uxijvyij - uyijvxij > 0 для каждой стрелки (ij) в графе Γ, и для F и F -1 выполнены условия липшицевой гиперболичности с константами ci и di соот- ветственно, причем cidi < 1 для 1 i N . Тогда если граф Γ сильно связен, то (s± - + + s± )α dimH NW(F ) dimB NW(F ) s- + s+. Константы s-, s± , s+ и s± выбираются так, чтобы спектральный радиус соответствующей - матрицы равнялся 1: - ρ((Λ-)s + - s = 1, ρ((Λ± ) ! = 1, ρ((Λ+)s+ - + s = 1, ρ((Λ± ) ! = 1, + где Λ± = (λ±), Λ± = (λ±±) и1 As = (as ) для A = (aij ), aij ) 0, а ij ± ij ij α = min {min{α-, α+} o σ σ σ по всем простым циклам σ в графе Γ (значения α± определены в (5.3) и (5.4)). Здесь, если (ij) стрелка в Γ, то λ- и λ-± задаются формулами (5.2) и (5.3), а λ+ и λ+± - ij ij ji ji формулами (5.4), и λ- = λ-± = λ+ = λ+± = 0 в противном случае. ij ij ji ji ± Вычисленные на компьютере значения констант s , s± ± и α для исследуемого отображения F приведены в (5.5): + s+ = 0,408, s± - = 0,327, s = 0,876, s± - = 0,593. (5.5) Отметим, что решение уравнения ρ(Λs) = 1 по s на первый взгляд представляется весьма нетривиальным, однако существование и единственность его решения, а также элементарный чис- ленный метод его нахождения с любой наперед заданной точностью дает следующее утверждение о строгом убывании функции ρ(Λs) по s. 1Для получения матрицы As необходимо каждый элемент неотрицательной матрицы A возвести в степень s > 0. Если s = 0, то A0 - это (0, 1)-матрица, с единицами в тех местах, где у матрицы A стоят ненулевые числа. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 55 Предложение 5.1 (см. [27]). Пусть Λ = (λij ) - примитивная N × N матрица с неотрица- тельными коэффициентами. Если коэффициенты λij удовлетворяют условию (5.1) сжатия вдоль простых циклов, то функция ρ(Λs) непрерывна и строго убывает по s, причем ρ(Λ0) > 1 и ρ(Λs) → 0 при s → +∞. σ Численные значения коэффициентов α± для F и F -1 по всем простым циклам приведены в таблицах 3 и 4 соответственно. Поэтому α = min {min{α-, α+} = 0,625. o σ σ Лемма 5.5. Размерности по Хаусдорфу и по Минковскому множества NW(F ) удовлетворя- ют следующим неравенствам: 0,575 dimH NW(F ) dimB NW(F ) 1,284. (5.6) Односторонняя марковская цепь. Во второй части данной работы, посвященной общим гамильтоновым системам с разрывной правой частью, нам потребуется описание множества то- чек, не сходящихся к полуособым циклам Zij в прямом направлении времени безотносительно рассмотрения асимптотики траектории в обратном направлении времени. Очевидно, что точки Qk ∩ D31, k = 1, 3, под действием отображения Пуанкаре Φ не притягива- ются к Z13 в прямом времени (так как (ij)Φ2(Qk ∩ Dij ) = Qk ∩ Dij , k = i, j, по лемме 2.10). Более того в статье [10] доказано, что дифференциал отображения Пуанкаре в объемлющем фактор- пространстве Φ : S/g → S/g имеет ровно одно собственное значение, по модулю меньшее 1. Следовательно, по теореме Адамара-Перрона (см. [12]) на поверхности S/g определено гладкое погруженное одномерное устойчивое многообразие Qk точек, стремящихся к Qk ∩ Dij , k = i, j под действием отображения Φ. Поднимаясь в расширенное фазовое пространство M = T ∗M , мы немедленно получаем, что траектории гамильтоновой системы (2.3), начинающиеся в точках про- образа π-1(Qk ), попадают в начало координат за конечное время и, следовательно, по теореме 2.1 являются оптимальными. Таким образом, на D31 определены два одномерных липшицевых1 по- k груженных подмногообразия Qk ⊃ Qk ∩ D13, k = 1, 3, таких, что для любой точки z ∈Q Φn(z) не стремятся к полуособым циклам Zij при n → ∞. образы Помимо Qk на D31, k = 1, 3, присутствует множество Y таких точек, что их образы также не стремятся к полуособым циклам Zij . Множество Y имеет фрактальную природу: оно состоит из объединения множеств i0.i1i2 ... , где ik обозначают один из символов A или C. Структура этих множеств описана в [27, лемма 4] - каждое такое множество представляет собой липшицеву кри- вую из Lipdj (Yj → Xj ) в соответствующем прямоугольнике Bj ⊃ i0.i1. Рассмотрим естественное отображение Ψ+ из Y в одностороннюю марковскую цепь Σ+ бесконечных вправо путей на графе Γ Γ Γ. Прообразом каждой точки из Σ+ является соответствующая липшицева кривая i0.i1i2 ... . Оче- Γ видно, что по построению отображение Ψ+ полусопрягает левый сдвиг l на Σ+ и отображение F , Γ Γ т.е. l ◦ Ψ+ = Ψ+ ◦ F . Отображение Ψ+ является непрерывным в силу [27, замечание 1]. Оценки Γ Γ Γ на размерность множества Y так же найдены в [27]2: где + 1+ α+s± dimH Y dimB Y 1+ s+. ln λ+ α+ = min σ Таким образом, доказана следующая лемма. o ± o . ln λ+ 1Вообще говоря, на D31 нет гладкой структуры, сохраняемой отображением E, поэтому мы всегда используем лишь липшицеву структуру на D31, которая уважается отображением E (см. теорему 2.1) и лемму 5.1. 2К сожалению, эта оценка в [27] не сформулирована в виде отдельного утверждения. Подробности см. в доказатель- i стве теоремы 5 из [27]: выписанные оценки на размерности dimH Y и dimB Y суть в точности оценки на размерности множеств Q±, полученные в этом доказательстве. 56 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД t D r A B r r t C Рис. 21. Граф Γ . Буквы r и t не важны для графа Γ , но участвуют в построении графа Γ в определении 5.2 Лемма 5.6. На диске D31 определено одномерное погруженное липшицево многообразие Q2 точек, ко- торые стремятся в прямом времени под действием отображения последования Пуанкаре Φ к точкам пересечения четырехзвенного цикла Q2 с S/g. На диске D31 определено множество Y ⊂ B, обладающее следующими свойствами: (1) для любой точки z ∈ Y итерации Fn(z) не стремятся к полуособым циклам Zij при n → +∞; (2) ограничение отображения F на Y полусопряжено с помощью непрерывного отобра- жения Ψ+ с левым сдвигом на односторонней топологической цепи Маркова Σ+, причем Γ прообраз любой точки из Σ+ Γ Γ есть одномерная липшицева кривая в B; (3) размерности множества Y удовлетворяют оценкам 1,204 dimH Y dimB Y 1,408. Фрактальная структура отображения Пуанкаре. Отображение F , конечно, является вспомогательным. Нашей основной целью является исследование отображения последования Пу- анкаре Φ. Для формулировки основной теоремы об отображении Φ нам потребуется следующий граф Γ. Определение 5.2. Изображенная схема графа Γ на рис. 21 является прототипом ориентиро- ванного графа Γ. Граф Γ получается следующим образом. Множество его вершин есть прямое произведение множества вершин Γ и множества упорядоченных пар чисел (ij), принимающих значения i, j ∈ {1, 2, 3}, i /= j. Поэтому Γ имеет 24 вершины {A12, A13,..., D32}. Из вершины Aij графа Γ ведет стрелка в вершину Bi!j! тогда и только тогда, когда j = i± и i /= j±, т.е. {i, j = i±, j±} = {1, 2, 3}. В знак этого факта стрелка помечена значком r. Из вершины Aij графа Γ ведет стрелка в вершину Ci!j! тогда и только тогда, когда i± = j и j± = i. В знак этого факта стрелка помечена значком t. Стрелки Bij → Ai!j! , Cij → Di!j! и Dij → Ai!j! строятся аналогичным образом. Других стрелок в графе Γ нет. Отметим, что граф Γ состоит из двух несвязных идентичных компонент Γ±, каждая из которых сильно связна и имеет одну компоненту в спектральном разложении1. Теорема 5.3. Динамика отображения последования Пуанкаре Φ : (S∩ M+)/g → (S∩ M+)/g описывается следующим образом. Множество неблуждающих точек Y = NW(Φ) ⊂ (S∩ M+)/g отображения Φ гомеоморф- но топологической цепи ΣΓ бесконечных в обе стороны путей на графе Γ с помощью 1Граф имеет одну компоненту в спектральном разложении, если наибольший общий делитель длин его простых циклом равен 1 (см. [12]). ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 57 некоторого отображения Ψ Γ. Более того, отображение Ψ Γ сопрягает Φ и левый сдвиг l на ΣΓ, т.е. следующая диаграмма коммутативна: Φ Y ⏐ Ψ Γ⏐ ----→ Y ⏐ ⏐ Ψ Γ ΣΓ - l → ΣΓ --- Размерности множества Y удовлетворяют неравенствам 0,575 dimH Y dimB Y 1,284. Множество точек z ∈ (S∩M+)/g, которые под действием Φ в прямом направлении време- ни не стремятся к одному из полуособых циклов Zij , содержит (1) устойчивые многооб- разия Qi в точках Qi ∩ (S/g) отображения Φ; (2) некоторое множество Y+ ⊂ (S∩ M+)/g, ⊂Y инвариантное относительно Φ, т.е. Φ(Y+) +. Динамика Φ на Y+ полусопряжена ле- Γ вому сдвигу l на топологической цепи Маркова Σ+ бесконечных вправо путей на графе Γ с помощью некоторого отображения Ψ + : Y+ → Σ+, т.е. следующая диаграмма комму- тативна: Γ Γ + Φ + Y ----→ Y Γ ⏐ Ψ +⏐ Σ+ ⏐ ⏐Ψ+ Γ l - → Σ+ Γ --- Γ Γ Отображение Ψ+ непрерывно, сюръективно, и прообраз любой точки является липши- цевым многообразием, гомеоморфным отрезку. Размерности множества Y+ удовлетво- ряют оценкам 1,204 dimH Y+ dimB Y+ 1,408. Отметим, что в п. 2 теоремы 5.3 описаны не все такие точки z ∈ (S ∩ M+)/g, которые под действием Φ в прямом направлении времени не стремятся к одному из полуособых циклов Zij . Например, в теореме 5.3 ничего не утверждается про трехзвенные циклы. Доказательство теоремы 5.3. Начнем с доказательства первого пункта. Обозначим через S(Φ) множество точек z ∈ S/g, которые при итерациях Φk (z) не стремятся ни к одному из трех полу- особых циклов Zij в прямом времени, k → +∞, и ни к одному их двух трехзвенных циклов Z± в обратном времени, k → -∞. Для описания множества S(Φ) и динамической системы Φ : S(Φ) → S(Φ) рассмотрим часть множества S(Φ), лежащую в диске D31. Поскольку F есть в точности Φ2 на A.A ∪ C.A или Φ3 на A.C ∪ C.C, то множество S(F ) содержит NW(F ), Φ(NW(F )) и Φ2(NW(F )). Применяя все перестановки из S3 к NW(F ), получаем S(Φ) ⊃ S1(Φ) = σ∈S3 σ NW(F ) ∪ Φ(NW(F ) ∪ Φ2(NW(F ) . Как было показано в пп. 4.9 и 4.10, пересечение разности S(Φ) \\ S1(Φ) с замыканием обла- сти III в диске D31 состоит из точек z, которым отвечает последовательность (... i-1i0.i1 .. .), ik ∈ {A, B, C}, заканчивающаяся бесконечным хвостом из символов B. Любая такая точка z лежит на устойчивом усе Q2 и притягивается к четырехзвенному циклу Q2 в прямом времени. Остальные точки разности S(Φ) \\ S1(Φ) в диске D31 получаются применением Φ или Φ2 к описан- ным точкам z и соответствующей симметрии из S3. Таким образом, получаем S(Φ) \\ S1(Φ) = S˜(Φ) ⊂ Qi i и, следовательно, точки множества S˜(Φ) не являются неблуждающими точками отображения Φ. Точки множества (S/g) \\ S(Φ) также не являются неблуждающими точками Φ, так как либо притягиваются в обратном времени к одному из трехзвенных циклов Z±, либо притягиваются 58 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД ij к точке выхода соответствующей оптимальной траектории на один из полуособых отрезков Zs . Итак, NW(Φ) = S1(Φ) = σ∈S3 σ NW(F ) ∪ Φ(NW(F ) ∪ Φ2(NW(F ) . Учитывая результаты лемм 5.4 и 5.5, для доказательства первого пункта осталось объяснить, как возникает граф Γ, и построить отображение Ψ Γ. Во-первых, отметим, что топологическая цепь Маркова ΣΓ идентична во всех смыслах цепи ΣAC бесконечных в обе стороны слов с двухсимвольным алфавитом {A, C}. Напомним, что (с точностью до применения некоторой перестановки, переводящей точку в D31) F = Φ3 на множе- стве A.C ∪ C.C и F = Φ2 на A.A ∪ C.A. Поэтому, если рассмотреть на множестве NW(Φ) ∩ D31 отображение Φ : z 1→ σ(Φ(z)), где σ ∈ S3 переводит Φ(z) в D31, то отображение ΨΓ˜ из леммы 5.4 немедленно даст сопряженность динамической системы Ψ : NW(Φ) ∩ D31 → NW(Φ) ∩ D31 с левым сдвигом на топологической марковской цепи ΣΓ с помощью естественного гомеоморфизма Ψ Γ , построенного по ΨΓ˜ (ориентированный граф Γ имеет четыре вершины и изображен на рис. 21). Для того, чтобы вернуться к исходному отображению Φ, необходимо учитывать все диски Dij и следить за тем, в каком из шести дисков находится точка Φk (z). Это можно легко проделать, если использовать буквы r и t над стрелками на рис. 21 (напомним, что A = rr и C = trt). Буква r обозначает для диска D31 перестановку (312) ∈ S3, а буква t -перестановку (13) ∈ S3, что немедленно дает сопряженность Φ на NW(Φ) с левым сдвигом на цепи ΣΓ. Первая часть теорема доказана. Пункт 1 второй части теоремы тривиален. Доказательство пункта 2 основано на лемме 5.6 и абсолютно аналогично доказательству первой части, если в качестве множества Y+ выбрать, например, Y = σ Y ∪ Φ(Y ∪ Φ Y . + σ∈S3 2( Замечание 5.1. Множество Y+ можно выбрать не единственным образом. Например, можно заменить его на Φk (Y+) для любого наперед заданного k ∈ Z. Однако с множеством J k∈Z Φk (Y+) связаны следующие трудности: во-первых, его размерность по Минковскому, вообще говоря, может Γ быть строго больше размерности Y+, а во-вторых, прообраз любой точки из Σ+ в J Φk (Y+) уже k∈Z перестает быть липшицевым многообразием, а превращается в погруженное липшицево многообра- зие. Вторая трудность сродни запутыванию устойчивого и неустойчивого многообразия некоторой неподвижной точки гиперболического отображения при удалении от неподвижной точки. Основная теорема о хаотичности оптимального синтеза в модельной задаче. Теперь мы готовы сформулировать основную теорему первой части работы, описывающую динамику оп- тимальных траекторий в исходной задаче оптимального управления (2.1). Первые три пункта теоремы описывают исследуемые множества точек X и X +, сотканные из траекторий гамиль- тоновой системы (2.3), а остальные пункты теоремы описывают хаотическую динамику на этих множествах. Поскольку любая траектория из множеств X и X + пересекает стратифицированное многообразие S = S12 ∪ S13 ∪ S23 разрыва правой части системы (2.3), то хаотическая динамика поведения этих траекторий описана в терминах последовательности пересечения страт Sij . Теорема 5.4. В расширенном фазовом пространстве M = T ∗M задачи (2.1) определены два множества X и X +, обладающие следующими свойствами. Для любой точки z ∈ X ∪ X + определено такое время T (z) < ∞, что траектория X(t, z) гамильтоновой системы (2.3), проходящая через z, существует и единственна при t ∈ [-∞; T (z)]. Траектория X(t, z) попадает в начало координат за время T (z), X(T (z), z) = 0. Множества X и X + инвариантны относительно потока гамильтоновой системы (2.3) ∈X в следующем смысле. Если z + , то X(t, z) лежит в X + при всех t ∈ [0; T (z)). Если же z ∈ X , то X(t, z) лежит в X при всех t ∈ [-∞; T (z)). ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 59 Проекция траектории X(t, z) на фазовое пространство M , продолженная нулем при t > T (z), является оптимальной при любом z ∈ X ∪ X + (т.е. X ∪ X + ⊂ M+). Более того, траектория X(t, z) пересекает поверхность переключения S счетное число раз в моменты ... < t-1 < t0 0 < t1 < t2 ... < T (z), X(tk, z) ∈ S, причем tk → T (z) при k → +∞ и tk → -∞ при k → -∞. Динамическая система Φ : X ∩ S → X ∩ S, переводящая точку z ∈ X ∩ S в точку пер- вого пересечения траектории X(t, z) с множеством S, Φ(z) = X(t1, z), полусопряжена с топологической цепью Маркова бесконечных в обе стороны путей на графе Γ с помощью некоторого отображения ΨΓ: X ∩ S ⏐ ΨΓ⏐ Φ ----→ X ∩ S ⏐ ⏐Ψ Γ Φ ΣΓ ----→ ΣΓ Γ Отображение ΨΓ непрерывно и сюръективно, а прообраз любой точки σ ∈ Σ+ являет- ся одномерным гладким многообразием, диффеоморфным открытому интервалу. Пусть .V обозначает множество путей в Γ, начинающихся из вершины V . Тогда прообразы множеств Ψ-1(.Aij ), Ψ-1(.Bij ), Ψ-1(.Cij ) и Ψ-1(.Dij ) лежат на страте Sij . Γ Γ Γ Γ Динамическая система Φ : X + ∩S → X + ∩ S, переводящая точку z ∈ X+ ∩S в точку первого пересечения траектории X(t, z) с множеством S, Φ(z) = X(t1, z), полусопряжена Γ с левым сдвигом на топологической цепи Маркова Σ+ бесконечных вправо путей на Γ графе Γ (см. определение 5.2) с помощью некоторого отображения Ψ+, т.е. следующая диаграмма коммутативна: X+ ∩ S Ψ+⏐ Φ ----→ X+ ∩ S ⏐ Ψ+ ⏐ ⏐ Γ Γ Φ Σ+ - → Σ+ Γ --- Γ Γ Отображение Ψ+ Γ непрерывно и сюръективно, а прообраз любой точки σ ∈ Σ+ есть липшицево многообразие, относительная внутренность которого гомеоморфна двумер- ному открытому диску. Прообразы множеств (Ψ+)-1(.Aij ), (Ψ+)-1(.Bij ), (Ψ+)-1(.Cij ) и Γ (Ψ+)-1(.Dij ) лежат на страте Sij . Γ Γ Γ Размерности по Хаусдорфу и Минковскому множеств X и X + удовлетворяют неравен- ствам 3,204 dimH X + dimB X + 3,408, 2,575 dimH X dimB X 3,284. Γ Топологическая энтропия левого сдвига l на ΣΓ и Σ+ равна ⎛ 3 1 htop(l) = log2 ⎝ 2 + √ 69 3 1 - + 18 2 √ ⎞ 69 18 ⎠ ≈ 0,4057. Абсолютно аналогичная картина наблюдается в гамильтоновой системе (2.3) для тра- екторий, исходящих из начала координат, за исключением того, что они уже не будут оптимальными в задаче (2.1). Доказательство. Для того, чтобы построить множества X и X +, воспользуемся построенными в теореме 5.3 множествами Y и Y+. На самом деле различие этих пар множеств заключается в том, что, во-первых, вторая пара лежит в фактор-пространстве M+/g, а первая - в исходном пространстве M, а во-вторых, Y и Y+ лежат на поверхности переключения S/g и не содержат самих оптимальных траекторий. Построим сначала промежуточные множества Z и Z+ следующим образом: для каждой точки из Y или Y+ поместим в Z или Z+ соответственно выходящую из этой 60 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД точки траекторию проекции гамильтоновой системы (2.3). В Z поместим траекторию целиком, а в Z+ - только ее половину, отвечающую положительному направлению времени. Заметим, что Z∩ (S/g) = Y, Z+ ∩ (S/g) = Y+, так как множества Y и Y+ инвариантны относительно Φ и, стало быть, мы не приобретем новых точек на S вследствие этой процедуры. Множества X и X + суть прообразы множеств Z и Z+ при проекции π : M→ M/g. Поскольку множества Y и Y+ лежат в M+/g, то любая траектория, начинающаяся в точке π-1(Y) или π-1(Y+), является оптимальной и приходит в начало координат за конечное время. Таким образом, п. 1 доказан. Пункты 2 и 3 получаются автоматически из построения множеств X и X +. Γ Полусопрягающие отображения ΨΓ и Ψ+ строятся одинаковым образом: необходимо сначала применить проекцию π на фактор-пространство M/g, а потом соответствующее отображение Ψ Γ Γ или Ψ + из теоремы 5.3: ΨΓ = Ψ Γ ◦ π, Ψ+ = Ψ + ◦ π. Γ Γ Изучим сначала свойства отображения ΨΓ. Очевидно, оно непрерывно как композиция непре- рывных отображений и сюръективно как композиция сюръективного и биективного отображений. Чтобы избежать путаницы, будем писать Φ↑ для отображения Пуанкаре на исходной поверхно- сти переключения S и Φ↓ для отображения Пуанкаре на факторе S/g. Тогда коммутативность диаграммы в п. 4 получается следующим образом: ΨΓ ◦ Φ↑ = Ψ Γ ◦ π ◦ Φ↑ = Ψ Γ ◦ Φ↓ ◦ π = l ◦ Ψ Γ ◦ π = l ◦ ΨΓ. Γ Второе равенство выполнено в силу того, что гамильтонова система (2.3) уважает действие g и, следовательно, его уважает отображение последования Пуанкаре. Третье равенство выполнено по теореме 5.3. Прообразом π-1(z) любой точки из z ∈ M+/g является гладкая одномерная кривая - орбита действия g группы R+. В силу биективности Ψ Γ получаем, что Ψ-1(σ) является гладкой Γ кривой для любого σ ∈ ΣΓ. Пункт 4 доказан. Доказательство п. 5 для отображения Ψ+ почти во всем эквивалентно доказательству п. 4. Γ Единственное небольшое отличие заключается в исследовании прообраза (Ψ+)-1(σ) любой точки o ∈ Σ+. В теореме 5.3 доказано, что (Ψ +)-1(σ) является липшицевой кривой в (S ∩ M+)/g. Γ Γ Γ Учитывая структуру проекции π-1, немедленно получаем, что (Ψ+ )-1 (σ) является двумерным липшицевым многообразием, гомеоморфным декартову произведению отрезка на интервал. Чтобы получить оценки в п. 6, докажем, что dimH X ) 1+ dimH Z ) 2+ dimH Y, dimB X 1+ dimB Z 2+ dimB Y, dimH X + ) 1+ dimH Z+ ) 2+ dimH Y+, dimB X + 1+ dimB Z+ 2+ dimB Y+. Эти оценкиполучаются элементарнымприменением формул для оценки размерностейпо Хаусдор- фу и по Минковскому произведения множеств (см. [19, Chapter 7]). Γ Вычислим теперь топологические энтропии левых сдвигов на ΣΓ и Σ+. Поскольку граф Γ несвя- зен и состоит из двух копий некоторого графа Γ±, то для вычисления топологической энтропии можно заменить граф Γ на Γ±. Граф Γ± получается из Γ склеиванием вершин одного типа, у ко- торых совпадают индексы, т.е. Aij с Aji, Bij с Bji и т. д. Пусть A01 обозначает 0, 1-матрицу графа Γ±. Поскольку A01 примитивна (так как граф Γ± сильно связен и у циклов нет общего де- лителя длины). Хорошо известно, что в этом случае по теореме Перрона-Фробениуса у матрицы A01 существует единственное положительное собственное значение λmax > 0, и интересующие нас топологические энтропии совпадают и равны log2(λmax) (см. [12]). Если p - собственный вектор A01, отвечающий собственному значению λmax, то, в силу един- ственности λmax и p, он должен выдерживать любую перестановку координат, индуцированную из действия группы S3 на графе Γ±. Поэтому, если вершине A12 отвечает координата a в векторе p, то всем вершинам Aij также отвечает координата a в векторе p. Следовательно, вершинам Bij и max Cij отвечает координата λ-1 max a, а вершинам Dij - координата λ-2 a, и мы немедленно приходим к уравнению a = λ -2 max a + λ -3 maxa. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 61 Поэтому λ3 max - λmax - 1 = 0. По формуле Кардано находим значение λmax, заявленное в условии теоремы. Последний пункт теоремы получается немедленно после применения отражения g(-1) к га- мильтоновой системе (2.3). Замечание 5.2. Размерности по Хаусдорфу и Минковскому множеств X и X + при проекции на исходное фазовое пространство M = {(x, y)} = R4 не изменяются, так как отображение E яв- ляется локально липшицевым, и, следовательно, проекция M+ = graph E → M является локально билипшицевой. Замечание 5.3. Множество Ξ, определенное в теореме 3.1, в случае, если треугольник Ω яв- ляется правильным, содержится в множестве X . 6. ХАОТИЧНОСТЬ НА КОНЕЧНЫХ ИНТЕРВАЛАХ ВРЕМЕНИ В ГАМИЛЬТОНОВЫХ СИСТЕМАХ С РАЗРЫВНОЙ ПРАВОЙ ЧАСТЬЮ В этом разделе будут сформулированы и доказаны две теоремы о хаотичном поведении тра- екторий в интегральных воронках в гамильтоновых системах с разрывной правой частью общего положения. Доказательства этих теорем основываются на структуре оптимального синтеза в мо- дельной задачи (2.1), точнее, на теоремах 3.1 и 5.4. Гамильтоновы системы с разрывной правой ча- стью. Рассмотрим гладкое 2n-мерное симплектическое многообразие M2n. Пусть (2n - 1)-мерное стратифициро- ванное подмногообразие SH ⊂ M разделяет M на ко- нечное число открытых областей Ω1,... Ωk : (M = J Ωi). Рассмотрим непрерывный гамильтониан H(q, p) : M → R, ограничение которого Hi = H|Ωi на любое множество Ωi определяет гладкую функцию, C∞-продолжаемую на окрестность множества Ωi. Рассмотрим открытое множе- ство U ⊂ M. Пусть в множестве U содержатся части лишь H ij от трех (2n - 1)-мерных страт SH ⊂S , i, j = 1, 2, 3, кото- ij рые разделяют области Ωi и Ωj . Пусть SH примыкают друг Рис. 22. Взаимное расположение к другу по страте SH размерности (2n - 2), как показано страт SH H i на рис. 22. 123 ij , S123 и областей Ω Главным инструментом исследования общих задач поведения решений дифференциальных урав- нений является изучение их типичных особенностей. Для обыкновенных дифференциальных урав- нений с непрерывной правой частью эта программа была в основном реализована в работах Пу- анкаре. Но в теории оптимального управления ключевую роль играют гамильтоновы системы с разрывной правой частью и касательным скачком вектора скорости, которые возникают при при- менении принципа максимума Понтрягина. В работах И. Купки [24] и М. И. Зеликина и В. Ф. Борисова [30] были изучены решения кусочно гладкой гамильтоновой системы, которые входят в особую точку x0 порядка 2, лежащую на по- верхности разрыва S коразмерности 1. Было доказано, что моменты пересечения {t1, t2,..., tn,... } таких решений с поверхностью S при подходе решения к точке x0 в ситуации общего положения образуют двойную асимптотически геометрическую прогрессию - четтеринг, точнее, bi-constant ratio chattering: lim t2n+2 - t2n+1 = a, lim t2n+3 - t2n+2 = b. n→∞ t2n+1 - t2n n→∞ t2n+2 - t2n+1 В данной главе изучается ситуация, когда особая точка второго порядка лежит на страте ко- размерности 2. Здесь возникает качественно новый феномен, типичный для задач оптимального синтеза и для гамильтоновых систем с разрывной правой частью. Помимо траекторий, которые вхо- дят в x0 с обычным четтерингом, существует канторово множество траекторий XH (x0), динамика ij пересечения которых со стратами SH Γ описывается топологической цепью Маркова Σ+, где Γ - 62 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Γ некоторый ориентированный граф (см. определение 5.2). Точнее, Σ+ является фактором системы, ij описывающей динамику пересечений траекторий из XH (x0) с SH . Пересечение множества траек- с трансверсальной к ним поверхностью есть многомерное канторово множество типа торий XH (x0) Γ подковы Смейла. Топологическая марковская цепь Σ+ гомеоморфна стандартной подкове Смейла (см. [12]) как топологическое пространство, но не сопряжена с ней как динамическая система. Формулировки теорем о хаосе в гамильтоновых системах с разрывной правой частью. Прежде чем перейти к основным формулировкам, определим формально ситуацию, изображенную на рис. 22. А именно, потребуем, чтобы выполнялись неравенства (с возможной заменой H на -H) Hi(x) > max(Hj (x), Hk (x)) ∀x ∈ Ωi, для всех различных i, j и k из {1, 2, 3}. (6.1) Введем обозначения 3G = 3F0 = H1 + H2 + H3, 3F1 = H2 - H3, 3F2 = H3 - H1, 3F3 = H1 - H2. (6.2) Очевидно, Hi однозначно выражаются через G, F1 и F2 и наоборот, а F3 ≡ -F1 - F2 (функция F3 введена для удобства обозначений). 123 Определение 6.1. Точку x0 ∈ SH , H1(x0) = H2(x0) = H3(x0), будем называть странной1, если в x0 выполнен следующий набор условий. В окрестности x0 выполняется условие (6.1) (возможно с заменой H на -H); Функции Fr , (ad Fi)Fr , (ad Fj )(ad Fi)Fr и (ad Fk )(ad Fj )(ad Fi)Fr обращаются в нуль в точке x0, где индекс r пробегает числа 1, 2, 3, а индексы i, j, k - числа 0, 1, 2, 3. Набор их диф- ференциалов в точке x0 имеет максимальный ранг2 (насколько это допускается условиями антикоммутативности, линейности, тождествами Якоби и равенством F1 +F2 +F3 ≡ 0); иными словами, эти дифференциалы находятся в общем положении. Билинейная форма 0 Brr! = ad Fr (ad G)3Fr! |x , r, r± = 1, 2, 3, имеет максимально возможный ранг 2 и является симметрической и неположительно (неот- рицательно) определенной, если условие (6.1) выполняется для H (соответственно для -H). Остальные (независимые от перечисленных) коммутаторы пятого порядка от функций G = F0 и Fr , r = 1, 2, 3, обращаются в нуль3 в точке x0. Поведение траекторий в интегральной воронке траекторий, входящих в точку x0, описывается в теоремах 6.1 и 6.2. В первой теореме дано намного более точное описание хаотичного поведения траекторий, чем во второй, однако на форму Brr! наложено дополнительное ограничение, эквива- лентное (для модельной задачи (2.1)) условию правильного треугольника (аналогично теореме 5.4). Во второй же теореме это условие заменено на естественное условие близости к правильному тре- угольнику (аналогично теореме 3.1). Теорема 6.1. Пусть точка x0 гамильтоновой системы с кусочно гладким гамильтонианом H является странной (удовлетворяет условиям определения 6.1), а форма Brr! пропорцио- нальна билинейной форме с матрицей ⎛ -1 1/2 1/2 ⎞ ⎝ 1/2 -1 1/2 ⎠ (6.3) 1/2 1/2 -1 с положительным коэффициентом, если условие (6.1) выполняется для H, и с отрицательным коэффициентом, если условие (6.1) выполняется для -H. Тогда в окрестности точки x0 существует такое множество точек XH (x0), что справедливы следующие утверждения. Для любой точки z ∈ XH (x0) определено такое время T (z) < ∞, что траектория X(t, z), проходящая через z, существует и единственна при t ∈ [0; T (z)]. Более того, траектория X(t, z) попадает в x0 за время T (z), X(T (z), z) = x0. 1Мы надеемся, что это название вызовет у читателя ассоциации, связанные с понятием странного аттрактора. 2На самом деле это условие может быть ослаблено. 3Нетрудно показать, что если коммутаторы пятого порядка, отличные от ad Fr (ad G)3Frl , обращаются в нуль в точке x0, то форма Brrl является симметрической, хотя и может быть априори вырожденной или не быть знакоопределенной. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 63 Множество XH (x0) соткано из траекторий гамильтоновой системы с гамильтонианом H и инвариантно относительно нее в следующем смысле: если z ∈ XH (x0), то X(t, z) лежит в XH (x0) при всех t ∈ [0; T (z)). Более того, траектория X(t, z) при t ∈ (0; T (z)) пересекает поверхность переключения SH счетное (бесконечное) число раз в моменты H t1 < t2 < .. ., X(tk, z) ∈S H , причем tk → T (z) при k → +∞. ∩S Динамическая система ΦH : XH (x0) H H → XH (x0) ∩S , переводящая точку z ∈ XH (x0) ∩ H S в точку следующего пересечения траектории X(t, z) с S , т.е. ΦH (z) = X(t1, z), Γ полусопряжена с помощью некоторого отображения ΨH с односторонней топологиче- Γ ской марковской цепью Σ+ бесконечных вправо путей на фиксированном графе Γ (см. определение 5.2), не зависящем от x0 и H: H ΦH H XH (x0) ∩S ⏐ ΨH Γ ⏐ ----→ XH (x0) ∩S ⏐ ⏐ΨH Σ+ - Γ l → Σ+ Γ --- Γ Γ где l - бернуллиевский сдвиг влево, а ΨH - непрерывное сюръективное отображение. Прообраз (ΨH )-1(σ) любой точки σ ∈ Σ+ гомеоморфен открытому двумерному диску D2, и диаметр Γ H Γ ((Ψ ) Γ (σ) стремится к нулю при k → +∞. Пусть (.V ) обозначает мно- Φk H -1 H -1 жество путей в Γ, начинающихся в вершине V . Тогда прообразы множеств (ΨΓ ) (.Aij ), (ΨH )-1(.Bij ), (ΨH )-1(.Cij ) и (ΨH )-1(.Dij ) лежат на страте SH с теми же индексами. Γ Γ Γ ij Если1 dG(x0) = 0, то размерности по Хаусдорфу и Минковскому множества XH (x0) не зависят от x0 и H (лишь бы точка x0 удовлетворяла условиям теоремы), совпадают с размерностями множества X в теореме 5.4 и, следовательно, удовлетворяют оценкам 3,204762 dimH XH (x0) dimB XH (x0) 3,407495. (6.4) Топологическая энтропия бернулевского сдвига l равна ⎛ 3 1 htop(l) = log2 ⎝ 2 + √ 69 3 1 - + 18 2 √ ⎞ 69 18 ⎠ ≈ 0,4057. Аналогичная картина с обращением течения времени имеет место для траекторий, выходящих из точки x0. Множество XH (x0) является прямым аналогом множества X + из теоремы 5.4. Однако с фор- мальной точки зрения гамильтонова система (2.3) принципа максимума Понтрягина в модельной задачи оптимального управления (2.1) не удовлетворяют условиям теоремы 6.1, так как большин- ство скобок в определении странной точки обращаются в нуль тождественно и, стало быть, не выполняется условие о линейной независимости дифференциалов в нуле. Можно было бы сфор- мулировать теорему 6.1 так, чтобы подобные случаи удовлетворяли ее условиям, но тогда мы потеряли бы структурную устойчивость феномена (см. замечание 6.11). Γ Замечание 6.1. Используя методы вычисления топологической энтропии, несложно найти меру Перри μP на Σ+, удовлетворяющую вариационному принципу и максимизирующую метрическую энтропию: max hμ(l) = hμP (l) = htop(l). μ Теорема 6.2. Пусть точка x0 гамильтоновой системы с кусочно гладким гамильтонианом H является странной (удовлетворяет условиям определения 6.1). Предположим также, что существует такое число λH (x0) > 0 (если условие (6.1) выполняется для H) или λH (x0) < 0 (если условие (6.1) выполняется для -H), что форма λH (x0)Brr! достаточно близка2 к били- нейной форме с матрицей (6.3). 1К сожалению, в статьях [9, 21] содержится досадная опечатка и условие dG(x0) = 0 пропущено. 2Под «достаточной близостью» здесь понимается существование такой не зависящей от x0 и H окрестности мат- рицы (6.3) в пространстве симметрических матриц ранга 2 и такого числа λH (x0), что форма λH (x0)Brrl лежит в указанной окрестности. 64 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Тогда в окрестности точки x0 существует множество точек ΞH (x0), обладающее следую- щими свойствами. Для любой точки z ∈ ΞH (x0) определено такое время T (z) < ∞, что траектория X(t, z), проходящая через z, существует и единственна при t ∈ [0; T (z)]. Более того, траектория X(t, z) попадает в x0 за время T (z), X(T (z), z) = x0. Множество ΞH (x0) соткано из траекторий гамильтоновой системы с гамильтонианом H и инвариантно относительно нее в следующем смысле: если z ∈ ΞH (x0), то X(t, z) лежит в ΞH (x0) при всех t ∈ [0; T (z)). Более того, траектория X(t, z) при t ∈ (0; T (z)) пересекает поверхность переключения SH счетное (бесконечное) число раз в моменты H t1 < t2 < .. ., X(tk, z) ∈S , причем tk → T (z) при k → +∞. H H Рассмотрим динамическую систему ΦH : ΞH (x0) ∩S → ΞH (x0) ∩S , переводящую точку z ∈ ΞH (x0) на SH в точку следующего пересечения траектории X(t, z) с SH , т.е. ΦH (z) = H 01 X(t1, z). Существует такое натуральное n > 0 (одинаковое для всех гамильтоновых систем и точек x0 и совпадающее со степенью n в теореме 3.1), что отображение Φn полусопряжено с топологической марковской цепью бернуллиевского сдвига на несвязном объединении двух экземпляров пространства Σ+ , состоящего из бесконечных в одну сторону последовательностей из нулей и единиц. Другими словами, существует такое 2 01 непрерывное сюръективное отображение ΨH ∩S из ΞH (x0) H 01 в пространство 1 Σ+ , что следующая диаграмма коммутативна: H H Φn H ΞH (x0) ∩S ⏐ ΨH 01⏐ ----→ ΞH (x0) ∩S ⏐ ⏐ΨH 01 2 2 1 Σ+ - l → 1 Σ+ 01 --- 01 где l обозначает сдвиг влево на каждом экземпляре Σ+ . Прообраз (ΨH )-1(σ) каждой 01 01 точки σ ∈ Σ+ гомеоморфен открытому двумерному диску D2, и диаметр Φk ((ΨH )-1(σ) 01 стремится к нулю при k → +∞. H 01 Помимо описанного в пп. 1-4 канторова множества ΞH (x0) траекторий в точку x0 входит еще два множества четтеринг траекторий: (а) существуют два однопараметрических семейства «трехзвенных» траекторий R123 и R132, попадающих в точку x0 за конечное время с четтеринг-режимом, т.е. режимом со счетным числом последовательных пересечений страт SH , SH и SH в прямом порядке для R123 и в обратном порядке для R132. 12 23 31 (b) существуют три двупараметрических семейства «четырехзвенных» траекторий Q1, Q2 и Q3. Каждая траектория из Qi счетное число раз последовательно пересекает страты SH , SH , SH , SH и далее по циклу (i /= j /= k). ij ik ik ij Аналогичная картина с обращением течения времени имеет место для траекторий, выходящих из точки x0. Замечание 6.2. Если выполняется условие «правильного треугольника» из теоремы 6.1, то мно- жество ΞH (x0) содержится в множестве XH (x0). Ниспадающая система скобок Пуассона. Доказательства теорем 6.1 и 6.2 похожи и опи- раются на ключевые факты о хаотичности оптимального синтеза в модельной задаче, полученные соответственно в доказательствах теорем 5.4 и 3.1. Для того чтобы в явном виде отыскать опи- санный в теоремах 6.1 и 6.2 оптимальный синтез модельной задачи (2.1), содержащийся внутри произвольной гамильтоновой системы с разрывной правой частью, воспользуемся так называемой ниспадающей системой скобок Пуассона, которая позволяет проводить эффективное исследование поведения траекторий в интегральных воронках. С помощью метода ниспадающей системы скобок Пуассона доказаны, например, теорема о гамильтоновости потока особых траекторий (см. [13]) и теорема о структуре лагранжевого многообразия в окрестности особой траектории первого порядка в экстремальных задачах, голономных по управлению, меняющемуся в многограннике (см. [14]). Опишем подробно структуру ниспадающей системы скобок Пуассона. Вместо гамильтонианов Hi будем использовать гамильтонианы Fi из (6.2) помня, что F1 + F2 + F3 ≡ 0. Гамильтониан H ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 65 может быть записан следующим образом (здесь и далее по совпадающим верхним и нижним индексам ведется суммирование от 1 до 3): 3 H = G + ) ur Fr = G + ur Fr, r=1 где u ∈ R3, u1 + u2 + u3 = 0 и функция u(x) выбирается следующим образом: ui(x) = -1, uj (x) = 1, uk (x) = 0, если x ∈ Ωk и (ijk) - четная перестановка, т.е. (ijk) ∈ A3. Таким образом, u(x) находится в соответствующей вершине треугольника Ω = conv{(-1, 1, 0), (0, -1, 1), (1, 0, -1) ⊂ U = {u ∈ R3 : u1 + u2 + u3 = 0}. (6.5) z z Поскольку гамильтониан H является негладким, то траектория гамильтоновой системы обык- новенных дифференциальных уравнений с разрывной правой частью определяется по Филиппову (см. [18]). Дадим точное определение. Обозначим через ω симплектическую форму на M, а че- рез iω - задаваемый формой ω канонический изоморфизм iω (z) : T ∗M → Tz M. Тогда абсолютно непрерывная траектория (t) является траекторией гамильтоновой системы обыкновенных диффе- ренциальных уравнений с гамильтонианом H в том и только том случае, если для почти всех t выполняется дифференциальное включение z) z˙(t) ∈ conv{предельных точек iωdH( z при → z(t) ⊂ Tx(t)M или, равносильно, z˙(t) = iω dG(z(t) + urdFr (z(t) для некоторого u ∈ arg max{ur Fr (z(t))}. u∈Ω Замечание 6.3. Важно отметить, что на пространстве U = {u : u1 +u2 +u3 = 0}⊂ R3 не задано скалярное произведение. Свертку ur Fr правильно понимать как свертку вектора и ковектора, где u(x) ∈ U , а F (x) ∈ U ∗. Приведем теперь процедуру построения ниспадающей системы скобок Пуассона для гамильто- ниана H. Для этого выпишем набор дифференциальных уравнений вдоль произвольной траектории системы и упорядочим их по строкам. В первой строке ниспадающей системы стоят три обыкно- венных дифференциальных уравнения (будем перед уравнениями, стоящими в k-й строке, ставить символ lkl): d r l1l dt Fi = {G, Fi} + {Fr, Fi}u , i = 1, 2, 3. Вторая строка содержит два типа уравнений: d r l2l dt {G, Fi} = {G, {G, Fi}} + {Fr, {G, Fi}}u , i = 1, 2, 3, d r l2l dt {Fi, Fj } = {G, {Fi, Fi}} + {Fr, {Fi, Fj }}u , i, j = 1, 2, 3. В общем случае в m-й строке выписаны уравнения вида lml d m dt K = {G, Km } + {Fr, Km r }u , где Km = {Km, {Km 1,... {K ,K } .. .}}, K = F , i = 1, 2, 3, а остальные символы K могут - 2 1 1 i j обозначать как G, так и Fi. Уравнения в (m + 1)-й строке получаются дифференцированием по t правых частей уравнений m-й строки. Так, например lm + 1l и d m dt {G, K } = {G, {G, Km }} + {Fr, {G, Km }}ur lm + 1l d m dt {Fi, K } = {G, {Fi, Km }} + {Fr, {Fi, Km r }}u , i = 1, 2, 3. Ниспадающая система выписывается вплоть до строки с номером 2h, где h - порядок особенности в точке x0 (см. [8]). В нашем случае h = 2, так как управление в явном виде в точке x0 возникает на четвертом шаге дифференцирования. 66 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Таким образом, в m-й строке выписаны уравнения на производную по времени от скобок m- го порядка, а правые части этих уравнений есть аффинные по u функции, где коэффициентами выступают скобки (m + 1)-го порядка. Отметим, что выписывание ниспадающей системы сродни отысканию особой траектории, когда равенства Fi(x(t)) ≡ 0 дифференцируются вдоль траекторий гамильтоновой системы с гамильто- нианом H = G + Frur . Однако с нашей точки зрения ниспадающая система (хотя и содержит большое количество уравнений) значительно удобнее прямого дифференцирования, так как не со- держит формальных производных от управляющего параметра u˙ , u¨,.. ., с которыми обычно очень неудобно работать. Определение 6.2. Главными скобками в ниспадающей системе мы будем называть скобки Fr , (ad G)Fr , (ad G)2Fr , (ad G)3Fr , r = 1, 2, 3. Остальные скобки порядка не больше четырех мы будем называть неглавными1. Сведение гамильтоновой системы с разрывной правой частью к гамильтоновой системе принципа максимума Понтрягина модельной задачи (2.1) будет основано на том факте, что в окрестности любой странной точки в любой строке с номером m неглавные скобки имеют больший порядок малости, чем главные, и потому не влияют на принципиальное поведение системы. Лемма 6.1. Рассмотрим произвольную траекторию x(t), входящую в странную точку x0 = x(0) при t < T . Тогда существует такая константа c > 0, что если Km - главная скобка Пуассона в ниспадающей системе порядка m 4, то при t, близких к T , выполнено неравенство |Km( x(t) | c(T - t)5-m, а если Km - неглавная скобка Пуассона, m 4, то неравенство |Km( x(t) | c(T - t)6-m. Доказательство. Будем доказывать лемму обратной индукцией по m. Основным инструментом будет следующая формула, верная для любой скобки Km, m 4, из ниспадающей системы при t ∈ [0; T ]: t m r K = {G, Km}(x(τ )) + ur (τ ){Fr, Km}(x(τ )) T dτ, (6.6) которая вытекает из соотношения Km(x(T )) = 0 для m 4. Докажем теперь базу обратной индукции. Рассмотрим последнюю строчку ниспадающей систе- мы. Если K4 - неглавная скобка, то подынтегральное выражение в (6.6) обращается в нуль при t = T по определению странной точки x0. Следовательно, при малых T - t для некоторого b4 > 0 выполнено неравенство 4 2 4 |K (x(t))| b4(T - t) , если K - неглавная скобка. Рассмотрим главную скобку Km в последней строке ниспадающей системы. Для нее подынте- гральное выражение в (6.6) при t = T , вообще говоря, не обращается в нуль. Поэтому мы можем лишь гарантировать, что 4 |K (x(t))| b4(T - t), если K4 - главная скобка. Шаг обратной индукции очень похож на базу. Пусть m < 4. Если Km - неглавная скобка, то подынтегральное выражение в (6.6) содержит только неглавные скобки. Поэтому из результата для строки m + 1 получаем, что для некоторого bm > 0 при t < T близких к T , справедливо неравенство |Km(x(t))| bm(T - t) 6-m , если Km - неглавная скобка. Для главной скобки Km получаем следующее: первое подынтегральное слагаемое в (6.6) является главной скобкой в строке с номером (m + 1), а второе - неглавной и мажорируется первым при малых t< T , близких к T . Поэтому при малых t ) 0 имеем |Km(x(t))| bm(T - t) 5-m , если Km - главная скобка, 1Отметим, что G˙ не участвует в ниспадающей системе и потому не является ни главной скобкой, ни неглавной. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 67 что и требовалось. Замечание 6.4. В конце доказательства теорем 6.1 и 6.2 мы покажем, что на интересующих нас траекториях в интегральной воронке странной точки x0 для главных скобок Пуассона выполнена также оценка снизу: 1 c±±(T - t) max Km(x(t) 5-m c±(T - t) m для которых констант c±, c±± > 0. Конечно оценки, аналогичные полученным в лемме 6.1, верны и для траекторий, выходящих из странной точки; необходимо только заменить T - t на время, прошедшее с выхода из странной точки x0. Раздутие особенности в странной точке. В этом пункте мы опишем процедуру раздутия особенности в странной точке, связанную лишь с невырожденностью формы Brr! , и покажем, что на нулевом сечении (т.е. на сфере, вклеенной в особую точку) возникает гладкое подмногообразие, содержащее в точности траектории гамильтоновой системы (2.3) принципа максимума Понтрягина модельной задачи (2.1) с треугольником Ω. При этом форма Brr! задаст то самое скалярное про- изведение на плоскости u1 + u2 + u3 = 0, относительно которого задан функционал J в модельной задаче (2.3), поэтому правильность треугольника Ω на самом деле определяется формой Brr! . Замечание 6.5. Без ограничения общности всегда будем предполагать, что условие (6.1) вы- полнено для H. В этом случае согласно определению 6.1 форма Brr! является отрицательно опре- деленной на U . Поэтому форму -Brr! можно использовать в качестве скалярного произведения на U . Введем новые локальные координаты в окрестности точки x0. Рассмотрим набор из всех воз- можных скобок Km, m 4, из ниспадающей системы скобок Пуассона - всего 255 скобок1. Набор функций K = {Km,m 4}, конечно же, является зависимым, ввиду тождества Якоби, кососимметричности скобки Пуассона и соотношения F1 + F2 + F3 ≡ 0. Более того, некото- рые скобки являются тождественно нулевыми. Однако согласно определению 6.1 странной точ- ки, набор дифференциалов dKm имеет в x0 максимально возможный ранг. Поэтому набор K определяет отображение окрестности x0 в линейное подпространство R255 размерности 31. (Раз- мерность 31 получается следующим образом. Размерность свободной нильпотентной алгебры Ли четвертого порядка с тремя образующими G, F1 и F2 равна 32. Однако мы исключили G из набора локальных координат, поэтому размерность понижается на 1.) Дополним систему K до полного набора локальных координат в окрестности x0 произвольным набором гладких функций dim M-31 w(x) = (w1(x),..., w(dim M-31)(x)) ∈ R , лишь бы дифференциал dw в x0 имел макси- мальный ранг и выполнялось условие w(x0) = 0. На пространстве Rdim M-31 введем стандартную евклидову норму. В координатах (K, w) гамильтонова система обыкновенных дифференциальных уравнений с гамильтонианом H записывается в следующем виде: ⎧ d m ⎨ dt ⎪ K ⎪ d = {G, Km } + {Fr, Km r }u , m 4, ⎪ dt w = α(K, w)+ βr (K, w)ur, (6.7) ⎪ Frur → max ⎩ u∈Ω для некоторых гладких функций α и βr . Отметим, что скобки пятого порядка K5 в окрестности x0 являются гладкими функциями от локальных координат (K, w). Раздутие особенности произведем аналогично раздутию начала координат в модельной задаче (см. п. 3.2). Для этого определим действие gH (x0) группы R \\ {0} на пространстве Rdim M = {(K, w)} следующим образом. 1Число 255 получается следующим образом. Скобок первого порядка в ниспадающей системе всего 3: F1, F2 и F3 (скобка G не участвует в процедуре последовательного дифференцирования в ниспадающей системе). Скобок второго порядка всего 3 · 4 = 12: {Fi, Fj} и {G, Fi}. Итого 255 = 3 + 3 · 4+3 · 42 +3 · 43. 68 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Определение 6.3. Для произвольного числа λ /= 0 определим действие gH (x0)(λ) следующим образом: K gH (x0)(λ) : ( . 1, K2, K3, K4, w 1→ λ4K1, λ3K2, λ2K3, λK4, λw Действие gH (x0), конечно, не уважает гамильтонову систему с гамильтонианом H. Однако глав- ная часть системы может быть выделена благодаря раздутию особенности в точке x0 с помощью действия gH (x0). Для этого введем точные обозначения для локальных координат в окрестности странной точки x0. Положим здесь и далее F0 = G, а также 1 2 1 3 2 4 3 Kr = Fr, Kir = Fi, Kr }, Kjir = {Fj, Kir , Kkjir = {Fk, Kjir , где индекс r может принимать значения 1, 2 и 3, а остальные индексы i, j и k принимают те же значения или 0. В качестве локальных координат возьмем w, K1, K2 , K3 и K4 . Учитывая замечание 6.5, положим / r ir jir kjir μ(K) = 24 (-Brr! K1K1 )3 + (-Brr! K2 K2 )4 + (-Brr! K3 K3 )6 + (-Brr! K4 K4 )12, (6.8) r r! 0r 0r! 00r 00r! 000r 000r! где матрица Brr! обозначает матрицу обратной формы на U ∗ к отрицательно определенной форме Brr! на U из определения 6.1 странной точки. Также положим (K , w) = gH (x0) (1/μ(K)) (K, w . (6.9) w Переменные K = {K m,m 4} и лежат на сферическом цилиндре H C0 = ) = 1 (K , w) : μ(K . Цилиндр CH зададим согласно определению 3.2 в пункте 3.2. w 0 Отображение (K, w) 1→ (μ, K , ) обозначим через B. Топологически данная процедура разду- тия эквивалентна вырезанию подмногообразия, на котором обращаются в нуль главные скобки Пуассона, и вклеиванию сферического цилиндра CH в странную точку x0. В дальнейшем тильда над скобкой Пуассона будет означать деление на μ в соответствующей степени, т.е., например, K m = Km /μ5-m, {G , Km} = {G, Km }/μ 4-m. Для скобок до четвертого порядка включительно получаем локальную координату на CH ,а скобки пятого порядка не изменяются при добавлении тильды. Теперь перенесем гамильтонову систему обыкновенных дифференциальных уравнений обыкно- венных дифференциальных уравнений на пространство CH аналогично тому, как мы действовали в п. 3.3. Прямым дифференцированием (6.8) и (6.9) вдоль произвольной траектории получаем ⎧ d ⎪ ⎪ dt ⎪ d ⎪ μ = Υ(μ, K , w, u), 1 m m = m ⎪⎨ dt K μ {G, K } + {Fr, K }ur - (5 - m)ΥKm , d 1 (6.10) ⎪ w = (α + β ur - Υw , ⎪ dt μ r ⎪ ⎪ ⎪⎩ F r ur → max, где u∈Ω w, u) = -6(Brr! K 1K1 2Brr! K 1 {G, K } + {F , }ur!! + 24Υ(μ, K , r r! ( 1 r r! r!! 1 K r! 0r 0r! ( 2 2 0r + 8(Brr! K 2 K2 )3Brr! K 2 {G, K 0r! } + {Fr!! , K0r! }ur!! + (6.11) 00r 00r! ( 3 3 00r r + 12(Brr! K 3 K3 )5Brr! K 3 {G, K 00r! } + {Fr!! , K00 ! }ur!! + + 24(Brr! K 4 K4 )11Brr! K 4 {G, K } + {Fr , }ur!! . 000r 000r! ( 4 000r r 4 !! K r 000 ! 000 ! ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 69 Аналогично п. 3.3 обозначим векторное поле на CH ∩{μ> 0} в правой части (6.10) через ξH (x0). 0 Формально поле ξH (x0) определено в окрестности CH при μ > 0, однако мы его продолжим теми же формулами на нижнюю половину окрестности в CH ∩{ 0}. Точнее, отображение μ< B-1 : (μ, K , w) 1→ (K, w), где (K, w) = gH (x0)(μ)(K , w 0 является двулистным накрытием окрестности CH в CH ∩ {μ /= 0} над ее образом в проколотой окрестности1 x0 и позволяет перенести значения функций α и β и скобок Пуассона пятого порядка на нижнюю половину цилиндра CH ∩ {μ < 0}. В этом случае отображение B-1 отображает векторное поле системы (6.10) в поле гамильтониана H и при μ> 0, и при μ< 0. Отметим, что при μ → 0 поле ξH (x0) растет как 1/μ. Однако поле μξH (x0) уже может быть 0 продолжено по непрерывности на сечение цилиндра CH = CH ∩ {μ = 0} во всех точках, кроме r точек множества SH = {K 1 r! = K 1 ,r /= r± H . Поэтому в дальнейшим будем предполагать, что 0 поле μξH (x0) определено на CH \\S с помощью естественного продолжения по непрерывности. Конечно же, μξH (x0) /= 0 на C0 , несмотря на то, что μ = 0 на C0 . Траектории поля μξH (x0) либо H H 0 не пересекают сечение CH , либо лежат в нем, так как вдоль поля μξH (x0) имеем μ˙ = μΥ. Более того, на CH компоненты поля μξH (x0), отвечающие переменным (K , ), не зависят от μ. 0 Таким образом, интегральные кривые полей ξH (x0) и μξH w (x0) совпадают на CH ∩ {μ /= 0}, отличается лишь скорость движения по ним. Если обозначить через s параметр времени движения по траектории поля μξH (x0), то s и t связаны соотношением 1 Система (6.10) перепишется в виде ds = dt. μ ⎧ d ⎪ ⎪ ds ⎪ d μ = μΥ(μ, K , w, u), ⎪ m ⎪ ⎨ ds K = {G , K r Km} + {Fr, m}u m - (5 - m)ΥK , d (6.12) ⎪ w = α + βrur - Υw, ⎪ ⎪ ds ⎪ ⎩ ⎪ F r ur → max . u∈Ω 0 H Модельная задача оптимального управления на нулевом сечении CH . Рассмотрим про- извольную траекторию x(t), входящую в странную точку x0 = x(0) при t → -0. В этом случае μ(x(t)) c±|t|→ 0 при t → -0 по лемме 6.1. Поэтому, если x(t) лежит в множестве B-1(CH \\ C0 ) при малых 0, то образ траектории B(x(t) на CH ∩ {μ> 0} стремится к CH при t → -0. t< 0 Нас будут интересовать такие траектории x(t) входящие в x0 = x(0), что хотя бы одна из главных скобок Пуассона Km(x(t)) имеет максимально возможный порядок |t|5-m при t → -0. В этом случае μ(x(t)) имеет порядок |t| при t → -0. А именно, благодаря лемме 6.1, при малых t < 0 выполнено неравенство c±±|t| μ(x(t)) c±|t|. Поэтому траектория x(t) при малых t < 0 не H H покидает множества B-1(CH \\ C0 ), а ее образ B(x(t)) на CH ∩ {μ> 0} стремится к C0 . На самом деле верно более сильное утверждение: при t → -0 образ B(x(t)) стремится к подмногообразию H H D0 ⊂ C0 , на котором обращаются в нуль все неглавные скобки Пуассона: H D0 = а μ = 0 и K m = 0, где K m пробегает все неглавные скобки Пуассон H ⊂ C0 . Более того, любая траектория поля μξH (x0), начинающаяся на DH , не покидает DH . Действитель- 0 но, на DH вдоль поля μξH (x0) имеем d μ = 0, 0 0 m d K = 0, ds ds где K m - любая неглавная скобка Пуассона в ниспадающей системе. 0 1Отметим, что образ окрестности CH в CH ∩ {μ /= 0} при отображении B-1 не содержит проколотой окрестности точки x0. 70 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД 0 Система обыкновенных дифференциальных уравнений (6.12) на DH устроена так же, как и в раздутой системе (3.4) принципа максимума Понтрягина модельной задачи (2.1). Действительно, переобозначим главные скобки ниспадающей системы следующим образом: ψ r = K 1, φ r = -K 2 , xr = Brr! K 3 , yr = Brr! K 4 , (6.13) r 0r 00r! 000r! где φ , ψ ∈ U ∗ и ∈ U . Тогда на DH мы получим систему обыкновенных дифференциальных уравнений x, y 0 ⎧ d ⎪ ψ r = -φ r - 4Υψ r , ⎪ ds d ⎪ ⎪ φr = -Brr xr! - 3Υφr , ! ⎪ ⎪ ds ⎪ d ⎪ xr yr xr ⎪⎨ ds = - 2Υ , d (6.14) - ⎪ yr = ur Υyr ; ⎪ ⎪ ds d ⎪ ⎪ w = α(x0)+ βr (x0)ur - Υw, ⎪ ⎪ ds ⎪ ⎩ ⎪ ψ r ur → max . u∈Ω 0 Подставляя в (6.11) вместо неглавных скобок нули, получаем, что на DH выполнено соотношение rr! rr! rr! r 24Υ|DH = -6(-B - ψ r ψ r! ( B ψ r φ r + 8(-B φ r φ r (φ r + ! ! x 0 - xrxr! 5( Brr xryr! + 24( Brr yryr! 11(-Brr yrur! . + 12( Brr! - ! - ! ! w Таким образом, если отбросить переменную , то система обыкновенных дифференциальных 0 уравнений на DH исходной гамильтоновой системы с гамильтонианом H совпадает (после разду- 0 тия) с гамильтоновой системой (3.4) принципа максимума Понтрягина в модельной задаче (2.1), если задать на U скалярное произведение с помощью формы -Brr! . Система обыкновенных диф- ференциальных уравнений, получившаяся на CH , является, в некотором смысле, «нильпотентиза- цией» исходной гамильтоновой системы в окрестности странной точки x0. Также отметим, что «правильность» треугольника Ω определяется формой -Brr! . А именно, треугольник Ω является правильным, если форма Brr! устроена, как описано в теореме 6.1. Дей- ствительно, вершины треугольника Ω, заданные в (6.5), должны образовывать правильный тре- угольник относительно формы -Brr! с центром в начале координат. Следовательно, матрица Грама вершин треугольника Ω должна быть пропорциональна матрице (6.3) с отрицательным коэффици- ентом, по модулю равным длине стороны треугольника Ω. 0 Нильпотентизация в окрестности странной точки. Ниже будет показано, что поведение исходной гамильтоновой системы моделируется ее поведением на нулевом сечении CH цилиндра C. Доказательство будет основано на точном исследовании отображения последования Пуанкаре в системе (6.12) в окрестности точек странных множеств Ξ и X из теорем 6.2 и 6.1. Поэтому в качестве вспомогательной системы обыкновенных дифференциальных уравнений в окрестности x0 мы рассмотрим систему, полученную из системы (6.12) «нильпотентизацией» по μ с помощью раздувающего отображения B. Опишем процедуру «нильпотентизации» в окрестности странной точки с помощью раздувающе- го отображения. Правую часть системы (6.12), полученную с помощью раздувающего отображе- и ния B, необходимо преобразовать следующим образом: дифференциальные уравнения на K w 0 переносятся на весь цилиндр C с нулевого сечения CH без изменений, а правая часть дифференци- ального уравнения на μ линеаризуется по μ в окрестности нулевого сечения (т.е. отбрасываются члены порядка o(μ)). В результате получаем систему (все суммирования по совпадающему верх- нему и нижнему индексу r± ведутся по r± = 1, 2, 3) d dsμ = μ Υ(0, K , w, u), (6.15a) ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 71 d 1 2 2 r! 1 ds K r = K 0r + K r!r u - 4K r Υ, (6.15b) d 2 3 3 r! 2 ds K ir = K 0ir + K r!ir u - 3K ir Υ, (6.15c) d 3 4 4 r! 3 ds K jir = K 0jir + K r!jir u - 2K jir Υ, (6.15d) d 4 r! 4 ds K 000r = Brr! u - K 000r Υ, (6.15e) d 4 4 4 ds K kjir = -K kjir Υ, если Kkjir - неглавная скобка, (6.15f) d w = α(x0)+ βr (x0)ur - Υ(0, K , w, u)w, (6.15g) ds 1 K r ur → max . (6.15h) u∈Ω Перепишем эту систему в исходных (не раздутых) координатах K и w. После применения обрат- ного отображения B-1 и обратной замены параметров времени s и t получим (все суммирования по совпадающему верхнему и нижнему индексу r± ведутся по r± = 1, 2, 3) d 1 2 r! dt Kr = K0r + Kr!ru , (6.16a) d 2 3 r! dt Kir = K0ir + Kr!iru , (6.16b) d 3 4 r! dt Kjir = K0jir + Kr!jiru , (6.16c) d 4 r! dt K000r = Brr! u , (6.16d) d 4 4 dt Kkjir = 0, если Kkjir - неглавная скобка, (6.16e) d w = α(x0)+ βr (x0)ur, (6.16f) dt 1 Krur → max . (6.16g) u∈Ω Таким образом, «нильпотентизация» по μ в окрестности странной точки с помощью раздувающего отображения B приводит к системе (6.16), которая фактически получена из системы (6.7) заменой функций α и βr , а также скобок пятого порядка их значениями в точке x0. 0 Как было сказано выше, система (6.15) совпадает на нулевом сечении CH с системой (6.10), и дифференциальные уравнения на K w не зависят от μ, а правая часть дифференциального 0 уравнения на μ получена из (6.10) линеаризацией по μ в окрестности CH = CH ∩ {μ = 0}. Отметим три важных факта, касающихся системы (6.15): w Правая часть дифференциальных уравнений на K не зависит от и μ. Поэтому после точного w отыскания координат K на траектории системы (6.15) ln μ и могут быть найдены прямым интегрированием. При постоянном управлении поведение неглавных скобок Пуассона никак не связано с пове- дением главных скобок Пуассона (поведение главных скобок влияет лишь на момент пере- ключения управления). 0 Таким образом, на сечении DH для исходной гамильтоновой системы с гамильтонианом H мы можем найти любую оптимальную траекторию в модельной задаче оптимального управления (2.1). Действительно, рассмотрим произвольную траекторию ( t), t), φ (t), ψ (t), t) принципа макси- x( y( u( мума Понтрягина модельной задачи (2.1), лежащую на M+ (см. следствие 2.7), т.е. траекторию, входящую в начало координат. По теореме 2.1 эта траектория входит в начало координат при t = T (x(0), y(0) . Эта траектория задает с помощью (6.13) главные скобки Пуассона K как функ- ции времени t при t< T (x(0), y(0) . Чтобы получить траекторию системы (6.16), необходимо еще определить неглавные скобки Пуассона K и w как функции времени. Мы сделаем это следую- щим образом. Положим неглавные скобки K (как функции времени) равными нулю тождественно. 72 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Функцию w(t) определим из последнего уравнения системы (6.16): w(t) = w0 + α(x0) t - T (x(0), y(0) + βr (x0)yr (t). Поскольку нас интересуют траектории, входящие в странную точку x0, положим w0 = w(0) = 0. Получившаяся траектория по построению удовлетворяет обыкновенным дифференциальным урав- нениям «нильпотентизованной» системы (6.16). Таким образом, мы построили отображение Π+ из M+ ⊂ {(x, y, φ, ψ)} в пространство {(K, w)}, заданное формулами ⎧ 1 2 3 r! 4 r! Π+ : ⎪⎨ Kr = ψr, K0r = -φr, K00r = Br!rx K = 0 для всех неглавных скобок K, ⎪⎩ w = βr (x0)yr - α(x0)T (x(0), y(0) . , K000r = Br!ry , Лемма 6.2. Построенное отображение Π+ : M+ → {(K, w)} является эквивариантной инъ- екцией, т.е. уважает действие группы R+: Π+ ◦ g(λ) = gH (x0)(λ) ◦ Π+. Более того, отображение Π+ является непрерывным на M+ и переводит траектории гамиль- тоновой системы (2.3) модельной задачи (2.1) на M+ в траектории «нильпотентизованой» системы (6.16). Если к тому же dG(x0) = 0, то отображение Π+ является локально липшицевым. Доказательство. Отображение Π+ является инъективным и эквивариантным по построению. Непрерывность Π+ на M+ \\ {0} следует из теоремы 2.1, в которой, помимо прочего, доказано, что функция T (·) непрерывна. Отображение Π+ переводит траектории системы (2.3) в траектории системы (6.16) по построению. Если dG(x0) = 0, то x(t) = x0 является траекторией исходного гамильтониана H = G + Frur при u = 0. Поэтому K(t) = 0, w(t) = 0 является траекторией системы (6.7) при u = 0. Поэтому необходимо α(x0) = 0 и отображение Π+ не содержит слагаемого с T (x(0), y(0)) и потому является локально липшицевым согласно теореме 2.1. Таким образом, мы можем отыскать любую траекторию системы (2.3) в «нильпотентизованой» системе (6.16). Однако в исходной системе (6.7) эти траектории, вообще говоря, отсутствуют. Однако траектории множеств X (из теоремы 5.4) и Ξ (из теоремы 3.1) все же удается отыскать в исходной гамильтоновой системе. Для этого сначала необходимо спроектировать множества Π+(X ) и Π+(Ξ) на CH , а потом поднять каждую траекторию с нулевого сечения CH с помощью 0 0 теоремы Адамара-Перрона. Итак, в силу эквивариантности отображения Π+ корректно определено отображение Π+/g : H H M+/g → C0 . Более того, образ M+/g лежит в D0 . Поскольку векторное поле μξH (x0) раздутой «нильпотентизованой» системы (6.15) и векторное поле μξ раздутой модельной системы (3.4) также сохраняются действием группы R \\ {0}, то любая траектория поля μξ на M+/g переходит в траекторию поля μξH (x0). 0 Теперь перенесем множества X и Ξ из модельной задачи оптимального управления на нулевое сечение CH . Определим множества XH (x0) = (Π+/g)(X /g ⊂ D0 , ΞH (x0) = (Π+/g)(Ξ/g ⊂ D0 . 0 H 0 H Отметим, что множество XH (x0) корректно определено для гамильтоновой системы с гамиль- тонианом H, только если треугольник Ω является правильным относительно формы Brr! или, другими словами, если форма Brr! устроена, как описано в условии теоремы 6.1. Отображение последования Пуанкаре в гамильтоновой системе. В предыдущем пункте H мы построили множества X 0 (x0) и Ξ0 (x0) на DH ⊂C в общей гамильтоновой системе с гамиль- H H 0 0 тонианом 0 H. Однако при обратном отображении B-1 сечение CH целиком перейдет в странную 0 0 точку x0. Поэтому для того чтобы отыскать траектории исходной гамильтоновой системы, мы при- меним теорему Адамара-Перрона к каждой траектории из множеств ΞH (x0) и XH (x0) на DH . Мы покажем, что их устойчивые многообразия уже не лежат в нулевом сечении CH , а их объединение ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 73 0 и дает искомые множества XH (x0) и ΞH (x0), а неустойчивые многообразия лежат в CH и не дают никакого вклада в исходную гамильтонову систему. Мы будем применять теорему Адамара-Перрона к отображению последования Пуанка- ре в окрестности произвольной траектории γ из X 0 (x0) или Ξ0 (x0). Любая траектория H H (x(t), t), φ (t), ψ (t), t) из множества Ξ или X (в модельной задаче (2.1)) пересекает поверх- y( u( ность переключения только трансверсально, и поэтому в окрестности любой ее точки на поверх- ности переключения определено гладкое отображение последования Пуанкаре. В этом пункте мы перенесем структуру этого отображения из модельной задачи на траекторию γ сначала в «нильпо- тентизованую» систему (6.15), а потом и в исходную систему (6.12). Нас будет интересовать дифференциал отображения последования Пуанкаре ΦH поверхности переключения на себя в «нильпотентизованой» системе (6.15) в окрестности произвольной траек- 0 тории на DH (отображение последования в исходной (не «нильпотентизованой») гамильтоновой системе мы будем обозначать через ΦH без надчеркивания). H H Для построения отображения ΦH в окрестности точки z0 = γ(0) на траектории γ(t) из X 0 (x0) или Ξ0 (x0) воспользуемся следующими упрощающим соображением: поскольку γ(t) пересекает поверхность переключения SH трансверсально в последовательных точках z0 и z1 = ΦH (z0) = γ(τ ), то на любой траектории в окрестности γ(t) управление также постоянно между точками пересечения с SH и совпадает с управлением на γ(t). Поэтому будем считать, что управление в «нильпотентизованой» системе (6.15) постоянно, и вычислим dΦH как композицию линеари- зации отображения вдоль системы (6.15) на фиксированное время τ и проекции на касательное пространство к SH вдоль векторного поля системы (6.15). Обозначим первое отображение через ΦH (τ ) и вычислим его. Уравнение в вариациях для системы (6.15) в окрестности γ устроено следующим образом: d dt ΦH (t) = M ΦH (t). 0 Поскольку траектория γ лежит в DH , то все неглавные скобки обращаются в нуль на γ. Так как функция Υ не зависит от μ и неглавных скобок K , то матрица M имеет следующую блочную структуру (здесь и далее Υ(t) = Υ(γ(t)), а I - единичная матрица нужного размера): μ Главные скобки K Неглавные скобки K w μ r 0r 00r 000r Главные скобки K 1 Главные скобки K 2 Главные скобки K 3 Главные скобки K 4 Υ(t) 0 0 0 0 0 0 0 0 0 ∗ ∗ ∗ ∗ ∗ ∗ ∗ 0 0 ∗ ∗ ∗ ∗ ∗ ∗ ∗ 0 0 ∗ ∗ ∗ ∗ ∗ ∗ ∗ 0 0 ∗ ∗ ∗ ∗ ∗ ∗ ∗ 0 Неглавные скобки K 2 0 0 0 0 0 -3Υ(t)I ∗ ∗ 0 Неглавные скобки K 3 0 0 0 0 0 0 -2Υ(t)I ∗ 0 Неглавные скобки K 4 0 0 0 0 0 0 0 -Υ(t)I 0 w 0 ∗ ∗ ∗ ∗ ∗ ∗ ∗ -Υ(t)I Матрица M является блочно-нижнетреугольной матрицей с тремя блоками на диагонали, при- чем центральный блок (отвечающий переменным K ) является блочно-верхнетреугольным. Поэтому матрица ΦH (t) имеет ту же структуру: 74 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД μ Главные скобки K Неглавные скобки K w μ Главные скобки K Неглавные скобки K w λ 0 0 0 0 ∗ ∗ 0 0 0 C 0 0 ∗ ∗ W причем матрица W пропорциональна единичной, а матрица C является верхнетреугольной. Выпишем явно дифференциальные уравнения на λ, W и C: d λ = Υ(t)λ, λ(0) = 1. dt Обозначим λ(τ ) = ρ, где τ - время движения по γ от z0 до z1. Далее, d - ⇒ W = Υ(t)W, W (0) = I = W (τ ) = ρ-1I. dt Уравнение на матрицу C имеет вид ⎛ ⎞ d dt C = ⎝ -3Υ(t) ∗ ∗ 0 -2Υ(t) ∗ 0 0 -Υ(t) ⎠ C, C(0) = I. Поэтому диагональные блоки C будут соответственно ρ-3I, ρ-2I и ρ-1I. 0 Вычислим теперь число ρ. Пусть траектория γ± - это поднятие γ с CH = {μ = 0} на {μ /= 0}. Другими словами, координаты K / и w на γ и γ± совпадают, но на γ± выполнено условие μ = 0, 0 причем траектория γ± удовлетворяет системе (6.15). Через z± 1 и z± обозначены соответствующие поднятия z0 и z1. Лемма 6.3. Обозначим μ0 = μ(z± ) и μ1 = μ(z± ). Тогда 0 1 μ1 = ρ. μ0 0 Доказательство. Действительно, μ1 есть функция начальной точки z± w0 = (μ0, K 0, ), т.е. μ1 = w0 μ1(μ0, K 0, ). Очевидно, что w0) = κμ1(μ0, K 0, w0) ∀κ ∈ R. Дифференцируя это равенство по κ при κ = 1, находим ∂μ1 = μ1 . ∂μ0 μ0 Поскольку правая часть равенства не изменяется при умножении μ0 на κ /= 0, получаем, что производная ∂μ1 ∂μ0 постоянна на всей вертикальной прямой (κμ0, K 0 , w0), κ ∈ R. Однако на γ (т.е. при κ = 0) выполнено соотношение что и требовалось. ∂μ1 = λ(τ ) = ρ, ∂μ0 w Замечание 6.6. Если на траектории γ± отбросить координату и координаты неглавных ско- (т.е. применить отображение, обратное к Π+/g), то получится оптимальная траектория бок K модельной задачи (2.1). Поэтому к ней применима ключевая лемма 3.2, которая гарантирует экс- поненциальную скорость стремления к 0 координаты μ(s) на ней при s → +∞. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 75 H Займемся теперь оператором проектирования касательного пространства Tz1 C H на гиперплос- кость Tz1 S вдоль векторного поля системы (6.15). Вообще говоря, векторное поле системы (6.15) разрывно в точке z1, но нас интересует тот вектор скорости, с которым траектория γ приходит в точку z1 при t → τ - 0. Обозначим этот вектор через v. Тогда ∗ v = 0 H T 0 ∗ . Ковектор α, задающий гиперплоскость Tz1 S имеет следующий вид: α = 0 ∗ 0 0 . ⊗ α H Таким образом, оператор проектирования 1- α(v) на Tz1 S вдоль v имеет следующую структуру: μ Главные скобки K Неглавные скобки K w μ Главные скобки K Неглавные скобки K w 1 0 0 0 0 ∗ 0 0 0 0 I 0 0 ∗ 0 I Итак, дифференциал отображения последования Пуанкаре dΦH «нильпотентизованой» систе- мы (6.15) в точке z0 записывается в виде ( dΦH |z0 = 1 - и имеет следующую блочную структуру: ρ 0 0 0 0 A ∗ 0 0 0 ρ-3I ∗ ∗ 0 0 ρ-2I ∗ 0 0 ρ-1I 0 ∗ ∗ ρ-1I ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ v ⊗ α \\ α(v) ΦH (τ ) ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ dΦH |z0 = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ 0 Замечание 6.7. Важно отметить, что матрица A получается сопряжением с помощью диффе- ренциала отображения (6.13) из соответствующей матрицы в гамильтоновой системе принципа максимума Понтрягина (2.3) для модельной задачи (2.1). Это немедленно вытекает из сказан- ного в п. 6.5. Более того, поскольку все рассматриваемые траектории лежат в DH , то матрица сопряжения будет постоянной и не зависеть от выбора траекторий γ 0 на DH . 0 0 Опишем теперь матрицу дифференциала отображения последования Пуанкаре dΦH уже для исходной (не «нильпотентизованой») системы (6.12). Поскольку исходная система (6.12) и «ниль- потентизованная» (6.15) совпадают на CH , то у матриц dΦH и dΦH заведомо совпадают все элементы вне первого столбца и первой строки. Но первая строка тоже сохраняется, так как диф- ференциальные уравнения на μ в системах (6.12) и (6.15) отличаются на член порядка O(μ2) в окрестности CH . 76 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Таким образом, доказана следующая лемма. Лемма 6.4. Дифференциал dΦH отображения последования Пуанкаре системы (6.12) в точ- H H 0 0 H ке z0 ∈ D0 ∩S из XH (x0) или ΞH (x0) на поверхности S имеет следующий вид: μ r 0r 00r 000r Главные скобки K 1 Главные скобки K 2 Главные скобки K 3 Главные скобки K 4 ρ 0 0 0 0 0 0 0 0 ∗ ∗ ∗ ∗ 0 ∗ ∗ ∗ ∗ 0 ∗ A ∗ ∗ ∗ 0 ∗ ∗ ∗ ∗ 0 μ Главные скобки K Неглавные скобки K w Неглавные скобки K 2 ∗ 0 0 0 0 ρ-3I ∗ ∗ 0 Неглавные скобки K 3 ∗ 0 0 0 0 0 Неглавные скобки K 4 ∗ 0 0 0 0 0 w ∗ ∗ ∗ ∗ ∗ ∗ ρ-2I ∗ 0 0 ρ-1I 0 ∗ ∗ ρ-1I где матрица A совпадает (с точностью до замены (6.13)) с соответствующей матрицей системы (2.3) принципа максимума Понтрягина для модельной задачи (2.1), а ρ может быть вычислено по лемме 6.3. Окончание доказательства хаотического поведения траекторий в общей гамильтоно- вой системе. Лемма 6.4 позволяет воспользоваться результатами о хаотичности оптимального синтеза, полученными в модельной задаче (2.1). Однако, как уже было сказано выше, множе- ⊂ C ства Ξ0 (x0) H или X 0 ⊂ C (x0) H построены на нулевом сечении CH и перейдут в странную H 0 H 0 0 точку x0 при обращении раздувающего отображения B-1. Поэтому для того чтобы не потерять 0 картину хаотичного синтеза, мы для каждой оптимальной траектории из X или Ξ построим с помощью теоремы Адамара-Перрона (см. [12]) двумерные устойчивые листы, которые уже будут выходить за пределы нулевого сечения CH . Точнее, теорему Адамара-Перрона будем применять к отображению последования Пуанкаре ΦH вдоль этой траектории. Итак, зафиксируем траекторию γ из множества Ξ0 (x0) или множества X 0 (x0). Траектория γ H H γ является образом некоторой траектории из Ξ/g или X /g при отображении Π+/g. Обозначим точки последовательного пересечения поверхности переключения SH траекторией γ через ..., z-1, z0, z1,.. ., а траектории - через ..., , , ,.. .. Матрицу A и число ρ из леммы 6.4, γ z-1 z0 z1 отвечающие k-й точке zk , будем обозначать через A(zk ) = Ak и ρ(zk ) = ρk соответственно. По лемме 6.4 для гамильтоновой системы (2.3) имеем: z k ( ρ 0 \\ k ) = . dΦ( 0 Ak Здесь и далее через Φ обозначено отображение последования в раздутой модельной системе поля μξ (см. систему (3.4)). Сначала докажем сжатие в вертикальном направлении в исходной гамильтоновой системе с гамильтонианом H. Вообще говоря, при однократном отображении последования ΦH , в диффе- ренциале dΦH (zk ) собственное значение ρk может быть больше 1. Однако мы утверждаем, что H лемма 3.2 гарантирует, что найдется такое натуральное N , что ΦN будет сжимать в вертикальном направлении. Действительно, любая оптимальная траектория в модельной задаче попадает в начало координат за конечное время, поэтому повторяя отображение последования Пуанкаре ΦH ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 77 γ достаточное число раз, мы получим сжатие в вертикальном направлении. Докажем это утвержде- ние строго. Воспользуемся результатами, полученными для модельной задачи (2.1). Из леммы 3.2 следует, что на оптимальной траектории на M+ выполнены неравенства c1e-c2s μ(γ(s)) μ(γ(0)) c3e-c4s, причем положительные константы cj , k = 1,..., 4, не зависят от выбора траектории на M+. Следовательно, μ(s) 1 1 4 μ(0) 2 при s ) c ln(2c3). Оценим теперь время σ(z) перехода между двумя последовательными пересечениями поверхности переключения S в точках z ∈ S и Φ(z) ∈ S вдоль поля μξ по произвольной траектории из Ξ или X . Функция σ непрерывна и не зависит от μ, а множества (Ξ/g) ∩S и (X /g) ∩S компактны и не пересекаются с S123. Поэтому выполнена оценка smin σ(z) smax для некоторых неотрицательных констант smin и smax. Поскольку непрерывная функция достигает своего минимума на компакте, то smax ) smin > 0. Поэтому по лемме 6.3 получаем 1 ρkρk+1 ... ρk+N -1 < 2 ∀k при N > s 1 minc4 ln(2c3). Таким образом, зафиксировав произвольное достаточно большое число N и работая только с N -й степенью отображений Φ и ΦH вместо них самих, мы можем считать, что в вертикальном направлении происходит сжатие. Итак, доказана следующая лемма. Лемма 6.5. Зафиксируем число1 и введем обозначения 1 N > sminc4 ln(2c3) Положим также H Θ = Φ-N , ΘH = Φ-N . -1 κ(zkN ) = κk = ρkN -1ρ kN -2 ... ρ(k-1)N > 2, -1. Тогда A(zkN ) = Ak = AkN -1AkN -2 ... A(k-1)N zkN ( κk 0 \\ dΘ( ) = , 0 Ak а матрица dΘH (zkN ) имеет структуру из леммы 6.4 с заменой ρ на κk и A на Ak . Следующим шагом, необходимым для применения теоремы Адамара-Перрона, является акку- ратное изучение структуры матриц Ak . Мы докажем, что в некотором специальном разложении касательного пространства все матрицы Ak превращаются в блочно-диагональные. Поэтому для удобства обозначим z) = z) ( ρ( 0 \\ , (6.17) dΦ( 0 A(z) где линейный оператор A( действует из T C ∩ S) в T C ∩ S. 0 Φ( 0 z) z ( z) z Лемма 6.6. В точках каждого из множеств (Ξ/g) ∩S и (X /g) ∩S существует такое разложение касательного пространства2 z) = 1, dim V (z) = 5, 1Число N не зависит от выбора траектории zk и может быть выбрано одинаковым для всех траекторий. 2Напомним, что dim C0 ∩S = 6. 78 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД z) и метрика на них, что оператор A( принимает вид где A(z) = z) ( α( 0 0 \\ δ(z) , z)). z) → V (Φ( α При этом - сжимающий оператор, а δ - растягивающий, т.е. z) < 1, δ (z)-1 < 1 ∀z. C 0 Более того, и метрика, и разложение Tz ( z) ∩ S) = U ( z) ⊕ V ( z. непрерывно зависят от Доказательство. Доказательство леммы состоит из двух частей. Сначала мы выберем «почти» правильное разложение касательного пространства в точках каждого из множеств (Ξ/g) ∩S и z) (X /g) ∩ S, в которых матрица A( становится «почти» блочно-диагональной, а потом трансформируем это разложение. Итак, мы утверждаем, что в окрестности каждого из множеств (Ξ/g)∩S и (X /g)∩S существуют такие локальные координаты и риманова метрика, что ( α( β( \\ A-1(z) = z) z) γ( z) z) δ( , (6.18) для каждой точки из этих окрестностей. Здесь α( число, β( и γ( матрицы 1 × 5 и 5 × 1, z z) z) z) z) а δ( - матрица 5 × 5. При этом найдутся четыре таких положительных числа ux, uy , vx и vy , что z)-1 -1 z) uy, γ(z) vx, δ(z) vy. α( ux , β( Более того, диагональные элементы устроены гиперболически, а элементы на побочной диагонали малы по сравнению с ними. Точнее, числа ux, uy , vx и vy удовлетворяют неравенствам ux > 1 > vy, (ux - 1)(1 - vy ) > uyvx. (6.19) Действительно, существование таких локальных координат в окрестности множества (Ξ/g) ∩S следует из теоремы Гробмана-Хартмана (см. [12]) и трансверсальности гомоклинической точки (см. лемму 3.6): множество (Ξ/g) ∩S в теореме 3.1 можно уменьшить при необходимости так, что в произвольной фиксированной метрике норма элементов на побочной диагонали будет сколь угодно мала, а диагональные элементы будут растягивающими и сжимающими операторами тех размерностей, что и в шестизвенном цикле, т.е. 5 и 1. Для множества (X /g) ∩S этот факт следует из явной формулы локальных координат. Приведем эти координаты на поверхности переключения ψ1 = ψ3, с нормализацией φ2 = 1. Сначала проведем редукцию к шести переменным: √2 1 √2 π1 = 2 6 (y1 - y3), π2 = √ (y1 - 2y2 + y3), π3 = 2 (x1 - x3), 1 √2 1 π4 = √6 (x1 - 2x2 + x3), π5 = 2 6 (φ1 - φ3), π6 = √ (ψ1 - 2ψ2 + ψ3). Теперь в каждой из 16 областей AA.AA, AA.AC, . . . , CC.CC произведем линейную замену координат η = Mπ, где постоянные матрицы M для 16 областей имеют вид ⎛ -0,5913 -1,0677 0,0683 0,2937 -0,0114 0,0316 ⎞ ⎜ 0,0848 -1,3179 -0,9326 -0,6262 -0,0104 0,0737 ⎟ ⎜ ⎟ MAA.AA = ⎜ -0,0023 0,6606 0,2677 0,7432 0,4258 0,2468 ⎟ , ⎜ ⎟ ⎜ -0,2024 0,8600 -0,7595 0,9189 -1,5610 0,7982 ⎟ ⎠ ⎝ ⎜ 0,5347 -0,1061 1,3964 0,6468 2,3193 -2,1665 ⎟ -1,1822 0,5279 -2,5279 -0,2730 -3,8024 2,6844 ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 79 ⎛ -0,3772 -0,6812 0,0436 0,1874 -0,0072 0,0201 ⎞ ⎜ 0,0603 -0,9371 -0,6631 -0,4452 -0,0074 0,0524 ⎟ ⎜ ⎟ MAA.AC = ⎜ -0,0016 0,4697 0,1903 0,5285 0,3028 0,1755 ⎟ , ⎜ ⎟ ⎜ -0,1439 0,6115 -0,5401 0,6534 -1,1101 0,5675 ⎟ ⎠ ⎝ ⎜ 0,3801 -0,0754 0,9930 0,4599 1,6493 -1,5406 ⎟ -0,8407 0,3754 -1,7976 -0,1940 -2,7037 1,9088 ⎛ -0,3971 -0,6704 0,1033 0,2038 0,0053 -0,0444 ⎞ ⎜ ⎜ ⎜ MAA.CA = ⎜ 0,1116 -0,2444 -0,2931 -0,2188 0,0594 0,0028 ⎟ ⎟ , 0,0819 0,6562 0,5188 0,8690 1,3697 0,2361 ⎟ ⎟ ⎜ -0,0770 0,5547 -0,3887 0,6313 -0,8937 0,5253 ⎟ ⎠ ⎝ ⎜ 0,2177 -0,0065 0,6332 -0,1496 1,2464 0,3705 ⎟ -0,1329 0,0749 -0,4715 -0,2392 -0,9990 0,9895 ⎛ -0,2941 -0,4965 0,0765 0,1509 0,0039 -0,0329 ⎞ ⎜ ⎜ ⎜ MAA.CC = ⎜ 0,1180 -0,2584 -0,3099 -0,2314 0,0629 0,0030 ⎟ ⎟ , 0,0865 0,6937 0,5485 0,9186 1,4479 0,2496 ⎟ ⎟ ⎜ -0,0815 0,5864 -0,4109 0,6674 -0,9447 0,5552 ⎟ ⎠ ⎝ ⎜ 0,2302 -0,0068 0,6694 -0,1581 1,3176 0,3916 ⎟ -0,1405 0,0791 -0,4985 -0,2529 -1,0561 1,0461 ⎛ -1,3472 -1,2301 0,8883 0,9348 -0,4362 -0,0239 ⎞ ⎜ ⎜ ⎜ MAC.AA = ⎜ 0,1653 -1,7355 -1,7124 -0,5395 0,6959 0,2788 ⎟ ⎟ 0,3610 0,1926 2,3424 -0,1152 4,4150 -0,4106 ⎟ , ⎟ ⎜ -0,2216 1,5281 -0,9719 1,9245 -2,4828 1,4865 ⎟ ⎠ ⎝ ⎜ 1,7063 -1,3513 3,2009 -1,9034 4,1924 -0,2951 ⎟ -0,4124 0,3207 -1,2318 -0,1906 -2,4337 2,6356 ⎛ -1,5370 -1,4034 1,0134 1,0666 -0,4977 -0,0273 ⎞ ⎜ ⎜ ⎜ MAC.AC = ⎜ 0,1456 -1,5288 -1,5084 -0,4752 0,6131 0,2456 ⎟ ⎟ 0,3180 0,1697 2,0633 -0,1015 3,8890 -0,3616 ⎟ , ⎟ ⎜ -0,1951 1,3460 -0,8561 1,6952 -2,1869 1,3094 ⎟ ⎠ ⎝ ⎜ 1,5029 -1,1902 2,8195 -1,6767 3,6929 -0,2599 ⎟ -0,3632 0,2825 -1,0851 -0,1678 -2,1437 2,3215 ⎛ -1,4918 -1,2360 1,0849 0,9744 -0,6000 -0,1150 ⎞ ⎜ -0,5929 0,5930 1,2489 0,5188 -0,7829 -0,2039 ⎟ ⎜ ⎜ MAC.CA = ⎜ ⎜ ⎜ ⎝ ⎟ 0,2087 -2,0370 0,9934 -2,4691 2,5841 -1,8853 ⎟ , ⎟ 0,8390 1,3864 4,1958 1,8630 10,4128 0,9577 ⎟ ⎠ 1,8997 -0,1209 6,1266 -1,0920 12,6540 3,2477 ⎟ -0,5410 0,3880 -1,7381 -0,6350 -3,6204 3,9319 ⎛ -1,4492 -1,2008 1,0539 0,9467 -0,5829 -0,1117 ⎞ ⎜ -0,6064 0,6066 1,2774 0,5307 -0,8008 -0,2085 ⎟ ⎜ ⎜ MAC.CC = ⎜ ⎜ ⎜ ⎝ ⎟ 0,2134 -2,0836 1,0162 -2,5256 2,6432 -1,9285 ⎟ , ⎟ 0,8583 1,4182 4,2918 1,9056 10,6511 0,9796 ⎟ ⎠ 1,9431 -0,1237 6,2668 -1,1170 12,9436 3,3220 ⎟ -0,5534 0,3969 -1,7778 -0,6495 -3,7032 4,0219 ⎛ -0,8312 -1,5009 0,0960 0,4129 -0,0159 0,0445 ⎞ ⎜ 0,1017 -1,5797 -1,1178 -0,7505 -0,0125 0,0883 ⎟ ⎜ ⎟ MCA.AA = ⎜ -0,0028 0,7918 0,3209 0,8908 0,5104 0,2957 ⎟ , ⎜ ⎟ ⎜ -0,2426 1,0308 -0,9104 1,1014 -1,8712 0,9568 ⎟ ⎠ ⎝ ⎜ 0,6409 -0,1272 1,6739 0,7752 2,7801 -2,5969 ⎟ -1,4171 0,6327 -3,0301 -0,3272 -4,5577 3,2177 80 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД ⎛ -0,5590 -1,0094 0,0646 0,2777 -0,0107 0,0300 ⎞ ⎜ ⎜ ⎜ MCA.AC = ⎜ 0,0284 -1,2522 -1,0645 -0,6260 -0,2454 0,2924 ⎟ ⎟ , 0,0136 0,5899 0,2568 0,6980 0,4571 0,2243 ⎟ ⎟ ⎜ -0,1603 0,7743 -0,6799 0,8766 -1,3837 0,6740 ⎟ ⎠ ⎝ ⎜ 0,4698 0,0295 1,3318 0,6845 2,0995 -2,0201 ⎟ -1,1106 0,4685 -2,3717 -0,2692 -3,5420 2,4780 ⎛ -0,6987 -1,1795 0,1817 0,3586 0,0093 -0,0782 ⎞ ⎜ ⎜ ⎜ MCA.CA = ⎜ 0,2866 -0,6276 -0,7527 -0,5620 0,1527 0,0072 ⎟ ⎟ , 0,2102 1,6846 1,3320 2,2311 3,5163 0,6063 ⎟ ⎟ ⎜ -0,1980 1,4241 -0,9979 1,6208 -2,2944 1,3485 ⎟ ⎠ ⎝ ⎜ 0,5591 -0,0166 1,6256 -0,3841 3,1999 0,9511 ⎟ -0,3412 0,1922 -1,2105 -0,6143 -2,5648 2,5404 ⎛ -0,5165 -0,8721 0,1343 0,2651 0,0068 -0,0579 ⎞ ⎜ ⎜ ⎜ MCA.CC = ⎜ 0,2310 -0,5057 -0,6066 -0,4529 0,1230 0,0059 ⎟ ⎟ , 0,1694 1,3576 1,0734 1,7980 2,8339 0,4887 ⎟ ⎟ ⎜ -0,1595 1,1476 -0,8042 1,3062 -1,8490 1,0867 ⎟ ⎠ ⎝ ⎜ 0,4506 -0,0134 1,3100 -0,3096 2,5789 0,7664 ⎟ -0,2750 0,1549 -0,9756 -0,4950 -2,0670 2,0473 ⎛ -1,7029 -1,5549 1,1228 1,1818 -0,5513 -0,0303 ⎞ ⎜ ⎜ ⎜ MCC.AA = ⎜ 0,2242 -2,3541 -2,3229 -0,7318 0,9440 0,3782 ⎟ ⎟ 0,4897 0,2613 3,1773 -0,1562 5,9887 -0,5568 ⎟ , ⎟ ⎜ -0,3006 2,0727 -1,3182 2,6104 -3,3677 2,0164 ⎟ ⎠ ⎝ ⎜ 2,3143 -1,8329 4,3417 -2,5818 5,6867 -0,4003 ⎟ -0,5593 0,4349 -1,6709 -0,2585 -3,3011 3,5749 ⎛ -2,1389 -1,9529 1,4103 1,4843 -0,6925 -0,0380 ⎞ ⎜ ⎜ ⎜ MCC.AC = ⎜ 0,2145 -2,2524 -2,2225 -0,7003 0,9032 0,3618 ⎟ ⎟ 0,4685 0,2499 3,0400 -0,1494 5,7300 -0,5328 ⎟ , ⎟ ⎜ -0,2876 1,9832 -1,2612 2,4976 -3,2221 1,9292 ⎟ ⎠ ⎝ ⎜ 2,2144 -1,7536 4,1542 -2,4703 5,4411 -0,3829 ⎟ -0,5352 0,4161 -1,5988 -0,2473 -3,1585 3,4205 ⎛ -2,1848 -1,8102 1,5888 1,4272 -0,8787 -0,1684 ⎞ ⎜ -0,9631 0,3038 0,8826 0,2771 -2,6832 -1,3049 ⎟ ⎜ ⎜ MCC.CA = ⎜ ⎜ ⎜ ⎝ ⎟ 0,1995 -2,1397 1,4883 -2,6630 3,2584 -1,9360 ⎟ , ⎟ 0,9908 1,4063 4,5037 1,9791 11,6620 0,8665 ⎟ ⎠ 2,2134 -0,2631 6,8269 -1,3631 14,3844 3,5996 ⎟ -0,6009 0,2926 -2,2588 -0,8628 -4,4148 4,3259 ⎛ -1,8994 -1,5738 1,3813 1,2407 -0,7640 -0,1464 ⎞ ⎜ -0,6747 0,6749 1,4212 0,5903 -0,8909 -0,2319 ⎟ ⎜ ⎜ MCC.CC = ⎜ ⎜ ⎜ ⎝ ⎟ 0,2374 -2,3179 1,1304 -2,8096 2,9404 -2,1454 ⎟ . ⎟ 0,9548 1,5775 4,7743 2,1199 11,8485 1,0898 ⎟ ⎠ 2,1615 -0,1375 6,9713 -1,2427 14,3987 3,6954 ⎟ -0,6155 0,4415 -1,9777 -0,7225 -4,1196 4,4740 В этих координатах константы ux, uy и т. д. для отображения последования Пуанкаре на областях AA.AA, AA.AC, .. ., CC.CC удовлетворяет неравенствам |ux| > 1,2641, uy < 0,3894, vx < 0,3894, vy < 0,4000. Далее рассуждения для множеств (Ξ/g)∩S и (X /g)∩S совпадают. Поэтому мы будем обозначать через X любое из этих множеств. z Таким образом, в каждой точке из X определено разложение касательного пространства ⊕ 0 z) V (z), ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 81 z непрерывно зависящее от ∈ X. Получаем, что z) → U (Φ-1(z)), β(z) : V (z) → U (Φ-1(z)), z) : U ( z) → V (Φ-1(z)) δ(z) : V (z) → V (Φ-1(z)) z) : U ( z) - линейные операторы. В нашем случае dim U ( z) = 1, а dim V ( = 5. Однако это не существенно для дальнейшего, и мы будем производить рассуждения для произвольных размерностей z) = m1 и dim V ( m2 (соответственно, α( будем считать не числом, а обратимым, dim U ( z) = z) z) растягивающим в ux раз линейным отображением). Векторы пространств U ( z) и V ( будем обозначать буквами u и v. v Итак, мы ищем такую линейную замену координат z) = v + R( u в каждом пространстве C z) 0 Tz ( ∩ S), что нижний левый элемент в матрице A-1( z) обращается в нуль. Найдем R( , т.е. если ( u \\ ( = 1 0 \\( u \\ z) , v R( 1 v то A-1(z) ( u \\ = z) ( 1 0 \\( α( z) β( u \\( 1 0 \\( \\ , v или, иначе, z)) z) R(Φ-1( 1 γ( z) δ( z) -R( 1 v ( u \\ ( α(z) β (z) \\ ( u \\ A-1(z) = ( , δ( где ⎧ α( α( v - β( R( , γ z) z) v z) = z) ⎪ z) z) ⎪ z) = β( , ⎨ β ( γ( z) γ( - δ( R( R(Φ ( α( -1 - R(Φ-1( β( R( , ⎪ z) = z) z) z)+ z)) z) z)) z) z) ⎪ z) = δ(z)+ (Φ-1(z))β(z). ⎩ δ ( R γ z) = 0 Поскольку нас интересует такая замена, что ( z для всех ∈ X, то мы получаем R(Φ-1(z)) = -(γ(z) - δ(z)R(z) (α(z) - β(z)R(z) -1. (6.20) z) z) z), т.е. R( ε для некоторого фиксированного z ε> 0 и любого ∈ X. Произведем точный выбор ε> 0. Для обратимости оператора ( - β( R( достаточно, чтобы α z) z) z) ux - εuy > 0. Для того, чтобы отображение в правой части равенства (6.20) давало оператор, по норме не превосходящий ε, достаточно, чтобы vx + εvy ux - εuy ε. Теперь наложим еще одно требование на ε, а именно, выберем его так, чтобы отображение в правой части равенства (6.20) было сжимающим. Дифференциал этого отображения имеет вид z)+ 1 z)) z) dR(α(z) - β(z)R(z) -1. (δ( R(Φ- ( β( Поэтому достаточным условием сжатия является vy + εuy ux - εuy < 1. z) Последнее, что необходимо потребовать от ε, это чтобы оператор A-1( сохранял гиперболическую структуру, а именно, 1 z) < 1. z)- < 1, δ ( Для этого достаточно, чтобы выполнялись неравенства 1 ux - εuy < 1, vy + εuy < 1. 82 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Объединяя все полученные условия на ε> 0, получаем систему ⎧ uyε< ux, ⎪ u ε2 - (u - v )ε + v 0. ⎪ y x y x ⎪ ⎨⎪ uyε< ⎪ ⎪ 1 2 (ux - vy ), (6.21) - uyε< ux 1, ⎪ ⎪ ⎩ uyε< 1 - vy. Докажем, что эта система совместна по ε. Если uy = 0, то система имеет тривиальное решение u o ) x vx - vy . Разберем теперь случай uy > 0. Первое условие системы (6.21) следует из четвертого; третье - из четвертого и пятого. Таким образом, после замены C = uyε получаем равносильную систему ⎧ C2 ⎪⎨ - (ux - vy )C + uyvx < 0, C < ux - 1, ⎪⎩ C < 1 - vy. Дискриминант квадратного трехчлена в первом неравенстве положителен. Действительно, из нера- венств (6.19) следует, что D = (ux - vy )2 - 4uyvx = ((ux - 1) + (1 - vy ))2 - 4uyvx ) 4(ux - 1)(1 - vy ) - 4uyvx > 0. Поэтому система совместна, если меньший корень квадратного трехчлена лежит левее обоих чисел ux - 1 и 1 - vy , а именно, или, иначе, ux - vy - √D 2 < ux - 1, ux - vy - √D 2 < 1 - vy, √D > 2 - ux - vy, √D > ux + vy - 2. Поэтому осталось доказать, что √D > |2 - ux - vy | ⇐⇒ D > (2 - ux - vy )2, что немедленно следует из (6.19) после раскрытия скобок и приведения подобных членов. Покажем теперь, что интересующее нас линейное отображение R( U ( → V ( , R( ε, z) : z) z) z) действительно существует и непрерывно по z. Рассмотрим пространство C всех непрерывных отоб- ражений из ∈ X в шар радиуса ε в пространстве L(U ( ,V ( линейных отображений из U ( z z) z)) z) z) в V ( . Пространство C является полным метрическим пространством относительно стандартной метрики «супремум разности», так как множество X компактно, а L(U ( ,V ( полно. На проz) странстве C определено отображение P : C → C по формуле (6.20), а именно, PR(Φ-1(z)) = -(γ(z) - δ(z)R(z) (α(z) - β(z)R(z) -1. z)) Отображение P определено корректно, потому что (1) образ непрерывного отображения R будет z) z) z) отделен от множества необратимых за счет непрерывным, так как оператор (α( - β( R( выбора ε, и (2) из неравенства |R( | < ε следует неравенство |PR( | < ε, опять же за счет z) z) выбора ε. Более того, отображение P является сжимающим по тем же причинам. Следовательно, z) отображение P имеет единственную неподвижную точку R0 ∈ C, т.е. R0( - искомый линейный z оператор, непрерывно зависящий от ∈ X. Таким образом, в точках множества X определено непрерывное семейство таких операторов z), что ( , причем R0( γ z) = 0 1 z) < 1. Заменяя подпространства на z)- < 1, δ ( z) = {v = 0}, V (z) = {u = 0} v = v + R0( u = 0}, V ( V ( , z) = { z) z) = z) ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 83 получаем новое непрерывное разложение z), 0 z) ⊕ V ( z) в котором матрица A-1( принимает форму ( α( β( \\ для всех z из X. A-1(z) = z) 0 z) z) δ ( ux В силу компактности X найдутся такие положительные константы vy > 1 и < 1, что 1 u-1 z) < vy. z)- < x , δ ( Поскольку в новом разложении = u , а = 0, то условия (6.19) выполнены и в новом uy y vx в новом разложении z) разложении. Применяя описанную выше процедуру, но уже к оператору A( получаем искомое разложение 0 z) ⊕ V (z) z На самом деле можно показать, что это разложение зависит от ∈ X не только непрерывно, но и с выполнением условия Гельдера, однако это не существенно для дальнейшего. z) Замечание 6.8. Дадим краткое пояснение, почему оператор R0( , вообще говоря, не явля- ется гладким (скажем, по Уитни). Уравнение (6.20) является функциональным уравнением, и в наиболее простом виде можно его записать так: y(x) = f x, y(φ(x) , y где x - координата, f (x, y) и φ(x) - данные бесконечно гладкие функции, а y(x) - искомая функ- ция. О функции f известно, что f ± < 1. Можно даже считать, что x и y одномерны - это не меняет принципиальных эффектов, связанных с негладкостью решения. Если бы функция φ имела вид φ(x) = x, то уравнение имело бы вид y = f (x, y). В этом случае теорема о неявной функции гарантирует существование бесконечно гладкого решения. Именно, тот факт, что y ∈ C1, можно доказать прямой оценкой, а из него немедленно следует, что y ∈ C∞. Действительно, y±(x) = f ± x(x, y(x)) 1 - fy± (x, y(x)) и, следовательно, y± ∈ C1, так что y ∈ C2 и т. д. 2 Однако если φ(x) не есть тождественная функция, то, если φ есть отображение некоторого компакта в себя, по-прежнему можно доказать существование и единственность непрерывного решения на этом компакте (как это сделано в лемме 6.6). Однако решение этого уравнения, вообще говоря, может быть не гладким, а лишь гельдеровым. Например, для уравнения y(x) = 1 y(3x) решение y(x) = |x|log3 2 не является гладким в точке x = 0. Теперь, применяя поочередно к различным разложениям касательного пространства процедуру, описанную в лемме 6.6, приведем -N -ю степень матрицы дифференциала отображения последо- H вания Пуанкаре dΦ-N = ΘH из леммы 6.4 к наиболее удобному виду. Поскольку дальнейшие рассуждения почти идентичны для обоих множеств Ξ0 (x0) и X 0 (x0), будем обозначать через X0 H H Ξ0 H 0 H любое из двух множеств H (x0) ∩S или XH (x0) ∩S . Для того, чтобы привести дифференциал dΘH (z) к блочно-диагональному виду, сначала ограничимся нулевым сечением CH и, более того, отбросим пока не нужную координату . Обозначим H 0 H 1 H 0 w подпространство C , отвечающее главным скобкам через T C , а неглавным - через T C . T 0 H Tz 0 z 0 z 0 Разложим z C0 с помощью леммы 6.6 и замены (6.13) в сумму T 0 H z C0 = U (z) ⊕ V (z), dim U (z) = 1. Оператор A(z) станет блочно-диагональным и будет растягивать на U (z) и сжимать на V (z). Те- перь расширим V (z), присоединив к нему подпространство T 1CH . В получившемся разложении оператор dΘH |T 0 H z 1 H имеет вид (6.18) с γ(z) = 0 и α(z)-1 0 " < 1. Поскольку κ(z) > 2, можно z C0 ⊕Tz C0 увеличить N так, чтобы норма δ(z) стала меньше 1 (число N можно выбрать не зависящим от z в силу компактности множества X0). Поэтому к dΘH |T 0 H 1 H может быть применена процедура, z C0 ⊕Tz C0 84 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД описанная в лемме 6.6, после чего оператор dΘH |T K H H примет блочно-диагональный вид. z z C0 ⊕T K C0 Повторяя этот прием, мы можем поочередно присоединить к разложению, касательные подпроw странства, отвечающие координатам и μ. При этом размерность подпространства U (z) возрастет ровно на единицу на последнем шаге, при добавлении координаты μ. Таким образом, мы получаем такое непрерывно зависящее от z разложение ∩S Tz CH H = U (z) ⊕ V (z) 0 в точках z из X0, что dim U (z) = 2, а подпространство V (z) горизонтально, т.е. V (z) ⊂ Tz CH . При этом где dΘH (z) = ( α(z) 0 \\ 0 β(z) , α(z) : U (z) → U (ΘH (z)), β(z) : V (z) → V (ΘH (z)) непрерывно зависят от z, и α(z)-1 < 1, β(z) < 1. H ∩S В силу компактности Ξ0 (x0) H ∩S и H X 0 (x0) H можно считать, что нормы этих операторов отделены от 1, т.е. для некоторого κ< 1. α(z)-1 < κ, β(z) <κ Применим теперь теорему Адамара-Перрона. Для этого построим систему локальных коорди- нат в окрестности X0. Поскольку множество X0 компактно, то для любого ε > 0 найдется такое δ > 0, что для любой точки z0 из X0 разность ΘH (z) - dΘH (z0)(z - z0) меньше ε в метрике C1 для 0 z из δ-окрестности точки z0. Покроем X0 конечным числом (δ/2)-окрестностей в CH с центрами в точках z0, .. ., z0 ∈ X0, и в δ-окрестности каждой точки z0 введем свои локальные коор- 1 M m m динаты, порожденные дифференциалом dΘH (z0 ). Если точка z ∈ X0 лежит в (δ/2)-окрестности m точки z0 , то норма разности m dΘH (z) - dΘH (z0 ) меньше ε. Поэтому, если ε достаточно мало, то H к орбите Θk (z), k ∈ Z, применима теорема Адамара-Перрона. Таким образом, для каждой точки H 0 z0 ∈ X0 в ее (δ/2)-окрестности в CH ∩S определено двумерное бесконечно гладкое многообразие H W +(z0) точек z, экспоненциально стремящихся при итерациях отображения Θ-1 к образу z0 при H тех же итерациях. Поскольку ΘH = Φ-N , а множество X0 компактно, то любая точка z ∈ W +(z0) стремится к образу z0 и при итерациях самого отображения ΦH : H H δ k k k W +(z0) = z ∈C ∩S , z - z0 < 2 , ΦH (z) - ΦH (z0) < Cλ , k ∈ N , причем константы C > 0 и 0 < λ < 1 из теоремы Адамара-Перрона зависят лишь от выбора κ и ε, т.е. одинаковы для всех точек z. В силу компактности X0 можно выбрать такие константы C1 > 0 и 0 < λ1 < 1, что Φk (z) - Φk (z0) < C1λk при k ∈ N. H H 1 Нам потребуются некоторые свойства построенных множеств W +(z0). H Опишем теперь, как устроены траектории исходной гамильтоновой системы с гамильтони- аном H, начинающиеся в точках множества W+(z0), z0 ∈ X0. Для этого воспользуемся полем μξH (x0) на CH в окрестности C0 , построенным в п. 6.4 (см. систему (6.10)). Пусть для опре- деленности μ(z) > 0. Траектория γ(s), начинающаяся в точке γ(0) = z ∈ W +(z0), пересекает при s → +∞ поверхность разрыва правой части гамильтониана SH счетное число раз в точках Φk H (z), k ∈ N. При этом такая траектория существует и единственна, так как в окрестности X0 векторное поле μξH (x0) трансверсально SH . При этом время между переключениями ограничено снизу и сверху числами 1 smin и 2smax. Поэтому γ(s) стремится при s → +∞ к CH = {μ = 0} с 2 экспоненциальной скоростью, т.е. 0 c1e-c2s < μ(γ(s)) < c3e-c4s ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 85 для некоторых положительных констант ci, i = 1,..., 4. Поскольку dt = μds, получаем, что интеграл T (z) = +∞ r μ(γ(s))ds < ∞ 0 z) конечен; следовательно, прообраз траектории B-1(γ(t)) попадает в точку x0 за конечное вре- мя T (z). Другими словами, траектория X(t, , z ∈ M, исходной гамильтоновой системы с га- H z) = z 1(W (z0)), существует и единственна мильтонианом , начинающаяся в точке X(0, ∈ B- + на промежутке t ∈ [0; T (B( и попадает в x0 в момент T (B( . В дальнейшем для краткости z))] мы будем опускать знак отображения B и будем писать T ( z)) . z) = T (B(z)) Отметим, что главные скобки Km(X(t, z)) удовлетворяют неравенствам, заявленным в замеча- нии 6.4. Опишем теперь, как могут пересекаться множества W +(z0) и W +(z1), определенные в (δ/2)- окрестностях точек z0 и z1. Пусть U - пересечение (δ/2)-окрестностей точек z0 и z1. Докажем, что W +(z0) и W +(z1) либо не пересекаются, либо совпадают в U . Ясно, что если их пересечение не пусто и содержит некоторую точку z ∈ U , то итерации z стремятся и к образу z0,ик образу z1, поэтому итерации z0 и z1 сближаются с экспоненциальной скоростью. Как следствие, итерации любой точки z ∈ W +(z0) сближаются с итерациями z1 и наоборот. Поэтому множества W +(zi), i = 1, 2 совпадают на U . Множества ΞH (x0) и XH (x0) устроены следующим образом: их пересечение с SH есть в точно- сти объединение всех слоев B-1(W +(z0)) по всем z0: H ΞH (x0) ∩S = 1 H z0∈Ξ0 (x0) B-1(W +(z0)); H XH (x0) ∩S = 1 H z0∈X 0 (x0) B-1(W +(z0)); а сами множества получаются, если из каждой точки на SH выпустить траекторию гамильтоновой системы до следующего пересечения с SH . Таким образом свойства 1 и 2 обеих теорем 6.1 и 6.2 получаются автоматически из свойства (a) множеств W +(z0). Отображения ΨH и ΨH , топологические цепи Маркова Σ+ и Σ+ , заявленные в 3, получаются Γ 01 Γ 01 с помощью с помощью соответствующих отображений для модельной задачи (2.1). А именно, как композиции H 0 0 + проекции πW , которая переводит z ∈ B-1(W +(z0)) в точку z0 ∈ C0 , идентификации X (x0) и Ξ (x0) с X /g и Ξ/g с помощью отображения Π+/g из леммы 6.2, H H применения соответствующего фактор-отображения из модельной задачи (2.1) и отбрасывания некоторых начальных позиций в полученной топологической цепи Маркова. Γ Точнее, для отображения ΨH Γ в 2 необходимо использовать отображение Ψ+/g из теоремы 5.4, а 01 для отображения ΨH - отображение Ψ01/g из теоремы 3.1. Важно отметить, что сама проекция z 1→ z0 определена не однозначно, так как, вообще говоря, возможно, что z ∈ B-1(W +(z0) ∩ W +(z1)). Однако в этом случае по свойству (b) итерации z0 и z1 сближаются с экспоненциальной скоростью, поэтому найдется такое число K ∈ N, что в образах (Ψ+/g)((Π+/g)-1(zi) ∈ Σ+ или (Ψ01/g)((Π+/g)(zi) ∈ Σ01 Γ Γ отличия могут быть только на позициях с номерами меньше K, а на позициях с номерами больше K они должны совпадать. Поэтому мы отбросим все позиции левее K (обозначим это отображе- ние1 через d). После этого неоднозначность в отображении πW пропадет. Итак, ΨH + -1 H -1 Γ = d ◦ (ΨΓ /g) ◦ (Π+/g) ◦ πW , Ψ01 = d ◦ (Ψ01/g) ◦ (Π+/g) πW . Таким образом, п. 3 обеих теорем 6.1 и 6.2 доказан. Пункт 4 теоремы 6.2 получается заменой множества X0 конечным множеством, состоящим из пересечений Rijk /g или Qi/g с S (точнее их образа при отображении Π+/g). В первом случае Γ 1В случае бесконечных вправо последовательностей Σ+ мы отбрасываем ровно K первых членов, а в случае беско- нечных в обе стороны последовательностей Σ01 мы отбрасываем весь бесконечный влево хвост, начиная с позиции K. 86 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД X0 - это трехточечное множество, а во втором - четырехточечное. В случае трехзвенного цикла все собственные значения оператора A3 из (6.17) по модулю больше 1 (см. п. 2.8). Поэтому в этом случае мы получаем, что многообразие W + одномерно. В случае четырехзвенного цикла оператор A4 содержит ровно одно собственное значение, по модулю меньшее 1 (см. п. 2.8). В этом случае многообразие W + двумерно. 0 H H Пункт 4 теоремы 6.1 об оценке размерностей XH (x0) следует из соответствующего пункта теоремы 5.4. Действительно, во-первых, для некоторого достаточно малого μ0 отображение B-1 является диффеоморфизмом на CH ×{0 <μ< μ0} и, значит, не изменяет размерностей. Во-вторых, если dG(x0) = 0, то размерности (и по Хаусдорфу, и по Колмогорову) множеств X 0 (x0) и X /g совпадают, так как по лемме 6.2 в этом случае отображение Π+ является локально липшицевым. Остается только сказать, что множества XH (x0) и X + получаются из соответственно X 0 (x0)∩SH и (X ∩S)/g с помощью одинаковой процедуры (строятся двумерные устойчивые листы и выпускаются траектории). Пункт 5 теоремы 6.1 идентичен соответствующему пункту в теореме 5.4. Пункты 6 теоремы 6.1 и 5 теоремы 6.2 получаются рассмотрением липшицевой поверхности M- вместо липшицевой поверхности M+ оптимальных траекторий. Напомним, что M- состоит из траекторий, выходящих из начала координат гамильтоновой системы (2.3) принципа максимума Понтрягина модельной задачи (2.1). Доказательство теорем 6.1 и 6.2 закончено. D Докажем теперь утверждение, сформулированное в замечании 6.4. Оценка сверху уже получена в лемме 6.1. Оценка снизу эквивалентна тому, что на любой траектории X(t) из множества XH (x0) или ΞH (x0) выполнена оценка μ(X(t)) ) c±±(T - t), где c±± > 0 - некоторая константа, а T - момент выхода в странную точку x0. μ Перенесем траекторию X(t) на цилиндр CH с помощью раздувающего отображения B и сделаем замену времени ds = 1 dt. Получим траекторию X (s) = B(X(t(s)) системы (6.12). Таким образом, необходимо доказать, что μ(X (s)) ) T - t(s) = c±± +∞ r μ(X (σ)) dσ. s Обозначим через X 0(s) траекторию на CH из XH (x0) или Ξ0 (x0), к которой приближается X (s) 0 H при s → +∞. Как уже неоднократно упоминалось, траектория X 0(s) является также траекторией системы (6.15), так как μ(X 0(s)) = 0. Рассмотрим также траекторию X 1(s) системы (6.15), которая отличается от X 0(s) только тем, что μ(X 1(s)) > 0, а именно: ⎧ K (X ⎪ ⎪ 1(s)) = K (X 0(s)), ⎪ w(X 1(s)) = w(X 0(s)), ⎨ d ⎪ ⎪ ds ⎪⎩ μ(X 1(s)) = μ(X 1(s))Υ(X 1(s)) = μ(X 1(s))Υ(X 0(s)), μ(X 1(0)) = μ(X (0)). Поскольку траектория X 1(s) является образом оптимальной траектории в модельной задаче (2.1) при отображении B ◦Π+, то на ней по теореме 2.1 выполнено +∞ r для некоторой константы c0 > 0. μ(X 1(s)) ) c0 s μ(X 1(σ)) dσ ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 87 Покажем теперь, что значения μ на обеих траекториях X (s) и X 1(s) отличаются «не слишком сильно», а именно, ⎧ d ⎨⎪ μ(X(s)) = μ(X ds 1(s))Υ(X (s)), 1 1 1 ⇒ d ln μ(X (s)) 1 = Υ(X (s)) - Υ(X 1(s)). d ⎩⎪ dsμ(X (s)) = μ(X (s))Υ(X (s)) ds μ(X (s)) Поскольку X (s) и X 1(s) с экспоненциальной скоростью приближаются к X 0(s), то разность в правой части тоже стремится к нулю с экспоненциальной скоростью. Итак, для некоторых констант c1, c2 > 0 выполнены оценки Учитывая, что -c1e-c2s d ln μ(X (s)) ds μ(X 1(s)) c1e-c2s. ln μ(X (0)) μ(X 1(0)) = 0, немедленно приходим к выводу, что для c3 = ec1/c2 выполнены неравенства 1 Таким образом, c μ(X 1(s)) μ(X (s)) c3μ(X 1(s)). 3 1 c μ(X (s)) ) 3 что и требовалось. μ(X 1(s)) ) c0 c3 +∞ r μ(X s c 2 1(σ)) dσ ) c0 3 +∞ r μ(X (σ)) dσ, s Замечание 6.9. Учитывая замечание 6.4, мы можем проконтролировать, как множества ΞH (x0) и XH (x0) входят в странную точку x0. Говоря геометрическим языком, множества ΞH (x0) и XH (x0) касаются (в смысле порядка по μ) конуса B-1(D0 × {μ ∈ R} . Замечание 6.10. Согласно определению 6.1, странная точка может появиться только если ко- личество степеней свободы системы не меньше 16. Действительно, в определении 6.1 требуется линейная независимость дифференциалов функций Fr , (ad Fi)Fr и т. д. до четвертого порядка включительно. Минимальная размерность, в которой такое возможно, легко вычислить через раз- мерность свободной нильпотентной градуированной алгебры Ли глубины 4 с тремя образующими (F3 необходимо исключить, так как F3 ≡ -F1 - F2). А именно, вектор роста такой алгебры легко вычислить через слова Холла: он равен (3, 6, 14, 32). Поскольку на первой ступени мы не используем dF0, то минимально возможная размерность M - это 31. Но dim M четна, поэтому dim M ) 32 и система имеет не менее 16 степеней свободы. Число степеней свободы так велико, потому что условия в определении странных точек чрезмерно строги. На самом деле их можно существенно ослабить. Примером гамильтоновой системы малой размерности (с четырьмя степенями свободы), в которой наблюдается описанный в теореме 6.1 феномен, может служить гамильтонова система (2.3) принципа максимума Понтрягина в модельной задаче (2.1). Замечание 6.11. Появление странных точек в больших размерностях становится неизбежным и не уничтожается малым шевелением Hi, i = 1, 2, 3, если линейно независимыми являются диф- ференциалы коммутаторов в x0 не до четвертого порядка (как это требуется в определении 6.1) а до пятого порядка. В этом случае множество странных точек ST является гладким многообразием в окрестности точки x0, и его коразмерность также вычисляется через размерность свободной нильпотентной градуированной алгебры Ли глубины 5 с тремя образующими. А именно, вектор роста такой алгебры равен (3, 6, 14, 32, 80). Коразмерность ST меньше 80 на 4 (3 за счет симмет- рической формы Brr! и еще за счет F0 на первой ступени). Таким образом, codim ST = 76. 88 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД ПРИЛОЖЕНИЯ А. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ И ТЕОРИЯ ГАЛУА (М. И. ЗЕЛИКИН, Д. Д. КИСЕЛЕВ, Л. В. ЛОКУЦИЕВСКИЙ) В данном приложении кратко приведены недавние результаты, касающиеся еще одного типа выхода неособых экстремалей на особую в задачах, аффинных по многомерному управлению из шара Ω. Феномен заключается в том, что оптимальное управление движется вдоль иррациональной всюду плотной обмотки клиффордова тора, вложенного в сферу ∂Ω. При этом движение занимает конечное время: иррациональная обмотка проходится целиком в положительном направлении за конечное время. Оптимальная траектория, отвечающая такому управлению, представляет собой обобщенную логарифмическую спираль, натянутую на иррациональную обмотку. В отличие от фокуса в обыкновенных дифференциальных уравнениях, движение по этой спирали занимает конечное время и оптимальная траектория попадает в начало координат за конечное время. А.1. Введение. Рассмотрим гладкое 2n-мерное симплектическое многообразие M 2n. Пусть (2n - 1)-мерное стратифицированное подмногообразие S ⊂ M разделяет M на конечное число от- крытых областей Ω1,..., Ωk : M = J Ωi. Рассмотрим непрерывный гамильтониан H(q, p) : M → R, ограничение которого Hi = H|Ωi на любое множество Ωi определяет гладкую функцию, C∞- продолжаемую на окрестность множества Ωi. Одной из основных целей теории оптимального управления является построение оптимально- го синтеза, т.е. фазового портрета экстремалей, проходящих через каждую начальную точку x0. Принцип максимума Понтрягина сводит эту проблему к изучению гамильтоновой системы диф- ференциальных уравнений с разрывной правой частью, причем разрывы достигаются в тех точках x0 ∈ ∂S, для которых максимум достигается при нескольких различных значениях управления. В таких точках стандартные теоремы существования и единственности неприменимы. Вопросы существования обобщенного решения обеспечиваются с помощью рассмотрения вспомогательного дифференциального уравнения с многозначной правой частью. В правой части этого уравнения стоит выпуклое замыкание всех предельных точек фазовых скоростей, полученных при стремле- нии окрестных точек к точке x0. Единственность решения, проходящего через x0, принципиально не имеет места. Здесь на первый план выходит проблема описания с помощью функций Hi соот- ветствующей интегральной воронки - конуса решений, входящих в точку x0, или выходящий из нее. Порядок особенности определяется числом кратных скобок Пуассона от функций Hi, которые обращаются в нуль в точке x0 (см. [8]). Для одномерного управления, или, что то же, для поверхности разрыва коразмерности 1 при особенности первого порядка, в типичной ситуации интегральная воронка состоит из трех экс- тремалей: две из них лежат по разные стороны от поверхности разрыва, а третья идет по этой поверхности. При особенности второго порядка ситуация общего положения была найдена и ис- следована в работах И. Купки [24] и М. И. Зеликина и В. Ф. Борисова [30]. Экстремали подходят к точке x0 (и отходят от нее) за конечное время со счетным числом пересечений поверхности разрыва (chattering-режим). Особенности второго порядка для многомерного управления в случае, когда областью изменения управления является круг, были описаны в [15, 30]. При подходе к точке x0 управление за конечное время совершает счетное число оборотов по некоторой окружности. Соответствующая траектория x(t) попадает в точку x0, проходя за конечное время некоторый аналог логарифмической спирали. Данный обзор посвящен недавно обнаруженному феномену выхода неособой траектории на осо- бую таким образом, что соответствующее оптимальное управление в ряде случае движется вдоль иррациональной всюду плотной обмотки клиффордова тора (см. [7, 8]). При этом вся полови- на этой обмотки в одном направлении проходится за конечное время. Дело заключается в том, что в некотором классе задач оптимальное управление движется вдоль обмотки (не обязательно иррациональной) клиффордова тора, а иррациональность этой обмотки определяется линейной зависимостью (или точнее независимостью) над полем рациональных чисел Q корней некоторых многочленов Rq , q ∈ N, специального вида. Авторам удалось показать линейную независимость корней Rq в ряде случаев. Многочлен Rq имеет степень 2q - 1, а его коэффициенты могут быть ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 89 выписаны в явном виде. Тем не менее вопрос о линейной независимости корней Rq над Q для произвольного q остается открытым. А.2. Постановка задачи и ее симметрии. В этом пункте будет изучен класс задач, в которых, с одной стороны, сопряжение особых оптимальных траекторий с неособыми неизбежно, а с другой (см. [8, теорема 5.1]) - запрещает регулярное сопряжение. Рассмотрим оптимизационную задачу +∞ на траекториях управляемой системы → r (x, Cx dt 0 min (А.1) x(q) = u, |u| 1, x ∈ V, u ∈ U = V, k x(k)(0) = x0 при k q - 1. · Здесь V - евклидово пространство размерности n со скалярным произведением ( , · , а C - некоторая симметрическая билинейная форма. Функция x(t) считается абсолютно непрерывной вместе со своими 2q - 1 производными. Управление u(t) ∈ L1(0; +∞) - измеримая функция. Пусть λ1,..., λk - собственные числа формы C, а V1,..., Vk - соответствующие собственные подпространства. Очевидно, что если хотя бы одно из собственных чисел отрицательно, то мини- мум задачи равен -∞. Поэтому будем считать, что форма C неотрицательно определена. Нетрудно показать, что если det C = 0, то за счет проектирования вдоль ker C задача сводится к аналогич- ной, но уже с невырожденной матрицей C. Поэтому без ограничения общности будем считать, что форма C положительна определена. В этом случае у задачи для любых начальных данных решение существует, единственно и попадает в начало координат за конечное время (по аналогу теоремы 2.1). Легко видеть, что в данной задаче имеется равно одна особая экстремаль x = u = 0, и ее глобальный порядок равен1 q. Значит, если q четно, то в силу теоремы 5.1 из [8] регулярное сопряжение неособой траектории с особой x = u = 0 не оптимально. Обозначим через L ⊂ V подпространство, натянутое на векторы {x0, x0,..., x0 }, отвечающие начальным данным задачи (А.1). 0 1 q-1 Теорема А.1 (см. [8, Теорема 6.1]). Если L лежит в некотором собственном подпростран- стве Vj , то оптимальная траектория задачи (А.1) остается в L в течение всего времени. Доказательство основано на том факте, что ортогональная проекция на L допустимой траек- тории снова является допустимой траекторией. При этом, если L ⊂ Vj , то эта проекция может только уменьшить функционал (А.1). Поэтому оптимальной траектории ничего не остается, как лежать в L при всех t ) 0. Оказывается, что если собственные значения формы C находятся в некотором специальном отношении, то в задаче (А.1) возникают оптимальные решения, управление в которых двигается по клиффордовому тору, вложенному в сферу |u| = 1. Для отыскания всех траекторий такого типа мы воспользуемся группой Ли симметрий данной задачи и выделим семейства траекторий, не выходящий за пределы одной орбиты. Для этого выпишем систему принципа максимума. Положим x1 = x, x˙ 1 = x2, ..., x˙ q-1 = xq. Тогда гамильтониан (функция Понтрягина) имеет вид H = -λ0(Cx1, x1 + (p1, x2 + ... + (pq, u (p1,..., pq - сопряженные переменные). Нетрудно показать, что λ0 /= 0. Положив λ0 = 1/2, полу- чаем p˙1 = Cx1, p˙2 = -p1, ..., p˙q = -pq-1, u = pq . |pq | 1Точнее, глобальный порядок есть финитная последовательность (0,..., 0, dim V, 0 .. .) где dim V стоит на q-ом месте (подробнее см. [8]). 90 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Вид этой системы сильно упростится, если ввести обозначения Тогда x = C-1zq+1 и zk = (-1)q-k pq -k+1, z q+k = Cxk при k q. (А.2) Cz1 z˙1 = z2, z˙2 = z3, ..., z˙2q = (-1)q+1u, u = |z1| . (А.3) Данная система обладает следующими симметриями: группа G1 = SO(V1) × SO(V2) × ... × SO(Vs) ⊆ SO(V ) действует на zk и u одновременными поворотами и переводит векторы скоростей (а значит, и решения) системы (А.3) в себя; группа G2 = R+ действует масштабированием: если λ ∈ R+, то zk 1→ λ2q-k+1zk . На самом деле, вектор скорости системы (А.3) удлиняется в λ раз при этом действии. Однако интегральные кривые по-прежнему переходят в интегральные кривые (только скорость движения по ним возрастает в λ раз). А.3. Об оптимальном управлении в виде обмотки клиффордова тора. Ключевую роль в отыскании траекторий в виде обобщенных логарифмических спиралей, моделирующих движение вдоль иррациональной обмотки клиффордова тора, будет играть многочлен Pq (α) = (2q + iα ((2q - 1) + iα ... (1+ iα (А.4) и корни αj > 0 его мнимой части, при которых действительная часть имеет нужный знак: Im Pq (αj ) = 0, (-1)q+1Re Pq (αj ) > 0, αj > 0. (А.5) Теорема А.2 (см. [7, теорема 3]). Рассмотрим любой набор двумерных плоскостей Lm ⊆ Vjm , 1 m = 1,...,N , где Vjm - какие-либо различные собственные подпространства формы C. Если набор собственных значений λj1 ,..., λjk формы C удовлетворяет условию Pq (αj1 ) = Pq (αj2 ) = ... = Pq (αjN ) = μ (А.6) λj1 λj2 λjN для каких-то различных αjm , то любая траектория вида N exp z1 = ) bmt2q u = ) m=1 N ±iαjm ln |t| ym, (А.7) exp m=1 ±iαjm ln |t| ym является оптимальной для задачи (А.1) при любом выборе единичных векторов ym ∈ Lm и ненулевых чисел bm ∈ R при выполнении условия m = 1. μ2 ) b2 Более того, таким способом описываются все возможные (с точностью до сдвига по времени) оптимальные траектории задачи (А.1), не покидающие какую-либо фиксированную орбиту группы G = G1 × G2. Отметим, что в решениях (А.7) управление движется по обмотке клиффордова тора (L1 × ... × LN ) ∩ {|u| = 1} и проходит ее целиком2 за конечное время. Сама траектория x(t) представляет собой прямое произведение соответствующих логарифмических спиралей и тоже проходится за конечное время. На каждой оптимальной траектории (А.7) управление проходит обмотку клиффордова тора TN = (L1 × ... × Lk ) ∩ {|u| = 1} 1Случай N = 1 не исключается. В этом случае подойдет любое собственное значение λj формы C, лишь бы dim Vj ) 2. 2Точнее, ту ее половину, что соответствует положительному направлению времени ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 91 и выходит за конечное время на особый режим x = u = 0. Тор TN вложен в сферу Sn-1 = {|u| = 1}⊆ V единичного радиуса. Более того, если значения αj1 ,..., αN несоизмеримы над Q, то полученная обмотка тора T является всюду плотной. - }j=1 Положительный ответ на вопрос о линейной независимости корней {α2j 1 [q/2] полинома Pq (α) над полем рациональных чисел для произвольного q позволит доказать, что оптимальное управ- ление из теоремы А.2 движется вдоль иррациональной обмоткой любого k-мерного тора. Если же какие-либо наборы корней окажутся линейно зависимыми (хотя примеры многочленов вида (А.4) и А.5 неизвестны), то соответствующая им обмотка замкнется. Заметим, что природа коэффициентов многочлена Pq (α) весьма специфична. Обозначим через σj элементарный симметрический многочлен степени j от набора чисел {1, 2 ..., 2q}. Имеем 2 ImPq (α) = α(σ2q-1 - σ2q-3α 2 + ... + (-1) 4 q-1 σ1α q 2q-2), 2q (А.8) RePq (α) = σ2q - σ2q-2α + σ2q-4α - ... + (-1) α . В [7] доказано, что при q < 16 корни многочлена ImPq (α), удовлетворяющие условию (А.5), ли- нейно независимы над полем рациональных чисел Q. Это дает нам смелость высказать следующую гипотезу. Гипотеза А.1 (см. [7, 8, гипотеза 1]). При любом q ∈ N корни многочлена ImPq (α), удовле- творяющие условию (А.4), линейно независимы над полем рациональных чисел Q. Количество решений в (А.5) нетрудно вычислить. Предложение А.1. Многочлен ImPq (α) имеет 2q - 1 различных действительных корней, из которых ровно [q/2] удовлетворяет условию (А.5). Доказательство. Многочлен ImPq (α) можно представить в виде ImPq (α) = αfq (α2), где fq (x) - многочлен степени q - 1. Поэтому нуль всегда является корнем многочлена ImPq (α) а остальные корни разбиваются на пары совпадающих по модулю и отличающихся знаком чисел. Изучим положительные корни. Каждый из сомножителей в формуле (А.4) является комплекс- ным числом, аргумент которого при росте α ∈ (0; +∞) монотонно возрастает от нуля до π/2. Аргумент их произведения монотонно возрастает от нуля до πq и, следовательно, Pq (α) ровно q - 1 раз пересекает действительную ось. Если при этом q четно, то он [q/2] раз пересекает отри- цательную часть действительной оси, а если q нечетно, то он [q/2] раз пересекает положительную часть действительной оси. А.4. Применение теории Галуа для доказательства иррациональности обмотки клиффор- дова тора. Начнем с простейшего случая q = 2. Тогда α = √5 и находим экстремали (если λj = 1): 1 4 z1 = 126 t exp{±iα ln |t| , u = exp{±iα ln |t| . (А.9) Поскольку ln |t|→∞ при t → 0, то управление совершает счетное число оборотов по окружности S1 за конечное время. При этом x → 0, и траектория выходит на особый режим. Траекторией в конфигурационном пространстве служит логарифмическая спираль. В отличие от траекторий особой точки типа фокуса для обыкновенных дифференциальных уравнений, кривая подходит к началу координат за конечное время, совершая счетное число оборотов. Пусть теперь q = 4. Если начальные векторы {x0, x1, x2, x3} лежат на одной прямой l ⊆ Vj , 0 0 0 0 то, в соответствии с теоремой А.1, вопрос сводится к решению одномерной задачи четвертого порядка типа Фуллера. В этом случае в фазовом пространстве R4 имеются два семейства автомо- дельных оптимальных траекторий, ведущих в начало координат со счетным числом переключений на конечном интервале времени (см. [30]). В конфигурационном пространстве все эти оптималь- ные траектории не покидают прямой l. Если же начальные векторы в задаче (А.1) принадлежат некоторой двумерной плоскости L ⊆ Vj , то возникает двумерная задача четвертого порядка типа Фуллера. Согласно (А.8) имеем ImP4(α) = α(109584 - 67284α2 + 4536α4 - 36α6) = 0, ReP4(α) = 40320 - 118124α2 + 22449α4 - 546α6 + α8 < 0. 92 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Получаем α2 = 1,86 и α2 = 109,13. Корни α2 = 15,01 и α4 = 0 лишние, так как для них нарушается 1 ∼ 2 ∼ 3 ∼ неравенство (А.5). Итак, A1 ∼= 78·10-7 и A2 ∼= 32·10-9. Соответствующие оптимальные управления и решения системы (А.3) имеют вид (при λj = 1) u1 = exp(α1i ln |t|), u2 = exp(α2i ln |t|), z1 1 = A1t8 1 exp(α1i ln |t|), z2 = A2t8 exp(α2i ln |t|). (А.10) Рассмотрим исходную задачу (А.1) при q = 4. Используя найденные явные решения в простран- ствах Vj , построим оптимальные траектории, не лежащие в собственных подпространствах Vj . Предположим, что решения z1 и z2 из (А.10) лежат в разных собственных подпространствах V1 1 1 и V2, отвечающих собственным значениям λ1 и λ2. Рассмотрим их линейную комбинацию: пусть j Lj , j = 1, 2 - двумерные плоскости в Vj , а x0 - два фиксированных единичных вектора в L1 и L2. Тогда при ненулевых a и b имеем z1 = a t8 exp(α1i ln |t|)x0 + b t8 exp(α2i ln |t|)x0. (А.11) 1 2 Очевидно, z1 удовлетворяет всем уравнениям системы (А.3) кроме, возможно, последнего. Для того, чтобы удовлетворялось последнее уравнение, коэффициенты a и b должны быть такими, чтобы при любом t выполнялось равенство z˙2q = aP4(α1) exp(α1i ln |t|)x0 + bP4(α2) exp(α2i ln |t|)x0 = 1 = aλ1 -√ 2 1 | | - √ exp(α i ln t )x0 bλ2 z1 exp(α2i ln |t|)x0 = (-1)q+1C . a2 + b2 1 a2 + b2 2 |z1| Поскольку a /= 0 и b /= 0, то данное уравнение выполнено при любом t тогда и только тогда, когда коэффициенты a и b удовлетворяют системе ⎧ λ1 ⎪ √ = -P4(α1), ⎨ a2 + b2 (А.12) λ2 ⎪⎩ √a2 + b2 = -P4(α2). Как было показано, P4(αj ) ∈ R и отрицательно, j = 1, 2. Поэтому система (А.12) разрешима, если пара собственных значений формы C удовлетворяет соотношению P4(α1) = P4(α2) = μ. (А.13) λ1 λ2 Тогда задача (А.1) имеет семейство оптимальных траекторий вида (А.11) при μ2(a2 + b2) = 1. На каждом таком решении управление проходит обмотку клиффордова тора Tab и выходит за конечное время на особый режим x = u = 0. Тор Tab вложен в сферу S3 ⊆ V = R4 единичного радиуса и описывается уравнениями a b |u1| = √a2 + b2 , |u2| = √a2 + b2 . Более того, если значения α1 и α2 несоизмеримы над Q, то полученная обмотка тора Tab является всюду плотной. Докажем, что корни α1 и α2 линейно независимы над Q. Для этого покажем, что их квад- раты линейно независимы над Q. Предположим противное: пусть для некоторых рациональных b1, b2 ∈ Q выполнено b1α2 + b2α2 = 0. 1 2 i Обозначим Qq (α2) = ImPq (α)/α. Корнями многочлена Q4 являются α2, i = 1, 2, 3. Легко видеть (например, из формулы Кардано), что многочлен Q4 не имеет рациональных корней. Поскольку deg Q4 = 3, то он неприводим над Q и, значит, группа Галуа действует транзитивно на α2, α2 и α2 3 (см. [5]). Поэтому 1 2 b1α2 + b2α2 + 0α2 = 0, i j k i для любой четной перестановки (ijk) ∈ S3. Данная линейная система относительно α2 должна иметь нетривиальное решение, что возможно только если b1 + b2 = 0. Это противоречит тому, что α2 2 1 /= α2. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 93 Итак, мы доказали гипотезу А.1 для q = 4 (случаи q = 1, 2, 3 тривиальны). Следовательно, в задаче (А.1) при q = 4 возникают семейства оптимальных траекторий с управлением в виде иррациональной всюду плотной обмотки тора, если выполняются следующие условия: некоторая пара собственных значений λ1 и λ2 матрицы C находится в отношении (А.13); соответствующие собственные подпространства V1 и V2 имеют размерность не меньше двух; значения α1 и α2 несоизмеримы над Q. В [7] получен следующий результат. Теорема А.3 (см. [7, теорема 8]). Гипотеза А.1 выполняется для всех q < 16. Также недавно Д. Д. Киселевым для всех q > 3 был доказан следующий важный результат: Теорема А.4 (Д. Д. Киселев, 2015). Для всех q > 3 найдется как минимум два линейно неза- висимых корня многочлена ImPq (α) из (А.4), удовлетворяющих условию (А.5). Таким образом, при любом q > 3 если какие-либо два собственных значения формы C находятся в соотношении (А.6), то оптимальное управление на построенной траектории движется вдоль всюду плотной иррациональной обмотки двумерного клиффордова тора и проходит ее половину за конечное время. Полное доказательство этого результата готовится к отдельной публикации. Завершим этот обзор наброском доказательства теоремы А.4 для четных q > 8. Воспользуемся идеей, которая помогла доказать гипотезу А.1 для q = 4: если квадраты двух чисел линейно независимы над Q, то и сами числа линейно независимы над Q. Обозначим αfq (α2) = ImPq (α). Иными словами, fq (x) = (-1)q-1σ1xq-1 + (-1)q-2σ3xq-2 + ... + σ2q -1. (А.14) Знаки коэффициентов полинома fq (x) чередуются, поэтому все его вещественные корни1 положи- тельны. Учитывая условие (-1)q+1ImPq (α) > 0 для четных q, получаем, что необходимо оставить только [q/2] корней fq (x), для которых выполнено соотношение 2q ) arctg s=1 √x s = (2k - 1)π, k = 1,..., [q/2]. (А.15) Лемма А.1. При любом q все коэффициенты многочлена fq (x) делятся на старший. Доказательство. Итак, надо показать, что все коэффициенты σ2k+1 делятся на σ1 = q(2q + 1). Рассмотрим многочлен Pq (α) как многочлен над кольцами2 Z/qZ и Z/(2q + 1)Z. В первом случае получаем (iα + 1) ... (iα + 2q) = -α2(iα + 1)(iα - 1) ... (iα + (q - 1))(iα - (q - 1)) = = -α2(-α2 - 12) ... (-α2 - (q - 1)2), т.е. мнимая часть исчезает, поэтому q | σ2k+1. Во втором случае получаем (iα + 1) ... (iα + 2q) = (iα + 1)(iα - 1) ... (iα + q)(iα - q) = (-α2 - 12) ... (-α2 - q2); мнимая часть опять исчезает, поэтому (2q + 1) | σ2k+1. Поскольку числа q и 2q +1 взаимно просты, то σ1 | σ2k+1. Следствие А.1. Все рациональные корни многочлена fq (x) (если таковые имеются) должны быть целыми. Теперь, обобщая идеи, использованные для доказательства гипотезы А.1 при q = 4, докажем следующую лемму. 1Многочлен fq (x) имеет только вещественные корни согласно предложению А.1. 2Точнее, над (Z/mZ)[i]/(i2 +1 = 0), где m = q, 2q + 1. 94 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Лемма А.2. Пусть f (x) ∈ Q[x] - неприводимый над Q многочлен степени m ) 2. Предпо- ложим, что все корни многочлена f (x) вещественны и одного знака. Тогда любые два корня многочлена f (x) линейно независимы над Q. Доказательство. Фиксируем произвольным образом два корня многочлена f (x) и обозначим их x1 и x2. Предположим, что имеется линейная зависимость над Q вида b1x1 + b2x2 = 0, b2 + b2 /= 0. (А.16) 1 2 В силу неприводимости многочлена f (x) над Q его группа Галуа действует на корнях транзи- тивно. Поэтому найдется такой элемент g ∈ GalQ(f ), что g(x1) = x2. Положим xk = gk-1(x1). Тогда существует такое наименьшее натуральное s, что xs+1 = x1. В таком случае получим после (s - 1)-кратного применения автоморфизма g к (А.16) систему линейных однородных алгебраиче- ских уравнений на числа x1,..., xs над полем разложения многочлена f (x) с матрицей ⎛b1 b2 0 ... 0 0 ⎞ ⎜ 0 b1 b2 ... 0 0 ⎟ X = ⎜..................... .⎟ . (А.17) ⎜ ⎟ ⎜ 0 0 0 ... b1 b2⎟ ⎝ ⎠ b2 0 0 ... 0 b1 Определитель матрицы (А.17) должен обращаться в нуль. С другой стороны непосредственное вычисление показывает, что det X = bs + (-1)s+1bs . (А.18) 1 2 Если s четно, то bs = bs , откуда либо b1 = b2, либо b1 = -b2 (мы пользуемся тем, что b1, b2 ∈ Q). 1 2 1 Если же s нечетно, то получаем bs = (-b2)s, откуда b1 = -b2. Пусть b1 = b2. Тогда из (А.16) получаем равенство x1 = -x2, которое противоречит условиям леммы. Пусть b1 = -b2. Тогда из (А.16) получаем равенство x1 = x2, которое противоречит неприводимости многочлена f (x), ибо условие неприводимости над полем нулевой характеристики влечет сепарабельность. Лемма доказана. Многочлен fq (x) имеет степень q - 1 и, согласно предложению А.1, является сепарабельным, причем все его корни вещественны и положительны. Обозначим через A множество корней fq (x), удовлетворяющих условию (А.15). Разложим многочлен fq (x) на неприводимые множители над Q. Если нашлась хотя бы одна неприводимая компонента, имеющая не менее двух корней из A, то результат следует из леммы А.2. Поэтому без ограничения общности можно считать, что каждая неприводимая компонента имеет не более одного корня из A. Согласно лемме А.1 можно заклю- чить, что если многочлен fq (x) имеет рациональные корни, то они необходимо целые. Заметим, что если хотя бы один элемент множества A является целым числом, то либо найдутся два иско- мых линейно независимых над Q элемента множества A, либо справедливо включение A ⊂ N. Но тогда x1 ∈ N. Однако, корень x1 должен быть решением уравнения (А.15) при k = 1. Поскольку arctg x ∼ x при x → 0, то при достаточно больших q выполнено √1 arctg 1 √1 + arctg 2 √1 + ... + arctg 2q > π. (А.19) На самом деле нетрудно убедиться, что данное соотношение выполнено при q > 8. Оценка (А.19) вместе с равенством (А.15) при k = 1 показывает, что x1 ∈/ N. Итак, осталось рассмотреть вариант, при котором возможно, что любые два корня из A линей- но зависимы над Q: если каждая неприводимая компонента многочлена fq (x) содержит не более одного корня из A, а каждая компонента, имеющая корень из A, не является многочленом степени 1. Рассмотрим неприводимые компоненты, содержащие по одному корню из A. Степень любой такой компоненты не меньше 2, а их количество равно [q/2]. Но так как q четно, то получаем противоречие: степень многочлена fq (x) равна q - 1; с другой стороны, она не меньше 2 · [q/2] = q. Теорема А.4 для четных q > 8 доказана. При нечетных q аргументы «принципа Дирихле» (именно, что для четных q выполнено 2[q/2] = q, а степень многочлена равна q - 1) не проходят, поэтому для доказательства теоре- мы А.4 используется аппарат полигонов Ньютона и вариации на тему постулата Бертрана. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 95 Таким образом, при всех q > 3 если в задаче (А.1) некоторые собственные значения формы C находятся в соответствующем отношении (А.6), то существуют оптимальные траектории, управле- ние на которых имеет вид иррациональной всюду плотной обмотки клиффордова тора, проходимой за конечное время. Б. БАЗОВЫЕ СВОЙСТВА МОДЕЛЬНОЙ ЗАДАЧИ С ПРАВИЛЬНЫМ ТРЕУГОЛЬНИКОМ (М. И. ЗЕЛИКИН, Н. Б. МЕЛЬНИКОВ, Р. ХИЛЬДЕБРАНД) Основные результаты о наличии хаотических структур в интегральных воронках в гамильтоно- вых системах с разрывной правой частью, изложенные в настоящей статье, опираются на ключе- вые элементы оптимального синтеза в модельной задаче, полученные в [10]. В данном приложении кратко изложены основные результаты статьи [10], к которой мы отсылаем интересующегося чи- тателя за доказательствами и более подробными изложением. Б.1. Постановка задачи. Задача Б.1. Минимизировать интегральный функционал r∞ 1 2 2 2 на траекториях системы J (x(·)) = 2 0 (x1 + x2 + x3) dt → inf (Б.1) x˙ = y, с начальными данными (x(0), y(0)) = (x0, y0). y˙ = u (Б.2) Здесь (x, y) = (x1,..., y3) ∈ R6 - вектор состояния системы, u = (u1, u2, u3) ∈ R3 - управле- ние со значениями в симплексе Ω = {u | u1 + u2 + u3 = 0, -2 ui 1}. Допустимым управлением будем считать всякую измеримую функцию u(t), а допустимой траекторией - соответствующую абсолютно непрерывную функцию (x(t), y(t)). Будем также считать, что y1 + y2 + y3 = 0, x1 + x2 + x3 = 0. Эти соотношения определяют фазовое пространство M размерности dim M = 4. Пусть (x(t), y(t)) - оптимальная траектория, отвечающая оптимальному управлению u(t). То- гда в соответствии с принципом максимума Понтрягина (см. [17]) существуют такие абсолютно непрерывные функции φ(t) и ψ(t) и число λ0 = 1 (см. теорему 2.1), что H = max H(φ, ψ, x, y, v) = H(φ, ψ, x, y, u) ≡ 0, (Б.3) v∈Ω где ψ˙ = -φ, φ˙ = x, x˙ = y, y˙ = u(t), u ∈ arg max H(v), (Б.4) v∈Ω 3 H(φ, ψ, x, y, u) = ) i=1 ( -1 2 \\ i x2 + φiyi + ψiui , φ1 + φ2 + φ3 = 0, ψ1 + ψ2 + ψ3 = 0. Определение Б.1. Экстремаль (x(t), y(t), φ(t), ψ(t)) будем называть неособой на интервале t0 t t1, если для почти всех t из этого интервала существует такой индекс k, что ψk < min{ψi, ψj | i, j /= k}. Из явного вида функции H непосредственно вытекает следующее предложение. Предложение Б.1. Управление на неособом участке траектории равно ⎧ ⎪⎨(-2, 1, 1), ψ1 < min{ψ2, ψ3}, u(t) = (1, -2, 1), ψ2 < min{ψ3, ψ1}, ⎪⎩(1, 1, -2), ψ3 < min{ψ1, ψ2}. В точках, где ψi = ψj < ψk , происходит переключение управления. Пусть i, j, k - некоторая перестановка индексов 1,2,3. 96 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Определение Б.2. Экстремаль (x(t), y(t), φ(t), ψ(t)) будем называть (ij)-особой (или полуосо- бой) на интервале t0 t t1, если ψi ≡ ψj < ψk для почти всех t из этого интервала. Дифференцируя несколько раз соотношение ψi ≡ ψj в силу системы (Б.4) немедленно получаем следующее утверждение. Предложение Б.2. Все (ij)-особые траектории принадлежат многообразию Aij = {(x, y) ∈ M | xi = xj, yi = yj }. При этом оптимальное управление на (ij)-особой траектории принимает постоянное значе- ние ui = uj = -1/2, uk = 1. Начало координат естественно называть (123)-особой траекторией с оптимальным управлением u(t) ≡ 0. Группу G = {gλ, λ > 0 } преобразований пространства M , действующую по формулам gλ(x, y) = (λ2x, λy), будем называть группой Фуллера. Обозначим фактор-пространство (M \\ {0})/G через Σ3. Эта симметрия была найдена А. Фуллером [20] в системах с одномерным управлением. Как отмечено в пункте 2.2, данная группа симметрий уважает оптимальный синтез задачи. Предложение Б.3. Оптимальное управление как функция от x, y инвариантно относитель- но действия G. Орбитами группы G являются кривые, проекциями которых на плоскости xi, yi служат полу- параболы x = Cy2. При этом точки переключения оптимальных траекторий переходят в точки переключения оптимальных траекторий, и поверхности переключения состоят из орбит группы. Кроме непрерывной группы симметрий G, на траекториях системы (Б.2) действует также дис- кретная группа перестановок индексов координат S3. Предложение Б.4. Оптимальный синтез в задаче Б.1 является инвариантным относитель- но действия группы перестановок S3. Определение Б.3. Решение (x(t), y(t)) задачи Б.1 будем называть автомодельным, если дей- ствие некоторой дискретной циклической подгруппы группы G переводит его в себя. Б.2. Оптимальный синтез в окрестности Aij . Исследование оптимального синтеза задачи Б.1 удобно начинать с построения синтеза на подпространствах Aij и в их окрестностях. Возможность явного построения здесь основана на двух ключевых соображениях: ограничение задачи Б.1 на подпространство Aij совпадает с задачей Фуллера с несиммет- ричным отрезком управлений, и потому оптимальный синтез на Aij может быть построен полностью; оптимальные траектории на Aij содержат полуособые участки, в окрестности которых опти- мальный синтез также может быть построен явно с помощью некоторой специальной замены координат, описанной в [30]. Б.2.1. Оптимальный синтез на подпространствах Aij . Согласно предложению Б.2, (ij)-особые режимы могут лежать только на подмногообразиях Aij , задаваемых уравнениями xi = xj, yi = yj . Эти многообразия являются двумерными подпространствами четырехмерного фазового простран- ства M и попарно пересекаются в начале координат. Исследуем оптимальный синтез на этих подпространствах. Отметим, что Aij является множеством неподвижных точек пространства M относительно транспозиции (ij) из группы S3 перестановок индексов координат. Более того, из леммы 2.8 следует, что подпространства Aij являются интегральными многообразиями оптималь- ного синтеза задачи Б.1: Лемма Б.1. Пусть (x(t), y(t), u(t)) - решение задачи Б.1 и (x0, y0) = (x(0), y(0)) ∈ Aij . Тогда для всех t ) 0 имеем (x(t), y(t)) ∈ Aij . ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 97 Эта лемма позволяет понизить размерность задачи нахождения оптимального синтеза на мно- гообразиях Aij . Обозначим третий индекс (отличный от i, j) через k. Тогда плоскость Aij пара- метризуется координатами xk, yk , а остальные координаты выражаются через них по формулам xi = xj = - 1 xk , yi = yj = - 1 yk . Уравнения системы (Б.2) приводятся к виду 2 2 x˙ k = yk, y˙k = uk, а минимизируемый функционал (Б.1) - к виду r∞ r∞ 1 2 2 2 3 2 J (x(·)) = 2 0 (xi + xj + xk ) dt = 4 0 xk dt. Эта задача есть несимметрическая задача Фуллера на плоскости xk , yk с управлением uk из интервала [-2, 1]. Такие задачи были полностью исследованы в [30]. Приведем описание синтеза для этого типа задач. Задача Б.2 (несимметрическая задача Фуллера). Минимизировать интегральный функционал r∞ на траекториях системы 1 J (x(·)) = 2 0 x2 dt → inf x˙ = y, y˙ = u, u ∈ [a, b] с начальными данными (x(0), y(0)) = (x0, y0) ∈ R2 при условии 0 ∈ (a, b) (здесь координаты x, y предполагаются одномерными). Предложение Б.5. Оптимальный синтез в за- даче Б.2 имеет следующий вид. Имеется кри- вая переключения с u = b на u = a, задаваемая уравнением x = αy2, y ) 0, где α ∈ 1 , 0 , и 2a . кривая переключения с u = a на u = b, задавае- мая уравнением x = βy2, y 0, где β ∈ 0, 1 2b Эти кривые разделяют фазовое пространство на две области, где применяются управления u = a и u = b соответственно (см. рис. 23). В задаче имеет место чаттеринг-режим, т.е. оптимальные траектории совершают счетное количество переходов из области, где u = a, в область, где u = b, и обратно, но все же за конечное время приходят в начало координат. Начало координат представляет собой особый режим второго порядка. Рис. 23. Оптимальный синтез в задаче Фуллера Дополним результаты [30] точными формулами для функции Беллмана и сопряженных пере- менных. Обозначим через B[a,b](x, y) функцию Беллмана1 задачи Б.2: ⎧ ⎨ 1 B[a,b](x, y) = inf ⎩ 2 ∞ ⎫ r x2(t) dt x = x(0), y = y(0)⎬ . 0 ⎭ Предложение Б.6 (см. [10, предложение 3.2]). Постоянные α и β однозначно находятся из двух уравнений (при u = a и u = b): Ku = 3 u2α2 - 2uα + 2 10u3 (1 - 2uα)3/2 3 - u2β2 2uβ + 2 = -10u3 (1 - 2uβ)3/2 . (Б.5) 1В статье [10] вместо функции B[a,b] использована функция ω[a,b] = - B[a,b]. 98 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Функция Беллмана в областях, где u = a и u = b, задается выражением 1 2 1 3 1 5 2 5 B[a,b](x, y) = - 2ux y + 3u2 xy - 15u3 y + Ku(y - 2ux) 2 . (Б.6) Функция Беллмана связана с сопряженными переменными уравнениями ∂ B[a,b] = ∂x B[a,b] ∂ - - φ, = ψ. (Б.7) ∂y Дифференцируя (Б.6) по x и y и подставляя в (Б.7), получаем для сопряженных переменных 1 φ = uxy - 1 3u2 y3 + 5uKu(y2 - 2ux)3/2, (Б.8) - ψ = 1 x2 2u 1 xy2 + u2 1 3u3 y4 - 5Ku(y2 - 2ux)3/2y. 2a Легко проверить, что уравнения (Б.5) имеют в интервале α ∈ 1 , 0 0, 2b , β ∈ 1 в точности одно решение. В частности, для значений a = -2, b = 1 получаем α ≈ -0,2225502019, β ≈ 0,4444824223. (Б.9) Таким образом, мы установили следующий вид оптимального синтеза на подмногообразиях Aij . Теорема Б.1 (см. [10, теорема 1]). Оптимальный синтез задачи Б.1, ограниченный на под- многообразие Aij , в точности совпадает с синтезом несимметрической задачи Фуллера с интервалом допустимых управлений [-2, 1]. Каждое из многообразий Aij делится на две области, разделяемые кривыми переключения xk = αy2, xk = βy2. В одной области, которую мы обозначим через An , применяются управления k k ij ij (uk = -2, ui = uj = 1), а в другой, которую обозначим через As , применяются управления uk = 1, ui = uj = - An ij - неособыми. . Таким образом, область As 1 2 ij заполнена (ij)-особыми траекториями, а ij ij Б.2.2. Оптимальный синтез в окрестности As . Для исследования поведения системы в окрестности особых траекторий М. И. Зеликин и В. Ф. Борисов разработали метод, изложенный в [30]. Используя эти результаты, мы исследуем оптимальный синтез в окрестности областей As . Заметим, что вместе с синтезом на Aij мы построили поднятия подмногообразий Aij из фазо- вого пространства M в расширенное фазовое пространство T ∗M , определив на них сопряженные переменные как функции от xk, yk . При этом синтез несимметрической задачи Фуллера определя- ет φk , ψk как функции от xk , yk , а остальные сопряженные переменные выражаются через xk , yk в силу условий φi = φj , ψi = ψj формулами φi = φj = - 1 φk , ψi = ψj = - 1 ψk . Рассмотрим точку 2 2 ij в области As . В окрестности поднятия этой точки в T ∗M проведем согласно [30] следующую замену координат: 1 1 1 1 z1 = - 3 (ψj - ψi), z2 = 3 (φj - φi), z3 = 3 (xj - xi), z4 = 3 (yj - yi), w1 = -ψk, w2 = φk, w3 = xk, w4 = yk. Переменные z, w с индексами 3, 4 параметризуют пространство M . Многообразие Aij задается уравнениями z3 = z4 = 0 и параметризуется переменными w3, w4. Переменные z1, z2, рассматри- ваемые как функции от координат пространства M , также равны нулю на Aij . Система (Б.4) в координатах z, w примет вид: ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 99 w˙ l = wl+1, l = 1, 2, 3, 1, w1 < |z1|, w˙ 4 = -2, w1 > |z1|, (Б.10) z˙l = zl+1, l = 1, 2, 3, sgn z1, w1 < |z1|, z˙4 = 0, w1 > |z1|. ij Область As характеризуется неравенством w1 < 0, поэтому в рассматриваемой окрестности имеем w1 < |z1|. В ней применима теорема Зеликина-Борисова о расслоении [30], согласно которой имеij ем следующую картину. В окрестности области As ij в M имеем некоторое расслоение Πij → As с ij базой As и двумерными слоями F ij w , являющимися интегральными многообразиями оптимального ij синтеза задачи Б.1. База As ij расслоения Πij параметризована переменными w3, w4, а слои Fw - переменными z3, z4. На каждом из этих слоев синтез эквивалентен синтезу симметрической за- дачи Фуллера с интервалом допустимых управлений [-1, 1]. Оптимальные траектории выходят на ij базу As ij с чаттерингом по слою Fw и дальше движутсяпо Aij . Существует поднятие пространства расслоения Πij из M в T ∗M , которое является (локальным) лагранжевым сечением кокасательij ного расслоения T ∗M над M . Другими словами, в окрестности области As в M сопряженные переменные φ, ψ задаются как функции от x, y. ij В рассматриваемом случае переменные zl в окрестности As эволюционируют независимо от переменных wl. При выполнении неравенства w1 < |z1| уравнения (Б.10), которым подчиняются zl, представляют собой в точности гамильтонову систему, возникающую в симметрической задаче ij Фуллера с интервалом допустимых управлений [-1, 1]. Поэтому синтез на слоях Fw расслоения Πij не только эквивалентен, но и в точности совпадает с синтезом в этой задаче. Этот синтез подробно исследован в [30]. Он имеет вид, описанный в предложении Б.5, где α и β принимают значения 1 / √ -α = β = 12 6 33 - 6, а переменные задачи Б.2 выражаются через zl по формулам y = z4, x = z3, φ = z2, ψ = -z1. ij Предложение Б.7 (см. [10, предложение 3.3]). В окрестности области As существует гиперповерхность переключения с управления (ui = -2, uj = uk = 1) на управление (ui = 1, uj = -2, uk = 1), задаваемая уравнением 1 / √ 2 xj - xi = - 36 6 33 - 6(yj - yi) , yj > yi, (Б.11) и гиперповерхность переключения с управления (ui = 1, uj = -2, uk = 1) на управление (ui = -2, uj = uk = 1), задаваемая уравнением 1 / √ 2 xj - xi = 36 6 33 - 6(yj - yi) , yj < yi. (Б.12) Доказательство. В задаче Фуллера поверхности переключения задаются уравнениями 1 / √ 2 1 / √ 2 z3 = - 12 6 33 - 6 z4 , z4 < 0 и z3 = 12 6 33 - 6 z4 , z4 > 0. Переходя в старую систему координат, получаем требуемое утверждение. Формулы (Б.8) задают уравнение лагранжева сечения кокасательного расслоения в T ∗M . Вы- ражая z1, z2, w1, w2 как функции координат фазового пространства M , имеем: 100 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД ⎧ z ⎪ 1 2 ⎪ 2 1 4 √33+15 24 - / 1 √ 6 ( 33 - 1) 2 3/2 ⎪ ⎪ ⎪⎨ z1 = 2 3 + z3z4 + 3 z4 - ( 2 1 - / 1 √ 6 ( 33 - 1) (z4 + 2z3) \\3/2 z4, z1 > 0, ⎪ 1 1 √ 33+15 / 1 √ - 3 4 ⎪ z2 + z3z2 - z 4 24 - - 6 ( 33 - 1) (z2 - 2z3)3/2z4, z1 < 0, 1 - 1 (√33 - 1) ⎪ ⎪ 2 3 4 ⎪⎩ ( / 2 6 \\3/2 4 ⎧ ⎪ ⎪ -z3z4 - ⎪ 3 1 z4 + √33+15 24 - / 1 √ 6 ( 33 - 1) (z2 \\3/2 4 + 2z3) 3/2 , z1 > 0, ⎪ ⎪⎨ z2 = 3 ( 2 1 - / 1 √ 6 ( 33 - 1) (Б.13) ⎪ 2 ⎪ ⎪ z3z4 - 3 1 z4 - √ 33+15 24 - / 1 √ 6 ( 33 - 1) 2 3/2 (z4 - 2z3) , z1 < 0, 1 - 1 (√33 - 1) ⎪ 3 ( / 2 ⎩⎪ 6 \\3/2 1 2 2 1 4 3 β2 - 2β + 2 2 3/2 4 - 3 - w1 = - 2 w3 + w3w4 - 3 w4 - 2(1 (w 2w ) 2β)3/2 w4, 3 1 3 β2 - 2β + 2 2 3/2 4 - 3 - w2 = w3w4 - 3 w4 - 2(1 (w 2w ) . 2β)3/2 ij Постоянная β здесь находится из уравнений (Б.5) для интервала допустимых управлений [a, b] = [-2, 1] и принимает значение (Б.9). Все приведенные утверждения верны только в окрестности области As , состоящей из отрезков траекторий, на которых выполнено неравенство w1 < |z1|. As Формулы (Б.13) использованы в разделе 4 для построения лагранжева многообразия в окрестности ij на фактор-пространстве M/G. Гиперповерхность w1(w3, w4) = z1(z3, z4) (Б.14) является поверхностью переключения с управления (ui = uj = 1, uk = -2) на управление (ui = -2, uj = uk = 1) или (ui = 1, uj = -2, uk = 1). ij Б.2.3. Уравнение слоя. Займемся теперь выводом уравнения слоя Fw расслоения Зеликина- Борисова Πij . Обозначим через τ (z(0), z(0)) время, за которое оптимальная траектория в симмет- 3 4 рической задаче Фуллера с интервалом допустимых управлений [a, b] = [-1, 1] из начальной точки (z3(0), z4(0)) = (z(0), z(0)) ∈ R2 достигает начала координат (z3(τ ), z4(τ )) = (0, 0). 3 4 ij Предложение Б.8 (см. [10, предложение 3.4]). Пересечениями слоев Fw расслоения Πij с уровнями {w3 = const, w4 = const} являются линии уровня функции τ (z3, z4). Следующий результат был получен Маршалом в [28]. Предложение Б.9. Для симметрической задачи Фуллера с интервалом допустимых управ- лений [-1, 1] время τ перехода из начальной точки (x, y) в начало координат равно ⎧ 2 2 y - 2x ⎪ ⎪ - y, u(x, y) = 1, ⎪ ⎪⎨ τ (x, y) = / 1 √ 1+ 6 ( 33 - 1) - / 1 √ 1 - 6 ( 33 - 1) ⎪ 2 y2 + 2x ⎪ + y, u(x, y) = -1. ⎩ ⎪⎪ 1+ / 1 √ 6 ( 33 - 1) - / 1 √ 1 - 6 ( 33 - 1) ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 101 Таким образом, линии уровня функции τ (z3, z4) образуют центрально-симметрические концентрические замкнутые кривые, составлен- ные из двух кусков парабол. На рис. 24 изобра- жены линии уровня τ = 1, 2, 3. ij ij Рассмотрим участок траектории σ на подпро- странстве Aij , проходящий через область As , и параметризуем его временем t. Пусть p1 - точка переключения с управления uk = -2 на uk = 1, через которую траектория σ входит в область As , ij а p2 - точка переключения с uk = 1 на uk = -2, через которую σ покидает As . Таким образом, ij t(p2) > t(p1), и для всех точек p траектории σ, лежащих в As , имеем t(p) ∈ (t(p1), t(p2)). Рис. 24. Уровни функции τ (z3, z4) Зафиксируем точку p ∈ σ ∩ As с координатами w(0), w(0) и рассмотрим двумерный уровень (0) ij 3 4 (0) ij s = {w3 = w3 , w4 = w4 } в M . Множество s пересекается со слоями Fw над всеми точками p± ∈ σ, для которых t(p±) ) t(p). Пересечением является линия уровня τ (z3, z4) = t(p±) - t(p) функции τ . При этом, если p±, p±± ∈ σ - две такие точки, что t(p±±) > t(p±) > t(p), то линия уровня τ = t(p±) - t(p) более близка к центру (z3, z4) = (0, 0), чем линия уровня τ = t(p±±) - t(p), и лежит внутри последней. ij Зафиксируем точку p± и рассмотрим, как будет меняться пересечение слоя Fw над p± с уровнем s, ij если варьировать точку p, над которой взят уровень s. По мере того, как p приближается к p± и разница t(p±) - t(p) уменьшается, линия уровня τ = t(p±) - t(p) стягивается к центру и при p = p± вырождается в точку. Таким образом, слой Fw над p± представляет собой конусообразную поверхность с вершиной p±. ij Рассмотрим, как ведет себя система (Б.10) в окрестностях точек p1 и p2. В точке p1 имеют место соотношения w1 = z1 = 0, z˙1 = 0, w˙ 1 < 0. Поэтому p1 лежит на поверхности (Б.14), и любая траектория, приходящая в p1, приходит из области w1 > |z1|. Следовательно, переменные zl не подчиняются уравнениям гамильтоновой системы симметрической задачи Фуллера, и расслоение Зеликина-Борисова не продолжается на p1. В эту точку приходит в точности одна неособая траектория, а именно, траектория σ, лежащая на Aij . В точке p2 также выполняется равенство w1 = z1 = 0, но w˙ 1 > 0. Поэтому на траекториях, приходящих в p2, в окрестности p2 для t< t(p2) имеет место неравенство w1 < |z1|. Следовательно, расслоение Πij можно продолжить на p2, и слой Fw над p2 также является двумерной поверхностью. Б.2.4. Оптимальный синтез в окрестности An . На слоях Fw расслоения Πij используются ij ij ij только управления (ui = uk = 1, uj = -2) и (ui = -2, uj = uk = 1), а на базе As - особое управ- 1 ление ui = uj = - 2 , uk = 1 . Все эти управления лежат на одномерной грани двумерного симплекса допустимых управлений, которая задается соотношением uk = 1. Управление (ui = uj = 1, uk = -2), соответствующее третьей вершине симплекса допустимых управлений, применяется в области w1 > |z1|. Граница этой области задается уравнением (Б.14). ij ij Рассмотрим отображение E, переводящее (x, y) на оптимальной траектории в соответствую- щие сопряженные ковекторы (φ, ψ) (отображение E построено в теореме 2.1). Это отображение непрерывно (и даже локально липшицево), поэтому оптимальное управление в окрестности An устроено так же, как и на An . Действительно, неравенство ψk < min(ψi, ψj ) является грубым и не нарушается при малом шевелении ковектора ψ. В [10] доказана следующая теорема о структуре оптимального синтеза в окрестности Aij . ij Теорема Б.2 (см. [10, теорема 2]). В окрестности области As интегрального многообразия ij Aij имеем расслоение Πij с базой As ij и двумерными слоями Fw , являющимися интегральными ij многообразиями оптимального синтеза задачи Б.1. На слоях Fw используются управления 102 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД ij (ui = uk = 1, uj = -2) и (ui = -2, uj = uk = 1). Траектории, лежащие на слое Fw , с чаттерингij режимом входят в соответствующую точку на базе As и дальше движутся по Aij . Точку p2 можно включить в базу расслоения Πij . ij ij Каждый из слоев Fw над точками σ гомеоморфен поверхности конуса; слой окружает кри- вую σ, и его вершина лежит на ней. Любая траектория, лежащая на одном из слоев Fw , имеет точку пересечения с гиперповерхностью (Б.14). В окрестности p1 эти точки пере- сечения образуют двумерное многообразие переключения T , содержащее p1. В окрестности точки p0 имеется двумерное многообразие переключения T ±, содержащее p0. Неособый от- резок траектории σ, соединяющий точки p0 и p1, погружен в поток неособых траекторий, сохраняющих управление (ui = uj = 1, uk = -2) между поверхностями переключения T и T ±. Б.3. Элементы оптимального синтеза на фактор-многообразии. Ниже мы покажем, что на фактор-многообразии {M \\ {0}}/G = Σ3, гомеоморфном сфере S3, имеется картина, сходная с той, что описана в теореме Б.2. В силу предложения Б.3 на Σ3 определен синтез, т.е. управление является функцией на Σ3. На Σ3 имеется поле направлений, индуцированное векторным полем оптимального синтеза за- дачи Б.1. Это означает, что векторное поле на Σ3 определено с точностью до умножения на положительные скалярные функции. Свойства полей направления на фактор-многообразиях по группе Фуллера были исследованы в работах М. И. Зеликина и В. Ф. Борисова [30]. Известно, что образ автомодельной траектории задачи Б.1 на фактор-многообразии является либо замкнутой траекторией, либо неподвижной точкой. Начало координат в задаче Б.1 является особой траекторией второго порядка, поэтому из теоре- мы о сопряжении (см., например, [8]) следует, что оптимальное управление должно иметь разрыв второго рода в момент выхода оптимальной траектории в начало координат. Поэтому справедливо следующее утверждение. Предложение Б.10. Поле направлений на фактор-многообразии Σ3 не имеет особенностей типа неподвижных точек. Так как подпространство Aij состоит из автомодельных траекторий, его образ на фактор- многообразии Σ3 является циклом. Обозначим этот цикл через A˜ij . На нем имеются две точки переключения, соответствующие кривым переключения на Aij , поэтому мы будем называть циклы A˜ij двузвенными. Точки переключения разделяют цикл A˜ij на две дуги, которые являются обраij и A ij зами областей An s ij соответственно. Обозначим эти дуги через A˜n ij и A˜s . Точку переключения с A ij ij ˜n на A˜s ij обозначим через p˜1, а точку переключения с A˜s ij на A˜n - через p˜2. Точка p˜1 является образом точки p1, а p˜2 - образом точек p0 и p2 при проекции M на фактор-многообразие Σ3. Проекция расслоения Πij коммутирует с действием элементов группы G. Поэтому расслоение ij Πij индуцирует на Σ3 расслоение Π˜ ij → A˜s ij с базой A˜s ij и двумерными слоями F˜w , являющимися интегральными многообразиями поля направлений на Σ3. Особый отрезок некоторой траектории ij A ij o ⊂ Aij , проходящий через As , является поднятием дуги ˜s из Σ3 в M . Поэтому топология расслоения Π˜ ij соответствует описанной в теореме Б.2 топологии расслоения Πij , ограниченного на одну выделенную (ij)-особую траекторию σ. Обозначим образы поверхностей T и T ± на фактор- T многообразии Σ3 через ˜ T ± и ˜ . Справедлив следующий аналог теоремы Б.2. ij Предложение Б.11 (см. [10, предложение 4.3]). В окрестности дуги A˜s имеется расслоение ij Π˜ ij с базой A˜s ij и двумерными слоями F˜w , являющимися интегральными многообразиями поля ij направлений на Σ3. На слоях F˜w используются управления (ui = uk = 1, uj = -2), (ui = -2, uj = uk = 1). Траектории, лежащие на слое F˜w , с бесконечным числом переключений входят A ij в соответствующую точку на базе ˜s включить в базу расслоения Π˜ ij . ij и дальше движутся по циклу A˜ij . Точку p˜2 можно ij Каждый из слоев F˜w ij расслоения Π˜ ij над A˜s гомеоморфен поверхности конуса, «осью» которого служит A˜s . Любая траектория, лежащая на одном из слоев F˜w , имеет точку пересеij ij чения с образом гиперповерхности переключения (Б.14). В окрестности точки p˜1 эти точки ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 103 Рис. 25. Окрестность цикла A˜ij на Σ3 T пересечения образуют двумерное многообразие переключения ˜ , содержащее p˜1. В окрестно- T ± A сти точки p2 имеется двумерное многообразие переключения ˜ , содержащее ij p˜2. Дуга ˜n погружена в поток неособых траекторий, сохраняющих управление (ui = uj = 1, uk = -2) T между поверхностями переключения ˜ T ± и ˜ . ij Обозначим слой F˜w ij расслоения Π˜ ij над точкой p˜2 через F˜p˜2 . Цикл A˜ij в точке p˜2 пересекает T ± две поверхности ˜ ij и F˜p˜2 , соприкасающиеся в p˜2. На рис. 25 изображена окрестность цикла A˜ij . T Цикл пересекает поверхности ˜ ˜ и T ± в точках p˜1 и p˜2. Изображен слой F ˜p˜2 ij над точкой p˜2, по которому чаттеринг-траектории приходят в p˜2. Завершим исследование синтеза в окрестности цикла A˜ij его характеризацией в пространстве T ± между поверхностями ˜ ij и F˜p˜2 . T ± Проследим поток траекторий, проходящий через ˜ , дальше в обратном направлении времени. Согласно предложению Б.11 через точку p˜2 проходит не только цикл A˜ij , но в нее приходят и траектории со слоя F˜p˜2 . Через любую другую точку поверхности ˜ проходит в точности одна ij T ± траектория. T ± Предложение Б.12 (см. [10, предложение 4.4]). Поток траекторий, проходящих через ˜ , в T ± окрестности точки p˜2 заполняет все пространство между поверхностями ˜ ij и F˜p˜2 . Сопряженные переменные непрерывны в окрестности любой точки p2 ∈ M , являющейся поднятием точки p˜2. Следствие Б.1. Область притяжения цикла является окрестностью цикла A˜ij . A˜ij в Σ3 содержит полноторие P, которое и ˜ Доказательство. Действительно, синтез построен на самом цикле A˜ij , в пространстве расслоения T Π˜ ij , на потоке неособых траекторий между поверхностями ˜ T ± и в окрестности точки p˜2. Объединение этих областей является окрестностью цикла A˜ij , содержащейся в области притяжения цикла рию. A˜ij . Она содержит открытую окрестность цикла A˜ij , гомеоморфную открытому полното- Полноторие P из следствия Б.1 можно выбрать так, чтобы все траектории, проходящие через точки его границы ∂P, пересекали границу ∂P трансверсально снаружи внутрь. Отсюда следует утверждение о топологии области притяжения Aij цикла A˜ij в Σ3. Предложение Б.13 (см. [10, предложение 4.6]). Области притяжения Aij циклов гомеоморфны открытым полноториям. A˜ij в Σ3 G Б.4. Периодические траектории вне областей притяжения. В [10] на основе идей, изложен- ных в п. 2.7, получены три ключевых типа периодических траекторий на фактор-пространстве Σ7 = (T ∗M \\ {0})/ ˜ (см. лемму 2.10). 104 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Теорема Б.3 (см. [10, теоремы 3-5]). Поле направлений, индуцированное системой (Б.4), определяет на фактор-многообразии Σ7 два трехзвенных цикла B˜ijk и B˜jik , каждый из которых соответствует однопара- метрическому семейству оптимальных траекторий в M . На этих траекториях после- довательно используются управления, лежащие в каждой из трех вершин симплекса Ω. При этом управления чередуются в порядке, соответствующем индексации, т.е. на од- ном из циклов вершины чередуются в одном порядке, а на другом - в противоположном. Оба цикла инвариантны относительно четных перестановок из группы симметрий S3. Нечетные перестановки переводят циклы друг в друга. При этом на оптимальных тра- екториях имеет место чаттеринг-режим, т.е. фазовая точка приходит в начало коор- динат за конечное время с бесконечным числом переключений управления. На фактор-многообразии Σ7 существуют три четырехзвенных цикла Q˜ikjk , Q˜ijkj , Q˜jiki, на каждом из которых совершается четыре переключения управления за период цикла. При этом управления чередуются в порядке, соответствующем индексации; в част- ности, в любом из циклов участвуют все вершины симплекса управлений. Цикл Q˜ikjk инвариантен относительно нечетной перестановки (ij), цикл Q˜ijkj - относительно (ik), а цикл Q˜jiki - относительно (jk). Четные перестановки переводят циклы друг в друга. Каждый из этих циклов соответствует однопараметрическому семейству оптимальных траекторий на многообразии M . При этом на этих оптимальных траекториях имеет место чаттеринг-режим, т.е. фазовая точка приходит в начало координат за конечное время с бесконечным числом переключений управления. На фактор-многообразии Σ7 существуют два шестизвенных цикла R˜ijkijk , R˜jikjik , на каждом из которых совершается шесть переключений управления за период цикла. При этом управления чередуются в порядке, соответствующем индексации, в частности, в любом из циклов участвуют все вершины симплекса управлений. Цикл R˜ijkijk инвариантен относительно четной перестановки (ikj), цикл R˜jikjik - относительно (jki). Нечетные перестановки переводят циклы друг в друга. Каждый из этих циклов соответствует однопараметрическому семейству оптимальных траекторий на многообра- зии M . При этом на этих оптимальных траекториях имеет место чаттеринг-режим, т.е. фазовая точка приходит в начало координат за конечное время с бесконечным чис- лом переключений управления. Важно отметить, что к периодическим траекториям может быть применена теорема Гробмана- Хартмана для отыскания устойчивых и неустойчивых многообразий этих траекторий. Примене- ние теоремы Гробмана-Хартмана осложняется необходимостью вычисления собственных значений дифференциала отображения последования Пуанкаре Φ˜ поверхности переключения на себя в точках периодической траектории. В [10] эти значения вычислены для всех трех найденных семейств автомодельных траекторий. Теорема Б.4 (см. [10, теорема 6 и утверждения 6.3-6.5]). В точках переключения двух трехзвенных циклов B˜ из п. 1 теоремы Б.3 все собственные значения дифференциала отображения α-1 ◦ Φ˜ вещественны, попарно отличны друг от друга и по абсолютной величине строго больше единицы, где α - четная перестановка, соответствующая данному циклу. Два собственных значения имеют вид λ-4 ≈ 51,2106 и λ-5 ≈ 136,993. Здесь 7 ( 1 λ = cos arctg 1 \\ 7 √ - cos2 ( 1 arctg 1 \\ √ - 1 ≈ 0,373817876 3 3 3 3 3 3 3 3 есть коэффициент сжатия траектории, отвечающей трехзвенному циклу, после одного переключения. Остальные собственные числа разбиты на пары. Вычисление дает сле- дующие значения для этих пар: (≈ -129,573; ≈ -1,05726) и (≈ -24,733; ≈ -5,53889). Их произведение в каждой паре равно λ-5. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 105 Точки переключения трех четырехзвенных циклов Q˜ из п. 2 теоремы Б.3 являются ги- перболическими неподвижными точками отображения α-1 ◦ Φ˜ 2, где α - нечетная пере- становка, соответствующая данному циклу. Более точно, все собственные значения дифференциала этого отображения вещественны, попарно различны, в точности од- но из них по модулю строго меньше 1, а все другие - строго больше. Два собствен- ных значения имеют вид λ-4 ≈ 593,6238 и λ-5 ≈ 2930,1611. Здесь λ ≈ 0,20259194 - число, на которое сжимается траектория, отвечающая четырехзвенному циклу, после двух переключений. Остальные собственные числа разбиты на пары (вычисление дает (≈ -0,3582464; ≈ -8179,2022), (≈ -312,78875; ≈ -9,367823)), и их произведение в каждой паре равно λ-5. Точки переключения двух шестизвенных циклов R˜ из п. 3 теоремы Б.3 являются гиперболическими неподвижными точками отображения α-1 ◦ Φ˜ 2, где α - четная перестановка, соответствующая данному циклу. Более точно, все собственные значения дифференци- ала этого отображения вещественны, попарно различны, в точности одно из них по мо- дулю строго меньше 1, а все другие - строго больше. Два собственных значения имеют вид λ-4 ≈ 1982,838 и λ-5 ≈ 13231,50. Здесь λ ≈ 0,14985738 - число, на которое сжимает- ся траектория, отвечающая шестизвенному циклу, после двух переключений. Осталь- ные собственные числа разбиты на пары (вычисление дает (≈ 0,789381; ≈ 16761,72), (≈ 520,5791; ≈ 25,4169)), и их произведение в каждой паре равно λ-5. C помощью теоремы Гробмана-Хартмана немедленно получаем следующее утверждение. Следствие Б.2 (см. [10, следствие 5.1]). Каждый из циклов Q˜ из п. 2 теоремы Б.3 погружен в двумерное интегральное многообразие поля направлений на Σ7. Эти многообразия гомеоморф- ны произведению S1 × R. Траектории на этих многообразиях асимптотически приближаются к соответствующему четырехзвенному циклу. Им соответствуют трехмерные интеграль- ные многообразия оптимального синтеза в M . Аналогичное утверждение верно и для шестизвенных циклов R˜ из п. 3 теоремы Б.3. В [10] вычислены коэффициенты попарного зацепления найденных периодических траекторий. Предложение Б.14 (см. [10, предложение 5.3]). Попарные коэффициенты зацепления вось- ми циклов в Σ3, найденных в предложении Б.2 и пп. 1 и 2 теоремы Б.3, при подходящем выборе ориентации на Σ3 равны единице. Индекс зацепления любого шестизвенного цикла с любым двузвенным или четырехзвенным циклом равен 2. Индекс зацепления циклов R˜ijkijk и B˜ijk равен 1, также как и индекс зацепления циклов R˜jikjik и B˜jik . Индекс зацепления циклов R˜ijkijk и B˜jik равен 2, также как и индекс зацепления циклов R˜jikjik и B˜ijk . Индекс зацепления двух шестизвенных циклов равен 4. Справедливо следующее очевидное предложение. Предложение Б.15 (см. [10, предложение 5.4]). Трехзвенные, четырехзвенные и шестизвен- ные циклы не могут принадлежать ни одной из областей притяжения Aij циклов A˜ij . В. ГАМИЛЬТОНОВОСТЬ ПОТОКА ОСОБЫХ ТРАЕКТОРИЙ (Л. В. ЛОКУЦИЕВСКИЙ) Принцип максимума Понтрягина сводит задачи оптимального управления к изучению гамиль- тоновых систем обыкновенных дифференциальных уравнений с разрывной правой частью. Оп- тимальный синтез - это совокупность решений этой системы с фиксированным конечным (или начальным) условием, однозначно покрывающих некоторую область фазового пространства. Опре- деляющую роль при построении оптимального синтеза играют особые траектории - траектории, идущие вдоль поверхности разрыва правой части гамильтоновой системы. Основной характери- стикой особой траектории является ее порядок. Однако в определении порядка исторически при- сутствует некоторая путаница, а существующие различные определения порядка не всегда удобно использовать. В данном приложении построено новое определение порядка, призванное компенси- ровать недостатки классических определений. В терминах нового определения получена теорема 106 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД o том, что особые траектории образуют гладкий гамильтонов поток на некотором подмногооб- разии поверхности разрыва правой части принципа максимума Понтрягина. В качестве примера исследован поток особых траекторий в задаче управления намагниченным волчком Лагранжа в контролируемом магнитном поле. Поток особых траекторий в этой задаче является вполне инте- грируемым по Лиувиллю и включается в поток некоторой суперинтегрируемой гладкой гамиль- тоновой системы в объемлющем пространстве. Подробное изложение большинства результатов (с доказательствами) можно найти в [13]. В.1. Введение. Хорошо известно, что принцип максимума Понтрягина сводит решение задач оптимального управления к нахождению решений гамильтоновой системы обыкновенных диффе- ренциальных уравнений. Гамильтониан H этой системы часто является негладким, и правая часть системы терпит разрыв на некотором стратифицированном многообразии N . В гл. 6 настоящей работы исследовались хаотические структуры в интегральных воронках точек, лежащих на стыке трех гиперповерхностей N . В данном приложении исследована динамика траекторий в окрестности одной страты N коразмерности 1. Пусть N1 - страта N коразмерности 1. Нетрудно показать, что в силу гамильтоновости пре- дел поля скоростей системы ξ может иметь на N1 лишь тангенциальный скачок. Большинство траекторий системы пересекает N1 трансверсально, однако, в некоторых точках предел поля ξ с обеих сторон от N1 становится касательным к N1. В этом случае возникают траектории системы, целиком лежащие в N1. Их принято называть особыми. В основе исследования геометрических свойств гладкой системы обыкновенных дифференци- альных уравнений лежит изучение особых точек и предельных циклов системы. Аналогично, особые траектории гамильтоновой системы с разрывной правой частью обычно играют ключевую роль при построении полного фазового портрета. Во-первых, их сравнительно нетрудно находить с помощью дифференцирования гамильтониана принципа максимума Понтрягина. Во-вторых, осо- бые траектории определяют строение поля неособых траекторий в своей окрестности. В огромном спектре задач удается доказать так называемую «теорему о магистрали», т.е. показать, что любая оптимальная траектория за конечное время выходит на особую траекторию1, и далее оптимальное движение продолжается вдоль особой траектории (см. [6]). Достаточно много работ посвящено изучению оптимальности особых траекторий. Известны как необходимые условия (см. [1, 22, 23]), так и достаточные условия (см. [3]) второго порядка. Наи- более употребимую форму эти условия принимают в задачах субримановой геометрии (см. [4]). В данном приложении проведено исследование не свойств одной отдельно взятой особой траек- тории, но изучение потока всех особых траекторий системы в целом. Доказана теорема о том, что множество всех особых траекторий образует симплектическое подмногообразие S, а их поток на S является гамильтоновым относительно ограничения H на S. В качестве приложения этой теоре- мы в п. В.8 исследована задача оптимального управления намагниченным волчком Лагранжа в контролируемом магнитном поле. С помощью разработанной техники показано, что поток особых траекторий в этой задаче является вполне интегрируемым по Лиувиллю на S и включается в поток некоторой суперинтегрируемой гладкой гамильтоновой системы в объемлющем пространстве. С понятием особой траектории тесно связано понятие порядка, в некотором смысле характе- ризующего степень вырождения системы. Имеется два классических определения - определение локального порядка траектории (local order) и определение глобального порядка системы (intrinsic order, см. [25]). Первое определение дает хорошие инструменты для исследования оптимальности одной отдельной особой траектории и работает в большинстве конкретных задач. Второе опреде- ление, напротив, часто оказывается слишком ограничительным, но уж если его можно применить в какой-то задаче, то оно позволяет не только сформулировать необходимые и достаточные усло- вия оптимальности особой траектории удобным образом в терминах скобок Пуассона, но и дает возможность исследовать поведение неособых траекторий в окрестности особой траектории. На- пример, хорошо известна теорема о невозможности регулярного сопряжения неособой траектории с особой траекторией четного порядка (см. [29]), верная в терминах глобального порядка, и, вообще говоря, неверная в терминах локального порядка (см. [25]). 1Единственность решения теряется в окрестности особых траекторий; см. пункт В.2. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 107 В данном приложении предложено новое, наиболее естественное, на взгляд автора, определение порядка особой траектории. Оно не требует (обычно неудобного) дифференцирования управляю- щего параметра (в отличие от локального порядка) и не требует коммутирования серии гамиль- тонианов (в отличие от глобального порядка). При этом оно сочетает в себе достоинства обоих классических определений: во-первых, оно позволяет изучать оптимальность особой траектории и поведение неособых траекторий в ее окрестности, используя гамильтонов формализм и алгебры Ли скобок Пуассона (как и определение глобального порядка), а во-вторых, оно работает в боль- шинстве конкретных задач (как и определение локального прядка). Теорема о гамильтоновости особого потока доказана в терминах нового определения порядка, хотя верна и в более ограничи- тельном случае глобального порядка. В терминах нового определения также доказана теорема о сопряжении, обобщающая классическую теорему о сопряжении. В.2. Гамильтоновы системы с негладким гамильтонианом. Пусть M - 2n-мерное симплек- тическое многообразие с симплектической формой1 ω ∈ Λ2(M). Через iω обозначим канонический изоморфизм iω : T ∗M → T M, индуцированный формой2 ω. Мы исследуем системы с кусочно гладкими гамильтонианами. Система обыкновенных дифференциальных уравнений, определяе- мая кусочно гладким гамильтонианом, имеет разрывную правую часть. Поэтому мы начнем с общепринятого определения траектории такой системы, которое совпадает в точках гладкости га- мильтониана с классическим определением для гладких систем обыкновенных дифференциальных уравнений. Пусть H - непрерывный кусочно гладкий гамильтониан с множеством N точек разрыва первой производной (т.е. H ∈ C∞(M\\ N ) и H ∈ C0(M)), где N - стратифицированное подмногообра- зие M, не содержащее страт полной размерности 2n. x0 Определение В.1. Абсолютно непрерывная траектория x(t) является траекторией системы с га- мильтонианом H, если для почти всех t выполнено дифференциальное включение x˙ (t) ∈ iω K(x(t)), где K(x0) ⊆ T ∗ M - наименьшее выпуклое замкнутое множество, содержащее все предельные точки dH(x) при x → x0. Такое определение гарантирует существование траектории (подробнее про системы обыкновен- ных дифференциальных уравнений с разрывной правой частью см. [18]), однако единственность теряется. Часто встречаются случаи, когда существуют траектории, целиком лежащие в N ,причем в каждую точку такой траектории входят траектории, не лежащие в N (и выходят из нее). Определение В.2. Траекторию x(t), t ∈ (t0, t1), будем называть особой, если она лежит на множестве точек разрыва x(t) ∈ N при t ∈ (t0, t1). В данном приложении проведено исследование поведения особых траекторий гамильтоновой системы на поверхности разрыва H коразмерности 1. Предположим, что в окрестности V точки x0 ∈ N множество N является гладкой гиперповерхностью, разбивающей V на две области Ω1 и Ω2. Пусть H|Ωi = Hi, i = 1, 2, и Hi гладко продолжаются в окрестность Ωi. Тогда гамильтониан H в окрестности x0 задается одним из двух соотношений: H = max(H1, H2) или H = min(H1, H2). Будем считать, что гладкие функции H1 и H2 заданы в окрестности точки x0. Тогда можно записать иначе: где H = H + Gu, 1 1 H = 2 (H1 + H2), G = 2 (H1 - H2), а u = 1 в Ω1 и u = -1 в Ω2 (или наоборот)3. Будем считать, что dG(x0) /= 0; этого достаточно, чтобы N было гладким многообразием в окрестности x0 ∈ N . 1Иными словами, ω(x) - невырожденная кососимметрическая форма на касательном расслоении TxM. В канониче- ских координатах (q, p) форма ω принимает вид ω = dp ∧ dq. 2В канонических координатах (q, p) изоморфизм iω принимает вид iω : dH 1→ (H! ! p, -Hq ) = sgrad H. 3Всюду в этой работе u ∈ [-1; 1]. Общий случай u ∈ [a, b] немедленно сводится к u ∈ [-1; 1] очевидной аффинной заменой. 108 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД В.3. Порядок особой траектории. С понятием особой траектории тесно связано понятие ее порядка, который, в некотором смысле, определяет степень вырождения системы в окрестности особой траектории. Как уже отмечалось, существует два различных классических определения порядка: так называемый локальный порядок траектории и глобальный (intrinsic) порядок системы (см. [25]). Глобальный порядок всегда не превосходит локального порядка. Использование глобального по- рядка системы позволяет использовать гамильтонов формализм, выписывать необходимые условия и отыскивать особые траектории в терминах скобок Пуассона, что очень удобно и при конкрет- ных вычислениях, и при теоретических исследованиях. В терминах глобального порядка может быть доказана теорема о сопряжении: если глобальный порядок h = hglob четен, 2|h, и на осо- бой траектории выполнено усиленное обобщенное условие Лежандра-Клебша (условие Келли- Коппа-Мойера [22]), то в точке стыковки этой особой траектории с любой неособой управление на последней обязано иметь разрыв второго рода (см. [29]). Особые траектории, на которых не выполнено усиленное условие Келли-Коппа-Мойера (такие траектории принято называть ати- пичными), невозможно исследовать с помощью определения глобального порядка. Напротив, локальный порядок не позволяет использовать гамильтонов формализм. Однако в большом количестве задач локальный порядок любой особой траектории строго больше глобаль- ного порядка системы (в таких случаях мы будем говорить, что определение глобального порядка вырождается). В этом случае в понятии глобального порядка мало смысла: все особые траекто- рии атипичны и их невозможно найти, используя определение глобального порядка. Также в этом случае не работает теорема о сопряжении (см. [25]). Использовать определение локального поряд- ка для отыскания особых траекторий в этих случаях тоже не очень удобно, так как приходится производить формальное дифференцирование управления u, u˙ , u¨ и т. д., которое не всегда кор- ректно и всегда не удобно. В защиту определения локального порядка скажем, что обобщенное условие Лежандра-Клебша (см. [22]) формулируется очень просто даже для атипичных особых траекторий1: - ( 1)hloc ∂ ∂u ( d \\2hloc-1 dt ∂ ∂u H 0. В этом приложении построено модифицированное определение порядка, сочетающее в себе достоинства обоих классических определений; во избежание путаницы будем называть его на- туральным порядком. Во-первых, новое определение порядка позволяет без труда использовать гамильтонов формализм, а во-вторых, в большинстве конкретных примеров, в которых локаль- ный порядок траекторий больше глобального порядка системы, натуральный порядок оказывается равным локальному порядку, и все неудобства, связанные с вычислениями в терминах локально- го порядка, исчезают. В результате удается получить важную теорему о гамильтоновости потока особых траектории. Теорема о невозможности регулярного сопряжения неособой траектории и осо- бой траекторией в системе четного порядка остается верной при замене глобального порядка на натуральный. Определение В.3. Пусть Sk - множество точек V , в которых обращаются в нуль скобки2 (ad H)mG при m = 0, 1,...,k - 1: Sk = {x ∈ V : G(x) = (ad H)G(x) = ... = (ad H)k-1G(x) = 0 . Будем говорить, что гамильтонова система с кусочно гладким гамильтонианом H = H + Gu имеет в V натуральный порядок h ∈ N, если для всех k = 1,...,h - 1 выполнены соотношения {G, (ad H)2k-1G = 0 на S2k, (В.1) 1Неравенство сформулировано для принципа максимума, т.е. для случая u = sign G. Если же u = - sign G, то знак в неравенстве необходимо обратить. 2Через ad здесь и далее обозначено присоединенное действие, т.е. (ad H)G = {H, G} = H! G! - H! G! . p q q p ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 109 а также1 {G, (ad H)2h-1G /= 0 в любой точке из S2h. Если же равенства (В.1) выполнены для всех k ∈ N, то натуральный порядок системы равен ∞. Легко убедиться, что выполняются следующие неравенства: локальный порядок ) натуральный порядок ) глобальный порядок. Для того чтобы пояснить данное определение и продемонстрировать разницу между различными определениями порядков, проведем подробное исследование модифицированной задачи Фуллера2. Пример В.1. Рассмотрим задачу минимизации интеграла T 1 r → x2 dt min 2 0 с некоторыми начальными и конечными условиями, которые несущественны для дальнейшего, и при ограничении на вторую производную3 |x¨| |1+ x|. В классической задаче Фуллера предыдущее условие немного другое, |x¨| 1, поэтому при x и x˙ , близких к началу координат, эта задача в некотором смысле не сильно отличается от задачи Фуллера. Воспользуемся принципом максимума Понтрягина: пусть q1 = x, q2 = сопряженные переменные к q1, q2. Тогда4 x˙ , а p1, p2 - 1 2 H = - 2 q1 + p1q2 + p2(1 + q1)u, и управление u выбирается в зависимости от знака произведения p2(1 + q1). Получаем 1 2 H = - 2 q1 + p1q2 и G = p2(1 + q1). Траектория является особой, если на ней G обращается в нуль. Поэтому множество S1 опре- деляется условием p2(1 + q1) = 0 и не является гладким многообразием. Прямые вычисления дают 0 = G˙ = {H, G} + {G, G}u = {H, G} = p2q2 - p1(1 + q1), d 0 = dt {H, G} = {H, {H, G}} + {G, {H, G}}u. Поскольку {G, {H, G}} = 2p2(1 + q1) /≡ 0, то система имеет первый глобальный порядок в любой открытой области V , hglob = 1. С другой стороны, поскольку скобка {G, {H, G}} = 2G обраща- ется в нуль на любой особой траектории, то локальный порядок любой особой траектории не меньше двух, hloc ) 2. Таким образом, определение глобального порядка в этой задаче вырождается. Напротив, определение натурального порядка работает: поскольку {G, {H, G}}|S2 = 0, то натуральный порядок системы, как и локальный порядок, не меньше двух, h ) 2. Найдем особые траектории, их локальные порядки и натуральный порядок системы в их окрестности. Итак, 2 (ad H)2G = -q1(1 + q1) - 2p1q2, (ad H)3G = -q2(1 + 4q1), (ad H)4G = -4q2, {G, (ad H)2G} = 2{H, G}, {G, (ad H)3G} = -(1 + q1)(1 + 4q1), {G, (ad H)4G} = -4q2(1 + q1), (ad H)k G ≡ {G, (ad H)k G}≡ 0 при k ) 5. 1Если в каких-либо точках из S2h (но не во всех) скобка {G, (ad H)2h-1G обращается в нуль (обозначим множе- 0 ство таких точек через S0 ), то в V натуральный порядок не определен. Однако в V \\S система имеет натуральный порядок, равный 2h 2h h. В ситуации общего положения dim S0 2h 2h = dim S2h - 1. Вообще говоря, на множестве S0 могут лежать атипичные особые траектории, локальный порядок которых больше h. 2Подробнее про задачу Фуллера и вообще про особые экстремали второго глобального порядка см. [30]. 3Как обычно, предполагаем, что x ∈ C1 и x˙ ∈ AC. 4Будем считать, что λ0 = 1. 110 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД S2 S3 Поскольку {G, (ad H)G}| = 0 и {G, (ad H)2G}| = 0, то на любой особой траектории выполнено ⎧ d ⎪ ⎪ dt ⎪ G = (ad H)G, ⎪ ( \\2 d ⎪ ⎨ ⎪ dt ( d \\3 ⎪ ⎪ dt ⎪ G = (ad H)2G, G = (ad H)3G, ⎪ ( d \\ 4 ⎪ ⎪ G = (ad H)4G + {G, (ad H)3G}u. ⎩ dt Дальнейшие вычисление зависят от того, равна ли нулю скобка {G, (ad H)3G}. Существует две возможности, в зависимости от того, в окрестности какой особой траектории рассматривается система. Положим S1 = {p2 = 0, q1 /= -1 , S1 = {q1 = -1, p2 /= 0 , S1 = {p2 = 0, q1 = -1 1 2 0 1 и изучим по отдельности поведение системы в малых окрестностях V j многообразий Sj , j = 1, 2. 0 Будем считать, что V j ∩ S1 = ∅, j = 1, 2. В области V 1 имеем S1 = {p2 = 0, q1 /= -1 , S2 = S1 ∩ {p1 = 0 , S3 = S2 ∩ {q1 = 0 , S4 = S3 ∩ {q2 = 0 . 1 1 1 1 1 1 1 S4 С другой стороны {G, (ad H)3G}| 1 /= 0. Поэтому нетрудно показать, что единственная особая траектория q1 = q2 = p1 = p2 = u = 0 в V 1 имеет локальный порядок 2. Более того, натуральный порядок системы в V 1 тоже равен 2 и совпадает с локальным. В области V 2 ситуация следующая: S2 = S2 ∩ {q2 = 0}, а при k ) 3, S2 = S2. Все особые 2 1 k 2 траектории образуют двумерную поверхность {q1 = -1, q2 = 0}, а p1, p2 - любые. Действительно, если q1 = -1 и q2 = 0, то q˙1 ≡ q˙2 ≡ 0, поэтому никакое управление не может сдвинуть систему из этой точки. Локальный порядок каждой особой траектории в V2 равен ∞. Поскольку Sk {G, (ad H)k-1G}| 2 при всех k, то натуральный порядок системы в V 2 совпадает с локальным порядком любой особой траектории и тоже равен ∞. 2 Таким образом, в приведенном выше примере глобальный порядок hglob в любой открытой об- ласти равен 1. Однако (1) имеется одна особая траектория второго локального порядка, hloc = 2, и в ее окрестности система имеет второй натуральный порядок, h = 2, и (2) имеется двумерная поверхность S2 особых траекторий бесконечного локального порядка, hloc = ∞, и в окрестности 2 S2 система тоже имеет бесконечный натуральный порядок, h = ∞. В.4. Гамильтоновость потока особых траекторий. Хорошо известно, что управление на осо- бой траектории с помощью процедуры последовательного дифференцирования G в силу системы может быть найдено лишь на четном шаге дифференцирования 2h. Поэтому в ситуации общего положения все особые траектории образуют четномерное многообразие S коразмерности 2h в M. Само многообразие M симплектично, имеет четную размерность, и, значит, размерность S тоже четна. Истинная причина того, что многообразие S всегда имеет четную размерность, заключает- ся в том, что оно является симплектическим подмногообразием в M. Более того, поток особых траекторий на нем является гамильтоновым с гладким гамильтонианом H|S = H|S . Приведенная ниже теорема о гамильтоновости особого потока сформулирована в терминах нату- рального порядка, однако остается верной, если заменить в ее формулировке натуральный порядок на глобальный и не рассматривать атипичные траектории (тогда, правда, область применимости теоремы сильно сужается). Теорема В.1 (о гамильтоновости, см. [13, теорема 1]). Предположим, что гамильтонова си- стема H = H + Gu имеет в V натуральный порядок h /= ∞ и дифференциалы ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 111 dG, d(ad H)G, ..., d(ad H)2h-2G линейно независимы в V . Тогда все особые траектории си- стемы лежат в множестве S = S2h ∩ {x : |us(x)| 1}, где (ad H)2hG - { us(x) = . G, (ad H)2h-1G Кроме того, справедливы следующие утверждения. Множество S2h (если не пусто) является гладким симплектическим многообразием с симплектической формой ω|S2h и dim S2h = dim V - 2h. Особые траектории на S получаются следующим образом: необходимо взять траек- тории гамильтоновой системы на S2h с гамильтонианом H|S2h = H|S2h и ограни- чить их на S. Таким образом, особые траектории образуют гамильтонов поток на S2h ∩ {|us(x)| < 1}. Поток гладкого гамильтониана H = H(x) + G(x)us(x) в объемлющем пространстве V является касательным к S2h, и его траектории на S2h совпадают с траекториями из пункта 2. При этом функцию us(x) в определении H функцию v(x), что us(x) = v(x) на S2h. можно заменить на любую такую Будем называть S многообразием особых траекторий или просто особым многообразием. Теорема В.1 сформулирована в локальных терминах в окрестности V , однако если система с гамильтонианом H = H + Gu имеет натуральный порядок h на всем пространстве M (т.е. M = Ω1 ⊃ Ω2 ⊃ N ), то многообразие S определено глобально на N (достаточно положить V = M). Замечание В.1. Из п. 2 теоремы В.1 немедленно следует, что особые траектории являются бесконечно гладкими и не пересекаются друг с другом, хотя могут пересекаться с неособыми. Замечание В.2. Если множество допустимых управлений в H = H + Gu представляет собой всю прямую, u ∈ R, то все траектории являются особыми. Действительно, если G /= 0, то макси- мум Gu по u ∈ R не достигается. В этом случае имеются лишь особые траектории, и они образуют гладкий гамильтонов поток на S = S2h. Имеет место следующее очевидное следствие (конечно, его нетрудно получить и прямым вы- числением). Следствие В.1. H является первым интегралом потока особых траекторий. Замечание В.3. Если существуют n - h независимых функций H1,..., Hn-h в V , коммути- рующих на S с H, G и друг с другом, то поток особых траекторий на S является вполне интегрируемым по Лиувиллю. Более того, он включается в поток гладкого гамильтониана H в V , который часто является суперинтегрируемым (см. [16]) на S с n + h интегралами H1,..., Hn-h, 2h-1 Hn-h+1 = G, Hn-h+2 = (ad H)G, ... , Hn+h = (ad H) G. Замечание В.4. Если H и G являются бесконечно гладкими функциями, то многообразие осо- бых траекторий S бесконечно гладко; более того, все особые траектории на S бесконечно гладкие. Если же H, G ∈ Ck (V ), где k > 2h, то S и особые траектории на S будут иметь гладкость не ниже k - 2h. В.5. Метод упрощенных вычислений. В этом пункте приведены два полезных утверждения, применение которых позволяет кардинально упростить выкладки. Дело заключается в том, что при прямых вычислениях приходится находить огромное количество символьных слагаемых, ко- торые на деле обращаются в нуль на соответствующих многообразиях Sk . Например, попытка прямого счета (без использования приводимой ниже техники) в задаче оптимального управления намагниченным волком Лагранжа в контролируемом магнитном поле привела к выражениям, со- держащим несколько сотен ненулевых слагаемых. На деле же оказалось, что лишь несколько из них не являлись тождественно нулевыми функциями на S. Лемма В.1 (см. [13, леммы 1, 2]). Пусть F - произвольная гладкая функция в V , k ∈ N и дифференциалы dG, d(ad H)G, .. ., d(ad H)k-1G линейно независимы в V . Тогда значения скоб- ки {H, F } в точках множества Sk+1 зависят только от значений F в точках Sk и не зависят от продолжения F в V \\ Sk . 112 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Если дополнительно система имеет в V натуральный порядок h и k < 2h, то значения скобки {G, F } в точках множества Sk зависят только от значений F в точках Sk и не зависят от продолжения F в V \\ Sk . Таким образом, лемма В.1 позволяет производить вычисления скобок на Sk индуктивно, отбра- сывая слагаемые, обратившиеся в нуль на предыдущих шагах. Например, вычисления в приме- ре В.1 становятся совершенно элементарными. Действительно, в этом примере 1 2 H = - 2 q1 + p1q2, G = p2(1 + q1) = 0. Разберем случай q1 /= -1, т.е. p2|S1 = 0. Итак, {H, G} = p2q2 - p1(1 + q1), {H, G}|S1 = p1(1 + q1), p1|S2 = 0. Поскольку h ) 1, то по лемме В.1 Далее, опять по лемме В.1 {G, {H, G}}|S1 = 0, h ) 2. (ad H)2G| = {H, p (1 + q )}| = (q (1 + q )+ q p )| = q (1 + q ), q | = 0. S2 1 1 S2 1 1 2 1 S2 1 1 1 S3 Снова по лемме В.1 получаем Наконец, на последнем шаге S3 {G, (ad H)2G}| = 0. т.е. S3 (ad H)3G| 3 = q2, q2|S4 = 0, {G, (ad H) G}|S3 = (1 + q1)|S3 = 1. Поэтому h = 2, и по теореме В.1 особая траектория единственна: p1 = p2 = q1 = q2 = 0 и us = 0. Приведем еще одно очень полезное утверждение. Лемма В.2 (см. [13, лемма 3]). Пусть дифференциалы dG, d(ad H)G, .. ., d(ad H)h-2G линей- но независимы в области V , в которой система имеет натуральный порядок h. Обозначим Km = {Km, {Km-1,... {K2, K1} .. .}}, где при каждом i ) 1 символ Ki обозначает H или G. Пусть 1 m < 2h и j ) 0. Тогда Km+j = 0 на Sm, если скобка Km+j содержит не более m - 1 символов H (и любое количество символов G). При m = 2h это утверждение верно для всех скобок K2h+j , в которых крайний слева символ есть H. В.6. Ниспадающая система скобок Пуассона. Достаточно удобным инструментом для иссле- дования поведения неособых траекторий в окрестности особой является ниспадающая система скобок Пуассона. Опишем ее для случая натурального порядка: выпишем набор дифференциаль- ных уравнений вдоль произвольной траектории системы и упорядочим их по строкам. Первые две строки системы содержат по одному уравнению (будем перед уравнениями, стоящими в k-й строке, ставить символ lkl): l1l l2l d { } G = H, G , dt d dt {H, G} = {H, {H, G}} + {G, {H, G}}u. Третья строка содержит два уравнения: d l3l l3l dt {H{H, G}} = {H{H, {H, G}}} + {G, {H{H, G}}}u, d dt {G{H, G}} = {H{G, {H, G}}} + {G, {G{H, G}}}u. В общем случае m-я строка, m ) 2, содержит уравнения вида d lml dt Km = {H, Km} + {G, Km}u, ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 113 где Km = {Km, {Km-1,... {K2, K1} .. .}}, K1 = G, K2 = H, а остальные символы Kj могут обозначать как H, так и G (т.е. всего 2m-2 уравнений). Уравнения в (m + 1)-й строке получаются дифференцированием по t правых частей уравнений m-й строки, например, d lm + 1l lm + 1l dt {H, Km} = {H, {H, Km}} + {G, {H, Km}}u, d dt {G, Km} = {H, {G, Km}} + {G, {G, Km}}u. Ниспадающая система выписывается вплоть до строки с номером 2h, где h - натуральный порядок системы. Таким образом в m-й строке выписаны уравнения на производную по времени от скобок m-го порядка, а правые части этих уравнений суть аффинные по управлению u функции, где коэффи- циентами выступают скобки (m + 1)-го порядка. Главными скобками ниспадающей системы будем называть скобки G, (ad H)G, .. ., (ad H)2h-1G. Остальные скобки порядка не выше 2h будем называть неглавными. Доказательство теоремы В.2 о сопряжении основано на том, что при выходе на особую траекторию (или при сходе с нее) в любой строке с номером m неглавные скобки имеют больший порядок малости по t - τ , чем главные скобки, и потому не влияют на принципиальное поведение системы. Этот факт следует из леммы В.2. Действительно, если неособая траектория выходит в некоторый момент τ на особое многообразие, то почти все правые части в ниспадающей системе скобок Пуассона обращаются в нуль в момент τ . Единственное уравнение, правая часть которого не обращается в нуль - это производная от главной скобки в последней строке: { } d ((ad H)2h-1G = (ad H)2hG + G, (ad H)2h-1G u. dt Поэтому все скобки длины 2h, кроме главной, имеют на траектории порядок (t - τ )2 и мажо- рируются главной скобкой. Осталось заметить, что аналогичный факт для главных и неглавных скобок одинаковой длины k < 2h также верен: неглавные скобки длины k < 2h имеют порядок (t - τ )2h-k+2. Дело заключается в том, что главная скобка длины m появляется в правой части в (m - 1)-й строке только в производной главной скобки длины m - 1. В.7. Теорема о сопряжении. Как отмечалось выше, в окрестности многообразия особых тра- екторий S теряется единственность решения гамильтоновой системы H = H + Gu с разрывной правой частью. А именно, через каждую точку на S проходит единственная особая траектория, но из каждой точки особой траектории могут выходить неособые, и обратно, в каждую точку осо- бой траектории могут входить неособые. Типичное поведение неособых траекторий в окрестности (не атипичной) особой траектории в системе первого натурального (или, что то же, глобального) порядка описано так: в каждую точку особой траектории приходят две неособые траектории и выходят тоже две. В случае большего глобального порядка в любую точку особой траектории может входить (или выходить) континуальное семейство неособых (см. пример Фуллера [30]) Теоремы о невозможности регулярного сопряжения (в том или ином смысле) неособой траек- тории с особой обычно доказываются в терминах глобального порядка. Например, если система имеет четный глобальный порядок, то при сопряжении неособой траектории с особой (не атипич- ной) управление обязано иметь разрыв второго рода. При этом заменить глобальный порядок на локальный в формулировке нельзя (см. [25]). В этом пункте мы приводим обобщение классической теоремы о сопряжении, а именно, тео- рему В.2 о невозможности регулярного сопряжения неособой траектории с особой траекторией четного порядка в терминах натурального прядка. Таким образом, наличие глобального порядка не является необходимым для доказательства теорем о сопряжении. Достаточно наличие лишь натурального порядка. Без ограничения общности будем считать, что u = 1, если G > 0, и u = -1 если G < 0, т.е. выполнен принцип максимума. Теорема В.2 (о сопряжении, см. [13, теорема 2]). Предположим, что негладкая гамильтоно- ва система H = H + Gu имеет в V четный натуральный порядок h /= ∞ и дифференциалы dG, d(ad H)G,..., d(ad H)2h-2G линейно независимы в V . Рассмотрим особую траекторию x∗(t), 114 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД u∗(t) при t ∈ (t1, t2), на которой u∗(t) ∈ (-1; 1) и выполнено усиленное условие Лежандра- Клебша1: {G, (ad H)2h-1G}(x∗(t)) < 0. Если неособая траектория t), t) определена при t ) τ (или t τ ) и сопрягается в точке x( u( u( x(τ ) = x∗(τ ) , то управление t) имеет разрыв второго рода при t → τ +0 (соответственно t → τ - 0). Замечание В.5. Условие |u∗(t)| < 1 в теореме В.2 существенно. Это означает, что теорема В.2 запрещает регулярное сопряжение во внутренних точках многообразия особых траекторий S, но ничего не утверждает про сопряжение на его границе ∂S. Пример В.2. В рассмотренном выше примере В.1 в окрестности особой траектории q1 = q2 = p1 = p2 = 0 система имеет второй натуральный порядок, поэтому2 по доказанной теореме В.2 регулярное сопряжение с неособой траекторией невозможно. Однако этот факт не следует из клас- сической теоремы о сопряжении, так как глобальный порядок системы равен 1 в любой открытой области. Это связано с тем, что определение глобального порядка в этом примере вырождается: локальный порядок любой особой траектории больше или равен 2; следовательно, все траектории атипичны. Таким образом, невозможность регулярного сопряжения на самом деле определяется четностью натурального порядка, а не глобального. Четность локального порядка, напротив, не препятствует регулярному сопряжению. Это хорошо видно из примера Льюиса (см. [25]), который изначально и послужил толчком для введения двух разных определений порядка - глобального и локального. Замечание В.6. Если система в V имеет натуральный порядок h, то локальный порядок любой особой траектории в V совпадает с h (хотя глобальный порядок может быть меньше). Действительно, вычислим в старых обозначениях ( d k ∂ H как формальный многочлен от u, u˙ , u¨,.. .. dt ∂u Коэффициентами при мономах будут линейные комбинации скобок от H и G длины k. Поэтому, согласно лемме В.2, если k < 2h, то ∂ ( d \\k ∂ ∂u dt ∂u H = 0. Если же k = 2h, то по той же лемме получаем ∂ ( d \\2h ∂ 2h-1 ∂u dt ∂u H = {G, (ad H) G} /= 0 на S. Более того, как элементарное следствие получаем обобщенное неравенство Лежандра-Клебша для натурального порядка, вытекающее из его аналога для локального порядка: (-1)h{G, (ad H)2h-1G} 0. Неравенство сформулировано для принципа максимума, т.е. для случая u = sign G. Если же u = - sign G, то знак в неравенстве надо обратить. Эта формула хорошо известна в случае, когда h - глобальный порядок. Здесь же она доказана для более общего определения натурального порядка и работает во многих случаях несовпадения локального и глобального порядков. В.8. Задача управления намагниченным волчком Лагранжа в контролируемом магнитном поле. Пример В.3. Рассмотрим задачу оптимального управления вращением твердого тела в пере- менном магнитном поле. Пусть осесимметричное намагниченное твердое тело (волчок Лагранжа) закреплено в точке на оси симметрии и помещено внутрь индукционной магнитной катушки (в невесомости). Магнитное поле катушки приближенно будем считать в каждый момент времени по- стоянным: h(t)e, где e ∈ R3 - единичный вектор, а h(t) ∈ R - напряженность поля, и пренебрежем 1Тот факт, что обобщенное условие Лежандра-Клебша формулируется в терминах натурального порядка именно в таком виде, доказан в замечании В.6. 2Обобщенное условие Лежандра-Клебша выполнено, так как {G, (ad H)3G} = -1 в начале координат. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 115 эффектом Барнетта. Вычисления будем проводить в системе координат, связанной с телом. Обо- значим через J = diag(J1, J1, J2) матрицу, обратную к тензору инерции, через m ∈ R3 - момент тела, а через N ∈ R3 - постоянный магнитный момент тела. Будем считать, что тело намагниче- но осесимметрично, т.е. вектор N лежит на оси симметрии и является собственным вектором J , JN = J2N . Тогда, если u(t) ∈ [-u0, u0] - напряжение на катушке в момент времени t, а R - ее внутреннее сопротивление, то ⎧ m˙ = [m, Jm]+ h[e, N ], ⎨ ⎪ e˙ = [e, Jm], ⎩⎪ h˙ = -Rh + u, (В.2) где [·, ·] обозначает векторное произведение. Система (В.2) почти совпадают с системой уравнений вращения волчка Лагранжа в однородном силовом поле тяжести (см. [2]). Существенная разница заключается в том, что модуль силы меняется со временем. Система (В.2) не изменяется при следующих заменах координат: пусть λ> 0, тогда t 1→ 1/λt, m 1→ λm, h 1→ λ2h, u 1→ λ3u, R 1→ λR, поэтому мы можем считать, что R = 1; λ h 1→ λh, N 1→ 1 N , u 1→ λu, поэтому можно считать, что u0 = 1, и λ e 1→ λe, N 1→ 1 N , поэтому будем считать, что N = (0, 0, 1), а вектор e может иметь, вообще говоря, не единичную длину. Таким образом, фазовое пространство M = {m, e, h} семимерно: M = R7 \\ {e = 0}. Требуется, управляя напряжением на катушке u ∈ [-1, 1], перевести систему из начального состояния в конечное за минимальное время: T → inf . (В.3) Начальное и конечное состояния могут быть либо фиксированными, либо лежащими на некоторых терминальных многообразиях - это несущественно для дальнейшего. Система (В.2) обладает следующими очевидными первыми интегралами: проекция вектора момента на ось симметрии: (m, N = const; проекция вектора момента на направление магнитного поля: (m, e = const; геометрический интеграл: (e, e = const. Длина вектора момента m и аналог энергии E не сохраняются в системе, так как напряженность магнитного поля h меняется со временем. Пусть p, q, r - переменные, сопряженные к m, e и h соответственно (координаты в слое на кокасательном расслоении M = T ∗M ); p ∈ R3, q ∈ R3 и r ∈ R. Согласно принципу максиму- ма Понтрягина, оптимальные траектории должны быть траекториями гамильтоновой системы с разрывной правой частью: H = (p, [m, Jm] + h(p, [e, N ] + (q, [e, Jm] - rh + ru = H + Gu, где (·, · обозначает спаривание вектора и ковектора (скалярное произведение), а симплектическая форма имеет вид ω = dp ∧ dm + dq ∧ de + dr ∧ dh. Таким образом, ⎧ p˙ = [p, Jm] - J [p, m] - J [q, e], ⎪⎨ q˙ = h[p, N ]+ [q, Jm], ⎪⎩ r˙ = -(p, [e, N ] + r. Особое многообразие S может быть найдено в явном виде с помощью лемм В.1 и В.2. Оказы- вается, что глобальный порядок системы равен 2, но любая особая траектория атипична. Тем не менее определение натурального порядка работает. В этой задаче натуральный порядок равен 3 на открытом всюду плотном множестве, и натуральный порядок совпадает с локальным порядком. Таким образом, на 14-мерном пространстве M особые траектории лежат на многообразии S раз- мерности dim S = dim M- 2 · 3 = 8 и образуют на нем гамильтонов поток с гамильтонианом H. Помимо очевидного первого интеграла H особый поток обладает дополнительно тремя первыми 116 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД интегралами исходной управляемой системы. Следовательно, поток особых траекторий автомати- чески является интегрируемым по Лиувиллю (подробнее см. лемму В.3). Это приводит к тому, что особые траектории в рассматриваемой задаче удается отыскать в явном виде. Теорема В.3 (см. [13, теорема 3]). Движение по любой особой траектории на M± = M∩ {[e, N ] /= 0, (e, [m, q] /= 0} в задаче (В.2), (В.3) оптимального управления волчком Лагранжа в контролируемом магнит- ном поле устроено следующим образом: вектор момента импульса m, магнитный момент тела N и направление магнитного по- ля e во время движения лежат в одной плоскости и образуют друг с другом постоянные углы; вектор момента m во время движения имеет постоянную длину и параллелен сумме вектора магнитного момента N и проекции N на направление магнитного поля e; плоскость, содержащая векторы m и e, вращается вокруг N с постоянной угловой ско- ростью (e, N Ω = (e, e + (J2 - J1)( N, N ; управление u выбирается так, чтобы напряженность магнитного поля h внутри катуш- ки была постоянной: us = h ∈ (-u0, u0). Таким образом, при движении по особой траектории волчок равномерно вращается с постоянной скоростью вокруг вектора направления магнитного поля. Прецессия и нутация отсутствуют, а сумма магнитного момента и его проекции на направление магнитного поля в любой момент времени параллельна вектору момента вращения тела. Теорема В.3 описывает проекцию особых траекторий на фазовое пространство M = {m, e, h}. Ситуация в расширенном фазовом пространстве M = T ∗M описывается следующим образом. Лемма В.3 (см. [13, лемма 6]). Гамильтонов поток особых траекторий на S, dim S = 8, обладает четырьмя независимыми первыми интегралами в инволюции: F1 = (e, e , F2 = (m, e , F3 = (m, N , F4 = H н=а=S H н=а=S H н=а=S (q, [e, Jm] . Первые интегралы h и E = (m, Jm через них выражаются. i,j=1 Таким образом, по теореме В.1 поток особых траекторий в задаче (В.2), (В.3) оптимального управления волчком Лагранжа в переменном магнитном поле является вполне интегрируемым по Лиувиллю. Более того, по той же теореме его можно включить в поток гамильтониана H = H(x)+G(x)us(x), который (как было отмечено в замечании В.3) обладает на S дополнительно еще шестью первыми интегралами: F5 = G, F6 = (ad H)G,..., F10 = (ad H)5G. Матрица ({Fi, Fj })10 имеет ранг 6, и потому система с гамильтонианом H является суперинтегрируемой1 на S. Г. ОСОБЫЕ РЕЖИМЫ В УПРАВЛЯЕМЫХ СИСТЕМАХ С МНОГОМЕРНЫМ УПРАВЛЕНИЕМ ИЗ МНОГОГРАННИКА (Л. В. ЛОКУЦИЕВСКИЙ) Основной объект исследования в работе - это гамильтоновы системы, аффинные по многомерно- му управлению, меняющемуся в некотором многограннике Ω. В основной части работы проведено исследование интегральных воронок точек, лежащих на траекториях второго порядка, и показа- но, что интегральные воронки содержат хаотические структуры канторовского типа. В данном приложении проведено исследование интегральных воронок точек на особых траекториях первого порядка. Доказана теорема о структуре выхода оптимальных траекторий на особую траекторию первого порядка в ее окрестности (и схода с нее) для систем с голономным управлением. Доказа- но, что лагранжева поверхность в окрестности особой траектории первого порядка специальным 1Отметим, что вне S эта система теряет первые интегралы F5,..., F10, но это не имеет значения, так как все особые траектории лежат на S. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 117 образом соткана из траекторий системы, особых по граням многогранника Ω. Предложен про- стой метод явного отыскания особых траекторий первого порядка по граням многогранника Ω. В результате описывается полная картина оптимального синтеза, полученная последовательным сопряжением особых экстремалей первого порядка. Подробное изложение результатов данного приложения можно найти в [14]. Г.1. Введение. При изучении топологии решений системы обыкновенных дифференциальных уравнений ключевую роль играют неподвижные (особые) точки и периодические траектории. Поведение траекторий системы в окрестности особых точек и циклов является определяющим при исследовании глобальной структуры решений. Аналогичным образом в задачах оптимального управления при построении оптимального синтеза1 особые траектории и геометрия их окрестно- стей зачастую определяют структуру всего синтеза. Наиболее хорошо изученный случай - это аффинные по управлению гамильтоновы системы принципа максимума Понтрягина с одномерным управлением: H(q, p, u) = H(q, p)+ G(q, p)u, u ∈ [α, β]. Согласно принципу максимума Понтрягина u = α, если G< 0, и u = β, если G> 0. Если же на оптимальной траектории G ≡ 0 на некотором промежутке времени, то управление не может быть найдено из принципа максимума. Такая траектория называется особой, и управление на ней часто может быть найдено из условий G˙ = G¨ = ... = G(n) = ... = 0. По теореме Келли-Коппа-Мойера (см. [22]), управление на особой траектории в явном виде в первый раз может возникнуть только в производной G четного порядка 2h и однозначно выражается из условия G(2h) = 0. Число h принято называть порядком особой траектории. Особые траектории первого порядка часто встречаются в задачах математической экономики. Например хорошо известна теорема о магистрали (см. [6]). Особые траектории второго порядка естественным образом возникают в управляемых механических системах - робототехнике, астро- навтике и т. д. (см. [30]). Это связано с тем, что в качестве управления в таких задачах выступает вторая производная фазовых координат (сила). Определение порядка особой экстремали для задач с многомерным управлением приводит к так называемому флагу порядков (подробнее см. [8]). В данном приложении изучаются особые траектории первого порядка в управляемых гамиль- тоновых системах с многомерным управлением. На управление наложен ряд аффинных ограниче- ний, т.е. u ∈ Ω, где Ω - многогранник. В приложении предложен новый метод изучения особых траекторий. На участвующие в системе гамильтонианы H и G и их скобки Пуассона выписы- вается система дифференциальных уравнений специального вида. Оказывается, что с помощью некоторого раздувающего отображения, в этой системе можно выделить набор главных перемен- ных, определяющих поведение всей системы в целом. В системах с голономным управлением2 структура системы относительно главных переменных совпадает с оптимальным синтезом одной выпуклой модельной задачи оптимального управления. Это позволяет применить мощную технику выпуклого анализа для построения синтеза в окрестности особой траектории. Для нелинейных систем с голономным управлением доказана теорема об эквивалентности син- теза в окрестности особой траектории первого порядка и синтеза в модельной задаче оптималь- ного управления. Структура оптимальных траекторий в модельной задаче полностью построена в многомерном случае для «не слишком скошенных» компактных многогранников (подробнее см. теоремы Г.3 и Г.4). Построен метод аналитического отыскания особых траекторий для заданной грани многогранника. В пп. Г.2 и Г.3 даются основные определения. В п. Г.4 показано, что в ситуации общего поло- жения особые траектории по граням размерности )2 не оптимальны. Начиная с п. Г.5 исследуется класс задач с голономным управлением, в которых (в отличие от общего случая) возникают особые траектории по граням всех возможных размерностей. Г.2. Особые по граням траектории. Пусть на многомерное управление u наложен ряд линей- ных ограничений типа равенств и неравенств, т.е. u меняется в некотором многограннике Ω из аффинного пространства U с отмеченной точкой. Без ограничения общности можно считать, что 1Или более общо, в изучении динамики траекторий гамильтоновой системы с разрывной правой частью. 2Аффинная по управлению система имеет голономное управление, если, грубо говоря, поле плоскостей, отвечающих многограннику Ω, интегрируемо. Точнее см. определение Г.4. 118 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД dim U = dim Ω. На симплектическом многообразии M задана управляемая гамильтонова система принципа максимума Понтрягина H(x, u) = H(x)+ (G(x), u . (Г.1) · u Здесь x = (q, p) ∈ M, а H : M → R и G : M → U ∗ - достаточно гладкие функции1, а ( , · обо- значает действие ковектора на векторе. Оптимальное управление выбирается согласно принципу максимуму Понтрягина (G, u = max v∈Ω (G, v . (Г.2) u Очевидная геометрическая интерпретация принципа максимума Понтрягина заключается в том, что лежит в опорной гиперплоскости (G, v = const к многограннику Ω (если G /= 0). Пересечение опорной гиперплоскости с Ω может быть либо вершиной, либо гранью большей размерности. Рассмотрим произвольную траекторию x(t), u(t) системы (Г.1), (Г.2). Определение Г.1. Если для почти всех t из промежутка (t1, t2) максимум в (Г.2) достигается ровнов одной вер- шине (возможно, в разных при разных t), то траекторию x(t), u(t) будем называть неособой на (t1, t2). Зафиксируем грань Γ многогранника Ω. Если при всех t из промежутка (t1, t2) максимум в (Г.2) достигается одновременно на всех точках Γ и только в них, то такую траекторию будем называть особой2 по грани Γ. Данное выше определение особой траектории по всему многограннику Ω совпадает с классиче- ским определением особой траектории: G(x(t)) = 0 при t ∈ (t1, t2). Замечание Г.1. В данном приложении изучаются окрестности особых экстремалей. Если траек- тория t), t) является особой по грани Γ на промежутке (t1, t2), то для любой точки x, близкой x( u( x( к t) , максимум в (Г.2) может достигаться только на точках некоторой подграни Γ ⊆ Γ. Поэтому при изучении окрестности особой экстремали (в том числе ее самой) можно редуцировать задачу и считать, что Ω = Γ, а траектория является особой по всему многограннику. Ниже приведена теорема о выходе на особую траекторию первого порядка по всему многогран- нику в голономном случае (см. определение Г.4) А именно, пусть Γ1 ⊂ Γ2 ⊂ ... ⊂ Γk - некоторый набор последовательно вложенных граней3. Тогда существует траектория, выходящая на особую по всему многограннику следующим образом: сначала используется управление, особое по Γ1, потом оно скачком переключается на особое управление по Γ2 и т. д., пока не переключится на особое управление по всему многограннику (см. теорему Г.4). Подобное поведение оптимальных траекторий в широком классе задач впервые было получено для случая, когда Ω - тетраэдр, в работах М. И. Зеликина, Л. Ф. Зеликиной и К. В. Хлюстова (см., например, [11]). Г.3. Аналитические формулы особых траекторий. Согласно замечанию Г.1 для отыскания особых экстремалей по граням, достаточно построить алгоритм отыскания особой экстремали по всему многограннику. Итак, пусть t), t) - траектория, особая по всему многограннику Ω, т.е. x( u( x( G| t) = 0 (Г.3) при t ∈ (t1, t2), и управление не может быть найдено однозначно из принципа максимума Понтря- гина. Однако из определения (Г.1) немедленно следует, что G˙ = G¨ = ... = G(n) = ... = 0. 1Например, бесконечно гладкие. 2Иногда употребляется термин «полуособая экстремаль/траектория по грани Γ». 3Возможно, Γ1 - точка. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 119 Здесь и далее производная берется вдоль траекторий системы (Г.1). Производная может быть вычислена стандартным образом через скобки Пуассона. Однако необходимо действовать акку- ратно; например {G, G , вообще говоря, нулю не равно, так как G(x) является векторнозначной функцией. Дадим строгое определение. Определение Г.2. Пусть F : M→ Tn (U ) и K : M→ Tk (U ) - две тензорнозначные функции. m l m+l Тогда их скобкой Пуассона называется тензорнозначная функция R : M → Tn+k , определяемая формулой1 Rα1...αnγ1...γk α1...αn γ1...γk . β1...βmδ1...δl = Fβ1...βm , Kδ1...δl Прямое вычисление показывает, что это определение корректно, т.е. G действительно является тензором типа (n+k, m+l). Это определение позволяет производить вычисления в бескоординатной форме (например, оно используется для нахождения первых интегралов в гамильтоновых системах классической механики, см. [2, добавление 5]). Линейность скобки Пуассона для функций влечет линейность тензорной скобки Пуассона. Ко- сосимметричность и тождество Якоби записываются в виде β ...β δ ...δ + {F, K α1...αnγ1...γk 1 m 1 l {K, F = 0; γ1...γk α1...αn δ1...δlβ1...βm β ...β δ ...δ ζ ...ζ + {G, {F, K α1...αnγ1...γk γ1...γs 1 m 1 l 1 r {F, {K, G + γ1...γk γ1...γsα1...αn δ1...δlζ1...ζr β1...βm {K, {G, F = 0. γ1...γsα1...αnγ1...γk ζ1...ζr β1...βmδ1...δl Таким образом, {G, G является кососимметрической билинейной формой над U . Найдем производную G вдоль системы (Г.1). По правилу Лейбница получаем ( d \\ G uβ = {H, (G)α + {(G)β, (G)α β + (G)β u˙ . dt α Здесь = t) - управление на особой траектории. Поскольку G| t) = 0 при t ∈ (t1, t2), то u u( x( u. d dt G = {H, G + {G, G (Г.4) По теореме Гоха-Кренера (см. [23]) билинейная форма {G, G должна обращаться в нуль в точках особой траектории: {G, G |x(t) = 0 при t ∈ (t ,t ), (Г.5) и, следовательно, Далее аналогично получаем 1 2 {H, G x(t) | = 0. (Г.6) d {H, G = {H, {H, G + {G, {H, G u = 0. (Г.7) dt u Теперь управление может быть найдено, если { { x(t); в этом случае особое управление билинейная форма G, H, G невырождена в u непрерывно и однозначно находится: t) = OΩ( t)), где OΩ(x) = - {G, u( {H, G x( { -1 |x H, {H, G |x. Будем определять функцию OΩ(x) только в таких точках x, для которых выполняются усло- вия (Г.3), (Г.5) и (Г.6); u( найденное особое управление t) лежит во внутренности Ω. Определение Г.3. Будем говорить, что особая по Ω траектория t), t) имеет первый порядок, если она удовлетворяет условиям 1, 2. x( u( Замечание Г.2. Теорема Гоха-Кренера требует также симметричности и неотрицательной определенности формы ∂ d 2 ∂ (подробнее см. лемму Г.2). ∂u dt 2 ∂u H 1Справа в равенстве стоит классическая скобка Пуассона для функций. 120 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Воспользуемся замечанием Г.1, чтобы найти особую траекторию по некоторой грани Γ. Пусть Γ± - линейное подпространство в U , параллельное A Γ, Γ⊥ - аннулятор Γ± в U ∗. Зафиксируем произвольное u0 ∈ Γ и положим u = u0 + v, где v ∈ Γ±. Тогда H = (H + (G, u0 + (G, v = HΓ + (GΓ, v , где HΓ(x) = H(x) + (G(x), u0 и GΓ(x) = G(x)|Γ! определены для таких x ∈ M, что arg max(G, u ⊆ Γ. Прямым вычислением получаем следующее утверждение. u∈Ω Лемма Г.1 (см. [14, лемма 1]). Пусть t), t) является особой траекторией первого порядка по грани Γ при t ∈ (t1, t2). Тогда x( u( условие (Г.3) превращается в G| t) ∈ Γ при t ∈ (t ,t ); x( условие (Г.6) преобразуется в | {HΓ, G x(t) = ⊥ {H, G | x(t) 1 + {G, G 2 | x(t)u0 ∈ Γ⊥; условие (Г.5) из теоремы Гоха-Кренера означает {G, G |x(t)Γ± ⊆ Γ⊥ при t ∈ (t ,t ). 1 2 uΓ В этом случае особое управление находится их формулы (t) = O x( Γ( t)), где x(t)) = u0 - {GΓ, {HΓ, GΓ x(t) -1{ HΓ, {HΓ, GΓ , |x(t) OΓ( | если форма {GΓ, {HΓ, GΓ x(t) невырождена на Γ±, t) ∈ Γ и (G, v достигает на Γ макси- | u( мума по Ω (а не минимума)1. Для экстремалей первого порядка при стыковке особых траекторий по разным граням харак- терно регулярное поведение управления, т.е. управление терпит разрыв первого рода в точке стыковки2. Рассмотрим экстремаль t), t), которая является особой по грани Γ0 при t ∈ (t0, t1) x( u( и особой по грани Γ1 при t ∈ (t1, t2). Тогда в точке стыковки x0 = x(t1) с очевидностью должны быть выполнены условия 1-3 из леммы Г.1 для обеих граней Γ1 и Γ2. Отметим, что в точке стыковки x0 функция (G(x0), v достигает максимума одновременно в точках v ∈ Γ1 и в точках v ∈ Γ2. Поэтому условие 1 должно быть выполнено в усиленной форме: G|x0 ∈ (conv(Γ0 ∪ Γ1) ⊥, (Г.8) где conv(Γ1 ∪ Γ2) - минимальная грань, содержащая Γ1 и Γ2. Г.4. Поверхности особых экстремалей. Условия 1 и 2 леммы Г.1 определяют в M некото- рую поверхность MΓ, внутри которой должны лежать все особые траектории первого порядка по грани Γ. Необходимое условие Гоха-Кренера - условие 3 из леммы Г.1 - определяет в MΓ Γ поверхность M0 Γ ⊆ MΓ. Особые траектории также не должны покидать и поверхность M0 по теореме Гоха-Кренера. Γ С другой стороны, особое управление uΓ фактически выбирается только в точках M0 из того условия, что траектория гамильтоновой системы (Г.1), (Г.2) не покидает MΓ. Другими словами, uΓ 0 векторное поле, отвечающее гамильтониану H(x, ), должно быть касательным к MΓ в точках Γ MΓ. В ситуации общего положения такое управление может быть выбрано единственным образом, что определяет на M0 единственно возможное векторное поле ξΓ управляемой системы (Г.1), (Г.2), касательное к MΓ. 1Нетрудно видеть, что определение OΓ(x) не зависит от выбора u0 ∈ Γ. 2Для особых экстремалей второго порядка (или вообще любого четного порядка) регулярная стыковка вообще невозможна: ее запрещает обобщенное условие Лежандра-Клебша (см. [8, 25]). ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 121 Γ С другой стороны, условие 3 - теорема Гоха-Кренера - накладывает дополнительные требования типа равенств. Форма {G, G}|Γ! в случае общего положения имеет ранг dim Γ(dim Γ - 1)/2. Значит, если dim Γ /= 0, 1, то M0 0 имеет ненулевую коразмерность в MΓ, codimMΓ MΓ = dim Γ(dim Γ - 1)/2. Поэтому в ситуации общего положения Γ поле ξΓ не будет касаться M0 и, следовательно, траекто- Γ рии системы (Г.1), (Г.2) будут протыкать M0 , и необходимое условие оптимальности будет нарушено (см. рис. 26). Γ Конечно, в M0 Γ поверхность M1 в ситуации общего положения найдется той же коразмерности, в точках которой Γ поле ξΓ будет касательным к M0 . Однако ξΓ не будет касательным к M1 , и траектории покинут M1 , а значит, и M0 . Γ Γ Γ Γ Исключение составляют точки из гиперповерхности M2 в Рис. 26. Структура поверхностей M i M1 1 Γ Γ,в которыхполе ξΓ касается MΓ. Продолжая этот про- цесс, получим, что, вообще говоря, траектории поля ξΓ не Γ будут лежать в M0 в ситуации общего положения. Поэтому в общем случае особые траектории по граням размер- ности больше 1 не оптимальны. Поскольку оптимизационные задачи моделируют процессы, возникающие в реальной жизни, практический интерес представляют только те оптимальные траектории, которые не разрушаются при малом шевелении самой задачи, т.е. неособые траектории и траектории, особые по ребру. Γ Естественный класс систем - это системы, в которых MΓ = M0 . Это так в важном частном случае, когда гамильтонова система (Г.1), (Г.2) получена из оптимизационной задачи управления голономной системой. В следующем пункте мы покажем, что в этом случае необходимое условие Гоха-Кренера (условие 3) будет выполнено автоматически на особых траекториях. Г.5. Голономный случай. Все утверждения и определения в этом пункте носят исключитель- но локальный характер. Однако они будут сформулированы в глобальной форме для упрощения записи. Рассмотрим оптимизационную управляемую динамическую систему на многообразии M q˙ = a(q)+ B(q)u. (Г.9) Здесь q ∈ M , a(q) ∈ Tq M и B(q) ∈ Hom(U, Tq M ) гладко зависят от q ∈ M . Будем считать, что dim M ) dim U = dim Ω. Целевой функционал - терминального типа и не влияет на гамильтонову систему принципа максимума Понтрягина. Определение Г.4. Будем говорить, что управление в системе (Г.9) голономно по грани Γ, если отображение B(q)|Γ! невырождено, а поле плоскостей B(q)Γ± ⊆ Tq M является интегрируемым. Голономность управления по какой-либо грани Γ, вообще говоря, не влечет голономность по подграни Γ ⊂ Γ. Стоит также отметить, что поскольку определенное выше условие голономности никак не зависит от поля a(q), то система (Г.9) может одновременно иметь голономное управление по Ω и быть вполне управляемой. Теорема Г.1 (см. [14, теорема 1]). Если управление в системе (Г.9) голономно по грани Γ, Γ то поверхности MΓ и M0 совпадают. Иными словами, необходимое условие Гоха-Кренера (условие 3 из леммы Г.1) выполнено авто- матически на любой особой траектории, если система (Г.9) голономна по соответствующей грани. Таким образом, в системах с голономным управлением траектории, особые по граням, возникают в ситуации общего положения. Точнее, справедливо следующее утверждение. Следствие Г.1. В системах общего положения вида (Г.9), голономных по грани Γ, множе- ство всех особых по Γ траекторий первого порядка является подмногообразием в расширен- ном фазовом пространстве M = T ∗M коразмерности 2 dim Γ. 122 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Замечание Г.3. Любая управляемая система (Г.9) голономна по любому ребру многогранни- ка Ω. Замечание Г.4. Если система голономна по грани Γ, то из леммы Г.1 можно убрать условие 3: оно является следствием условия 1. Следствие Г.2. Для системы с голономным по Γ управлением функция OΓ(x) корректно определена во всех точках поверхности MΓ, в которых форма {GΓ, {HΓ, GΓ} невырождена. Естественный класс систем - это системы, голономные по любой грани многогранника Ω. Это так, если, например, векторные поля B(x)u коммутируют, когда u пробегает базисные векторы U (или, скажем, вершины Ω). Г.6. Сведение к модельной задаче. В этом пункте будут описаны системы дифференциальных уравнений специального вида на скобки Пуассона, позволяющие (с помощью некоторого раздува- ющего отображения) свести изучение окрестности особой экстремали к оптимальному синтезу в одной модельной задаче оптимального управления. x( Рассмотрим управляемую гамильтонову систему (Г.1), (Г.2), голономную по любой грани мно- гогранника Ω. Пусть x0 ∈M - некоторая точка особой траектории t) первого порядка по всему x(0) u( многограннику Ω, x0 = . Будем предполагать, что особое управление t) непрерывно в x0. Итак, G|x0 = {H, G |x0 = 0, следовательно, {G, G |x0 = 0. Предположим, что набор дифференциалов функций (G)i и {H, G j имеют максимальный ранг в x0: rk dGi, d{H, Gj , = 2 dim Ω. Введем локальную систему координат в окрестности точки x0. Положим z1 = G и z2 = {H, G , z = (z1, z2), и дополним до полной системы переменной w, так что w(x0) = 0. Тогда гамильтонова система (Г.1), (Г.2) переписывается в виде ⎧ (z1, u → max, ⎪ u∈Ω ⎪ ⎨ z˙1 = z2 + εz1u, ⎪ z˙2 = α(z, w)+ β(z, w)u, ⎪⎩ w˙ = R(z, w)+ S(z, w)u. Здесь z1, z2,α ∈ U ∗, β ∈ T2(U ) - билинейная форма: α = {H, {H, G}}, β = {G, {H, G}}, εz1 = εG = {G, G}. (Г.10) Лемма Г.2 (см. [14, лемма 3]). Билинейная форма {G, {H, G}}|x0 = β(0, 0) является симмет- ричной и положительно определенной: β(0, 0) ?-- 0, β(0, 0)[u, v] = β(0, 0)[v, u] ∀u, v ∈ U. u Естественно использовать форму {Gk, {H, Gl}}|x0 = β(0, 0) в качестве скалярного произведения на U . Это задаст отождествление U и U ∗, а форма β(0, 0) запишется как единичная матрица в любом ортонормированной базисе. Взяв -β-1(0, 0)α(0, 0) за начало координат в аффинном про- странстве U , мы можем считать, что α(0, 0) = 0. В новых координатах на U особое управление в точке x0 - это = 0. Оказывается, что поведение переменных z1 и z2 в окрестности особой точки x0 определяет поведение всей системы в целом. Чтобы показать это, воспользуемся процедурой раздутия осо- бенности. Именно эта процедура использовалась для доказательства теорем 6.1 и 6.2 с помощью выделения главных скобок Пуассона, поведение которых моделируется системой принципа макси- мума Понтрягина для модельной задачи (2.1). Итак, пусть 12 2 λ = |z1| + 2 |z2| , z1 = λ ζ1, z2 = λζ2, w = λω, ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 123 т.е. переменные z2 и w имеют первый порядок по раздувающей переменной λ, а z1 - второй1. 1 2 1 2 2 Переменные λ, ζ , ζ , ω лежат на цилиндре |ζ | + 1 |ζ |2 = 1. Точка x0 раздувается на сечение N этого цилиндра гиперплоскостью λ = 0. В новый координатах система (Г.10) запишется в виде \\ ⎧ 1 ((ζ1, ζ2 + λεζ1 ⎪ λ˙ = 2 + (ζ ,α + βu 1 2 = φ(λ, ζ ,ζ , ω), ⎪ ⎪ 2 |ζ1| ⎪ ˙ ⎪ 1 ⎪ λ 2 1 1 ⎪ ζ1 = (ζ - 2φζ + λεζ ) , ⎨ ˙ 1 (Г.11) ⎪ λ 2 ζ2 = (α + βu - φζ ) , ⎪ ⎪ - ⎪ ω˙ ⎪ ⎪ 1 = (F + Gu φω), λ ⎪ (ζ1, u → max . ⎩ u∈Ω Векторное поле ξ = (λ˙ , ζ˙1, ζ˙2, ω˙ ) не продолжается на сечение N гиперплоскостью λ = 0 ввиду наличия особенности типа 1/λ по каждой координате ζ1, ζ2 и ω. Однако интегральные кривые все же могут быть перенесены на сечение N . Дело в том, что траектории векторных полей ξ и λξ совпадают, различаются лишь скорости движения по этим траекториям. Поле же λξ может быть продолжено на гиперплоскость λ = 0. Итак, на N траектории поля λξ удовлетворяют системе ⎧ λ˙ = 0, ⎪ ⎪ ⎪ ζ˙1 = ζ2 - 2φ0ζ1, ⎪ ⎨ ζ˙2 = u - φ0ζ2, (Г.12) ⎪ ω˙ ⎪ ⎪ ( ⎪ = F (0, 0) + G(0, 0)u - φ0ω, Здесь ⎩ ζ1,u → max . u∈Ω \\ 1 ((ζ1, ζ2 ( φ0 = 2 + |ζ1| ζ2,u . Полученная система (Г.12) фактически описывает поведение исходной системы (Г.10) в бесконечно малой окрестности точки x0. Она обладает следующими важными свойствами. Система (Г.12) зависит лишь от значений F (0, 0) и G(0, 0) и не зависит от поведения функций F и G в окрестности точки x0. Поэтому система (Г.12) получится одинаковой во всех задачах с данными значениями F (0, 0) и G(0, 0). Так как переменная ω не входит в правую часть системы (Г.12), то достаточно ограничиться изучением поведения главных переменных ζ1 и ζ2 (которое не зависит от F (0, 0) и G(0, 0)), а переменная ω однозначно найдется из линейного неоднородного дифференциального уравне- ния с переменными коэффициентами ω˙ = a(t)ω + b(t), где a(t) = φ0(ζ1(t), ζ2(t), u(t)) и b(t) = F (0, 0) + G(0, 0)u(t). В следующем пункте приведена задача оптимального управления, уравнения принципа мак- симума Понтрягина в которой полностью совпадают с главной частью (ζ1, ζ2) системы (Г.12). Оптимальный синтез в этой задаче будет построен для не «слишком скошенных» компактных многогранников. После этого в п. Г.8 доказывается теорема о структуре выхода траекторий на особую траекторию первого порядка в ее окрестности (и схода с нее) для систем с голономным управлением. 1Переменные z1, z2 и w должны иметь именно такие порядки относительно раздувающего отображения, чтобы векторное поле системы (Г.10) в новых координатах имело особенность одинакового типа по всем переменным при приближении к гиперплоскости λ = 0. 124 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Г.7. Модельная задача оптимального управления. Рассмотрим следующую задачу: +∞ 1 r J (q) = 2 0 (q(t), q(t) dt → inf, (Г.13) q˙ = u, u ∈ Ω ⊂ U, q(0) = q0. Здесь q и u лежат в евклидовом пространстве U ± Rn, а 0 является внутренней точкой1 Ω. Пусть p - сопряженная к q переменная из принципа максимума Понтрягина; тогда λ0 H = - 2 (q, q + (p, u , 2 т.е. p˙ = λ0q. Если λ0 = 0, то p постоянно, и мы немедленно приходим к противоречию с конечно- стью интеграла (Г.13). Полагая λ0 = 1, получаем H = - 1 (q, q , G = p и ⎧ p˙ = q ⇔ ⎪⎨ q˙ = u ⇔ z˙1 = z2, z˙2 = u, (Г.14) ⎪⎩ (z1, u = (p, u → max . u∈Ω В этой задаче существует ровно одна особая по всему многограннику траектория: q ≡ p ≡ u ≡ 0. Она имеет первый порядок. Поведение оптимальных траекторий в окрестности начала координат является типичным, потому что раздутие данной системы приводит к тем же уравнениям (Г.12) с ω = 0, что и раздутие общей системы (Г.10). Поэтому оптимальные траектории задачи (Г.13) являются модельными для системы (Г.10). Для модельной задачи Г.14, как и для модельной задачи 2.1, можно доказать следующую теорему о структуре оптимального синтеза. Теорема Г.2 (см. [14, теорема 2]). Предположим, что Ω - выпуклое компактное множество (возможно, не многогранник) и 0 ∈ Int Ω. Тогда для любой начальной точки q0 справедливы следующие утверждения. q( Существует и единственна оптимальная траектория t, q0) задачи (Г.13). Сопряженная p( функция t, q0 ) также единственна. айдется такой момент времени T (q0) ) 0, что t, q0) = 0 и t, q0) = 0 при t ) T (q0). Н q( p( Отображение q0 1→ , q0) является локально липшицевым и биективным. p(0 Таким образом, множество всех пар (q0, , q0)) образует в расширенном фазовом пространстве p(0 T ∗M липшицево многообразие M+, однозначно проектирующееся на плоскость {p = 0}. Все оптимальные траектории (и только они) лежат в M+ и приходят в начало координат за конечное время. Других попадающих в начало координат траекторий гамильтоновой системы (Г.14) не существует2. Стоит еще сказать, что замена q 1→ -q, p 1→ p не меняет гамильтониана H, но изменяет знак симплектической формы dq ∧ dp. Поэтому при такой замене траектории гамильтоновой систе- мы (Г.14) переходят в себя, но меняется направление движения по ним. Липшицева поверхность M+ переходит в поверхность M- траекторий, выходящих из начала координат. Найдем теперь особые траектории задачи (Г.13) в случае, когда Ω - многогранник. Рассмотрим p, u, особая по грани Γ при м, t ∈ (t1, t2). Поскольку {G, G ≡ 0, то по лемме Г.1 немедленно получае что ∈ Γ⊥ и ∈ Γ⊥. p q Пусть OΓ - ортогональная проекция начала координат на A Γ. Так как {G, {H, G ≡ id, то u особое управление по Γ равно OΓ, если OΓ ∈ Γ. Определение Г.5. Будем называть многогранник Ω не слишком скошенным, если OΓ ∈ Int Γ для любой грани Γ многогранника Ω. 1Это условие необходимо для локальной управляемости. 2Иначе они были бы оптимальны в силу выпуклости исходной задачи. ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 125 Компактные не слишком скошенные многогранники обладают тем замечательным свойством, что подпространства Γ⊥, ортогональные граням, разрежут «правильным образом» все пространство на секторы, наподобие барицентрического разбиения. А именно, верна следующая лемма. Лемма Г.3 (о барицентрическом разбиении многогранника). Пусть на каждой грани Γ /= Ω выпуклого компактного многогранника Ω ⊆ U , 0 ∈ Int Ω, выбрано по внутренней точке OΓ. Тогда для любой точки q0 ∈ U найдутся такие единственный набор граней Γ1 Γ2 ... Γk Ω и единственный набор положительных чисел λ1 > 0,..., λk > 0, что q0 = λ1OΓ1 + ... + λk OΓk . Множество всех q0 с данным набором граней Γ1 ... Γk будем обозначать через ⎧ ) = cone(Γ1,..., Γk ⎨ ⎩ q0 = k ) j=1 ⎫ j 0 λj OΓ , где λ1 > 0,..., λk > ⎬ . ⎭ В случае не слишком скошенного компактного многогранника Ω линейное пространство U раз- бивается на конусы, ребра которых порождены особыми управлениями OΓi по всем возможным различным наборам вложенных друг в друга гра- ней Γ1 ... Γk Ω. Для любой такой начальной точки q0, q( что -q0 лежит в относительной внутренности cone(Γ1,..., Γk ), оптимальная траектория начи- нает двигаться с управлением, особым по грани Γ1 до тех пор, пока траектория t, q0) не попадет на (k - 1)-мерную грань cone(Γ2,..., Γk ). В этот момент управление скачком переключается на особое управление OΓ2 по грани Γ2, и про- цесс повторяется до момента выхода траектории q( в начало координат (см. рис. 27). Рис. 27. Оптимальная траектория - x) Точнее, имеет место следующая теорема. Теорема Г.3 (см. [14, теорема 3]). Если компактный многогранник Ω является не слишком скошенным, то любая оптимальная траектория t, q0), t, q0) устроена следующим образом. q( u( Пусть Γ1 ⊂ ... ⊂ Γk и λ1 > 0,..., λk > 0 - из предыдущей леммы для точки -q0, т.е. -q0 = λ1OΓ1 + ... + λk OΓk ∈ cone(Γ1,..., Γk ). Тогда найдутся такие моменты времени 0 = t0 < t1 < ... < tk = T (q0), tj = u( t ∈ (tj-1, tj ) управление t, q0) = OΓj и -q(t) = μ(t)OΓj + λj+1OΓj+1 + ... + λk OΓk ∈ cone(Γj, Γj+1,..., Γk ), где μ - линейно убывающая функция от μ(tj-1) = λj до μ(tj ) = 0. j λi, что при i=1 В частности, управление выбирается по принципу обратной связи: t, q0) = t, q0)) = OΓ, q( где u( Γ - грань наименьшей размерности из разложения - t, q0) по лемме Г.3. u(q( Г.8. Структура выхода на особую траекторию и схода с нее. Как было показано ранее, структура решений модельной задачи должна определять поведение траекторий управляемой га- мильтоновой системы (Г.1) в окрестности особой траектории. В предыдущем пункте в модельной задаче были найдены все траектории, выходящие на особую траекторию и сходящие с нее для случая не слишком скошенного компактного многогранника Ω. Для произвольной управляемой системы условие «не слишком скошенности» Ω в точке x0 ∈ MΩ означает следующее: необходимо в пространстве управлений U выбрать в качестве начала координат особое управление в точке x0, а в качестве скалярного произведения - форму {G, {H, G}}|x0 . 126 М. И. ЗЕЛИКИН, Л. В. ЛОКУЦИЕВСКИЙ, Р. ХИЛЬДЕБРАНД Как было доказано в лемме Г.2, в голономном случае форма {G, {H, G}} является симметрич- ной, поэтому следующее определение корректно. Определение Г.6. Будем говорить, что компактный многогранник Ω ⊂ U является не слишком скошенным в точке x0 ∈ MΩ относительно управляемой гамильтоновой системы (Г.1), если форма {G, {H, G}}|x0 является положительно определенной в x0; проекции (относительно скалярного умножения с формой {G, {H, G}}|x0 ) особого управления OΩ(x0) на любую грань Γ попадает строго внутрь этой грани. Рис. 28. Оптимальный синтез в окрестности особой траектории. Естественно, если многогранник Ω является не слишком скошенным в x ∈ MΩ, то он является не слишком скошенным и для любой точки из MΩ, достаточно близкой к x. Итак, в рамках этого ограничения мы докажем следующую теорему, являющуюся обобщением теоремы Г.3 для произвольной управляемой системы (Г.1), (Г.2) с голономным управлением (см. рис. 28). Теорема Г.4 (см. [14, теорема 4]). Пусть t), t), t ∈ (τ1, τ2) - особая траектория по всему x( u( x( t∗ ∗ компактному многограннику Ω управляемой гамильтоновой системы (Г.1), (Г.2) с голоном- ным управлением по каждой грани Ω. При этом форма {G, {H, G}} положительно определена в точке t∗) при t∗ ∈ (τ1, τ2). Если многогранник Ω является не слишком скошенным отно- сительно точки ), то определено следующее семейство траекторий выходящих из t ) и x( x( удовлетворяющих принципу максимума Понтрягина и необходимым условиям Гоха-Кренера: для каждого набора граней Γ1 ⊃ Γ2 ... ⊃ Γk определена траектория x(t), u(t), выходящая из x(t∗) при t> t∗, где x(t∗) = x(t∗), x˙ (t) = u(x(t) , u(x(t) = OΓi (x(t) при t ∈ (ti-1, ti). Здесь t∗ = t0 < t1 < t2 < ... < tk - любой набор моментов времени, лишь бы разница tk -t∗ была достаточно мала. Выход на особую траекторию при t < t∗ устроен аналогично; необходимо лишь изменить направление течения времени и порядок прохождения граней (от большей к меньшей). Замечание Г.5. Мы не проверяем достаточные условия второго порядка в данном приложении, однако скажем о них несколько слов. Рассмотрим случай нормальной траектории (λ0 = 1 и сопря- женный множитель p(t) определен однозначно). На самом деле, поскольку на особой траектории выполняются равенства {G, G} = 0 и {G, {G, G}} = 0, то достаточные условия второго порядка для локального понтрягинского минимума (Π-минимума) фактически совпадают с достаточными ТИПИЧНОСТЬ ФРАКТАЛЬНО-ХАОТИЧЕСКОЙ СТРУКТУРЫ ИНТЕГРАЛЬНЫХ ВОРОНОК 127 условиями слабого локального минимума (см. [3]). Последние же в нашем случае требуют положи- тельной определенности формы {G, {H, G}} (которая имеет место) вкупе с некоторыми условиями трансверсальности на концах траектории. Поэтому проверка достаточных условий в конкретных примерах сведется к проверке граничных условий и не должна вызвать затруднений (подробнее см. [4]) Теорема Г.4 дает наглядное описание поверхностей MΓ: для произвольной грани Γ0 в окрест- ности MΓ0 поверхности MΓ по всем Γ Γ0 примыкают друг к другу по MΓ0 (см. рис. 28).×
Об авторах
М. И. Зеликин
Московский государственный университет им. М. В. Ломоносова
Email: mzelikin@mtu-net.ru
Москва, Россия
Л. В. Локуциевский
Московский государственный университет им. М. В. Ломоносова
Email: lion.lokut@gmail.com
Москва, Россия
Р. Хильдебранд
Институт прикладного анализа и стохастики им. К.Вейерштрасса
Email: hildebra@wias-berlin.de
Berlin, Germany
Список литературы
- Аграчев А. А., Гамкрелидзе Р. В. Принцип оптимальности второго порядка для задачи быстродействия// Мат. сб. - 1976. - 100 (142 ), № 4 (8). - С. 610-643.
- Арнольд В. И. Математические методы классической механики. - М.: Едиториал УРСС, 1989.
- Дмитрук А. В. Квадратичные условия понтрягинского минимума в задаче оптимального управления, линейной по управлению. I. Теорема о расшифровке// Изв. АН СССР. Сер. мат. - 1986. - 50, № 2. - С. 284-312.
- Дмитрук А. В. Квадратичные достаточные условия минимальности анормальных субримановых геодезических// Итоги науки и техн. Сер. Совр. мат. прилож. - 1999. - 4.- С. 5-89.
- Зарисский О., Самюэль П. Коммутативная алгебра. Т. 1. - М.: Изд-во иностр. лит., 1963.
- Зеликин М. И., Борисов В. Ф. Особые оптимальные режимы в задачах математической экономики// Итоги навки и техн. Сер. Совр. мат. и ее прилож. - 2003. - 11. - С. 3-161.
- Зеликин М. И., Киселев Д. Д., Локуциевский Л. В. Оптимальное управление и теория Галуа// Мат. сб. - 2013. - 204, № 11. - С. 83-98.
- Зеликин М. И., Локуциевский Л. В., Хильдебранд Р. Геометрия окрестностей особых экстремалей в задачах с многомерным управлением// Тр. МИАН. - 2012. - 277. - С. 74-90.
- Зеликин М. И., Локуциевский Л. В., Хильдебранд Р. Стохастическая динамика алгебр Ли скобок Пуассона в окрестности точки негладкости гамильтониана// Докл. РАН. - 2013. - 450, № 1. - С. 1- 6.
- Зеликин М. И., Мельников Н.Б., Хильдебранд Р. Топологическая структура фазового портрета типичного слоя оптимального синтеза для задач с накоплением переключений// Тр. МИАН. - 2001. - 233. - С. 125-152.
- Зеликина Л. Ф., Зеликин М. И., Хлюстов К. В. Особые стратифицированные многообразия для инволютивных управляемых систем// Дифф. уравн. - 2001. - 37, № 9. - C. 1161-1167.
- Каток А. Б., Хасселблат Б. Введение в современную теорию динамических систем. - М.: Факториал, 1999.
- Локуциевский Л. В. Гамильтоновость потока особых траекторий// Мат. сб. - 2014. - 205, № 3. - С. 133-160.
- Локуциевский Л. В. Особые режимы в управляемых системах с многомерным управлением из многогранника// Изв. РАН. Сер. мат. - 2014. - 78, № 5. - С. 167-190.
- Милютин А. А., Илютович А. Е., Осмоловский Н. П., Чуканов С. В. Оптимальное управление в линейных системах. - М.: Наука, 1993.
- Мищенко А. С., Фоменко А. Т. Обобщенный метод Лиувилля интегрирования гамильтоновых систем// Функц. анализ и его прилож. - 1978. - 12, № 2. - С. 46-56.
- Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. - М.: Наука, 1969.
- Филиппов А. Ф. Дифференциальные уравнения с разрывной правой частью. - М.: Наука, 1985.
- Falconer K. Fractal Geometry. Mathematical Foundations and Applications. - Chichester: Wiley, 2003.
- Fuller A. T. Dimensional properties of optimal and sub-optimal nonlinear control systems// J. Franklin Inst. - 1970. - 289. - С. 379-393.
- Hildebrand R., Lokutsievskiy L. V., Zelikin M. I. Generic fractal structure of nite parts of trajectories of piecewise smooth hamiltonian systems// Russ. J. Math. Phys. - 2013. - 20, № 1. - С. 25-32.
- Kelley H. J., Kopp R. E., Moyer H. G. Singular extremals// В сб.: «Topics in Optimization». - N.Y.: Academic Press, 1967. - С. 63-101.
- Krener A. J. The high order maximum principle and its application to singular extremals// SIAM J. Control Optim. - 1977. - 15, № 2. - С. 256-293.
- Kupka I. Fuller’s phenomena// В сб.: «Progr. Systems Control Theory». - Boston: Birkha¨user, 1990. - С. 129-142.
- Lewis R. M. Defenitions of order and junction condition in singular control problems// SIAM J. Control Optim. - 1980. - 18, № 1. - С. 21-32.
- Lokutsievskiy L. V. Generic structure of the lagrangian manifold in chattering problems// Sb. Math. - 2014. - 205, № 3. - С. 432-458.
- Lokutsievskii L. V., Zelikin M. I., Hildebrand R. Fractal structure of hyperbolic Lipschitzian dynamical systems// Russ. J. Math. Phys. - 2012. - 19, № 1. - С. 27-44.
- Marchal C. Chattering arcs and chattering controls// J. Optim. Theory Appl. - 1973. - 11, № 5. - С. 441- 468.
- McDannel J. P., Powers W. F. Necessary conditions for joining optimal singular and non-singular subarcs// SIAM J. Control Optim. - 1971. - 9. - С. 161-173.
- Zelikin M. I., Borisov V. F. Theory of chattering control with applications to astronautics, robotics, economics, and engineering. - Boston: Birkha¨user, 1994.