Цифровая экономика: коммуникации с использованием нейронных сетей в международном общении
- Авторы: Стренина М.А.1
-
Учреждения:
- ООО «Трансинк»
- Выпуск: Том 28, № 3 (2020)
- Страницы: 547-555
- Раздел: ИННОВАЦИИ В СОВРЕМЕННОЙ ЭКОНОМИКЕ
- URL: https://journals.rudn.ru/economics/article/view/24672
- DOI: https://doi.org/10.22363/2313-2329-2020-28-3-547-555
Цитировать
Полный текст
Аннотация
В статье рассматриваются теоретические и практические вопросы разработки, реализации и совершенствования технологических решений для голосовой коммуникации людей, говорящих на иностранных языках с применением синхронного машинного перевода, а также потенциальные направления развития данных программ для проведения международных конференций, семинаров, бизнес-встреч, образования в зарубежных вузах. Описан конкретный опыт реализации научно-технологического проекта по созданию программного обеспечения и приложений, осуществляемый в рамках инновационного проекта российского Фонда развития инноваций. Проанализированы перспективы данного вида технологий и продуктов в России в условиях создания цифровой экономики.
Полный текст
Введение Сегодня в мире и в России существуют различные средства коммуникации и передачи информации. Ключевой необходимостью для развития циф- ровой экономики и бизнеса является коммуникация с партнерами в ближнем и дальнем зарубежье. В условиях жесткой конкуренции на рынках многие компании, банки и предприниматели используют в основном английский язык при работе с партнерами или зарубежными клиентами. Однако существует большое количество стран, где предпочитают коммуницировать на родном языке, и немногие владеют английским языком или несколькими иностранными языками (Китай, Индия, страны Латинской Америки, Италия, Испания, Турция, Греция, страны Средней Азии и т. д.). Для российских компаний и банков также очень важно расширить свои возможности выхода на новые рынки, быстро и доступно осуществлять связи и общение со своими иностранными клиентами, партнерами либо осваивать новый внешний рынок. © Стренина М.А., 2020 This work is licensed under a Creative Commons Attribution 4.0 International License https://creativecommons.org/licenses/by/4.0/ Имеющиеся на мировом рынке технологии пока не применяют передачу звука, его распознавание и перевод в телекоммуникационных сетях. Частично можно отнести к такой связи Skype, но он работает только при наличии установленного одноименного приложения, мало используется в бизнесе и имеет ряд ограничений в различных регионах мира. Передачи голоса с синхронным переводом на иностранный язык в IP-телефонии пока не осуществляется. Разработка программных продуктов и приложений различного направления применения с машинным голосовым переводом (на базе нейронных сетей) является актуальной и необходимой в новых условиях развития мировой экономики и сферы коммуникации в целом. Обзор литературы Развитие технологий и создание приложений и платформ, которые по- зволяют охватывать большую целевую аудиторию и также более специализированные потребительские группы, рассматриваются в научной литературе уже достаточно долгое время. Так, в своих научных публикациях А.Н. Жуковская и А.С. Заушицина анализируют решения для создания специализированных кроссплатформенных мобильных приложений по отображению работы станков на заводе для сотрудников отделов автоматизации. А.В. Черниченко создал модель системы, которая позволяет в дальнейшем адаптировать разрабатываемые платформы для коммуникации для различных внешних устройств. То есть создавая мобильное приложение, либо алгоритм ПО для платформы текстового или голосового перевода, либо мобильное приложение, при дальнейшей разработке новых продуктов и услуг по коммуникации с прямым переводом ядро ПО не нужно переделывать или разрабатывать новое ПО для новых устройств, новых модификаций устройств, которые имеются или появляются на рынке коммуникаций. Данный принцип был взят за основу при разработке алгоритма Transync - программы коммуникации, поскольку, на наш взгляд, это является оптимальным решением для развития различных продуктов и подключения в дальнейшем новых внешних компонентов. О возможностях и способах синхронизации передачи голосового и текстового потока с одновременной передачей и распознаванием иностранного языка написано много. В частности, К.А. Оськина в своей работе «Мультиязыковая типология семантем концепта “Новейшие информационные технологии”» подробно рассмотрела и предложила варианты решения применения различных языковых баз перевода и их соединения с машинным переводом. В отдельной статье проанализировать все, что написано и разработано наукой в области коммуникации и голосового машинного перевода, не представляется возможным. Это подчеркивает тот факт, что на протяжении не менее пятнадцати лет в России ведутся научные и технологические разработки по созданию различных систем, платформ, мобильных приложений, которые позволяют выполнять узкоспециализированые и широкие задачи в области как экономики в целом, так и коммуникации. Объем рынка цифровых коммуникаций РФ: анализ современного состояния и перспектив развития отрасли цифровой коммуникации Согласно данным международных статистических агентств Discovery Re- search Group, J’son & Partners и TelecomDaily[38], на конец 2017 - начало 2018 г. объем рынка IP-телефонии в России оценивается в 7,9 млрд руб. В начале 2017 г. объем сегмента виртуальных АТС составил 3,8 млрд руб., а среднегодовой темп роста зафиксирован на уровне 30 %. По данным Discovery Research Group, рост рынка виртуальных АТС в России продолжится до 2021 г. и достигнет 9,7 млрд руб., тогда как рынок IP-телефонии в целом к 2021 г. вырастет до 14,2 млрд руб. Как отмечают аналитики, российский рынок IPтелефонии, хотя и отстает от мирового (по оценкам экспертов на 1-3 года), развивается в рамках глобальных тенденций. Лидерами по количеству клиентов на российском рынке виртуальных АТС стали «Манго Телеком» (25 % от доли рынка) и МТС (16 %). На третьем месте разместилась компания UIScom (11 %). За ней следуют «Телфин» и «Зебра Телеком» (по 10 % от рынка), МТТ (9,8 %), MCN Telecom (4,7 %). У новичка сегмента - «Яндекс.Телефонии» - 4,5 %. Прочие компании занимают 7,4 % от рынка. Рост рынка виртуальных АТС будет происходить на фоне снижения рынка фиксированной телефонии в сегменте B2B. Падение доходов в этом сегменте на протяжении рассматриваемого периода, согласно оценкам J’son & Part- ners, ожидается со среднегодовым темпом около 2 %. Динамично развивающийся рынок виртуальных АТС, который показывает рост за последние годы, привлекает внимание новых игроков и мобилизует работу ведущих компаний. Основными участниками рынка виртуальных АТС Москвы являются специализированные игроки: «Манго Телеком», «Телфин», UIScom, YouMagic (МТТ), «Яндекс.Телефония», Zebra Telecom, Octoline и «Гравител». Также свои услуги по части виртуальных/облачных АТС предлагают крупные операторы услуг корпоративной телефонии: «Билайн. Бизнес», МТС, «Мегафон» и «Ростелеком», но, как правило, в комплексе с основными услугами. Рынок услуг виртуальной АТС в Москве достаточно хорошо развит, здесь присутствуют и специализированные игроки, и федеральные операторы телеком-услуг, но первые предоставляют более комплексное предложение, позволяя пакетом выбирать как тарифы на аренду АТС, так и виртуальные номера. По удобству и простоте начала работы специализированные операторы также предстают в более выгодном свете, так как ряд компаний, например Mango Office, Zebra Telecom, «Яндекс.Телефония», Octoline и «Гравител», позволяют начать использовать услуги сразу после простой регистрации и пополнения счета (иногда оно не требуется). Все провайдеры предлагают широкий спектр возможностей оплаты услуг: по умолчанию это электронные деньги, банковские карты и безналичные переводы. Максимальное количество способов оплаты предлагает «Телфин». В корпоративном сегменте основную долю доходов занимают услуги междугородной и международной связи в IP-сетях, на услуги виртуальных АТС пришлось 45 % рынка. Более 90 % российского рынка виртуальных АТС в 2017 г. было сосредоточено в двух крупнейших городах - Москве и Санкт-Петербурге. Действующее регулирование отрасли связи в России имеет ярко выраженный «телефонный характер», что заставляет операторов строить сети по правилам телефонной иерархии. Это противоречит идее развития IP-сетей, одноранговых по своей природе. А интересы бизнеса и пользователей диктуют операторам необходимость развития IP-сетей, IP-технологий и IP-сервисов, в том числе и IP-телефонии. Число пользователей интернета в России достигло к 2020 г. 86,7 млн чел. Согласно международной статистике, Россия входит в десятку стран с самым недорогим широкополосным интернетом в мире и занимает третье место в списке. Большинство операторов связи переориентируются на корпоративный сегмент. Для предприятий и организаций пока еще не представляется возможным отказаться от городского номера. Учитывая, что в новые строящиеся офисы телефонный кабель прокладывают опционально, а сеть передачи данных в обязательном порядке, развитие корпоративного сектора IPтелефонии будет продолжаться и дальше. Крупнейшими разработчиками и поставщиками продуктов с прямым машинным переводом (в основном мобильные приложения для голосовых звонков и текстовых сообщений) являются: 1) Google - новая версия переводчика Translate. Приложение позволяет переводить меню и объявления, а также живую речь в режиме реального времени. Доступен моментальный перевод с английского на русский, французский, немецкий, итальянский, португальский и испанский языки, а также с этих языков на английский. Возможен перевод разговоров, для чего нужно переключить приложение в режим голосового перевода. Всего в базе приложения - 38 языков, включая русский. Недостатки: необходимость наличия программы переводчика в мобильном телефоне, перевод только при личном общении говорящих, ограниченное количество языков, невозможность звонков на стационарные телефоны; 2) DROTR - мобильное приложение для чата, звонков на мобильную связь с переводом. Звонки доступны только при наличии данного мобильного приложения. Ограничение по количеству языков перевода - 44 иностранных языка. Звонки на IP-телефоны не выполняются. Нет платформы звонков только для стационарных телефонов; 3) переводчик Skype - голосовые звонки с поддержкой только 8 языков. Доступ на устройствах с Windows 7 и выше. Перевод чата на 50 языков. Недостатки: необходимость обязательного наличия Skype у собеседников, небольшое количество языков перевода, ограниченное использование у корпоративных клиентов для проведения деловых встреч, переговоров. Основной сегмент потребительского рынка в РФ - корпоративные клиенты, использующие коммуникацию через виртуальные АТС, и абоненты, имеющие обычный телефонный аппарат, который подключен по технологии ADSL или FTTB, с роутером со встроенным VoIP шлюзом. В случае если у абонента технология FTTB, то достаточно наличия телефонного аппарата SIP. Основные корпоративные пользователи коммуникационных услуг ведущих провайдеров в Москве и регионах - Мегафон (МультифонБизнес, виртуальная АТС), МТС (SIP телефония для офисов), Ростелеком. Основные корпоративные сегменты потребителей: компании-экспортеры и посредники во внешнеэкономической деятельности, филиалы иностранных компаний, банки (для своих корпоративных клиентов), отели, университеты (в первую очередь университеты - участники Проекта 5-100). Рынок потребления в РФ выглядит следующим образом: объем рынка IP-телефонии составил 7,9 млрд руб. на 2017 г., объем сегмента виртуальных АТС (ВАТС) достиг 3,8 млрд руб., а среднегодовой темп роста зафиксирован на уровне 30 %. Лидерами по количеству клиентов на российском рынке виртуальных АТС стали «Манго Телеком» - 25 % и МТС (ПАО «Мобильные ТелеСистемы») - 16 %. Объем российского рынка виртуальных АТС по итогам 2017 г. равен 4,4 млрд руб. В 2018 г. рынок вырос на 10 % (официальная оценка спроса ГК «Финам»)[39]. Программный продукт и разработка платформы для голосовой коммуникации с синхронным машинным переводом на иностранный язык Развитие и распространение мобильных платформ и эволюция их возможностей в мире и в РФ позволяет разрабатывать новые программные продукты и технологии, дающие широкий спектр возможностей для общения людей в разных точках мира и на разных языках. В рамках российской инновационной программы была начата разработка алгоритма программного обеспечения и внедрение технологии передачи голоса с синхронным переводом на базе нейронных сетей для мобильных платформ IOS и Android. Программный продукт Transync позволяет создать не только мобильное приложение для прямого телефонного диалога людей, говорящих на разных языках, но и предполагает в дальнейшем подготовку различных видов продуктов для широкого спектра коммуникаций в бизнесе, образовании, медицине, культуре. Разрабатываются архитектура программного обеспечения и базы данных для хранения голосовых звонков на мобильную связь, текстовых сообщений и данных пользователей, а также программный код, позволяющий распределять потоки звонков и сообщений на сервер. Программное обеспечение дает возможность осуществлять распознавание голоса, его одновременный перевод на иностранный язык и передачу голосового потока через сервер на принимающие клиентские устройства. Алгоритм ПО с использованием машинного перевода позволяет пользователю каждый раз улучшать качество получаемого перевода, так как голос и особенности произношения запоминаются и распознаются машиной, которая, в свою очередь, самообучается и совершенствует перевод данного пользователя на иностранный язык. Распознавание голоса и его передача на принимающее устройство с одновременным переводом на иностранный язык осуществляется по следующей схеме (см. рисунок): 1) аудиопоток отправляется на медиасервер с установленным ПО Wowza Streaming Engine; 2) аудио/видеоданные отправляются на устройство вызываемого абонента и одновременно с этим аудиопоток дублируется на основной сервер для дальнейшего распознавания и перевода; 3) основной сервер передает полученный аудиопоток в Google Cloud Platform, посредством Speech API происходит распознавание речи, после чего распознанный текст возвращается на основной сервер; 4) выполняется перевод распознанного текста на язык вызываемого абонента с помощью Google Cloud Platform Translate API; 5) основной сервер сохраняет данные о переводе в базу данных Firebase Realtime Datebase; 6) устройство вызываемого абонента получает данные о переводе и произносит речь абоненту, используя встроенный возможности iOS и Android устройства. Рисунок. Схема передачи голосового потока с синхронным переводом с одного мобильного устройства на другое с использованием алгоритма ПО Transyc [Figure. Voice stream transmission scheme with simultaneous translation from one mobile device to another using the Transyc software algorithm] Источник: составлено на основе авторских разработок ООО «Трансинк», 2019. Официальный сайт Фонда содействия инновациям - www.fasie.ru Была спроектирована база данных для хранения сведений о пользователях, чатах и телефонных разговорах, основанная на сервисе Firebase Realtime Database. Выбор данного сервиса обусловлен опцией получения информации об изменениях в базе данных в режиме реального времени серверным и клиентскими приложениями. Возможности, которые дает данный алгоритм для дальнейшей разработки различный продуктов и подключения внешних платформ: - мобильное приложение для широкого круга пользователей, осуществ-ляющих звонки за рубеж, деловое и частное общение с иностранцами; - система «одного устройства», позволяющая вести прямой диалог че-рез наушники во время путешествий и деловых поездок в различные страны; - платформы и облачные АТС для звонков с мобильного телефона на IP-телефоны для бизнес-общения; - специализированные платформы для проведения деловых перегово-ров, конференций, бизнес-семинаров, выставок с использованием голосового машинного перевода; - специализированные платформы для проведения профессиональных коммуникаций и деловых контактов в области медицины и здравоохранения с разработкой собственной базы перевода с узким направлением, которого нет на сегодняшний день в глобальном переводчике Google; - специализированные платформы для дистанционного обучения и по-вышения квалификации в российских и зарубежных вузах, также с синхронным голосовым переводом на базе нейронной сети. Таким образом, как в России, так и в мире имеются емкий рынок и потенциал развития продуктов на основе коммуникации с использованием ма- шинного голосового перевода в различных сферах. Заключение В условиях развития цифрового направления мировой экономики, широкого использования потребителями мобильной связи, IP-телефонии, с учетом текущего санитарного кризиса можно сделать вывод, что развитие средств и технологий коммуникации, которые позволяют обычным людям, компаниям, научным группам, университетам существенно расширить свои профессиональные, деловые и культурные контакты независимо от условий функционирования мирового рынка и осуществлять общение без каких-либо ограничений, является востребованным и перспективным.
Об авторах
Мария Александровна Стренина
ООО «Трансинк»
Автор, ответственный за переписку.
Email: mashyagoda@gmail.com
кандидат экономических наука, доцент, экспертаналитик и соорганизатор инновационного проекта
Российская Федерация, 107014, Москва, ул. 1-я Боевская, д. 2/12, стр. 4Список литературы
- Аналитические обзоры ГК «Финам». 2018-2019. URL: www.finam.ru (дата обращения: 15.05.2020)
- Жуковская А.Н., Заушицина А.С. Особенности разработки кроссплатформенных мобильных приложений // Решетневские чтения. 2017. Т. 2. С. 330-331
- Научно-технические материалы инновационной компании ООО «Трансинк» - Фонд содействия инновациям. М., 2019-2020. URL: http://fasie.ru (дата обращения: 15.05.2020)
- Обзор телекоммуникационных, облачных и ИТ-рынков в сегменте B2B в России, 2014-2018 гг., прогноз до 2022 г. URL: https://json.tv/ict_telecom_analytics_view/ obzor-telekommunikatsionnyh-oblachnyh-i-it-rynkov-v-segmente-b2b-v-rossii-20142018-gg-prognoz-do-2022-g-20200415041014 (дата обращения: 15.05.2020)
- Оськина Н.А. Мультиязыковая типология семантем концепта «новейшие информационные технологии: дис. ... канд. филол. наук. М.: Московский государственный лингвистический университет, 2017. С. 172
- Русанова И.В. Анализ платформ для разработки гибридного мобильного приложения для систем iOS и Android // Актуальные проблемы авиации и космонавтики. 2017. Т. 3. № 13. С. 1100-1102
- Самойлов А.Г. Перспективные технологии в средствах передачи информации // Материалы 13-й Научно-технической конференции ПТСПИ - 2019 / Владимирский гос. университет: в 2 т. Т. 2. Владимир: ВлГУ, 2019
- Чередниченко А.В. Технологии создания адаптируемых систем обработки информации // Программные продукты и системы. 2010. № 3. С. 82-85