The development of machine-aided translation and its place in the professional cross-cultural communication

Cover Page

Abstract


It takes time and effort to make a highly qualified translator. But currently there is a great demand in skills of qualified translators in professional cross-cultural communication. So machine-aided translation could solve the problem. Today it is impossible to overestimate the significance and prospects of the machine-aided translation for this purpose. The paper describes the main stages of the machine-aided translation development, evaluates its advantages and disadvantages, its future opportunities for professional cross-cultural communication and provides the results of the explanotary study. The authors believe that this technology will facilitate teaching English for professional needs as LSP.

Введение Каждое занятие по иностранному языку - это перекресток культур, это практика межкультурной коммуникации, потому что каждое иностранное слово отражает иностранный мир и иностранную культуру: за каждым словом стоит обусловленное национальным сознанием представление о мире [14]. Перевод имеет важное значение для правильного восприятия мира с его многогранностью и для межкультурной коммуникации. Но в общении между специалистами из разных стран по-прежнему имеют место языковые барьеры или трудности перевода. При обучении английскому языку в университетах, в том числе и технических, основное внимание отводится традиционным методам преодоления языковых барьеров - это обучению переводу на разных этапах подготовки специалистов. Следует признать, что с ростом экономических, политических и культурных связей между странами повышается и интенсивность информационных потоков между ними, и этих методов становятся уже недостаточно. Расширение международного сотрудничества делает проблему оперативного перевода корреспонденции, деловых предложений и контрактов и т.д. особо актуальной. И одним из решений этой проблемы может быть создание и развитие систем машинного перевода, которые могли бы стать эффективным инструментом в работе специалистов различных профилей. Цель данной статьи - дать краткий обзор основных этапов и подходов в развитии машинного перевода (МП), сравнить уже существующие системы МП и оценить возможности машинного перевода для профессиональной межкультурной коммуникации. Проблемами МП занимались многие исследователи и практики [1-3; 6; 7; 11], но стремительно развивающиеся информационные технологии изменили подход к МП и расширили сферу его применения, а современных работ, которые представили бы целостную картину развития МП и его современные возможности в сфере профессиональной коммуникации, к сожалению, нет. Решая задачу машинного перевода, необходимо учитывать богатый опыт межкультурного общения и опыт переводческой деятельности, накопленный человечеством. Истоки возникновения машинного перевода Нужно отметить, что перевод как ремесло имеет долгую историю, и своими корнями он восходит к тем далеким временам, когда несколько языков могли выступать в роли посредников при общении представителей разных языковых общин. Круг деятельности, охватываемой понятием «перевод», очень широк. Переводятся с одного языка на другой стихи, художественная проза, научные и научно-технические книги, статьи из самых разных областей знания, документы, деловые бумаги, выступления и обсуждения профессионалов, разговаривающих на разных языках и вынужденных прибегать к помощи посредника - «толмача». Так что же такое перевод? Переводом называют процесс и результат создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке. При этом коммуникативная равноценность, или эквивалентность, понимается как такое качество текста перевода, которое позволяет ему выступать в процессе общения носителей разных языков в качестве полноправной замены исходного текста (оригинала) в сфере действия языка перевода [1]. В последнее время многим стало очевидно, что знание иностранных языков может понадобиться не только в путешествии или на приеме гостей, для участия в научных конференциях или обмене мнениями с коллегами, но и в собственном доме, например, при просмотре популярных зарубежных кинолент, при чтении инструкций по использованию техники, или чтении популярных Web-страниц по интересующей тематике. Оказывается, что, даже не покидая родных стен, мы нуждаемся в услугах переводчика. И необходимую помощь нам вполне может оказать домашний компьютер. Системы машинного перевода давно перестали быть диковинкой, вместо бессвязного текста они начинают изъясняться на вполне понятном, «человеческом» языке. Еще совсем недавно такие программы были не только очень дорогостоящими, но и весьма сложными и капризными в применении. И вот появились первые переводчики, пригодные для использования на домашнем компьютере (ПК). Но можно ли доверять таким переводам? Учитывают ли они профессиональную и культурную специфику? Возможность механизации такого казавшегося рутинным умственного труда, как перевод, давно привлекала внимание. По свидетельству биографов, еще выдающийся математик XIX в. Чарльз Бэббидж пытался убедить британское правительство в необходимости финансировать его исследования по разработке «вычислительной машины». В числе прочих благ он обещал, что когда-нибудь эта машина сможет автоматически переводить разговорную речь [9]. Основные этапы развития машинного перевода Развитие машинного перевода и его современное состояние можно представить как диалектическое взаимодействие, борьбу двух основных направлений, двух подходов к проблеме. Эти подходы определяются тем, что берется за основу системы описания входного языка для конечной цели перехода к выходному естественному языку в условиях сохранения содержания, смысла переводимого текста. Первый подход характеризуется использованием максимально универсального мощного языка смысла. К нему можно отнести метод «семантических множителей, тезаурусный метод, метод фильтров, анализ через синтез, модель «смысл-текст» и прочие. Второй подход, который хронологически возник раньше первого, был создан математиками и инженерами; теперь, когда мы оцениваем высказанные в то время соображения, следует признать, что интуиция и здравый смысл дали возможность уже в то время сформулировать важные индуктивные концепции. Этот подход базируется на таком представлении о промежуточном языке, которое близко к идее переводных соответствий на чисто языковом уровне. Методическая суть этого подхода: изучение индивидуального поведения языковых единиц, особенно в языковом контексте; моделирование человеческого владения языком, особенно в процессе межъязыкового перевода; переход от простого, легко формализуемого, находящегося на поверхности, к более сложному, формализация которого достигается постепенно, последовательным движением от простого [6; 11]. История машинного перевода как научно-прикладного направления началась в середине прошлого века. В 1933 г. было запатентовано механизированное переводное устройство П.П. Смирнова-Троянского, своего рода лингвистический арифмометр. В марте 1947 г. Уоррен Уивер, директор отделения естественных наук Рокфеллеровского фонда, в переписке с Эдрю Бутом и Норбертом Винером впервые сформулировал концепцию машинного перевода (МП), которую несколько позже (в 1949 г.) развил в своем меморандуме, адресованном Фонду [16]. Собственно МП начинается с применения электронных вычислительных машин (ЭВМ) к обработке текстов на естественных языках. Эта идея основывалась на успехах, достигнутых в применении ЭВМ к криптографическим задачам. В 1946 г. в дискуссии между У. Уивером и А.Д. Бутом было высказано предположение, что основные элементы языка могут быть обнаружены с помощью устройств, разработанных во время Второй мировой войны и предназначенных для расшифровки секретных кодов противника [12]. После публикации работ К. Шеннона по математической теории связи [17], оказавших большое влияние на развитие математической теории информации, были сделаны попытки применить к анализу языка инструментарий средств, пригодных для обнаружения общих свойств кодов, и машинный перевод рассматривался как еще одна область применения техники дешифрования. При этом важно, что предполагалось осуществить обнаружение на первых порах самых общих свойств «кода». В меморандуме У. Уивера - одном из исходных документов, от которых началось развитие машинного перевода, - приводится пример дешифрования и отмечается важное качество языковых сообщений, а именно инвариантность языковых характеристик на разных уровнях, позволяющая найти хотя бы самые общие свойства кода: «...Можно было догадаться, что при расшифровке использовалась частотность букв и комбинаций букв, которые почти не зависят от того, каким языком написан зашифрованный текст. Сразу же возникает предположение, что на том этапе, когда человек изобретал и развивал языки, возникли некоторые их инвариантные свойства, которые опять-таки неточно, но до некоторой статистически полезной степени присущи всем языкам» [12]. Порядок установления иерархии языковых уровней в общем случае переустройства системы знаков может быть иной - не от низших уровней к высшим, а от общих уровней к частным. Можно считать, что на становление и развитие машинного перевода оказал влияние криптоанализ. Процесс криптоанализа подразумевает совместную работу человека и ЭВМ; работа аналитика состоит из рутинной обработки больших массивов текста в непрерывной связи с тонкими умственными догадками, требующими лингвистической интуиции и знаний культурных особенностей. Датой рождения МП (как области исследований) принято считать 1947 г., когда А.Д. Бут и Д.Г.В. Бриттен разработали подробный «код» для пословного машинного перевода. Через год Р.Г. Риченс предложил правила разбиения словоформ на основу и окончание. В 1952 г. состоялась первая конференция, организованная знаменитым математиком Бар-Хиллелем, на которой исследователи обменялись мыслями относительно организации множества синтаксических правил языка, способов описания семантики, морфологических структур, структуры словарей для систем перевода. Достижения в академических исследованиях стимулировали коммерческий интерес к проблеме МП, и фирма IBM совместно с Джорджтаунским университетом в США в 1954 г. в Нью-Йорке представили первую систему МП - IBM Mark II (это событие вошло в историю как Джорджтаунский эксперимент). Представленная программа была очень ограниченна в своих возможностях: она имела словарь в 250 единиц и всего 6 грамматических правил. Тем не менее, был осуществлен первый публичный эксперимент по машинному переводу: были переведены 49 специально подготовленных и отобранных русских предложений на английский язык. Этот эксперимент положил начало исследовательскому буму, и в последующие 10 лет правительство и военные ведомства США затратили на исследования в области МП около 40 млн долларов. Казалось, что создание систем качественного автоматического перевода вполне достижимо в пределах нескольких лет, при этом акцент делался на развитии полностью автоматических систем, обеспечивающих высококачественные переводы; участие человека на этапе постредактирования расценивалось как временный компромисс. Таким образом, историю машинного перевода можно разделить на три периода: 1946-1957 гг., 1957-1967 гг., 1967 - настоящее время. Первый период включает появление идеи и связанный с этим энтузиазм. Особое внимание отводилось построению машинных словарей, хотя уже складывались представления об алгоритмах морфологического, синтаксического, лексического анализа для МП. Если кратко подвести основные итоги этого периода, то они выглядели бы следующим образом: - выдвинута концепция языка как кода; - созданы первые машинные словари для МП экспериментального характера; - разработано общее представление об МП, включающее машинный словарь, алгоритмы анализа и синтеза, программное обеспечение; - созданы и опробованы первые экспериментальные системы МП, которые хотя и носили рекламный характер, обладали рядом существенных черт для систем МП. Наиболее плодотворный второй период в истории развития МП закончился в некотором смысле декларированным отходом от МП как проблемы. В 1967 г. специально созданная Комиссия Национальной Академии Наук США признала машинный перевод нерентабельным, что существенно затормозило исследования в этой области. И в СССР развивались исследования в области машинного перевода. После демонстрации системы IBM Mark II группа ученых ВИНИТИ начала разработку системы машинного перевода для машины БЭСМ, и первый образец перевода с английского на русский язык был получен к концу 1955 г. Другое направление работ возникло в Отделении прикладной математики Математического института АН СССР (ныне ИПМ им. М.В. Келдыша РАН) по инициативе А.А. Ляпунова. Первые программы машинного перевода, разработанные этим коллективом, были реализованы на машине «Стрела». Благодаря работе над созданием систем МП оформилось такое направление, как прикладная лингвистика [13]. Более пристальное внимание к разработке компонентов систем МП показало, что слишком многие аспекты языковой деятельности чрезвычайно далеки от формализации и тем более алгоритмизации. Особенно следует отметить возникновение и разработку идеи языка-посредника. Возникли и получили развитие такие лингвистические идеи, как гипотеза глубины, представление о проектировании синтаксических структур, были разработаны алгоритмы синтаксического анализа, способы изображения, представления и обнаружения синтаксических структур [6; 12]. Ряд действующих систем МП был внедрен в информационную практику именно в этот период: результаты работы этих систем позволили по-новому взглянуть на возможности и перспективу развития МП. Параллельно с развитием МП появилась идея создания автоматического словаря в помощь переводчику. Третий период, начавшийся после 1967 г., характеризуется возникновением нового социального статуса МП. В это время сформировалась информатика - наука о научно-технической информации. Если ранее развитие научной мысли в области МП шло в некотором отрыве и без учета новых возможностей вычислительной техники, то этот период, можно считать, соединил новые достижения технической кибернетики с новыми результатами теории и практики лингвистических исследований в автоматической обработке текстов. Это соединение произошло на базе осознания социальных потребностей в области МП - преодоления языковых барьеров. В научном аспекте этот период характерен возвратом к построению цельных систем МП, и только к 1977 г. активизировалась работа в этом направлении. В последнее время благодаря появлению Интернет как платформы глобальной связи она стала привлекать широкое внимание. С начала 80-х гг., когда ПК уверенно и мощно начали завоевывать мир, стало возможным получать необходимую информацию быстро и эффективно. Так МП наконец-то стал экономически выгодным, он вновь стал привлекательной областью вложения капиталов, как для частных инвесторов, так и для государственных структур. Появились системы перевода, которые используются и поныне: это Power Translator (компания Globalink), Language Assistant (компания MicroTac) и Transend (компания Intergraph). 90-е гг. можно считать подлинной эпохой возрождения в развитии МП, что связано не только с высоким уровнем возможностей ПК, с появлением сканеров и программ OCR, но и с распространением Интернет/интранет (Internet/intranet), обусловивших реальный спрос на МП. Наиболее популярными стали такие программы, как Stylus и PROMT. При разработке систем PROMT впервые был применен фактически революционный подход, который и позволил получить впечатляющие результаты. Системы перевода семейства PROMT - это системы, спроектированные на основе не лингвистических, а кибернетических методов. Первая система машинного перевода, выпущенная компанией PROMT в 1991 г., переводила с английского языка на русский специализированные тексты по программному обеспечению. Она использовала небольшой словарь - около 17 тыс. слов и выражений, работала в среде doc и не имела средств настройки для пользователя. Тем не менее, этот подход оказался очень плодотворным для самых разных языков. Современное состояние машинного перевода За последние несколько лет машинный перевод пережил значительные изменения. Большое количество исследований ведется в области статистического машинного перевода и машинного перевода на базе примеров перевода. Сегодня немногие компании используют статистический машинный перевод в коммерческих целях, например, Microsoft использует свою собственную патентованную статистическую программу МП для перевода статей базы. Возобновился интерес к гибридизации, исследователи совмещают синтаксические и морфологические знания в статистических системах с уже существующими правилами [12; 13]. Наиболее популярными в последнее время стали он-лайн переводчики, среди них пальму первенства завоевал Google-переводчик. Но Google-переводчик, как и другие инструменты автоматического перевода, имеет свои ограничения. Этот инструмент может помочь пользователю понять общий смысл содержания текста на иностранном языке, он не предоставляет точных переводов, особенно что касается профессиональной сферы. Из-за того, что выдача вариантов контролируется статистическим алгоритмом, при переводе общеупотребительных слов Google-переводчик может предлагать в числе возможных вариантов нецензурные слова, что часто может очень усложнить межкультурную коммуникацию. Постоянно ведется работа над качеством перевода, разрабатываются переводы на другие языки. Наряду с этим появился целый ряд профессиональных словарей, созданных на основе лингвистических корпусов. Наиболее популярными являются он-лайн словари ABBY Lingvo, Multitran. Исследование эффективности различных видов машинного перевода В МГТУ им. Н.Э. Баумана был проведен опрос среди студентов 1-3 курсов, магистров и аспирантов. Как показало исследование, на младших курсах почти 100% студентов используют он-лайн переводчики, а именно - Google-переводчик при работе с текстами общетехнического содержания. На старших курсах, работая с научно-технической литературой, они все чаще обращаются к специализированным словарям, используют он-лайн словари ABBY Lingvo, Multitran. Более успешные студенты, магистры и аспиранты в 80% случаев предпочитают работать с он-лайн словарями, а не с переводчиками. Это говорит прежде всего о том, что преподаватели английского языка в технических вузах должны учитывать этот факт при разработке курса и планировании своей работы со студентами на разных этапах обучения [4; 8]. Что же касается специалистов-переводчиков, они все чаще обращаются к Concordance - программе, разработанной для контент-анализа. Появляются новые технологии. В частности, это технологии так называемой «памяти переводов» (Translation Memory). Эта технология позволяет создавать глоссарии корпоративной терминологии, а также автоматически отслеживать единство используемой терминологии, и, возможно, именно эта программа станет наиболее популярным инструментом МП среди профессионалов разных отраслей промышленности и экономики, в том числе инженеров. Исследователи в области МП уделяют все больше внимания основной проблеме выбора лексики (это уязвимое место для MП) [12], в частности - использование большого объема доступных сейчас лексических и текстовых ресурсов (например Интернета). В рамках корпусной лингвистики появилась возможность по-новому описать такую важную единицу современной лексики, как термин. Поскольку современные базы знаний политематичны, большую роль в них играет контекстологический словарь, который можно эффективно исследовать и применять, используя принципы и методы корпусной лингвистики [15]. Эти разработки обещают быструю работу систем и более широкий и глубокий языковой охват. Заключение Хотя технологии МП по-прежнему имеют множество недостатков, многие специалисты стали вновь серьезно относиться к обещанию Бэббиджа. «Машинный перевод все еще далек от совершенства, но любой желающий с его помощью сможет, по крайней мере, понять основной смысл документа», - считает Луи Монье, технологический директор Alta Vista, крупного поискового web-узла, который работает с МП в онлайновом режиме [9]. Несомненно, средства машинного перевода никогда не смогут улавливать все смысловые нюансы. Различия в синтаксисе и семантике, особенно между западными и восточными языками, - например, английским, русским или арабским [15] - слишком велики. Но, работая с техническими текстами, инженеры, даже без глубоких знаний по английскому языку, все же смогут воспользоваться МП для профессионального межкультурного общения, изучать статьи своих зарубежных коллег и делиться своими профессиональными находками и достижениями на английском языке, работать с документами [10]. Итак, проанализировав современное состояние МП, можно заключить, что он становится полезным инструментом в профессиональной межкультурной коммуникации, прежде всего благодаря своей универсальности; возможности переводить в режиме онлай; а также благодаря конфиденциальности и низкой стоимости [5]. Полагаем, что со временем «чистых» систем машинного перевода (коммерческих, онлайн или иных) будет становиться все меньше. Напротив, больше будет компьютерных инструментов и приложений, где автоматический перевод станет лишь одиним из компонентов. Наиболее вероятная область применения МП - это профессиональная межкультурная коммуникация, где редко встречаются эмоционально окрашенные тексты, фразеологические обороты или тексты с культурным подтекстом, которые затрудняют машинный перевод. Комплексное программное обеспечение для автоматического перевода станет нормой, доступной для всех пользователей IT инструментов и устройств. Автоматический перевод станет повседневной и существенной частью глобального информационного общества.

E Yu Kartseva

Peoples’ Friendship University of Russia (PFUR)

Email: lenakartseva@inbox.ru
Miklukho-Maklaya str., 10, Moscow, Russia, 117198

T D Margaryan

Bauman Moscow State Technical University

Email: t.margaryan@bmstu.ru
2nd Baumanskaya str., 5, Moscow, Russia, 105005

G G Gurova

Bauman Moscow State Technical University

Email: ggurova@bmstu.ru
2nd Baumanskaya str., 5, Moscow, Russia, 105005

Views

Abstract - 166

PDF (Russian) - 217


Copyright (c) 2016 Карцева Е.Ю., Маргарян Т.Д., Гурова Г.Г.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.