<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">Polylinguality and Transcultural Practices</journal-id><journal-title-group><journal-title xml:lang="en">Polylinguality and Transcultural Practices</journal-title><trans-title-group xml:lang="ru"><trans-title>Полилингвиальность и транскультурные практики</trans-title></trans-title-group></journal-title-group><issn publication-format="print">2618-897X</issn><issn publication-format="electronic">2618-8988</issn><publisher><publisher-name xml:lang="en">Peoples’ Friendship University of Russia named after Patrice Lumumba (RUDN University)</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="publisher-id">27382</article-id><article-id pub-id-type="doi">10.22363/2618-897X-2021-18-3-245-254</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>Language Processes</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Языковые процессы</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Design of ASR Software for Recognition of the Russian Language Variants</article-title><trans-title-group xml:lang="ru"><trans-title>Разработка программы ASR для распознавания вариантов русского языка</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Valuitseva</surname><given-names>Irina I.</given-names></name><name xml:lang="ru"><surname>Валуйцева</surname><given-names>Ирина Ивановна</given-names></name></name-alternatives><bio xml:lang="en"><p>Doctor of Philology, Professor, Chair of the Department of the Theoretical and Applied Linguistics</p></bio><bio xml:lang="ru"><p>доктор филологических наук, профессор, заведующий кафедрой теоретической и прикладной лингвистики</p></bio><email>irinaiv-v@yandex.ru</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Filatov</surname><given-names>Igor Ie.</given-names></name><name xml:lang="ru"><surname>Филатов</surname><given-names>Игорь Евгеньевич</given-names></name></name-alternatives><bio xml:lang="en"><p>Bachelor of the Department of Theoretical and Applied Linguistics</p></bio><bio xml:lang="ru"><p>бакалавр кафедры теоретической и прикладной лингвистики</p></bio><email>imphilya_com@yahoo.com</email><xref ref-type="aff" rid="aff1"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">Moscow Region State University</institution></aff><aff><institution xml:lang="ru">Московский государственный областной университет</institution></aff></aff-alternatives><pub-date date-type="pub" iso-8601-date="2021-09-10" publication-format="electronic"><day>10</day><month>09</month><year>2021</year></pub-date><volume>18</volume><issue>3</issue><issue-title xml:lang="en">VOL 18, NO3 (2021)</issue-title><issue-title xml:lang="ru">ТОМ 18, №3 (2021)</issue-title><fpage>245</fpage><lpage>254</lpage><history><date date-type="received" iso-8601-date="2021-09-10"><day>10</day><month>09</month><year>2021</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2021, Valuitseva I.I., Filatov I.I.</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2021, Валуйцева И.И., Филатов И.Е.</copyright-statement><copyright-year>2021</copyright-year><copyright-holder xml:lang="en">Valuitseva I.I., Filatov I.I.</copyright-holder><copyright-holder xml:lang="ru">Валуйцева И.И., Филатов И.Е.</copyright-holder><ali:free_to_read xmlns:ali="http://www.niso.org/schemas/ali/1.0/"/><license><ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-nc/4.0</ali:license_ref></license></permissions><self-uri xlink:href="https://journals.rudn.ru/polylinguality/article/view/27382">https://journals.rudn.ru/polylinguality/article/view/27382</self-uri><abstract xml:lang="en"><p style="text-align: justify;">The article first touches on the problem of speech recognition of Russian language variants. With the development and growing (ASR) popularity of the automatic speech recognition (ASR) technology, more and more attention is now being paid to the problems related to the incompatibility of modern applications to work with non-standard language varieties. This question is especially relevant for Russian, as it is, contrary to the conservative statement about its homogeneity, represented by many forms that differ from the standard one, which generally have a wide distribution in various regions of Russia and throughout the world. The study of various aspects of the interaction of ACER algorithms with non-standard varieties of the Russian language, as well as existing approaches to creating an ASR product that can process such idioms, today seems to be an urgent direction. The aim of the work is to analyze in detail the methods for developing ASR systems capable of performing the task of recognizing and processing speech samples of speakers of Russian language forms different from the standard, which may contribute to further research on this topic. The research material is based on the software interface of the SOVA ASR application for automatic speech recognition, as well as a selection of audio recordings of speech of native speakers of the Central Asian and Ukrainian versions of Russian, and the corresponding transcription texts. The research methods such as the study and analysis of specialized literature, data collection for subsequent software processing, qualitative and quantitative analysis, and experimental data are used.</p></abstract><trans-abstract xml:lang="ru"><p style="text-align: justify;">В статье впервые затрагивается проблема распознавания вариантов русского языка на уровне речи. С развитием и ростом популярности технологий автоматического распознавания речи (ASR) в настоящее время все больше внимания уделяется проблемам, связанным с неприспособленностью современных приложений к работе с нестандартными разновидностями языка. Этот вопрос особенно актуален для русского, который, вопреки устоявшемуся положению о его однородности, в действительности представлен множеством отличных от стандарта форм, имеющих в большинстве случаев широкое распространение в различных регионах России и мира. Изучение различных аспектов взаимодействия алгоритмов ASR с нестандартными разновидностями русского языка, а также существующих подходов к созданию ASR-продукта, умеющего обрабатывать такие идиомы, сегодня представляется актуальным направлением лингвистических исследований. Цель данной работы заключается в подробном анализе методов разработки ASR-систем, способной выполнять задачи по распознаванию и обработке образцов речи носителей, отличных от нормы вариантов русского, что может способствовать дальнейшему исследованию данной проблемы. В качестве материала исследования используется программный интерфейс приложения для автоматического распознавания речи SOVA ASR, а также выборка аудиозаписей речи носителей центральноазиатского и украинского вариантов русского языка, соответствующие им тексты транскрипций. Применяются такие методы исследования, как анализ и систематизация специальной литературы, сбор данных, качественный и количественный анализ, эксперимент и анализ полученных результатов.</p></trans-abstract><kwd-group xml:lang="en"><kwd>automatic speech recognition</kwd><kwd>natural language processing</kwd><kwd>Russian language variants</kwd><kwd>regiolect</kwd><kwd>classification of Russian language variants for ASR</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>автоматическое распознавание речи</kwd><kwd>обработка естественного языка</kwd><kwd>варианты русского языка</kwd><kwd>региолект</kwd><kwd>классификация вариантов русского языка для ASR</kwd></kwd-group><funding-group/></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><citation-alternatives><mixed-citation xml:lang="en">Bakhtikireeva, U.M. 2014. “Russian is a Multinational Language?”. Vestnik RUDN. Russian Journal of Linguistics 2: 16—30. Print. (In Russ.)</mixed-citation><mixed-citation xml:lang="ru">Бахтикиреева У.М. Русский - полинациональный язык? // Вестник Российского университета дружбы народов. Серия: Лингвистика. 2014. №. 2. С. 16-30.</mixed-citation></citation-alternatives></ref><ref id="B2"><label>2.</label><citation-alternatives><mixed-citation xml:lang="en">Erina, T.N. 2019. “Teoreticheskie osnovy izucheniya regional’nogo var’irovaniya russkogo yazyka”. In Russkii yazyk v usloviyakh bii polilingvizma: sb. nauchnykh trudov. Ed. by Z.N. Yakushkina. Cheboksary: Chuvash. gos. ped. un-t. Pp. 54—57. Print. (In Russ.)</mixed-citation><mixed-citation xml:lang="ru">Ерина Т.Н. Теоретические основы изучения регионального варьирования русского языка // Русский язык в условиях бии полилингвизма: сб. научных трудов / отв. ред. З.Н. Якушкина. Чебоксары: Чуваш. гос. пед. ун-т, 2019. С. 54-57.</mixed-citation></citation-alternatives></ref><ref id="B3"><label>3.</label><citation-alternatives><mixed-citation xml:lang="en">Erina, T.N., Fomin Eh.V. 2018. “Govoryat Cheboksary: k probleme izucheniya cheboksarskogo regiolekta russkogo yazyka”. In Nauchnoe nasledie V.A. Bogoroditskogo i sovremennyi vektor issledovanii Kazanskoi lingvisticheskoi shkoly. Vol. 1. Pp. 81—84. Print. (In Russ.)</mixed-citation><mixed-citation xml:lang="ru">Ерина Т.Н., Фомин Э.В. Говорят Чебоксары: к проблеме изучения чебоксарского региолекта русского языка // Научное наследие В.А. Богородицкого и современный вектор исследований Казанской лингвистической школы. 2018. Т. 1.</mixed-citation></citation-alternatives></ref><ref id="B4"><label>4.</label><citation-alternatives><mixed-citation xml:lang="en">Zherebilo, T.V. 2016. “Funktsionirovanie regional’nogo varianta russkogo yazyka v Chechenskoi Respublike”. Refleksiya 5: 3—102. Print. (In Russ.)</mixed-citation><mixed-citation xml:lang="ru">Жеребило Т.В. Функционирование регионального варианта русского языка в Чеченской Республике // Рефлексия. 2016. № 5. С. 3-102.</mixed-citation></citation-alternatives></ref><ref id="B5"><label>5.</label><citation-alternatives><mixed-citation xml:lang="en">Stepanov, E.N. 2011. “Natsional’nye varianty russkogo yazyka ili russkie territorial’nye koine?” Mova 16: 9—14. Print. (In Russ.)</mixed-citation><mixed-citation xml:lang="ru">Степанов Е.Н. Национальные варианты русского языка или русские территориальные койне? // Мова. Одесский национальный университет им. И.И. Мечникова. 2011. № 16. С. 9-14.</mixed-citation></citation-alternatives></ref><ref id="B6"><label>6.</label><citation-alternatives><mixed-citation xml:lang="en">Aref’ev, A.L. 2012. Russkii yazyk na rubezhe XX—XXI vekov. Moscow: Tsentr Sotsial’nogo razvitiya i marketinga. Print. (In Russ.)</mixed-citation><mixed-citation xml:lang="ru">Арефьев А.Л. Русский язык на рубеже XX-XXI веков. М.: Центр социального развития и маркетинга. 2012.</mixed-citation></citation-alternatives></ref><ref id="B7"><label>7.</label><citation-alternatives><mixed-citation xml:lang="en">Vakhtin, N.B., A. Mustaioki, and Protasova, E. 2010. “Russkie yazyki”. Slavica Helsingiensia 40: 5. Print. (In Russ.)</mixed-citation><mixed-citation xml:lang="ru">Вахтин Н.Б., Мустайоки А., Протасова Е. Русские языки // Slavica Helsingiensia 40. Istrumentarium of Linguistics. Sociolinguistic Approaches to Non-Standard Russian. 2010. С. 5.</mixed-citation></citation-alternatives></ref><ref id="B8"><label>8.</label><citation-alternatives><mixed-citation xml:lang="en">Li, B. et al. 2018. “Multi-dialect speech recognition with a single sequence-to-sequence model”. In 2018 IEEE international conference on acoustics, speech and signal processing (ICASSP) Proceedings. Pp. 4749—4753.</mixed-citation><mixed-citation xml:lang="ru">Li B. et al. Multi-dialect speech recognition with a single sequence-to-sequence model // 2018 IEEE international conference on acoustics, speech and signal processing (ICASSP). IEEE, 2018. С. 4749-4753.</mixed-citation></citation-alternatives></ref><ref id="B9"><label>9.</label><citation-alternatives><mixed-citation xml:lang="en">Elfeky, M. et al. 2016. “Towards acoustic model unification across dialects”. In 2016 IEEE Spoken Language Technology Workshop (SLT) Proceedings. Pp. 624—628.</mixed-citation><mixed-citation xml:lang="ru">Elfeky M. et al. Towards acoustic model unification across dialects // 2016 IEEE Spoken Language Technology Workshop (SLT). IEEE, 2016. С. 624-628.</mixed-citation></citation-alternatives></ref><ref id="B10"><label>10.</label><citation-alternatives><mixed-citation xml:lang="en">Diakoloukas, V. et al. 1997. “Development of dialect-specific speech recognizers using adaptation methods”. In 1997 IEEE International Conference on Acoustics, Speech, and Signal Processing. — IEEE Proceedings. Vol. 2. Pp. 1455—1458.</mixed-citation><mixed-citation xml:lang="ru">Diakoloukas V. et al. Development of dialect-specific speech recognizers using adaptation methods // 1997 IEEE International Conference on Acoustics, Speech, and Signal Processing. IEEE, 1997. Т. 2. С. 1455-1458.</mixed-citation></citation-alternatives></ref></ref-list></back></article>
