Computer analysis of the content of textbooks on history and geography in the aspect of an integrated Russian language teaching methodology in new territorial subjects of the Russian Federation
- Authors: Khamraeva E.A.1, Shapovalov M.I.1, Kovtun L.V.1
-
Affiliations:
- Moscow Pedagogical State University
- Issue: Vol 23, No 4 (2025)
- Pages: 696-716
- Section: Methods of Teaching Russian as a Native, Non-Native, Foreign Language
- URL: https://journals.rudn.ru/russian-language-studies/article/view/47716
- DOI: https://doi.org/10.22363/2618-8163-2025-23-4-696-716
- EDN: https://elibrary.ru/OLSXEK
- ID: 47716
Cite item
Full Text
Abstract
The relevance of the study is determined by the need to create subject and language integrated methods for the new territorial subjects of the Russian Federation, where teaching is organized under the conditions of closely related bilingualism. This linguistic-cultural situation complicates the adaptation of schoolchildren to the Russian educational environment. The aim of the study is to analyze the content of Russian- and Ukrainian-language text-books on history and geography for creating new subject and language integrated Russian language methods in Russian, objectively assessing the level of background knowledge in cultural studies and the degree of their influence on the effectiveness of learning various subjects in the Russian language. Computational methods of quantitative and corpus linguistics enable the analysis of texts in Russian and Ukrainian and allow for predicting potential difficulties and challenges in teaching Russian in the newly incorporated regions of the Russian Federation. To identify multi-word terms from textbook texts, the AI-powered online service ChatPDF was employed. Ukrainian and Russian textbooks on world history and geography for the 9th gradewere used as research material. The analysis was carried out on three levels: language, frequency of use of language units; evaluative, sensitivity-analysis of concepts; culturological, consideration of the importance of concepts. While analyzing the textbook thesaurus, we identified words which are found in both textbooks and only in one of them. The result of the computer analysis is a database for compiling the technological tools of subject integration, Russian language, history, geography, and World Around Us, in new territorial subjects of the Russian Federation under the conditions of close bilingualism. Individual parts of the research studied by means of computer technologies can be used as tasks for project activities of schoolchildren. The tasks are likely to increase their motivation to study.
Full Text
Введение
В России возникла задача интеграции обучающихся из новых регионов в единое образовательное пространство. Общение со школьниками из новых территорий во время летних школ и совместных проектов в центральной России показывает, что их знания концептуально важных для России событий и исторических личностей часто оказываются недостаточными, а оценка не всегда соответствует исторической правде. Лакуны в фоновых знаниях могут препятствовать интеграции в образовательное пространство или вызывать проблемы с адаптацией во время учебы в школе или в российском вузе.
Понятийные, образные и оценочные характеристики значимых концептов отличаются в картинах мира даже близкородственных культур. Данный феномен исследовался многими учеными (Вежбицка, 1978; Ларина, 2006; Hackett-Jones, 2016; Свердлова, 2019). Этот фактор лег в основу поиска причин возникшей лакунарности и обращения к анализу текстов учебников географии и всемирной истории 9 класса, проведенному с точки зрения соответствия фактологического аппарата, особенно интерпретации языковых и лингвокультурных реалий, которые, на наш взгляд, и порождают проблемы при общении между школьниками из разных регионов России.
Достаточно полно изучено взаимоотношение близкородственных языков, описаны явления языковой интерференции. Тем не менее, исследование в сфере обнаружения расхождения элементов языка и культуры в пространстве школьного образования в близкородственной среде проводится впервые. Достаточно часто лингвокультурную компетенцию рассматривают в связи с изучением иностранных языков (Odlin, 1989; Tomalin, Stempleski, 1993). При этом сравнительных исследований в сфере близкородственных языков ощутимо меньше (Маркова, Квапил, 2021), поскольку бытует мнение, что говоря-щие на родственных языках способны на самокоррекцию и не нуждаются в дополнительном внимании. Однако в ходе исследования обнаружено, что при владении близкородственными языками говорящие не всегда осознают различия между языками и менее тщательно следят за соблюдением коммуникативных и лингвокультурных норм из-за особенностей лингвокультурной ситуации. Лингвокультурная ситуация — это динамичный и волнообразный процесс взаимодействия языков и культур в исторически сложившихся культурных регионах и социальных средах (Шаклеин, 2010: 19), где уровень проявления взаимовлияния и интерференции часто зависит от культурной и политической ситуации, особенно в детском и подростковом возрасте.
Феномен интерференции активно изучается в разных научных дисцип-линах, например, лингвистике, социолингвистике, психолингвистике, психологии и методике преподавания иностранных языков. Такие исследователи, как В.В. Алимов, Е.М. Верещагин, В.А. Виноградов, М. Джусупов (Алимов, 2003; Верещагин, 1969; Виноградов, 1990; Джусупов, 2021) и др., внесли значительный вклад в изучение вопросов, связанных с различной интерференцией, однако универсального подхода к этому явлению пока не выработано.
Среди российских ученых одним из первых затронул тему интерференции в своих исследованиях Л.В. Щерба (Щерба, 1974). Он описал интерференцию как процесс взаимного искажения двух языков при изучении иностранного, когда родной язык оказывает влияние на иностранный. Более общее определение дал В.А. Виноградов (Виноградов, 1990), представив интерференцию как результат взаимодействия языковых систем в условиях двуязычия, проявляющийся в отклонениях от норм и структуры второго языка под воздействием первого.
Каждый человек, принадлежащий к конкретной культуре, воспринимает мир сквозь призму своей культурной картины мира, что приводит к столкновению концептов и взаимодействию языковых форм. На протяжении долгого времени основной фокус исследований интерференции был направлен на ее языковые аспекты, особенно на фонетический (Вишневская, 1993, Краснова, 1985), орфографический (Гаврилина, 2022), грамматический (Isurin, 2021) и лексический уровни (Ткачева, 2024), так как влияние родного языка на второй язык чаще всего выражается через ошибки и неоправданный перенос элементов из одного языка в другой. Именно поэтому ранее исследования интерференции сосредоточивались преимущественно на ее фонетических и грамматических проявлениях (Семчинский, 1973; Цейтлин, Круглякова, 2024). Тем не менее, интерференционные процессы могут происходить на любом уровне языковой системы и проявляются в речи независимо от осознанных усилий говорящего.
Исследованием культурного аспекта взаимовлияния языков занимаются П.В. Тимачев, Н.П. Федорова, Р.А. Арынбаева, Ж.К. Маханова и Н.В. Дмит-рюк (Тимачев, 2005; Федорова, 2010; Арынбаева, Маханова, Дмитрюк, 2023). Важно отметить, что знание экстралингвистических факторов, например, обычаев, традиций, системы ценностей играет ключевую роль в организации языкового образования. По словам П.В. Тимачева (Тимачев, 2005), неполное совпадение культурных ассоциаций одного языка с аналогичными ассоциациями других языков, вступающих в контакт, свидетельствует о лингвокультурной интерференции. Причина возникновения такой интерференции кроется в различиях между лингвокогнитивными картинами мира разных культур. Для устранения подобных трудностей в период обучения предлагается формирование недостающих знаний о чужой культуре, корректировка ошибочных представлений и дополнение недостающей информации на лингвистическом, дискурсивном и социокультурном уровнях. Безусловно, в школьном возрасте многие реалии и представления формируются у обучающихся средствами образовательно-воспитательной среды и учебников. Именно поэтому в исследовании была реализована идея проведения компьютерного анализа на нескольких уровнях: языковом, где с помощью цифровых средств устанавливалась частотность употребления языковых единиц; оценочном, когда предлагался сентимент-анализ выявленных концептов, и общем культурологическом, позволившем определить сам перечень концептов.
Язык несет в себе информацию о ценностях, нормах поведения и мировоззрении определенного народа. Безусловно, культурная картина мира включает в себя важнейшие концепты, которые кажутся универсальными, но воспринимаются носителями разных языков по-разному и отражают особенности понимания сущности мира. А.А. Реформатский писал: «Кажущееся тождество первичного и вторичного языков ведет к тому, что обучаемый все более начинает опираться на родной язык. Эти тождества, как правило, мнимы, и поэтому они, будучи провокационными, способствуют более длительному и устойчивому сохранению интерференции» (Реформатский, 2001: 27). Так, даже при хорошем знании русского языка можно прогнозировать трудности в понимании культурных контекстов и подтекстов, особенно если речь идет о специфических терминах или идиоматических выражениях. Незнание концептов или их неточная интерпретация затрудняет адаптацию к российскому образовательному пространству школьников, живущих на территориях новых субъектов РФ и недавно вошедших в состав России (Херсонская и Запорожская области). Именно поэтому задачи создания единства в понимании фактов культуры в школьных учебниках и стали объектами отдельного внимания.
Возникновение корпусных методов лингвистических описаний позволило автоматизировать исследования параллельных корпусов на основе применения новых интегрированных и цифровых подходов (Плунгян, 2023). Например, в исследованиях В.В. Потапова представлены терминологические базы данных, помогающие переводчикам решить многие профессиональные задачи (Потапов, 2022). При этом значительная часть задач решалась до сих пор без использования компьютерных и цифровых инструментов. Компьютерный анализ текстов учебников помогает максимально точно обозначить зоны расхождений используемых терминов и интерпретации фактов языка и культуры.
Цель исследования — провести анализ контента учебников истории и географии на русском и украинском языках для создания предметно-языковых интегративных методик в средних общеобразовательных школах новых территорий. Проведенный анализ призван объективно оценить уровень фоновых знаний культуроведческого характера, а также проанализировать, как они влияют на усвоение различных учебных предметов на русском языке школьниками новых субъектов РФ.
Методы и материалы исследования
Материалом для исследования послужили тексты учебников по все-мирной истории и географии на русском и украинском языках, находящиеся в свободном доступе в сети Интернет, а также в цифровых школьных библиотеках[1]. На территориях Донецкой Народной Республики (ДНР) и Луганской Народной Республики (ЛНР) российские учебники используются с 2014 г., однако на территориях Херсонской и Запорожской областей до последнего времени обучение всем предметам велось по украинским учебникам. Именно этот факт и определил выборку.
Для частотного анализа были выбраны учебники всемирной истории и географии 9 класса, поскольку они содержат как хорошо развитую терминологическую подсистему, так и значительное количество слов общей лексики. Именно 9 класс — это период завершение ступени общего образования, по-этому основные понятия и термины аккумулированы в данных учебниках максимально. Хотя языковая интерференция является психолингвистическим явлением, в фокусе нашего внимания находились ее результаты, проявляющиеся в форме нарушений языковых или культурных норм. Например, в учебниках географии помимо слов общей лексики и терминов выделялись специфические географические названия или топонимы, используемые в той или иной социокультурной действительности, а в учебниках истории выделялись значимые исторические события или имена, которые оценивались с точки зрения частотности использования. Таким образом осуществлялась экстраполяция характеристик обнаруженного влияния на формирование лингвокультурных представлений обучающихся.
В качестве теоретических методов применялись анализ и обобщение источниковых данных, лексических корпусов, научных трудов по вопросам компьютерной и цифровой обработки полученных результатов.
Перед началом частотного анализа была проведена лемматизация (лемма — это неизменная, базовая форма слова, которая служит основой для всех его грамматических вариаций, например существительных к именительному падежу, а глаголов к инфинитиву). Для этого были использованы интернет-сервисы SEO-оптимизации2, 3. Заметим, что первый сервис[2] позволяет проверять текст на n-граммы максимум до 7 слов в n-грамме. Второй сервис[3] выделяет семантическое ядро и дает частоты входящих в него слов. Именно с семантическим ядром и велась дальнейшая работа.
На втором этапе исследования выделена терминологическая подсистема. Нами был использован подход, использующий анализ значения коэффициента Жуйана в Национальном корпусе русского языка[4] (НКРЯ). Коэффициент Жуйана показывает, насколько равномерно распределены частоты в различных сегментах корпуса. Однако для его использования нужно сначала определить граничное значение коэффициента Жуайна, начиная с которого слово может быть отнесено к термину. Это необходимо, учитывая большой объем анализируемой информации, делающий невозможным (крайне затруднительным) ручную обработку. Значения коэффициента Жуйана для терминов были получены для слов из следующих источников: История. Учебный словарь[5], Словарь исторических терминов[6], Исторический словарь[7] и установлено максимальное значение коэффициента Жуйана, позволяющее отнести при анализе слово к термину — 54.
Для проверки мы выделили термины и определения из Историко-культурного стандарта[8]. В Стандарте они содержатся, в т.ч. в виде выделенных блоков. Анализ показал, что слова со значением коэффициента Жуйана — 55–80 относятся в значительной части к словам общей лексики, но могут быть использованы и в качестве терминов. Так, например, для учебников истории была автоматически выделена терминологическая подсистема, которая и стала предметом пристального рассмотрения. В учебнике на русском языке это: военные реформы, Вторая мировая война, гражданская война, демократия, империализм, информационная революция, ислам, классовая борьба, культурная идентичность, научная революция, патриотические организации, политическая идеология. Всего порядка 150 терминов.
При этом только в украинском учебнике: выгода, инвестиции, инфляция, капитал, ликвидность, макроэкономика, микроэкономика, налоги, рынок, спрос, углеродный след, экологическая политика, экология, эмпатия.
В процессе выявления доминирующих лексических единиц учебников истории сгруппированы термины, которые присутствуют в обоих учебниках или только в одном из них. Это дало возможность сделать вывод о том, что уже на первом этапе анализа, когда рассматривается терминосистема и глоссарии, обнаруживается различный подход к формированию содержания учебника.
Заметим, что при анализе учебников географии по аналогичной методике, была выделена значительная (порядка 11 % лексики) группа слов, представляющих собой специфическую географическую терминосистему. Так, для учебников на русском языке характерными стало использование понятий: географическое положение, государственная граница, морская граница, страны-соседи, российский сектор Арктики, адаптация, природные условия, природные ресурсы, часовые пояса, декретное время, московское время, Северный морской путь, научное прогнозирование, географический прогноз. Для учебника на украинском языке частотно выше использовались слова: геосистема, климат, экологическая катастрофа, природа, летнее и зимнее время, конструктивная роль географии. Анализ также выявил факты использования в качестве терминов в данных учебниках (порядка 7 %) слов общей лексики, что не позволяло провести выделение терминологической подсистемы полностью в автоматическом режиме и обусловило дополнительную проверку, осуществленную исследователями. Уточним, что описанная выше методика проведения анализа работает только для n-грамм с n = 1. Для выделения терминов-словосочетаний (n > 1) из текста учебников использовался интернет-сервис на основе искусственного интеллекта ChatPDF[9].
Результаты
Доказано, что лингвокультурные базы учебников по истории России и Украины и в меньшей степени учебников географии существенно разли-чаются. Этот фактор объясняет затруднения школьников новых территорий в определении географических или исторических реалий, в использовании значимых имен, а главное — и расхождение фоновых знаний, отмечаемое учителями. Анализ частоты слов и n-граммов текстов учебников стал важным инструментом в исследовании различных видов расхождений исторических и географических знаний у школьников-носителей близкородственных языков (русского и украинского), что позволило сформулировать результаты:
Выявлены доминирующие лексические единицы. Это позволило в ходе исследования определить, какие культурные концепты являются значимыми для носителей каждого из языков. Например, для российских учебников истории: суверенитет, культурная идентичность, патриотические организации, для украинских: выгода, инвестиции, свобода воли. Для российских учебников географии — сибирь, северный морской путь, экология. Для украинских учебников — зеленые технологии, климатические проблемы, раздельный сбор мусора. Высокая частотность названных лексем указывает на понятия и концепты, на которые учителю необходимо обращать отдельное внимание.
Выявлены языковые стереотипы. Это дало возможность высказать предположение, что определенные слова часто используются лишь в одном из языков, что указывает на определенные понятийные несоответствия. Например, для российских учебников истории: гражданская война, институт семьи, историческая память, для украинских: зависимость, индивидуализм, голодомор. В учебниках географии ярче всего стереотипность подтверждается количеством упоминаний разных стран. Так, например, в российских учебниках упоминаются Россия, Евразия, Китай, США. В украинских учебниках — Украина, США, Евросоюз.
Определены особенности словоупотребления. С помощью частотного анализа текстов учебников на украинском языке удалось выявить случаи использования слов и терминов с частотой, нехарактерной для носителя русского языка. Например, в учебниках истории на украинском языке в 30...50 раз по сравнению с НКРЯ превышена частотность слов: захватнический, неравноправный, колонизатор, географии — экологические катастрофы, зеленая энергетика, глобализация.
Выделены классы высокочастотных семантически близких слов. Это помогло выявить, какие слова чаще подвергаются интерференции, и понять закономерности изменения при переходе от одного языка к другому. Например, одинаково часто используются слова: глобальное потепление, климат, социальные нормы.
Проанализированы термины с целью фиксации семантических изменений. В ходе исследования обнаружен факт: если термин получил новое или смещенное значение, это может прогнозировать возможную культурную интерференцию. Например, по-разному оцениваются в российских и украинских учебниках истории такие понятия, как: униаты и православие, становление национальной идентичности, национально-освободительное движение, декоммунизация, история национальных меньшинств. По учебникам географии — государственные границы, нефтяная промышленность, газопровод.
Осуществлен анализ частеречного состава текстов учебников. Это дало возможность обнаружить частоту использования различных частей речи в учебно-научном подстиле учебников в ситуации близкородственного двуязычия русского и украинского языков, что не являлось целью обозначенного исследования, но может быть предложено для изучения в дальнейшем. Выявлено, что самую высокую разницу дают существительные-термины и глаголы восприятия или состояния.
Результатом исследования стал также проведенный сентимент-анализ (компьютерный анализ тональности) для описания персоналий и концептов, позволяющий предвидеть сформированные культурные стереотипы, приводящие к проявлению лингвокультурной интерференции. Ниже приведен пример сентимент-анализа такого исторического персонажа, как Мазепа.
Важно подчеркнуть, что выделение анализа терминологической подсистемы в отдельную задачу позволило одновременно с изучением языковой интерференции исследовать ряд дополнительных параметров, таких, например, как распределение плотности терминов в тексте, выявлять и анализировать многозначность терминов в учебниках различных дисциплин. Такого рода дополнительная информация может быть весьма полезна при разработке методических материалов.
Безусловно, инструменты квантитативной и корпусной лингвистики с использование компьютера позволили получить обширные результаты. Нужно иметь в виду, однако, определенное смещение лексического частотного спектра Национального корпуса русского языка, вызванное значительным процентом (около 40) содержащихся в нем текстов из классической литературы. Заметим, что в наших исследованиях анализировалась не только частота отдельных слов, но и n-граммов, т.е. многосоставных терминов и понятий.
Обсуждение
Язык является основным средством формирования личности. Он выступает как часть культуры, охватывающей мировоззрение, традиции, нормы и способы общения. В условиях близкородственного двуязычия изучение русского языка играет ключевую роль в формировании личности и усвоении основ национальной культуры. Язык выражает духовную культуру народа, включая фольклор, литературу и философию. Именно он представляет собой фундаментальный элемент человеческой культуры, а его глубокое изучение связано с усвоением духовных ценностей нации. Основное становление человека происходит в школьном возрасте, поэтому так важно обнаружить содержательные компоненты данного процесса, включая тексты учебной литературы. Развитие русского языка в образовательных учреждениях не должно ограничиваться только пониманием и разговорной речью, важно вовлекать обучающихся в национальную культуру, используя русский язык как инструмент этого процесса. Безусловно, обучение в условиях близкородственного двуязычия подразумевает изучение русского языка в контексте национальной культуры, поэтому так важен процесс преодоления лингвокультурной интерференции.
Преподавание и изучение русского языка в новых регионах России (ДНР, ЛНР и особенно в Запорожской и Херсонской областях) отличаются рядом особенностей, например, межъязыковой интерференцией, недостаточной семантической и когнитивной базой русского языка у обучающихся на всех уровнях образования, отсутствием фоновых знаний, характерных для обучающихся российских школ.
Именно поэтому в ходе компьютерного анализа учебников, включаю-щего и анализ частотности слов и терминов, и сравнение тезауруса, и контент-анализ обработки результатов средствами искусственного интеллекта, проведенной в рамках данного исследования, оказалось возможным не только описать прогноз возможной лингвокультурной интерференции, но и сформировать набор понятий и тем, необходимых для актуализации на уроках русского языка. Таким образом сформировали перечень слов необходимой общей учебной лексики на русском языке, которую следует в приоритетном порядке использовать в учебных текстах для школьников данной территории с целью заполнения лакун или уменьшения лингвокультурных расхождений, на изучение которых следует обратить особое внимание при организации образовательного процесса на новых территориях.
Детализируем данный тезис. Так, например, в ходе исследования был проанализирован частеречный состав российского и украинского учебников истории и географии 9 классов и определены зоны потенциального расхождения понимания содержания тестов учебника.
Ориентируясь на результаты исследования (Коновалова, 2012), в котором анализировались статистические показатели интерференции с точки зрения частеречной принадлежности интерферем, мы оценили частеречный состав российских учебников истории и географии[10] (показатель указывает, на работу с какими словами следует обратить внимание в первую очередь — это существительные-термины и глаголы восприятия и состояния) (табл. 1).
Таблица 1
Нормированный вклад части речи в возможную интерференцию
Уникальных слов | Часть речи | Доля в учебнике, % | Вероятность интерференции | Вклад в возможную интерференцию (нормирован) |
2160 | Существительное | 50 | 0,11 | 5,5 |
959 | Глагол | 22 | 0,15 | 3,3 |
920 | Прилагательное | 21 | 0,08 | 1,84 |
240 | Наречие | 5 | 0,23 | 1,15 |
Источник: составлено М.И. Шаповаловым.
Table 1
Normalized part of speech contribution to the possible interference
Unique words | Part of speech | Proportion in the textbook | Possibility of interference | Contribution to the possible interference (normalized) |
2160 | Noun | 50 | 0.11 | 5.5 |
959 | Verb | 22 | 0.15 | 3.3 |
920 | Adjective | 21 | 0.08 | 1.84 |
240 | Adverb | 5 | 0.23 | 1.15 |
Source: compiled by M.I. Shapovalov.
Выделено порядка 30 терминов, содержащихся в учебниках географии и истории на обоих языках: глобализация, Вторая мировая война, глобальное потепление, информационные технологии, искусственный интеллект, миграция, образование, революция, социальная мобильность, эволюция, экономическая политика. Но при этом большое количество слов-терминов и имен собственных, необходимых для освоения программ российской школы, обнаружено только в российских учебниках, что заранее определяет зоны необходимого внимания при работе со школьниками новых территорий: военные реформы, великая отечественная война, гражданская война, Петр Первый, море Лаптевых, северный морской путь, информационная революция, ислам, классовая борьба, культурная идентичность, научная революция, патриотические организации, политическая идеология. При этом только в украинских учебниках географии и истории были обнаружены термины: жизненный цикл, загрязнение почвы, законы природы, зеленые технологии, нейробиология, психическое здоровье, разделение мусора, свобода воли, углеродный след, экологическая политика, униаты и православие, голодомор, декоммунизация. Безусловно, слова, отсутствующие в украинских учебниках, требуют отдельного внимания, включая организацию специальной лексической работы на уроках русского языка.
Далее для проведения анализа из учебников на украинском языке выделили 150 терминов, которые сопоставляли с частотностью использования в НКРЯ, что в итоге продемонстрировало наличие количественных расхождений, которое и становится причиной проявления фоновых интерференций (табл. 2).
Частотность рассмотренных слов в украинских учебниках истории и географии на порядок превышает частоту в российских учебниках и отражает сформированные учебными материалами социально-культурные реалии общества. Безусловно, для уменьшения лингвокультурной интерференции следует учитывать этот фактор.
Таблица 2
Превышение частоты слова по сравнению с НКРЯ, раз (фрагмент)
Украинский учебник истории | Российский учебник истории | ||
Слово | Превышение частоты по сравнению с НКРЯ, раз | Слово | Превышение частоты по сравнению с НКРЯ, раз |
Османский | 1535 | Право | 288 |
Якобинец | 1253 | Демократизация | 252 |
Тори | 1206 | Монополистический | 218 |
Конвент | 1188 | Буржуазия | 201 |
Пруссия | 1077 | присоединять | 178 |
Колонизатор | 1035 | Триколор | 140 |
Балканский | 789 | Урбанизация | 136 |
Австро-венгерский | 658 | Парламентаризм | 119 |
Захватнический | 411 | Монархия | 118 |
Неравноправный | 365 | Основывать | 117 |
Источник: составлено М.И. Шаповаловым.
Table 2
Excess word frequency compared to the Russian National Corpus (RNS) (times). (Fragment)
Ukrainian history textbook | Russian history textbook | ||
Word | Excess word frequency compared to RNS (times) | Word | Excess word frequency compared to RNS (times) |
Ottoman | 1535 | Law | 288 |
Jacobin | 1253 | Democratization | 252 |
Tory | 1206 | Monopolistic | 218 |
Convention | 1188 | Bourgeoisie | 201 |
Prussia | 1077 | To join | 178 |
Colonizer | 1035 | Tricolor | 140 |
Balkan | 789 | Urbanization | 136 |
Austro-Hungarian | 658 | Parliamentarism | 119 |
Invasive | 411 | Monarchy | 118 |
Unequal | 365 | To found | 117 |
Source: compiled by M.I. Shapovalov.
Что же касается слов общей лексики, то выявлено отсутствие в украинских учебниках ряда слов, присутствующих в российских учебниках, например: центр, федерация, управление, гражданин, память, отечественный. Это является, на наш взгляд, причиной возникающих проблем.
Так, на основании анализа русских и украинских учебников истории при помощи компьютерных методов, а также коннотативной оценки текстов, включающих определенные концепты (гражданин, память, вера, православие, национальная идентичность, великая отечественная война, Сибирь, Русский Север), появилась возможность определять те зоны, которые необходимо корректировать с помощью специальных форм организации школьной деятельности (проектной, поисково-исследовательской и др.), а также через создание предметно-интегративных методик обучения на русском языке для преодоления лингвокультурной интерференции у школьников. Выяснение критических точек расхождения в фоновых знаниях позволило в рамках проведенного исследования сформулировать рекомендации по списку тем и материалов, которые целесообразно включать в работу со школьниками новых регионов на уроках истории.
Методика анализа учебников географии аналогична описанной выше для учебников истории. Так, например, проверялось, насколько пересекается семантически общая лексика украинского и российского учебников 9 класса. Для этого вновь использовался механизм лемматизации содержания учебников на обоих языках, т.е. приведения словоформ к их базовой форме. Данный подход машинного преобразования текста позволил упростить анализ первоисточников, снизил размерность материалов и повысить точность работы алгоритмов обработки. Уникальных слов в российском учебнике оказалось 5869, в украинском — 6846. Пересечение общей лексики составило всего 2344 лемм, что в близкородственных и структурно единых языках составляет всего лишь около 40 %. Отметим, что 60 % расхождения слов общего употребления, на наш взгляд, достаточно существенно. Обнаруженное в украинских учебниках отсутствие слов общей лексики (например, полоса, заселять, опорный, переселенец) должны стать предметом особого внимания на уроках русского языка.
Дополнительно, после лемматизации были выделены географические наименования и рассчитана их частотность (табл. 3).
Таблица 3
Количество упоминаний географических наименований в тексте
Украинский учебник | Российский учебник | ||
Страна | Количество упоминаний | Страна | Количество упоминаний |
Украина | 564 | Россия | 635 |
США | 143 | Китай | 29 |
Китай | 121 | Япония | 21 |
Россия | 58 | США | 10 |
Япония | 55 | Украина | 7 |
Канада | 49 | Швеция | 6 |
Бразилия | 34 | Франция | 4 |
Австралия | 31 | Финляндия | 4 |
Великобритания | 22 | Турция | 4 |
Мексика | 18 | Австралия | 3 |
Швейцария | 15 | Великобритания | 3 |
Франция | 14 | Норвегия | 3 |
Италия | 14 | Италия | 2 |
Швеция | 14 | Бразилия | 1 |
Перу | 14 | Перу | 1 |
Источник: составлено М.И. Шаповаловым.
Table 3
Number of references to geographic names in the text
Ukranian textbook | Russian textbook | ||
Country | Number of references | Country | Number of references |
Ukraine | 564 | Russia | 635 |
USA | 143 | China | 29 |
China | 121 | Japan | 21 |
Russia | 58 | USA | 10 |
Japan | 55 | Ukraine | 7 |
Canada | 49 | Sweden | 6 |
Brazil | 34 | France | 4 |
Australia | 31 | Finland | 4 |
Great Britain | 22 | Turkey | 4 |
Mexico | 18 | Australia | 3 |
Switzerland | 15 | Great Britain | 3 |
France | 14 | Norway | 3 |
Italy | 14 | Italy | 2 |
Sweden | 14 | Brazil | 1 |
Peru | 14 | Peru | 1 |
Source: compiled by M.I. Shapovalov.
Сравнение количества упоминаний дает достаточно ясное представление о расстановке приоритетов в процессе изучения географии и оценке значимости отдельных стран.
Безусловно, компьютерная обработка реалий и терминов из учебников истории и географии сигнализирует об отсутствии единых фоновых знаний школьников в разных историко-географических областях.
Однако даже наличие в текстах учебников одинаковых понятий или персоналий не говорит о едином подходе к оценке события или персонажа. Нами был выделен набор понятий, по-разному оцениваемых в российских и украинских учебниках. Для этого был привлечен сентимент-анализ (анализ тональности текста). Тональность текста можно оценить, основываясь на наборе правил либо используя нейронные сети, или же комбинируя оба эти подхода. Как доказано в исследовании (Пазельская, 2011), особенно перспективно применение тональных словарей. Мы использовали для анализа тональный словарь русского языка[11] КартаСловСент (Кулагин, 2021).
Так, в качестве самого яркого примера продемонстрируем результаты сентимент-анализа такого персонажа, как Мазепа. Например: Мазепа и его роль в истории, униаты и православие, становление национальной идентичности, национально-освободительное движение, декоммунизация, история национальных меньшинств, глобализация.
В украинском учебнике для характеристики используются слова: гетман, Украина, Полтава, Речь Посполитая, Мазепа, казацкий, война, договор, левобережная, правобережная, Россия, Австрия, Хмельницкий, политика, традиции, права, противостояние, личность, поддержка, влияние, освобождение, Запорожье, легенда, наследие, государственный, патриотизм, укрепление, сопротивление, раскол, противник, восстание.
В российском же учебнике мы видим несколько иные лексемы:
Мазепа, гетман, Украина, политика, автономия, война, Сечь, православие, Левобережье, Правобережье, враги, сражение, казаки, история, судьба, противостояние, конфликт, непокорность, память, события, восстание, соперничество, плен, интриги, завоевание. Сравним их. Результаты анализа и общая оценка тональности представлены в табл. 4.
Результаты сентимент-анализа и тональных словарей в количественном и частотном отношении позволяют определить оценочные коннотации в отношении исторических лиц, географических объектов или описанных событий в учебнике, что дает возможность выявить общую тональность текста. Так, например, данные табл. 4 дают представление об общей положительной оценке образа Мазепы в украинском учебнике, что подтверждается общей оценкой тональности 0,0637. Учебник истории на русском языке демонстрирует иную общую оценку тональности –0,2225 (минусовое значение), что подтверждает резкую отрицательность коннотации образа.
Таблица 4
Оценка уровня тональности персоналий (фрагмент)
Украинский учебник истории | Российский учебник истории | ||
Слово | Оценка тональности | Слово | Оценка тональности |
Противостояние | –0,47 | Судьба | 0,01 |
Личность | 0,51 | Противостояние | –0,47 |
Поддержка | 1 | Конфликт | –1 |
Влияние | 0 | Непокорность | –0,34 |
Освобождение | 0,9 | Память | 0,58 |
Легенда | 0,55 | Восстание | –0,58 |
Наследие | 0,66 | Соперничество | –0,39 |
Патриотизм | 0,9 | Завоевание | –0,38 |
Общая оценка тональности 0,0637. Оценка положительная | Общая оценка тональности –0,2225. Оценка весьма отрицательная. | ||
Источник: составлено М.И. Шаповаловым.
Table 4
Evaluation of personality tonality level (fragment)
Ukrainian history textbook | Russian history textbook | ||
Word | Tonality evaluation | Word | Tonality evaluation |
Confrontation | –0.47 | Destiny | 0.01 |
Personality | 0.51 | Confrontation | –0.47 |
Support | 1 | Conflict | –1 |
Influence | 0 | Disobedience | –0.34 |
Liberation | 0.9 | Memory | 0.58 |
Legend | 0.55 | Rebellion | –0.58 |
Heritage | 0.66 | Сompetition | –0.39 |
Patriotism | 0.9 | Conquest | –0.38 |
General tonality evaluation 0.0637. Positive evaluation | General tonality evaluation –0.2225. Negative evaluation | ||
Source: compiled by M.I. Shapovalov.
Заключение
Результаты исследования имеют высокую значимость для обучения русскому языку и на русском языке в школах новых субъектов Российской Федерации и могут быть использованы для проведения ряда дальнейших научных изысканий, в т.ч. проектной и исследовательской деятельности школьников. Сформирован перечень необходимой лексики для обучения предметам на русском языке, которую следует в приоритетном порядке использовать в учебных текстах для школьников новых территорий. Сложившаяся ранее в новых субъектах РФ языковая и социокультурная ситуация привела к проявлению различных расхождений, что осложняет адаптацию школьников к российской образовательной системе. Исследование позволило всесторонне изучить причины расхождений и даже проявления лакун в условиях близкородственного двуязычия русского и украинского языков.
Значимость нашего исследования видится в следующих направлениях:
во-первых, разработанная методика компьютерного анализа текстов украинских и российских учебников истории и географии позволила подготовить уникальную базу для составления технологического инструментария предметной интеграции (русского языка, истории, географии) для учителей территорий новых субъектов РФ, работающих в условиях близкородственного двуязычия;
во-вторых, примененные инструменты квантитативной и корпусной лингвистики, как и использование компьютерных методов, позволяют прогнозировать на основе осуществленного анализа возможные трудности обучения предметам на русском языке на территории новых субъектов РФ;
в-третьих, полученные данные использованы для создания предметно-языковых интегративных методик по преподаванию русского языка, истории, географии, подготовленные к дальнейшему тиражированию на территориях новых субъектов РФ. Именно в последующем наполнении методических моделей и предполагается перспектива нашего исследования.
1 Сорочинська Н.М., Мартинюк О.О., Гісем О.О. Всесвітня історія : підручник для 9 кл. загальноосвіт. навч. закл. Тернопіль : Навчальна книга. Богдан, 2017. 272 с.; Юдовская А.Я., Баранов П.А., Ванюшкина Л.М. История. Всеобщая история. История Нового времени: 9-й класс : учебник. М. : Просвещение, 2023. 271 с.; Надтока О.Ф., Топузов О.М. Географія : підруч. для 9 кл. загальноосвіт. навч. закл. К. : УОВЦ «Оріон», 2017. 208 с.; Алексеев А.И. География. 9 класс : учеб. для общеобразоват. организаций. 7-е изд., перераб. М. : Просвещение, 2019. 239 с.
2 Инструменты для SEO-специалистов. URL: https://arsenkin.ru/tools/lemma/ (дата обращения: 03.11.2024).
3 Семантический анализ текста онлайн, SEO-анализ текста. URL: https://advego.ru/text/seo/ (дата обращения: 03.11.2024).
4 Национальный корпус русского языка. URL: https://ruscorpora.ru/ (дата обращения: 03.11.2024).
5 История. Учебный словарь. URL: http://history.pstu.ru/wp-content/uploads/2019/04/Grigorevyih.-Slovar-po-istorii-korr.pdf (дата обращения: 03.11.2024).
6 Словарь исторических терминов. URL: https://slovar-istoricheskih-terminov.slovaronline.com/ (дата обращения: 03.11.2024).
7 Исторический словарь. URL: https://gufo.me/dict/history_dict (дата обращения: 03.11.2024).
8 Историко-культурный стандарт. URL: https://iro86.ru/images/documents/Obr._Deyat/umk_istor/Istoriko_kultur_standart.pdf (дата обращения: 03.11.2024).
9 Интернет-сервис ChatPDF. URL: https://www.chatpdf.com/ru (дата обращения: 03.11.2024).
10 Юдовская А.Я, Баранов П.А, Ванюшкина Л.М. История. Всеобщая история. История Нового времени: 9-й класс : учебник. М. : Просвещение, 2023. 271 с.; Алексеев А.И. География. 9 класс : учеб. для общеобразоват. организаций. 7-е изд., перераб. М. : Просвещение, 2019. 239 с.
[11] Тональный словарь русского языка КартаСловСент. Объем датасета составляет 28197 слов. Датасет распространяется по лицензии CC BY-NC-SA 4.0. URL: https://github.com/dkulagin/kartaslov/diffs/0?commit=261eb5a10f558da87c5d8c0bfc51c3cd79719799&name=master&qualified_name=refs%2Fheads%2Fmaster&sha1=fe5981b8ae241331095e115294953c6dc8aa2627&sha2=261eb5a10f558da87c5d8c0bfc51c3cd79719799&short_path=162c582&unchanged=expanded&w=false (дата обращения: 18.03.2025).
About the authors
Elizaveta A. Khamraeva
Moscow Pedagogical State University
Author for correspondence.
Email: ea.khamraeva@mpgu.su
ORCID iD: 0000-0002-8551-5462
SPIN-code: 7025-3780
Scopus Author ID: 57215194561
Doctor of Pedagogy, Senior Researcher, Head of the Department of Linguodidactics of Russian as a Foreign Language and Bilingualism
1 Malaya Pirogovskaya St., bldg. 1, Moscow, 119991, Russian FederationMichail I. Shapovalov
Moscow Pedagogical State University
Email: mi.shapovalov@mpgu.su
ORCID iD: 0000-0002-6425-3862
SPIN-code: 2588-7140
Candidate of Technical Sciences, Doctor of Engineering Sciences (Germany), Associate Professor of the Department of General Linguistics named after I.G. Dobrodomova
1 Malaya Pirogovskaya St., bldg. 1, Moscow, 119991, Russian FederationLilia V. Kovtun
Moscow Pedagogical State University
Email: lv.kovtun@mpgu.su
ORCID iD: 0009-0008-3207-1969
SPIN-code: 3186-1995
Scopus Author ID: 57314706600
PhD in Cultural Studies, Associate Professor, Associate Professor of the Department of Linguodidactics of Russian as a Foreign Language and Bilingualism
1 Malaya Pirogovskaya St., bldg. 1, Moscow, 119991, Russian FederationReferences
- Alimov, V. V. (2003). Special translation and linguistic intervention. Moscow: Moscow University of the MVD. (In Russ.). EDN: QQRWUN
- Arynbayeva, R. A., Makhanova, Zh. K., & Dmitryuk, N. V. (2023). Forming linguistic-cultural competencies in Kazakhstani students learning Russian as a non-native language. Russian Language Studies, 21(3), 341–355. (In Russ.). http://doi.org/10.22363/2618-8163-2023-21-3-341-355 EDN: SKSMWB
- Ceytlin, S. N., & Kruglyakova, T. A. (2024). Case system in learning Russian as a first and second foreign language. Russian Language Studies, 22(1), 135–149. (In Russ.). http://doi.org/10.22363/2618-8163-2024-22-1-135-149 EDN: QTISXN
- Dzhusupov, M. (2021). Speech interference as the result of a two-pronged negative influence. RUDN Journal of Language Studies, Semiotics and Semantics, 12(1), 23–40. (In Russ.). https://doi.org/10.22363/2313-2299-2021-12-1-23-40 EDN: AQSPZE
- Fedorova, N. P. (2010). Overcoming linguocultural interference in the process of teaching a foreign language to students of non-linguistic universities (based on the material of the English language). [Author’s abstr. cand. ped. diss.]. Nizhny Novgorod. (In Russ.). EDN: ZOBSZV
- Gavrilina, M. A. (2022). Orthographic literacy of Russian-speaking schoolchildren in Latvia. Russian Language Studies, 20(1), 101–114. (In Russ.). http://doi.org/10.22363/2618-8163-2022-20-1-101-114 EDN: GUYSHI
- Hackett-Jones, A. V. (2016). Language and culture interference in plurilingual education. Russian Linguistic Bulletin, (3), 141–143. https://doi.org/10.18454/RULB.7.08 EDN: XRZCNT
- Isurin, L. (2021). Does language transfer explain it all? The case of first language change in Russian-English bilinguals. Russian Journal of Linguistics, 25(4), 908–930. https://doi.org/10.22363/2687-0088-2021-25-4-908-930 EDN: YIUUJP
- Konovalova, E. A. (2012). The problem of interference between closely-related languages (on example of the poly-lingua-cultural situation of the Autonomous Republic of Crimea). Scientific Notes of V.I. Vernadsky Crimean Federal University. Filology. Social communications, 25(2-1), 14–18. (In Russ.). EDN: RWHQBL
- Krasnova, T. A. (1985). Prosodic interference in the interaction of lexical-grammatical and intonation means. [Author’s abstr. cand. phil. diss]. Leningrad. (In Russ.). EDN: CWZRUI
- Kulagin, D. I. (2021). Open tone dictionary of the Russian language KartaSlovSent. Computer linguistics and intellectual technologies, (20), 1106–1119. (In Russ.). https://doi.org/10.28995/2075-7182-2021-20-1106-1119 EDN: XGDDBD
- Larina, T. V. (2006). Linguocultural communicative interference. In Humaniora: lingua Russica. Works on Russian and Slavic philology. Linguistics IX. Interaction of languages and linguistic units (pp. 184–196). Tartu: University of Tartu. (In Russ.).
- Markova, E. M., & Kvapil, R. (2021). Teaching Russian in a closely-related Slovak environment. Russian Language Studies, 19(2), 191–206. (In Russ.). http://doi.org/10.22363/2618-8163-2021-19-2-191-206 EDN: DWXBTM
- Odlin, T. (2012). Language Transfer: Cross-linguistic influence in Language Learning. UK: Cambridge. https://doi.org/10.1017/CBO9781139524537
- Pazelskaia, A. G., & Solovev, A. N. (2011). Method for emotion analisys in Russian texts. In Computational Linguistics and Intelligent Technologies: Proceedings of the International conference Dialog-2011 (pp. 510–552). Moscow: Nauka Publ. (In Russ.).
- Plungyan, V. A. (2023). The parallel corpus as a grammar database and the New Testament as a parallel corpus (Preface). Acta Linguistica Petropolitana, 19(3), 15–38. http://doi.org/10.30842/alp230657371931538 EDN: IVRTMB
- Potapov, V. V. (2022). Linguistic and cognitive approach to the creation of an automated translation system based on specialized parallel terminological databases. Social and Humanitarian Sciences. Domestic and foreign literature. Series 6: Linguistics, (2), 35–40. (In Russ.). http://doi.org/10.31249/ling/2022.02.01 EDN: FYEEGF
- Reformatsky, A. A. (2001). Introduction to language studies. Moscow: Aspect Press. (In Russ.).
- Semchinsky, S. B. (1973). Semantic interference of languages (on the material of Slavic-Eastern Romance contacts). [Author’s abstr. cand. phil. diss.]. Moscow. (In Russ.).
- Shaklein, V. M. (2010). Lingvoсultural situation in modern Russia. Moscow: Flinta: Nauka Publ. (In Russ.). EDN: QWFAGP
- Shcherba, L. V. (1974). On bilingualism. In Shcherba, L.V. (ed.). Language system and speech activity (pp. 313–318). Leningrad: Nauka Publ. (In Russ.).
- Sverdlova, N. A. (2019). Hermeneutic aspects of bilingualism: the role of interlingual interference. RUDN Journal of Language Studies, Semiotics and Semantics, 10(3), 602–609. (In Russ.). https://doi.org/10.22363/2313-2299-2019-10-3-602-609 EDN: JALCBS
- Timachev, P. V. (2005). Linguistic and cultural interference as a communicative obstacle (based on the material of the English language). (Candidate dissertation). Volgograd. (In Russ.). EDN: NNGIBN
- Tkacheva, E. K. (2024). Lexical interference or what to pay attention to when preparing Spanish-speaking students for the subtest “Writing”. Russian Language: Research, Testing and Practice, 10(1), 55–62. (In Russ.). https://doi.org/10.22363/3034-2090-2024-10-1-55-62
- Tomalin, B., & Stempleski, S. (1993). Cultural awareness. New York, NY: OUP.
- Vereshchagin, E. M. (1969). Psychological and methodological characteristics of bilingualism. Moscow: Moscow State University. (In Russ.). EDN: GOGOWN
- Vinogradov, V. A. (1990). Diglossia. In Yartseva, Y.S. (ed.). Linguistic encyclopedic dictionary. Moscow: Sovetskaya ehntsiklopediya Publ. (In Russ.).
- Vishnevskaya, G. M. (1993). Interference and emphasis (On the material of intonational errors in the study of non-native language). (Candidate dissertation). Saint Petersburg. (In Russ.). EDN: VQOLVV
- Wierzbicka, A. (1978). Metatext in the text. New in foreign linguistics. Linguistics of the text. Is. 8 (pp. 402–424). Moscow: Progress Publ. (In Russ.).
Supplementary files










