Компьютерный анализ контента учебников истории и географии для создания интегративной методики обучения на русском языке в новых субъектах РФ

Обложка

Цитировать

Полный текст

Аннотация

Актуальность исследования определяется необходимостью создания предметно-языковых интегративных методик для территорий новых субъектов Российской Федерации, в которых преподавание ведется в условиях близкородственного двуязычия. Сложившаяся ранее в данных регионах языковая и социокультурная ситуация часто осложняет адаптацию школьников к российской образовательной среде. Цель исследования - провести анализ контента учебников истории и географии на русском и украинском языках для создания новых предметно-языковых интегративных методик обучения на русском языке. Для этого необходимо объективно оценить объем фоновых знаний культуроведческого характера, а главное - их влияние на успешность усвоения различных учебных предметов на русском языке школьниками. Компьютерные методы квантитативной и корпусной лингвистики позволяют исследовать тексты на русском и украинском языках и прогнозировать возможные трудности и проблемы в обучении на русском языке на территории новых субъектов РФ. Для выделения терминов-словосочетаний из текста учебников использовался интернет-сервис на основе искусственного интеллекта ChatPDF. Материалом исследования послужили украинские и русские учебники всемирной истории и географии для 9 класса. Анализ проводился на трех уровнях: языковом - частота употребления языковых единиц, оценочном - сентимент-анализ концептов, культурологическом - учет степени важности концептов. В процессе анализа тезауруса учебников выявлена лексика, которая присутствует в обоих учебниках либо только в одном из них. По результатам анализа с применением цифровых методов подготовлена база для составления технологического инструментария предметной интеграции (русского языка, истории, географии, окружающего мира) на территориях новых субъектов РФ в условиях близкородственного двуязычия. Отдельные элементы исследования, решенные средствами компьютерных технологий, могут быть предложены в качестве заданий для проектной деятельности школьников, что в значительной степени повысит их мотивацию к обучению.

Полный текст

Введение

В России возникла задача интеграции обучающихся из новых регионов в единое образовательное пространство. Общение со школьниками из новых территорий во время летних школ и совместных проектов в центральной России показывает, что их знания концептуально важных для России событий и исторических личностей часто оказываются недостаточными, а оценка не всегда соответствует исторической правде. Лакуны в фоновых знаниях могут препятствовать интеграции в образовательное пространство или вызывать проблемы с адаптацией во время учебы в школе или в российском вузе.

Понятийные, образные и оценочные характеристики значимых концептов отличаются в картинах мира даже близкородственных культур. Данный феномен исследовался многими учеными (Вежбицка, 1978; Ларина, 2006; Hackett-Jones, 2016; Свердлова, 2019). Этот фактор лег в основу поиска причин возникшей лакунарности и обращения к анализу текстов учебников географии и всемирной истории 9 класса, проведенному с точки зрения соответствия фактологического аппарата, особенно интерпретации языковых и лингвокультурных реалий, которые, на наш взгляд, и порождают проблемы при общении между школьниками из разных регионов России.

Достаточно полно изучено взаимоотношение близкородственных языков, описаны явления языковой интерференции. Тем не менее, исследование в сфере обнаружения расхождения элементов языка и культуры в пространстве школьного образования в близкородственной среде проводится впервые. Достаточно часто лингвокультурную компетенцию рассматривают в связи с изучением иностранных языков (Odlin, 1989; Tomalin, Stempleski, 1993). При этом сравнительных исследований в сфере близкородственных языков ощутимо меньше (Маркова, Квапил, 2021), поскольку бытует мнение, что говоря-щие на родственных языках способны на самокоррекцию и не нуждаются в дополнительном внимании. Однако в ходе исследования обнаружено, что при владении близкородственными языками говорящие не всегда осознают различия между языками и менее тщательно следят за соблюдением коммуникативных и лингвокультурных норм из-за особенностей лингвокультурной ситуации. Лингвокультурная ситуация — это динамичный и волнообразный процесс взаимодействия языков и культур в исторически сложившихся культурных регионах и социальных средах (Шаклеин, 2010: 19), где уровень проявления взаимовлияния и интерференции часто зависит от культурной и политической ситуации, особенно в детском и подростковом возрасте.

Феномен интерференции активно изучается в разных научных дисцип-линах, например, лингвистике, социолингвистике, психолингвистике, психологии и методике преподавания иностранных языков. Такие исследователи, как В.В. Алимов, Е.М. Верещагин, В.А. Виноградов, М. Джусупов (Алимов, 2003; Верещагин, 1969; Виноградов, 1990; Джусупов, 2021) и др., внесли значительный вклад в изучение вопросов, связанных с различной интерференцией, однако универсального подхода к этому явлению пока не выработано.

Среди российских ученых одним из первых затронул тему интерференции в своих исследованиях Л.В. Щерба (Щерба, 1974). Он описал интерференцию как процесс взаимного искажения двух языков при изучении иностранного, когда родной язык оказывает влияние на иностранный. Более общее определение дал В.А. Виноградов (Виноградов, 1990), представив интерференцию как результат взаимодействия языковых систем в условиях двуязычия, проявляющийся в отклонениях от норм и структуры второго языка под воздействием первого.

Каждый человек, принадлежащий к конкретной культуре, воспринимает мир сквозь призму своей культурной картины мира, что приводит к столкновению концептов и взаимодействию языковых форм. На протяжении долгого времени основной фокус исследований интерференции был направлен на ее языковые аспекты, особенно на фонетический (Вишневская, 1993, Краснова, 1985), орфографический (Гаврилина, 2022), грамматический (Isurin, 2021) и лексический уровни (Ткачева, 2024), так как влияние родного языка на второй язык чаще всего выражается через ошибки и неоправданный перенос элементов из одного языка в другой. Именно поэтому ранее исследования интерференции сосредоточивались преимущественно на ее фонетических и грамматических проявлениях (Семчинский, 1973; Цейтлин, Круглякова, 2024). Тем не менее, интерференционные процессы могут происходить на любом уровне языковой системы и проявляются в речи независимо от осознанных усилий говорящего.

Исследованием культурного аспекта взаимовлияния языков занимаются П.В. Тимачев, Н.П. Федорова, Р.А. Арынбаева, Ж.К. Маханова и Н.В. Дмит-рюк (Тимачев, 2005; Федорова, 2010; Арынбаева, Маханова, Дмитрюк, 2023). Важно отметить, что знание экстралингвистических факторов, например, обычаев, традиций, системы ценностей играет ключевую роль в организации языкового образования. По словам П.В. Тимачева (Тимачев, 2005), неполное совпадение культурных ассоциаций одного языка с аналогичными ассоциациями других языков, вступающих в контакт, свидетельствует о лингвокультурной интерференции. Причина возникновения такой интерференции кроется в различиях между лингвокогнитивными картинами мира разных культур. Для устранения подобных трудностей в период обучения предлагается формирование недостающих знаний о чужой культуре, корректировка ошибочных представлений и дополнение недостающей информации на лингвистическом, дискурсивном и социокультурном уровнях. Безусловно, в школьном возрасте многие реалии и представления формируются у обучающихся средствами образовательно-воспитательной среды и учебников. Именно поэтому в исследовании была реализована идея проведения компьютерного анализа на нескольких уровнях: языковом, где с помощью цифровых средств устанавливалась частотность употребления языковых единиц; оценочном, когда предлагался сентимент-анализ выявленных концептов, и общем культурологическом, позволившем определить сам перечень концептов.

Язык несет в себе информацию о ценностях, нормах поведения и мировоззрении определенного народа. Безусловно, культурная картина мира включает в себя важнейшие концепты, которые кажутся универсальными, но воспринимаются носителями разных языков по-разному и отражают особенности понимания сущности мира. А.А. Реформатский писал: «Кажущееся тождество первичного и вторичного языков ведет к тому, что обучаемый все более начинает опираться на родной язык. Эти тождества, как правило, мнимы, и поэтому они, будучи провокационными, способствуют более длительному и устойчивому сохранению интерференции» (Реформатский, 2001: 27). Так, даже при хорошем знании русского языка можно прогнозировать трудности в понимании культурных контекстов и подтекстов, особенно если речь идет о специфических терминах или идиоматических выражениях. Незнание концептов или их неточная интерпретация затрудняет адаптацию к российскому образовательному пространству школьников, живущих на территориях новых субъектов РФ и недавно вошедших в состав России (Херсонская и Запорожская области). Именно поэтому задачи создания единства в понимании фактов культуры в школьных учебниках и стали объектами отдельного внимания.

Возникновение корпусных методов лингвистических описаний позволило автоматизировать исследования параллельных корпусов на основе применения новых интегрированных и цифровых подходов (Плунгян, 2023). Например, в исследованиях В.В. Потапова представлены терминологические базы данных, помогающие переводчикам решить многие профессиональные задачи (Потапов, 2022). При этом значительная часть задач решалась до сих пор без использования компьютерных и цифровых инструментов. Компьютерный анализ текстов учебников помогает максимально точно обозначить зоны расхождений используемых терминов и интерпретации фактов языка и культуры.

Цель исследования — провести анализ контента учебников истории и географии на русском и украинском языках для создания предметно-языковых интегративных методик в средних общеобразовательных школах новых территорий. Проведенный анализ призван объективно оценить уровень фоновых знаний культуроведческого характера, а также проанализировать, как они влияют на усвоение различных учебных предметов на русском языке школьниками новых субъектов РФ.

Методы и материалы исследования

Материалом для исследования послужили тексты учебников по все-мирной истории и географии на русском и украинском языках, находящиеся в свободном доступе в сети Интернет, а также в цифровых школьных библиотеках[1]. На территориях Донецкой Народной Республики (ДНР) и Луганской Народной Республики (ЛНР) российские учебники используются с 2014 г., однако на территориях Херсонской и Запорожской областей до последнего времени обучение всем предметам велось по украинским учебникам. Именно этот факт и определил выборку.

Для частотного анализа были выбраны учебники всемирной истории и географии 9 класса, поскольку они содержат как хорошо развитую терминологическую подсистему, так и значительное количество слов общей лексики. Именно 9 класс — это период завершение ступени общего образования, по-этому основные понятия и термины аккумулированы в данных учебниках максимально. Хотя языковая интерференция является психолингвистическим явлением, в фокусе нашего внимания находились ее результаты, проявляющиеся в форме нарушений языковых или культурных норм. Например, в учебниках географии помимо слов общей лексики и терминов выделялись специфические географические названия или топонимы, используемые в той или иной социокультурной действительности, а в учебниках истории выделялись значимые исторические события или имена, которые оценивались с точки зрения частотности использования. Таким образом осуществлялась экстраполяция характеристик обнаруженного влияния на формирование лингвокультурных представлений обучающихся.

В качестве теоретических методов применялись анализ и обобщение источниковых данных, лексических корпусов, научных трудов по вопросам компьютерной и цифровой обработки полученных результатов.

Перед началом частотного анализа была проведена лемматизация (лемма — это неизменная, базовая форма слова, которая служит основой для всех его грамматических вариаций, например существительных к именительному падежу, а глаголов к инфинитиву). Для этого были использованы интернет-сервисы SEO-оптимизации2, 3. Заметим, что первый сервис[2] позволяет проверять текст на n-граммы максимум до 7 слов в n-грамме. Второй сервис[3] выделяет семантическое ядро и дает частоты входящих в него слов. Именно с семантическим ядром и велась дальнейшая работа.

На втором этапе исследования выделена терминологическая подсистема. Нами был использован подход, использующий анализ значения коэффициента Жуйана в Национальном корпусе русского языка[4] (НКРЯ). Коэффициент Жуйана показывает, насколько равномерно распределены частоты в различных сегментах корпуса. Однако для его использования нужно сначала определить граничное значение коэффициента Жуайна, начиная с которого слово может быть отнесено к термину. Это необходимо, учитывая большой объем анализируемой информации, делающий невозможным (крайне затруднительным) ручную обработку. Значения коэффициента Жуйана для терминов были получены для слов из следующих источников: История. Учебный словарь[5], Словарь исторических терминов[6], Исторический словарь[7] и установлено максимальное значение коэффициента Жуйана, позволяющее отнести при анализе слово к термину — 54.

Для проверки мы выделили термины и определения из Историко-культурного стандарта[8]. В Стандарте они содержатся, в т.ч. в виде выделенных блоков. Анализ показал, что слова со значением коэффициента Жуйана — 55–80 относятся в значительной части к словам общей лексики, но могут быть использованы и в качестве терминов. Так, например, для учебников истории была автоматически выделена терминологическая подсистема, которая и стала предметом пристального рассмотрения. В учебнике на русском языке это: военные реформы, Вторая мировая война, гражданская война, демократия, империализм, информационная революция, ислам, классовая борьба, культурная идентичность, научная революция, патриотические организации, политическая идеология. Всего порядка 150 терминов.

При этом только в украинском учебнике: выгода, инвестиции, инфляция, капитал, ликвидность, макроэкономика, микроэкономика, налоги, рынок, спрос, углеродный след, экологическая политика, экология, эмпатия.

В процессе выявления доминирующих лексических единиц учебников истории сгруппированы термины, которые присутствуют в обоих учебниках или только в одном из них. Это дало возможность сделать вывод о том, что уже на первом этапе анализа, когда рассматривается терминосистема и глоссарии, обнаруживается различный подход к формированию содержания учебника.

Заметим, что при анализе учебников географии по аналогичной методике, была выделена значительная (порядка 11 % лексики) группа слов, представляющих собой специфическую географическую терминосистему. Так, для учебников на русском языке характерными стало использование понятий: географическое положение, государственная граница, морская граница, страны-соседи, российский сектор Арктики, адаптация, природные условия, природные ресурсы, часовые пояса, декретное время, московское время, Северный морской путь, научное прогнозирование, географический прогноз. Для учебника на украинском языке частотно выше использовались слова: геосистема, климат, экологическая катастрофа, природа, летнее и зимнее время, конструктивная роль географии. Анализ также выявил факты использования в качестве терминов в данных учебниках (порядка 7 %) слов общей лексики, что не позволяло провести выделение терминологической подсистемы полностью в автоматическом режиме и обусловило дополнительную проверку, осуществленную исследователями. Уточним, что описанная выше методика проведения анализа работает только для n-грамм с n = 1. Для выделения терминов-словосочетаний (n > 1) из текста учебников использовался интернет-сервис на основе искусственного интеллекта ChatPDF[9].

Результаты

Доказано, что лингвокультурные базы учебников по истории России и Украины и в меньшей степени учебников географии существенно разли-чаются. Этот фактор объясняет затруднения школьников новых территорий в определении географических или исторических реалий, в использовании значимых имен, а главное — и расхождение фоновых знаний, отмечаемое учителями. Анализ частоты слов и n-граммов текстов учебников стал важным инструментом в исследовании различных видов расхождений исторических и географических знаний у школьников-носителей близкородственных языков (русского и украинского), что позволило сформулировать результаты:

Выявлены доминирующие лексические единицы. Это позволило в ходе исследования определить, какие культурные концепты являются значимыми для носителей каждого из языков. Например, для российских учебников истории: суверенитет, культурная идентичность, патриотические организации, для украинских: выгода, инвестиции, свобода воли. Для российских учебников географии — сибирь, северный морской путь, экология. Для украинских учебников — зеленые технологии, климатические проблемы, раздельный сбор мусора. Высокая частотность названных лексем указывает на понятия и концепты, на которые учителю необходимо обращать отдельное внимание.

Выявлены языковые стереотипы. Это дало возможность высказать предположение, что определенные слова часто используются лишь в одном из языков, что указывает на определенные понятийные несоответствия. Например, для российских учебников истории: гражданская война, институт семьи, историческая память, для украинских: зависимость, индивидуализм, голодомор. В учебниках географии ярче всего стереотипность подтверждается количеством упоминаний разных стран. Так, например, в российских учебниках упоминаются Россия, Евразия, Китай, США. В украинских учебниках — Украина, США, Евросоюз.

Определены особенности словоупотребления. С помощью частотного анализа текстов учебников на украинском языке удалось выявить случаи использования слов и терминов с частотой, нехарактерной для носителя русского языка. Например, в учебниках истории на украинском языке в 30...50 раз по сравнению с НКРЯ превышена частотность слов: захватнический, неравноправный, колонизатор, географии — экологические катастрофы, зеленая энергетика, глобализация.

Выделены классы высокочастотных семантически близких слов. Это помогло выявить, какие слова чаще подвергаются интерференции, и понять закономерности изменения при переходе от одного языка к другому. Например, одинаково часто используются слова: глобальное потепление, климат, социальные нормы.

Проанализированы термины с целью фиксации семантических изменений. В ходе исследования обнаружен факт: если термин получил новое или смещенное значение, это может прогнозировать возможную культурную интерференцию. Например, по-разному оцениваются в российских и украинских учебниках истории такие понятия, как: униаты и православие, становление национальной идентичности, национально-освободительное движение, декоммунизация, история национальных меньшинств. По учебникам географии — государственные границы, нефтяная промышленность, газопровод.

Осуществлен анализ частеречного состава текстов учебников. Это дало возможность обнаружить частоту использования различных частей речи в учебно-научном подстиле учебников в ситуации близкородственного двуязычия русского и украинского языков, что не являлось целью обозначенного исследования, но может быть предложено для изучения в дальнейшем. Выявлено, что самую высокую разницу дают существительные-термины и глаголы восприятия или состояния.

Результатом исследования стал также проведенный сентимент-анализ (компьютерный анализ тональности) для описания персоналий и концептов, позволяющий предвидеть сформированные культурные стереотипы, приводящие к проявлению лингвокультурной интерференции. Ниже приведен пример сентимент-анализа такого исторического персонажа, как Мазепа.

Важно подчеркнуть, что выделение анализа терминологической подсистемы в отдельную задачу позволило одновременно с изучением языковой интерференции исследовать ряд дополнительных параметров, таких, например, как распределение плотности терминов в тексте, выявлять и анализировать многозначность терминов в учебниках различных дисциплин. Такого рода дополнительная информация может быть весьма полезна при разработке методических материалов.

Безусловно, инструменты квантитативной и корпусной лингвистики с использование компьютера позволили получить обширные результаты. Нужно иметь в виду, однако, определенное смещение лексического частотного спектра Национального корпуса русского языка, вызванное значительным процентом (около 40) содержащихся в нем текстов из классической литературы. Заметим, что в наших исследованиях анализировалась не только частота отдельных слов, но и n-граммов, т.е. многосоставных терминов и понятий.

Обсуждение

Язык является основным средством формирования личности. Он выступает как часть культуры, охватывающей мировоззрение, традиции, нормы и способы общения. В условиях близкородственного двуязычия изучение русского языка играет ключевую роль в формировании личности и усвоении основ национальной культуры. Язык выражает духовную культуру народа, включая фольклор, литературу и философию. Именно он представляет собой фундаментальный элемент человеческой культуры, а его глубокое изучение связано с усвоением духовных ценностей нации. Основное становление человека происходит в школьном возрасте, поэтому так важно обнаружить содержательные компоненты данного процесса, включая тексты учебной литературы. Развитие русского языка в образовательных учреждениях не должно ограничиваться только пониманием и разговорной речью, важно вовлекать обучающихся в национальную культуру, используя русский язык как инструмент этого процесса. Безусловно, обучение в условиях близкородственного двуязычия подразумевает изучение русского языка в контексте национальной культуры, поэтому так важен процесс преодоления лингвокультурной интерференции.

Преподавание и изучение русского языка в новых регионах России (ДНР, ЛНР и особенно в Запорожской и Херсонской областях) отличаются рядом особенностей, например, межъязыковой интерференцией, недостаточной семантической и когнитивной базой русского языка у обучающихся на всех уровнях образования, отсутствием фоновых знаний, характерных для обучающихся российских школ.

Именно поэтому в ходе компьютерного анализа учебников, включаю-щего и анализ частотности слов и терминов, и сравнение тезауруса, и контент-анализ обработки результатов средствами искусственного интеллекта, проведенной в рамках данного исследования, оказалось возможным не только описать прогноз возможной лингвокультурной интерференции, но и сформировать набор понятий и тем, необходимых для актуализации на уроках русского языка. Таким образом сформировали перечень слов необходимой общей учебной лексики на русском языке, которую следует в приоритетном порядке использовать в учебных текстах для школьников данной территории с целью заполнения лакун или уменьшения лингвокультурных расхождений, на изучение которых следует обратить особое внимание при организации образовательного процесса на новых территориях.

Детализируем данный тезис. Так, например, в ходе исследования был проанализирован частеречный состав российского и украинского учебников истории и географии 9 классов и определены зоны потенциального расхождения понимания содержания тестов учебника.

Ориентируясь на результаты исследования (Коновалова, 2012), в котором анализировались статистические показатели интерференции с точки зрения частеречной принадлежности интерферем, мы оценили частеречный состав российских учебников истории и географии[10] (показатель указывает, на работу с какими словами следует обратить внимание в первую очередь — это существительные-термины и глаголы восприятия и состояния) (табл. 1).

Таблица 1
Нормированный вклад части речи в возможную интерференцию

Уникальных слов

Часть речи

Доля в учебнике, %

Вероятность интерференции

Вклад в возможную интерференцию (нормирован)

2160

Существительное

50

0,11

5,5

959

Глагол

22

0,15

3,3

920

Прилагательное

21

0,08

1,84

240

Наречие

5

0,23

1,15

Источник: составлено М.И. Шаповаловым.

Table 1
Normalized part of speech contribution to the possible interference

Unique words

Part of speech

Proportion in the textbook

Possibility of interference

Contribution to the possible interference (normalized)

2160

Noun

50

0.11

5.5

959

Verb

22

0.15

3.3

920

Adjective

21

0.08

1.84

240

Adverb

5

0.23

1.15

Source: compiled by M.I. Shapovalov.

Выделено порядка 30 терминов, содержащихся в учебниках географии и истории на обоих языках: глобализация, Вторая мировая война, глобальное потепление, информационные технологии, искусственный интеллект, миграция, образование, революция, социальная мобильность, эволюция, экономическая политика. Но при этом большое количество слов-терминов и имен собственных, необходимых для освоения программ российской школы, обнаружено только в российских учебниках, что заранее определяет зоны необходимого внимания при работе со школьниками новых территорий: военные реформы, великая отечественная война, гражданская война, Петр Первый, море Лаптевых, северный морской путь, информационная революция, ислам, классовая борьба, культурная идентичность, научная революция, патриотические организации, политическая идеология. При этом только в украинских учебниках географии и истории были обнаружены термины: жизненный цикл, загрязнение почвы, законы природы, зеленые технологии, нейробиология, психическое здоровье, разделение мусора, свобода воли, углеродный след, экологическая политика, униаты и православие, голодомор, декоммунизация. Безусловно, слова, отсутствующие в украинских учебниках, требуют отдельного внимания, включая организацию специальной лексической работы на уроках русского языка.

Далее для проведения анализа из учебников на украинском языке выделили 150 терминов, которые сопоставляли с частотностью использования в НКРЯ, что в итоге продемонстрировало наличие количественных расхождений, которое и становится причиной проявления фоновых интерференций (табл. 2).

Частотность рассмотренных слов в украинских учебниках истории и географии на порядок превышает частоту в российских учебниках и отражает сформированные учебными материалами социально-культурные реалии общества. Безусловно, для уменьшения лингвокультурной интерференции следует учитывать этот фактор.

Таблица 2
Превышение частоты слова по сравнению с НКРЯ, раз (фрагмент)

Украинский учебник истории

Российский учебник истории

Слово

Превышение частоты по сравнению с НКРЯ, раз

Слово

Превышение частоты по сравнению с НКРЯ, раз

Османский

1535

Право

288

Якобинец

1253

Демократизация

252

Тори

1206

Монополистический

218

Конвент

1188

Буржуазия

201

Пруссия

1077

присоединять

178

Колонизатор

1035

Триколор

140

Балканский

789

Урбанизация

136

Австро-венгерский

658

Парламентаризм

119

Захватнический

411

Монархия

118

Неравноправный

365

Основывать

117

Источник: составлено М.И. Шаповаловым.

Table 2
Excess word frequency compared to the Russian National Corpus (RNS) (times). (Fragment)

Ukrainian history textbook

Russian history textbook

Word

Excess word frequency compared to RNS (times)

Word

Excess word frequency compared to RNS (times)

Ottoman

1535

Law

288

Jacobin

1253

Democratization

252

Tory

1206

Monopolistic

218

Convention

1188

Bourgeoisie

201

Prussia

1077

To join

178

Colonizer

1035

Tricolor

140

Balkan

789

Urbanization

136

Austro-Hungarian

658

Parliamentarism

119

Invasive

411

Monarchy

118

Unequal

365

To found

117

Source: compiled by M.I. Shapovalov.

Что же касается слов общей лексики, то выявлено отсутствие в украинских учебниках ряда слов, присутствующих в российских учебниках, например: центр, федерация, управление, гражданин, память, отечественный. Это является, на наш взгляд, причиной возникающих проблем.

Так, на основании анализа русских и украинских учебников истории при помощи компьютерных методов, а также коннотативной оценки текстов, включающих определенные концепты (гражданин, память, вера, православие, национальная идентичность, великая отечественная война, Сибирь, Русский Север), появилась возможность определять те зоны, которые необходимо корректировать с помощью специальных форм организации школьной деятельности (проектной, поисково-исследовательской и др.), а также через создание предметно-интегративных методик обучения на русском языке для преодоления лингвокультурной интерференции у школьников. Выяснение критических точек расхождения в фоновых знаниях позволило в рамках проведенного исследования сформулировать рекомендации по списку тем и материалов, которые целесообразно включать в работу со школьниками новых регионов на уроках истории.

Методика анализа учебников географии аналогична описанной выше для учебников истории. Так, например, проверялось, насколько пересекается семантически общая лексика украинского и российского учебников 9 класса. Для этого вновь использовался механизм лемматизации содержания учебников на обоих языках, т.е. приведения словоформ к их базовой форме. Данный подход машинного преобразования текста позволил упростить анализ первоисточников, снизил размерность материалов и повысить точность работы алгоритмов обработки. Уникальных слов в российском учебнике оказалось 5869, в украинском — 6846. Пересечение общей лексики составило всего 2344 лемм, что в близкородственных и структурно единых языках составляет всего лишь около 40 %. Отметим, что 60 % расхождения слов общего употребления, на наш взгляд, достаточно существенно. Обнаруженное в украинских учебниках отсутствие слов общей лексики (например, полоса, заселять, опорный, переселенец) должны стать предметом особого внимания на уроках русского языка.

Дополнительно, после лемматизации были выделены географические наименования и рассчитана их частотность (табл. 3).

Таблица 3
Количество упоминаний географических наименований в тексте

Украинский учебник

Российский учебник

Страна

Количество упоминаний

Страна

Количество упоминаний

Украина

564

Россия

635

США

143

Китай

29

Китай

121

Япония

21

Россия

58

США

10

Япония

55

Украина

7

Канада

49

Швеция

6

Бразилия

34

Франция

4

Австралия

31

Финляндия

4

Великобритания

22

Турция

4

Мексика

18

Австралия

3

Швейцария

15

Великобритания

3

Франция

14

Норвегия

3

Италия

14

Италия

2

Швеция

14

Бразилия

1

Перу

14

Перу

1

Источник: составлено М.И. Шаповаловым.

Table 3
Number of references to geographic names in the text

Ukranian textbook

Russian textbook

Country

Number of references

Country

Number of references

Ukraine

564

Russia

635

USA

143

China

29

China

121

Japan

21

Russia

58

USA

10

Japan

55

Ukraine

7

Canada

49

Sweden

6

Brazil

34

France

4

Australia

31

Finland

4

Great Britain

22

Turkey

4

Mexico

18

Australia

3

Switzerland

15

Great Britain

3

France

14

Norway

3

Italy

14

Italy

2

Sweden

14

Brazil

1

Peru

14

Peru

1

Source: compiled by M.I. Shapovalov.

Сравнение количества упоминаний дает достаточно ясное представление о расстановке приоритетов в процессе изучения географии и оценке значимости отдельных стран.

Безусловно, компьютерная обработка реалий и терминов из учебников истории и географии сигнализирует об отсутствии единых фоновых знаний школьников в разных историко-географических областях.

Однако даже наличие в текстах учебников одинаковых понятий или персоналий не говорит о едином подходе к оценке события или персонажа. Нами был выделен набор понятий, по-разному оцениваемых в российских и украинских учебниках. Для этого был привлечен сентимент-анализ (анализ тональности текста). Тональность текста можно оценить, основываясь на наборе правил либо используя нейронные сети, или же комбинируя оба эти подхода. Как доказано в исследовании (Пазельская, 2011), особенно перспективно применение тональных словарей. Мы использовали для анализа тональный словарь русского языка[11] КартаСловСент (Кулагин, 2021).

Так, в качестве самого яркого примера продемонстрируем результаты сентимент-анализа такого персонажа, как Мазепа. Например: Мазепа и его роль в истории, униаты и православие, становление национальной идентичности, национально-освободительное движение, декоммунизация, история национальных меньшинств, глобализация.

В украинском учебнике для характеристики используются слова: гетман, Украина, Полтава, Речь Посполитая, Мазепа, казацкий, война, договор, левобережная, правобережная, Россия, Австрия, Хмельницкий, политика, традиции, права, противостояние, личность, поддержка, влияние, освобождение, Запорожье, легенда, наследие, государственный, патриотизм, укрепление, сопротивление, раскол, противник, восстание.

В российском же учебнике мы видим несколько иные лексемы:

Мазепа, гетман, Украина, политика, автономия, война, Сечь, православие, Левобережье, Правобережье, враги, сражение, казаки, история, судьба, противостояние, конфликт, непокорность, память, события, восстание, соперничество, плен, интриги, завоевание. Сравним их. Результаты анализа и общая оценка тональности представлены в табл. 4.

Результаты сентимент-анализа и тональных словарей в количественном и частотном отношении позволяют определить оценочные коннотации в отношении исторических лиц, географических объектов или описанных событий в учебнике, что дает возможность выявить общую тональность текста. Так, например, данные табл. 4 дают представление об общей положительной оценке образа Мазепы в украинском учебнике, что подтверждается общей оценкой тональности 0,0637. Учебник истории на русском языке демонстрирует иную общую оценку тональности –0,2225 (минусовое значение), что подтверждает резкую отрицательность коннотации образа.

Таблица 4
Оценка уровня тональности персоналий (фрагмент)

Украинский учебник истории

Российский учебник истории

Слово

Оценка тональности

Слово

Оценка тональности

Противостояние

–0,47

Судьба

0,01

Личность

0,51

Противостояние

–0,47

Поддержка

1

Конфликт

–1

Влияние

0

Непокорность

–0,34

Освобождение

0,9

Память

0,58

Легенда

0,55

Восстание

–0,58

Наследие

0,66

Соперничество

–0,39

Патриотизм

0,9

Завоевание

–0,38

Общая оценка тональности 0,0637. Оценка положительная

Общая оценка тональности –0,2225. Оценка весьма отрицательная.

Источник: составлено М.И. Шаповаловым.

Table 4
Evaluation of personality tonality level (fragment)

Ukrainian history textbook

Russian history textbook

Word

Tonality evaluation

Word

Tonality evaluation

Confrontation

–0.47

Destiny

0.01

Personality

0.51

Confrontation

–0.47

Support

1

Conflict

–1

Influence

0

Disobedience

–0.34

Liberation

0.9

Memory

0.58

Legend

0.55

Rebellion

–0.58

Heritage

0.66

Сompetition

–0.39

Patriotism

0.9

Conquest

–0.38

General tonality evaluation 0.0637.

Positive evaluation

General tonality evaluation –0.2225. Negative evaluation

Source: compiled by M.I. Shapovalov.

Заключение

Результаты исследования имеют высокую значимость для обучения русскому языку и на русском языке в школах новых субъектов Российской Федерации и могут быть использованы для проведения ряда дальнейших научных изысканий, в т.ч. проектной и исследовательской деятельности школьников. Сформирован перечень необходимой лексики для обучения предметам на русском языке, которую следует в приоритетном порядке использовать в учебных текстах для школьников новых территорий. Сложившаяся ранее в новых субъектах РФ языковая и социокультурная ситуация привела к проявлению различных расхождений, что осложняет адаптацию школьников к российской образовательной системе. Исследование позволило всесторонне изучить причины расхождений и даже проявления лакун в условиях близкородственного двуязычия русского и украинского языков.

Значимость нашего исследования видится в следующих направлениях:

во-первых, разработанная методика компьютерного анализа текстов украинских и российских учебников истории и географии позволила подготовить уникальную базу для составления технологического инструментария предметной интеграции (русского языка, истории, географии) для учителей территорий новых субъектов РФ, работающих в условиях близкородственного двуязычия;

во-вторых, примененные инструменты квантитативной и корпусной лингвистики, как и использование компьютерных методов, позволяют прогнозировать на основе осуществленного анализа возможные трудности обучения предметам на русском языке на территории новых субъектов РФ;

в-третьих, полученные данные использованы для создания предметно-языковых интегративных методик по преподаванию русского языка, истории, географии, подготовленные к дальнейшему тиражированию на территориях новых субъектов РФ. Именно в последующем наполнении методических моделей и предполагается перспектива нашего исследования.

 

 

1 Сорочинська Н.М., Мартинюк О.О., Гісем О.О. Всесвітня історія : підручник для 9 кл. загальноосвіт. навч. закл. Тернопіль : Навчальна книга. Богдан, 2017. 272 с.; Юдовская А.Я., Баранов П.А., Ванюшкина Л.М. История. Всеобщая история. История Нового времени: 9-й класс : учебник. М. : Просвещение, 2023. 271 с.; Надтока О.Ф., Топузов О.М. Географія : підруч. для 9 кл. загальноосвіт. навч. закл. К. : УОВЦ «Оріон», 2017. 208 с.; Алексеев А.И. География. 9 класс : учеб. для общеобразоват. организаций. 7-е изд., перераб. М. : Просвещение, 2019. 239 с.

2 Инструменты для SEO-специалистов. URL: https://arsenkin.ru/tools/lemma/  (дата обращения: 03.11.2024).

3  Семантический анализ текста онлайн, SEO-анализ текста. URL: https://advego.ru/text/seo/ (дата обращения: 03.11.2024).

4  Национальный корпус русского языка. URL: https://ruscorpora.ru/ (дата обращения: 03.11.2024).

5 История. Учебный словарь. URL: http://history.pstu.ru/wp-content/uploads/2019/04/Grigorevyih.-Slovar-po-istorii-korr.pdf  (дата обращения: 03.11.2024).

6  Словарь исторических терминов. URL: https://slovar-istoricheskih-terminov.slovaronline.com/ (дата обращения: 03.11.2024).

7 Исторический словарь. URL: https://gufo.me/dict/history_dict  (дата обращения: 03.11.2024).

8  Историко-культурный стандарт. URL: https://iro86.ru/images/documents/Obr._Deyat/umk_istor/Istoriko_kultur_standart.pdf  (дата обращения: 03.11.2024).

9 Интернет-сервис ChatPDF. URL: https://www.chatpdf.com/ru (дата обращения: 03.11.2024).

10 Юдовская А.Я, Баранов П.А, Ванюшкина Л.М. История. Всеобщая история. История Нового времени: 9-й класс : учебник. М. : Просвещение, 2023. 271 с.; Алексеев А.И. География. 9 класс : учеб. для общеобразоват. организаций. 7-е изд., перераб. М. : Просвещение, 2019. 239 с.

[11] Тональный словарь русского языка КартаСловСент. Объем датасета составляет 28197 слов. Датасет распространяется по лицензии CC BY-NC-SA 4.0. URL: https://github.com/dkulagin/kartaslov/diffs/0?commit=261eb5a10f558da87c5d8c0bfc51c3cd79719799&name=master&qualified_name=refs%2Fheads%2Fmaster&sha1=fe5981b8ae241331095e115294953c6dc8aa2627&sha2=261eb5a10f558da87c5d8c0bfc51c3cd79719799&short_path=162c582&unchanged=expanded&w=false (дата обращения: 18.03.2025).

×

Об авторах

Елизавета Александровна Хамраева

Московский педагогический государственный университет

Автор, ответственный за переписку.
Email: ea.khamraeva@mpgu.su
ORCID iD: 0000-0002-8551-5462
SPIN-код: 7025-3780
Scopus Author ID: 57215194561

доктор педагогических наук, старший научный сотрудник, заведующая кафедрой лингводидактики русского языка как иностранного и билингвизма

Российская Федерация, 119991, Москва, ул. Малая Пироговская, д. 1, стр. 1

Михаил Иванович Шаповалов

Московский педагогический государственный университет

Email: mi.shapovalov@mpgu.su
ORCID iD: 0000-0002-6425-3862
SPIN-код: 2588-7140

кандидат технических наук, доктор инженерных наук (ФРГ), доцент кафедры общего языкознания им. И.Г. Добродомова

Российская Федерация, 119991, Москва, ул. Малая Пироговская, д. 1, стр. 1

Лилия Викторовна Ковтун

Московский педагогический государственный университет

Email: lv.kovtun@mpgu.su
ORCID iD: 0009-0008-3207-1969
SPIN-код: 3186-1995
Scopus Author ID: 57314706600

кандидат культурологии, доцент, доцент кафедры лингводидактики РКИ и билингвизма

Российская Федерация, 119991, Москва, ул. Малая Пироговская, д. 1, стр. 1

Список литературы

  1. Алимов В.В. Специальный перевод и лингвистическая интерференция. М. : МОСУ, 2003. 134 с. EDN: QQRWUN
  2. Арынбаева Р.А., Маханова Ж.К., Дмитрюк Н.В. Формирование лингвокультурологической компетенции казахстанских учащихся в обучении русскому языку как неродному // Русистика. 2023. Т. 21. № 3. С. 341–355. http://doi.org/10.22363/2618-8163-2023-21-3-341-355 EDN: SKSMWB
  3. Вежбицка А. Метатекст в тексте // Новое в зарубежной лингвистике. Вып. VIII. Лингвистика текста. М. : Прогресс, 1978. С. 402–421.
  4. Верещагин Е.М. Психологическая и методическая характеристика двуязычия (билингвизма). М. : Изд-во МГУ, 1969. 160 с. EDN: GOGOWN
  5. Виноградов В.А. Диглоссия // Лингвистический энциклопедический словарь. М. : Советская энциклопедия, 1990.
  6. Вишневская Г.М. Интерференция и акцент (на материале интонационных ошибок при изучении неродного языка) : дис. … д-ра филол. наук. СПб., 1993. 373 с. EDN: VQOLVV
  7. Гаврилина М.А. Орфографическая грамотность русскоязычных школьников Латвии // Русистика. 2022. Т. 20. № 1. С. 101–114. http://doi.org/10.22363/2618-8163-2022-20-1-101-114 EDN: GUYSHI
  8. Джусупов М. Речевая интерференция как результат двуединого отрицательного воздействия // Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика. 2021. Т. 12. № 1. С. 23–40. http://doi.org/10.22363/2313-2299-2021-12-1-23-40 EDN: AQSPZE
  9. Коновалова Е.А. Проблема интерференции близкородственных языков (на примере полилингвокультурной ситуации АРК) // Ученые записки Таврического национального университета им. В.И. Вернадского Серия «Филология. Социальные коммуникации». 2012. Т. 25 (64). № 2. Ч. 1. С. 14–18. EDN: RWHQBL
  10. Краснова Т.А. Просодическая интерференция при взаимодействии лексико-грамматических и интонационных средств : автореф. дис. ... канд. филол. наук. Л., 1985. EDN: CWZRUI
  11. Кулагин Д.И. Открытый тональный словарь русского языка КартаСловСент // Computational Linguistics and Intellectual Technologies. 2021. № 20. С. 1106–1119. https://doi.org/10.28995/2075-7182-2021-20-1106-1119 EDN: XGDDBD
  12. Ларина Т.В. Лингвокультурная коммуникативная интерференция // HUMANIORA: LINGUA RUSSICA. Труды по русской и славянской филологии. Лингвистика IX. Взаимодействие языков и языковых единиц. Тарту : Тартуский университет, 2006. С. 184–196.
  13. Маркова Е.М., Квапил Р. Особенности обучения русскому языку в близкородственной словацкой среде // Русистика. 2021. Т. 19. № 2. С. 191–206. http://doi.org/10.22363/2618-8163-2021-19-2-191-206 EDN: DWXBTM
  14. Пазельская А.Г., Соловьев А.Н. Метод определения эмоций в текстах на русском языке // Диалог 2011. М. : Наука. С. 576–586.
  15. Плунгян В.А. Параллельный корпус как грамматическая база данных и Новый Завет как параллельный корпус (предисловие) // Acta Linguistica Petropolitana. Труды ин-ститута лингвистических исследований. 2023. Т. 19. № 3. С. 15–38. http://doi.org/10.30842/alp230657371931538 EDN: IVRTMB
  16. Потапов В.В. Лингвокогнитивный подход к созданию автоматизированной системы перевода на основе специализированных параллельных терминологических баз данных // Социальные и гуманитарные науки. Отечественная и зарубежная литера-тура. Сер. 6, Языкознание : реферативный журнал. 2022. № 2. С. 32–40. http://doi.org/10.31249/ling/2022.02.01 EDN: FYEEGF
  17. Реформатский А.А. Введение в языковедение. М. : Аспект. Пресс, 2001. 536 с.
  18. Свердлова Н.А. Герменевтичекие аспекты билингвизма: роль межъязыковой интерференции // Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика. 2019. Т. 10. № 3. С. 602–609. http://doi.org/10.22363/2313-2299-2019-10-3-602-609 EDN: JALCBS
  19. Семчинский C.B. Семантическая интерференция языков (на материале славяно-восточнороманских контактов) : автореф. дис. ... д-ра. филол. наук М. : 1973. 34 с.
  20. Тимачев П.В. Лингвокультурная интерференция как коммуникативная помеха (на материале английского языка) : дис. … канд. филол. наук. Волгоград : 2005. 179 с. EDN: NNGIBN
  21. Ткачева Е.К. Лексическая интерференция, или На что обратить внимание при подготовке испаноговорящих студентов к субтесту «Письмо» // Русский тест: теория и практика. 2024. Т. 10. № 1. С. 55–62. https://doi.org/10.22363/3034-2090-2024-10-1-55-62
  22. Федорова Н.П. Преодоление лингвокультурной интерференции в процессе обучения иностранному языку студентов неязыковых вузов (на материале английского языка) : автореф. дис. ... канд. пед. наук. Н. Новгород, 2010. 21 с. EDN: ZOBSZV
  23. Цейтлин С.Н., Круглякова Т.А. Падежная система в процессе освоения русского языка как первого и второго // Русистика. 2024. Т. 22. № 1. С. 135–149. http://doi.org/10.22363/2618-8163-2024-22-1-135-149 EDN: QTISXN
  24. Шаклеин В.М. Лингвокультурная ситуация в современной России. М. : Флинта ; Наука, 2010. EDN: QWFAGP
  25. Щерба Л.B. К вопросу о двуязычии // Языковая система и речевая деятельность. Л. : Наука, 1974. 428 с.
  26. Hackett-Jones A.V. Language and culture interference in plurilingual education // Russian Linguistic Bulletin. 2016. № 3 (7). P. 141–143. https://doi.org/10.18454/RULB.7.08 EDN: XRZCNT
  27. Isurin L. Does language transfer explain it all? The case of first language change in Russian- English bilinguals // Russian Journal of Linguistics. 2021. Т. 25. № 4. С. 908–930. https://doi.org/10.22363/2687-0088-2021-25-4-908-930 EDN: YIUUJP
  28. Odlin T. Language transfer: cross-linguistic influence in language learning. UK : Cambridge, 1989. https://doi.org/10.1017/CBO9781139524537
  29. Tomalin B., Stempleski S. Cultural awareness. New York, NY : OUP, 1993.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Хамраева Е.А., Шаповалов М.И., Ковтун Л.В., 2025

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial 4.0 International License.