Том 22, № 4 (2024): ЛИНГВИСТИЧЕСКОЕ ПРОФИЛИРОВАНИЕ ТЕКСТОВ НА РУССКОМ ЯЗЫКЕ: ОТ ФОРМ К СМЫСЛАМ

От редакции

Подходы и инструменты лингвистического профилирования текста на русском языке

Солнышкина М.И., Соловьев В.Д., Эбзеева Ю.Н.

Аннотация

Развитие подходов и усовершенствование инструментов оценки лингвистической и когнитивной сложности учебного текста востребовано как в науке, так и практике обучения. Особую значимость прогнозирование трудностей восприятия и понимания, а также ранжирование текстов по классам, т.е. количеству лет формального обучения, или уровням владения языком (А1-С2) имеет в системе образования. Цель исследования - продемонстрировать, каким образом современные методологии, алгоритмы и инструменты аналитики текстов на русском языке реализованы в автоматическом анализаторе RuLingva, а также представить статьи тематического выпуска, посвященного комплексному анализу учебников по русскому языку для российских и белорусских школ. Показано, что современная парадигма дискурсивной комплексологии опирается на разработанные в российском языкознании методы стилостатистики, позволяющие выявлять функциональные характеристики языковых единиц и осуществлять их верификацию на материале больших языковых данных. Функционирующие на портале RuLingva сервисы предназначены для преподавателей и исследователей и позволяют в автоматическом режиме не только осуществлять аналитику учебного текста, но и прогнозировать его целевую аудиторию на основании данных о читабельности, лексическом разнообразии, абстрактности, частотности, терминологической плотности. В режиме «Русский как иностранный» RuLingva выгружает из текста списки слов, соответствующие каждому из уровней владения языком, и оценивает долю каждого из них, предоставляя таким образом материал для пред- и посттекстовой работы преподавателя. Алгоритм функционирования RuLingva разработан на основе типологии учебных текстов и имеет в качестве перспективы создание функционала оценки вербального интеллекта и читательской грамотности обучающегося. Перспектива развития RuLingva связана с расширением спектра предикторов сложности и внедрением функции автоматического определения предметной области учебного текста. Оба направления планируется реализовать при помощи нейронных сетей и созданных на их основе классификационных моделей, а также на базе «типологических паспортов» учебных текстов различной сложности и тематической направленности.

Русистика. 2024;22(4):501-517
pages 501-517 views 114

Актуальные проблемы исследований русского языка

Предикативная сила лексических параметров: оценка сложности текста в учебниках по русскому языку для 5-7 классов

Андреева М.И., Замалетдинов Р.Р., Борисова А.С.

Аннотация

Рассмотрена оценка влияния лексических параметров на сложность текста и реализована на материале специализированного лингвистического корпуса, в состав которого вошли тексты 15 действующих учебников по русскому языку для 5-7 классов общим объемом 811911 слов. Исследование нацелено на определение объема и динамики изменения лексического состава учебников для 5-7 классов современных линеек учебников по русскому языку. Алгоритм исследования: (а) выявление объема и состава лексики в текстах учебников; (б) оценка доли лингвистических терминов в их составе; (в) идентификация предикторов сложности, т.е. параметров, демонстрирующих статистически значимую корреляцию с читабельностью. Осуществлению аналитической части исследования предшествовали метаописание корпуса, его токенизация, лемматизация, сегментирование на отрывки приблизительно по 1000 слов. Расчеты параметров текста производились при помощи текстового профайлера RuLingva, оценка силы корреляционных зависимостей выполнялась при помощи программы STATISTIKA. Для достоверности результатов исследования анализ влияния лексиче ских параметров на читабельность текста проведен на двух уровнях: учебники (рассчитывались средние показатели по 15 учебникам 5-7 классов), 1000-словные сегменты текста. Выявлен несколько сниженный (в среднем на 1.0-1.5. уровней) от ожидаемого индекс читабельности изученных текстов, который может служить характеристикой текста учебника по русскому языку как жанра и свидетельствует об эклектичности учебного текста, включающего фрагменты научного стиля (правила), художественного (упражнения) и делового (инструкции и задания к упражнениям). Установлено, что доля терминов не превышает 2 % в словарном составе учебников, но их доля в тексте поднимается до 13 %. Доказано, что предиктивной силой роста сложности текста обладают индексы «лексической плотности», связности (локальный и глобальный повторы существительного и аргумента), «дескриптивность» (отношение прилагательных к существительным), «нарративность» (отношение глаголов к существительным), а также доля имен существительных в родительном падеже. Перспектива исследования видится в изучении роли глаголов и местоимений в текстах учебников по русскому языку как предикторов сложности.

Русистика. 2024;22(4):518-539
pages 518-539 views 101

Учебник русского языка как проводник перемен: от СССР до нового века

Булина Е.Н., Солнышкина М.И., Эбзеева Ю.Н.

Аннотация

Актуальность изучения лингвистических параметров текста учебника русского языка как отдельного жанра определяется, с одной стороны, отсутствием в русистике четких лингвистических критериев эталонного учебника, а с другой стороны, усилившейся в связи с пересмотром ФГОС критикой языка учебника. Цель исследования - выявить сходства и различия двух коллекций учебников по русскому языку для 5 класса: опубликованных в 1935-1974 гг. и 2012-2015 гг. Последовательное описание, анализ их структуры, состава и языка с применением методов корпусной лингвистики, текстовой аналитики и автоматического профилирования при помощи анализатора RuLingva подтвердило гипотезу о том, что, репрезентируя единый жанр, учебники по русскому языку двух исторических эпох имеют ряд лингвистических различий. Доказано, что общий для всех учебников состав, включающий тексты по теории лингвистики, тексты инструкций и заданий, а также художественные и познавательные тексты упражнений, значительно различается по объему и коммуникативным стратегиям. Структурная изоморфность учебников, эксплицируемая в последовательном размещении теории и упражнений, отсутствует только в учебнике Шапиро 1935 г., в котором правила размещены в специальной главе отдельно от упражнений. Наибольшие различия выявлены в директивах заданий: их общий объем в современных учебниках вырос в 2,5 раза, а содержащиеся в них мотивационные вопросы реализуют тенденцию к диалогичности. Директивы учебников прошлого имеют традиционную форму побуждения, объективируемую прямым глагольным императивом. Современные учебники используют больше иллюстративных источников за счет включения научных текстов гуманитарной и естественно-научной предметных областей, а также художественной литературы рубежа веков. Типографика учебников XXI в. значительно более многообразна и способствует лучшему восприятию текста. В выявлении содержательных предпочтений авторов учебных текстов двух изучаемых эпох видится перспектива исследования, осуществление которой предполагает системную параметризацию лексики изучаемых учебников, а также их лексико-синтаксический и дискурсивный анализ.

Русистика. 2024;22(4):540-554
pages 540-554 views 96

Лингвистическое профилирование учебных и художественных текстов

Воронин К.В., Исмаева Ф.Х., Данилов А.В.

Аннотация

Исследование проведено в рамках текстовой аналитики как одного из стратегических направлений современной российской лингвистики и посвящено лингвистическому профилированию учебных и художественных текстов. Определение жанровой специфики текстов востребовано для разработки автоматических программных комплексов и обработки больших языковых данных. Цель исследования состоит в выявлении диапазонов значений лингвистических параметров, позволяющих дифференцировать учебные (вторичные) и художественные (первичные) тексты. Исследование выполнено на материале 72 текстов биографий из учебников по русскому языку как иностранному и 90 отрывков из приключенческих рассказов. Выбор для изучения оппозиции жанров обусловлен (1) высокой степенью нарративности и динамичности обоих; (2) функциональными различиями: нацеленностью биографии на информативность и приключений - на развлечения. Общий объем исследовательского корпуса составил 120932 словоформ. В исследовании использованы два инструмента обработки данных: (1) с помощью платформы RuLingva рассчитывали значения лингвистических параметров; (2) программу STATISTIKA использовали для выявления статистически значимых различий изучаемых текстов. Определено, что список параметров, дифференцирующих тексты биографий и приключений, включает глобальные и локальные повторы существительных и аргумента, дистрибуцию имен существительных в предложном и родительном падежах, дистрибуцию глаголов прошедшего и настоящего времени. Выявлено, что повторы существительных и аргумента способствуют высокой связности текстов биографий, что реализуется в номинации каждого следующего события жизни человека в связи с предыдущим. Родительный падеж превалирует в биографиях по причине использования номинативных словосочетаний существительных. Перспектива исследования видится в типологии жанров, основанной на лингвистическом профилировании официальных и личных биографий, с одной стороны, и приключенческих романов, с другой. Отдельный аспект дальнейших исследований в изучаемой области составляет инсталляция матриц значений в текстовый профайлер RuLingva с целью автоматизации лингвистического профилирования текстов.

Русистика. 2024;22(4):555-578
pages 555-578 views 99

Теория русской орфографии в учебной литературе для студентов Республики Беларусь

Иванов Е.Е., Куликович В.И.

Аннотация

Жесткие рамки интерпретации любого «кодекса правил» существенно ограничивают теоретические аспекты их изучения, однако требуют специального объяснения применительно к орфографии как разделу языкознания, особенно в тех случаях, когда существует несколько национальных вариантов литературного языка. Актуальность исследования обусловили: насущная потребность теоретического описания корпуса основополагающих понятий орфографии, используемых в преподавании русского языка в Беларуси и значимых для создания стратегического плана внедрения новаций в орфографической системе; необходимость фиксации изменений в дефинициях, детерминированных переходом к конвергентному обучению; влияние комплекса лингвистических и экстралингвистических факторов; разработка опциональных аргументов для кодификации белорусского национального варианта русского языка. Цель исследования - определить параметры и специфику теории орфографии в учебной литературе по русскому языку в Республике Беларусь. Материалом для исследования послужили дефиниции и языковые иллюстрации основных понятий теории орфографии (орфография, орфографическое правило, орфограмма, орфографический принцип, орфографическая ошибка, орфографическая норма и др.) в учебниках и учебных пособиях по русскому языку для учреждений высшего образования Республики Беларусь, изданных с 2000 по 2024 гг. Применялись методы параметризации и сравнения, логико-лингвистический и лексико-семантический анализ. Установлено, что как в специализированных учебных изданиях, посвященных только орфографии, так и в комплексных изданиях, где орфография является частью учебного материала, преимущественно отсутствует теоретический и метаязыковой аппарат либо значительной части, либо всей необходимой базы теории орфографии. В различных учебных изданиях сосуществуют разные подходы в позиционировании орфографической терминологии. Это преимущественно ориентация на устаревшие традиции, отсутствие современных понятий («орфографическая деятельность», «орфографическая картина языка» и др.). Теория орфографии в учебной литературе по русскому языку для высших учебных заведений Республики Беларусь базируется, как правило, на действующих правилах русской орфографии, однако характеризуется, с одной стороны, инновационной спецификой, а с другой - консерватизмом их позиционирования в письменной практике, что свидетельствует о наличии разности подходов в формировании орфографической языковой личности, орфографического языкового и метаязыкового сознания белорусов, изучающих русский язык. Определены основные принципы разработки современной теории орфографии, учитывающей орфографические инновации и национально-культурную специфику в преподавании русского языка в высших учебных заведениях Республики Беларусь.

Русистика. 2024;22(4):598-614
pages 598-614 views 104

Лексическое обогащение в учебниках филологического блока: корпусный и статистический подходы

Галимова Х.Н., Мартынова Е.В., Москвичева С.А.

Аннотация

Актуальность представленного исследования определяется значимостью объективных данных о частоте употребления лексических единиц в учебниках русского языка, а также неизученностью процессов освоения лексики в процессе обучения родному языку в школе. Описан опыт создания частотного словаря учебников филологического блока с опорой на лингвистический корпус учебников русского языка и литературы для 5-7 классов. Учебники филологического предметного блока содержат в себе усредненную модель русского языка и литературы, отражая актуальные для школьника темы и постепенно наращивая объем лексического состава от простого к более сложному. Цель исследования - оценка лексического обогащения в учебных текстах филологического предметного блока для 5-7 классов, а также усовершенствование методики формирования частотных списков. Исследование проведено на материале корпуса, в который вошли 66 учебников по русскому языку и литературе общим объемом 1 553 224 словоформ. Использование методов корпусной и компьютерной лингвистики, а также сравнительно-сопоставительного и статистического методов, в частности программы IKSWEB, среды Google Colab, библиотек Pandas, NLTK и Pymorphy позволило выявить, что объем частотного словаря учебников филологического блока 5 класса составляют 8984 лексемы, 6 класса - 7572 лексемы, 7 класса - 7321 лексемы. «Обогащение» лексики» в 6 классе составляют 258 лексем, в 7 классе - 150 лексем. Лексическим ядром трех частотных списков являются слова следующих тематических групп: «Филологические термины», «Глаголы, обозначающие учебные операции», «Природа», «Родственные и дружеские отношения», «Искусство» и «Время». Выявлено, что обогащение словарного запаса у учащихся 6 класса осуществляется за счет архаизмов и историзмов; терминов, характеризующих формы общенационального языка, и терминов словообразования. В 7 классе обогащение частотного словаря осуществляется за счет лингвистических терминов по теме «Наименование глагольных форм», лексико-тематической группы «Религия» и общественно-политической лексики. Частотные списки подтвердили гипотезу о тематической сбалансированности текстов в современных учебниках русского языка и литературы среднего звена и ядерном положении терминологии в текстах рассматриваемых учебников. Перспектива исследования видится в осуществлении аналогичного исследования на материале учебных текстов филологического и других предметных блоков старшей школы для выявления внутри- и метапредметных связей.

Русистика. 2024;22(4):579-597
pages 579-597 views 86

Текст учебника по русскому языку: диахронический лингвостатический анализ

Куприянов Р.В., Шоева Г.Н., Александрова О.И.

Аннотация

Актуальность исследования обусловлена необходимостью более полного понимания учебного текста как жанрового комплекса, выполняющего полифункциональную роль в образовательном процессе. В условиях пересмотра образовательных стандартов и повышенного внимания к качеству учебников анализ диахронических изменений в структуре и содержании учебников русского языка становится актуальным для определения основных факторов, влияющих на образовательный процесс. Целью данного исследования является изучение лингвистической специфики формантов текстов учебников русского языка и анализ тенденций их изменения со временем. Материалы исследования включают учебники русского языка, опубликованные в Советском Союзе (1935-1974) и в современной России (2012-2015). Методы исследования основаны на сравнительном анализе лингвистических параметров формантов: упражнения - задания - теория, с применением статистических тестов для выявления различий между этими категориями. Результаты исследования показали наличие статистически значимых различий по большинству лингвистических параметров, что подтверждает тезис о неоднородности учебных текстов. Наиболее выраженные различия между категориями формант наблюдались по следующим параметрам: индекс Флеша - Кинкейда ( p < 0,01), глобальное совпадение существительных ( p < 0,01), соотношение типов и слов ( p < 0,01), синглетоны ( p < 0,01), глаголы прошедшего времени ( p < 0,01), средняя длина предложения ( p < 0,01), средняя длина слова ( p < 0,01), глобальное совпадение аргументов ( p < 0,01) и количество существительных в родительном падеже ( p < 0,01). Современные учебники русского языка характеризуются меньшей лексической плотностью ( p < 0,05) и меньшим количеством существительных на 1000 лексем ( p < 0,05), большей локальной повторяемостью существительных ( p < 0,05), более частым использованием глаголов будущего времени ( p < 0,01) и большей глобальной связностью текста ( p < 0,05). Эти закономерности отражают диахронические изменения в тексте учебников русского языка. Перспектива исследования видится в расширении круга анализируемых учебников русского языка, в частности, за счет включения текстов как для старшей, так и для начальной школы, а также в более детальном изучении динамики изменения лингвистических параметров учебников русского языка в советский период.

Русистика. 2024;22(4):615-632
pages 615-632 views 99

Методы мониторинга англицизмов в русскоязычном молодежном дискурсе

Привалова И.В., Петрова А.А., Гишкаева Л.Н.

Аннотация

Отсутствие долгосрочного комплексного мониторинга англоязычных заимствований в молодежном дискурсе и социолекте определяет актуальность этого исследования. Цель исследования - описание авторских методик, позволяющих проводить анализ качественного и количественного состава англицизмов в социолекте российской молодежи и уточнение способов их лексикографического закрепления в русском литературном языке. Гипотеза исследования состоит в том, что англицизмы доминируют среди других языковых единиц молодежного социолекта, таких как новояз и индивидуальное словотворчество, однако, это не всегда приводит к их фиксации на уровне русского литературного языка. Данное исследование представляет собой единый пилотный макропроект, состоящий из двух микропроектов. Площадками проведения первого микропроекта стали Волгоградский государственный университет (2017-2019) и Саратовский государственный университет (2020-2022). В опросах приняли участие 135 испытуемых в возрасте от 16 до 25 лет. Второй микропроект проводился на базе Казанского государственного университета с 2022 по 2024 г. В нем приняли участие 210 респондентов в возрасте от 15 до 25 лет. Материалом исследования стали данные онлайн и офлайн 345 опросов, а также результаты анализа лексикографических источников и корпусов. Сформирована единая методологическая база комплексного исследования, в которую вошли классификационные и сравнительные методы. Применялись социолингвистические методы интервьюирования информантов и психолингвистические методы, связанные с интроспекцией явлений молодежного дискурса. Для обработки результатов использовали статистические и количественные методы, а также метод корреляционного анализа. Установлены основные источники англоязычных заимствований в молодежном дискурсе, а также соотношение англицизмов и молодежных сленгизмов. Выявлено влияние социальных характеристик на распределение языковых вариантов. Обнаружено, что показатели англицизмов, полученные в результате опросов, и показатели этих же единиц в Национальном корпусе русского языка имеют расхождения при их сопоставлении. В перспективе разработанная комплексная модель мониторинга может быть использована для мероприятий по сохранности системы русского языка.

Русистика. 2024;22(4):633-661
pages 633-661 views

Методика преподавания русского языка как родного, неродного, иностранного

Обучение арабских школьников русским этикетным формулам: лингвокультурологический аспект

Левушкина О.Н., Чернышева Е.Г., Янченко В.Д.

Аннотация

Процесс обучения русскому языку как иностранному (РКИ) преследует важнейшую цель - формирование коммуникативной компетенции обучающихся. Овладение речевым этикетом, формулы которого называют культуроемкими единицами языка, - одна из составляющих коммуникативной компетенции. Следовательно, необходим лингвокультурологический аспект реализации процесса обучения речевому этикету. Важно обучать осмыслению того, каким образом взаимодействуют лингвокультуры изучаемого языка и родного языка обучающегося. Цель исследования - разработка и обоснование комплекса упражнений для обучения речевому этикету арабоговорящих школьников в лингвокультурологическом аспекте на начальном этапе постижения РКИ. Основные методы исследования: теоретический анализ при постановке научной проблемы, а также методическое проектирование и научно-методическое обобщение. В исследовании участвовали ливанские школьники от 15 лет и старше, изучающие русский язык на начальном этапе в Центре открытого образования Министерства Просвещения Российской Федерации в Ливанской Республике (г. Анаб) в 2024 г. Выявлены особенности реализации лингвокультурологического аспекта при обучении речевому этикету на начальном этапе знакомства с РКИ арабоговорящих школьников (использование элементов культурологического и этимологического комментариев, сопоставление языковых и внеязыковых реалий родного и изучаемого русского языка, соотнесение этикетных фраз русского и родного языка). Научная новизна: для обучения арабоговорящих школьников этикетным формулам на начальном этапе изучения РКИ предложена система упражнений, построенная в соответствии с этикетными фазами диалога (приветствие, благодарность, обращение и прощание) и с учетом лингвокультурных особенностей употребления данных формул в русском и арабском языках. Актуализируется представление о реализации лингвокультурологического аспекта при работе с этикетными формулами на первых этапах изучения языка как важном мотивирующим факторе, позволяющем вызвать интерес к изучаемому языку.

Русистика. 2024;22(4):662-680
pages 662-680 views

Педагогическая технология в методике преподавания русского языка как иностранного: трансформация понятия и авторская классификация

Лешутина И.А., Давыдова М.А., Стрельчук Е.Н.

Аннотация

Педагогическая технология - одно из активно употребляемых понятий научно-педагогического дискурса, получившее несколько десятков определений, трактовок и интерпретаций. Цель исследования - оценить валидность использования педагогических технологий на занятиях по русскому языку как иностранному (РКИ) и предложить авторскую классификацию на основе унифицированного коммуникативно значимого принципа с учетом уже известных в методической науке разнообразных подходов к их трактовке и систематизации. Материалами исследования стали более 40 определений феномена «педагогическая технология» и около 10 их классификаций. Использованы методы анализа, синтеза, обобщения, сопоставления, сравнения. В результате предложена систематизация имеющихся в российской и зарубежной методической науке подходов к трактовке педагогических технологий, а также авторская классификация педагогических технологий с позиции коммуникативного принципа. В основe классификации лежат понятия: речевой поступок / речевое действие, речевое событие и речевой жанр. Приведены примеры конкретных педагогических технологий, распределенных на три группы в зависимости от затраченных учащимися коммуникативных усилий, показаны возможности сочетания различных технологий и их синергия в процессе обучения РКИ. Перспективы исследования заключаются в создании учебного пособия, содержащего теоретические основы интеграции педагогических технологий в учебный процесс в соответствии с уровнем языковой подготовки инофонов и профессиональной направленностью.

Русистика. 2024;22(4):681-697
pages 681-697 views