Формирование нарративной стратегии в рассказах билингвов на русском языке: корпусное исследование
- Авторы: Шишков М.С.1,2
-
Учреждения:
- Шанхайский университет иностранных языков
- Санкт-Петербургский государственный университет
- Выпуск: Том 21, № 3 (2023): Лингвистические и лингводидактические проблемы билингвизма
- Страницы: 321-340
- Раздел: Актуальные проблемы исследований русского языка
- URL: https://journals.rudn.ru/russian-language-studies/article/view/36382
- DOI: https://doi.org/10.22363/2618-8163-2023-21-3-321-340
- EDN: https://elibrary.ru/SGSQVB
Цитировать
Полный текст
Аннотация
Исследование посвящено определению лексических характеристик устного рассказа двух поколений русско-немецких билингвов и описанию роли лексических средств в реализации нарративной стратегии. Обращение к устному нарративу включает данную работу в круг современных трудов, рассматривающих особенности текстопорождения билингвами. Актуальность обусловлена как материалом, так и выбранными методами анализа. Цель - выявить на лексическом уровне степень сформированности нарративной стратегии у представителей двух поколений русско-немецких билингвов в сопоставлении с монолингвальными носителями русского языка. Материалом послужил корпус устных рассказов (47 текстов) немецко-русских билингвов, собранный экспериментальным путем с использованием в качестве стимульного материала книги М. Майера «Лягушка, где ты?» В исследовании участвовали 22 семьи: дети - 26 человек в возрасте от 8 до 19 лет, родители - 21 человек в возрасте от 30 до 55 лет. Для сопоставления характеристик корпуса привлекался аналогичный корпус устных рассказов монолингвов (42 рассказа). Применялись количественно-статистический анализ, корпусный анализ, тематический и семантический анализ лексики, элементы структурного анализа нарратива. Новизной исследования является выявление лексических параметров нарративных стратегий, применяемых двумя поколениями билингвов, путем корпусного анализа. Показано, что, несмотря на статистическую похожесть двух корпусов рассказов, проявляющуюся в том числе в разнообразии употребляемой лексики, степень развития лексических навыков реализации нарративных стратегий у билингвов ниже, чем у монолингвов в обеих возрастных группах. Это касается прежде всего полноты и унифицированности лексического выражения обязательных компонентов нарратива, стимулированного предъявляемым материалом, и отношений между ними в тексте. В то же время общая тенденция создания нарратива соответствует ожиданиям. Выявленные параметры в дальнейшем могут быть методически интерпретированы в целях подготовки учебных материалов для билингвов.
Полный текст
Введение
Изучение речи билингвальных носителей русского языка в настоящее время является одним из актуальных направлений исследований в общем контексте проблемы овладения вторым языком. Среди многочисленных работ, посвященных вопросам усвоения билингвами фонетической системы, лексики и грамматики, выделяется исследование устного нарратива: как спонтанного, так и созданного на основе стимульного материала.
Большое внимание в настоящее время уделяется проблемам развития речи билингва в детском (чаще – дошкольном или раннем школьном) возрасте: в рассказах по картинкам или созданных на основе мультфильмов изучаются особенности грамматики речи (Pavlenko, 2009; Протасова и др., 2011; Aktan-Erciyes, 2020), называния персонажей и описания действий (Бойкова, 2020), языковые тактики, используемые при недостатке лексического или грамматического запаса (Anstatt, 2010; Иваненко, Выренкова, 2021), динамика рассказов (Протасова, 2021) и т. д. Несмотря на частое обращение исследователей к устному нарративу как объекту исследования речи билингвов с разными языковыми парами, проблемная область изучена недостаточно полно: необходимо накопить еще больший объем разностороннего описания этого явления для дальнейшего теоретического обобщения.
При анализе нарративов билингвов необходимо учитывать и общие процессы становления нарратива (Юрьева, 2016, 2017), в том числе формирование пространственно-временных характеристик и коммуникативной структуры текста (Эйсмонт, 2017): при сопоставлении с нарративами монолингвов того же возраста появляется возможность увидеть степень сформированности представлений о свойствах нарратива.
Выбор истории в картинках как стимула для создания нарратива определяется эффективностью применения такого подхода, о чем свидетельствует целый ряд психолингвистических исследований. Так, о разных типах стимульного материала, в том числе о рассказах по картинкам, говорит О.В. Федорова (Федорова, 2016). Подробный анализ проблемы выбора стимульного материала представлен в работе П.М. Эйсмонт, где показано, что характер презентации (серия картинок или видеоряд) «с точки зрения усвоения базовых нарративных характеристик дают одинаково надежные результаты» (Эйсмонт, 2022: 328). В последней работе приводятся также схемы анализа нарративной компетенции, а критерии оценки качественного нарратива упоминает и Е.Ю. Протасова (Протасова, 2021). Теоретически осмысляя результаты эксперимента по сопоставлению нарративов пациентов с афазиями и здоровых людей, М.Б. Бергельсон и колл. показывают, какие нарративные стратегии используются в различных ситуациях (спонтанный или вынужденный рассказ) и дают объяснения выбору этих стратегий (Бергельсон и др., 2014).
Таким образом, тексты, полученные на основе картиночного стимульного материала, в целях изучения языковой способности билингвов имеют ряд преимуществ перед текстами спонтанных нарративов: совокупность экспериментальных данных может быть соотнесена с некоторым эталоном – максимальным набором обозначенных на картинках лиц, предметов, вариантов развития сюжетной линии, возможностей интерпретации действий и эмоций и т. д. или аналогичным корпусом текстов монолингвов.
Использованный для проведения эксперимента стимульный материал – книга М. Майера «Лягушка, где ты?» (Mayer, 1969), представляющая в виде картинок связный сюжет поиска героями (мальчик и его собака) сбежавшей из банки лягушки. Эта книга, привлекаемая в научных исследованиях с середины 1980-х годов, не теряет актуальности в качестве стимульного материала и по сей день. В отечественных и зарубежных работах проводится анализ текстов, полученных на основе истории лягушки от различных типов испытуемых: детей-монолингвов (Хоэл, 2016; Севастьянова, 2021), детей-билингвов (Pavlenko, 2009; Anstatt, 2010; Aktan-Erciyes, 2020), детей со специфическими нарушениями речи (Reilly et al., 2004) и мн. др.
Все сказанное подтверждает актуальность обращения к проблеме изучения устного нарратива, созданного билингвальными носителями русского языка на основе предъявленного стимульного материала.
В настоящем исследовании нарратив рассматривается как с позиции лексических статистик, так и с точки зрения представленных в нем лексических сюжетных маркеров. Особенностью нашего подхода является анализ не отдельных текстов, а выявление лексических свойств целых подкорпусов рассказов по картинкам не только детей, но и их родителей, а также интерпретация этих показателей с точки зрения сформированности у двух возрастных групп билингвов нарративной стратегии. Под нарративной стратегией мы понимаем использование совокупности лексических (обозначение действующих лиц и их характеристик, выбор лексики для обозначения действий и др.) и текстовых средств (выражение места, времени, последовательности событий, оценки и др.), позволяющих донести до слушателя или читателя связную историю логичной структуры с достаточным для понимания количеством деталей. Предполагается, что при предъявлении одинакового стимульного материала уровень сформированности нарративной стратегии у каждой возрастной группы будет выражаться в степени развернутости компонентов нарратива и их унифицированности.
В то же время результаты сопоставления с показателями аналогичных текстов монолингвов (лексические особенности корпуса подробно описаны нами ранее (Шишков, 2022)) позволяют увидеть на лексическом уровне наиболее яркие лакуны в умении создавать, структурировать и унифицировать текст нарратива, что в дальнейшем может стать предметом методической интерпретации при подготовке учебных материалов для билингвальных носителей русского языка.
Цель исследования – выявить на лексическом уровне степень сформированности нарративной стратегии у представителей двух поколений русско-немецких билингвов в сопоставлении с монолингвальными носителями русского языка.
Материалы и методы
Исследование выполнено с использованием статистических методов корпусного анализа, тематического и семантического анализа лексики, элементов структурного анализа нарратива.
Материалом исследования послужил корпус устных нарративов (рассказов на основе стимульного материала) русско-немецких билингвов, проживающих в Германии. Рассказы были записаны в 2021 и 2023 гг. в г. Бохуме.
Испытуемым предъявлялась серия картинок из книги М. Майера «Лягушка, где ты?» (Mayer, 1969), которые они должны были последовательно устно описать на русском языке в форме связного рассказа. Для изучения лексических параметров были подготовлены транскрипты речи в орфографической форме с делением на предложения, после чего корпус текстов был загружен в среду разработки на языке Python для предобработки (токенизация, лемматизация) и дальнейшего количественно-статистического анализа.
Полученный корпус составили 47 текстов, записанных от представителей 22 семей и разделенных на два подкорпуса: подкорпус речи детей (26 человек в возрасте от 8 до 19 лет, средний возраст – 13,5 лет; объем подкорпуса – 4376 токенов) и подкорпус речи родителей (21 человек в возрасте от 30 до 55 лет, средний возраст – 44 года; объем подкорпуса – 6479 токенов). Родители после переезда в Германию в среднем живут там около 18 лет, дети либо родились уже в Германии, либо переехали туда в раннем возрасте (2 человека – в 1 год, 1 человек – в 7 лет).
Для сопоставительного анализа и интерпретации данных корпуса речи русско-немецких билингвов в качестве контрольного привлекался корпус рассказов по картинкам, полученных от двух поколений монолингвальных носителей русского языка (экспериментальные данные записаны в Санкт-Петербурге в 2022 г.; объем подкорпусов: речь детей-монолингвов – 4352 токена, речь родителей-монолингвов – 9874 токена). Методика сбора и стимульный материал для корпусов речи билингвов и монолингвов совпадают.
Параметры испытуемых – родителей-монолингвов (19 человек, 34‒50 лет, средний возраст – 40 лет) ‒ соответствуют параметрам испытуемых-билингвов. Возрастные характеристики детей-монолингвов немного ниже, чем характеристики детей-билингвов (23 человека, 7‒13 лет, средний возраст – 10 лет). В связи с этим для верификации данных по ряду статистических параметров необходимо было провести также анализ части подкорпуса речи детей-билингвов, по возрастным критериям соответствующего параметрам подкорпуса детей-монолингвов (до 13 лет).
Анализ лексических показателей корпуса речи монолингвов представлен нами ранее (Шишков, 2022). Упоминаемые далее статистические данные корпуса речи монолингвов и его лексические параметры отсылают к указанной работе.
Для получения максимально полной картины об особенностях лексического строения нарратива корпусный материал рассматривался в двух аспектах.
В начале исследования был проведен анализ ряда количественных показателей подкорпусов на основе методики, предложенной А.А. Соболевым и колл. (Соболев и др., 2022) и продемонстрировавшей, что выделенные критерии (перечень эмпирически обоснован в указанной работе) позволяют выявить различия между речью взрослых и детей:
- базовые статистики подкорпусов текстов (количество слов, количество уникальных слов и др.);
- метрики удобочитаемости (тест Флеша ‒ Кинкайда (Kincaid et al., 1975), индекс удобочитаемости Флеша (Flesch, 1948), индекс SMOG (McLaughlin, 1969) (обзор см.: Ляшевская, 2016);
- коэффициенты лексического разнообразия (TTR, RTTR, CTTR, MATTR, MSTTR) (краткое обзорное описание методов см.: Захарова, Савина, 2020).
Указанные характеристики получены путем обработки корпуса с использованием инструментов языка Python, в том числе библиотеки ruTS1 (разработчики С.С. Шкарин, Е.Ю. Смирнова).
Обращение к данным параметрам количественно-статистической оценки позволяет подойти к описанию уровня сложности продуцируемого билингвами текста как с позиции длины слов/предложений, так и с точки зрения лексического разнообразия (о различных трактовках и методах анализа сложности текста см.: Солнышкина, Кисельников, 2015).
Статистические свойства текстов корпуса речи билингвов были сопоставлены с теми же характеристиками текстов подкорпуса речи монолингвов.
Другим аспектом изучения стало выяснение того, какие лексические средства используются билингвами для построения нарратива, насколько этот нарратив унифицирован и стандартизован (то есть выявлены лексические параметры нарративной стратегии), а также сопоставление его по этим характеристикам с нарративом монолингвов. В данном случае мы частично опираемся на перечень элементов нарратива, описанный Е.Ю. Протасовой (Протасова, 2021: 30): указание на временную отнесенность, описание участников и их действий, включение в рассказ значимых для развития сюжета обстоятельств и др. Именно этот набор элементов позволяет нарративу, основанному на стимульном картиночном материале, приобретать свойство унифицированности. Для проведения анализа на данном уровне были составлены списки униграмм и биграмм всех текстов корпуса и отмечено, в каком количестве текстов встречается каждый из элементов. Проведен семантический и тематический анализ полученных единиц, а также определены их место и функции в нарративе.
Результаты
Анализ корпуса устных нарративов русско-немецких билингвов в сопоставлении с корпусом нарративов монолингвальных носителей русского языка позволил выявить следующие особенности, говорящие о степени сформированности нарративной стратегии у билингвальных носителей русского языка.
- Основные количественные показатели текстов родителей-билингвов значительно ниже, чем аналогичные показатели текстов родителей-монолингвов, в то время как тексты детей в среднем совпадают по объему.
- Корпусы билингвов и монолингвов сопоставимы по показателям использования уникальных слов, а также по метрикам лексического разнообразия. Незначительно более сложными по метрикам удобочитаемости оказались тексты детей-билингвов.
- Как и в случае с нарративами монолингвов, родители-билингвы используют более вариативную лексику в целом, но также используют нарративные стратегии, позволяющие тексту быть более унифицированным и в то же время описывать максимальное число элементов нарратива и отношений между ними. Однако по степени развернутости и унифицированности компонентов нарратива тексты родителей-билингвов значительно уступают текстам родителей-монолингвов (что коррелирует и с меньшим объемом данных текстов).
- Перечень и качество частотных биграмм и униграмм, связанных с развитием сюжета, показывают, с одной стороны, закономерный процесс освоения нарративных стратегий, а с другой – по сравнению с текстами детей-монолингвов демонстрируют более бедный активный тезаурус детей-билингвов.
- Степень лексической развернутости и унифицированности рассказа и у родителей, и у детей-билингвов ниже аналогичных показателей монолингвов, что проявляется в меньшем многообразии и частотности совпадающих во всех текстах подкорпусов униграмм и биграмм, связанных с необходимыми компонентами нарратива.
Обсуждение
Статистические показатели текстов рассказов
Полученный в результате эксперимента корпус текстов необходимо было прежде всего проанализировать с точки зрения базовых статистик и сравнить эти данные с параметрами корпуса рассказов монолингвов. С помощью средств библиотеки ruTS для языка Python были получены следующие характеристики текстов рассказов.
Средняя длина рассказа детей-билингвов – 16 предложений (168 слов), родителей-билингвов – 27 предложений (309 слов). В корпусе монолингвов: дети – 26 предложений (189 слов), родители – 56 предложений (520 слов). По данному показателю значительное расхождение в объеме текста наблюдается в рассказах родителей.
По процентному соотношению (от общего числа токенов в соответствующем подкорпусе) использования в текстах уникальных слов оба корпуса (монолингвы и билингвы) показывают идентичный результат: дети – 21 %, родители – 25 %. Процент употребления длинных (от 6 букв; дети – 32 %, родители – 36 %) и сложных (от 4 слогов; дети – 7 %, родители – 9 %) слов практически соответствует аналогичным параметрам корпуса монолингвов.
Рассмотрим подкорпусы с точки зрения лексического разнообразия, то есть оценим объем использованного словаря. В данном случае проведем подсчет подкорпуса детей дважды: весь подкорпус и часть подкорпуса, записанная от испытуемых в возрасте до 13 лет, чтобы корректно сопоставить данные по этому параметру с данными корпуса речи монолингвов (табл. 1).
Таблица 1
Метрики лексического разнообразия по подкорпусам рассказов билингвов и монолингвов
Метрика | Подкорпус речи | ||||
Билингвы | Монолингвы | ||||
Родители | Дети | Дети до 13 лет | Родители | Дети | |
Type-Token Ratio (TTR) | 0,25 | 0,21 | 0,28 | 0,25 | 0,21 |
Root Type-Token Ratio (RTTR) | 19,97 | 13,79 | 13,28 | 24,43 | 14,14 |
Corrected Type-Token Ratio (CTTR) | 14,12 | 9,75 | 9,39 | 17,28 | 10,00 |
Moving Average Type-Token Ratio (MATTR) | 0,84 | 0,77 | 0,78 | 0,85 | 0,79 |
Mean Segmental Type-Token Ratio (MSTTR) | 0,84 | 0,78 | 0,77 | 0,85 | 0,79 |
Table 1
Lexical diversity metrics of bilinguals’ and monolinguals’ narratives subcorpora
Metrics | Subcorpora of narratives | ||||
Bilinguals | Monolinguals | ||||
Parents | Children | Children under 13 years | Parents | Children | |
Type-Token Ratio (TTR) | 0.25 | 0.21 | 0.28 | 0.25 | 0.21 |
Root Type-Token Ratio (RTTR) | 19.97 | 13.79 | 13.28 | 24.43 | 14.14 |
Corrected Type-Token Ratio (CTTR) | 14.12 | 9.75 | 9.39 | 17.28 | 10.00 |
Moving Average Type-Token Ratio (MATTR) | 0.84 | 0.77 | 0.78 | 0.85 | 0.79 |
Mean Segmental Type-Token Ratio (MSTTR) | 0.84 | 0.78 | 0.77 | 0.85 | 0.79 |
По всем метрикам лексического разнообразия (как зависящим от длины анализируемого текста – TTR, RTTR, CTTR, так и не зависящим от нее – MATTR, MSTTR) данные практически совпадают с результатами анализа корпуса рассказов монолингвов, то есть по объему использованного словаря обе сравниваемые возрастные группы сопоставимы. Большее значение метрики TTR в рассказах детей до 13 лет объясняется меньшим объемом подкорпуса и корректируется в метриках MATTR и MSTTR.
Обратимся еще к одному параметру статистической оценки текстов – оценим уровень удобочитаемости по трем методикам (табл. 2).
Метрика, полученная в тесте Флеша ‒ Кинкайда, позволяет оценить минимальный для понимания текста уровень образования. Сама изображенная на стимульных картинках ситуация проста и не требует сложного описания, что объясняет полученные значения. Однако, несмотря на простоту сюжета текста, уровень сложности закономерно увеличивается в зависимости от возраста информантов: так, наиболее простые тексты по этому параметру будут у детей до 13 лет. Заметим, что тексты родителей-монолингвов по оценке Флеша ‒ Кинкайда оказываются незначительно проще (3,10), чем тексты родителей-билингвов. В то же время разница между текстами детей будет существенной (у монолингвов – 1,42): сложность всего подкорпуса можно объяснить разницей в возрасте испытуемых, но мы видим большее значение параметра и в подкорпусе речи детей того же возраста. Возможно, большая сложность текста объясняется несколько большими усилиями при продуцировании, связанными с говорением на втором языке, что ведет к увеличению числа единиц, влияющих на данный параметр.
Таблица 2
Метрики удобочитаемости по подкорпусам рассказов билингвов и монолингвов
Метрика | Подкорпус речи | ||||
Билингвов | Монолингвов | ||||
Родители | Дети | Дети до 13 лет | Родители | Дети | |
Тест Флеша ‒ Кинкайда | 3,68 | 2,49 | 1,93 | 3,10 | 1,42 |
Индекс удобочитаемости Флеша | 72,31 | 79,39 | 79,68 | 69,98 | 78,74 |
Индекс SMOG | 9,14 | 7,58 | 7,53 | 9,05 | 6,54 |
Table 2
Readability metrics of bilinguals’ and monolinguals’ narratives subcorpora
Metrics | Subcorpora of narratives | ||||
Bilinguals | Monolinguals | ||||
Parents | Children | Children under 13 years | Parents | Children | |
Flesch ‒ Kincaid Test | 3.68 | 2.49 | 1.93 | 3.10 | 1.42 |
Flesch Reading Ease Scale | 72.31 | 79.39 | 79.68 | 69.98 | 78.74 |
SMOG index | 9.14 | 7.58 | 7.53 | 9.05 | 6.54 |
Индекс удобочитаемости Флеша также показывает, что тексты детей проще для восприятия. По данному параметру тексты билингвов и монолингвов практически идентичны (находятся на уровне легкого чтения).
Индекс удобочитаемости SMOG ориентирован на сложность восприятия коммуникативных единиц (значение индекса показывает примерное количество лет обучения в школе, необходимое для понимания текста): он учитывает не только длину слов, но и их представленность в предложениях. По данному параметру мы видим закономерно более сложный текст у родителей-билингвов (на том же уровне сложности, что и тексты родителей-монолингвов). При этом тексты детей-билингвов, как и в случае с метрикой Флеша ‒ Кинкайда, будут сложнее, чем тексты детей-монолингвов (6,54).
Лексические средства формирования нарратива
Рассмотрим частотные характеристики использования лексических средств в подкорпусах рассказов детей и родителей – билингвов и сопоставим их с аналогичными данными корпуса рассказов монолингвов.
Подкорпус рассказов детей-билингвов. Говоря о самых частотных словах подкорпуса речи билингвов, заметим, что только одно слово является общим для всех рассказов – лягушка. По меньшей мере в трех четвертях текстов упоминаются дерево (92 %), лес, мальчик (по 88 %), искать (85 %), банка (81 %), собака (77 %). Данные слова связаны с ключевыми моментами сюжета и позволяют восстановить основную его линию: действующие лица (мальчик, собака, лягушка), исходная точка сюжета (банка), описание самого сюжета (искать), место поиска (лес), один из ярких фрагментов истории (дерево). В то же время в 75 % рассказов монолингвальных детей совпадающих слов оказывается в два раза больше: дается второй вариант наименования лягушки (лягушонок), описывается большее количество действий (спать, увидеть, послать), большее число мест поиска лягушки (дупло, норка), конкретизируется место нахождения лягушки (бревно).
Как видно в случае с самыми частотными словами, они все являются сюжетообразующими элементами. В связи с этим для оценки сформированности нарративной стратегии составлен перечень основных компонентов, которые присутствуют в рассказах. Совпадающие в нескольких текстах униграммы и биграммы, связанные с развитием нарратива, были распределены по данным компонентам, после чего вычислены два индекса: индекс развернутости компонента (ИР) (отношение суммы встречаемости единиц компонента в рассказах к количеству рассказов) и индекс унифицированности (ИУ) (средний процент встречаемости единиц компонента). Эти два индекса позволяют оценить разнообразие языковых средств, использующихся для реализации нарративной стратегии, а также оценить степень их унифицированности. Оценка качества компонентов нарратива детей представлена в табл. 3.
Таблица 3
Оценка качества нарратива по подкорпусам рассказов детей
Nграммы | Компонент нарратива | Дети-билингвы | Дети-монолингвы | ||
ИР | ИУ | ИР | ИУ | ||
Униграммы | Действующие лица | 3,77 | 53,86 | 4,21 | 46,78 |
Место | 2,23 | 37,17 | 3,26 | 36,22 | |
Время | 2,61 | 32,63 | 3,74 | 37,40 | |
Исходная точка сюжета | 1,35 | 45,00 | 2,48 | 41,33 | |
Сюжетные действия | 6,23 | 36,65 | 8,29 | 41,45 | |
Детали | 0,15 | 15,00 | 0,13 | 13,00 | |
Оценка и принятие решений | 0,46 | 23,00 | 0,83 | 27,67 | |
Выражение эмоций | 0,27 | 13,50 | 0,35 | 17,50 | |
Последовательность событий | 1,04 | 34,67 | 0,30 | 15,00 | |
Сюжетные точки | 2,85 | 35,63 | 4,69 | 46,90 | |
Персонажи сюжетных точек | 1,23 | 41,00 | 2,16 | 21,60 | |
Характеризация | 0,62 | 62,00 | 0,52 | 52,00 | |
Описание результата | 0,57 | 28,50 | 0,78 | 39,00 | |
Модальность | 0,53 | 17,67 | 0,56 | 14,00 | |
Биграммы | Последовательность событий | 0,96 | 32,00 | 1,14 | 38,00 |
Оценка и принятие решений | 0,19 | 19,00 | 0,60 | 20,00 | |
Направление движения | 1,07 | 26,75 | 2,95 | 49,17 | |
Характеризация | 0,27 | 27,00 | 0,43 | 43,00 | |
Выражение определенности | 1,27 | 25,40 | 0,48 | 24,00 | |
Выражение времени | 0,23 | 23,00 | 0,87 | 29,00 | |
Выражение модальности | 0,34 | 17,00 | 0,17 | 17,00 | |
| Суммарный индекс | 28,24 | 646,40 | 38,94 | 670,02 |
Table 3
Narrative quality estimate of children’s stories subcorpora
N-grams | Narrative components | Bilingual children | Monolingual children | ||
Completeness index | Uniformity index | Completeness index | Uniformity index | ||
Unigrams | Actors | 3.77 | 53.86 | 4.21 | 46.78 |
Place | 2.23 | 37.17 | 3.26 | 36.22 | |
Time | 2.61 | 32.63 | 3.74 | 37.40 | |
Starting point of the plot | 1.35 | 45.00 | 2.48 | 41.33 | |
Plot actions | 6.23 | 36.65 | 8.29 | 41.45 | |
Details | 0.15 | 15.00 | 0.13 | 13.00 | |
Assessment and decision-making | 0.46 | 23.00 | 0.83 | 27.67 | |
Emotions expression | 0.27 | 13.50 | 0.35 | 17.50 | |
Events sequence | 1.04 | 34.67 | 0.30 | 15.00 | |
Plot points | 2.85 | 35.63 | 4.69 | 46.90 | |
Plot point characters | 1.23 | 41.00 | 2.16 | 21.60 | |
Characterization | 0.62 | 62.00 | 0.52 | 52.00 | |
Description of the result | 0.57 | 28.50 | 0.78 | 39.00 | |
Modality | 0.53 | 17.67 | 0.56 | 14.00 | |
Bigrams | Sequence of events | 0.96 | 32.00 | 1.14 | 38.00 |
Assessment and decision-making | 0.19 | 19.00 | 0.60 | 20.00 | |
Direction of movement | 1.07 | 26.75 | 2.95 | 49.17 | |
Characterization | 0.27 | 27.00 | 0.43 | 43.00 | |
Expression of definiteness | 1.27 | 25.40 | 0.48 | 24.00 | |
Expression of time | 0.23 | 23.00 | 0.87 | 29.00 | |
Expression of modality | 0.34 | 17.00 | 0.17 | 17.00 | |
| Total index | 28.24 | 646.40 | 38.94 | 670.02 |
По данным таблицы можно увидеть, что в целом у детей-монолингвов заметно более высокий уровень развернутости компонентов. В то же время суммарный индекс унифицированности отличается не так значительно. Рассмотрим некоторые из компонентов реализации нарративной стратегии, где проявляются заметные различия, чтобы объяснить данное явление.
Действующие лица у билингвов обозначены в большой степени стандартизованно: лягушка (100 %); мальчик (88 %), ребенок (58 %); собака (77 %), собачка (27 %), друг (12 %) и песик (12 %). У монолингвов же представлено несколько больше наименований: лягушка (96 %), лягушонок (74 %), жаба (8 %), животное (8 %); мальчик (83 %); собака, собачка (по 52 %), друг (26 %), щенок (22 %).
Пространство в нарративе билингвов организует указание на место: основным местом оказывается лес (88 %); дом (38 %) упоминается гораздо реже; хотя при этом завершение рассказа, связанное с возвращением мальчика домой, отмечено в половине рассказов – домой (50 %).
Хотя лес осознается пространством нарратива, недостаточно детально и унифицировано в рассказах билингвов описываются его атрибуты, служащие сюжетными точками: только два элемента попадают в число частотных – дерево (92 %) и дупло (73 %). Остальные атрибуты встречаются в малом числе текстов: улей (35 %), норка (19 %), дыра, дырка (по 15 %; в значениях ‘нора’ или ‘дупло’), домик (в значении ‘улей’), болото (по 12 %). Наиболее часто упоминаемые обитатели леса (персонажи сюжетных точек) – пчела (65 %) и крот (27 %).
В то же время в рассказах монолингвов в разной степени представлены практически все реалии, изображенные на картинках, что, с одной стороны, заметно увеличивает индекс развернутости этих компонентов, а с другой – снижает их унифицированность.
В данном случае очевидны лакуны в тезаурусе детей-билингвов, не знающих многих наименований на русском языке и прибегающих к различным стратегиям, чтобы избежать называния этих реалий (вероятно, по этой причине их текст становится более сложным). Здесь можно предположить следующую статистическую взаимосвязь: меньшее значение индекса развернутости при большем значении индекса унифицированности говорит о более бедном лексиконе.
Биграмм (далее указываются в лемматизированной форме), совпадающих более чем в половине текстов билингвов-детей, не обнаружено. Самая частотная в корпусе детей-монолингвов биграмма из банка (78 %) в корпусе текстов детей-билингвов представлена лишь в четверти рассказов (23 %), хотя она является сюжетообразующей (связана с завязкой сюжета). Кроме того, обнаруживаются еще только две предложные конструкции на дерево (38 %) и за дерево (23 %), тогда как в корпусе монолингвов сочетаний предлогов и существительных, отражающих развитие сюжета, больше (из норка, на улица, на утро). Примыкающая по значению «глагол + предлог» залезть на встречается в 23 % текстов (у монолингвов – 61 %; у билингвов отсутствует унификация сюжетообразующей биграммы вылезти из).
По сравнению с монолингвами более частотны у билингвов биграммы, выражающие определенность (в том числе с помощью указания на принадлежность): один лягушка (23 %), другой лягушка, этот лягушка (35 %), свой собака (19 %), свой лягушка (15 %). Данный факт может косвенно свидетельствовать о грамматической интерференции со стороны немецкого языка.
Приведенные статистические данные показывают, что в целом степень развития нарративной стратегии у детей-билингвов значительно ниже, чем у детей-монолингвов, что выражается в меньшем уровне наполненности компонентов, а также в меньшем объеме общего словарного запаса. Это позволяет тексту билингвов при заметно менее развернутой реализации компонентов нарратива по уровню унифицированности приближаться к текстам детей-монолингвов.
То есть, несмотря на статистическое сходство текстов детей – билингвов и монолингвов – по параметру лексического разнообразия, качественно они значительно отличаются прежде всего степенью сформированности навыков выбора лексических средств, служащих развитию нарратива. Это особенно проявляется при представлении героев нарратива и их действий, а также в недостаточной способности развернуто передавать содержание сюжетных точек, для повествования о которых требуется более широкий тезаурус.
Подкорпус рассказов родителей-билингвов. Только два сюжетных слова было использовано во всех рассказах родителей-билингвов – лягушка и дупло. Как минимум в трех четвертях текстов присутствуют слова банка (95 %), дерево, лес (по 90 %), искать, мальчик (по 86 %), маленький, свой, увидеть (по 81 %), пчела (76 %).
Приведем оценку качества реализации компонентов нарративной стратегии в рассказах родителей (табл. 4) и рассмотрим более подробно некоторые из компонентов нарратива.
Как и в корпусе речи монолингвов, обозначение персонажей у билингвов достаточно унифицировано: используется слово лягушка (100 %) с вариантами лягушонок (71 %) и лягушечка (10 %), главный герой обозначен как мальчик (86 %), а его собака преимущественно как собачка (57 %) и собака (43 %), хотя в некоторых текстах встречаются также лексемы пес, щенок (по 14 %) и песик (10 %). Хотя по степени унифицированности данный компонент практически совпадает у билингвов и монолингвов, у билингвов он заметно менее развернутый.
Менее развернуто, по сравнению с текстами монолингвов, представлены и наименования персонажей сюжетных точек – животные и насекомые. Лишь пчела упоминается в трех четвертях рассказов (76 %). Остальные животные встречаются менее чем в трети текстов: крот (33 %), белочка, птичка, суслик (по 10 %).
Таблица 4
Оценка качества нарратива по подкорпусам рассказов родителей
N-граммы | Компонент нарратива | Родители-билингвы | Родители-монолингвы | ||
ИР | ИУ | ИР | ИУ | ||
Unigrams | Действующие лица | 4,09 | 45,44 | 5,74 | 47,83 |
Место | 3,49 | 26,85 | 4,15 | 46,11 | |
Время | 5,00 | 35,71 | 6,33 | 45,21 | |
Исходная точка сюжета | 1,99 | 39,80 | 2,68 | 53,60 | |
Сюжетные действия | 8,39 | 34,96 | 13,11 | 44,36 | |
Детали | 0,72 | 36,00 | 1,52 | 30,40 | |
Оценка и принятие решений | 1,57 | 31,40 | 2,32 | 46,40 | |
Выражение эмоций | 0,96 | 24,00 | 2,05 | 29,29 | |
Последовательность событий | 0,38 | 38,00 | 1,16 | 29,00 | |
Сюжетные точки | 4,32 | 39,27 | 6,12 | 43,71 | |
Персонажи сюжетных точек | 2,54 | 28,22 | 3,78 | 34,36 | |
Характеризация | 3,04 | 60,80 | 4,58 | 57,25 | |
Описание результата | 2,44 | 48,80 | 2,36 | 47,20 | |
Модальность | 1,19 | 23,80 | 2,43 | 30,38 | |
Bigrams | Последовательность событий | 0,14 | 14,00 | 0,21 | 21,00 |
Оценка и принятие решений | 0,75 | 18,75 | 1,89 | 47,25 | |
Направление движения | 2,19 | 31,29 | 3,00 | 42,86 | |
Характеризация | 0,91 | 30,33 | 1,90 | 63,33 | |
Выражение определенности | 1,00 | 33,33 | 1,85 | 37,00 | |
Выражение времени | 0,77 | 25,67 | 1,00 | 50,00 | |
Выражение модальности | 1,14 | 38,00 | 0,95 | 31,67 | |
| Суммарный индекс | 47,02 | 704,43 | 69,13 | 878,22 |
Table 4
Narrative quality estimate of parents’ stories subcorpora
N-граммы | Narrative components | Bilingual parents | Monolingual parents | ||
Completeness index | Uniformity index | Completeness index | Uniformity index | ||
Униграммы | Actors | 4.09 | 45.44 | 5.74 | 47.83 |
Place | 3.49 | 26.85 | 4.15 | 46.11 | |
Time | 5.00 | 35.71 | 6.33 | 45.21 | |
Starting point of the plot | 1.99 | 39.80 | 2.68 | 53.60 | |
Plot actions | 8.39 | 34.96 | 13.11 | 44.36 | |
Details | 0.72 | 36.00 | 1.52 | 30.40 | |
Assessment and decision-making | 1.57 | 31.40 | 2.32 | 46.40 | |
Emotions expression | 0.96 | 24.00 | 2.05 | 29.29 | |
Events sequence | 0.38 | 38.00 | 1.16 | 29.00 | |
Plot points | 4.32 | 39.27 | 6.12 | 43.71 | |
Plot point characters | 2.54 | 28.22 | 3.78 | 34.36 | |
Characterization | 3.04 | 60.80 | 4.58 | 57.25 | |
Description of the result | 2.44 | 48.80 | 2.36 | 47.20 | |
Modality | 1.19 | 23.80 | 2.43 | 30.38 | |
Биграммы | Sequence of events | 0.14 | 14.00 | 0.21 | 21.00 |
Assessment and decision-making | 0.75 | 18.75 | 1.89 | 47.25 | |
Direction of movement | 2.19 | 31.29 | 3.00 | 42.86 | |
Characterization | 0.91 | 30.33 | 1.90 | 63.33 | |
Expression of definiteness | 1.00 | 33.33 | 1.85 | 37.00 | |
Expression of time | 0.77 | 25.67 | 1.00 | 50.00 | |
Expression of modality | 1.14 | 38.00 | 0.95 | 31.67 | |
| Total index | 47.02 | 704.43 | 69.13 | 878.22 |
Более широко, по сравнению с рассказами детей-билингвов, у родителей-билингвов лексически выражается время: время (67 %), проснуться (57 %), утром (52 %), вечером, однажды (по 48 %), спать (43 %), утро, вдруг (38 %), ночью (29 %), поздно (24 %). При практически равном индексе унифицированности индекс развернутости в этом компоненте выше в два раза: это говорит о большем объеме равномерно использованного словаря.
Нарратив билингвов-взрослых, как и билингвов-детей, показывает стратегию унификации наименования основного места действия (лес ‒ 90 %, дом ‒ 48 %), в то же время обозначение других мест менее стандартизовано (пруд ‒ 19 %, болото, полянка ‒ по 14 %, дорога, место, путь, река, чаща ‒ по 10 %).
По сравнению с текстами детей-билингвов, более развернуто в рассказах родителей-билингвов используются глаголы, описывающие проблемную ситуацию (исчезнуть, пропасть ‒ по 33 %) и процесс поиска лягушки, однако более чем в половине текстов совпадают только шесть таких глаголов: искать (86 %), увидеть (81 %), взять (67 %), найти (57 %), пойти, смотреть (52 %). В корпусе рассказов родителей-монолингвов таких слов было тринадцать: мы видим и большее значение обоих индексов, что говорит о более разнообразном у родителей-монолингвов представлении действий участников нарратива.
В большом числе текстов у родителей-билингвов реализуются стратегии объяснения принятия героем решения и описания его мыслительных процессов (решить ‒ 43 %, думать, знать ‒ по 38 %). Почти в трети рассказов появляются глаголы, выражающие эмоциональное состояние, удивиться и обрадоваться (по 29 %). По этим показателям развернутость в текстах родителей-билингвов в три раза выше, чем у детей-билингвов.
В нарративах взрослых чаще используются прилагательные, характеризующие действующих лиц и наиболее важные сюжетообразующие элементы: маленький (81 %), большой (57 %), пустой (52 %), старый (33 %).
Частотный анализ позволяет вывить и наиболее частые грамматические средства в речи родителей-билингвов. В сложных синтаксических конструкциях выражаются следующие типы отношений в порядке убывания частотности: определительные (который – 71 %, какой – 43 %), временные (когда – 62 %, пока – 29 %), пространственные (где – 57 %, куда – 43 %), сравнительные (как – 52 %), целевые (чтобы – 29 %, чтоб – 10 %), уступительные (хотя – 10 %).
Количество регулярных предложных конструкций, служащих для выражения пространственных отношений, в текстах родителей возрастает (индекс развернутости в два раза выше, чем в текстах детей-билингвов): на дерево (52 %), из банка (33 %), на земля, на улица, за они (29 %), из норка (24 %).
Можно констатировать, что, по сравнению с детскими нарративами, нарративы родителей содержат в унифицированной форме гораздо больше сюжетообразующих лексических элементов, позволяющих описать структуру рассказа и сделать его более красочным: наименования действующих лиц, мест, важных предметов и их атрибутов, обозначение времени и пространства, а также глагольную событийную лексику и лексику, описывающую мыслительные процессы, эмоциональное состояние и модальность. Нарративная стратегия родителей сформирована лучше и ее использование приводит к реализации большего количества признаков, свойственных качественному нарративу.
Однако и по степени развернутости всех компонентов нарратива (рис. 1 и 2), и по их унифицированности нарративы родителей-билингвов лишь незначительно превосходят тексты детей-монолингвов и демонстрируют большой разрыв с текстами родителей-монолингвов.
Рис. 1. Развернутость компонентов нарратива
Figure 1. Breadth of the narrative components
Рис. 2. Унифицированность компонентов нарратива
Figure 2. Unification of the narrative components
Как видно из представленного экспериментального материала, у взрослых представителей монолингвальных и билингвальных носителей русского языка в нарративах прослеживаются одинаковые нарративные стратегии, однако степень их выраженности оказывается различной. Особенно заметно это в способах реализации основных нарративных компонентов – указание на время, место, а также в сюжетообразующей глагольной лексике. Меньшая степень развернутости второстепенных сюжетных элементов может говорить о выходе в пассивный запас малоупотребительной лексики у взрослых. Данная проблема требует дальнейшего изучения для выявления причин, в особенности оценки того факта, насколько на это повлияло долгое нахождение вне языковой среды и развитие билингвизма.
Заключение
В результате проведенного анализа установлено, что обращение к статистическим метрикам лексического разнообразия и удобочитаемости дает лишь общее представление о лексическом составе текстов, хотя и достоверно позволяет сравнивать тексты, продуцированные испытуемыми разного возраста. По этим параметрам, как было показано, рассказы билингвов соответствуют текстам монолингвов и отражают степень использования словарного запаса, характерную для своих возрастных групп. Однако качество нарративов значительно отличается, что удается обнаружить при анализе частотности использования совпадающих в текстах подкорпусов униграмм и биграмм. Сопоставление с принятым в качестве верифицирующего корпуса нарративов монолингвов показало разную степень развития нарративных навыков в одинаковых возрастных группах, что прежде всего отражается на степени развернутости элементов нарратива и их унифицированности.
Представленный в настоящей работе подход позволяет увидеть на уровне лексики степень сформированности нарративной стратегии и показать «проблемные» для билингвов компоненты нарратива. Дальнейшее расширение экспериментальных данных (в том числе за счет использования другого стимульного материала) даст возможность не только взглянуть на структуру устного нарратива с новых позиций, но и методически интерпретировать их для использования при обучении билингвов языку.
1 Russian Texts Statistics (ruTS). URL: https://github.com/SergeyShk/ruTS
Об авторах
Максим Сергеевич Шишков
Шанхайский университет иностранных языков; Санкт-Петербургский государственный университет
Автор, ответственный за переписку.
Email: max-shishkov@yandex.ru
ORCID iD: 0000-0002-3629-2602
кандидат филологических наук, доцент, доцент Института России, Восточной Европы и Центральной Азии, Шанхайский университет иностранных языков
Китайская Народная Республика, 200083, Шанхай, ул. Далянь Си, д. 550; Российская Федерация, 199034, Санкт-Петербург, Университетская наб., д. 7-9Список литературы
- Бергельсон М.Б., Драгой О.В., Акинина Ю.С., Шитова Н.М. Нарративные стратегии : норма и патология // Язык. Константы. Переменные : памяти Александра Евгеньевича Кибрика / отв. ред. В.А. Плунгян. СПб. : Алетейя, 2014. С. 75-85.
- Бойкова С.Е. Эксперимент с картинками со сквозным персонажем : анализ билингвального нарратива // Litera. 2020. № 10. С. 37-50. https://doi.org/10.25136/2409-8698.2020.10.33904
- Захарова Е.Ю., Савина О.Ю. Лексическое разнообразие текста и способы его измерения // Вестник Тюменского государственного университета. Гуманитарные исследования. Humanitates. 2020. Т. 6. № 1 (21). С. 20-34. https://doi.org/10.21684/2411-197X-2020-6-1-20-34
- Иваненко А.А., Выренкова А.С. Стратегии описания сложных сюжетных элементов русскоязычными монолингвами и билингвами с доминантным немецким // Проблемы онтолингвистики - 2021 : языковая система ребенка в ситуации однои многоязычия : материалы ежегодной международной научной конференции, Санкт-Петербург, 13-15 апреля 2021 года. СПб. : Изд-во ВВМ, 2021. С. 128-134.
- Ляшевская О.Н. Индексы удобочитаемости как мера оценки сложности текста : доклад на семинаре НУГ. 2016. URL : https://ling.hse.ru/data/2016/12/15/1111563794/Readability%20talk.pdf (дата обращения : 23.10.2022).
- Протасова Е.Ю. Динамика рассказов детей-билингвов : проблемы и практика // Современное дошкольное образование. 2021. № 5 (107). С. 28-37. https://doi.org/10.24412/1997-9657-2021-5107-28-37
- Протасова Е.Ю., Петровская В.В., Овчинников А.В. Описание картинок финско-русскими билингвами // Путь в язык : одноязычие и двуязычие : сб. статей / отв. ред. С.Н. Цейтлин, М.Б. Елисеева. М. : Языки славянских культур, 2011. С. 282-293.
- Севастьянова А.М. Функционирование глаголов движения в речи русскоязычных детей дошкольного возраста (на материале рассказов по картинкам) // Проблемы онтолингвистики - 2021 : языковая система ребенка в ситуации однои многоязычия : материалы ежегодной международной научной конференции, Санкт-Петербург, 13-15 апреля 2021 года. СПб. : Изд-во ВВМ, 2021. С. 165-171.
- Соболев А.А., Федотова А.М., Куртукова А.В., Романов А.С., Шелупанов А.А. Методика определения возраста автора текста на основе метрик удобочитаемости и лексического разнообразия // Доклады Томского государственного университета систем управления и радиоэлектроники. 2022. Т. 25. № 2. С. 45-52. https://doi.org/10.21293/1818-0442-2022-25-2-45-52
- Солнышкина М.И., Кисельников А.С. Сложность текста : этапы изучения в отечественном прикладном языкознании // Вестник Томского государственного университета. Филология. 2015. № 6 (38). С. 86-99. https://doi.org/10.17223/19986645/38/7
- Федорова О.В. Психолингвистические исследования дискурса в полевой лингвистике // Социои психолингвистические исследования. 2016. Вып. 4. С. 7-18.
- Хоэл Т. Нарративы маленьких читателей : модель читателя и реальные читатели // Современное дошкольное образование : теория и практика. 2016. № 10 (72). С. 66-80.
- Шишков М.С. Лексический портрет устного рассказа : корпусное исследование речи двух поколений носителей русского языка // Научный диалог. 2022. Т. 11. № 10. С. 121-138. https://doi.org/10.24224/2227-1295-2022-11-10-121-138
- Эйсмонт П.М. Мультфильм или серия картинок? К проблеме выбора экспериментальной методики // XLIX Международная научная филологическая конференция, посвященная памяти Людмилы Алексеевны Вербицкой (1936-2019) : избранные доклады, Санкт-Петербург, 16-24 ноября 2020 года / под ред. Т.В. Черниговской. СПб. : Изд-во Санкт-Петербургского государственного университета, 2022. С. 314-332. https://doi.org/10.21638/11701/9785288062353.19
- Эйсмонт П.М. Формирование нарративных функций пространственных и временных характеристик в онтогенезе // Научная сессия ГУАП, Санкт-Петербург, 10-14 апреля 2017 года : сборник докладов : в 3 частях. СПб. : Санкт-Петербургский государственный университет аэрокосмического приборостроения, 2017. Ч. 3. С. 180-184.
- Юрьева Н.М. Интерактивный подход в изучении становления нарратива в онтогенезе речи // Филологические науки. Вопросы теории и практики. 2017. № 12-2 (78). С. 178-181.
- Юрьева Н.М. Механизмы устного нарратива в детской речи : когнитивный подход // Вопросы психолингвистики. 2016. № 29. С. 285-298.
- Aktan-Erciyes A. Effects of second language on motion event lexicalization : comparison of bilingual and monolingual children’s frog story narratives // Journal of Language and Linguistic Studies. 2020. Vol. 16. No. 3. Pp. 1127-1145. https://doi.org/10.17263/jlls.803576
- Anstatt T. Kognitive Strategien Zweisprachiger : Lösungen lexikalischer Probleme im Russischen bilingualer Kinder und Jugendlicher // Die slavischen Sprachen im Licht der kognitiven Linguistik / ed. by B. Norman. Wiesbaden : Harrassowitz, 2010. Pp. 217-239.
- Flesch R. A new readability yardstick // Journal of Applied Psychology. 1948. Vol. 32. No. 3. Pp. 221-233. https://doi.org/10.1037/h0057532
- Kincaid J.P., Fishburne R.P. Jr., Rogers R.L., Chissom B.S. Derivation of new readability formulas (Automated readability index, Fog count and Flesch reading ease formula) for navy enlisted personnel. 1975. Vol. 56. URL : https://stars.library.ucf.edu/istlibrary/56 (accessed : 23.10.2022).
- Mayer M. Frog, where are you? New York : Dial Books for Young Readers, 1969.
- McLaughlin H. SMOG grading - a new readability formula // Journal of Reading. 1969. Vol. 12. No. 8. Pp. 639-646.
- Pavlenko A. Verbs of motion in L1 Russian of Russian-English bilinguals // Bilingualism : Language and Cognition. 2009. Vol. 13. No. 1. Pp. 49-62. https://doi.org/10.1017/s1366728909990198
- Reilly J., Losh M., Bellugi U., Wulfeck B. “Frog, where are you?” Narratives in children with specific language impairment, early focal brain injury, and Williams syndrome // Brain and Language. 2004. Vol. 88. Issue 2. Pp. 229-247. https://doi.org/10.1016/S0093-934X(03)00101-9