Динамика русскоязычного интернет-дискурса: особенности словарной репрезентации лексики
- Авторы: Астапкина Е.С.1, Баркович А.А.1
-
Учреждения:
- Белорусский государственный университет
- Выпуск: Том 23, № 1 (2025)
- Страницы: 97-116
- Раздел: Русский язык в Интернет-пространстве
- URL: https://journals.rudn.ru/russian-language-studies/article/view/44250
- DOI: https://doi.org/10.22363/2618-8163-2025-23-1-97-116
- EDN: https://elibrary.ru/VLFOHT
- ID: 44250
Цитировать
Полный текст
Аннотация
Рассмотрено лингвистическое описание динамики интернет-дискурса. Интернет-дискурс - это не только речевая практика отдельных коммуникантов, но и глобальная коммуникация. Закономерен интерес лингвистов к проблематике Интернета, безусловно актуальны исследования, посвященные появлению и закреплению соответствующих языковых средств, в т.ч. в русском языке. Практически востребованной задачей в этой связи представляется рассмотрение текущего состояния словарной обеспеченности русского языка в контексте используемой в коммуникации интернет-лексики и выявление соответствующего потенциала дальнейшего развития русской лексикографии. Цель исследования - анализ лексикографического отражения ассоциирующихся с Интернетом языковых единиц и тенденций их словарной реализации в современных условиях. Эмпирические возможности такого исследования и лингвистики, посвященной IT-проблематике, в целом обеспечены статистически значимыми данными современного дискурса, в частности - доступными посредством корпусных методик и интернет-поиска. Задействован достаточно репрезентативный материал, доступный в «Национальном корпусе русского языка». В соответствии с тематикой исследования в фокусе выполненного анализа находились словари русского языка: как интерпретирующие его, например, «Современный толковый словарь русского языка» под редакцией Т.Ф. Ефремовой, так и регулирующие реалии речевой практики, например, «Русский орфографический словарь» под редакцией В.В. Лопатина и О.Е. Ивановой. Использовался комплекс аналитических методов, в т.ч. дискурс-анализ, компонентный анализ, а также синтез, моделирование, сопоставление и ряд других общенаучных и лингвистических методов. Сделан вывод о высокой динамике русскоязычного интернет-дискурса, при этом моделирование происходящих изменений показало, что лексикографические источники отражают динамику языка неполностью и избирательно. Полученные результаты могут быть использованы при организации научного сопровождения современной русскоязычной коммуникации, оптимизации лексикографической работы и исследовании широкого круга теоретических и практических вопросов лингвистики.
Ключевые слова
Полный текст
Введение
На фоне активной экспансии компьютерно-опосредованной коммуникации состав и функциональность практически всех живых языков мира изменяются — в соответствии с модернизацией социокультурной и производственной сфер жизни (Дубина, 2013; Кондрашева, Тинина, 2019; Синишина, 2014; Sapone, 2021 и др.). Обновление языка особенно заметно на современном этапе его функционирования: в XXI в. высокие темпы технологического развития как никогда стремительны (Barkovich, 2019). Это — последствия бурного развития информационных технологий, которые существенно расширили сферу коммуникации для носителя практически любого языка: «Социальные медиа это не только социальные сети … но и блоги, бизнес-сети, совместные проекты, корпоративные социальные сети, форумы, микроблоги, обмен фотографиями, обзоры продуктов / услуг, сайты социальных закладок, социальные игры, обмен видео и виртуальные миры» (Aichner, Jacob, 2015: 258). Средние показатели использования гаджетов постоянно растут: «Если вас спросят, сколько раз в день вы проверяете свой телефон, вы, скорее всего, ответите десять, двадцать, самое большее тридцать раз в день. Неправильно. На самом деле, реальное количество ваших обращений к своему телефону, вероятно, ближе к ста … миллениалы проверяют свои телефоны более ста раз в день, в общей сложности пять часов» (Sapone, 2021: 363).
И лингвистическая практика постепенно фиксирует соответствующие изменения, но динамику языкового развития, которая раньше не спеша описывалась постфактум, сегодня в интересах высокотехнологичной коммуникации необходимо выявлять и квалифицировать в режиме «реального времени». Вместе с тем, проведенное исследование свидетельствует о значительном неиспользуемом потенциале такого важного научного измерения, как лексикографическое. Разумеется, создают словари люди, и «в последнее время лингвисты, недовольные интуитивным решением проблемы формирования лексического состава словарей, все чаще обращаются к Национальному корпусу русского языка и данным интернета, а также к лингвистическому эксперименту как более надежным источникам» (Голев, 2015: 185) — на самом деле, глубокое замечание, подтверждающее актуальность рассмотрения специфики современной лексикографии.
Актуальность метаописания современного развития русского языка обусловлена не только постоянно меняющимся составом и вариативностью русской речи, но и ее значимостью в общемировом контексте. По данным интернет-трафика, по состоянию на 2014 г. русскоязычный Интернет занимал второе место после англоязычного, опережая немецкий, французский, испанский и китайский интернет-дискурс (W3Techs[1]). Сейчас русский язык несколько уступил свои позиции в Интернете, однако по-прежнему является широко распространенным и востребованным (см., напр., Азимов, Кулибина, Ван, 2023; Вязовская, Данилевская, Трубчанинова, 2020).
При этом лингвистическое сопровождение современной коммуникации базируется именно на лексикографических источниках, не только составляющих содержание многочисленных языковых баз данных, но и обеспечивающих прогресс естественно-искусственноязыковых интерфейсов (Горошко, 2013; Лушникова, 2003; McLuhan, 1964; Tang et al., 2016). Для обеспечения соответствующих коммуникационных ресурсов специалистам необходимо понимать: насколько репрезентативна и эффективна имеющаяся лексикографическая база, успевает ли она за темпом обслуживаемого тем или иным языком социума и каким образом ее целесообразно оптимизировать. Конечно, в рамках одного исследования решить эти задачи «в натуральную величину» нереально, следовательно, одним из методологических путей решения такого рода запросов должно быть моделирование (Баркович, 2021). Посредством моделирования языковой динамики на материале ориентированных на интернет-семантику лексических единиц репрезентативная картина может быть получена и проанализирована.
Итак, компьютеры, опосредующие коммуникацию, делают языковые ресурсы легко масштабируемыми и разнообразными. Это диктует и стереотипы современной метаязыковой сферы (см., например, Crystal, 2001; Garfinkel, 2000; Pinker, 2000). Чтобы уточнить любой дискуссионный вопрос о той или иной языковой норме, сегодня совсем не обязательно планировать поездку в библиотеку — достаточно включить компьютер с подключенным уже по умолчанию Интернетом. Впрочем, уже практически все гаджеты, в т.ч. телефоны, технически оснащены не хуже серверов Интернета. В Интернете же сегодня присутствует и большинство словарей. Зачастую именно интернет-версии словарей оказываются наиболее востребованным источником лингвистической информации (Carr, 2010). Это предъявляет высокий уровень требований к объективности и репрезентативности современных словарей, от них ожидаем максимальный охват речевой практики, ее корректную поддержку и сопровождение (Голев, 2015; Мокиенко, 1982). Таким образом, своевременная фиксация языковых реалий и их корректное описание — актуальные вопросы комфортного и непротиворечивого обеспечения любого языка, в т.ч. русского.
Итак, компьютеры, опосредующие коммуникацию, делают языковые ресурсы легко масштабируемыми и разнообразными. Это диктует и стереотипы современной метаязыковой сферы (см., например, Crystal, 2001; Garfinkel, 2000; Pinker, 2000). Чтобы уточнить любой дискуссионный вопрос о той или иной языковой норме, сегодня совсем не обязательно планировать поездку в библиотеку — достаточно включить компьютер с подключенным уже по умолчанию Интернетом. Впрочем, уже практически все гаджеты, в т.ч. телефоны, технически оснащены не хуже серверов Интернета. В Интернете же сегодня присутствует и большинство словарей. Зачастую именно интернет-версии словарей оказываются наиболее востребованным источником лингвистической информации (Carr, 2010). Это предъявляет высокий уровень требований к объективности и репрезентативности современных словарей, от них ожидаем максимальный охват речевой практики, ее корректную поддержку и сопровождение (Голев, 2015; Мокиенко, 1982). Таким образом, своевременная фиксация языковых реалий и их корректное описание — актуальные вопросы комфортного и непротиворечивого обеспечения любого языка, в т.ч. русского.
Значимой предметной областью для объекта изучения — русскоязычного интернет-дискурса — является его динамика в лексикографическом аспекте. В исследовании решались следующие задачи:
1) охарактеризовать концептуально-понятийные параметры лексики, ассоциирующейся с интернет-дискурсом;
2) выявить состав и динамику общеупотребительной интернет-лексики;
3) описать потенциал развития и нормативного оформления интернет-лексики в русском языке;
4) охарактеризовать особенности развития в русском языке важных для интернет-дискурса единиц виртуальный и контент;
5) описать особенности речевого функционирования интернет-лексики.
Цель исследования — анализ лексикографического отражения ассоциирующихся с Интернетом языковых единиц и тенденций их словарной реализации в современных условиях.
Методы и материал
В исследовании задействована комплексная методика, базирующаяся на двух мощных аналитических парадигмах: дискурс-анализе — при рассмотрении речевой продукции и компонентном анализе — при рассмотрении структуры и модификации языковых единиц. Дискурсивная парадигма лингвистической методологии позволяет органично совмещать структуралистские основания языкознания с прикладными, ориентированными на коммуникацию, исследованиями (см., например, Баркович, 2015; Пешё, 1999; Тичер и др., 2009; Widdowson, 2005). Однако анализ, выполненный для решения поставленной задачи, конечно, не мог быть ограничен его вышеупомянутыми разновидностями: современные метаописания — и это исследование не исключение — предполагают системное применение таких апробированных видов анализа, как лексический, морфологический, семантический, стилистический и др. (Виноградова, 2012; Тошович, 2015; Schiffrin, 2006 и др.) Кроме того, выполненная работа была бы лишена методологической перспективы без сопоставления, обобщения, структурирования, моделирования и, конечно, синтеза. В частности, синтез был задействован при аргументационном моделировании рамок возможного и желательного лексикографического сопровождения современной речевой практики на примере лексико-семантической общности единиц русского языка, связанных с важной на сегодня и широко обсуждаемой интернет-тематикой.
Материал исследования систематизировали на основании его функциональности. Проанализировали как словари, регулирующие реалии речевой практики[2], например, «Русский орфографический словарь», так и интерпретирующие ее словари[3], например, «Современный толковый словарь русского языка» под редакцией Т.Ф. Ефремовой. Для понимания структуры и особенностей развития семантики Интернета рассмотрели особенности ее тезаурусной репрезентации[4]. Значимость лексики для сферы коммуникации уточнялась по данным частотных словарей[5]. Референтные цели исследования особенности речевого функционирования дополнительно были верифицированы на материале Национального корпуса русского языка (НКРЯ)[6]. Речевой материал, агрегированный в данном корпусе, достаточно репрезентативен — в «Основном» подкорпусе на сегодня собрано порядка 374 млн, в «газетных» — 850 млн словоупотреблений, представительны и иные подкорпусы НКРЯ. Также, посредством браузеров (Google, Яндекс) был осуществлен поиск единиц и фрагментов текстов в глобальной сети Интернет. Такого рода материал оказался репрезентативным для достижения цели данного исследования. Его последовательное изучение и описание позволило создать целостное и статистически значимое описание интернет-дискурса через призму его лексикографического отражения.
Результаты
Выбранный для анализа лексикографический аспект является ключевым для лингвистики, поскольку формирует материальную базу для исследования многообразной проблематики языкознания и смежных дисциплин. Последовательное рассмотрение объекта исследования, согласно составленному плану, позволило получить целый ряд новых обобщений касательно динамики развития интернет-дискурса. В частности, были выполнены следующие этапы исследования:
1) выявлены концептуально-понятийные параметры лексики, ассоциирующейся с интернет-дискурсом;
2) была проанализирована представленность релевантной лексики в толковых словарях русского языка;
3) была рассмотрена презентация деривационных реализаций лексемы «интернет» в основном регулирующем речевую практику русского языка ресурсе «Русский орфографический словарь» под редакцией В.В. Лопатина и О.Е. Ивановой[7];
4) рассмотрена динамика тесно ассоциированных с концептосферой Интернета дериватов основ -контент- и -виртуальн-;
5) осуществлен мониторинг речевой практики на предмет ее насыщенности интернет-лексикой.
В целом потенциал развития русского языка в современных условиях может быть оценен как высокий. Собственные деривационные возможности русского языка сегодня органично дополняются активной ассимиляцией необходимых заимствований. Это объективно подтверждается квантитативными методами и данными о динамике интернет-лексики. Дискурс и концептосфера сетевой коммуникации в подобных новациях остро нуждаются. В частности, для синтетического русского языка чрезвычайно высокой оказалась продуктивность заимствованной из английского языка лексемы Internet (Интернет). Продуктивность в русском языке других рассмотренных для сравнения референтных основ — виртуальный и контент — оказалась существенно менее интенсивной по сравнению с реализацией основы — интернет-.
В целом научное описание речевой практики в рамках данного исследования осуществлялось с позиций дискурсивного анализа. Для анализа структурных особенностей модификации языка использовался компонентный анализ, показавший приоритет такой деривационной модели русского языка, как создание композитов — сложных слов. Особенно продуктивным оказалось использование производящей основы -интернет-. Из 194 интернет-дериватов композитами оказались 185 единиц. Были задействованы и такие специальные лингвистические методы как интернет-поиск, корпусный анализ и ряд других. Использованный подход позволил провести метаязыковое моделирование языковой динамики и всесторонне охарактеризовать специфику развития словарного состава русского языка, в частности, ориентированного на концептосферу Интернета.
Терминологическая функциональность интернет-обусловленной лексики, изначально являвшаяся определяющей для соответствующей сферы языкового функционирования, на сегодняшний день уже полностью актуальна и для узуса, что подтверждается представленностью интернет-лексики в толковых словарях. Еще шире презентация Интернета в регулирующих языковую практику орфографических словарях. Разумеется, соответствующее лексико-семантическое поле формируют и многие другие единицы (контент, виртуальный и т.д.), для изучения которых можно использовать реализованную в данной статье исследовательскую модель. На базе мониторинга развития интернет-дискурса посредством широкого спектра лингвистического инструментария сделаны аргументированные выводы об исключительной продуктивности ориентированных на «интернет»-семантику базовых единиц. Несомненно, это свидетельствует о значимости самого феномена сетевой коммуникации посредством Интернета.
Итак, интернет-обусловленная лексика русского языка продуктивно развивается, уверенно преодолевая свои изначальные терминологические рамки. Это происходит, не в последнюю очередь, благодаря возможностям реализации в ней не только технической, но и личностной, социальной и культурной прагматики современной коммуникации. Вместе с тем, не менее существенно влияние разного рода прагматических и субъективных обстоятельств на формирование лингвистических традиций и реалий.
Обсуждение
- Ввиду распространенности самой лексемы Интернет (интернет) и насыщенности коммуникации ее дериватами именно эта лексема оказалась в фокусе исследования. Необходимо отметить, что круг референтной лексики достаточно широк. Так лексикографический онлайн-ресурс «Тезаурус русского языка RuWordNet» на запрос «Интернет» выдает 14 русскоязычных единиц (в источнике — все прописными символами): ВЕБ, ВСЕМИРНАЯ ПАУТИНА, ВСЕМИРНАЯ СЕТЬ, ВСЕМИРНО ПРОТЯНУТАЯ ПАУТИНА, ГЛОБАЛЬНАЯ КОМПЬЮТЕРНАЯ СЕТЬ, ГЛОБАЛЬНАЯ ПАУТИНА, ГЛОБАЛЬНАЯ СЕТЬ, ИНЕТ, ИНТЕРНЕТ, ИНТЕРНЕТ-ПРОСТРАНСТВО, ИНТЕРНЕТ-СЕТЬ, МЕЖДУНАРОДНАЯ КОМПЬЮТЕРНАЯ СЕТЬ, МИРОВАЯ ПАУТИНА, СЕТЬ ИНТЕРНЕТ[8]. Объем данного ресурса вполне сопоставим с объемом словаря среднего размера: «Всего тезаурус RuWordNet содержит 111.5 тысяч слов и выражений русского языка»[9].
В свою очередь, скрининг речевой практики посредством стандартного нейросетевого моделирования дает существенно более широкий круг задействованной в отражении интернет-семантики лексики: нейросеть в 9 кластерах («связь», «технологии», «контент», «пользователи», «экономика», «культура», «проблемы», «будущее», «дополнительные слова») видит уже 81 семантически релевантную единицу (более, чем в 5 раз больше):
- сеть, коммуникация, информация, данные, передача, сеть, сигнал, телефон, почта, письмо (кластер «связь»);
- компьютер, сервер, сеть, Wi-Fi, кабель, оптоволокно, маршрутизатор, провайдер, домен, IP-адрес, браузер, сайт, приложение, протокол (кластер «технологии»);
- веб-страница, статья, видео, музыка, фото, новость, блог, социальные сети, форум, чат, игра, файл, поиск (кластер «контент»);
- человек, пользователь, юзер, компания, владелец, администратор, разработчик, хакер, бот (кластер «пользователи»);
- е-коммерция, онлайн-платежи, реклама, контент-маркетинг, бизнес, фриланс, криптовалюта (кластер «экономика»);
- виртуальная реальность, социальные сети, мемы, тренды, инфлюенсеры, киберспорт, онлайн-игры (кластер «культура»);
- киберпреступность, фейковые новости, зависимость, конфиденциальность, цензура, отключение (кластер «проблемы»);
- искусственный интеллект, блокчейн, метавселенная, 5G, интернет вещей (кластер «будущее»);
- цифровой мир, глобальная сеть, виртуальное пространство, всемирная паутина, информационные технологии, цифровые технологии, веб, облако, информационная революция, сетевой этикет (кластер «дополнительные слова») (Midjorney[10]).
Анализ референтной лексики свидетельствует о ее представительности и многоаспектности. Вопрос подробной дифференциации данной понятийной общности требует отдельного рассмотрения. Для цели нашего исследования важны насыщенность этой совокупности и ее явная идентичность.
- Классические и необновляемые словари русского языка, такие как «Толковый словарь русского языка» С.И. Ожегова и Н.Ю. Шведовой[11], «Толковый словарь современного русского языка» Д.Н. Ушакова[12] и др. не содержат лексемы «Интернет», появившейся в мировой словарной практике (в словарях английского языка) лишь в 1984 г. — в узусе русского языка много позже. Но Интернет и 17 его дериватов уже присутствуют в «Современном толковом словаре русского языка» Т.Ф. Ефремовой: Интернет, интернет-издание, интернет-кафе, интернет-класс, интернет-компьютер, интернет-провайдер, интернет-реклама, интернет-рынок, интернет-сервис, интернет-СМИ, интернет-страничка, интернет-технология, интернет-фирма, интернет-центр, интернетизация, интернетный, интернетовский и интернетомания[13]. Сама лексема Интернет здесь толкуется достаточно лаконично: «Интернет м. Всемирная компьютерная сеть электронной связи, позволяющая пользователям персональных компьютеров, находясь на любом расстоянии, в любой точке земного шара, иметь связь друг с другом, принимать и передавать текстовую и изобразительную информации»[14]. Два значения лексемы Интернет зафиксировано в обновляемом и онлайн-представленном «Большом толковом словаре русского языка» С.А. Кузнецова: «ИНТЕРНЕТ [тэрнэ], -а; м. [англ. Internet от international net — международная сеть]. 1. [с прописной буквы] Всемирная компьютерная сеть (информационная система связи, объединяющая множество компьютеров во всем мире). Выйти в И. Открыть собственный сайт в Интернете. 2. Разг. Система связи для получения и передачи цифровой информации. Заплатить за и. Установить дома и.»[15]. Хотя здесь зафиксировано и интерпретировано лишь 5 интернет-дериватов: интернет-аудитория; интернет-аукцион; интернет-версия; интернет-издание и интернет-карта[16].
Таким образом, отмечается невысокий темп пополнения интерпретирующих язык лексикографических ресурсов — толковых словарей русского языка. Естественным образом толковые словари ориентированы на узус языка и актуальность того или иного неологизма для толкового словаря должна соотноситься с его частотностью и проникновением в публицистику и художественную литературу. Пока таких норм и их лингвистического обоснования, к сожалению, нет.
- Презентация деривационных реализаций лексемы Интернет в регулирующем речевую практику русского языка ресурсе «Русский орфографический словарь» под редакцией В.В. Лопатина и О.Е. Ивановой[17] существенно превосходит данные вышеупомянутых толковых словарей[18]. Естественным образом многие носители языка сверяют параметры своей речи с общепринятыми ориентирами в виде орфографических словарей. Особенно последовательно такая сверка происходит в процессе обучения, но не заканчивается с окончанием обучения в школе или университете. Орфографическая обеспеченность языка играет важную роль в поддержании его стабильности и верификации новаций, которые в любом социуме неизбежны. Для анализа современной новационно-насыщенной речевой сферы очевидным фокусом исследовательского интереса оказывается лексема Интернет. Учитывая немного более, чем двадцатилетнюю историю самого феномена «Интернет», логична оценка происходящих с интернет-обусловленной лексикой изменений, скажем, за 10 лет — например, за период 2014–2024 гг. Динамика репрезентации интернет-дериватов в наиболее представительном из орфографических русскоязычных словарей — «Русском орфографическом словаре» — является показательной. Так, согласно проведенному мониторингу — с 2014 по 2024 г. — состав интернет-лексики в данном ресурсе вырос почти в 4,5 раза: с 44 единиц до 193. На сегодняшний день это следующий набор лексики: доинтернетовский; интернет-автор; интернет-агентство; интернет-аддикт; интернет-аддикция и др.[19]
Из 194 единиц «Русского орфографического словаря» — 186 (≈ 96 %) существительных (+ 1 словосочетание сеть интернет), 6 (≈ 3 %) прилагательных и 1 (≈ 0,5 %) глагол. Этот состав разительно отличается от существующих пропорций речевой практики — согласно им в речи сопоставимое существительных, прилагательных и глаголов (Андреев, 2014; Altmann, 2014 и др.). Неологизмы-существительные, как можно видеть, являются наиболее заметным в динамике русского языка классом лексики.
Модель «понятийного облака» (визуализация совокупности семантически связанной лексики) данного набора единиц оказывается достаточно разнообразной, охватывая все стороны интернет-функциональности (рис.).
Визуализация понятийной совокупности интернет-лексики
Источник: выполнено Е.С. Астапкиной, А.А. Барковичем с помощью WordsCloud.
Visualization of Internet lexis cognitive system
Source: completed by E.S. Astapkina, A.A. Barkovich with WordsCloud.
В составляющую данную модель лексику вошли 19 пар однокоренной лексики, например, интернет-пейджер и интернет-пейджинг, интернет- страхование и интернет-страховка; а также 2 триады, в частности, интернет- провайдер, интернет-провайдерский и интернет-провайдинг; интернет-журнал, интернет-журналист и интернет-журналистика. В словарь попала и трехкомпонентная триада: интернет-пресс-конференция, интернет-пресс- служба и интернет-пресс-центр. Все это свидетельствует о несовершенстве критериев отбора интернет-лексики для словаря: вряд ли потенциальный пользователь словаря, знакомый с написанием сложного слова интернет-журнал, будет нуждаться в инструкциях по написанию единиц интернет-журналист и интернет-журналистика. Так, однокоренные дублеты интернет- страница и интернет-страничка; интернетчик и интернетчица, а также подобные им здесь необязательны. Также вряд ли целесообразна для словаря подача единиц во множественном числе: интернет-торги и интернет-материалы — и лексема торг, и лексема материал обычны в единственном числе в русском языке. Можно отметить и прямое дублирование словарных статей (4 случая): интернет-зависимость, интернет-предприниматель, интернет- соединение и интернет-сообщение. Но наиболее существенно, пожалуй, отсутствие в данном словаре множества уже присутствующей в русской речи лексики — о чем подробнее ниже.
- Но не только сама лексема Интернет является маркером развития соответствующей коммуникационной семантики, развивается и целый ряд связанных с ней лексических единиц. В референтной широкой лексико-семантической области можно отметить, в частности, такие глобальные составляющие, как виртуальность, контент. Подошли бы для анализа и многие другие, однако описание всего многообразия референтной лексики не предполагается форматом статьи. Характерно, что в вышеприведенной нейросетевой модели и сами лексемы контент, виртуальный, и связанные с ними единицы, отражающие соответствующие концепты, закономерно присутствуют. Впрочем, ядро интернет-концептосферы Интернет явно доминирует в русском языке, и лексикографическая фиксация единиц, образованных от основ контент-, виртуальн-, оказались не особенно многочисленны. Хотя, как можно видеть (ниже), в речи уже появилось более 1500 вариантов развития основы виртуальн-, которые, в частности, зафиксированы в НКРЯ (при этом содержащих основу интернет- — более 6000 словоупотреблений).
Словарная динамика «виртуальной» лексики значительно уступает «интернетной», но тоже достаточно ярко выражена. В частности, к 2014 г. в русском языке стадии словарной фиксации достигли лишь 5 неологизмов, соответствующих семантике виртуальность: виртуалист, виртуалистика, виртуалистический, виртуальность, виртуальный[20]. А в 2024 г. в этом же источнике было зафиксировано уже 10 «виртуальных» единиц, вдвое больше: виртуал, виртуалист, виртуальный, виртуализация, виртуалистика, виртуальность, виртуализованный, виртуалистический, виртуализированный, виртуализироваться[21]. Здесь словарными новациями 2024 г. оказались единицы виртуал, виртуализация, виртуализованный, виртуализированный, виртуализироваться. Динамика процесса явная и она в словаре, так или иначе, отражается. Конечно, ее темп не очень высок, но двукратный прирост дериватов от основы -виртуал- можно констатировать.
Статистика языковых корпусов о реальном функциональном потенциале «виртуальных» лексем помогает составить более полное представление об их востребованности. Так, среди 229 968 798 словоупотреблений в НКРЯ обнаружено 1592 варианта использования основы виртуальн-, что указывает на значительный потенциал его словообразовательного развития[22]. В то же время, исходя из широчайшей сочетаемостной активности лексемы виртуальный, можно предположить, что основным развитием ее деривации будет синтаксическое, в частности, в составе словосочетаний как виртуальный / -ае, / -ая: виртуальный процесс, виртуальное хранилище, виртуальная реальность и др.). Так, словосочетание виртуальная реальность уже присутствует в десятках словарных источников: для русского языка это около 30 источников[23].
Похожая ситуация наблюдается и в отношении деривационной активности основы -контент-. Начав с единичной фиксации в русскоязычном словаре дериванта контент- в 2013 г. — контент-анализ, к 2024 г. русская лексикография обогатилась дополнительными единицами: контент-менеджер, контент-редактор, контент-провайдинг, контент-производитель, контентно [ориентированный][24].
Насколько эти единицы являются действительно новыми — вопрос дискуссионный. На самом деле, и анализ, и менеджер, и редактор, и производитель, очевидно, входят в активный лексикон русского языка уже достаточно давно. Полноценной инновацией здесь можно считать, видимо, только провайдинг — и, соответственно, контент-провайдинг.
- Информативен лингвистически значимый мониторинг речевого функционирования интернет-лексики как фона ее лексикографической репрезентации (Гусейнова и др., 2022; Лацкова, 2021; Шишков, 2023). Достаточно много релевантной информации об интернет-обусловленном дискурсе содержится в НКРЯ. Уже в 2014 г. корпус-менеджер «НКРЯ» насчитал в «Основном корпусе» «2305 документов, 6468 вхождений» лексики с морфемой -интернет-. Первые сто страниц «выдачи» корпуса по запросу «*интернет*» содержали 135 «интернет»-слов, многие из которых использовались неоднократно. Это были следующие единицы: интернет-адрес, интернет-андеграунд, интернет-аудитория и др.[25] В «Русский орфографический словарь» на тот момент вошло лишь 44 единицы, и, конечно, на этом примере можно видеть, насколько велик темп отставания словаря, так и не зафиксировавшего и по прошествии 10 лет большинство единиц из данного пространного перечня. Разумеется, в речевой практике сегодня представленность интернет-лексики весьма многообразна, хотя порой и экзотична: например, вряд ли станут частотными единицы из вышеприведенного перечня — наподобие интернет-женщина, интернет-Италия и др. С другой стороны, корпус тоже не отражает разнообразие речи на 100 %. Так, в текстах НКРЯ пока не фиксируются (в словарях их тоже нет) такие уже распространенные единицы, как, например, интернет-эквайринг, интернет-билет и другие, во множестве находящиеся посредством интернет-поиска:
Компания WEBPAY предлагает гибкие тарифы на интернет-эквайринг, которые позволят учесть ваши индивидуальные потребности и условия сотрудничества (https://webpay.by/cards).
Клиентам, которые приобрели интернет-билет, на электронную почту придет письмо об актуальных изменениях (https://www.kvitki.by/rus/novosti-perenosy).
В немалой степени встречаемость подобных ситуативных новаций обусловлена спецификой самой речи. Здесь аннотированный корпус позволяет обобщить огромный массив данных, релевантных для графического, статистического и иного моделирования. Так, немалый интерес для лингвистического моделирования представляет доступная в НКРЯ информации о жанровой принадлежности текстов с «интернет-»-компонентом, о типе текстов, тематике и даже о гендере авторов текстов. В жанровом аспекте наиболее интернет-востребованными оказались тексты публицистического типа, «публицистика / нехудожественная», — 4348, далее выделялась проза типа «учебно-научная / нехудожественная» — 799 и «электронная коммуникации / нехудожественная» — 542 словоупотребления. В текстах художественной литературы интернет-слова встретились только в 336 контекстах[26]. Подобная частотность подтвердила большую лексическую динамику публицистики и, наоборот, консерватизм художественной литературы.
Первые четыре позиции в рейтинге наиболее распространенных типов текста интернет-обусловленного дискурса заняли рубрики «статья», «заметка», «форум» и «интервью»: соответственно, с 3364, 528, 456 и 390 словоупотреблениями. Только после этих категорий в рейтинг вошли «романы», «монографии», «рецензии», «рекламные объявления» и другие, более консервативные рубрики: 196, 131, 128, 112 словоупотреблений, соответственно. Аналогично, статистически приоритетными для компонента «Интернет» оказались тексты тематики «политика и общественная жизнь» — 1176 единиц, «наука и технологии» — 848, «бизнес, коммерция, экономика, финансы» — 827 словоупотреблений. Во втором ряду рейтинга расположились тексты тематики «частная жизнь», содержавшие 373, а также «искусство и культура» — 324 интернет-словоупотребления и т.д.[27]
Мужчины использовали «интернетную» лексику намного чаще, чем женщины: в 972 против 423 «документов» и это были 3114 словоупотребления против 1020 (НКРЯ). Такого рода статистика свидетельствует о терминологичности интернет-словоупотребления и косвенно подтверждает большую активность в IT-сфере мужчин. Такого рода обобщения — новое знание, синтезировать которое можно с помощью компьютера (за доли секунды) или посредством работы академического коллектива (за несколько лет).
Лексикографический потенциал корпусов текстов был востребован с момента их появления в лингвистической практике. Традиции русской лексикографии значительно укрепились с появлением компьютеров[28], например, «Частотный словарь русского языка» под редакцией Л.Н. Засориной объективно отразил речь середины ХХ в. как раз на базе компьютерного представления совокупности текстов: «Словарь представляет собой свод статистических данных о лексическом составе современного русского языка. Словарь составлен на основе обработки средствами вычислительной техники одного миллиона словоупотреблений, что дало около 40 тыс. единиц словаря»[29]. Тогда само слово «корпус» еще не укоренилось в русской лингвистике, но факт создания и использования ресурса, который сейчас обоснованно назвали бы «корпусом», состоялся. Сегодня тесная ассоциированность корпусного формата со словарями вполне позволяет рассматривать корпусы текстов в качестве лексикографических источников[30]. Впрочем, это не исключает необходимости поддержания в соответствующем реалиям языковой практики виде и, собственно, «словарей».
Заключение
Необходимо отметить огромный потенциал совершенствования базовой для языкознания лексикографической деятельности. Так, было отмечено, что регулирующие языковую практику словари отражают происходящие изменения шире и полнее, чем словари интерпретирующей направленности — толковые. На 2024 г. в орфографическом словаре русского языка появилось 194 интернет-неологизма, в толковых словарях таких неологизмов пока мало, лишь в один из них было включено 18 интернет-неологизмов. Разница в реализованной репрезентации превысила десятикратный размер: регулирующие языковую практику словари на порядок объективнее отражают динамику обновления языка. Показателен и темп обновления проанализированного детально орфографического словаря — за 10 лет число интернет-неологизмов в нем выросло с 44 до 194 единиц — почти в 4,5 раза. Тем не менее, потенциал данной лексики намного выше, о чем свидетельствует корпусный анализ и интернет-поиск. Полученные данные помогли составить обоснованное представление о динамике интернет-лексики и специфике ее отражения в лексикографических ресурсах.
Обоснованность ориентации словарных ресурсов на речевую практику была и остается приоритетом лингвистического описания языка. На основе репрезентативного материала нами всесторонне изучены параметры лингвистического обеспечения интернет-коммуникации. Практика такого рода традиционно опирается на лексикографические ресурсы: в данном аспекте показательной является фиксация референтных языковых единиц в интерпретирующих речевую практику словарях и регулирующих ее — толковых и орфографических соответственно. Информативен оказался обзор речевой практики, учитывавший как представленность интернет-лексики в корпусном формате и интернет-дискурсе, так и специфику самого контента, его субъектные и объектные характеристики. Было проведено моделирование полученных результатов и на этой основе было сформировано синтетическое обобщение о высокой динамике обновления интернет-дискурса, задействовании в процессе обновления существующих в языке типичных моделей.
В целом объектная база интернет-дискурса весьма широка и разнообразна и требует дальнейшего изучения. В рамках жанра научной статьи данная проблематика не может быть описана более подробно из-за ограничений формата. Выполненная лингвистическая характеристика русскоязычного интернет-дискурса, несомненно, полезна для дальнейшей объективной научной репрезентации современной речи.
[1] W3Techs — extensive and reliable web technology surveys. URL: http://w3techs.com/ (accessed: 04.12.2024).
[2] Русский орфографический словарь (ок. 200000 слов) / под ред. В.В. Лопатина, О.Е. Ивановой. М. : Аст-пресс книга, 2013. 896 с.
[3] Ефремова Т.Ф. Современный толковый словарь русского языка : в 3 томах. М. : АСТ, 2006. 3312 с. Кузнецов С.А. Большой толковый словарь русского языка. СПб. : Норинт, 2000. 1536 с. Ожегов С.И., Шведова Н.Ю. Толковый словарь русского языка : 72500 слов и 7500 фразеологических выражений. М. : Азъ, 1994. 907 с. Ушаков Д.Н. Толковый словарь современного русского языка. М. : Альта-Принт : Дом. XXI век, 2008. 510 с.
[4] Тезаурус русского языка RuWordNet. URL: https://www.ruwordnet.ru/ (дата обращения: 04.12.2024).
[5] Ляшевская О.Н., Шаров С.А. Частотный словарь современного русского языка на материалах Национального корпуса русского языка. М. : Азбуковник, 2009. 1090 с. Полякова Г.П. Частотный словарь языка газеты. М. : Изд-во Моск. ун-та, 1971. 281 с. Харакоз П.И. Частотный словарь современного русского языка. Фрунзе : Мектеп, 1971. 180 с. Частотный словарь общенаучной лексики / под общ. ред. Е.М. Степановой. М. : Изд. Моск. ун-та, 1970. 87 с. Частотный словарь русского языка : около 40 000 слов / под ред. Л.Н. Засориной. М. : Русский язык, 1977. 934 с. Частотный словарь современного русского языка / под ред. Л. Лённгрена // Acta Universitatis Upsaliensis, Studia Slavica Upsaliensia 32. Uppsala, 1993. 188 р. Штейнфельдт Э.А. Частотный словарь современного русского литературного языка : 2500 наиболее употребительных слов. Таллин : Юхиселу. 1963. 315 с.
[6] Национальный корпус русского языка. URL: http://www.ruscorpora.ru/ (дата доступа: 04.12.2024).
[7] Русский орфографический словарь (ок. 200000 слов) / под ред. В.В. Лопатина, О.Е. Ивановой. М. : Аст-пресс книга, 2013. 896 с.
[8] Тезаурус русского языка RuWordNet. URL: https://www.ruwordnet.ru/ (дата обращения: 04.12.2024).
[10] Midjorney. URL: https://www.midjourney.com/home/ (accessed: 04.12.2024).
[11] Ожегов С.И., Шведова Н.Ю. Толковый словарь русского языка : 72500 слов и 7500 фразеологических выражений. М. : Азъ, 1994. 907 с.
[12] Ушаков Д.Н. Толковый словарь современного русского языка. М. : Альта-Принт ; Дом. XXI век, 2008. 510 с.
[13] Ефремова Т.Ф. Современный толковый словарь русского языка : в 3 томах. М. : АСТ, 2006. 3312 с.
[15] Кузнецов С.А. Большой толковый словарь русского языка. СПб. : Норинт, 2000. 1536 с.
[17] Русский орфографический словарь (ок. 200000 слов) / под ред. В.В. Лопатина, О.Е. Ивановой. М. : Аст-пресс книга, 2013. 896 с.
[18] Ефремова Т.Ф. Современный толковый словарь русского языка : в 3 томах. М. : АСТ, 2006. 3312 с. Кузнецов С.А. Большой толковый словарь русского языка. СПб. : Норинт, 2000. 1536 с. Ожегов С.И., Шведова Н.Ю. Толковый словарь русского языка : 72500 слов и 7500 фразеологических выражений. М. : Азъ, 1994. 907 с. Ушаков Д.Н. Толковый словарь современного русского языка. М. : Альта-Принт: Дом. XXI век, 2008. 510 с.
[19] Русский орфографический словарь (ок. 200000 слов) / под ред. В.В. Лопатина, О.Е. Ивановой. М. : Аст-пресс книга, 2013. 896 с.
[20] Русский орфографический словарь (ок. 200000 слов) / под ред. В.В. Лопатина, О.Е. Ивановой. М. : Аст-пресс книга, 2013. 896 с.
[21] Русский орфографический словарь (ок. 200000 слов).
[22] Национальный корпус русского языка. URL: http://www.ruscorpora.ru/ (дата доступа: 04.12.2024).
[23] Словари и энциклопедии на Академике. URL: http://academic.ru/ (дата доступа: 04.12.2024).
[24] Русский орфографический словарь (ок. 200000 слов).
[25] Национальный корпус русского языка.
[27] Национальный корпус русского языка.
[28] Полякова Г.П. Частотный словарь языка газеты. М. : Изд-во Моск. ун-та, 1971. 281 с. Харакоз П.И. Частотный словарь современного русского языка. Фрунзе : Мектеп, 1971. 180 с. Частотный словарь общенаучной лексики / под общ. ред. Е.М. Степановой. М. : Изд. Моск. ун-та, 1970. 87 с. Штейнфельдт Э.А. Частотный словарь современного русского литературного языка : 2500 наиболее употребительных слов. Таллин : Юхиселу, 1963. 315 с.
[29] Частотный словарь русского языка : около 40 000 слов / под ред. Л.Н. Засориной. М. : Русский язык, 1977. 934 с.
[30] Ляшевская О.Н., Шаров С.А. Частотный словарь современного русского языка на материалах Национального корпуса русского языка. М. : Азбуковник, 2009. 1090 с. Частотный словарь современного русского языка / под ред. Л. Лённгрена // Acta Universitatis Upsaliensis, Studia Slavica Upsaliensia 32. Uppsala, 1993. 188 р.
Об авторах
Екатерина Сергеевна Астапкина
Белорусский государственный университет
Email: astapkina@gmail.com
ORCID iD: 0009-0005-5941-1730
кандидат филологических наук, доцент кафедры германского языкознания
Республика Беларусь, 220004, г. Минск, пр. Независимости, д. 4Александр Аркадьевич Баркович
Белорусский государственный университет
Автор, ответственный за переписку.
Email: barkovichaa@gmail.com
ORCID iD: 0000-0001-8469-8431
SPIN-код: 5171-1479
Scopus Author ID: 57208124708
ResearcherId: W-2342-2018
доктор филологических наук, доцент, заведующий кафедрой теоретического и славянского языкознания
Республика Беларусь, 220004, г. Минск, пр. Независимости, д. 4Список литературы
- Азимов Э.Г., Кулибина Н.В., Ван В. Лингводидактический потенциал социальных сетей в обучении русскому языку как иностранному // Русистика. 2023. Т. 21. № 2. C. 133–147. https://doi.org/10.22363/2618-8163-2023-21-2-133-147 EDN: BAUPZH
- Андреев С.Н. Соотношение частей речи в романе А.С. Пушкина «Евгений Онегин» // Квантитативная лингвистика. 2014. Т. 4. С. 5–19. EDN: TEAUSN
- Баркович А.А. Функциональность диады «коммуникационный — коммуникативный»: дискурсивный аспект // Вестник Томского государственного университета. Филология. 2015. № 5 (37). С. 37–52. https://doi.org/10.17223/19986645/37/3 EDN: VCPSFD
- Баркович А.А. Русско-белорусская межъязыковая интерференция и трасянка: компьютерно-опосредованная верификация и научная рефлексия // Вестник Томского государственного университета. Филология. 2021. № 69. С. 5–28. https://doi.org/10.17223/19986645/69/1 EDN: COMSFX
- Виноградова В.Н. Система русского словообразования в функционально-стилистическом аспекте. М. : Инфотех, 2012. 336 с.
- Вязовская В.В., Данилевская Т.А., Трубчанинова М.Е. Интернет-ресурсы в обучении русскому языку как иностранному: ожидания vs реальность // Русистика. 2020. Т. 18. № 1. C. 69–84. https://doi.org/10.22363/2618-8163-2020-18-1-69-84 EDN: BAUPZH
- Голев Н.Д. Лексическая реализация как функциональная характеристика словообразовательной системы русского языка и количественные параметры ее описания // «Осмь десять» : сб. науч. статей к 80-летию И.С. Улуханова. М. : Азбуковник, 2015. С. 183–193.
- Горошко Е.И. Возникновение лингвистики новых медиа и перспективы развития этого направления // Гипертекст как объект лингвистического исследования. Самара : Изд-во Самарского государственного социально-педагогического ун-та, 2013. С. 27–42.
- Гусейнова Л.Д., Дугалич Н.М., Ломакина О.В., Нелюбова Н.Ю., Эбзеева Ю.Н. Отражение социокультурного контекста в русских, французских и азербайджанских интернет-мемах // Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика. 2022. Т. 13. № 4. C. 1020–1043. https://doi.org/10.22363/2313-2299-2022-13-4-1020-1043 EDN: INAPKU
- Дубина Л.В. Тенденции развития русского языка в условиях интернет-коммуникации // Вестник ТГПУ. 2013. № 2. С. 177–181.
- Кондрашева Е.В., Тинина А.О. Новая лексика языка интернета: способы образования, причины появления // Эпоха науки. 2019. № 18. С. 134–139. https://doi.org/ 10.24411/2409-3203-2018-11830
- Лацкова М. Морфологические особенности лексических единиц английского происхождения в современном русском сленге: словарный и корпусный анализ // Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика. 2021. Т. 12. № 3. C. 632–651. https://doi.org/10.22363/2313-2299-2021-12-3-632-651
- Лушникова Е.В. Экстра- и интралингвистические факторы формирования компьютерного жаргона (на материале русского, английского и французского языков) : автореф. дис. … канд. филол. наук. Саратов, 2003. 23 с.
- Мокиенко В.М. О тематико-идеографической классификации фразеологизмов // Словари и лингвострановедение / ред. Е.М. Верещагин. М. : Русский язык, 1982. С. 108–121.
- Пешё М. Контент-анализ и теория дискурса // Квадратура смысла: Французская школа анализа дискурса. М. : Прогресс, 1999. С. 302–337.
- Синишина О.О. Интернет-лексика в современном китайском языке // Вестник Московского университета. Серия 13: Востоковедение. 2014. № 3. С. 57–62. https://doi.org/10.12731/2077-1770-2020-6-24-36 EDN: SNGAON
- Тичер С., Мейер М., Водак Р., Веттер Е. Методы анализа текста и дискурса / пер. с англ. Харьков : Гуманитарный центр. 2009. 354 с.
- Тошович Б. Интернет-стилистика. М. : Наука, 2015. 238 с.
- Шишков М.С. Формирование нарративной стратегии в рассказах билингвов на русском языке: корпусное исследование // Русистика. 2023. Т. 21. № 3. C. 321–340. https://doi.org/10.22363/2618-8163-2023-21-3-321-340 EDN: SGSQVB
- Aichner T., Jacob F. Measuring the degree of corporate social media use // International Journal of Market Research. 2015. Vol. 2. No. 57. Pp. 257–275. https://doi.org/10.2501/IJMR-2015-018
- Altmann G. Supra-sentence levels // Glottotheory. 2014. Vol. 5. No. 1. Pp. 25–39. https://doi.org/10.1515/glot-2014-0002
- Barkovich A. Informational linguistics: computer, internet, artificial intelligence and language // 2019 IEEE 1st International Conference on Artificial Intelligence in Information and Communication (ICAIIC 2019). Japan, 2019. Pp. 008–013. https://doi.org/10.1109/ICAIIC.2019.8668989
- Carr N. The shallows: what the internet is doing to our brains. New York : W.W. Norton & Company, 2010. 276 р.
- Crystal D. Language and the Internet. Cambridge : Cambridge University Press, 2001. 272 p.
- Garfinkel S. Database nation: the death of privacy in the 21st century. Sebastopol : O’Reilly & Associates, 2000. 336 p.
- McLuhan M. Understanding media: the extensions of man. New York : McGraw-Hill, 1964. 360 p.
- Pinker S. The language instinct. New York : Harper Perennial Modern Classics, 2000. 525 p.
- Sapone L. Moving fast and breaking things: an analysis of social media’s revolutionary effects on culture and its impending regulation // Duquesne Law Review. 2021. Vol. 59. Pp. 362–384.
- Schiffrin D. From linguistic reference to social reality // Discourse and identity / ed. by A. de Fina, D. Schiffrin, M. Bamberg. Cambridge : Cambridge University Press, 2006. Pp. 103–131.
- Tang J., Chang Y., Aggarwal C., Liu H. A survey of signed network mining in social media // ACM Computer Surveys (CSUR). 2016. Vol. 49. Pp. 1–37. https://doi.org/10.1145/2956185
- Widdowson H. Applied linguistics, interdisciplinarity, and disparate realities. Clevedon, UK : Multilingual Matters, 2005. 327 p.
Дополнительные файлы











