Словарь языка писателя и толковые словари литературного языка: системные и количественные соотношения

Обложка

Цитировать

Полный текст

Аннотация

В настоящей статье рассматривается проблема соотношения лексики толковых словарей русского языка разного типа, по С.И. Ожегову, с лексикой, представленной в авторском словаре - Словаре языка Пушкина. Системные параметры соотношения выявлялись в процессе анализа Большого Академического словаря (БАС), Малого академического словаря (МАС), Словаря языка Пушкина и двух произведений А.С. Пушкина: «Пиковой дамы» и «Капитанской дочки». Показано, что одним из эффективных приёмов исследования системных свойств вероятностных объектов, таких как лексический состав языка, является вычисление распределения. Показано, что распределение слов по количеству значений является одной из существенных структурных характеристик лексики. Вводится понятие «семантического триггера» как носителя имплицитной семантической информации, запускающего в сознании носителя языка поиск релевантного значения полисемичного слова. Проведенный анализ соотношения между словарём текста, сводным словарём языка писателя и общеязыковым словарём по степени полисемичности представленной в них лексики показал, что характерным является последовательное нарастание средних характеристик значения на слово в словаре текста до максимума значений в БАС, что связано с постепенным накоплением значений, реализующихся во всё более обширных текстовых массивах и более разнообразных контекстах. Наблюдаемое усиление зоны среднеполисемичных слов в общеязыковом словаре в сравнении с идиолектным словарём является отражением того, что наиболее общими, повторяющимися для словарей каждой из частных сфер (вслед за служебными словами) являются общеупотребительные и широкотематические слова, занимающие среднеполисемичную зону.

Полный текст

Памяти
Геннадия Прокопьевича Мельникова и
Анатолия Анатольевича Поликарпова

Введение

В современном языкознании интерес к проблемам системной организации лексики проявляется постоянно [1–7]. Элементы лексической системы подвержены воздействию различных факторов. Некоторые из факторов являются случайными, точнее, влияющими на один или несколько элементов. Другие факторы влияют на большие подсистемы лексики. Повторяясь в каждом элементе такой подсистемы, результаты воздействия различных внешних и внутренних факторов усиливают друг друга, как бы «резонируют»; случайные же факторы взаимно нейтрализуют друг друга. В этом проявляется специфика системных свойств вероятностных объектов, в том числе, словарного состава языка. «Асистемные» факты [7] являются проявлением вероятностного характера системности лексики.

Одним из эффективных приёмов исследования системных свойств вероятностных объектов является математическая статистика, в частности, вычисление распределения. В распределении устанавливается соотношение количества элементов, обладающих интересующим нас признаком в разной степени. Таким образом, распределение — одна из весьма показательных структурных характеристик организации вероятностного объекта [8]. Решающее значение имеет сам предварительный выбор наиболее информативных, наиболее системно значимых признаков среди всех признаков системы. Только эвристически верный выбор и последующая интерпретация полученных распределений придаёт такой структурной характеристике, как распределение, системную значимость.

Соотношение трех типов словарей  по потенциальной полисемии

Важным системно-значимым признаком лексических единиц языка является полисемичность. Полисемия — это проявление сущности знака как семантического триггера, носителя имплицитной семантической информации. В процессе коммуникации отправителем для обозначения того или иного ситуативно-конкретного смысла подбирается из имеющихся в языке наиболее подходящий знак. Он опознаётся получателем, и получатель должен среди нескольких потенциальных значений знака выбрать согласно контексту наиболее подходящий лексико-семантический вариант. Получатель с помощью контекстуальных и ситуативных «подсказок» поднимает, какое значение и, далее, какой ситуативно-конкретный смысл имелся в виду, на что отправитель знака хотел «навести» получателя [1; 2].

В силу фундаментальной значимости момента триггера-опознания в любом акте общения нагруженность того или иного знака типовыми функциями, т.е. значениями, из которых производится выбор в каждом отдельном акте коммуникации, является одной из наиболее важных характеристик любой знаковой единицы языка.

Чем более многозначна знаковая единица, тем выше её системная значимость. Ядро словарного состава языка составляют слова с максимальной полисемией. Чем меньше многозначность, тем ниже системная значимость и речевая употребительность знаковой единицы [9]. Однозначные слова располагаются на периферии словарного состава языка, наименее употребительны, наименее значимы для него.

В определённом смысле можно говорить о том, что однозначные слова находятся на границе между языковым и неязыковым мирами. Однозначные единицы со своими исходными, предложенными внеязыковой практикой значениями, не испытавшие в полной мере адаптирующего воздействия языковой системы, это только «кандидаты» на роль собственно языковых единиц. Такого рода «кандидатов» намного больше, чем полноправных языковых лексических единиц, т.е. тех, которые имеют два значения или более. Например, в Большом Академическом словаре (БАС) однозначных слов 76382, а слов с 2 и более значениями — 44099. Такое же соотношение между однозначными словами наблюдается и в других языках — английском, китайском, вьетнамском, турецком, венгерском, финском.

Множество однозначных слов — открытая категория, наиболее неопределённая величина в любом языке в силу наибольшей случайности воздействия на словарь внеязыковой реальности именно в этой его части, что приводит к наибольшим субъективным колебаниям составителей словаря при отборе слов в данное множество. Это же обстоятельство, в частности, делает вопрос: «Сколько слов в языке?», некорректным. Более корректным был бы вопрос: «Сколько слов в языке с двумя и более значениями?». Эта величина весьма последовательно и точно связана с типом языка и с типом словаря [10].

Распределение слов по количеству значений является одной из существенных структурных характеристик лексики. В том, какой удельный вес занимают в словаре единицы с разным количеством значений, отображается тип языка. Чем более аналитическим является данный язык, тем более многозначной в целом лексикой он располагает, тем больший удельный вес многозначная лексика занимает в совокупном словаре данного языка [2; 10].

Если соотношение объёмов групп слов с данным количеством значений представить графически в виде так называемого спектрально-полисемического распределения, где по оси абсцисс откладывается количество слов, имеющих определённое количество значений (в логарифмическом масштабе), а по оси ординат — количество значений (в том же масштабе), то указанное соотношение для аналитических языков (таких, как вьетнамский, английский) в сравнении с синтетическими языками (такими, как русский) будет выражаться в более крутом общем угле наклона всего распределения к оси абсцисс.

Максимальные величины количества значений у слов аналитического языка будут значительно выше, а число слов в каждой из групп с малым количеством значений будет существенно меньше, чем в словаре относительно синтетического языка.

Это соотношение между словарями разных по типу языков является весьма устойчивым, какой бы по объёму толковый словарь в каждом из них ни взять. Толковые словари одного языка, но разного объёма, демонстрируют тождество по соотношению объёмов групп слов с определённым количеством значений, что выражается в одинаковом угле наклона распределения любого толкового словаря данного языка, в принципиальной параллельности этих распределений.

Наиболее наглядный материал в этом отношении представляет русская лексикография. В ней практически выработаны и теоретически осмыслены три основные типа толковых словарей [11]. Большой словарь, ориентирующийся на максимально полное покрытие всего словарного богатства русского языка на глубину в 150–200 лет, то есть на весь период, представленный текстами, которые продолжают читаться, продолжают быть понятными, — таковым является БАС; средний словарь ориентирует на покрытие всего актуального, т.е. употребляемого и сейчас словарного состава русского языка — таковым является толковый словарь русского языка под редакцией Д.Н.Ушакова и 4-х томный словарь современного русского языка под редакцией А.П. Евгеньевой (МАС); малый, краткий словарь ориентирует на покрытие ядра языка, наиболее употребительной части словарного запаса современного языка — таковым является словарь русского языка С.И. Ожегова.

Исходя из этих задач и из определения состава основных толковых словарей русского языка, предполагается, что каждый из более ограниченных по своему составу словарей должен быть частью некоторого более крупного словарного образования — как по словнику, так и по полноте и степени подробности представления значения, что в целом соответствует реальному соотношению между четырьмя указанными словарями, но с определённой оговоркой. Она заключается в том, что полного вложения словаря Ожегова как самого краткого в МАС или словарь Ушакова и даже в БАС, а МАС и словаря Ушакова в БАС не происходит. Например, в словаре Ожегова присутствует 1254 слова, отсутствующие в МАС, и 1501 слово, отсутствующее в словаре Ушакова. Наконец, в словаре Ожегова есть 1033 слова, не представленных в БАС. И это несмотря на то, что БАС включает в себя более 120 тысяч слов, а словарь Ожегова — всего лишь 57 тысяч слов.

Эти отношения неполного вложения малых словарей в большие словари не противоречат идее соотношения малых и больших словарей как части и целого. Наблюдаемые расхождения общих принципов соотношения больших, средних и малых словарей с реальным положением дел, говорят лишь о том, что эти принципы не могут быть представлены в идеальном виде в современной лексикографической практике. Лексикографической практике объективно свойственна некоторая неопределённость в реализации отбора источников, подбора словника и подготовке толкований слов. Любой из меньших по объёму словарей в той или иной степени ориентируется на состав более полных словарей, является в определённом смысле его редуцированным вариантом — как по объёму словника, так и по объёму толкования попавших в словник слов, что и отражается в пропорциональном уменьшении объёма словника и объёма толкований и, в конечном счёте, в параллельности спектрально-полисемических распределений разных по объёму словарей. Примером такого рода является работа С.И. Ожегова над словарём русского языка. В качестве одного из основных источников был взят словарь Ушакова (см. Предисловие к Словарю Ожегова, 10 издание, 1972, с. 9). Однако основным, наиболее важным источником для любого словаря является живая, актуальная словарная данность. На неё, в конечном счёте, ориентируется любой лексикограф, ею он проверяет всё то, что ему известно из готовых лексикографических источников, из неё же он черпает то, чего не достаёт в самом полном по объёму из известных опубликованных словарей. Ввиду этого уже первое издание Словаря Ожегова (1949 г.) «не было простым сокращением Словаря Ушакова: наблюдения над развитием современного языка позволили уточнить определения значений слов, их стилистические характеристики, нормативные рекомендации, вопросы отбора слов. В словаре 1952 г. внесены были многие уточнения в этом направлении» (см. предисловие к словарю Ожегова, 1972, с. 9). Например, в четвертой редакции Словаря Ожегова (переиздание в авторской редакции 2011 г.) среди тех 1033 слов, которые отсутствуют в БАС, представлены такие слова: волжанин, венерический, заворот, мертвецкий, соскребать, чертовски, щипковый и др., которые, видимо, только по случайным, объективно-вероятным причинам не попали в БАС, но не прошли мимо внимания составителя и редакторов Словаря Ожегова. Таким образом, отношения между большим академическим словарём отдельного языка, средним и кратким словарями — это отношение полного словаря данного языка (с теми или иными оговорками в отношении исторической глубины литературного языка, отображаемого в словаре, и действия случайных факторов, сказавшихся в основном на отборе в словарь однозначных слов) с тем совокупным набором лексики, который находится в употреблении во всех функциональных сферах данного языка в данную эпоху (средний словарь) и с тем набором лексики, который составляет наиболее высоко употребительное ядро, общее достояние всех членов данного языкового коллектива (краткий словарь).

Эксперименты по выявлению индивидуального словарного знания показывают, что типовой носитель русского языка обладает знанием, по крайней мере, 80–110 тыс. слов. При этом было обнаружено, что объём зоны пересечения всех индивидуальных словарей равен 50–60 тыс. лексических единиц, а по качественному составу это пересечение соответствует словнику Словаря Ожегова на 80–90%. Это, по всей видимости, означает, что задача активной нормализации словоупотребления современного общества, ставящаяся перед краткими толковыми словарями, относится к той части совокупного словарного запаса, которая является общей, повторяющейся в индивидуальном запасе каждого члена социума, и только к ней. Этот вывод перекликается с высказанным П.Н. Денисовым мнением, что «словарь такого типа должен ориентироваться на средний культурный уровень предполагаемого потребителя. Другими словами, в кратком словаре типа Словаря Ожегова легко улавливается принцип ориентации на отдельного человека определённого культурного уровня. Словарь как бы уже не отражает лексику всего языка, а отражает лишь ту её часть, которая под силу отдельному человеку и ограничена кругом его знаний и культурных запросов» [12. С. 132].

Отношение между тремя указанными типами словарей — это не просто отношение целого и каких-то его частей, а отношение целого и его всё более суживающихся центральных частей. Совокупный словарь отдельного языка — это не хаотичное множество слов, а определённым образом структурированная, иерархически организованная система, в которой могут быть выделены зоны ближней и дальней периферии. По всей видимости, выделенные русской лексикографической традицией три типа толковых словарей соответствуют трём основным способам членения словарного состава по степени его центральности-периферийности: большой словарь покрывает и центр, и периферию; средний — покрывает центр и часть периферии, за исключением лексики, хотя и понимаемой, представленной в классических текстах, но не употребляемой в современном речевом обиходе; малый словарь включает в себя только ядерную лексику данного языка, высоко употребительную, известную практически всем её носителям. Совершенно очевидно, что в краткие словари не попадает лексика, характерная для тех или иных специальных сфер общения, для тех или иных отдельных групп или индивидов.

Ещё более существенно то, что и в средние, и в большие толковые словари не попадают окказиональные, в том числе индивидуальные слова, как не попадают и сугубо индивидуальные, окказиональные употребления общеизвестных слов. Таким образом, толковый словарь, независимо от его объёма, даже и самый полный — это не механическая фиксация всего словоупотребления эпохи или целого ряда эпох, а определённого рода обобщение, типизация наблюдаемых в реальной речи лексических фактов с целью их нормализации. Причём, как показывают оценки полисемических распределений, степень обобщения наблюдаемых лексических характеристик в среднем словаре в сравнении с малым, а в большом — в сравнении со средним и малым растёт, что отображается в слабом, но устойчивом, последовательном изменении геометрии графиков полисемических распределений, повышении степени выпуклости графиков полисемических распределений более полных словарей в сравнении с более краткими. По поводу данного отношения между толковыми словарями разного целевого назначения, разного объёма см. в [13]. Отсюда с очевидностью следует отсутствие необходимости фиксации в толковом словаре окказионализмов, слов-однодневок. Задача полной фиксации текущего словоупотребления может ставиться только в исследовательских целях, и то при описании ограниченных сфер и за ограниченный период их существования. Рассмотрение того, в каком соотношении находятся между собой разные толковые словари данного языка — лишь один, хотя на наш взгляд, и важнейший, аспект рассмотрения иерархического устройства лексикографического обеспечения отдельного языка. Важным является рассмотрение и того, какие коммуникативные сферы, в какой степени и какой вклад вносят в совокупный общеязыковой словник и в семантический объём слов. Или, наоборот, — как и по каким коммуникативным сферам распределяется накопленное предшествующей коммуникативной практикой богатство слов и их значений.

Разные коммуникативные сферы отличны друг от друга не только набором специфичных для них лексических единиц (при совпадении части ядерных лексических единиц), но и употреблением специфических значений общих для каждой из них единиц, их особым семантическим объёмом. Отношения словарей разных коммуникативных сфер — это отношения частичного взаимоналожения и частичного расхождения как по набору слов, так и по набору значений повторяющихся слов.

Предельным случаем словаря частной коммуникативной сферы является словарь языковой личности, словарь идиолекта. Роль таких словарей в развитии и пополнении общего словаря, их статус как реализаций языкового потенциала не рассматривались. В особенности важным представляется изучение лексики заметных идиолектов, таких, как язык писателя. Словарь писателя отображает одну из наиболее развитых форм участия языковой личности в современном ей процессе языкового развития. Словарь языка писателя в этом, как и в ряде других отношений, совершенно не изучен.

«Словарь языка Пушкина» (издание 1956–1961) [14] охватывает практически всю лексику, употреблённую в текстах А.С. Пушкина, представленных в первом академическом издании произведений А.С. Пушкина (издание 1937–1949) [15], за исключением лексического материала «Истории Петра», «Заметок при чтении «Описания земли Камчатки» С.П. Крашенникова», раздела «Наброски и планы поэм» и слов, представленных в вариантах основных текстов. В 1982 г. вышли «Новые материалы к словарю Пушкина» [16], которые включают лексику вариантов произведений Пушкина, не вошедшую в Словарь языка Пушкина или имевшую новые значения. В 2000 г. был переиздан дополненный вариант словаря [17].

Надо отметить, что каждое слово в данном словаре глубоко проанализировано с позиций семантики, однако, по словам составителей словаря, их целью было не истолковывать значение слова или дать ему реальный комментарий, а лишь разграничить отдельные значения, если их в словаре больше одного, то есть словарь не полон по описанию содержания значений. Если у однозначного слова значение совпадает с тем, которое существует в современном языке, то толкование такого слова обычно отсутствует. Но при каждом знаменательном слове (и ряде служебных) и их значениях приводится контекст, что позволяет подтвердить точность понимания. Кроме того, при каждом слове указывается его общая частота в пушкинских текстах в целом, частота каждого его отдельного значения, а для знаменательных слов, как правило, перечисляются все произведения, в которых употребляется слово, а также том, страница, строка, т.е. приводится точный адрес слова.

Особенностью словаря языка писателя, как словаря идиолекта, является стремление зафиксировать всё богатство, все нюансы словоупотребления данного автора. Однако в действительности это весьма сложная задача, и разные словари языка писателя реализуют её в разной степени. Словарь языка Пушкина, хотя и фиксирует значительную часть индивидуального лексического своеобразия А.С. Пушкина, не до конца реализует все возможности. Как говорится в Предисловии к указанному словарю, «Словарь языка Пушкина далеко не охватывает всех своеобразных, всех качественных особенностей пушкинского стиля в области фразеологического сочетания слов, а также их образного использования. Это словарь, прежде всего, языка, а затем — и то не в полной мере — индивидуального стиля Пушкина. Он часто не регистрирует тех смысловых осложнений, тех многообразных, а иногда каламбурных, намеренно противоречивых смысловых оттенков, которые получают слова в композиции художественного целого. Он не содержит каталога пушкинских образов, он, естественно, не берёт на себя задачу описания и использования развёрнутых метафор пушкинского стиля, иногда охватывающих целые стихотворения (см. Предисловие к Словарю языка Пушкина [14. С. 10]). Как видно из приведённой цитаты, Словарь языка Пушкина действительно не решает в полном объёме задач словаря языка писателя. Однако, несмотря на это, он является ценным источником информации о многих важных соотношениях в авторском словаре.

Лингвистическая значимость данного словаря, в частности, заключается в том, что он позволяет рассмотреть соотношения между общеязыковыми словарями и словарями идиолекта как своеобразной реализацией части лексического потенциала, свойственного языку в целом. В словаре идиолекта реализуется часть словарного состава данного языка и часть семантического объёма слова. Именно этот — реализационный — аспект является лингвистически одним из наиболее интересных. Важно то обстоятельство, что в любом словаре идиолекта содержатся сугубо индивидуальные, окказиональные лексические компоненты (слова и их значения), которые никогда не фиксируются ни в одном общеязыковом толковом словаре. Эти явления составляют заметную, но всё-таки относительно незначительную долю среди всех фактов словоупотребления любого автора, но каждый автор — прежде всего носитель данного языка, а затем уже творец своего, индивидуального стиля, вносящий свой вклад в развитие языка. Исследование пушкинского словаря на этот предмет выявило, что в нём присутствует более 1700 слов и около 1300 значений слов, не вошедших в БАС. Однако внимательное рассмотрение этих слов показывает, что часть из них обязательно должна была бы быть там, но по совершенно случайным причинам не попала в БАС: багрить, библеизм, блажь, гранд, днёвка и т.д. Другая часть — это ряд просторечных зачуфыриться, страмец и т.д., устаревших фортеция, благостыня, доброродный и т.д., которые могли бы быть представлены в таком словаре и в некоторых других, например, в Словаре Даля. Вполне могли бы оказаться в этом словаре и безводица, братоваться, братование, головомытье и др., являющиеся морфологическими вариантами вполне обычных слов (они есть в Словаре Даля). Далее, в БАС включаются достаточно редко и непоследовательно имена собственные, имеющие нарицательный смысл, а также прилагательные, образованные от собственных имён и топонимов. За счёт неполного отражения в БАС таких слов, например, альбион, Минерва, флорентиец, Рим, гоголевский и т.д.//и др. также создаётся неполное вложение этого авторского словаря в общеязыковой. И, наконец, лишь незначительную группу, порядка 20–50 слов, можно считать собственно пушкинскими нововведениями, авторскими неологизмами. В первом томе Словаря языка Пушкина их обнаруживается только шесть: аристократичествовать, байроничать, болезненноотверстый, воейковствовать, врагоугодник, див-рыба.

Подобное явление можно отметить и при анализе тех значений слов пушкинского словаря, которые по разным причинам не представлены в БАС. Стоит упомянуть, что не все особенности авторского употребления слов представлены в пушкинском словаре. Эти особенности касаются таких смысловых нюансов, которые могут пониматься как «образные использования», «смысловые осложнения», «каламбурные, намеренно противоречивые смысловые оттенки», и при этом они являются не заменой общеязыковых значений, а их контекстуальным развитием, конкретизацией.

Приведенные факты позволяют сделать вывод, что словарь даже такой оригинальной, творческой личности, как А.С. Пушкин, является, в основном, результатом использования общеязыковых лексических средств, реализацией части общеязыкового лексического фонда и в этом качестве и может быть исследован.

Особый интерес представляют количественные параметры с точки зрения их соотношения. Рассмотрение их позволяет, в частности, выяснить различие между общеязыковыми словарями разного объёма и между общеязыковыми и частными словарями, например, идиолектными.

Словарь языка Пушкина в этом плане представляет уникальные возможности. Так, на основе творческого наследия А.С. Пушкина и его словаря можно выделить отличительные черты и такого минимального словарного образования, как словарь того или иного пушкинского текста. На этой основе может быть рассмотрена в некоторых существенных чертах такая иерархия, как «словарь текста» — «совокупный словарь автора» — «общеязыковой словарь», т.е. проанализирована словарная иерархия, начиная с самых элементарных компонентов, поскольку словарь элементарнее, чем словарь текста, единого по смысловому замыслу, трудно себе представить.

Возникающие вопросы касаются в первую очередь соотношения общеязыкового состава этих словарей по объёму реализованного в каждом из них общеязыкового словарного состава и его семантического потенциала, а также степени системности этой реализации.

В процессе анализа Словаря языка Пушкина и двух пушкинских текстов («Пиковая дама» и «Капитанская дочка») с целью рассмотрения специфических характеристик распределения в них слов с разными количеством реализованных ими значений были получены характеристики распределений по словарям этих текстов и по Словарю языка Пушкина, а затем сопоставлены между собой и с характеристиками полисемического распределения БАС, а также с рядом других дополнительно получаемых характеристик. Соотношение рангово-полисемических характеристик единиц указанных словарей показывает, что распределение слов словаря текста по количеству присущих им значений существенно отличается от распределения слов по величине реализованной полисемии в словаре такой сборной совокупности текстов одного автора, каким является Словарь языка Пушкина, и ещё в большей степени от распределения слов с предельно реализованной (полной) полисемией в словаре, полученной на разнообразной и практически неограниченной текстовой выборке (в БАС). Отличия заключаются, в основном, в геометрии распределений в данной системе координат: полисемическое распределение словаря текста как «Пиковой дамы», так и «Капитанской дочки» довольно очевидно аппроксимируется прямой линией. Для такой совокупности слов, как Словарь языка Пушкина, свойственно заметное искривление геометрии распределения в сторону его выпуклости. Ещё более значительная степень выпуклости свойственна полисемическому распределению такого предельного словаря, как БАС.

Аналогичная динамика свойственна и частотно-ранговым лексическим структурам, если переходить от частотного словаря текста к частотным словарям сборных совокупностей текстов [13; 18]. Случай стремления частотной структуры текста к прямолинейности в билогарифмической структуре координат соответствует выполнению на данном тексте так называемого частотного закона Дж. Ципфа. Он выполняется в целостном тексте и только в нём. Этот закон является отображением смыслового единства, организационной целостности текста [18]. Смешение разных текстов в одну выборку даёт частотную структуру, в которой закон Ципфа не реализуется.

Наличие подобного изоморфизма между частотными и полисемическими структурами текстов и смешанных текстовых совокупностей свидетельствует, видимо, о наличии общих причин, управляющих частотными и полисемическими характеристиками.

Наиболее важным как в том, так и в другом случае является то, что увеличение выпуклости как частотных, так и полисемических распределений при увеличении смешанности выборки [19], если идти от целостного текста до предельно смешанной совокупности текстов, каковой и должен соответствовать такой крупный словарь языка, как БАС, свидетельствует о нарастании в таком случае удельного веса в словаре элементов, средних по своим характеристикам — среднечастотных и среднеполисемичных слов. Иначе говоря, меньшая органичность, большая усреднённость лексики, в том числе и по полисемическому распределению, — это существенное отличие сводного словаря писателя от словаря какого-либо текста того же писателя. Но, тем не менее, его степень специфичности по этой характеристике (и, видимо, по ряду других) выше общеязыкового языка.

Аналитически общий характер полисемического распределения слов по количеству значений описывается выражением

\( P_n = \frac{C}{n^{\gamma}+B} - B, \)

где P — полисемия; n — количество слов с данной полисемией; B — параметр, ответственный за описание степени криволинейности распределения, γ —  параметр, описывающий угол наклона распределения; С — величина (константа), характеризующая данный словарь.

Для словарей текстов «Пиковой дамы» и «Капитанской дочки» параметр B равен нулю (B=0), для Словаря языка Пушкина — 0,4, для БАС — 1,6. Данным числовым коэффициентом довольно наглядно описывается последовательное уменьшение специфичности сводных словарей. Словарь языка писателя по этому параметру находится между самым специфичным словарным образованием — словарём целостного текста — и наименее специфичным образованием — общеязыковым словарём.

Соотношение между словарём текста, сводным словарём языка писателя и общеязыковым словарём по степени полисемичности представленной в них лексики предлагается в Таблице 1, где отражены средние объёмно-полисемические характеристики этих лексикографических образований. Характерным является последовательное нарастание средних характеристик от 1,19 значения на слово (в словаре текста «Пиковой дамы») до 1,37 значения на слово по Словарю языка Пушкина и до 1,7 значения в БАС, что связано с постепенным накоплением значений, реализующихся во всё более обширных текстовых массивах, во всё более разнообразных контекстах.

Таблица 1 / Table 1
Средние полисемические характеристики слов разных словарей / Average polysemic characteristics of words in different dictionaries

Словарь / Dictionary

Общее распределение / General distribution

1 тысяча самых частых слов / 1 thousand most frequent words

1 тысяча случайных слов / 1 thousand random words

БАС / Dictionary of Modern Russian literary Language

1,7

4,24

1,71

Словарь языка Пушкина / Dictionary of  the Pushkin language

1,37

3,02

1,32

Словарь текста «Пиковой дамы» / Dictionary of «The Queen Of Spades»

1,19

1,34

-

Та же тенденция последовательного нарастания наблюдается и в том случае, если для сравнения взять тысячу самых частых слов каждой из этих текстовых совокупностей. Для выяснения того, в какой степени только пушкинские слова успели реализовать семантический объём, свойственный им в языке в целом, для каждого пушкинского слова была определена его полисемия, по БАС. При этом обнаруживается весьма значительное рассеяние слов одной полисемической категории по разным полисемическим категориям в БАС. Только около 50% каждого полисемического разряда из пушкинского словаря имеют то же количество значений и в БАС. Однако остальные 50%, как правило, имеют в БАС большее количество значений — в среднем на 1,5. Наблюдается весьма значительный факт большей нагруженности в этом полисемическом распределении зоны среднезначных слов и понижении нагруженности малозначных слов (например, однозначных) пушкинских слов по БАС.

Заключение

Наблюдаемое усиление зоны среднеполисемичных слов в общеязыковом словаре в сравнении с частным (в данном случае с идиолектным) словарём является, по всей видимости, отражением того факта, что наиболее общими, повторяющимися для словарей каждой из частных сфер вслед за служебными словами являются общеупотребительные и широкотематические слова, которые и занимают среднеполисемичную зону. В силу этого в сводном словаре, а именно общеязыковом словаре, такая зона, помимо очевидного и быстрее проявляющегося факта усиления в распределении зоны самых полисемичных слов, усиливает своё «звучание» благодаря семантическому триггеру, а всё распределение приобретает более выраженную выпуклую криволинейность в логарифмической системе координат. Как видно, полученные данные по Словарю языка Пушкина позволяют рассмотреть ряд существенных проблем устройства частных словарей, в том числе словарей идиолекта, как реализации части общеязыкового семантического потенциала, функций слов, а также поставить вопрос о причинах нарастания усреднённых тенденций в сводных словарях в сравнении с частными, входящими в них в качестве составной части. Это отношение — между частным и сводным словарем — существенно отличается от того, в каком находятся между собой большие, средние и малые общеязыковые толковые словари.

×

Об авторах

Ольга Ивановна Максименко

Московский государственный областной университет

Автор, ответственный за переписку.
Email: maxbel7@yandex.ru
ORCID iD: 0000-0002-6611-8744

доктор филологических наук, профессор, профессор кафедры теории языка, англистики и прикладной лингвистики

141014, Московская область, Мытищи, ул. Веры Волошиной, д. 24

Список литературы

  1. Мельников Г.П. Системология и языковые аспекты кибернетики. М.: Сов. радио, 1978.
  2. Поликарпов А.А. Циклические процессы в становлении лексической системы языка: моделирование и эксперимент: дисс. … д-ра филол. н. М.: МГУ, 1998.
  3. Hillis A.E. The organization of the lexical system // Rapp, B. (Ed.). The handbook of cognitive neuropsychology: What deficits reveal about the human mind. New York: Psychology Press, 2001. P. 185-210.
  4. Кузнецова А.И. Понятие семантической системы языка и методы её исследования. М.: МГУ, 1963.
  5. Тархова В.В. Особенности системного подхода к изучению лексического состава языка // Вестник ВИ МВД России. 2007. №4. Режим доступа: https://cyberleninka.ru/article/n/osobennosti-sistemnogo-podhoda-k-izucheniyu-leksicheskogo-sostava-yazyka (дата обращения: 15.10.2021).
  6. Майоренко И.А. Понятие системы и системного подхода к изучению лексического состава языка // Евразийский Союз Ученых. 2015. №4-13 (13). Режим доступа: https://cyberleninka.ru/article/n/ponyatie-sistemy-i-sistemnogo-podhoda-k-izucheniyuleksicheskogo-sostava-yazyka (дата обращения: 15.10.2021).
  7. Маковский М.М. Системность и асистемность в языке: опыт исследования антиномий в лексике и семантике. М.: Ком Книга, 2006.
  8. Тулдава Ю.А. Проблемы и методы квантитативно-системного исследования лексики. Тарту: ТГУ, 1987.
  9. Zipf G.K. The meaning-frequency relationship of words // The Journal of General Psychology. 1945. Vol. 33 (2). P. 251-256.
  10. Поликарпов А.А. О системном соотношении основных русских толковых словарей // Труды по лингвостатистике. Тарту: ТГУ, 1984. С. 38-46.
  11. Ожегов С.И. О трёх типах толковых словарей современного русского языка // Вопросы языкознания. 1951. № 2. С. 85-103.
  12. Денисов П.Н. Системность и связность в лексике и система словарей // Проблематика определения терминов в словарях разных типов. Л., 1976. С. 63-73.
  13. Орлов Ю.К. Обобщённый закон Ципфа-Мандельброта и частные структуры информационных единиц различных уровней // Вычислительная лингвистика. М.: Наука, 1976. С. 57-60.
  14. Словарь языка Пушкина: в 4 т./ Отв. ред акад. АН СССР В.В. Виноградов. М.: Гос. издво иностранных и национальных словарей, 1956-1961.
  15. Пушкин А.С. Полное собрание сочинений, в 15 т. М.: Издательство АН СССР, 1937-1949.
  16. Новые материалы к Словарю А.С. Пушкина / Отв. ред. В.В. Виноградов, ред. В.А. Плотникова. М.: Наука, 1982.
  17. Словарь языка Пушкина: в 4 т. Изд. 2е, доп. / Отв. ред. В.В. Виноградов. М.: Азбуковник, 2000.
  18. Орлов Ю.К. Модель частотной структуры лексики // Исследования в области вычислительной лингвистики и лингвостатистики. М.: Наука, 1979. С. 65-72.
  19. Долинский В.А. Семейство ранговых распределений в квантитативной лингвистике. Вестник МГЛУ. Гуманитарные науки. 2018. Вып. 6 (797). С. 124-154.

© Максименко О.И., 2022

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах