A cognitive linguistic approach to analysis and correction of orthographic errors

Robert Reynolds; Рейнольдс Роберт; Laura Janda; Янда Лора; Tore Nesset; Нессет Торе

doi:10.22363/2687-0088-30122

Лингвокогнитивный подход к классификации и исправлению орфографических ошибок

Авторы: Рейнольдс Р.¹^,2, Янда Л.¹, Нессет Т.¹
Учреждения:
1. Университет Тромсё - Арктический университет Норвегии
2. Университет Бригама Янга
Выпуск: Том 26, № 2 (2022): Компьютерная лингвистика и дискурсивная комплексология
Страницы: 391-408
Раздел: Статьи
URL: https://journals.rudn.ru/linguistics/article/view/31330
DOI: https://doi.org/10.22363/2687-0088-30122

Цитировать

Полный текст

Аннотация

В представленной статье мы предлагаем систематизацию орфографических ошибок неносителей русского языка на основе лингвистических и когнитивных критериев. Материалом исследования послужили данные лонгитюдного корпуса (560000 слов) работ на русском языке, написанных студентами-иностранцами. Традиционные автоматические средства проверки орфографии (spell checkers) выявляют ошибки и предлагают исправления, но не могут построить объяснительные когнитивные модели. Предлагаемый подход позволяет распознать не только сами ошибки, но и концептуальные причины этих ошибок, заключающиеся в непонимании фонотактики и морфофонологии русского языка, а также в способах их репрезентации орфографическими правилами. Этот способ позволяет обосновывать причины грамматических ошибок и рекомендовать правила, которые улучшают владение пользователями русской морфофонологией, а не просто исправляют ошибки. Принцип систематизации аннотированных ошибок в корпусе академического письма на неродном языке и таксономия ошибок ориентированы на преподавание. На основе представленной таксономии мы разработали набор правил (mal-rules), расширяющих функционал конечно-автоматного анализатора русского языка. Разработанный морфологический анализатор аннотирует словоформы специальными тегами ошибок. Для каждого тега ошибки мы предлагаем сопровождающее пояснение, чтобы помочь пользователям понять, почему и как исправить диагностированные ошибки. Используя наш расширенный анализатор, мы создаем веб-приложение, позволяющее пользователям набирать или вставлять текст, а также подробные комментарии и исправления распространенных морфофонологических и орфографических ошибок в русском языке.

Ключевые слова

морфофонология, фонотактика, орфография, корпус, таксономия ошибок

Об авторах

Роберт Рейнольдс

Университет Тромсё - Арктический университет Норвегии; Университет Бригама Янга

Email: robert_reynolds@byu.edu
ORCID iD: 0000-0003-0306-087X

доцент-исследователь в Отделе цифровых гуманитарных наук

Тромсё, Норвегия; Прово, Юта, США

Лора Янда

Университет Тромсё - Арктический университет Норвегии

Email: laura.janda@uit.no
ORCID iD: 0000-0001-5047-1909

профессор кафедры языка и культуры

Тромсё, Норвегия

Торе Нессет