На пути к систематике учебников как жанра: на примере российских учебников

Обложка

Цитировать

Полный текст

Аннотация

Проект, представленный в статье, первоначально ставил цель разработки функциональной модели распознавания или классификации современного российского школьного учебника как жанра. В этом исследовании мы проверяем и подтверждаем гипотезу о том, что определение предметной области и уровня сложности учебника может быть сведено к ограниченному числу количественных лингвистических параметров, имеющих точно заданные и проверенные диапазоны значений. Мы охарактеризовали наш подход к жанровому анализу как многомерный, собрав корпус из более чем 1 млн текстов. Лексемы, измерявшие значения 15 лингвистических параметров в 19 учебниках двух разных предметных областей и уровней сложности, выявили 7 предикторов сложности, 7 предикторов предметной области и один частотный - метапараметр, способный отличать учебники истории и обществознания от текстов других жанров. Наши результаты подчеркивают важность следующих параметров для учебников по выбранным предметным областям: частота встречаемости существительных, времена глаголов (настоящее, прошедшее и будущее), совпадение локальных и глобальных аргументов, соотношение типов лексем. Установлено, что модель классификации сложности зависит от длины предложения, длины слова, частоты встречаемости существительных в родительном падеже и глаголов, показателя абстрактности, соотношения глаголов и существительных, а также соотношения прилагательных и существительных нарицательных. Результаты этого анализа будут использованы для интерпретации количественных лингвистических описаний и классификации текстов.

Об авторах

Марина Ивановна Солнышкина

Казанский (Приволжский) федеральный университет

Автор, ответственный за переписку.
Email: mesoln@yandex.ru
ORCID iD: 0000-0003-1885-3039
SPIN-код: 6480-1830
Scopus Author ID: 56429529500
ResearcherId: E-3863-2015

доктор филологических наук, профессор, профессор кафедры теории и практики преподавания иностранных языков, руководитель НИЛ «Текстовая аналитика», Институт филологии и межкультурной коммуникации

420008, Российская Федерация, г. Казань, ул. Кремлевская, 18

Гулноза Нармахмадовна Шоева

Казанский (Приволжский) федеральный университет

Email: gnshoeva@yandex.ru
ORCID iD: 0009-0005-0438-0404

аспирант кафедры теории и практики преподавания иностранных языков, младший научный сотрудник, НИЛ «Текстовая аналитика», Институт филологии и межкультурной коммуникации

420008, Российская Федерация, г. Казань, ул. Кремлевская, 18

Ксения Олеговна Косова

Российский университет дружбы народов

Email: kosova-ko@rudn.ru
ORCID iD: 0009-0007-5606-9604
SPIN-код: 2675-2106

аспирант кафедры иностранных языков филологического факультета

117198, Российская Федерация, г. Москва, ул. Миклухо-Маклая, д. 6

Список литературы

  1. Kessler, B., Nunberg, G. & Schuetze, H. (1997). Automatic Detection of Text Genre.
  2. Biber, D. (1988). Variation across Speech and Writing. Cambridge: Cambridge University Press.
  3. Biber, D. & Conrad, S. (2013). Introduction: Multi-dimensional analysis and the study of register variation. In: S. Conrad & D. Biber (Eds.) Variation in English: Multidimensional studies. Routledge. pp. 3-12.
  4. Biber, D. & Gray, B. (2016). Grammatical Complexity in Academic English: Linguistic Change in Writing. Cambridge: Cambridge University Press.
  5. Paltridge, B. (1994). Genre Analysis and the Identification of Textual Boundaries. Applied Linguistics, 15, 288-299.
  6. Raible, W. (2019). Variation in Language: How to Characterise Types of Texts and Communication Strategies between Orality and Scripturality. Answers given by Koch / Oesterreicher and by Biber. International Journal of Language and Linguistics, 6(2). https://doi.org/10.30845/ijll.v6n2p19
  7. Hyland, K. (2004). Disciplinary Discourses: Social Interactions in Academic Writing. Michigan: University of Michigan Press.
  8. Куприянов Р.В., Солнышкина М.И., Лехницкая П.А. Параметрическая таксономия учебных текстов // Вестник Волгоградского государственного университета. Серия 2. Языкознание. 2023. Т. 22. № 6. С. 80-94. https://doi.org/10.15688/jvolsu2.2023.6.6
  9. Gatiyatullina, G., Solnyshkina, M., Solovyev, V., Danilov, A., Martynova, E. & Yarmakeev, I. (2020). Computing Russian Morphological distribution patterns using RusAC Online Server Proceedings. International Conference on Developments in eSystems Engineering, DeSE 9450753. pp. 393-398. https://doi.org/10.1109/DeSE51703.2020.9450753
  10. Paraschiv, A., Dascalu, M. & Solnyshkina, M.I. (2023). Classification of Russian textbooks by grade level and topic using ReaderBench. Research Result. Theoretical and Applied Linguistics, 9(1), 50-63. https://doi.org/110.18413/2313-8912-2023-9-1-0-4
  11. Solnyshkina, M.I., Kupriyanov, R.V. & Shoeva, G.N. (2024). Linguistic profiling of text genres: adventure stories vs. textbooks. Research Result. Theoretical and Applied Linguistics, 10(1), 15-132. https://doi.org/10.18413/2313-8912-2024-10-1-0-7
  12. Swales, J.M. (1990). Genre Analysis English in Academic and Research Settings. Cambridge: Cambridge University Press.
  13. Lüdeling, A. & Kytö, M. (2009). Corpus Linguistics. An International Handbook (HSK 29.1 und 29.2). Berlin, New York: Mouton de Gruyter. https://doi.org/10.1515/zrs-2012-0019
  14. Biber, D. & Conrad, S. (2019). Register, Genre, and Style. Cambridge: Cambridge University Press.
  15. Алексеева Л.М., Аннушкин В.И., Баженова Е.А. Стилистический энциклопедический словарь русского языка. М.: Наука: Флинта, 2003.
  16. Kuznetsova, J. (2015). Linguistic profiles: going from form to meaning via statistics. New York: Mouton de Gruyter. https://doi.org/10.1515/9783110361858
  17. Yakhibbaeva, L.M. (2008). Uchebnyi tekst kak osobyi vid vtorichnogo teksta i sostavlyayushchaya uchebnogo diskursa. Vestnik Bashkirskogo universiteta, 13(4), 1029-1031.
  18. Vedyakova, N.A. (2016). Uchebnyi tekst - nauchnyi tekst? Lingua mobilis, 1(54), 19-26.
  19. Plavén-Sigray, P. & Matheson, G.J., Schiffler, B.Ch. & Thompson, W.H. (2017). Research: The readability of scientific texts is decreasing over time eLife. URL: https://elifesciences.org/articles/27725#cite-this-article (accessed: 12.01.2024). https://doi.org/10.7554/eLife.27725
  20. Ember, M. & Ember, C. (1999). Cross-Language Predictors of Consonant-Vowel Syllables. American Anthropologist, 101(4), 730-742.
  21. Lyons, C. (1986). The syntax of English genitive constructions. Journal of Linguistics, 22(1), 123-143. https://doi.org/10.1017/S0022226700010586
  22. Tang, J. (2024). Variation in metadiscourse verb patterns in English academic papers from intra- and interdisciplinary analysis. Applied Mathematics and Nonlinear Sciences, 9(1).
  23. Hodošček, B. (2011). Word Class Ratios and Genres in Written Japanese: Revisiting the Modifier Verb Ratio. Acta Linguistica Asiatica, 1(2).
  24. Biber, D., Conrad, S. & Reppen, R. (1999). Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press.
  25. Sharoff, S., Umanskaya, E. & Wilson, J. (2013). A Frequency Dictionary of Russian: Core vocabulary for learners. Routledge.
  26. Van Dijk, T.A. (1988). News as Discourse. Lawrence Erlbaum Associates, Inc.
  27. Read, J. (2000). Assessing vocabulary. Cambridge: Cambridge University Press. https://doi. org/10.1017/CBO9780511732942
  28. Treffers-Daller, J., Parslow, P. & Williams Sh. (2018). Back to Basics: How Measures of Lexical Diversity Can Help Discriminate between CEFR Levels. Applied Linguistics, 39(3), 302-327. https://doi.org/10.1093/applin/amw009
  29. Yang, J.S., Rosvold, C. & Bernstein, R.N. (2022). Measurement of Lexical Diversity in Children’s Spoken Language: Computational and Conceptual Considerations. Front. Psychol, 13, 905789. https://doi.org/10.3389/fpsyg.2022.905789
  30. Foltz, P.W., Kintsch, W. & Landauer, T.K. (1998). The Measurement of Textual Coherence with Latent Semantic Analysis. Discourse Processes, 25 (2-3), 285-307. https://doi.org/10.1080/01638539809545029
  31. McNamara, D.S., Louwerse, M.M., McCarthy, P.M. & Graesser, A.C. (2010). Coh-Metrix: Capturing linguistic features of cohesion. Discourse Processes, 47, 292-330.
  32. Crossley, S.A. & McNamara, D.S. (2011). Text cohesion and judgments of essay quality: Models of quality and coherence. Cognition and Instruction, 29(6), 569-589.
  33. Marza, L.E. (2011). A comprehensive corpus-based study of the use of evaluative adjectives in promotional hotel websites. Odisea, 12, 97-123.

Дополнительные файлы

Доп. файлы
Действие
1. Fig. 1. Range of sentence length

Скачать (67KB)
2. Fig. 2. Range of word length

Скачать (54KB)
3. Fig. 3. Incidence of nouns

Скачать (78KB)
4. Fig. 4. Incidence of genitive case (nouns)

Скачать (77KB)
5. Fig. 5. Incidence of verbs

Скачать (80KB)
6. Fig. 6. Frequency

Скачать (70KB)
7. Fig. 7. Abstractness

Скачать (77KB)
8. Fig. 8. Type Token Ratio

Скачать (71KB)
9. Fig. 9. a) Local argument overlap; b) Global argument overlap

Скачать (80KB)
10. Fig. 10. Verb/Noun ratio

Скачать (43KB)
11. Fig. 11. Adjective/Noun ratio

Скачать (52KB)
12. Fig. 12. Verb tenses

Скачать (57KB)

© Солнышкина М.И., Шоева Г.Н., Косова К.О., 2024

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах