<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">Russian Journal of Linguistics</journal-id><journal-title-group><journal-title xml:lang="en">Russian Journal of Linguistics</journal-title><trans-title-group xml:lang="ru"><trans-title>Russian Journal of Linguistics</trans-title></trans-title-group></journal-title-group><issn publication-format="print">2687-0088</issn><issn publication-format="electronic">2686-8024</issn><publisher><publisher-name xml:lang="en">Peoples’ Friendship University of Russia named after Patrice Lumumba (RUDN University)</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="publisher-id">35198</article-id><article-id pub-id-type="doi">10.22363/2687-0088-32933</article-id><article-id pub-id-type="edn">LOVEXS</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>Articles</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Статьи</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="zh"><subject>Articles</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Linguistic and statistical analysis of the lexical ‘Langue-Parole’ dichotomy in a restricted domain</article-title><trans-title-group xml:lang="ru"><trans-title>Лингвостатистический анализ лексической дихотомии «язык-речь» предметной области</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0003-1245-4213</contrib-id><name-alternatives><name xml:lang="en"><surname>Sheremetyeva</surname><given-names>Svetlana O.</given-names></name><name xml:lang="ru"><surname>Шереметьева</surname><given-names>Светлана Олеговна</given-names></name></name-alternatives><bio xml:lang="en"><p>Doctor Habil. in Computational Linguistics, Professor, Head of the Innovative Language Technology R&amp;D center of the Institute of Linguistics and Intercultural Communication at the South Ural State University. She has considerable teaching and research experience acquired both in Russia and abroad. Prof. Sheremetyeva worked as a key researcher and lecturer in computational linguistics at New Mexico State University (USA), Uppsala University (Sweden), and Copenhagen Business School (Denmark). She is a regular participant, reviewer and program committee member of many international conferences on computational linguistics. Her research interests cover a wide range of NLP problems.</p></bio><bio xml:lang="ru"><p>доктор филологических наук, профессор, директор научно-образовательного центра «Лингво-инновационные технологии» ЮУрГУ. Имеет большой опыт преподавательской и научно-исследовательской работы в ЮУрГУ и за рубежом в качестве ведущего исследователя по вычислительной лингвистике в университете Нью-Мексико (США) и лектора по вычислительной лингвистике и машинному переводу в Уппсалском университете (Швеция), а также Копенгагенской высшей школе экономики (Дания). Является регулярным участником, рецензентом и членом программных комитетов многих международных конференций по вычислительной лингвистике. Ее исследовательские интересы охватывают широкий круг проблем автоматической обработки текста.</p></bio><email>sheremetevaso@susu.ru</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-1733-6075</contrib-id><name-alternatives><name xml:lang="en"><surname>Babina</surname><given-names>Olga I.</given-names></name><name xml:lang="ru"><surname>Бабина</surname><given-names>Ольга Ивановна</given-names></name></name-alternatives><bio xml:lang="en"><p>PhD in Computational Linguistics. She is Head of the Department of Linguistics and Translation and Deputy Head of the Innovative Language Technology R&amp;D center of the Institute of Linguistics and Intercultural Communication at the South Ural State University. Her research interests include corpus linguistics, computational linguistics, natural language processing, as well as text mining and text analysis using machine learning methods.</p></bio><bio xml:lang="ru"><p>кандидат филологических наук, заведующий кафедрой лингвистики и перевода, заместитель директора научно-образовательного центра «Лингво-инновационные технологии» института лингвистики и международных коммуникаций Южно-Уральского государственного университета. Исследовательские интересы включают корпусную лингвистику, компьютерную лингвистику, автоматическую обработку текстов, применение методов машинного обучения для извлечения информации и интеллектуального анализа текстов</p></bio><email>babinaoi@susu.ru</email><xref ref-type="aff" rid="aff1"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">South Ural State University</institution></aff><aff><institution xml:lang="ru">Южно-Уральский государственный университет (национальный исследовательский университет)</institution></aff></aff-alternatives><pub-date date-type="pub" iso-8601-date="2023-06-30" publication-format="electronic"><day>30</day><month>06</month><year>2023</year></pub-date><volume>27</volume><issue>2</issue><issue-title xml:lang="en">VOL 27, NO2 (2023)</issue-title><issue-title xml:lang="ru">ТОМ 27, №2 (2023)</issue-title><fpage>468</fpage><lpage>499</lpage><history><date date-type="received" iso-8601-date="2023-07-04"><day>04</day><month>07</month><year>2023</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2023, Sheremetyeva S.O., Babina O.I.</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2023, Шереметьева С.О., Бабина О.И.</copyright-statement><copyright-statement xml:lang="zh">Copyright ©; 2023, Sheremetyeva S., Babina O.</copyright-statement><copyright-year>2023</copyright-year><copyright-holder xml:lang="en">Sheremetyeva S.O., Babina O.I.</copyright-holder><copyright-holder xml:lang="ru">Шереметьева С.О., Бабина О.И.</copyright-holder><copyright-holder xml:lang="zh">Sheremetyeva S., Babina O.</copyright-holder><ali:free_to_read xmlns:ali="http://www.niso.org/schemas/ali/1.0/"/><license><ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-nc/4.0</ali:license_ref></license></permissions><self-uri xlink:href="https://journals.rudn.ru/linguistics/article/view/35198">https://journals.rudn.ru/linguistics/article/view/35198</self-uri><abstract xml:lang="en"><p style="text-align: justify;">Development of new digital methods for analyzing the ‘Langue-Parole’ dichotomy is one of the most sought-after, but least researched problems of modern theoretical and applied linguistics. This determines the relevance of this study, the purpose of which is to develop a methodology for the automated linguastatistical analysis of a domain-related lexical layer in the context of the ‘Langue-Parole’ dichotomy and to apply the methodology to the Russian-language domain “Research on athlete integrative physiology” (RAIP). The study was conducted on the material of the Russian-language corpus including 56 RAIP domain texts of 300,000 wordforms in total published over the 2013-2020 period in the scientific journals “People. Sport. Medicine” (formerly “SUSU Bulletin. Series “Education, Healthcare, Physical Culture”), “Theory and Practice of Physical Culture”, etc. The key methodological approach is the ontological analysis of corpus data using statistical and linguistic modeling methods. The domain-specific language and speech are modeled by the corresponding lexicon and corpus, while the ‘Langue-Parole’ lexical dichotomy is represented by the values of the linguistic-statistical concept verbalization parameters of the domain concepts in the lexicon and corpus. The computational parameters include the indices of lexical diversity, structural complexity, conceptual syncretism, lexical structural complexity vs. conceptual syncretism correlation, and syncretical concept junction when verbalized in the corpus. The main results of the study are: 1) а methodology for analyzing domain-specific lexical dichotomy ‘Langue-Parole’, which can be ported to other domains and national languages; 2) the RAIP domain-related resources, including language-independent ontology, conceptually annotated Russian corpus, onto-lexicon, linguistic-statistical parameter values of the lexical ‘Langue-Parole’ dichotomy; and 3) tools that automate certain stages of the study.</p></abstract><trans-abstract xml:lang="ru"><p style="text-align: justify;">Создание новых информационно-технологических методов анализа соотношения языка и речи относится к числу наиболее востребованных, но наименее разработанных проблем современной теоретической и прикладной лингвистики, что определяет актуальность настоящего исследования, целью которого является разработка методологии автоматизированного лингвостатистического анализа лексического слоя ограниченной предметной области в контексте дихотомии «язык-речь» и реализация разработанных методологических принципов на материале русскоязычной предметной области «Исследование интегративной физиологии спортсменов» (ПО ИИФС). Исследование проводилось на материале русскоязычного корпуса из 56 текстов ПО ИИФС общим объемом 300 000 словоупотреблений, опубликованных в научных журналах «Человек. Спорт. Медицина» (ранее «Вестник ЮУрГУ. Серия «Образование, здравоохранение, физическая культура»), «Теория и практика физической культуры» и отдельных статей из сети Интернет за 2013-2020 гг. Основным методологическим принципом исследования является онтологический анализ корпусных данных с использованием лингвостатистических методов и методов лингвистического моделирования. Язык и речь предметной области моделируются соответствующими лексиконом и корпусом текстов, а специфика лексической дихотомии «язык-речь» определяется вычислением и сравнением значений лингвостатистических параметров вербализации концептуальной (онтологической) структуры предметной области в соответствующих лексиконе и корпусе. В качестве вычислительных параметров дихотомии предлагаются коэффициенты лексического разнообразия, лексической структурной сложности, лексического концептуального синкретизма, корреляции между структурной сложностью и концептуальным синкретизмом лексических единиц и сопряжения синкретично вербализованных концептов. Основными результатами исследования являются предложенная универсальная методология анализа лексической дихотомии «язык-речь», которая может быть использована в приложении к различным предметным областям и национальным языкам, и ориентированные на ПО ИИФС ресурсы: независимая от конкретного языка онтология предметной области, русскоязычные онто-лексикон, концептуально аннотированный корпус, значения лингвостатистических параметров лексической дихотомии «язык-речь» указанной предметной области и инструментарий, автоматизирующий определенные этапы исследования.</p></trans-abstract><kwd-group xml:lang="en"><kwd>langue-parole dichotomy</kwd><kwd>linguastatistical analysis</kwd><kwd>restricted domain</kwd><kwd>ontology</kwd><kwd>Russian language</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>дихотомия «язык-речь»</kwd><kwd>лингвостатистический анализ</kwd><kwd>предметная область</kwd><kwd>онтология</kwd><kwd>русский язык</kwd></kwd-group><funding-group/></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><mixed-citation>Варфоломеев А.П. Психосемантика слова и лингвостатистика текста: метод. рекомендации к спецкурсу. Калининград: Калининградский университет, 2000. [Varfolomeev, Anatoly P. 2000. Psihosemantika slova i lingvostatistika teksta (Psychosemantics of the Word and Linguostatistics of the Text): Guidelines. Kaliningrad: Kaliningrad university Publ. (In Russ.)].</mixed-citation></ref><ref id="B2"><label>2.</label><mixed-citation>Добров А.В., Доброва А.В., Сомс Н.Л., Чугунов Н.Л. Семантический анализ новостных сообщений по теме «Электронные услуги»: опыт применения методов онтологической семантики // Государство и граждане в электронной среде: теория и технологии исследований. Труды XVIII объединенной конференции «Интернет и современное общество» IMS-2015. Санкт-Петербург: ИТМО, 2015. С. 120-125. [Dobrov, Aleksej V., Anastasija V. Dobrova, Nikolai L. Soms &amp; Andrej V. Chugunov. 2015. Semanticheskii analiz novostnykh soobcshhenii po teme «Elektronnye uslugi»: opyt primeneniya metodov ontologicheskoi semantiki (Semantic analysis of news items on ‘electronic services’ subject domain: Experience of applying methods of ontological semantics). In Gosudarstvo i grazhdane v ehlektronnoi srede: teoriya i tekhnologii issledovanii. Trudy XVIII ob’edinennoi konferentsii «Internet i sovremennoe obshchestvO» IMS-2015. 120-125. Saint-Petersburg: ITMO Publ. (In Russ.)].</mixed-citation></ref><ref id="B3"><label>3.</label><mixed-citation>Мельчук И.А. Опыт теории лингвистических моделей Смысл ó Текст: Семантика, синтаксис. 2-е изд. М.: Школа «Языки русской культуры», 1999. [Mel'chuk, Igor A. 1999. On the Theory of Linguistic Models “Meaning ⇔ Text”. 2nd ed. Moscow: Shkola «Yazyki russkoi kul'tury». (In Russ.)].</mixed-citation></ref><ref id="B4"><label>4.</label><mixed-citation>Осипова Л.И. К вопросу о дихотомии «язык-речь» // Актуальные проблемы гуманитарных и естественных наук. 2012. №11. С. 199­-202. [Osipova, Lyudmila I. 2012. K voprosu o dikhotomii “yazyk-rech’” (On the issue of the dichotomy “Langue-Parole”). Aktual'nye Problemy Gumanitarnykh i Estestvennykh Nauk 11. 199­-202. (In Russ.)].</mixed-citation></ref><ref id="B5"><label>5.</label><mixed-citation>Пименова М.В. Лексико-семантический синкретизм как проявление формально-содержательной языковой асимметрии // Вопросы языкознания. 2011. № 3. С. 19-48. [Pimenova, Marina V. 2011. Leksiko-semanticheskii sinkretizm kak proyavlenie formal'no-soderzhatel'noi yazykovoi asimmetrii (Lexical and semantic syncretism as a manifestation of form- and content-related language asymmetry) // Voprosy yazykoznaniya 11. 19-48. (In Russ.)].</mixed-citation></ref><ref id="B6"><label>6.</label><mixed-citation>Сысоева А.А. Явление семантического синкретизма (на примере обозначений восприятия в немецком языке в диахронии) // Вестник Московского государственного лингвистического университета. Гуманитарные науки. 2019. T. 817. № 1. С. 317-327. [Sysoeva, Alesia A. 2019. Yavlenie semanticheskogo sinkretizma (na primere oboznachenii vospriyatiya v nemeckom yazyke v diahronii) (Semantic syncretism (on the example of German lexical units denoting perception in diachrony)). Vestnik Moskovskogo gosudarstvennogo lingvisticheskogo universiteta. Gumanitarnye nauki 1 (817). 317-327. (In Russ.)].</mixed-citation></ref><ref id="B7"><label>7.</label><mixed-citation>Хохлова М.В. Атрибутивные коллокации в золотом стандарте сочетаемости русского языка и их представление в словарях и корпусах текстов // Вопросы лексикографии. 2021. № 21. C. 33-68. [Khokhlova, Maria V. 2021. Attributive collocations in the gold standard of Russian collocability and their representation in dictionaries and corpora. Voprosy Leksikografii 21. 33-68. (In Russ.)].</mixed-citation></ref><ref id="B8"><label>8.</label><mixed-citation>Чуфарова Е.Н. Юридический язык в дихотомии «язык-речь» // Юридические исследования. 2018. №2. С. 1­-7. [Chufarova, Ekaterina N. 2018. Yuridicheskii yazyk v dikhotomii “yazyk-rech” (Legal language in the ‘language-speech’ dichotomy). Yuridicheskie issledovaniya 2. 1-7. (In Russ.)].</mixed-citation></ref><ref id="B9"><label>9.</label><mixed-citation>Шнякина Н.Ю. О вербализации событийных концептов // Историческая и социально-образовательная мысль. 2015. Т.7. № 5. Ч. 2. С. 283-288. [Shnjakina, Natal’ja Ju. 2015. O verbalizacii sobytiinyh konceptov (On event concept verbalization). Istoricheskya i social'no-obrazovatel'naya mysl' 7 (5-2). 283-288. (In Russ.)]. https://doi.org/10.17748/2075-9908-2015-7-5/2-283-288</mixed-citation></ref><ref id="B10"><label>10.</label><mixed-citation>Щерба Л.В. Языковая система и речевая деятельность. М.: Едиториал УРСС, 2004. [Scherba, Lev V. 2004. Yazykovaya sistema i rechevaya deyatel’nost’ (Language system and speech activity). Moscow: Editorial URSS. (In Russ.)].</mixed-citation></ref><ref id="B11"><label>11.</label><mixed-citation>Alatrish, Emhimed S., Dušan Tošić &amp; Nikola Milenkov. 2014. Building ontologies for different natural languages. Computer Science and Information Systems 11 (2). 623-644. https://doi.org/10.2298/CSIS130429023A</mixed-citation></ref><ref id="B12"><label>12.</label><mixed-citation>Apresjan, Valentina &amp; Nikolai Mikulin. 2016. Dictionary as an instrument of linguistic research, In Tinatin Margalitadze &amp; George Meladze (eds.), Proceedings of the XVII EURALEX international congress: Lexicography and linguistic diversity, 224-231. Tbilisi: Ivane Javakhishvili Tbilisi State University.</mixed-citation></ref><ref id="B13"><label>13.</label><mixed-citation>Arp, Robert, Barry Smith &amp; Andrew D. Spear. 2010. Building Ontologies with Basic Formal Ontology. Cambridge, MA: MIT Press.</mixed-citation></ref><ref id="B14"><label>14.</label><mixed-citation>Carvalho, Victorio A., Joo Paulo A. Almeida, Claudenir M. Fonseca &amp; Giancarlo Guizzardi. 2017. Multi-level ontology-based conceptual modeling. Data &amp; Knowledge Engineering 109 (C). 3-24.</mixed-citation></ref><ref id="B15"><label>15.</label><mixed-citation>Ceausu, Valentina &amp; Sylvie Després. 2007. Learning term to concept mapping through verbs: A case study. Proceedings of the Semantic Authoring, Annotation and Knowledge Markup Workshop (SAAKM2007) located at the 4th International Conference on Knowledge Capture (KCap 2007), October 28-31, 2007. CEUR Workshop Proceedings 289. Whistler, British Columbia, Canada: CEUR-WS.org.</mixed-citation></ref><ref id="B16"><label>16.</label><mixed-citation>Chaves, Marcirio S. &amp; Cassia Trojahn. 2010. Towards a Multilingual Ontology for Ontology-Driven Content Mining in Social Web Sites. https://www.researchgate.net/publication/266526035 (accessed 05 December 2022).</mixed-citation></ref><ref id="B17"><label>17.</label><mixed-citation>Cucerzan, Silviu. 2007. Large-scale named entity disambiguation based on Wikipedia data. Proceedings of the 2007 joint conference on empirical methods in natural language processing and computational natural language learning (EMNLP-CoNLL), Prague, Czech Republic. 708-716. Association for Computational Linguistics.</mixed-citation></ref><ref id="B18"><label>18.</label><mixed-citation>Elworthy, David. 1995. Tagset design and inflected languages. In Steven P. Abney &amp; Erhard W. Hinrichs (eds.), Proceedings of the European chapter of the association for computational linguistics SIGDAT workshop from texts to tags: Issues in multilingual language analysis, 1-10. Dublin: Association for Computational Linguistics.</mixed-citation></ref><ref id="B19"><label>19.</label><mixed-citation>Embley, David W., Stephen W. Liddle, Deryle W. Lonsdale &amp; Yuri Tijerino. 2011. Multilingual ontologies for cross-language information extraction and semantic search. In Manfred A. Jeusfeld, Lois Delcambre &amp; Tok Wang Ling (eds.), ER'11: Proceedings of the 30th international conference on conceptual modeling, 147­-160. Berlin, Heidelberg: Springer-Verlag.</mixed-citation></ref><ref id="B20"><label>20.</label><mixed-citation>Erjavec, Tomaž. 2010. Multext-East version 4: Multilingual morphosyntactic specifications, lexicons and corpora. In Nicoletta Calzolari, Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner &amp; Daniel Tapias (eds.), Proceedings of the seventh conference on international language resources and evaluation (LREC’10), 2544-2547. Valetta, Malta: European Language Resources Association.</mixed-citation></ref><ref id="B21"><label>21.</label><mixed-citation>Espinoza, Mauricio, Asunción Gómez-Pérez &amp; Eduardo Mena. 2008. Enriching an Ontology with Multilingual Information. The Semantic Web: Research and Applications. ESWC Lecture Notes in Computer Science 5021. 333-347. Berlin, Heidelberg: Springer.</mixed-citation></ref><ref id="B22"><label>22.</label><mixed-citation>Feldman, Anna, Jirka Hana &amp; Chris Brew. 2006. A cross-language approach to rapid creation of new morpho-syntactically annotated resources. In Proceedings of the fifth international conference on language resources and evaluation (LREC 2006). 549-554. Genoa, Italy: European Language Resources Association.</mixed-citation></ref><ref id="B23"><label>23.</label><mixed-citation>Galperin, Rina, Shachar Schnapp &amp; Michael Elhadad. 2022. Cross-Lingual UMLS Named Entity Linking using UMLS Dictionary Fine-Tuning. Findings of the Association for Computational Linguistics: ACL 2022. 3380-3390. Dublin, Ireland: Association for Computational Linguistics.</mixed-citation></ref><ref id="B24"><label>24.</label><mixed-citation>Gauch Jr, Hugh G. 2015. Scientific Method in Practice. New York: Cambridge University Press. https://doi.org/10.1017/CBO9780511815034.</mixed-citation></ref><ref id="B25"><label>25.</label><mixed-citation>Gnasa, Melanie &amp; Jens Woch. 2002. Architecture of a knowledge based interactive Information Retrieval System. Proceedings of KONVENS 2002. https://konvens.org/proceedings/2002/pdf/12P-gnasa.pdf (accessed 28 November 2022).</mixed-citation></ref><ref id="B26"><label>26.</label><mixed-citation>Hsieh, Hsiu-Fang &amp; Sarah E. Shannon. 2005. Three approaches to qualitative content analysis. Qualitative Health Research 15 (9). 1277-1288. https://doi.org/10.1177/1049732305276687</mixed-citation></ref><ref id="B27"><label>27.</label><mixed-citation>Jaccard, Paul. 1901. Étude comparative de la distribuition florale dans une portion des Alpes et des Jura. Bulletin de la Société Vaudoise des Sciences Naturelles 37. 547-579. https://doi.org/10.5169/seals-266450.</mixed-citation></ref><ref id="B28"><label>28.</label><mixed-citation>Mannes, Aaron &amp; Jennifer Golbeck. 2005. Building a Terrorism Ontology. In Proceedings of the ISWC workshop on ontology patterns for the semantic Web 36. https://www.semanticscholar.org/paper/Building-a-Terrorism-Ontology-Mannes-Golbeck/9bcb90e48677e39da7b84939e8c8da2b2a63cde7 (accessed 28 November 2022).</mixed-citation></ref><ref id="B29"><label>29.</label><mixed-citation>Miller, George A., Richard Beckwith, Christiane Fellbaum, Derek Gross &amp; Katherine J. Miller. 1990. Introduction to WordNet: An on-line lexical database. International Journal of Lexicography 3 (4). 235-244.</mixed-citation></ref><ref id="B30"><label>30.</label><mixed-citation>Montiel-Ponsoda, Elena, Guadelupe Aguado de Cea, Asunción Gómez-Pérez &amp;Wim Peters. 2008. Modelling multilinguality in ontologies. In Proceedings of COLING 2008, Companion volume - Posters. 67-70. Manchester, UK: Coling 2008 Organizing Committee.</mixed-citation></ref><ref id="B31"><label>31.</label><mixed-citation>Niles, Ian &amp; Adam Pease. 2003. Linking lexicons and ontologies: Mapping WordNet to the suggested upper merged ontology. In Proceedings of the IEEE International Conference on Information and Knowledge Engineering. 412-416.</mixed-citation></ref><ref id="B32"><label>32.</label><mixed-citation>Nirenburg, Sergei &amp; Viktor Raskin. 2004. Ontological Semantics. Cambridge, MA: MIT Press.</mixed-citation></ref><ref id="B33"><label>33.</label><mixed-citation>Nivre, Joakim, Igor M. Boguslavsky &amp; Leonid L. Iomdin. 2008. Parsing the SynTagRus treebank of Russian. In Proceedings of the 22nd international conference on computational linguistics (Coling 2008). 641-648. Manchester, UK: Coling 2008 Organizing Committee.</mixed-citation></ref><ref id="B34"><label>34.</label><mixed-citation>Orosz, György, Attila Novák &amp; Gábor Prószéky. 2014. Lessons learned from tagging clinical Hungarian. International Journal of Computational Linguistics and Applications 5 (1). 129-145.</mixed-citation></ref><ref id="B35"><label>35.</label><mixed-citation>Petrov, Slav, Dipanjan Das &amp; Ryan McDonald. 2012. A universal part-of-speech tagset. In Proceedings of the conference on language resources and evaluation (LREC 2012). 2089-2096. Istanbul, Turkey: European Language Resources Association.</mixed-citation></ref><ref id="B36"><label>36.</label><mixed-citation>Roberts, Angus, Robert Gaizauskas, Mark Hepple, George Demetriou, Yikun Guo, Ian Roberts &amp; Andrea Setzer. 2009. Building a semantically annotated corpus of clinical texts. Journal of Biomedical Informatics 42 (5). 950-966.</mixed-citation></ref><ref id="B37"><label>37.</label><mixed-citation>Saussure, Ferdinand de. 1967. Cours de Linguistique Générale. Paris: Payot.</mixed-citation></ref><ref id="B38"><label>38.</label><mixed-citation>Sheremetyeva, Svetlana. 2012. Automatic extraction of linguistic resources in multiple languages. Proceedings of NLPCS 2012, 9th International Workshop on Natural Language Processing and Cognitive Science in conjunction with ICEIS 2012, Wroclaw, Poland, 44-52.</mixed-citation></ref><ref id="B39"><label>39.</label><mixed-citation>Sheremetyeva, Svetlana. 2018. Universal computational formalisms and developer environment for rule-based NLP. In Alexander Gelbukh (ed.), Computational linguistics and intelligent text processing: CICLing 2017. Lecture notes in computer science 10761, 67-78. https://doi.org/10.1007/978-3-319-77113-7_5</mixed-citation></ref><ref id="B40"><label>40.</label><mixed-citation>Solovyev, Vladimir, Marina M. Solnyshkina &amp; Danielle M. McNamara. 2022. Computational linguistics and discourse complexology: Paradigms and research methods. Russian Journal of Linguistics 26 (2). 275-316. https://doi.org/10.22363/2687-0088-30161</mixed-citation></ref><ref id="B41"><label>41.</label><mixed-citation>Stojanović, Ljiljana, Nenad Stojanovic &amp; Jun Ma. 2007. On the conceptual tagging: An ontology pruning use case. WI '07: Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence. 344-350.</mixed-citation></ref><ref id="B42"><label>42.</label><mixed-citation>Tsalidis, Christos, Aristides Vagelatos &amp; Giorgos Orphanos A. 2004. An electronic dictionary as a basis for NLP tools: The Greek case, arXiv:cs/0408061 [cs.CL] (accessed 28 November 2022). https://doi.org/10.48550/arXiv.cs/0408061</mixed-citation></ref></ref-list></back></article>
