Язык вирусных фейковых новостей: корпусный подход к анализу русскоязычной дезинформации о Covid-19
- Авторы: Моногарова А.Г.1, Ширяева Т.А.1, Тихонова Е.В.2
-
Учреждения:
- Пятигорский государственный университет
- МГИМО МИД России
- Выпуск: Том 27, № 3 (2023)
- Страницы: 543-569
- Раздел: Статьи
- URL: https://journals.rudn.ru/linguistics/article/view/36169
- DOI: https://doi.org/10.22363/2687-0088-33757
- EDN: https://elibrary.ru/MRDMOZ
Цитировать
Полный текст
Аннотация
С самого начала пандемии Covid-19 в 2020 году распространение нового вируса сопровождалось нарастанием инфодемии, в результате которой Интернет-пользователи получали огромное количество ложной и потенциально опасной информации. Социальные сети и онлайн-мессенджеры сыграли важную роль в транслировании различных фейковых сообщений о Covid-19. Отсутствие эффективного инструмента обнаружения текстов, содержащих дезинформацию, по-прежнему является серьезной проблемой. Интересным видится рассмотрение специфических характеристик подобного контента с позиций корпусной лингвистики. Цель настоящей статьи - на основе изучения русскоязычных текстов вирусных фейковых историй о Covid-19 определить ключевые языковые черты, отличающие подобные истории от аутентичных новостей, а также выявить лексические особенности языка фейков. Исследование проводилось на материале составленного авторами диахронического корпуса русскоязычных фейков о Covid-19 (целевой корпус, состоящий из 897 текстов), распространяемых российскими пользователями через социальные сети и мобильные мессенджеры в период с марта 2020 по март 2022 года, а также референтного корпуса, в текстах которого представлена подтвержденная факт-чекинговыми организациями информация о коронавирусе. В качестве первого шага мы сравнили представленность различных лингвистических особенностей в целевом и референтном корпусах. Кроме того, мы извлекли из целевого корпуса несколько высокочастотных групп слов и проанализировали соответствующие контексты ложных нарративов, чтобы сделать вывод о том, можно ли рассматривать данные лексические группы в качестве специфических характеристик языка фейковых новостей. Полученные результаты позволяют выделить ключевые лексико-грамматические и стилистические различия фейковых историй и верифицированных новостей о Covid-19, а также демонстрируют эффективность корпусного подхода к выявлению лексических паттернов языка дезинформации.
Ключевые слова
Об авторах
Алина Геннадьевна Моногарова
Пятигорский государственный университет
Email: alinach12@yandex.ru
ORCID iD: 0000-0003-4098-0341
доцент кафедры английского языка и профессиональной коммуникации Пятигорского государственного университета. Ее исследовательские интересы включают корпусную лингвистику, анализ текста, стандартизацию терминологий развивающихся сфер.
Пятигорск, РоссияТатьяна Александровна Ширяева
Пятигорский государственный университет
Автор, ответственный за переписку.
Email: shiryaevat@list.ru
ORCID iD: 0000-0001-5508-8407
профессор, заведующая кафедрой английского языка и профессиональной коммуникации Пятигорского государственного университета, главный редактор научно-исследовательского журнала «Профессиональная коммуникация: актуальные вопросы языкознания и методики обучения». Ее научные интересы сосредоточены на дискурс-анализе, социокогнитивной лингвистике, в особенности на исследованиях профессионального дискурса, теории и практики межкультурного профессионального и делового общения, английского языка для специальных целей, жанрового анализа и прагматики. Она является автором и соавтором более 200 публикаций, среди которых статьи в высокорейтинговых журналах, включая Heliyon, Humanities and Social Sciences Reviews, International Journal of Arabic-English Studies, Journal of Language and Education и др.
Пятигорск, РоссияЕлена Викторовна Тихонова
МГИМО МИД России
Email: etihonova@gmail.com
ORCID iD: 0000-0001-8252-6150
доцент кафедры иностранных языков МГИМО МИД России. Является заместителем главного редактора международного научно-исследовательского журнала Journal of Language and Education. Сфера ее научных интересов - дискурс-анализ, социокогнитивная лингвистика, психолингвистика. Реализует исследования в сфере английского языка для специальных целей, жанрового анализа, прагматики, академического письма. Опубликовала ряд статей в высококвартильных международных журналах. Является членом и лектором Ассоциации научных редакторов и издателей (АНРИ).
Москва, РоссияСписок литературы
- Ahmed, Hadeer. 2017. Detecting Opinion Spam and Fake News Using n-Gram Analysis and Semantic Similarity. University of Ahram Canadian.
- Ahmed, Hadeer, Issa Traore & Sherif Saad. 2018. Detecting opinion spams and fake news using text classification. Security and privacy 1 (1). 1-15. https://doi.org/10.1002/spy2.9
- Allcott, Hunt & Matthew Gentzkow. 2017. Social media and fake news in the 2016 election. Journal of Economic Perspectives 31 (2). 211-236. https://doi.org/10.1257/jep.31.2.211
- Al-Salman, Saleh & Ahmad S. Haider. 2021. COVID-19 trending neologisms and word formation processes in English. Russian Journal of Linguistics 25 (1). 24-42. https://doi.org/10.22363/2687-0088-2021-25-1-24-42
- Baron, Alistair, Paul Rayson & Dawn Elizabeth Archer. 2009. Word frequency and key word statistics in historical corpus linguistics. Anglistik: International Journal of English Studies 20 (1). 41-67.
- Biber, Douglas & Susan Conrad. 2019. Register, Genre, and Style. Cambridge University
- Brezina, Vaclav. 2018. Statistics in Corpus Linguistics: A Practical Guide. Cambridge University Press. https://doi.org/10.1017/9781316410899.008
- Chen, Lian-Ching, Kuei-Hu Chang & Hsiang-Yu Chung. 2020. A novel statistic-based corpus machine processing approach to refine a big textual data: An ESP Case of COVID-19 News Reports. Applied Sciences 10 (16). 5505. https://doi.org/10.3390/app10165505
- Christopher, S. Butler & Anne-Marie Simon-Vandenbergen. 2021. Social and physical distance/distancing: A corpus-based analysis of recent changes in usage. Corpus Pragmat 5 (4). 427-462. https://doi.org/10.1007/s41701-021-00107-2
- Curzan, Anne. 2009. Historical corpus linguistics and evidence of language change. In Anke Lüdeling & Merja Kytö (eds.), Corpus linguistics: An international handbook, 1091-1109. De Gruyter Mouton. https://doi.org/10.1515/9783110213881.2.1091
- Essam, Bacem A. & Muhammad S. Abdo. 2021. How do Arab tweeters perceive the Covid-19 pandemic? Journal of Psycholinguistic Research 50. 507-521. https://doi.org/10.1007/s10936-020-09715-6
- Gjylbegaj, Viola. 2018. Fake news in the age of social media. International E-Journal of Advances in Social Sciences 4 (11). 383-391. https://doi.org/10.18769/ijasos.455663
- Goddard, Cliff & Anna Wierzbicka. 2021. Semantics in the time of coronavirus: “Virus”, “bacteria”, “germs”, “disease” and related concepts. Russian Journal of Linguistics 25 (1). 7-23. https://doi.org/10.22363/2687-0088-2021-25-1-7-23
- Grieve, Jack & Helena Woodfield. 2023. The Language of fake. News Series: Elements in Forensic Linguistics, https://www.cambridge.org/core/elements/language-of-fake-news/7B37014A5C0768AEE806167E8ADD5897. (accessed 11 January 2023).
- Habgood-Coote, Joshua. 2019. Stop talking about fake news! Inquiry 62. 1033-1065.
- Ivanova, Irina. 2020. Pragmatic functions of interrogatives in media texts. Media Linguistics 7 (4). 501-515.
- Islam, Md Saiful, Tonmoy Sarkar, Sazzad Hossain Khan, Abu-Hena Mostofa Kamal, S M Murshid Hasan, Alamgir Kabir, Dalia Yeasmin, Mohammad Ariful Islam, Kamal Ibne Amin Chowdhury, Kazi Selim Anwar, Abrar Ahmad Chughtai & Holly Seale. 2020. Covid-19-Related infodemic and its impact on public health: A global social media analysis. American Journal of Tropical Medicine and Hygiene 103 (4). 1621-1629.
- Khan, Ali, Kathryn Brohman & Shamel Addas. 2021. The anatomy of ‘fake news’: Studying false messages as digital objects. Journal of Information Technology 37 (2).
- Kopytowska, Monika & Radosław Krakowiak. 2020. Online incivility in times of Covid-19: Social disunity and misperceptions of tourism industry in Poland. Russian Journal of Linguistics 24 (4). 743-773. https://doi.org/10.22363/2687-0088-2020-24-4-743-773
- Kuzmin, Gleb, Daniil Larionov, Dina Pisarevskaya & Ivan Smirnov. 2020. Fake news detection for the Russian language. In Proceedings of the 3rd International Workshop on Rumours and Deception in Social Media (RDSM). 45-57.
- Kytö, Merja. 2010. Data in historical pragmatics. In Jucker Taavitsainen & Irma Taavitsainen (eds.), Historical pragmatics. Berlin/New York: Walter de Gruyter Handbooks of Pragmatics https://doi.org/10.1515/9783110214284.2.33
- Lun, Wong Wei, Mazura Masture Muhammad, Muhamad Fadzllah Zaini, Rahimy Damit, Carrine Teoh-Ong, Charanjit Kaur Swaran Singh & Norhayati Yusoff. 2022. Analysis of Covid-19 related phrases using corpus-based tools: Dualisms language & technology. Journal of Positive School Psychology 6 (3). 5034-5044.
- Mahyoob, Mohammad, Jeehaan Algaraady & Musaad Alrahaili. 2021. Linguistic-based detection of fake news in social Media. International Journal of English Linguistics 11 (1). 99-109. https://doi.org/10.5539/ijel.v11n1p99
- McCulloch, Gretchen. 2019. Because Internet: Understanding the New Rules of Language. Riverhead Books.
- Monogarova, Alina, Tatiana Shiryaeva & Nadezda Arupova. 2021. The language of Russian fake stories: a corpus-based study of the topical change in the viral disinformation. Journal of Language and Education 7 (4). 83-106. https://doi.org/10.17323/jle.2021.13371
- Muslimah, Ryza Wahyu. 2020. A corpus-based analysis of critical strategies in Covid-19 corpora. Journal of Linguistics and Literature 4 (2). 258-268. https://doi.org/10.33019/lire.v4i2.89
- Oehmichen, Axel, Kevin Hua, Julio Amador Diaz Lopez, Miguel Molina-Solana, Juan Gómez-Romero & Yike Guo. 2019. Not All Lies Are Equal. A Study Into the Engineering of Political Misinformation in the 2016 US Presidential Election. IEEE Access (99) 1-1. 1-6.
- Pavlina, Svetlana. 2022. Pragmatic and stylistic perspectives on British and American COVID-19 cartoons. Russian Journal of Linguistics 26 (1). 162-193. https://doi.org/10.22363/2687-0088-27107
- Peng, Zhibin & Zhiong Hu. 2022. A bibliometric analysis of linguistic research on COVID-19. Frontiers in Psychology 13. https://doi.org/10.3389/fpsyg.2022.1005487
- Pisarevskaya, Dina. 2017. Deception detection in news reports in the Russian language: Lexics and discourse. In Proceedings of the 2017 EMNLP Workshop: Natural Language Processing meets Journalism. 74-79.
- Ponton, Douglas M. 2021. “Never in my life have I heard such a load of absolute nonsense. Wtf.” Political satire on the handling of the COVID-19 crisis. Russian Journal of Linguistics 25 (3). 767-788. https://doi.org/10.22363/2687-0088-2021-25-3-767-788
- Rashkin, Hannah, Eunsol Choi, Jin Yea Jang, Svitlana Volkova & Yejin Choi. 2017. Truth of varying shades: Analyzing language in fake news and political fact-checking. In Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing. 2931-2937. https://doi.org/10.18653/v1/D17-1317
- Rayson, Paul. 2019. Corpus analysis of key words. In Carol A. Chapelle (ed.), The encyclopaedia of applied linguistics, 1-7. Oxford: Wiley-Blackwell.
- Rayson, Paul & Roger Garside. 2000. Comparing corpora using frequency profiling. In The Workshop on Comparing Corpora. Hong Kong, China. Association for Computational Linguistics. 1-6. https://doi.org/10.3115/1117729.1117730
- Sinclair, John. 1991. Corpus, Concordance, Collocation. Oxford University Press.
- Sutu, Rodica Melinda. 2020. Fake news, from social media to television case study of the Romanian presidential elections 2019. Styles of Communication 11(2). 81-92.
- Tandoc, Edson & Zheng Wei Lim. 2017. Defining “Fake News”: A typology of scholarly definitions. Digital Journalism 6 (3). 1-17. https://doi.org/10.1080/21670811.2017.1360143
- Torabi Asr, Fatemeh & Maite Taboada 2019. Big Data and quality data for fake news and misinformation detection. Big Data & Society 6 (1).
- Yu, Hangyan, Huiling Lu & Jie Hu. 2021. A corpus-based critical discourse analysis of news reports on the COVID-19 pandemic in China and the UK. International Journal of English Linguistics 11 (2). 36. https://doi.org/10.5539/ijel.v11n2p36
- Zhang, Xichen & Ali A. Ghorbani. 2020. An overview of online fake news: Characterization, detection, and discussion. Information processing and management 57 (2). https://doi.org/10.1016/j.ipm.2019.03.004
- Beckett, Charlie. 2017. ‘Fake news’: The best thing that’s happened to Journalism at Polis. (http://blogs.lse.ac.uk/polis/2017/03/11/fake-news-thebest-thing-thats-happened-to-journalism/) (accessed 11 January 2023)
- How Bill Gates became the voodoo doll of Covid conspiracies (6 June 2020). BBC News. (https://www.bbc.com/news/technology-52833706) (accessed 25 October 2022)