Neural networks for illustration generation: towards the issue of adaptation practices

Cover Page

Cite item

Full Text

Abstract

Technologies are rapidly transforming the field of journalism. The phenomenon of convergence has long become the norm, and the term text in the media includes not only the verbal component, but also photos, videos, audio, graphics - that is, it represents a creolized text. One of the challenges of our time has become artificial intelligence. Many of its potential capabilities (video or audio generation) are at the beginning of their development at the time of writing this article. However, illustration generation is no longer just worth paying attention to, but is becoming a significant competitor for photographers, designers, and artists. The aim is to demonstrate this process using the example of the most flexible part of the professional journalistic community - freelance journalists, as it is shown in the article that they are often the first to introduce innovations into their activities. Within the framework of the research, several surveys were conducted involving 281 respondents and a comparative analysis of the situation in full-time and freelance journalism was carried out. Although the number of journalists who have completely replaced photo banks with neural network illustration generation may seem insignificant (3 and 8%, respectively), the general dynamics of this process is shown, which, ultimately, is unlikely to lead to a complete replacement of creative professions by artificial intelligence, but, quite possibly, will only leave the best of its representatives.

Full Text

Введение

Цифровая эпоха кардинально трансформирует нашу жизнь в целом и сферу медиа в частности. Развиваются новые средства массовой ин­формации, а блогеры, стримеры, гражданские журналисты и случайные свидетели событий становятся все более сильными конкурентами профессионалам. Активизируются и новые формы занятости. Фрилансеры занимают существенную и постоянную долю авторов в большинстве СМИ, а редакторы при планировании и создании контента все чаще полагаются на внештатных сотрудников (Josephi, O’Donnell, 2022; Norbäck, 2022), особенно после коронавирусной пандемии и локдауна (Himma-Kadakas, Mõttus, 2021).

Новым и актуальным вызовом остается искусственный интеллект (ИИ). С его помощью уже можно создавать вполне читабельный текст, не требующий редактирования, фотореалистичные иллюстрации, делать грамотные переводы, анализировать большие объемы информации. Авто­ры из Московского государственного университета, изучающие вопрос использования нейросетей в СМИ, отмечают, что ведущие медиа давно используют эти технологии (Давыдов и др., 2023). Внедряют новинки в свою работу и ученые. Они даже публикуют научные статьи в соавторстве с искусственным интеллектом (Pavlik, 2023). Нейросети изучаются и в педагогических целях (Alkamel, Alwagieh, 2024), многие исследователи подчеркивают необходимость обучать этим навыкам и студентов (Rufai et al., 2024;  Рогов, 2024). Не первый год исследуются и возможности генерации иллюстраций для медиа. В итоге выделяются такие популярные нейросети, как Midjourney, Stable Diffusion, DALL-E, Dream (Зимина, 2023), описываются возможные риски того, что некоторые журналисты могут в будущем лишиться работы (Мальцев, 2022). Возникает проблема авторского права (Чумичева, 2024), поскольку точно не ясно, кто является автором конкретного изображения, сгенерированного в нейросети. Тем не менее, несмотря на некоторые проблемы, искусственный интеллект развивается и делает это очень быстро. Растет и его применение специалистами – медиакоммуникаторами, в том числе и журналистами.

В рамках настоящей статьи мы выдвинули гипотезу, что медиафрилансеры чаще генерируют изображения в нейросетях, чем их штатные коллеги. Предполагая это, мы отталкивались от следующих пунктов.

  1. Труд фрилансеров больше востребован в нишевых изданиях, нежели общественно-политических, а они чаще не имеют собственных фотографий. Изображения, публикуемые в материалах таких СМИ, обычно имеют иллюстративный характер. Ранее подобные картинки медиафрилансеры искали в фотобанках. Однако в рамках развития нейросетей сгенерировать подходящий образец оказывается намного быстрее, нежели искать его, особенно если доступен только бесплатный контент.
  2. Фрилансеры быстрее штатных коллег внедряют в работу новинки: они лишены обязанности многоэтапных утверждений революционных решений; могут предложить свои услуги любому изданию – если текущий заказчик не принимает сгенерированные в нейросети иллюстрации, фрилансер легче уйдет в другое СМИ, чем штатный журналист; личная заинтересованность – ускорение работы увеличивает доход медиафрилансера, а не издания.

Методы и материалы

Проверяя свою гипотезу, мы провели несколько опросов. Формулировка вопросов была разной, поскольку они размещались на разных площадках. Безусловно, пост в социальной сети в формате «Подслушано» отличается от интервью в СМИ или опроса, проведенного лично. Однако, как бы ни был сформулирован конкретный вопрос, нас интересовало, предпочитает ли респондент нейросети фотобанкам, когда у него нет своей иллюстрации при создании контента для медиа. И ответ на данный вопрос был понятен на всех выбранных площадках.

  1. Мы инициировали опрос в группе «ВКонтакте» – «Подслушано Копирайтинг»[1]. Здесь стоит подчеркнуть, что границы журналистики как профессии размываются, а самоидентификация журналистов претерпевает трансформации. Современные журналисты чаще называют себя копирайтерами, райтерами, рерайтерами, контент-мейкерами, сторис-мейкерами и др. Вот и название данного паблика отражает эти тенденции, хотя его подписчики занимаются созданием контента для медиа как фрилансеры.
    Вопрос был сформулирован следующим образом: «А вы чаще используете фотобанки или нейросети, когда нет своей иллюстрации, а надо?»[2] Варианты ответов: «фотобанки», «нейросети», «по ситуации, 50/50». Площадка также позволяет предложить собственный вариант ответа в комментарии. Вопрос был опубликован 17.04.2024 и проверен 11.05.2024.
  2. Мы опубликовали опрос в группах «Медиа Фриланс»[3] 09.05.2024, результаты проверили 11.05.2024. Это проект авторов настоящей статьи, созданный для медиафрилансеров. Вопрос стал частью более обширного исследования и был сформулирован следующим образом: «А вы заменили какие-то задачи на работу с ИИ? (То, что раньше вы делали регулярно, а сейчас делаете в нейросети.)» Один из ответов касался фотобанков: «Раньше приходилось искать в фотобанках иллюстрации, сейчас генерирую их в нейросети (всегда или чаще всего)».
  3. В апреле 2024 года, с привлечением в качестве помощников студентов факультета журналистики Уральского федерального университета, мы провели опрос штатных и внештатных сотрудников. Вопросов было несколько. Респондент должен быть обозначить свой статус (штатный или внештатный журналист). В числе вопросов: «Использовали ли Вы в работе фотобанки? Если да, то с появлением нейросетей стали ли Вы использовать фотобанки реже? Насколько реже? Например, совсем перестали использовать или используете 50/50? Какие нейросети исполь­зуете?»
  4. В мае 2024 года мы взяли пять экспертных интервью у медиафрилансеров на тему использования ими нейросетей в работе. Интересующий нас в рамках настоящего исследования вопрос чаще всего входил в более общий, например: «Какие виды деятельности вы заменили на работу с ИИ?», «Какими нейросетями и с какими целями вы чаще всего пользуетесь в работе?», «Давайте начнем с ваших любимых нейросетей: чем вы пользуетесь и в каких целях?» (только однажды мы сформулировали вопрос конкретнее: «Вы использовали в работе фотобанки? Заменили ли их сейчас на генерацию картинок с помощью нейросетей?»). Однако непосредственно в разговоре мы всегда конкретизировали, перечисляя возможные варианты, упоминали генерацию иллюстраций как замену фотобанков, поэтому в ответах позиция героя по данной теме во всех интервью отражена. Интервью опубликованы в пабликах «Медиа Фриланс» 5, 7, 9, 11 и 13 мая.

В общей сложности мы получили ответы от 281 респондента (101 штатного журналиста и 180 медиафрилансеров). Тем не менее, настоящее исследование мы, конечно, считаем пилотным, разведывательным и отражающим скорее общие тенденции и мнения, нежели точные цифры, поскольку для получения конкретных данных выборка должна быть не меньше тысячи человек. Кроме того, большинство наших респондентов проживает в Екатеринбурге, поэтому было бы неверно экстраполировать данные на всю Россию или мир. Относительно сферы медиа ситуация также может отличаться в различных СМИ и при выполнении разного типа работ. Ввиду указанных ограничений характер исследования мы определяем как пилотный.

В качестве дополнительного аргумента провели анализ посещаемости одного из популярных бесплатных фотобанков Pixabay[4], предположив в качестве гипотезы, что посещаемость его падает с развитием нейросетей.

Мы также проанализировали популярный сайт вакансий HeadHunter[5] на предмет упоминаний в тексте вакансий для журналистов нейросетей, осуществили поиск по удаленным вакансиям и на полный день, чтобы сравнить показатели. Мы предположили, что от внештатных авторов работодатели (заказчики) чаще требуют навыки работы с нейросетями.

Результаты и обсуждение

Говоря об иллюстрациях, создаваемых нейросетями, начнем с того, что сгенерированные картинки не используются (и не должны!) в общественно-политических изданиях при освещении реальных событий (хотя и здесь можно представить ситуацию, когда необходима графика или воссоздание события при отсутствии или недостаточности фотографий и видео).

Вместе с тем, как уже упоминалось выше, существует огромное количество нишевых, узкоспециализированных изданий, где изображения выполняют сугубо иллюстративную функцию. Ранее такие СМИ использовали фотобанки: крупные издания – собственные, средние – вкладывались в платную подписку (самым популярным остается Shutterstock), мелкие – бесплатные (наиболее востребованный – Pixabay). Однако в бесплатном фотобанке довольно сложно найти иллюстрацию, которая идеально подходит под формат издания и отражает содержание публикации. Из собственного опыта в практической журналистике добавим, что поиск одного нужного изображения может занять часы, и замена такой работы на генерацию в нейросети выглядит весьма логичным решением.

Однако наш опрос показал, что лишь немногие полностью заменили фотобанки на работу с нейросетями: всего 3% штатных журналистов и 8% медиафрилансеров.

Штатные журналисты чаще фрилансеров полностью отвергают идею использования нейросетей для генерации иллюстраций в СМИ (64 против 22%). Нередко это объясняется политикой и форматом издания («Наше СМИ предпочитает традиционные методы»; «Это будет противоречить формату издания»; «Работаю в госиздании, и тут не приветствуется использование других источников, в частности нейросетей»; «Мы про объективность и достоверность сведений – про реальность. И если к нашим материалам о “реальности” тут же добавлять “искусственные” фотографии, у наших читателей это вызовет диссонанс») или его тематикой («В спортивных СМИ фото эмоций важнее»; «Для нашего контента нужны реальные фотографии мест»).

В основном штатные журналисты считают, что генерация картинок в нейросети используется для развлекательного контента («ИИ сейчас используем только при работе с развлекательным контентом: создание мемов, генерация развлекательных картинок»; «На некоторые праздники можно повеселиться и, например, заставить нейросеть раскрасить пасхальные яйца»; «У нас мало развлекательного контента, который по большей части генерируют AI») или узких прикладных задач (инфографики, редактирования старых фотографий).

В противоположность этому подходу медиафрилансеры, отвергающие ИИ, объясняют свои действия низким качеством результата («Нейросеть все-таки генерирует не всегда то, что надо»; «Пока не полностью понимает, что я хочу»). Однако те, кто освоил навыки формулирования промтов, отказываются от фотобанков в большей или меньшей степени («Раньше мы использовали фотобанки на полную катушку, но с появлением генеративных нейросетей лично для меня обращение к фотобанкам ушло в ноль, кроме очень точных репортажных фото»).

Показательно и сравнение штатных и внештатных журналистов, использующих и фотобанки и нейросети. Штатные коллеги при этом чаще склоняются к фотобанкам (22%, при незначительном проценте тех, кто использует ИИ, или и то, и другое 50/50). Фрилансеры, практикующие оба варианта, тоже чаще предпочитают фотобанки (29%), но доля остальных уже заслуживает внимания: почти 18% больше склоняются к ИИ и 24% используют их 50/50.

Таким образом, можно констатировать, что медиафрилансеры значительно чаще штатных коллег используют нейросети для генерации изображений. Данный вывод подтверждает нашу гипотезу и объясняется следующим:

  • изображения с иллюстративной функцией чаще применяются в нишевых, узкоспециализированных изданиях, где работают в основном фрилансеры, а вот общественно-политические СМИ, имеющие большой штат, в большинстве случаев, конечно, должны иметь реальные фотографии и видео;
  • фрилансер, работающий в одиночестве и нередко без посещения реальных мест и мероприятий, часто не имеет собственных фотографий – в противовес штатным коллегам, обычно имеющим фотографа и фотоархив издания.
  • Назовем также причины, озвученные ранее:
  • личная заинтересованность фрилансера в ускорении процесса (когда сгенерировать быстрее, чем искать в фотобанке);
  • отсутствие многоэтапных утверждений при внедрении новинок и возможность сотрудничать с любыми СМИ;
  • мотивация фрилансеров к самообразованию, что позволяет им освоить искусство формулирования промтов.

Среди популярных для генерации иллюстраций нейросетей лидируют Midjourney и Kandinsky. Упоминались также Stable Diffusion, Leonardo, «Шедеврум», Dream by Wombo, ArtGeneration, Bing Image Creator, Starryai, DeepAI и др.

В дополнение 13.08.2024 мы провели поиск по вакансиям для журналистов, используя один из наиболее популярных и активных сайтов вакансий – HeadHunter. Мы зашли в расширенный поиск и указали следующие данные:

  • специализация – «Журналист, корреспондент» и «Копирайтер, редактор, корректор»;
  • убрали регион;
  • график работы – «Удаленная работа»;
  • выводить – «За все время»;
  • остальное отметили как не имеющее значения.

В строке с ключевыми словами указали: «искусственный интеллект», OR нейросеть, OR Midjourney, OR Kandinsky, OR Stable Diffusion, OR Leonardo, OR «Шедеврум», OR Dream by Wombo, OR ArtGeneration, OR Bing Image Creator, OR Starryai OR DeepAI. Запрос означает, что мы просим систему найти любое из этих слов/словосочетаний и допускаем разные падежи. Галочками отметили, что искать данные слова надо только в названии или описании вакансии. Система выдала нам 272 вакансии, без ключевых слов – 1169.

Затем мы провели аналогичный поиск, только в качестве графика работы указали «полный день». Несмотря на то что такая опция пред­полагает офисную работу, мы не стали ограничивать поиск конкретным регионом. Результаты следующие: с указанными ключевыми словами – 57 вакансий, без ключевых слов – 1460.

Таким образом, если журналист ищет удаленную работу, то 23% предложений на рынке требуют умения работать с нейросетями, а если офисную, – то менее 4%. Логично, что медиафрилансеры больше стремятся освоить данный навык, чем штатные журналисты. Конечно, тут возможна погрешность: работодатель (заказчик) мог указать, например, слово «нейросеть» в рамках обязанности генерировать текст, а не иллюстрации, или написать: «В работе нельзя использовать нейросети». Он мог указать другую (не перечисленную нами) нейросеть или написать ее название с ошибкой. Однако в рамках данной статьи нас больше интересует разница между штатной и внештатной журналистикой, и, думается, наши цифры демонстрируют существенный разрыв.

Мы также изучили статистику посещаемости фотобанка, выбрав наиболее популярный из бесплатных – Pixabay. Проанализировали его с помощью сервиса Similarweb[6]. Он выдает информацию о посещаемости за последние три месяца, но у нас есть сведения с декабря 2023 по июль 2024 года включительно, поскольку мы проверили его 28.03.2024, 12.05.2024 и 13.08.2024. Руководствуясь полученной статистикой, можно сделать вывод, что за указанный период посещаемость фотобанка Pixabay упала с 36 до 32 млн посетителей в месяц, то есть более чем на 11%. Полагаем, что это также является подтверждением вышеизложенной статистики, которая демонстрирует, что для части журналистов фотобанки полностью или частично заменены нейросетями.

Заключение

Искусственный интеллект на данном этапе еще развивается. Однако уже сейчас он позволяет снять с человека примитивные задачи, а также позволяет создавать что-то тем, кто от природы не обладает творческими способностями. Креатив искусственного интеллекта подвергается (зачастую справедливой) критике, но сложно спорить с тем, что индивид, не обладающий навыками художника, способен сделать иллюстрацию, которая будет в точности отражать заданную тему и будет в нужном стиле, в том числе фотореалистичном. Для этого нужно лишь освоить искусство формулирования промтов.

Профессиональные художники, дизайнеры и фотографы часто критикуют «искусственные» иллюстрации: иногда заслуженно, а порой из страха за собственное будущее. Но стоит согласиться с исследователями, отмечающими, что нейросеть – это просто инструмент. Настоящим творцам она не конкурент, а помощник, освобождающий время для истинного творчества. Некоторые издания определенно выберут сэкономить бюджет, если для их концепции сгенерированных иллюстраций вполне достаточно. И этот путь начинается с отказа от фотобанков.

Рискнем предположить, что с дальнейшим развитием искусственного интеллекта работа художника, дизайнера и фотографа останется преимущественно в самых крупных изданиях с большим бюджетом, а «ручной» труд в данной сфере будет оплачиваться выше, к примеру, как сейчас ручная вышивка или авторская мебель, если сравнивать услугу с привычным машинным производством. Эта работа перейдет в разряд VIP-качества: в профессии останутся только лучшие специалисты, а в числе заказчиков и потребителей – особые ценители.

 

 

1 Подслушано Копирайтинг // ВКонтакте. URL: https://vk.com/pod_copy (дата обращения: 11.05.2024).

2 Пост от 17.04.2024. Подслушано Копирайтинг // ВКонтакте. URL: https://vk.com/wall-123495637_805318 (дата обращения: 11.05.2024).

3 Медиа Фриланс // ВКонтакте. URL: https://vk.com/media_freelance (дата обращения: 11.05.2024); Медиа Фриланс // Telegram. URL: https://t.me/mediafreelance (дата обращения: 11.05.2024).

4 Pixabay. URL: https://pixabay.com (дата обращения: 13.08.2024).

5 HeadHunter. URL: https://hh.ru (дата обращения: 13.08.2024).

6 Similarweb. URL: https://similarweb.com (дата обращения: 13.08.2024).

×

About the authors

Olga S. Mukhina

Ural Federal University named after the first President of Russia B.N. Yeltsin

Author for correspondence.
Email: olga.mukhina@urfu.ru
ORCID iD: 0000-0001-8791-6086

PhD in Philology, Associate Professor of the Department Periodical Press and Online Media

19 Mira St, Yekaterinburg, 620000, Russian Federation

Vladimir F. Oleshko

Ural Federal University named after the first President of Russia B.N. Yeltsin

Email: vladimir.oleshko@urfu.ru
ORCID iD: 0000-0003-3001-7391

Grand PhD in Philosophy, Professor, Head of the Department of Periodical Press and Online Media

19 Mira St, Yekaterinburg, 620000, Russian Federation

References

  1. Alkamel, M.A.A., & Alwagieh, N.A.S. (2024). Utilizing an adaptable artificial intelligence writing tool (ChatGPT) to enhance academic writing skills among Yemeni university EFL students. Social Sciences & Humanities Open, 10, 101095. https://doi.org/10.1016/j.ssaho.2024.101095
  2. Chumicheva, N.V. (2024). On the issue of legal regulation of the use of neural networks to create photo and video content. Modern scientific research: historical experience and innovations. Proceedings of the XX International (polythematic) scientific and practical conference (pp. 82–86). Krasnodar: IMSIT Publ. (In Russ.)
  3. Davydov, S.G., Zamkov, A.V., Krasheninnikova, M.A., & Lukina, M.M. (2023). The use of artificial intelligence technologies in Russian media and journalism. Vestn. Mosk. un-ta. Ser. 10: Zhurnalistika, (5), 3–21. (In Russ.) https://doi.org/10.30547/vestnik.journ.5.2023.32
  4. Josephi, B., & O’Donnell, P. (2022). The blurring line between freelance journalists and self-employed media workers. Journalism, 24(1), 139–156. https://doi.org/10.1177/14648849221086806
  5. Himma-Kadakas, M., & Mõttus, M. (2021). Ready to Hire a Freelance Journalist: The Change in Estonian Newsrooms’ Willingness to Outsource Journalistic Content Production. Central European Journal of Communication, 14(1), 27–43. https://doi.org/10.51480/1899-5101.14.1(28).2
  6. Malcev, N.D. (2022). The use of neural network technologies in mass media. In Journalism in the era of digital transformations: Values and practices. Proceedings of the X International Scientific and practical Conference (pp. 38–45). Tambov: Derzhavinsky Publ. (In Russ.)
  7. Norbäck, M. (2022). Maintaining a Freelance Career: How Journalists Generate and Evaluate Freelance Work. Journalism Studies, 23(10), 1141–1159. https://doi.org/10.1080/1461670X.2022.2073257
  8. Pavlik, J.V. (2023). Collaborating with ChatGPT: Considering the Implications of Generative Artificial Intelligence for Journalism and Media Education. Journalism & Mass Communication Educator, 78(1), 84–93. https://doi.org/10.1177/10776958221149577
  9. Rogov, A.A. (2024). Technologies of artificial intelligence and neural networks in design. Design education – the XXI century. Proceedings of the Russian scientific and practical conference with international participation (pp. 40–43). Belgorod: BGIIK. (In Russ.)
  10. Rufai, A.A., Khan, M.S.H., & Hasan, M. (2024). An exploration of pedagogical approaches in teaching artificial intelligence courses: Experience from undergraduates students of Bangladesh. Social Sciences & Humanities Open, 10. https://doi.org/10.1016/j.ssaho.2024.101075
  11. Zimina, L.V. (2023). Neural Networks in the Book Publishing Industry. Bibliography and Bibliology, (2), 48–66. (In Russ.) https://doi.org/10.25281/2411-2305-2023-2-48-66–23

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2024 Mukhina O.S., Oleshko V.F.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.