Нейросети для генерации иллюстраций: к проблеме адаптационных практик

Обложка

Цитировать

Полный текст

Аннотация

Технологии стремительно трансформируют сферу журналистики. Феномен конвергенции давно стал нормой, а термин «текст» в медиа включает в себя не только вербальный компонент, но и многое другое: фото, видео, аудио, графику. Одним из вызовов современности стал искусственный интеллект. Многие его потенциальные возможности (генерация видео или аудио) на момент написания настоящей работы находятся на первом этапе своего развития. Однако генерация иллюстраций уже не только заслуживает внимания, но и становится значимым конкурентом для фотографов, дизайнеров и художников. Цель - показать этот процесс на примере наиболее гибкой части профессионального журналистского сообщества - медиафрилансеров, поскольку в свою деятельность они зачастую первыми внедряют новинки. В рамках исследования проведено несколько опросов с участием 281 респондента, осуществлен сравнительный анализ ситуации в штатной и внештатной журналистике. Несмотря на то что число журналистов, полностью заменивших фотобанки на генерацию иллюстраций в нейросетях, может показаться незначительным (3 и 8% соответственно), проявляется общая динамика этого процесса, который, в итоге, вряд ли приведет к полной замене творческих профессий, но, вполне возможно, оставит только лучших их представителей.

Полный текст

Введение

Цифровая эпоха кардинально трансформирует нашу жизнь в целом и сферу медиа в частности. Развиваются новые средства массовой ин­формации, а блогеры, стримеры, гражданские журналисты и случайные свидетели событий становятся все более сильными конкурентами профессионалам. Активизируются и новые формы занятости. Фрилансеры занимают существенную и постоянную долю авторов в большинстве СМИ, а редакторы при планировании и создании контента все чаще полагаются на внештатных сотрудников (Josephi, O’Donnell, 2022; Norbäck, 2022), особенно после коронавирусной пандемии и локдауна (Himma-Kadakas, Mõttus, 2021).

Новым и актуальным вызовом остается искусственный интеллект (ИИ). С его помощью уже можно создавать вполне читабельный текст, не требующий редактирования, фотореалистичные иллюстрации, делать грамотные переводы, анализировать большие объемы информации. Авто­ры из Московского государственного университета, изучающие вопрос использования нейросетей в СМИ, отмечают, что ведущие медиа давно используют эти технологии (Давыдов и др., 2023). Внедряют новинки в свою работу и ученые. Они даже публикуют научные статьи в соавторстве с искусственным интеллектом (Pavlik, 2023). Нейросети изучаются и в педагогических целях (Alkamel, Alwagieh, 2024), многие исследователи подчеркивают необходимость обучать этим навыкам и студентов (Rufai et al., 2024;  Рогов, 2024). Не первый год исследуются и возможности генерации иллюстраций для медиа. В итоге выделяются такие популярные нейросети, как Midjourney, Stable Diffusion, DALL-E, Dream (Зимина, 2023), описываются возможные риски того, что некоторые журналисты могут в будущем лишиться работы (Мальцев, 2022). Возникает проблема авторского права (Чумичева, 2024), поскольку точно не ясно, кто является автором конкретного изображения, сгенерированного в нейросети. Тем не менее, несмотря на некоторые проблемы, искусственный интеллект развивается и делает это очень быстро. Растет и его применение специалистами – медиакоммуникаторами, в том числе и журналистами.

В рамках настоящей статьи мы выдвинули гипотезу, что медиафрилансеры чаще генерируют изображения в нейросетях, чем их штатные коллеги. Предполагая это, мы отталкивались от следующих пунктов.

  1. Труд фрилансеров больше востребован в нишевых изданиях, нежели общественно-политических, а они чаще не имеют собственных фотографий. Изображения, публикуемые в материалах таких СМИ, обычно имеют иллюстративный характер. Ранее подобные картинки медиафрилансеры искали в фотобанках. Однако в рамках развития нейросетей сгенерировать подходящий образец оказывается намного быстрее, нежели искать его, особенно если доступен только бесплатный контент.
  2. Фрилансеры быстрее штатных коллег внедряют в работу новинки: они лишены обязанности многоэтапных утверждений революционных решений; могут предложить свои услуги любому изданию – если текущий заказчик не принимает сгенерированные в нейросети иллюстрации, фрилансер легче уйдет в другое СМИ, чем штатный журналист; личная заинтересованность – ускорение работы увеличивает доход медиафрилансера, а не издания.

Методы и материалы

Проверяя свою гипотезу, мы провели несколько опросов. Формулировка вопросов была разной, поскольку они размещались на разных площадках. Безусловно, пост в социальной сети в формате «Подслушано» отличается от интервью в СМИ или опроса, проведенного лично. Однако, как бы ни был сформулирован конкретный вопрос, нас интересовало, предпочитает ли респондент нейросети фотобанкам, когда у него нет своей иллюстрации при создании контента для медиа. И ответ на данный вопрос был понятен на всех выбранных площадках.

  1. Мы инициировали опрос в группе «ВКонтакте» – «Подслушано Копирайтинг»[1]. Здесь стоит подчеркнуть, что границы журналистики как профессии размываются, а самоидентификация журналистов претерпевает трансформации. Современные журналисты чаще называют себя копирайтерами, райтерами, рерайтерами, контент-мейкерами, сторис-мейкерами и др. Вот и название данного паблика отражает эти тенденции, хотя его подписчики занимаются созданием контента для медиа как фрилансеры.
    Вопрос был сформулирован следующим образом: «А вы чаще используете фотобанки или нейросети, когда нет своей иллюстрации, а надо?»[2] Варианты ответов: «фотобанки», «нейросети», «по ситуации, 50/50». Площадка также позволяет предложить собственный вариант ответа в комментарии. Вопрос был опубликован 17.04.2024 и проверен 11.05.2024.
  2. Мы опубликовали опрос в группах «Медиа Фриланс»[3] 09.05.2024, результаты проверили 11.05.2024. Это проект авторов настоящей статьи, созданный для медиафрилансеров. Вопрос стал частью более обширного исследования и был сформулирован следующим образом: «А вы заменили какие-то задачи на работу с ИИ? (То, что раньше вы делали регулярно, а сейчас делаете в нейросети.)» Один из ответов касался фотобанков: «Раньше приходилось искать в фотобанках иллюстрации, сейчас генерирую их в нейросети (всегда или чаще всего)».
  3. В апреле 2024 года, с привлечением в качестве помощников студентов факультета журналистики Уральского федерального университета, мы провели опрос штатных и внештатных сотрудников. Вопросов было несколько. Респондент должен быть обозначить свой статус (штатный или внештатный журналист). В числе вопросов: «Использовали ли Вы в работе фотобанки? Если да, то с появлением нейросетей стали ли Вы использовать фотобанки реже? Насколько реже? Например, совсем перестали использовать или используете 50/50? Какие нейросети исполь­зуете?»
  4. В мае 2024 года мы взяли пять экспертных интервью у медиафрилансеров на тему использования ими нейросетей в работе. Интересующий нас в рамках настоящего исследования вопрос чаще всего входил в более общий, например: «Какие виды деятельности вы заменили на работу с ИИ?», «Какими нейросетями и с какими целями вы чаще всего пользуетесь в работе?», «Давайте начнем с ваших любимых нейросетей: чем вы пользуетесь и в каких целях?» (только однажды мы сформулировали вопрос конкретнее: «Вы использовали в работе фотобанки? Заменили ли их сейчас на генерацию картинок с помощью нейросетей?»). Однако непосредственно в разговоре мы всегда конкретизировали, перечисляя возможные варианты, упоминали генерацию иллюстраций как замену фотобанков, поэтому в ответах позиция героя по данной теме во всех интервью отражена. Интервью опубликованы в пабликах «Медиа Фриланс» 5, 7, 9, 11 и 13 мая.

В общей сложности мы получили ответы от 281 респондента (101 штатного журналиста и 180 медиафрилансеров). Тем не менее, настоящее исследование мы, конечно, считаем пилотным, разведывательным и отражающим скорее общие тенденции и мнения, нежели точные цифры, поскольку для получения конкретных данных выборка должна быть не меньше тысячи человек. Кроме того, большинство наших респондентов проживает в Екатеринбурге, поэтому было бы неверно экстраполировать данные на всю Россию или мир. Относительно сферы медиа ситуация также может отличаться в различных СМИ и при выполнении разного типа работ. Ввиду указанных ограничений характер исследования мы определяем как пилотный.

В качестве дополнительного аргумента провели анализ посещаемости одного из популярных бесплатных фотобанков Pixabay[4], предположив в качестве гипотезы, что посещаемость его падает с развитием нейросетей.

Мы также проанализировали популярный сайт вакансий HeadHunter[5] на предмет упоминаний в тексте вакансий для журналистов нейросетей, осуществили поиск по удаленным вакансиям и на полный день, чтобы сравнить показатели. Мы предположили, что от внештатных авторов работодатели (заказчики) чаще требуют навыки работы с нейросетями.

Результаты и обсуждение

Говоря об иллюстрациях, создаваемых нейросетями, начнем с того, что сгенерированные картинки не используются (и не должны!) в общественно-политических изданиях при освещении реальных событий (хотя и здесь можно представить ситуацию, когда необходима графика или воссоздание события при отсутствии или недостаточности фотографий и видео).

Вместе с тем, как уже упоминалось выше, существует огромное количество нишевых, узкоспециализированных изданий, где изображения выполняют сугубо иллюстративную функцию. Ранее такие СМИ использовали фотобанки: крупные издания – собственные, средние – вкладывались в платную подписку (самым популярным остается Shutterstock), мелкие – бесплатные (наиболее востребованный – Pixabay). Однако в бесплатном фотобанке довольно сложно найти иллюстрацию, которая идеально подходит под формат издания и отражает содержание публикации. Из собственного опыта в практической журналистике добавим, что поиск одного нужного изображения может занять часы, и замена такой работы на генерацию в нейросети выглядит весьма логичным решением.

Однако наш опрос показал, что лишь немногие полностью заменили фотобанки на работу с нейросетями: всего 3% штатных журналистов и 8% медиафрилансеров.

Штатные журналисты чаще фрилансеров полностью отвергают идею использования нейросетей для генерации иллюстраций в СМИ (64 против 22%). Нередко это объясняется политикой и форматом издания («Наше СМИ предпочитает традиционные методы»; «Это будет противоречить формату издания»; «Работаю в госиздании, и тут не приветствуется использование других источников, в частности нейросетей»; «Мы про объективность и достоверность сведений – про реальность. И если к нашим материалам о “реальности” тут же добавлять “искусственные” фотографии, у наших читателей это вызовет диссонанс») или его тематикой («В спортивных СМИ фото эмоций важнее»; «Для нашего контента нужны реальные фотографии мест»).

В основном штатные журналисты считают, что генерация картинок в нейросети используется для развлекательного контента («ИИ сейчас используем только при работе с развлекательным контентом: создание мемов, генерация развлекательных картинок»; «На некоторые праздники можно повеселиться и, например, заставить нейросеть раскрасить пасхальные яйца»; «У нас мало развлекательного контента, который по большей части генерируют AI») или узких прикладных задач (инфографики, редактирования старых фотографий).

В противоположность этому подходу медиафрилансеры, отвергающие ИИ, объясняют свои действия низким качеством результата («Нейросеть все-таки генерирует не всегда то, что надо»; «Пока не полностью понимает, что я хочу»). Однако те, кто освоил навыки формулирования промтов, отказываются от фотобанков в большей или меньшей степени («Раньше мы использовали фотобанки на полную катушку, но с появлением генеративных нейросетей лично для меня обращение к фотобанкам ушло в ноль, кроме очень точных репортажных фото»).

Показательно и сравнение штатных и внештатных журналистов, использующих и фотобанки и нейросети. Штатные коллеги при этом чаще склоняются к фотобанкам (22%, при незначительном проценте тех, кто использует ИИ, или и то, и другое 50/50). Фрилансеры, практикующие оба варианта, тоже чаще предпочитают фотобанки (29%), но доля остальных уже заслуживает внимания: почти 18% больше склоняются к ИИ и 24% используют их 50/50.

Таким образом, можно констатировать, что медиафрилансеры значительно чаще штатных коллег используют нейросети для генерации изображений. Данный вывод подтверждает нашу гипотезу и объясняется следующим:

  • изображения с иллюстративной функцией чаще применяются в нишевых, узкоспециализированных изданиях, где работают в основном фрилансеры, а вот общественно-политические СМИ, имеющие большой штат, в большинстве случаев, конечно, должны иметь реальные фотографии и видео;
  • фрилансер, работающий в одиночестве и нередко без посещения реальных мест и мероприятий, часто не имеет собственных фотографий – в противовес штатным коллегам, обычно имеющим фотографа и фотоархив издания.
  • Назовем также причины, озвученные ранее:
  • личная заинтересованность фрилансера в ускорении процесса (когда сгенерировать быстрее, чем искать в фотобанке);
  • отсутствие многоэтапных утверждений при внедрении новинок и возможность сотрудничать с любыми СМИ;
  • мотивация фрилансеров к самообразованию, что позволяет им освоить искусство формулирования промтов.

Среди популярных для генерации иллюстраций нейросетей лидируют Midjourney и Kandinsky. Упоминались также Stable Diffusion, Leonardo, «Шедеврум», Dream by Wombo, ArtGeneration, Bing Image Creator, Starryai, DeepAI и др.

В дополнение 13.08.2024 мы провели поиск по вакансиям для журналистов, используя один из наиболее популярных и активных сайтов вакансий – HeadHunter. Мы зашли в расширенный поиск и указали следующие данные:

  • специализация – «Журналист, корреспондент» и «Копирайтер, редактор, корректор»;
  • убрали регион;
  • график работы – «Удаленная работа»;
  • выводить – «За все время»;
  • остальное отметили как не имеющее значения.

В строке с ключевыми словами указали: «искусственный интеллект», OR нейросеть, OR Midjourney, OR Kandinsky, OR Stable Diffusion, OR Leonardo, OR «Шедеврум», OR Dream by Wombo, OR ArtGeneration, OR Bing Image Creator, OR Starryai OR DeepAI. Запрос означает, что мы просим систему найти любое из этих слов/словосочетаний и допускаем разные падежи. Галочками отметили, что искать данные слова надо только в названии или описании вакансии. Система выдала нам 272 вакансии, без ключевых слов – 1169.

Затем мы провели аналогичный поиск, только в качестве графика работы указали «полный день». Несмотря на то что такая опция пред­полагает офисную работу, мы не стали ограничивать поиск конкретным регионом. Результаты следующие: с указанными ключевыми словами – 57 вакансий, без ключевых слов – 1460.

Таким образом, если журналист ищет удаленную работу, то 23% предложений на рынке требуют умения работать с нейросетями, а если офисную, – то менее 4%. Логично, что медиафрилансеры больше стремятся освоить данный навык, чем штатные журналисты. Конечно, тут возможна погрешность: работодатель (заказчик) мог указать, например, слово «нейросеть» в рамках обязанности генерировать текст, а не иллюстрации, или написать: «В работе нельзя использовать нейросети». Он мог указать другую (не перечисленную нами) нейросеть или написать ее название с ошибкой. Однако в рамках данной статьи нас больше интересует разница между штатной и внештатной журналистикой, и, думается, наши цифры демонстрируют существенный разрыв.

Мы также изучили статистику посещаемости фотобанка, выбрав наиболее популярный из бесплатных – Pixabay. Проанализировали его с помощью сервиса Similarweb[6]. Он выдает информацию о посещаемости за последние три месяца, но у нас есть сведения с декабря 2023 по июль 2024 года включительно, поскольку мы проверили его 28.03.2024, 12.05.2024 и 13.08.2024. Руководствуясь полученной статистикой, можно сделать вывод, что за указанный период посещаемость фотобанка Pixabay упала с 36 до 32 млн посетителей в месяц, то есть более чем на 11%. Полагаем, что это также является подтверждением вышеизложенной статистики, которая демонстрирует, что для части журналистов фотобанки полностью или частично заменены нейросетями.

Заключение

Искусственный интеллект на данном этапе еще развивается. Однако уже сейчас он позволяет снять с человека примитивные задачи, а также позволяет создавать что-то тем, кто от природы не обладает творческими способностями. Креатив искусственного интеллекта подвергается (зачастую справедливой) критике, но сложно спорить с тем, что индивид, не обладающий навыками художника, способен сделать иллюстрацию, которая будет в точности отражать заданную тему и будет в нужном стиле, в том числе фотореалистичном. Для этого нужно лишь освоить искусство формулирования промтов.

Профессиональные художники, дизайнеры и фотографы часто критикуют «искусственные» иллюстрации: иногда заслуженно, а порой из страха за собственное будущее. Но стоит согласиться с исследователями, отмечающими, что нейросеть – это просто инструмент. Настоящим творцам она не конкурент, а помощник, освобождающий время для истинного творчества. Некоторые издания определенно выберут сэкономить бюджет, если для их концепции сгенерированных иллюстраций вполне достаточно. И этот путь начинается с отказа от фотобанков.

Рискнем предположить, что с дальнейшим развитием искусственного интеллекта работа художника, дизайнера и фотографа останется преимущественно в самых крупных изданиях с большим бюджетом, а «ручной» труд в данной сфере будет оплачиваться выше, к примеру, как сейчас ручная вышивка или авторская мебель, если сравнивать услугу с привычным машинным производством. Эта работа перейдет в разряд VIP-качества: в профессии останутся только лучшие специалисты, а в числе заказчиков и потребителей – особые ценители.

 

 

1 Подслушано Копирайтинг // ВКонтакте. URL: https://vk.com/pod_copy (дата обращения: 11.05.2024).

2 Пост от 17.04.2024. Подслушано Копирайтинг // ВКонтакте. URL: https://vk.com/wall-123495637_805318 (дата обращения: 11.05.2024).

3 Медиа Фриланс // ВКонтакте. URL: https://vk.com/media_freelance (дата обращения: 11.05.2024); Медиа Фриланс // Telegram. URL: https://t.me/mediafreelance (дата обращения: 11.05.2024).

4 Pixabay. URL: https://pixabay.com (дата обращения: 13.08.2024).

5 HeadHunter. URL: https://hh.ru (дата обращения: 13.08.2024).

6 Similarweb. URL: https://similarweb.com (дата обращения: 13.08.2024).

×

Об авторах

Ольга Сергеевна Мухина

Уральский федеральный университет имени первого Президента России Б.Н. Ельцина

Автор, ответственный за переписку.
Email: olga.mukhina@urfu.ru
ORCID iD: 0000-0001-8791-6086

кандидат филологических наук, доцент кафедры периодической печати и сетевых изданий

Российская Федерация, 620000, Екатеринбург, ул. Мира, д. 19

Владимир Федорович Олешко

Уральский федеральный университет имени первого Президента России Б.Н. Ельцина

Email: vladimir.oleshko@urfu.ru
ORCID iD: 0000-0003-3001-7391

доктор философских наук, профессор, заведующий кафедрой периодической печати и сетевых изданий

Российская Федерация, 620000, Екатеринбург, ул. Мира, д. 19

Список литературы

  1. Давыдов С.Г., Замков А.В., Крашенинникова М.А., Лукина М.М. Использование технологий искусственного интеллекта в российских медиа и журналистике // Вестник Московского университета. Серия 10: Журналистика. 2023. № 5. С. 3–21. https://doi.org/10.30547/vestnik.journ.5.2023.321
  2. Зимина Л.В. Нейросети в книгоиздательской индустрии // Библиография и книго­ведение. 2023. № 2. С. 48–66. https://doi.org/10.25281/2411-2305-2023-2-48-66
  3. Мальцев Н.Д. Использование нейросетевых технологий в масс-медиа // Журналистика в эпоху цифровых трансформаций: ценности и практики. Сборник материалов X Международной научно-практической конференции. Тамбов: Изд. дом «Державинский», 2022. С. 38–45.
  4. Рогов А.А. Технологии искусственного интеллекта и нейросети в дизайне // Дизайн-образование – XXI век. Сборник материалов Всероссийской научно-практической конференции с международным участием. Белгород: БГИИК, 2024. С. 40–43.
  5. Чумичева Н.В. К вопросу о правовом регулировании использования нейросетей для создания фото- и видеоконтента // Современные научные исследования: исторический опыт и инновации. Сборник материалов XХ Международной (политематической) научно-практической конференции. Краснодар: ИМСИТ, 2024. С. 82–86.
  6. Alkamel M.A.A., Alwagieh N.A.S. Utilizing an adaptable artificial intelligence writing tool (ChatGPT) to enhance academic writing skills among Yemeni university EFL students // Social Sciences & Humanities Open. 2024. Т. 10. P. 101095. https://doi.org/10.1016/j.ssaho.2024.101095
  7. Josephi B., O’Donnell P. The blurring line between freelance journalists and self-employed media workers // Journalism. 2022. Т. 24. No. 1. P. 139–156. https://doi.org/10.1177/14648849221086806
  8. Himma-Kadakas M., Mõttus M. Ready to Hire a Freelance Journalist: The Change in Estonian Newsrooms’ Willingness to Outsource Journalistic Content Production // Central European Journal of Communication. 2021. Т. 14. No. 1(28). P. 27–43. https://doi.org/10.51480/1899-5101.14.1(28).2
  9. Norbäck M. Maintaining a Freelance Career: How Journalists Generate and Evaluate Freelance Work // Journalism Studies. 2022. Т. 23. No. 10. P. 1141–1159. https://doi.org/10.1080/1461670X.2022.2073257
  10. Pavlik J.V. Collaborating with ChatGPT: Considering the Implications of Generative Artificial Intelligence for Journalism and Media Education // Journalism & Mass Communication Educator. 2023. Т. 78. No. 1. P. 84–93. https://doi.org/10.1177/ 10776958221149577
  11. Rufai A.A., Khan M.S.H., Hasan M. An exploration of pedagogical approaches in teaching artificial intelligence courses: Experience from undergraduates students of Bangladesh // Social Sciences & Humanities Open. 2024. Т. 10. P. 101075. https://doi.org/10.1016/j.ssaho.2024.101075

© Мухина О.С., Олешко В.Ф., 2024

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах