Нейросети: практический угол зрения
До прошлого года искусственный интеллект занимал умы в основном ученых и IT-специалистов, но в 2023 инструменты на базе ИИ сделали огромный скачок, став важнейшим фактором развития бизнеса, и это только начало:
Рынок труда также изменится, и всем придётся освоить новые навыки: от 75 млн до 375 млн человек (по разным оценкам) переквалифицируются к 2030, и к 2025 году появится 90+ млн рабочих мест, связанных с ИИ.
Эта революция по масштабам сравнима с компьютеризацией 90‑х, когда новая технология полностью преобразовала все сферы жизни, оставив за бортом всех, кто не принял перемен. Но сегодня всё намного быстрее.
Весь год не утихали споры о невиданных возможностях и опасностях нейросетей, кто-то смеялся над их несовершенством, по интернету ходили мемы про шесть пальцев… Но пришло время от неприятия или восторга перейти в практическую плоскость: как именно приспособить новые инструменты, какие у них ограничения и какая в них польза в каждом конкретном случае.
Для начала: общий контекст использования ИИ в России.
Вот в таком контексте будет происходить выбор нейро-решений для каждого бизнеса: нахождение собственного баланса между возможностями с одной стороны, легальностью, надежностью и безопасностью с другой. Итак, что же можно делать с помощью визуальных генеративных нейросетей здесь и сейчас?
Кейс 1:
Гламурная съемка со множеством моделей
Пример рекламных банеров
Задача
Сделать комплект фотоматериалов для использования в рекламе премиального угля для кальянов. Произвести несколько десятков качественных изображений с разными моделями в разных премиальных локациях, к тому же, учитывая необходимость использования дорогой одежды и аксессуаров — очень дорого. Дополнительное ограничение — дым: чтобы получались красивые клубы дыма, нужно проветривать помещение после каждого кадра, иначе получится просто невнятный туман. Бюджет на подобную съемку измеряется сотнями тысяч рублей, что в данном случае было неприемлемо.
Решение
Мы подобрали стилистические референсы, на их основании создали "мир бренда", описав его в основном промпте (это текстовая задача для нейросети) и необходимых настройках для генерации. Это дало возможность далее задавать ситуации, локации, параметры моделей, но так, чтобы все это выглядело в едином стиле и могло продолжаться бесконечно — для разных аудиторий и рекламных носителей. В этом проекте мы использовали собственные решения и наработки на базе Stable Diffusion, а не общедоступные решения, такие как Midjourney, именно для того, чтобы не только создать уникальный образ, но и обеспечить возможность управляемой генерации изображений любого нужного размера.
Еще интересный нюанс этого проекта: для того, чтобы найти наиболее подходящие параметры, мы провели жесткое тестирование восприятия нейрофотографий в сравнении с обычными, подав 24 работы на несколько фотоконкурсов. 2800+ фотографов и любителей фотографии, то есть не случайных, а разбирающихся в теме людей, не только не распознали, что изображения сделаны с помощью нейросетей, но оценили их выше большинства работ других участников конкурса. Анализ статистики по голосованию за каждое изображению помог нам создать еще более вовлекающие образы.
Результат
У клиента есть база качественных изображений на несколько месяцев рекламной кампании, и, что немаловажно, возможность очень быстро сделать дополнительные для ситуативных рекламных кампаний, ведь такую съемку за сутки обычным способом не провести.
Кейс 2:
История с идеальной резкостью
Пресс-волл высотой 2 метра
Задача
Создание изображения для оформления зала в творческом кластере «Арт-муза» необычным пресс-воллом на время проведения театральной конференции «Мнемотеатр», которая реализована в рамках гранта Президента Российской Федерации для поддержки творческих проектов общенационального значения в области культуры и искусства. «Мнемотеатр» – это интенсив-курс для специалистов сферы культуры, студентов и педагогов творческих вузов, участников театральных студий, посвящённый созданию, сохранению и распространению театрального наследия. Особенность задачи: большое изображение должно было хорошо восприниматься на любом расстоянии, а также на фотографиях в соцсетях, когда люди сделают селфи на его фоне.
Решение
Мы выбрали такой вариант только благодаря нейросети: издали виден древнегреческий амфитеатр, преходящий в современный город, а вблизи амфитеатр состоит из мельчайших деталей – дороги, мостов, машин и деревьев. Мы использовали собственные решения и наработки на базе Stable Diffusion, а не общедоступные варианты, такие как Midjourney, именно для того, чтобы не только создать уникальный образ, но и обеспечить возможность управляемой генерации огромного (11000 х 11000 пикселей) детализированного изображения.
Результат
Результат поражает воображение (моё, как минимум)). Действительно, мы привыкли, что изображение для восприятия издали (наружная реклама, например) вблизи выглядит не очень четко и наоборот. А тут: чем ближе подходишь, тем больше видишь деталей. Чудеса технологий!
Кейс 3:
Самостоятельное создание изображений для упаковок и рекламы
Задача
Производитель пищевой продукции постоянно создает множество фотографий для упаковок и рекламы в своей дизайн-студии, но она загружена текущими задачами, а нанимать каждый раз внешнего подрядчика дорого и требует дополнительных ресурсов для управления проектами. К тому же, дизайн и фотография – важное конкурентное преимущество, и их надежнее делать внутри компании.
Решение
В данном случае пошли еще дальше по пути оптимизации производственного процесса, и установили у клиента рабочее место для самостоятельной генерации изображений с необходимым для его деятельности набором библиотек и настроек.
Результат
Дизайн команда получила нейро-помощника, которого можно использовать 24/7. Это очень удобно – ставишь задачу и переключаешься на другой проект или идешь домой. Потом смотришь сгенерированные варианты и выбираешь нужный или немного уточняешь задачу. Это намного дешевле дополнительного дизайнера, ретушера и фотографа со всем комплектом необходимого им оборудования. И ещё важный нюанс – настоящая еда редко бывает настолько идеальна, как на фотографии, каждый кадр надо ретушировать. Теперь большинство изображений создаются готовыми, «без фотошопа», это дает дизайн-студии возможность больше времени уделять поиску креативных решений.
В первую очередь, нейро продакшн — замена не творческой, а коммерческой фотосессии. Под натиском новых технологий традиционные жанры бизнес фотографии будут умирать один за другим. Первый кандидат – съемка всех новых (неиспользованных) предметов и объектов: уже сейчас в недвижимости и большинстве других бизнесов используется 3D графика вместо фотографий. Исключение: «вторичка» – съемка использованных объектов и вещей, так как важно показать реальное состояние товара (машины, например). Репортаж не умрет, скорее всего, никогда – в нем важен сам факт съемки. Пока держится традиционная рекламная фотосессия с людьми. Но лёд уже тронулся, ведь дешевые фотобанки с одинаковыми фотографиями всем уже надоели и больше не «цепляют», а уникальные фотографии – это долго и дорого. К тому же с нашего рынка ушли качественные международные фотобанки, которые порой обеспечивали разумный баланс между ценой и качеством.
В этой статье описаны лишь 3 из множества проектов последнего полугодия, но видно, что самые невероятные прорывы нейросети несут в креативные индустрии: театр, архитектуру, моду, дизайн – тысячекратно умножая творчество человека. Вот где настоящие чудеса!
Подул ветер перемен, подставляйте паруса!
Георгий Безбородов
Партнер 1Neuro.pro – профессиональные нейрорешения для бизнеса, основатель агентства устойчивого маркетинга Time4Brand, фотохудожник, фотограф. Закончил МАрхИ. В маркетинге с 1994: ADV Group, Grey, BBDO, Proximity, Yourbrand. Многократный призёр фестивалей рекламы и фотографии, член СФР, РГО, СФДП, НАПФ.
Частично опубликовано в журнале ОПТИЧЕСКИЙ MAGAZINE
№1 (88) 2024, Международное издание.
Новости и мысли о фотографии и нейросетях
© Георгий Безбородов, нейро фотограф.