Топ-100

Нейросети: практический угол зрения

Человек одет в светлую одежду. Вокруг человека находятся динамичные желтые и черные фигуры, возможно, символизирующие движение или энергию. Фотография имеет художественный и абстрактный стиль. Георгий Безбородов Нейро фотограф

До прошлого года искусственный интеллект занимал умы в основном ученых и IT-специалистов, но в 2023 инструменты на базе ИИ сделали огромный скачок, став важнейшим фактором развития бизнеса, и это только начало:

  • $400+ млрд – объем рынка искусственного интеллекта к 2027 году,
  • 37,3% – годовой прирост ИИ с 2023 по 2030 год,
  • 90% интернет-контента будет создаваться при помощи ИИ к 2026 году.

Рынок труда также изменится, и всем придётся освоить новые навыки: от 75 млн до 375 млн человек (по разным оценкам) переквалифицируются к 2030, и к 2025 году появится 90+ млн рабочих мест, связанных с ИИ.

Эта революция по масштабам сравнима с компьютеризацией 90‑х, когда новая технология полностью преобразовала все сферы жизни, оставив за бортом всех, кто не принял перемен. Но сегодня всё намного быстрее.

Весь год не утихали споры о невиданных возможностях и опасностях нейросетей, кто-то смеялся над их несовершенством, по интернету ходили мемы про шесть пальцев… Но пришло время от неприятия или восторга перейти в практическую плоскость: как именно приспособить новые инструменты, какие у них ограничения и какая в них польза в каждом конкретном случае.

Для начала: общий контекст использования ИИ в России.

  • Самые распространенные сервисы – иностранные, а это значит, что их легальное использование сильно ограничено: VPN + оплата картами зарубежных банков + незаконность работы с персональными данными, а также со всеми, что составляют коммерческую и государственную тайну. Некоторые люди даже в госорганизациях используют ChatGPT, но это до тех пор, пока службы безопасности не задумываются, что данные обрабатываются на серверах в США. И, конечно, любая иностранная корпорация может по своему усмотрению в любой момент ещё более ограничить и вовсе запретить использование своих сервисов в РФ.
  • Вероятны ограничения поставок иностранного оборудования для профессионального использования. США уже ввело подобные санкции для Китая. Сейчас львиная доля рынка у американской Nvidia – на их оборудовании и софте производятся почти все вычисления в области искусственного интеллекта и альтернатив пока не видно. Простые задачи можно делать на игровых видеокартах, но для масштабных проектов они не годятся.
  • Россия делает ставку на ИИ на самом высоком уровне, но отставание пока весьма заметно. Яндекс делает большие успехи, но добиться от него практически полезных текстов сложно. При этом у нас есть реальная возможность стать одной из ведущих стран в этой высокотехнологичной области. Не стоит забывать, что собственная интернет-инфраструктура есть только у США, России и Китая, у остальных – отдельные программы или сайты.
  • Велик риск монополизации отрасли: вспомним пассажирские перевозки – как хорошо все начиналось для пользователей, когда на рынке появился Яндекс такси, и что происходит с ценами сейчас, когда он стал почти монополистом. Для устойчивого развития бизнес-сообщества нужно несколько сильных независимых локальных игроков.
  • Наибольшие перспективы – у систем на базе open source (с открытым исходным кодом) решений. Это реальная альтернатива закрытым продуктам западных корпораций. Каждый может собрать и «допилить» продукт для себя или клиента из легально доступных решений. Это делает большинство компаний, ведь создать полностью свою нейросетевую экосистему уровня ChatGPT или Stable Diffusion не проще, чем написать альтернативу Windows с нуля.

Вот в таком контексте будет происходить выбор нейро-решений для каждого бизнеса: нахождение собственного баланса между возможностями с одной стороны, легальностью, надежностью и безопасностью с другой. Итак, что же можно делать с помощью визуальных генеративных нейросетей здесь и сейчас?

Кейс 1:

Гламурная съемка со множеством моделей

Фото: Shico - премиальный кокосовый уголь для кальяна. Георгий Безбородов Нейро фотограф

Пример рекламных банеров

Задача

Сделать комплект фотоматериалов для использования в рекламе премиального угля для кальянов. Произвести несколько десятков качественных изображений с разными моделями в разных премиальных локациях, к тому же, учитывая необходимость использования дорогой одежды и аксессуаров — очень дорого. Дополнительное ограничение — дым: чтобы получались красивые клубы дыма, нужно проветривать помещение после каждого кадра, иначе получится просто невнятный туман. Бюджет на подобную съемку измеряется сотнями тысяч рублей, что в данном случае было неприемлемо.


Решение

Мы подобрали стилистические референсы, на их основании создали "мир бренда", описав его в основном промпте (это текстовая задача для нейросети) и необходимых настройках для генерации. Это дало возможность далее задавать ситуации, локации, параметры моделей, но так, чтобы все это выглядело в едином стиле и могло продолжаться бесконечно — для разных аудиторий и рекламных носителей. В этом проекте мы использовали собственные решения и наработки на базе Stable Diffusion, а не общедоступные решения, такие как Midjourney, именно для того, чтобы не только создать уникальный образ, но и обеспечить возможность управляемой генерации изображений любого нужного размера.


Еще интересный нюанс этого проекта: для того, чтобы найти наиболее подходящие параметры, мы провели жесткое тестирование восприятия нейрофотографий в сравнении с обычными, подав 24 работы на несколько фотоконкурсов. 2800+ фотографов и любителей фотографии, то есть не случайных, а разбирающихся в теме людей, не только не распознали, что изображения сделаны с помощью нейросетей, но оценили их выше большинства работ других участников конкурса. Анализ статистики по голосованию за каждое изображению помог нам создать еще более вовлекающие образы.


Результат

У клиента есть база качественных изображений на несколько месяцев рекламной кампании, и, что немаловажно, возможность очень быстро сделать дополнительные для ситуативных рекламных кампаний, ведь такую съемку за сутки обычным способом не провести.

Кейс 2:

История с идеальной резкостью

1neuro.pro - Мнемотеатр, нейро генерация, Это фотография представляет собой захватывающий вид на город при закате. В центре изображения находится крупное здание в форме амфитеатра или стадиона, окруженное многочисленными зданиями и небоскребами. Солнце, отражающееся от стеклянных фасадов небоскребов, добавляет изображению теплые тона. This is a photograph of a stunning view of the city at sunset. In the center of the image is a large building in the shape of an amphitheater or stadium, surrounded by numerous buildings and skyscrapers. The sun, reflecting off the glass facades of the skyscrapers, adds warm tones to the image.

Пресс-волл высотой 2 метра

Задача

Создание изображения для оформления зала в творческом кластере «Арт-муза» необычным пресс-воллом на время проведения театральной конференции «Мнемотеатр», которая реализована в рамках гранта Президента Российской Федерации для поддержки творческих проектов общенационального значения в области культуры и искусства. «Мнемотеатр» – это интенсив-курс для специалистов сферы культуры, студентов и педагогов творческих вузов, участников театральных студий, посвящённый созданию, сохранению и распространению театрального наследия. Особенность задачи: большое изображение должно было хорошо восприниматься на любом расстоянии, а также на фотографиях в соцсетях, когда люди сделают селфи на его фоне.


Решение

Мы выбрали такой вариант только благодаря нейросети: издали виден древнегреческий амфитеатр, преходящий в современный город, а вблизи амфитеатр состоит из мельчайших деталей – дороги, мостов, машин и деревьев. Мы использовали собственные решения и наработки на базе Stable Diffusion, а не общедоступные варианты, такие как Midjourney, именно для того, чтобы не только создать уникальный образ, но и обеспечить возможность управляемой генерации огромного (11000 х 11000 пикселей) детализированного изображения.


Результат

Результат поражает воображение (моё, как минимум)). Действительно, мы привыкли, что изображение для восприятия издали (наружная реклама, например) вблизи выглядит не очень четко и наоборот. А тут: чем ближе подходишь, тем больше видишь деталей. Чудеса технологий!

Кейс 3:

Самостоятельное создание изображений для упаковок и рекламы

Задача

Производитель пищевой продукции постоянно создает множество фотографий для упаковок и рекламы в своей дизайн-студии, но она загружена текущими задачами, а нанимать каждый раз внешнего подрядчика дорого и требует дополнительных ресурсов для управления проектами. К тому же, дизайн и фотография – важное конкурентное преимущество, и их надежнее делать внутри компании.


Решение

В данном случае пошли еще дальше по пути оптимизации производственного процесса, и установили у клиента рабочее место для самостоятельной генерации изображений с необходимым для его деятельности набором библиотек и настроек.


Результат

Дизайн команда получила нейро-помощника, которого можно использовать 24/7. Это очень удобно – ставишь задачу и переключаешься на другой проект или идешь домой. Потом смотришь сгенерированные варианты и выбираешь нужный или немного уточняешь задачу. Это намного дешевле дополнительного дизайнера, ретушера и фотографа со всем комплектом необходимого им оборудования. И ещё важный нюанс – настоящая еда редко бывает настолько идеальна, как на фотографии, каждый кадр надо ретушировать. Теперь большинство изображений создаются готовыми, «без фотошопа», это дает дизайн-студии возможность больше времени уделять поиску креативных решений.


В первую очередь, нейро продакшн — замена не творческой, а коммерческой фотосессии. Под натиском новых технологий традиционные жанры бизнес фотографии будут умирать один за другим. Первый кандидат – съемка всех новых (неиспользованных) предметов и объектов: уже сейчас в недвижимости и большинстве других бизнесов используется 3D графика вместо фотографий. Исключение: «вторичка» – съемка использованных объектов и вещей, так как важно показать реальное состояние товара (машины, например). Репортаж не умрет, скорее всего, никогда – в нем важен сам факт съемки. Пока держится традиционная рекламная фотосессия с людьми. Но лёд уже тронулся, ведь дешевые фотобанки с одинаковыми фотографиями всем уже надоели и больше не «цепляют», а уникальные фотографии – это долго и дорого. К тому же с нашего рынка ушли качественные международные фотобанки, которые порой обеспечивали разумный баланс между ценой и качеством.

В этой статье описаны лишь 3 из множества проектов последнего полугодия, но видно, что самые невероятные прорывы нейросети несут в креативные индустрии: театр, архитектуру, моду, дизайн – тысячекратно умножая творчество человека. Вот где настоящие чудеса!


Подул ветер перемен, подставляйте паруса!


Георгий Безбородов

Партнер 1Neuro.pro – профессиональные нейрорешения для бизнеса, основатель агентства устойчивого маркетинга Time4Brand, фотохудожник, фотограф. Закончил МАрхИ. В маркетинге с 1994: ADV Group, Grey, BBDO, Proximity, Yourbrand. Многократный призёр фестивалей рекламы и фотографии, член СФР, РГО, СФДП, НАПФ.

Частично опубликовано в журнале ОПТИЧЕСКИЙ MAGAZINE

№1 (88) 2024, Международное издание.

Новости и мысли о фотографии и нейросетях

    © Георгий Безбородов, нейро фотограф.