Архитектурный Интеллект: ИИ — волшебная кнопка или творчество? Часть 1

У кого руль?

В последнее время появилось достаточно много спекуляций на тему нейронных сетей. Истина там часто переплетается с домыслами, а будущее с настоящим. Поскольку я постоянно использую ИИ в работе, решил рассказать, как дела обстоят на самом деле. 
Должен сразу оговориться - это не научно-техническая статья по разоблачению мифов. Это — лично мой опыт и мои размышления, все выводы можете делать самостоятельно.

Предлагаю начать с вопросов земных и, в процессе подъема к более высоким материям, за несколько статей ответить на вопрос: Можно ли считать процесс работы с ИИ творческим? 

Рассмотрим первую крайность:

В контексте концепт артов и генерации референсов - может быть. Когда мы работаем с конкретными объектами, нам необходимо сохранить форму и их детали, поэтому приходится искать баланс между 3д, Посткором в фотошопе и нейронкой. Иначе ИИ вносит слишком много изменений и мы сильно отклонимся от технического задания. Наша основная задача - найти баланс между полным контролем над ней и бесконтрольными генерациями.Как только мы понимаем, что нейросеть всего-лишь инструмент в наших руках, а не наоборот, нам необходимо научиться правильно ее использовать. Мы начинаем встраивать ее в процессы, а не выстраивать процессы вокруг нее. Рано или поздно, мы приходим к осознанию того, что контроль над генерациями осуществляется за счет правильно сформированной идеи и подложку. Чем лучше мы проработаем идею, тем быстрее мы получим финальный результат.

  • У нас есть выстроенная композиция и контекст. Идея хорошо сформирована. Время на обработку через ИИ минимально.

Case 66. «Alpine Ascent»

  • У нас есть лишь часть композиции и совсем немного контекста. Идея сформирована недостаточно. По-сути, мы только знаем, где должен быть основной объект и окружение, в котором этот объект находится.Время генерации сильно возросло.Но, справедливости ради, это все еще в разы быстрее, чем делать в 3д.

Case 66. «Alpine Ascent»

Рассмотрим другую крайность:

Решение проблем с правками от заказчика достигается правильно выстроенными этапами работы.В отличие от Full CG пайплайна, при работе с ИИ очень важно утвердить ракурс и положение камеры до этапа обработки (По аналогии работы с применением фотобашинга). Остальные правки по изменению объектов, времен года, окружения, людей и даже материалов не станут проблемой.

Если же после правок заказчика изменяется архитектура, ничего не мешает нам комбинировать ИИ с привычными инструментами, о чем мы говорили ранее.

  • После превью, заказчик внес значительные правки в работу:
    -поменял ориентацию кадра
    -убрал часть объектов
    -внес изменения в архитектуру
    -поднял здание выше

Case 62. Villa in Nusa Dua

Наверное, вы уже поняли, что нет смысла выстраивать работу только вокруг ИИ. Доля Stable Diffusion в моих коммерческих проектах может составлять от 20% до 80%.

Case 45. «Mountain viewpoint»

Case 54. Skyscraper «Portal»

Нужно всегда трезво подходить к задаче и применять инструмент по назначению — для улучшения результата работы и ускорения процесса. Процент участия ИИ в работах зависит от строгости соблюдения ТЗ. Чем больше пространства для маневра дал заказчик, тем эффективнее применять нейронные сети.

Заключение

Технологии Искусственного интеллекта являются одной из самых бурно развивающихся областей. Но лично для себя я сделал следующий вывод: не нужно ждать волшебной кнопки или бояться ее появления. Это всего лишь инструмент, позволяющий подняться на новый уровень качества и скорости работы. Главное — правильно встраивать его в свои процессы и комбинировать его с привычными инструментами.

В следующей части: Насколько ИИ хорош в своей работе?

Комментарии (27)

0
Rutiger1987
Все по делу написали!)
0
giglen
the future is coming! :)
+4
Alvion
Если речь о коммерческих проектах, то ИИ имеет место быть в любых аспектах, если финальный результат удовлетворяет потребности заказчика. Сложность внесения корректировок наверное зависит от опыта работы с ИИ и, как Вы хорошо сказали, правильно выстроенными этапами работы. Про творчество вообще говорить смысла нет, так как кто то и жопой рисует, получая современное "произведение искусства". Но когда публикуют в разделе 3д работы выполненные на 70% ИИ и называют это 3д какой то диссонанс возникает))))
Для меня, как для специалиста CG важно что бы ИИ оставались помощниками и не стали заменителями.
P.S. Результаты классные, мне нравится художественный стиль ИИ. Было бы круто получить от Вас подробный making of или пару уроков по SD в архивизе. Из того что я находил 99% мусор и вода, а предыдущий Ваш коллега (не буду показывать пальцем), который тут размахивал дифьюжином и опубликовав сомнительный обзор уже успел открыть платные курсы с такой же водой и кошмарной подачей.
0
kuzenkovk
Спасибо за такой подробный фидбэк. Про обучение отписался в лс
0
MickeyMM
Тыкните пальцем в личку пожалуйста, на "коллегу"))
0
MickeyMM
Благодарю за статью!
Какие модели ИИ спользуете?
+1
kuzenkovk
Для обработки чаще всего EpicPhotoGasmhttps://civitai.com/models/132632/epicphotogasm 
0
Aleksandra_Kniazeva
А как можно использовать его для обработки уже существующих картинок рендеров? Там такое впечатление как будто можно только с нуля создавать новые изображения
0
3drj
Интересно, если так все разовьется нужны ли модели? сделал блок модель и потом генерируй ее под нужный вид? если так будет то всем нам капут?
+1
kuzenkovk
На мой взгляд, модели определенно будут нужны. Просто вектор приоритетных моделей для покупки может измениться у визуализаторов, что замечаю по себе. Уклон в сторону гибкости и удобства применения, чем максимальной детализации и реализма материалов. Все чему нужна точность и полное соответствие тз и оригиналу проще и удобнее использовать на уровне 3д. А это объекты конкретных производителей, к примеру. Нейронку можно натренировать на что-то конкретное, но на мой взгляд это не стоит таких затрат времени и надежнее поставить модель нужную
+3
ck_petya
Можно я тут в уголочке тихо посижу, подожду Pazа ?
+1
Yehat
Для эскизов и отстранённых картинок для настроения, это всё - да, для реальных проектов и комплектации - увы, нет.
+3
kuzenkovk
С интерьерами соглашусь, но даже в них можно повысить качество (реализм и детализацию) своих рендеров, просто подложка уже должна быть около финальной. С экстерьерами совершенно не согласен. Абсолютно все коммерческие "реальные" проекты (ЖК, административные и общественные средне-этажные объекты, виллы и коттеджи) последних нескольких месяцев я выполняю с нейронкой. Скорость работы значительно увеличилась, при этом и качество окружения стало заметно выше.

Все что должно сохранить форму - прорабатывается на уровне 3д, но проработка окружения, зеленки и людей сейчас сводится к минимально достаточному блокингу для последующей проработки. Я же как раз писал в статье про поиск баланса и выстраивание правильных пайплайнов. С нуля ясное дело нейронка не применима пока для таких задач.
0
ck_petya
Вы путаете "рабочку" с "презентацией"
0
kuzenkovk
А чем "презентация" не относятся к формулировке реальных проектов комментатора выше? Большинство визуализаторов моего окружения как раз занимается визуализацией для презентации клиентами - Для рекламы и продажи объектов, для представления инвесторам, для согласования каких-то решений. Я не пытаюсь навязать мнение, что ИИ способно ускорить решение любых задач. Я делюсь своим непосредственно практическим опытом, на сколько эффективно мне удалось применять это для моих задач. Кто-то рабочку и на уровне Ревита/ архикада согласует, и все норм. Это просто вопрос задач. Если что-то можно сделатьс ИИ одновременно быстрее и качественнее, это становится частью пайплайнов. Если же задачу не удается оптимизировать /ускорить и тп, понятно нету смысла никакого ИИ натягивать на это
+1
ck_petya
Само собой видно, что вы занимаетесь исключительно "презентацией". С этим никто не спорит. Она у вас красивая и приятная. Заки - инвесторы любят картинки, это понятно.
Вам просто говорят, что работы с нейронкой бесполезны в рабочей документации. Это просто мнение, которое высказывают под вашим блогом
0
kuzenkovk
Если это так, прошу простить за недопонимание, автор комментария может уточнить этот момент.С рабочкой соглашусь, вообще нет вопросов. Просто существует достаточно распространенное заблуждение, что нейронки можно применять только для творческих / эскизных проектов со свободой действий, а когда заказчику визуализации важны детали, нейронки бессильны. Мой ответ касался больше именно этой мысли, которую возможно не верно истолковал
0
YanCodename
А как быть если нужно например 5 камер с разных сторон, как нагенерить недостающее элементы чтоб они бились с другими камерами?
0
Alvion
пока никак))) поэтому ИИ остается инструментом одного ракурса)))
0
kuzenkovk
Один ИИ да. В компании с 3д максом и ФШ абсолютно точно нет :)
+1
kuzenkovk
Проработать на уровне 3д важные объекты, которые должны биться между разными ракурсами. И обрабатывать их на уровне 3д, намеренно контролируя их сохранение в обработке с ИИ. У меня в редких случаях заказывают 1 ракурс, в основном беру в работу как раз по 3-5 ракурсов. Никаких проблем не возникает абсолютно, все возможно. А если где-то не такой кустик расположен или трещены на асфальте в разных местах, до этого вообще нет дела большинству. Да и если рассмотреть привычные пайплайны, под каждую камеру порой индивидуально двигаются условные деревья, ради красивой композиции или делается фотобашинг элементов все для той же красоты.

Просто ищем баланс проработки в разных софтах на разной стадии проекта. Если работа на несколько ракурсов, изначально выстраиваем рабочие процессы, чтобы все было однородно в последствие. Если совмещать инструменты, о чем говорилось в статье, никаких проблем нет абсолютно
0
Alvion
А можете показать 1 проект с несколькими ракурсами где сохраняется расположение и вид основных объектов? Любопытно
+1
kuzenkovk
Покажу на примере портфолио проектов, так как вся коммерция под нда. В них значительно больше свободы в окружении между ракурсами ради визуала, в сравнении с коммерцией. Однако, на сколько удается сохранять архитектуру здания, на столько можно сохранять и окружение, будь проработана 3д подложка:

Во всех проектах ниже по несколько ракурсов, рядом с результатами выложены и 3д исходники до обработки. https://www.behance.net/gallery/189623093/AI-Case-66-Alpine-Ascent  https://www.behance.net/gallery/185210865/AI-Case-54-Skyscraper-Portal  https://www.behance.net/gallery/184881831/AI-Case-56-Canyon-jump 
-2
paz
скучно, не интересно, медленно, малоуправляемый результат. творчество должно приносить удовольствие
+4
kuzenkovk
Не удивлен
0
zeitgeist
Эй, очень хороший рабочий процесс.
Подскажите, пожалуйста, какой SD-интерфейс вы используете (Automatic1111, ComfyUI, Invoke,...)
0
kuzenkovk
Спасибо. Автоматик в кастомной конфигурации моей команды