ИИ - имба или пузырь? Разбираю на личной практике моделинга под сток.

Данная статья-урок проливает свет на практическое использование ИИ-инструментов в пайплайне моделлера, а также отвечает на вопросы: можно ли, не имея классической базы знаний и используя только ИИ-инструменты, получить коммерческий продукт, и действительно ли ИИ - имба?

Модели созданные с помощью ИИ, используемые в статье:

Раньше все мы держали (и держим) гигабайты текстурных сборников на своих хардах. Создание текстур, соответствующих оригиналу по фото, всегда отнимало много времени. Многие просто забивали на соответствие и лепили что-то близкое по тону. Если речь шла, например, о древесине, то подобрать что-то похожее можно было всегда. Но как только задача выходила за рамки доступных сборников с широким ассортиментом - всё, тупик. Сиди полдня, убивайся над сшиванием франкенштейна из того, что найдёшь в интернете, на основе убогих шакалистых джипегов. Однако с появлением Nano Banana работа по созданию текстур превратилась в почти беззаботную рутину. Теперь можно генерировать текстуры по образцам и просто по описанию. Причём образец может быть даже не в самом явном виде (для наших глаз), но нейросетке будет всё понятно, и она сгенерирует именно то, что нужно. Ниже я приведу промпты для основных сценариев.

  • Промт Nano Banana 2 для ситуации с явным образцом:

"создай плоскую текстуру дерева на подобии этой фотографии. Текстура должна быть однородной без швов. Направление волокон дерева вертикальное. Также на полотне текстуры не должны быть тёмные швы, как будто это доски - текстура это одно полотно без швов. Также текстура должна быть богата разнообразием рисунка древесины точно таким же как это на фото."

Слева - образец на вход. Справа - результат генерации:

  • Промт Nano Banana 2 для ситуации с не явным образцом:

"создай бесшовную текстуру деревянной столешницы как на фото у стола"

Интересно то, что, несмотря на едва заметную особенность столешницы, которая состоит из клеёных брусков, ИИ учёл её даже без указания этой особенности в промпте:

  • Промт Nano Banana 2 для ситуации с отсутствием образца:

"сгенерируй альбедо текстуру крыши из битумного рулонного покрытия. размер участка крыши пять метров на пять метров.  Ширина одного рулона - один метр."

  • Промт Nano Banana 2 для генерации альбедо (грубо говоря диффузная текстура без влияния света) из текстуры образца:

"создай из этой фотографии битумной рулонной кровли текстуру альбедо"

Можно было учесть это сразу в предыдущем промпте, но я просто демонстрирую возможность получения альбедо отдельным промптом:

  • Промт Nano Banana 2 для генерации вариантов текстур из текстуры образца:

"создай на основе этой текстуры альбедо рулонной битумной крыши ещё один вариант такой текстуры. На текстуре должно быть тоже пять полос битумного рулона, но уже других. Чтобы их рисунок текстуры отличался от прилагаемого. Цветовую гамму и насыщенность цветов менять не нужно."

Выглядит так просто, правда? Не нужно ничему учиться, нужно лишь уметь просить о том, что хочешь получить. Можно даже с ошибками писать кривым стилем. Но это большое заблуждение. Давайте разберём подробнее основные подводные камни:

  • Галлюцинации ИИ:

- галлюцинации и вселенский рандом. Если эти промпты работают у кого-то, это не гарантирует такой же результат у вас. Скорее всего, вам придётся пройти несколько итераций, прежде чем нейронка выдаст то, что нужно. Даже самые строгие и длинные промпты иногда не работают. Вот что выдало мне в одной из итераций, и этот результат совершенно не сочетался с теми вариантами битумных рулонов, которые были сгенерированы до этого.

  • Nano Banana 2 не умеет в seamless:

- я убил кучу времени и кредитов на попытки найти волшебный промпт, который генерировал бы мне бесшовную текстуру, но, видимо, такого просто не существует в природе. Да, в очень редких случаях это получалось. Но почти всегда - нет. Простая трата времени и кредитов. Приходится прибегать по старинке к старому софту вроде Photoshop или Substance 3D Sampler.

  • 4K-разрешение по факту не 4K:

- вроде бы всё чётко, но стоит зазумить, и становится ясно, что перед вами апскейленное стохастическое мыльцо. Я не смог найти промпт, который давал бы честные, чёткие 4K. Решал это апскейлом с 4K до 8K в Topaz Gigapixel и обратным даунскейлом до 4K.

Думаете, это всё? Чаще всего вашего промпта будет совсем недостаточно, и даже после десяти генераций нейронка будет выдавать не то. Вы будете всё подробнее и подробнее расписывать промпт, но работать всё равно не будет. Это потому, что нейронки, хоть и понимают свободную речь, всё ещё подчиняются языку структур и инструкций. Например, вот промпт, который генерирует в Nano Banana 2 из фотографии плетёного джута равномерную текстуру:

Страшный промт - осторожно!

Уже не так просто, правда? Даже голосом надиктовать не получится. Надо вдумчиво поработать над структурой. В этом, кстати, помогают другие ИИ. Да-да… тебе нужен ИИ, чтобы работать с ИИ… а иногда нужен один ИИ, чтобы помочь другому ИИ, чтобы смог третий ИИ… Я не шучу.

Кроме таких промтов есть ещё формат JSON:

{  "subject": "oak butcher-block countertop made of glued wooden strips",

  "material": "natural oak, visible lamination",

  "lighting": "soft daylight",

  "view": "top-down crop",

  "output": "seamless albedo texture",

  "constraints": "no shadows, no perspective distortion, no gloss"}

Но даже несмотря на эти чёткие форматы, вы всё равно будете получать галлюцинации и нарушения прописанных правил, хотя, конечно, гораздо реже, чем при использовании промптов в свободной форме речи. Например, два верхних промпта не дают seamless-текстур и ещё нарушают ряд других правил.

Хорошо, вы победили промпты и научились составлять их в формате структур или JSON, прибегая к помощи других ИИ. Что дальше? Теперь-то можно забыть про изучение базы классического софта? Нет. Вот цепочка действий, которая описывает весь путь создания материала на примере рулонной битумной кровли. И каждый шаг - это своя база знаний:

  1. - генерация в Nano Banana 2 четырёх вариантов текстур альбедо в 4K;
  2. - апскейл каждого варианта до 8K и даунскейл до 4K для придания чёткости в Topaz Gigapixel;
  3. - сшивание четырёх вариантов текстур в одну бесшовную 8K-текстуру в Photoshop;
  4. - генерация текстур нормалей и шероховатости в 4K в Substance 3D Sampler;
  5. - исправление текстуры нормалей в Photoshop, так как Substance 3D Sampler просто не «понимает», где на самом деле выпуклости, а где вогнутости. Да, вы должны разбираться в том, как работать с каналами карт нормалей и что там нужно инвертировать, чтобы карта трансформировалась в нужный вам вектор;
  6. - нарезание в 3ds Max текстур на полоски (полосы рулонов) через Crop. Да, вы должны знать, что лучше нарезать в самом Max через Crop, чем из трёх файлов текстур создавать тридцать файлов на жёстком диске;
  7. - линковка всех трёх (тридцати нарезанных) текстур сразу в один CoronaMultiMap. Да, вы должны знать, что нужно пользоваться Additional Outputs, а не плодить их под каждый PBR-канал (как многие);
  8. - использование гамма-коррекции в CoronaNormal, а не в CoronaBitmap. Да, вы должны знать, что, проходя через CoronaMultiMap, CoronaNormal не «видит» гамму 1.0 и начинает ругаться. И вообще, вы должны понимать, какой input gamma должен быть у текстур в зависимости от канала шейдера;
  9. - последовательная линковка в CoronaMappingRandomizer и CoronaTileMap. Да, тут тоже надо знать про Additional Outputs, а также про Tile ID и прочие настройки, особенности UV-мэппинга CoronaTileMap и зачем вообще его использовать в этом шейдере.

Итоговая структура шейдера рулонной битумной кровли после 9 шагов. Выглядит просто, но за этим "просто" стоят годы опыта и работы:

И опять кто-то скажет: да зачем мне все эти схематозы и нарезки? Я просто создам PBR текстуры в Nano Banana, подключу каждую в свой PBR-канал - и всё! К чёрту тайлинг и всё остальное - для табуретки и стола хватит за глаза. Так-то да, но только если ты, например, моделишь бытовой примитив. Но в случае с кровлей, которая может занимать десятки метров площади, ты получишь эффект тайлинга, даже несмотря на то, что текстура будет технически бесшовной. Избавиться от этого помогает как раз вышеописанный схематоз. И чтобы уметь с ним работать, надо подробно знать и понимать, как всё устроено и взаимодействует между собой.

Ну, с 2D всё понятно: можно обойтись малой кровью, избегая обработки текстур и сложных шейдеров, которые генерирует Nano Banana. Сидеть на одних условных табуретках, не претендуя на профессиональный рост. Но ведь и меш условной табуретки ещё где-то взять нужно. Да не просто меш, а ещё и с нормальными развёрнутыми текстурными координатами. Что там может предложить нам ИИ в плане генерации 3D? Давайте посмотрим.

Думаешь, сможешь с помощью 3D-ИИ вроде лучшей в мире Hunyuan генерировать геометрию табуреток без глубокого изучения моделинга, а потом, не изучая 2D-софт, генерировать текстуры в Nano Banana и накладывать их на сгенерированную модель? Тоже не выйдет. Посмотри, как криво делает модели уже третье поколение лучшей в мире 3D-ИИ Hunyuan:

 типа стол ага (используй ЛКМ, колёсико и ПКМ для вращения)

На входе были высококачественные 4K-фотографии самого примитивного квадратного стола, но ИИ не справился.

Вход:

Результат от лучшей 3D-ИИ третьего поколения:

И сколько бы итераций я ни делал, модель всегда получалась кривой. Тут проблемы и с геометрическими формами, и с пропорциями. О других проблемах даже говорить нет смысла, ведь сама форма фатально неправильна. Где ты возмёшь меш? Нигде. Нужно учить базу моделинга ручками, а потом ещё базу создания текстурных развёрток. А потом ещё и свет, и рендеринг изучать... И ещё сотни важных мелочей, которые просто не поместятся в эту статью.

Как видите, ИИ сам по себе не сделает вас успешным моделлером и, конечно же, не является никакой имбой. Новички думали, что ИИ облегчит им профессиональный путь, но на практике это всего лишь ещё одна дисциплина, которую нужно осваивать вдобавок к десятку классических, чтобы попытаться составить конкуренцию тем, кто стал профессионалами ещё до появления ИИ. Профессионалу нужно освоить всего одну новую дисциплину - ИИ. Всем остальным - в 10 раз больше.

Комментарии (44)

+3
SandraD
Каждая генерация стоит денег. Иногда не маленьких в общей сумме. Одно это не сделает труд профессионалов дешевле.
0
ck_petya
Так не используй платную нейронку
+1
SandraD
Бесплатные модели никогда не будут лучше платных, это хорошо видно уже сейчас
0
ck_petya
Так поправьте ручками, неужели сложно? Зато бесплатно. Или хочется и рыбку съесть, и руки не испачкать? Так не бывает. Любой труд должен быть оплачен
0
Uraken
Оформляй про подписку Гемини на год, и будут бесплатные генерации
+1
ck_petya
Это же не урок, это в болтанку надо. В "личное", например
+9
Holy3D
Это именно урок для нового поколения. Которые думают, что смогут без базы. И для таких как паз, которые не смогли в базу и теперь ИИ склейкой занимаются пытаясь выдать это за произведение. Урок о том, что без знаний и труда никуда.
-1
paz
какие-то схоластические умозаключения человека который вообще не в теме как PBR материал собирать. а про генерацию и промты слышал левым ухом.
статья шляпа. на главное ей не место. Ну и Хуниан далеко не самый лучший ИИ
+6
zeroid
Это же хейтеры и лузеры с 3ддд, хуже того это дикари с 3ддд с твоих слов. Чего ты хотел.
0
MARTINDESIGN
Это где он нас так? на рендерру?))
+1
Holy3D
https://render.ru/ru/gallery/artwork/259711
+1
MARTINDESIGN
Вот же мудак...
+1
Holy3D
а ты глянь в самом низу ещё Зероид выложил ссылочку )) я чуть с дивана не скатился сосмеху когда увидел. Взрослый мужик у себя в випе такое на серьёзе постит. И он ведь думает, что делает мне хуже, а по факту круг тех, кто его презирает только ширится.
+1
MARTINDESIGN
Я видел. Пока слов не нахожу для комментария
0
Holy3D
я нашел некоторые слова для админов и модераторов сайта в Улучшениях сайта опубликовал. По моему человека нужно просто освободить от мучений.
0
ramanya
какой лучший?
0
Holy3D
Он только за деньги отвечает. Те, кто заплатил, рассказывали, что продаëт статьи из Википедии или чужие пересказанные статьи. Деньги не возвращал.
+1
i7NOX
Хуниан хорошо, не для близких планов, просто, чтобы не тратить несколько часов на моделинг, но чтобы не было пусто, а так, если честноhttps://disk.yandex.ru/i/bnqZqHqvHpdoOQ 
+2
Y.O.U.
Не читала, но осуждаю
+1
Holy3D
Зай ты куда пропала? Давай модельки продолжай делать. Нужно много разных.
0
Y.O.U.
Лёва, дела у меня взрослые, ты же знаешь, развод, дети )
0
Holy3D
Эхх, опять значит завтра на шашлыки без тебя. Ну ладно. За тебя там опрокину и шпажку съем.
0
Y.O.U.
Сильно не шали там, а то потом тоже развод и дети )
0
CG/ARTEMY
Секундочку, развод, дети напополам, это что получается, свободное сердечко, можно становиться в очередь кавалеров, талантливые девочки сейчас нарасхват, так-то.
+1
Y.O.U.
Я вас на среду запишу, райдер вышлю на почту )
0
CG/ARTEMY
=)
+8
sash5K
это как с 3д принтерами: "каждая домохозяйка сможет распечатать себе все что нужно" говорили они
0
zeroid
Именно так. Все очень просто. когда нужно сделать что-то из серии "итак сойдет", "я так примерно и хотел", "хер с ним, похоже да и ладно"..и чет из этой оперы. А вот как только дело касается того, чтоб сделать в точности то что ты задумал и воплотить именно конкретную задачу без люфта смыслов...вот тут и начинается шоу=)))
+1
slipknot1111
Какой смысл в этой писанине не понятно. Всё равно, что во времена появления первых автомобилей сказали бы: смотрите, лошадь всё равно быстрее. Очередной залп в муку.
0
Holy3D
перечитай ещё раз мои выводы в самом низу. я не сравниваю скорость. я лишь говорю, что:
а) это не имба, а ещё одна дисциплина.
б) у новичков нет никаких конкурентных преимуществ перед старичками. Наоборот, новичкам теперь надо не 10 дисциплин изучать, а 11. А старичкам только одну новую.
0
slipknot1111
Это ты не понял о чем я говорю. Ты делаешь категоричные выводы в отношении того что в бесконечном процессе развития. Не есть умно.
0
Holy3D
слушай, ну уже по 3-5 поколений нейронок вышло. Уже можно сделать выводы на ближайшее время. Будет прорыв? будут новые выводы. Но щас то имбы нет по факту. А с таким успехом можно ждать бесконечно чего угодно. Работать и учиться то людям сейчас надо.
0
paz
Полезной информации ноль. Это не урок и не статья. Нужно уметь принимать критику. Некоторым людям просто не дано доносить информацию до других людей. Это искусство.
Материал эантихайп на ИИ. Хайп, основанный на критике.
Примеры просто подобраны не профессионально, не информативно. Не раскрывающие суть проблемы.
Любой адекватный 3д артист, да же начинающий. Прекрасно понимает, что табуретку генерировать смысла нет.
А вот сложную скульптуру, да. На сайте кстати очень много удачных примеров подобных 3д моделей. Но конечно фантазии хватило на текстуру рубероида.
Я думаю многие прочитали, но никто так и не понял, что автор хотел сказать. По этой причине и приходится объяснять.
+1
Holy3D
как жаль, что твоё мнение никому не интересно кроме тебя
0
slipknot1111
Этой демагогией и без тебя есть кому заниматься. А так ты работу за Кононыхина делаешь) Соратники блин.
0
Holy3D
А он вроде чёта обещал пару недель назад выложить про нейросетки... не помню уже. Но опять не сделал.
+2
zeroid
так выложил он, но не здесь=)))) https://render.ru/xen/threads/paz-w-i-p.178892/post-1362269 
+2
Holy3D
ору )))
+3
semjaza
Разрыв паза
0
AnastasiiaBerd
Друзья подскажите. Локально генерить (3d)что-то через comfyui с текстурами можно!? (Без платных нод ). Самостоятельный Stable proektorz- перестал работать даже с впн :(
0
ck_petya
Скачал Пинокио, через него поставил Хуниан. Для болванок, норм. Поищите на гитхабе, может там что-то есть, бесплатное
0
monotumba
>Я не смог найти промпт, который давал бы честные, чёткие 4K.
А его и нету! Ну база же, нанобанана апскейлит, это никто не скрывал никогда.
0
Holy3D
как я понимаю нет ни одной крутой нейронки по созданию текстур, которая бы генерила честные 4к?
0
mr.spoilt
Это, вероятно, пока ооочень жирно по расходу мощностей, я плохо считаю, но думаю, что это простым масштабированием в 16 раз не обойдется, так что пока апскейл только, хотя в 2К нанабанана апскейлит в бесплатной версии с артефактами жипега