ИИ против Голливуда: Битва Т-Рэкса и Трицератопса

Всем привет! 

В 1993 году на экраны вышел шедевр Стивена Спилберга«Парк Юрского периода». Это был настоящий прорыв в киноиндустрии, впервые зрители увидели динозавров, созданных при помощи 3D графики, которые выглядели невероятно правдоподобно. По данным источников, над спецэффектами для фильма трудилась команда из 50 человек, а рендер одного кадра, на супермощных компьютерах того времени, занимал до 10 часов. А всего в фильме было лишь около 6 минут CGI графики, но они навсегда изменили мир кино.

И вот, спустя 33 года, приоткрылись двери для любого творческого человека. Имея лишь идею и обычный компьютер (ну и немного денег на подписку) можно попробовать воссоздать сцены, на которые раньше требовались миллионы долларов.

Конечно, сейчас еще можно заметить почерк ИИ, но вспомните, что было пару лет назад, подобное вообще не было возможным. Что будет дальше, когда модели доучатся, может быть, Голливуд окажется в каждом доме. Хотя вряд ли один человек сможет создавать прямо полноценные фильмы уровня Голливуда, но для небольших студий с самыми необходимыми специалистами это точно станет прекрасной возможностью проявить себя.  

!Важно понимать: я ни в коем случае не соревнуюсь с Голливудом, а просто тестирую возможности современных нейросетей.

Предлагаю на миг погрузиться в атмосферу мезозоя. Буду очень благодарен за поддержку лайком или даже подпиской на самом канале — для меня это лучшая мотивация продолжать творить:

https://www.youtube.com/watch?v=U89SCo-MNZ8 

А теперь, как я это делал 

Нейросети, которые использовались:

Nano Banana Pro - картинки

Kling AI - видео

Suno - музыка

Для начала нужна была идея — о чем вообще будет ролик. Хотелось сделать что-то сложное для нейросетей, поэтому выбор пал на динозавров. Я взял довольно известную сцену битвы Т-Рэкса и Трицератопса.

Набросал короткий сценарий и сделал раскадровку. Её тоже создавал в Nano Banana Pro, только в запросе прописывал стиль «карандашный рисунок». Конечно, можно было в самой Nano Banana попросить сделать раскадровку сразу 4 или 6 кадров на одной картинке, но я люблю, чтобы всё было по-взрослому), поэтому, создал в Photoshop шаблон и уже в нем расставил кадры раскадровки. При этом, в Photoshop можно с легкостью менять местами кадры, если понадобится.

Далее, опираясь на раскадровку, стал генерировать картинки. В некоторых случаях мне понадобились изображения первого и последнего кадров для генерации видео. Для ролика в кинематографичном стиле, особенно в динамичных сценах, простых движений камеры вперед-назад, вправо-влево, вверх-вниз уже недостаточно, поэтому надо было включать фантазию для написания промта. Обычно добавлял - «камера следит за динозавром» и всё в таком духе. 

Nano Banana с динозаврами справлялась отлично, а вот Kling часто чудил. Если закидывал только одну стартовую картинку, то к концу видео Т-Рэкс частенько превращался в дракона (видимо, китайские корни Kling дают о себе знать). Выручал только способ генерации по первому и последнему кадру. Далеко не все генерации видео были удачными, думаю, две трети точно пришлось выбросить. Перед монтажом нужно было сгенерировать музыку. По запросу «музыка на фоне битвы динозавров», Suno выдавал такие треки, которые подошли бы больше для фона битвы хомячков) и только хорошо сработал, когда я прописал в промте - «музыка на фоне эпичной битвы двух огромных драконов»

И последнее — монтаж в Adobe Premiere Pro.

На самом деле, результат меня не совсем устраивает, некоторые моменты я бы переделал, но стало жалко тратить кредиты. Особенно когда понимаешь, сколько их уходит впустую на неудачные попытки.

Возможно, вам будет интересно посмотреть и другие мои видео сгенерированные в нейросетях, например о производстве кофе или традиционном производстве вина, ссылка на мой Ютуб:

https://www.youtube.com/@3DMixgenStudio   

На этом всё. Всем спасибо!

Комментарии (44)

+22
i7NOX
Такой галливуд мне не нужен! На этом всё. Всем спасибо!
+3
2garyn
ну боёвка пока так себе, как во времена первой годзилы))) В остальном вполне себе. Дальше - лучше!
+5
Predator84
музыка не в тему, нет никакого развития и драматизма, просто цикличный луп как для заставки меню в шутере типа калды. Сюжет не раскрыт, операторская работа так себе. Почему упал тирекс непонятно, читается в его глазах горечь что ему пришлось в этом участвовать.
+7
D_art_S
ИИ на основе Голливуда против Голливуда: Битва Т-Рэкса и Трицератопса
А так проблемы с масштабом, анимацией, светом, логикой. Побаловаться пойдет.
+1
pet046
Мыло конечно знатное на ролике, надо ждать обновлённые версии клинга. Пока треш конечно. Лучшее что я сейчас видел в виде крутого заменителя Голливуда - это мощный Seedance 2.0 от ByteDance.
+3
MountainTrooper
Всё, за что не любят нейронки, присутствует. Эффект зловещей долины, динамические артефакты, нарушенные пропорции. И всё под ремикс, из которого лезут уши саундтрека третьего Ведьмака. Зачем всё это? Для чего?
+1
paz
Мне понравилось еще ваше видео про виноградник. Красиво. Для рекламы вина, самое то.
Этот ролик то же классный, но местами сыроват. А Grok не пробовали?
+1
Russell_by
Спасибо! Пробовал Grok, но он совсем еще далек до совершенства. Это все делалось в Kling 2.6, на данный момент уже появилась версия 3.0, она чуть лучше, но понятно, что пока не выдаст качество, неотличимое от настоящего видео. Вот много говорят про Seedance 2.0, но пока его в доступе не нашел - он вроде появился для тестов и его быстро убрали, утрясают юридические вопросы. Veo 3 тоже пробовал, с динозаврами он еще хуже, чем Kling, справляется.
0
paz
я с Grok весьма неплохой запилил ролик. Он людей хорошо делает.
0
Russell_by
В чем-то и Grok хорош, я его тоже тестировал, очень классно то, что за 30 долларов в месяц им безлимитно можно пользоваться. Кстати, в основном все нейросети лучшего всего делают крупные планы людей, видимо больше всего именно на изображениях людей и обучались. Но пока Grok отстает еще от Kling по качеству и разрешение максимум HD 720, когда у Kling уже Full HD 1080. Стоит погенерировать в Kling уже к Grok возвращаться не хочется, правда разница в цене между ними значительная.
0
paz
Я уже Grok с месяц тестирую, очень доволен. Уже одну короткометражку сделал. С Veo у меня чуть ли не каждое второе видео отбраковка. и промт постоянно нужно редактировать.
+1
i7NOX
Ничего люди же едят фастфуд вместо нормальной еды и это схавают. Говоришь: раз-два-три-ты киношку мне насри и смотришь.
0
ISART2019
А можно еще на скрепный заливать? ))
+1
Russell_by
Вы, наверное, про Рутуб? Сожалею, дело в том, что я из Беларуси и у нас проблем с Ютубом нету, поэтому на Рутубе я даже не зарегистрирован
0
ISART2019
Понял) Значит потом открою через тор.
+3
vladimir.drobzhev90
Мне приходила в голову мысль, что лет через 20-50 мы сами будем генерить себе фильмы на вечер, просто загружая в ИИ любимую книгу в качестве сценария и выбирая варианты стиля будущего "кино на вечер". Такой формат сам собой напрашивается, тем более крутых книг много и большинство не имеет экранизаций, а технологии очевидно дорастут до такого масштаба. За доп плату можно будет выбрать каст актёров на главные роли, либо оформить подписку по выгодной цене с набором из 500+ актёров и в подарок получить Дикаприо на 2 месяца бесплатно.
+8
i7NOX
Да видимо с фастфудом я погорячился, люди видимо готовы жрать отбросы на помойке )) Такое чувство, большинство не догоняет отличие ИИ от человека, или им наплевать, глпавное, чтобы была красивая картинка для глаз.
+2
vladimir.drobzhev90
Ежу понятно, что через 20-50 лет ты фиг отличишь игру реального актёра от ИИ генерации с тем же актёром. Еще год назад мне позвонили из сбербанка и я несколько минут не понимал, что говорю с роботом, потому что это был новый уровень интонаций и ответов, буд-то реальный человек. Когда спросил а не робот ли он, там были и эмоции замешательства и извиняющийся тон - короче очень крутая имитация получилась.
0
i7NOX
Возможно так и будет, но это все равно тот же самый фаст фуд будет, и вопрос только в том, улыбаться или плакать. Правильно - ИМИТАЦИЯ.

Советую посмотреть полностьюhttps://www.youtube.com/watch?v=nwxtEvljUZU 
0
vladimir.drobzhev90
полностью смотреть не охота, но с первых минут понятно, что всё это результат того, что правовая система просто не может быть готова к тому, чего не существует в природе и о чем даже подумать нельзя было. Мы жили беззаботно создавая и публикуя контент, а в некоем офисе энтузиасты просто взяли и запихали весь интернет в некий новый алгоритм и это не было незаконным, потому что всё было взято из публичного доступа. А когда они закончили, то всё, оказалось, что поезд уже ушёл и поздняк метаться. Все начали догонять только через год-два что это такое и начались волнения в среде сценаристов и иллюстраторов, сейчас и до 3д художников докатилось спустя 3 года. Мы оказались теми лягушами, которых сварили на медленном огне и они даже ничего не заметили, а когда заметили уже было поздно. И сейчас даже если прикрутить к этому всему правовую базу, то затронет это только новые работы авторов, но это капля в море и ситуацию уже не спасет. Ага, пойди докажи, что твои работы 2014 года запихали в ИИ и теперь она рисует как ты, если по сути процесс обучения это значит твой труд переварили и превратили в матрицу из облака данных, по сути в информационный шум, где ты в жизни не докажешь, что этот нейрон содержит бит инфы на основе твоих работ. Яблоко с бананом можно в блендер запихать, перебить и с тем же успехом обратно разделить на яблоко и банан - лучшая аналогия. И вот в такой фарш перебили все данные и образы и кучу видосов. И просто не понятно как от этого защититься авторам оригинального контента.
0
i7NOX
Да и такой момент, если реальных авторов не станет, ИИ не на чем будет "учиться" и он будет становится все "тупее и ещё тупее". Так как создавать ИИ не умеет и думать тоже.
Идиократия - как оказывается, документальный фильм про будущее.
+1
vladimir.drobzhev90
Хочешь сказать, что люди сами не справляются с тем, чтобы искусство становилось "тупее и еще тупее"?)) Современное искусство доведенное до абсурда рисованием фекалиями и всякими тупыми перформансами тому не доказательство как мы скатились от скульптур уровня лучших итальянских мастеров к маканию жопы в краску и прикладыванию к холсту?)) С чего ты взял, что идиократия это про будущее? Как минимум уже бегаем в кроксах, ахаха, шутка))
+2
Russell_by
Я не понимаю, в чем вы видите проблему? В ролике я просто показал, на что в данный момент способны нейросети. Несколько лет назад подобное даже представить было невозможно - кто бы поверил, что нейросети смогут выдавать такой уровень. Конечно, мой ролик не стоит воспринимать серьезно, он примитивный и сделан за очень короткое время. Но дело в перспективе нейросетей - если они уже такое могут, что будет дальше? И сам Голливуд явно будет их использовать для создания кино, если уже не использует. Когда появится фильм, полностью сгенерированный нейросетью, а скорее всего, его в Голливуде и сделают, и он будет неотличим от реально снятого, но без использования живых актеров и многих других специалистов, создающих кино, подумайте - как вы отреагируете, если этот фильм еще будет и с отличным сюжетом? Когда-то мультфильмы, созданные в 3D, тоже ругали, мол, нет в них души, как в нарисованных. Но они практически вытеснили 2D-анимацию, и сейчас воспринимаются наверное всеми абсолютно нормально
+1
i7NOX
Да проблема даже не в лично в вашем ролике, а в ситуации в целом, балуйтесь сколько вам влезет, но не называйте себя режиссером или сценаристом, так как труда вложено в этот ролик с мышинную какаху ))
+2
Russell_by
Больше не буду себя так называть)))
+3
D_art_S
ага, а на деле просто весь контент 18+ станет иишным, начнутся всякие приколы. Что помешает ученикам 10 класса приделать голову училки и запостить в чатик? Ничего. Контент нейронок будет превалировать, 3д и 2д контент сойдет на 0 и нейронки будут учиться у нейронок. Будет тьма компрометирующего контента, манипуляций , люди перестанут понимать где реальность, а где ИИ. Как только ИИ будет массовым начнут появляться какие-то нейролидеры всяких движений, провокации. Будут процветать мошеннические схемы с подделкой голоса, обработкой фоток. Сайты знакомств можно будет просто закрывать, а лучшей рекламой будет " сайт без ИИ", как сейчас на продуктах пишут "без ГМО". И это будет, а не ваши фильмы по книгам, вечерком, под пледом:D
+1
i7NOX
Да это часть "прекрасной" картины, но все беснуются и радуются как младенцы.https://media1.tenor.com/m/c_RQskLXfEIAAAAd/clapping-will-smith.gif 
0
Medonozza
Вряд ли. Не понятно за чей счет такой банкет.
+4
Женька
Ой, накинулись-то. Еще год назад, глядя на такое, народ бы тут был бы в восторге.
0
paz
100%
+1
MountainTrooper
Не, год назад такое уже было. И то, вау-эффект быстро прошёл.
0
maxyglaz
Чем мне нравятся старые фильмы, так это своей реалистичностью. Да иногда есть свои косяки, но они выглядят реальными, а не CGI
+2
MountainTrooper
Всё верно. Терминаторы 1-2 с аниматроникой - до сих пор выглядят натурально. А всё, что снималось по франшизе после них - уже не выглядит так круто.
0
lis918
Спасибо! очень интересно!!!
0
AnastasiiaBerd
grok поинтересней бы нарисовал - хотя все это суррогат.
0
paz
все зависит от подхода. если взять профессионально, с учетом конечно ограничений технологии на данный момент. не делать заведомо провальных сцен и ракурсов. то может получится весьма и весьма. Я не говорю про динозавров, так в целом
+3
vasiliish
Круто получилось, отличная работа, представляю сколько сил и знаний понадобилось бы если делать это в 3д даже сейчас.
0
MountainTrooper
Сейчас это никто не стал бы делать. "Прогулки с динозаврами" делались 25 лет назад.
+2
paz
не нужно всем навязывать свое мнение. делают и сейчас Jurassic World Rebirth, весьма неплохой фильм.
0
Kirill_93
Что-то делают, серия prehistoric planet например, даже неплохой графон там
0
Игорь1969
А мне кажется все уже наигрались с этими нейронками. Останутся профи, которым нравится писать и допиливать промты + стальные нервы :) Потому как очень очень выбешивают эти дурные генерации. Большая часть в корзину.. Полноценных инструментов редактирования нет.. Все это похоже на игру, но не на комерческий проект. Для соцсетей делать такой ролик, чтобы что? Ради самообмана, что будет раскрутка, появится ценность специалиста как такового?
Труда и времени в такой ролик вложенно очень много, хотя все поют мол "За пять минут такое можно" :)))
Поначалу все эти ролики с Есениным, Блоком и другое были необычны и имели отклик. Сейчас уже приелось и просто смахиваются......
0
i7NOX
Комментарий удален
+3
ustym
очень трудно в ИИ сделать что-то конкретное, чем конкретние задача тем труднее. Но тем не мени ИИ очень стримительно развиваеться. Спасибо за труд, но еще есть куда стремиться.
0
Sahak1998
не путайте спецэффекты с визуальными эффектами..