Сложность: Уровень сложностиУровень сложностиУровень сложности

Как генерировать видео в нейронке Minimax

Продолжаем рассказывать о классных нейросетях для генерации видео. На этот раз поговорим подробнее про Minimax, которая не уступает по качеству Kling 1.5 и Runway, но при этом позволяет создавать работы бесплатно.

Чтобы создать первое видео, нужно перейти на сайт нейросети Minimax и зарегистрироваться через email и почту.

Интерфейс простой: на главном экране можно только ввести промпт, посмотреть свои и чужие работы. А также оплатить подписку.

Генерировать видео можно 3 способами:

  • только по промпту;
  • по картинке и промпту;
  • просто по картинке.

Как генерировать видео по промпту

Для этого в строку ввода нужно ввести запрос в привычной структуре:

Prompt

Объект и описание объекта + движение объекта + сцена и описание сцены + движение камеры + (язык камеры + освещение + атмосфера).

Чтобы составить хороший промпт, нужно ответить себе на 2 вопроса:

  • Что мы видим? Например, большая панда сидит в кофейне напротив окна и читает книгу.
  • Как мы это видим? Вокруг панды столы, слева окно. Съемка с близкого расстояния, теплое освещение. В стиле Тарантино.

Объект — главный герой видео. Это может быть человек, животные, растения, предметы и т. д. Под описанием объекта имеется ввиду его внешний вид, положение тела, выражение лица и т. д. Например, человека можно описать по такому принципу: спортивное телосложение, короткие темные волосы, в спортивном костюме, часы на руке, улыбается.

Движение объекта — что главный герой делает в видео. Например, машет рукой, садится или поворачивается. В Discord проекта команда и пользователи пишут, что нейронка лучше справляется с простыми движениями. Например, ходьбой или поворотом. Чем больше движений вы пропишете в промпте, тем больше галлюцинаний получите.

Например, сделать человека, который прыгает через препятствия и машет в воздухе сделать с первой попытки не получится. А вот пьющего что-то в кафе — вполне.

Сцена и описание сцены — это передний, задний план и все остальное, что окружает героя. Описание должно быть коротким и таким, чтобы его можно было отобразить в 6-секундном ролике. Например, «сцена на лужайке» — хороший вариант. А сцена «под водой с большим количеством рыб, несколькими подводными лодками, сундуками и дайверами» — плохой вариант. Нейронка не сможет это отобразить.

Движение камеры — то, как двигается камера относительно главного персонажа. Например:

  • приближение к объекту и отдаление;
  • смещение влево и вправо, вверх и вниз;
  • движение по орбите влево и вправо, вверх и вниз;
  • поворот камеры влево или вправо без движения объекта.

Язык камеры — совокупность визуальных приемов, которые используют режиссеры для передачи определенного смысла, настроения или информации зрителю с помощью методов съемки. К языку камеры относятся: эффект Боке, широкоугольный формат, крупный план и т. д.

Освещение поможет сделать видео более глубокими и задать им тональность. Подчеркнуть общее настроение картины.

Атмосфера тоже передает настроение и тон.

Разработчики рекомендуют добавлять к промптам слова cinematic и super-realism, но я за 10+ попыток так и не получил реалистичное видео с пандой в кафе.

Хоть и сами видео выглядят проработанными.

Вот еще несколько советов для создания хорошего промпта:

  • Используйте простые слова и простые предложения. Не пишите так, чтобы были разночтения и нейронке было сложно понять смысл.
  • Старайтесь описывать такое видео, содержание которого можно уместить в 6 секунд.
  • Чтобы задать стиль картинке, добавляйте слова-триггеры. Например, чтобы отобразить национальность, пишите «Американец», «американская культура» и т. д.
  • Не используйте цифры в промптах. Minimax пока что не чувствителен к цифрам и не умеет считать.

В Minimax есть дополнительная функция — prompt optimizer. Ее задача — переработать ваш промпт и сделать более качественную генерацию: повысить яркость, добавить цветов и больше движений.

Для примера — два видео с кроликом по промпту «A little bunny hops across the field»

Первое видео — пример генерации без функции prompt optimizer. Качество картинки высокое, но она не насыщенная, движений у кролика мало.

Второе видео — пример генерации с включенной функцией prompt optimizer. Качество картинки высокое, она не насыщенная, движений у кролика много.

Разработчики рекомендуют всегда включать оптимизатор промптов. Исключение — когда нужно сделать видео, где нейронка должна максимально точно выполнить все команды промпта и передать цветовую гамму. Если дать ей длинный промпт и включить оптимизатор, часть команд нейросеть проигнорирует, а картинку сделает в своих цветах.

промпт > оптимизатор

Степень влияния разных деталей на генерацию можно понять на примере 3-х с девушкой. Первое сделано по простому запросу «A woman stands by the window in the room».

Здесь женщина просто стоит и почему-то разговаривает.

Второе видео сделано по промпту «In a dimly lit room, a woman in a white dress stands before a European-style window. Soft orange light filters through, illuminating her face and upper body.»

Здесь уже больше деталей и нейронка все их соблюдает: белое платье, старое окно и оранжевый фильтр.

Последнее видео сделано по самому подробному промпту: «In a dimly lit room, a woman in a white dress stands in front of a European-style window. The camera quickly zooms in and pans left, shifting from a full-body shot to a close-up of her face. A faint orange light seeps through the window, illuminating her face and upper body, creating a stark contrast between the shadows in the room and the bright light from the window.»

Здесь описывается еще и движение камеры. И нейронка его соблюдает.

Как генерировать видео по картинке

Работает все просто: в строке для ввода промпта кликаете на иконку картинки и загружаете нужный файл. Также можете прописать промпт, но в том случае, если хотите задать конкретное движение персонажу.

За основу для создания видео можно взять не реальную фотографию, а уже сгенерированную картинку. Так получится сначала создать с нуля атмосферу и персонажей, а затем качественно «оживить» их.

Разработчики советуют использовать популярные сервисы Midjourney, DALL·E, Leonardo.

Вместо этого нужно написать что-то вроде «отдаление от объекта», а уже в следующей генерации перейти к высоте птичьего полета.

Сколько стоит

Оплатить сервис с карты российского банка нельзя. Сейчас после регистрации бесплатно дают безлимитную версию на 3 дня. В ней дают безлимитные кредиты и нет очереди на генерацию. Далее каждый день будут давать 100 кредитов, 1 генерация обойдется в 30 кредитов. Все видео будут только с водяным знаком в правом верхнем углу экрана и с лицензией для некоммерческого использования.

С картой иностранного банка можно подключить один из платных тарифов, чтобы убрать водяной знак и использовать генерации в коммерческих целях. Например, в рекламе. Минимальная стоимость — пока что $9,99 в месяц. Затем обещают увеличить стоимость до $14,99.

0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии