Как сделать 90-секундную AI-короткометражку за 1 час

Полный workflow для создания 90-секундной AI-драмы с согласованными персонажами на 30+ кадрах менее чем за час.

May 20, 2026·9 min read·tutorial

Большинство онлайн-туториалов «AI-короткометражка» производят 15–30-секундные клипы с одним персонажем и считают дело сделанным. Это не драма — это мудборд.

Настоящей короткой драме нужно:

Полная нарративная арка (завязка → конфликт → развязка)
Несколько кадров с разных ракурсов
Персонаж, который выглядит как тот же человек на протяжении всего видео
Правильный темп
Качество продакшна (без водяных знаков, субтитров и AI-артефактов)

В этом руководстве разбираем, как сделать всё это менее чем за час, используя инструментарий 2026 года.

Используем реальный пример: 90-секундную короткую драму 《孟婆嫌我烦》 («Леди Мэнпо раздражена мной»), которую креатор сделал на Juying за 60 минут. В готовой работе 30+ кадров, главный персонаж выглядит идентично на протяжении всего видео, и оно стало вирусным на азиатских short-form-платформах.

Ниже точный workflow, который использовался.

Перед началом: что вам нужно

Инструменты:

AI-видеоплатформа с поддержкой согласованности персонажей между кадрами. В этом руководстве используем Juying; принципы переносимы.
LLM для генерации сценария. Подойдут Claude или GPT-4. Многие AI-видеоплатформы включают этот этап.
Одно референсное изображение главного персонажа (реальное фото, AI-сгенерированный портрет или скетч).

Бюджет времени: 60 минут всего.

Уровень навыков: новичок. Опыт работы с AI-видео не нужен.

Шаг 1: Идея истории (1 минута)

Начните с одного предложения. Только одного.

Для Мэнпо посевное предложение было:

«Леди Мэнпо, богиня, разливающая суп забвения в китайском подземном мире, раздражена душой, которая не перестаёт болтать.»

И всё. Не переусердствуйте на этом этапе. Структура появится на шаге 2.

Ограничение: возьмите историю, которая не требует более 2–3 разных персонажей и укладывается в 60–90 секунд. У большинства вирусных коротких драм один или два главных героя, чёткий конфликт и быстрая развязка.

Если застряли, три паттерна, которые хорошо работают для AI-короткометражек:

Реакционный бит: что-то происходит, персонаж сильно реагирует, твист-развязка. (Мэнпо именно такой.)
Недопонимание: A думает, что B делает X, B на самом деле делает Y, раскрытие.
Эскалация: мелочь повторяется, ухудшается, кульминация.

Шаг 2: Сгенерируйте сценарий (5 минут)

Передайте свою идею LLM с этим промптом:

Write a 90-second short drama script based on this idea:
[your one-sentence idea]

Requirements:
- 8-12 scenes, each scene 6-10 seconds
- Specify camera framing for each scene (close-up, medium, wide, etc.)
- Specify lighting and mood
- Include 2-3 lines of dialogue or voiceover where appropriate
- Build a clear arc: setup, conflict, resolution
- End with a memorable beat

Вывод — структурированный сценарий. Просмотрите. Подправьте темп, замените скучные сцены на более сильные биты. Не цепляйтесь — сценарии короткометражек переписываются постоянно.

Для Мэнпо LLM выдала 11 сцен. Креатор оставил 9, выкинул 2, которые не тянули свой вес.

Шаг 3: Зафиксируйте главного персонажа (5 минут)

Это шаг, который большинство workflow пропускают и платят за это позже.

Загрузите одно хорошее референсное фото главного персонажа в вашу AI-видеоплатформу. Референс должен быть:

Высокого разрешения (минимум 1024×1024)
Фронтальный или 3/4
Равномерное освещение (без тяжёлых теней на лице)
Один персонаж в кадре (без других лиц на изображении)

Платформа обрабатывает референс и создаёт character asset — обычно занимает 30–90 секунд. После создания ассета каждая будущая генерация со ссылкой на этого персонажа будет использовать зафиксированную идентичность.

Почему это важно: без character lock к 6-му кадру вы будете смотреть на другого человека. С ним — 30-й кадр всё ещё выглядит как тот же персонаж, что и 1-й.

Если ваша платформа не поддерживает постоянные character assets, именно здесь многокадровые AI-драмы и проваливаются.

Для Мэнпо референсом был один AI-сгенерированный портрет строгой, доброй пожилой женщины в красных одеждах. Пять минут на загрузку, обработку и фиксацию.

Шаг 4: Автогенерация раскадровки (15 минут)

Современные AI-видеоплатформы включают storyboard planner. Подайте ему сценарий + зафиксированного персонажа; он выдаст покадровую раскадровку с:

Кадрированием (close-up, medium, wide)
Движением камеры (статика, push-in, pan, dolly)
Схемой освещения
Позой / выражением персонажа
Тайм-кодом (когда кадр начинается и заканчивается)

Если ваша платформа не автогенерирует раскадровки, можно сделать вручную, написав промпты для каждого кадра. Заложите 15–20 минут на ручной режим.

Хорошо спланированная раскадровка предотвращает проблему «все кадры выглядят одинаково», в которую упираются новички. Варьируйте кадрирование: чередуйте крупные планы со средними и общими; добавляйте движение dolly или push-in; не снимайте каждую сцену с уровня глаз.

Для Мэнпо раскадровка содержала 30+ кадров на 9 сцен — включая реакционные крупные планы души, детали рук на супе, общие планы декораций подземного мира и субъективное POV через пар.

Шаг 5: Сгенерируйте кадры (30 минут)

Это самый длинный шаг, но в основном это idle time — платформа генерирует кадры параллельно.

Нажмите «генерировать». Уйдите. Вернитесь через 30 минут.

Что происходит за кулисами:

30+ кадров идут в очередь параллельно (если платформа это поддерживает; последовательная генерация займёт гораздо больше)
Каждый кадр использует зафиксированный character embedding
Автогенерируемые negative prompts предотвращают частые режимы дрейфа
Пост-проверки согласованности перегенерируют кадры, которые слишком сильно дрейфуют

Если у платформы нет параллельной генерации или выделенной мощности без очередей, этот шаг займёт часы вместо минут. В этом разница между 60-минутным workflow и однодневным.

Для Мэнпо этот шаг занял 28 минут — 30 кадров, все параллельно, все согласованные.

Шаг 6: Сборка (3 минуты)

Большинство современных AI-видеоплатформ выдают грубую сборку автоматически — они склеивают кадры в порядке раскадровки.

Просмотрите сборку. Ищите:

Проблемы темпа (кадр, который висит слишком долго, слишком быстрый монтаж)
Ошибки непрерывности (скачки освещения, разрывы поз)
Кадры, в которые проскользнул дрейф персонажа

Для реальных проблем непрерывности перегенерируйте отдельный кадр. Для темпа — обрезайте или растягивайте в редакторе платформы.

Для Мэнпо понадобилось перегенерировать два кадра и обрезать 1 секунду на финальном. Три минуты всего.

Шаг 7: Удаление субтитров + upscale (5 минут)

Большинство сгенерированного AI-видео имеет тонкие артефакты: мелкие текстовые глитчи, элементы вроде водяных знаков, иногда аномалии. Smart-removal-инструменты чистят это, не деградируя кадр.

Затем upscale. 4K-выводы выглядят профессиональнее 1080p, особенно для short-form-контента, который смотрят на больших современных экранах.

Оба теперь встроены в интегрированные платформы. Если используете разрозненные инструменты, ожидайте 15–30 минут вместо 5.

Шаг 8: Финальная полировка (1 минута)

Добавьте:

Title card (1–2 секунды в начале)
End card с указанием авторства / ника (1 секунда в конце)
Фоновую музыку при необходимости (большинство платформ включает выбор музыки)
Дорожку субтитров для совместимости с платформами

Финальный штрих Мэнпо: одиночная китайская title card и водяной знак с указанием креатора и Juying.

Проверка общего времени

Шаг	Время
1. Идея истории	1 мин
2. Генерация сценария	5 мин
3. Фиксация персонажа	5 мин
4. Раскадровка	15 мин
5. Генерация кадров	30 мин (в основном idle)
6. Сборка	3 мин
7. Удаление субтитров + upscale	5 мин
8. Финальная полировка	1 мин
Итого	~65 мин

30 минут на шаге 5 в основном idle. Если запустить и уйти, общее активное время — около 35 минут.

Советы для повышения качества

Выберите правильное референсное изображение. Плохой референс = плохая фиксация. Размытый или странно освещённый референс будет преследовать каждый кадр. Потратьте 5 минут на поиск правильного.

Агрессивно варьируйте кадрирование. Новички снимают всё с уровня глаз средним планом. Профи используют крупные планы, нижние и верхние ракурсы, dolly. Разнообразие делает картинку кинематографичной.

Используйте тишину. 90-секундной драме не нужно 90 секунд диалога. Лучшие короткие драмы на 50% состоят из молчаливых реакций.

Смотрите реальные короткометражки перед своими. На TikTok и YouTube Shorts на первой странице по запросу «short film» удивительно много кинематографичных короткометражек. Воруйте паттерны темпа.

Не боритесь с моделью. Если сценарий просит того, с чем AI плохо справляется, упростите. Работайте с тем, что модель делает хорошо.

Частые вопросы

Подходит ли этот workflow для нескольких персонажей?

Да. Зафиксируйте 2–3 персонажей в начале шага 3, затем ссылайтесь на них по имени в промптах. Ограничение: если два персонажа делят экран и имеют похожие черты (тот же пол, возраст, этническая принадлежность), ожидайте случайного смешивания идентичностей в общих кадрах — около 10% многоперсонажных сцен требуют ручной правки.

Работает ли это для длинных видео (5+ минут)?

Теоретически да, но: стоимость растёт линейно, и нарративная согласованность за пределами ~3 минут пока действительно сложна. Мы видели, как креаторы сшивают три 90-секундные арки в 5-минутные эпизоды. Чистый 5-минутный end-to-end делается, но это больше работы, чем 90 секунд.

Что если я не могу нарисовать или сфотографировать референсное изображение?

Сгенерируйте его в image-AI (Midjourney, DALL-E, Stable Diffusion). Выберите результат, наиболее соответствующий вашему видению персонажа. Используйте его как референс для шага с видео.

У моей платформы нет character lock. Можно ли всё равно сделать это?

Можно, но ожидайте в 3–5 раз больше времени на правку согласованности. Обходные пути:

Используйте дословно тот же промпт для описания персонажа в каждом кадре
Всегда включайте референсное изображение
Генерируйте 3 версии каждого кадра, выбирайте самую согласованную
Планируйте перегенерировать ~30% кадров, когда дрейф слишком очевиден

Для нарративной работы переход на инструмент с нативной согласованностью персонажей обычно того стоит.

Сколько это стоит в кредитах / долларах?

Сильно варьируется по платформам. На Juying 90-секундный проект на 30 кадров обычно использует 200–400 кредитов, что укладывается в бесплатный тариф (500 кредитов/мес) или тривиально на Pro ($49/мес с 3000 кредитов).

На платформах с поклиповой оплатой ожидайте $5–30 за проект в зависимости от длины и настроек качества.

Чего вам не говорят

60-минутный workflow реален, но первая попытка большинства новичков занимает 3–4 часа. Замедление не в AI; это:

Слишком долгое сидение над сценарием (просто напишите что-то, итерируйте позже)
Выбор плохого референса (потратьте 5 минут, чтобы найти хороший)
Пропуск этапа раскадровки (каждый кадр становится «средним общим планом»; результат плоский)
Перегенерация всего (перегенерируйте худшие 10%, остальное оставьте)

После 2–3 проектов workflow сжимается до часа. После 5 проектов — до 40 минут.

Попробуйте workflow

Juying поддерживает весь этот workflow end-to-end с бесплатным тарифом. Если сделаете что-то по этому workflow, нам было бы приятно увидеть.