Как сделать 90-секундную AI-короткометражку за 1 час
Полный workflow для создания 90-секундной AI-драмы с согласованными персонажами на 30+ кадрах менее чем за час.
Большинство онлайн-туториалов «AI-короткометражка» производят 15–30-секундные клипы с одним персонажем и считают дело сделанным. Это не драма — это мудборд.
Настоящей короткой драме нужно:
- Полная нарративная арка (завязка → конфликт → развязка)
- Несколько кадров с разных ракурсов
- Персонаж, который выглядит как тот же человек на протяжении всего видео
- Правильный темп
- Качество продакшна (без водяных знаков, субтитров и AI-артефактов)
В этом руководстве разбираем, как сделать всё это менее чем за час, используя инструментарий 2026 года.
Используем реальный пример: 90-секундную короткую драму 《孟婆嫌我烦》 («Леди Мэнпо раздражена мной»), которую креатор сделал на Juying за 60 минут. В готовой работе 30+ кадров, главный персонаж выглядит идентично на протяжении всего видео, и оно стало вирусным на азиатских short-form-платформах.
Ниже точный workflow, который использовался.
Перед началом: что вам нужно
Инструменты:
- AI-видеоплатформа с поддержкой согласованности персонажей между кадрами. В этом руководстве используем Juying; принципы переносимы.
- LLM для генерации сценария. Подойдут Claude или GPT-4. Многие AI-видеоплатформы включают этот этап.
- Одно референсное изображение главного персонажа (реальное фото, AI-сгенерированный портрет или скетч).
Бюджет времени: 60 минут всего.
Уровень навыков: новичок. Опыт работы с AI-видео не нужен.
Шаг 1: Идея истории (1 минута)
Начните с одного предложения. Только одного.
Для Мэнпо посевное предложение было:
«Леди Мэнпо, богиня, разливающая суп забвения в китайском подземном мире, раздражена душой, которая не перестаёт болтать.»
И всё. Не переусердствуйте на этом этапе. Структура появится на шаге 2.
Ограничение: возьмите историю, которая не требует более 2–3 разных персонажей и укладывается в 60–90 секунд. У большинства вирусных коротких драм один или два главных героя, чёткий конфликт и быстрая развязка.
Если застряли, три паттерна, которые хорошо работают для AI-короткометражек:
- Реакционный бит: что-то происходит, персонаж сильно реагирует, твист-развязка. (Мэнпо именно такой.)
- Недопонимание: A думает, что B делает X, B на самом деле делает Y, раскрытие.
- Эскалация: мелочь повторяется, ухудшается, кульминация.
Шаг 2: Сгенерируйте сценарий (5 минут)
Передайте свою идею LLM с этим промптом:
Write a 90-second short drama script based on this idea:
[your one-sentence idea]
Requirements:
- 8-12 scenes, each scene 6-10 seconds
- Specify camera framing for each scene (close-up, medium, wide, etc.)
- Specify lighting and mood
- Include 2-3 lines of dialogue or voiceover where appropriate
- Build a clear arc: setup, conflict, resolution
- End with a memorable beatВывод — структурированный сценарий. Просмотрите. Подправьте темп, замените скучные сцены на более сильные биты. Не цепляйтесь — сценарии короткометражек переписываются постоянно.
Для Мэнпо LLM выдала 11 сцен. Креатор оставил 9, выкинул 2, которые не тянули свой вес.
Шаг 3: Зафиксируйте главного персонажа (5 минут)
Это шаг, который большинство workflow пропускают и платят за это позже.
Загрузите одно хорошее референсное фото главного персонажа в вашу AI-видеоплатформу. Референс должен быть:
- Высокого разрешения (минимум 1024×1024)
- Фронтальный или 3/4
- Равномерное освещение (без тяжёлых теней на лице)
- Один персонаж в кадре (без других лиц на изображении)
Платформа обрабатывает референс и создаёт character asset — обычно занимает 30–90 секунд. После создания ассета каждая будущая генерация со ссылкой на этого персонажа будет использовать зафиксированную идентичность.
Почему это важно: без character lock к 6-му кадру вы будете смотреть на другого человека. С ним — 30-й кадр всё ещё выглядит как тот же персонаж, что и 1-й.
Если ваша платформа не поддерживает постоянные character assets, именно здесь многокадровые AI-драмы и проваливаются.
Для Мэнпо референсом был один AI-сгенерированный портрет строгой, доброй пожилой женщины в красных одеждах. Пять минут на загрузку, обработку и фиксацию.
Шаг 4: Автогенерация раскадровки (15 минут)
Современные AI-видеоплатформы включают storyboard planner. Подайте ему сценарий + зафиксированного персонажа; он выдаст покадровую раскадровку с:
- Кадрированием (close-up, medium, wide)
- Движением камеры (статика, push-in, pan, dolly)
- Схемой освещения
- Позой / выражением персонажа
- Тайм-кодом (когда кадр начинается и заканчивается)
Если ваша платформа не автогенерирует раскадровки, можно сделать вручную, написав промпты для каждого кадра. Заложите 15–20 минут на ручной режим.
Хорошо спланированная раскадровка предотвращает проблему «все кадры выглядят одинаково», в которую упираются новички. Варьируйте кадрирование: чередуйте крупные планы со средними и общими; добавляйте движение dolly или push-in; не снимайте каждую сцену с уровня глаз.
Для Мэнпо раскадровка содержала 30+ кадров на 9 сцен — включая реакционные крупные планы души, детали рук на супе, общие планы декораций подземного мира и субъективное POV через пар.
Шаг 5: Сгенерируйте кадры (30 минут)
Это самый длинный шаг, но в основном это idle time — платформа генерирует кадры параллельно.
Нажмите «генерировать». Уйдите. Вернитесь через 30 минут.
Что происходит за кулисами:
- 30+ кадров идут в очередь параллельно (если платформа это поддерживает; последовательная генерация займёт гораздо больше)
- Каждый кадр использует зафиксированный character embedding
- Автогенерируемые negative prompts предотвращают частые режимы дрейфа
- Пост-проверки согласованности перегенерируют кадры, которые слишком сильно дрейфуют
Если у платформы нет параллельной генерации или выделенной мощности без очередей, этот шаг займёт часы вместо минут. В этом разница между 60-минутным workflow и однодневным.
Для Мэнпо этот шаг занял 28 минут — 30 кадров, все параллельно, все согласованные.
Шаг 6: Сборка (3 минуты)
Большинство современных AI-видеоплатформ выдают грубую сборку автоматически — они склеивают кадры в порядке раскадровки.
Просмотрите сборку. Ищите:
- Проблемы темпа (кадр, который висит слишком долго, слишком быстрый монтаж)
- Ошибки непрерывности (скачки освещения, разрывы поз)
- Кадры, в которые проскользнул дрейф персонажа
Для реальных проблем непрерывности перегенерируйте отдельный кадр. Для темпа — обрезайте или растягивайте в редакторе платформы.
Для Мэнпо понадобилось перегенерировать два кадра и обрезать 1 секунду на финальном. Три минуты всего.
Шаг 7: Удаление субтитров + upscale (5 минут)
Большинство сгенерированного AI-видео имеет тонкие артефакты: мелкие текстовые глитчи, элементы вроде водяных знаков, иногда аномалии. Smart-removal-инструменты чистят это, не деградируя кадр.
Затем upscale. 4K-выводы выглядят профессиональнее 1080p, особенно для short-form-контента, который смотрят на больших современных экранах.
Оба теперь встроены в интегрированные платформы. Если используете разрозненные инструменты, ожидайте 15–30 минут вместо 5.
Шаг 8: Финальная полировка (1 минута)
Добавьте:
- Title card (1–2 секунды в начале)
- End card с указанием авторства / ника (1 секунда в конце)
- Фоновую музыку при необходимости (большинство платформ включает выбор музыки)
- Дорожку субтитров для совместимости с платформами
Финальный штрих Мэнпо: одиночная китайская title card и водяной знак с указанием креатора и Juying.
Проверка общего времени
| Шаг | Время |
|---|---|
| 1. Идея истории | 1 мин |
| 2. Генерация сценария | 5 мин |
| 3. Фиксация персонажа | 5 мин |
| 4. Раскадровка | 15 мин |
| 5. Генерация кадров | 30 мин (в основном idle) |
| 6. Сборка | 3 мин |
| 7. Удаление субтитров + upscale | 5 мин |
| 8. Финальная полировка | 1 мин |
| Итого | ~65 мин |
30 минут на шаге 5 в основном idle. Если запустить и уйти, общее активное время — около 35 минут.
Советы для повышения качества
Выберите правильное референсное изображение. Плохой референс = плохая фиксация. Размытый или странно освещённый референс будет преследовать каждый кадр. Потратьте 5 минут на поиск правильного.
Агрессивно варьируйте кадрирование. Новички снимают всё с уровня глаз средним планом. Профи используют крупные планы, нижние и верхние ракурсы, dolly. Разнообразие делает картинку кинематографичной.
Используйте тишину. 90-секундной драме не нужно 90 секунд диалога. Лучшие короткие драмы на 50% состоят из молчаливых реакций.
Смотрите реальные короткометражки перед своими. На TikTok и YouTube Shorts на первой странице по запросу «short film» удивительно много кинематографичных короткометражек. Воруйте паттерны темпа.
Не боритесь с моделью. Если сценарий просит того, с чем AI плохо справляется, упростите. Работайте с тем, что модель делает хорошо.
Частые вопросы
Подходит ли этот workflow для нескольких персонажей?
Да. Зафиксируйте 2–3 персонажей в начале шага 3, затем ссылайтесь на них по имени в промптах. Ограничение: если два персонажа делят экран и имеют похожие черты (тот же пол, возраст, этническая принадлежность), ожидайте случайного смешивания идентичностей в общих кадрах — около 10% многоперсонажных сцен требуют ручной правки.
Работает ли это для длинных видео (5+ минут)?
Теоретически да, но: стоимость растёт линейно, и нарративная согласованность за пределами ~3 минут пока действительно сложна. Мы видели, как креаторы сшивают три 90-секундные арки в 5-минутные эпизоды. Чистый 5-минутный end-to-end делается, но это больше работы, чем 90 секунд.
Что если я не могу нарисовать или сфотографировать референсное изображение?
Сгенерируйте его в image-AI (Midjourney, DALL-E, Stable Diffusion). Выберите результат, наиболее соответствующий вашему видению персонажа. Используйте его как референс для шага с видео.
У моей платформы нет character lock. Можно ли всё равно сделать это?
Можно, но ожидайте в 3–5 раз больше времени на правку согласованности. Обходные пути:
- Используйте дословно тот же промпт для описания персонажа в каждом кадре
- Всегда включайте референсное изображение
- Генерируйте 3 версии каждого кадра, выбирайте самую согласованную
- Планируйте перегенерировать ~30% кадров, когда дрейф слишком очевиден
Для нарративной работы переход на инструмент с нативной согласованностью персонажей обычно того стоит.
Сколько это стоит в кредитах / долларах?
Сильно варьируется по платформам. На Juying 90-секундный проект на 30 кадров обычно использует 200–400 кредитов, что укладывается в бесплатный тариф (500 кредитов/мес) или тривиально на Pro ($49/мес с 3000 кредитов).
На платформах с поклиповой оплатой ожидайте $5–30 за проект в зависимости от длины и настроек качества.
Чего вам не говорят
60-минутный workflow реален, но первая попытка большинства новичков занимает 3–4 часа. Замедление не в AI; это:
- Слишком долгое сидение над сценарием (просто напишите что-то, итерируйте позже)
- Выбор плохого референса (потратьте 5 минут, чтобы найти хороший)
- Пропуск этапа раскадровки (каждый кадр становится «средним общим планом»; результат плоский)
- Перегенерация всего (перегенерируйте худшие 10%, остальное оставьте)
После 2–3 проектов workflow сжимается до часа. После 5 проектов — до 40 минут.
Попробуйте workflow
Juying поддерживает весь этот workflow end-to-end с бесплатным тарифом. Если сделаете что-то по этому workflow, нам было бы приятно увидеть.