Jak zrobić 90-sekundowy AI dramat krótki w 1 godzinę

Kompletny workflow do zrobienia 90-sekundowego AI-dramatu ze spójnymi postaciami przez 30+ ujęć w mniej niż godzinę.

May 20, 2026·9 min read·tutorial

Większość internetowych tutoriali „AI krótki film" produkuje 15–30 sekundowe klipy z jedną postacią i uznaje sprawę za załatwioną. To nie jest dramat — to moodboard.

Prawdziwy krótki dramat potrzebuje:

Pełnego łuku narracyjnego (zawiązanie → konflikt → rozwiązanie)
Wielu ujęć z różnych kątów
Postaci, która wygląda jak ta sama osoba przez całe wideo
Właściwego tempa
Jakości produkcyjnej (bez znaków wodnych, napisów ani artefaktów AI)

Ten przewodnik pokazuje, jak zrobić to wszystko w mniej niż godzinę, używając narzędzi z 2026 roku.

Użyjemy prawdziwego przykładu: 90-sekundowego krótkiego dramatu zatytułowanego 《孟婆嫌我烦》 („Lady Mengpo jest zirytowana mną"), który twórca zrobił na Juying w 60 minut. Pełny utwór ma 30+ ujęć, główna postać pojawia się identycznie przez całość, i stał się wirusowy na azjatyckich platformach short-form.

Workflow poniżej to dokładnie ten, który był użyty.

Zanim zaczniesz: czego potrzebujesz

Narzędzia:

Platforma AI-wideo wspierająca spójność postaci między ujęciami. Użyjemy Juying do tego przewodnika; zasady się przenoszą.
LLM do generacji scenariusza. Claude lub GPT-4 działają dobrze. Wiele platform AI-wideo zawiera ten krok.
Jeden obraz referencyjny twojej głównej postaci (prawdziwe zdjęcie, AI-wygenerowany portret lub szkic).

Budżet czasu: 60 minut łącznie.

Poziom umiejętności: początkujący. Wcześniejsze doświadczenie z AI-wideo nie jest wymagane.

Krok 1: Pomysł na historię (1 minuta)

Zacznij od jednego zdania. Tylko jednego.

Dla Mengpo zdanie zalążkowe brzmiało:

„Lady Mengpo, bogini, która podaje zupę zapomnienia w chińskim podziemnym świecie, jest zirytowana duszą, która wciąż gada."

I tyle. Nie planuj nadmiernie na tym etapie. Struktura przyjdzie w kroku 2.

Ograniczenie: weź historię, która nie wymaga więcej niż 2–3 odrębnych postaci i mieści się w 60–90 sekundach. Większość wirusowych krótkich dramatów ma jednego lub dwóch protagonistów, jasny konflikt i szybkie rozwiązanie.

Jeśli utknąłeś, trzy wzorce historii, które dobrze działają dla AI-shortów:

Bit reakcji: coś się dzieje, postać silnie reaguje, twist-rozwiązanie. (Mengpo idzie tym wzorcem.)
Nieporozumienie: A myśli, że B robi X, B faktycznie robi Y, ujawnienie.
Eskalacja: drobiazg się powtarza, pogarsza, kulminacja.

Krok 2: Wygeneruj scenariusz (5 minut)

Podaj swój jednozdaniowy pomysł do LLM z tym promptem:

Write a 90-second short drama script based on this idea:
[your one-sentence idea]

Requirements:
- 8-12 scenes, each scene 6-10 seconds
- Specify camera framing for each scene (close-up, medium, wide, etc.)
- Specify lighting and mood
- Include 2-3 lines of dialogue or voiceover where appropriate
- Build a clear arc: setup, conflict, resolution
- End with a memorable beat

Wyjście to ustrukturyzowany scenariusz. Przejrzyj go. Dostrój tempo, zamień nudne sceny na mocniejsze bity. Nie bądź sentymentalny — scenariusze krótkich dramatów są przepisywane bez przerwy.

Dla Mengpo LLM wyprodukował 11 scen. Twórca zachował 9, wyrzucił 2, które nie ciągnęły swojej wagi.

Krok 3: Zablokuj główną postać (5 minut)

To krok, który większość workflow pomija i płaci za to później.

Wgraj jedno dobre zdjęcie referencyjne głównej postaci do platformy AI-wideo. Referencja powinna być:

Wysoka rozdzielczość (minimum 1024×1024)
Widok z przodu lub 3/4
Równomierne oświetlenie (bez ciężkich cieni na twarzy)
Pojedyncza postać wyraźnie skadrowana (bez innych twarzy w obrazie)

Platforma przetwarza referencję i tworzy character asset — zwykle zajmuje 30–90 sekund. Po utworzeniu zasobu każda przyszła generacja odwołująca się do tej postaci będzie używać zablokowanej tożsamości.

Dlaczego to ważne: bez character lock przy ujęciu 6 będziesz patrzeć na inną osobę. Z nim — ujęcie 30 nadal wygląda jak ta sama postać co ujęcie 1.

Jeśli twoja platforma nie wspiera trwałych character assets, to tutaj wieloujęciowe AI-dramaty zawodzą.

Dla Mengpo referencją był pojedynczy AI-wygenerowany portret surowej, dobrej starszej kobiety w czerwonych szatach. Pięć minut na wgranie, przetworzenie, zablokowanie.

Krok 4: Auto-generacja storyboardu (15 minut)

Nowoczesne platformy AI-wideo zawierają planer storyboardu. Podaj mu scenariusz + zablokowaną postać; produkuje storyboard ujęcie po ujęciu z:

Kadrowaniem (close-up, medium, wide)
Ruchem kamery (statyka, push-in, pan, dolly)
Schematem oświetlenia
Pozą / wyrazem postaci
Time code (kiedy ujęcie się zaczyna i kończy)

Jeśli twoja platforma nie auto-generuje storyboardu, możesz to zrobić ręcznie, pisząc prompty dla każdego ujęcia. Załóż 15–20 minut, jeśli ręcznie.

Dobrze zaplanowany storyboard zapobiega problemowi „każde ujęcie wygląda tak samo", w który wpadają początkujący. Różnicuj kadrowanie: mieszaj close-upy z medium i wide; używaj dolly lub push-in, by dodać ruchu; nie kręć każdej sceny na poziomie oczu.

Dla Mengpo storyboard miał 30+ ujęć w 9 scenach — łącznie z reakcyjnymi close-upami duszy, detalami dłoni na zupie, szerokimi ujęciami scenografii podziemnego świata i subiektywnym POV przez parę.

Krok 5: Wygeneruj ujęcia (30 minut)

To najdłuższy krok, ale głównie czas bezczynny — platforma generuje ujęcia równolegle.

Kliknij generuj. Odejdź. Wróć za 30 minut.

Co się dzieje za kulisami:

30+ ujęć trafia do kolejki równolegle (jeśli platforma to wspiera; generacja szeregowa zajmie znacznie dłużej)
Każde ujęcie używa twojego zablokowanego osadzenia postaci
Auto-generowane negative prompts zapobiegają częstym trybom dryfu
Post-weryfikacja spójności regeneruje ujęcia, które dryfują zbyt mocno

Jeśli twoja platforma nie ma generacji równoległej ani dedykowanej pojemności bez kolejki, ten krok może zająć godziny zamiast minut. To różnica między 60-minutowym workflow a jednodniowym.

Dla Mengpo ten krok zajął 28 minut — 30 ujęć, wszystkie równolegle, wszystkie spójne.

Krok 6: Montaż (3 minuty)

Większość nowoczesnych platform AI-wideo produkuje surowy montaż automatycznie — zszywa ujęcia w kolejności storyboardu.

Przejrzyj montaż. Szukaj:

Problemów z tempem (ujęcie, które wisi za długo, cięcie zbyt szybkie)
Błędów ciągłości (skoki oświetlenia, niespójność pozy postaci)
Ujęć, gdzie dryf postaci się przedostał

Dla realnych problemów ciągłości regeneruj to pojedyncze ujęcie. Dla tempa – przytnij lub wydłuż w edytorze platformy.

Mengpo wymagała regeneracji dwóch ujęć i 1-sekundowego przycięcia ujęcia końcowego. Trzy minuty łącznie.

Krok 7: Usunięcie napisów + upscale (5 minut)

Większość wygenerowanego AI-wideo ma subtelne artefakty: drobne glitche tekstowe, elementy przypominające znaki wodne, sporadyczne anomalie. Narzędzia smart-removal czyszczą to bez degradowania klatki bazowej.

Następnie upscale. Wyjścia 4K wyglądają bardziej profesjonalnie niż 1080p, zwłaszcza dla contentu short-form oglądanego na dużych nowoczesnych ekranach.

Oba są teraz wbudowane w zintegrowane platformy. Jeśli używasz rozproszonych narzędzi, oczekuj 15–30 minut zamiast 5.

Krok 8: Końcowe szlify (1 minuta)

Dodaj:

Title card (1–2 sekundy na początku)
End card z creditem / handlem (1 sekunda na końcu)
Muzykę tła w razie potrzeby (większość platform zawiera selekcję muzyki)
Ścieżkę napisów dla kompatybilności z platformami

Końcowy szlif Mengpo: pojedynczy chiński title card oraz znak wodny przypisujący zarówno twórcę, jak i Juying.

Sprawdzenie łącznego czasu

Krok	Czas
1. Pomysł na historię	1 min
2. Generacja scenariusza	5 min
3. Blokowanie postaci	5 min
4. Storyboard	15 min
5. Generacja ujęć	30 min (głównie bezczynne)
6. Montaż	3 min
7. Usuwanie napisów + upscale	5 min
8. Końcowe szlify	1 min
Łącznie	~65 min

30 minut w kroku 5 to głównie czas bezczynny. Jeśli uruchomisz i odejdziesz, łączny aktywny czas to ~35 minut.

Wskazówki dla wyższej jakości

Wybierz odpowiedni obraz referencyjny. Zła referencja = złe blokowanie. Rozmyta lub dziwnie oświetlona referencja będzie cię prześladować w każdym ujęciu. Poświęć 5 minut na znalezienie odpowiedniej.

Agresywnie różnicuj kadrowanie. Początkujący kręcą wszystko z poziomu oczu, średnim planem. Zawodowcy używają close-upów, niskich kątów, wysokich kątów, dolly. Różnorodność daje wrażenie kinowe.

Używaj ciszy. 90-sekundowy dramat nie potrzebuje 90 sekund dialogu. Najlepsze krótkie dramaty są w 50% cichymi reakcjami.

Oglądaj prawdziwe krótkie filmy przed swoimi. TikTok i YouTube Shorts mają zaskakująco kinowe shorty na pierwszej stronie wyników wyszukiwania „short film". Kradnij wzorce tempa.

Nie walcz z modelem. Jeśli scenariusz prosi o coś, z czym AI sobie słabo radzi, uprość. Pracuj z tym, co model robi dobrze.

Częste pytania

Czy ten workflow obsłuży wiele postaci?

Tak. Zablokuj 2–3 postacie na początku kroku 3, potem odwołuj się do nich po imieniu w promptach. Ograniczenie: jeśli dwie postacie dzielą czas ekranowy i mają podobne cechy (ta sama płeć, wiek, etniczność), oczekuj okazjonalnego mieszania tożsamości w wspólnych kadrach — około 10% scen z wieloma postaciami wymaga ręcznej obróbki.

Czy to działa dla dłuższych wideo (5+ minut)?

Teoretycznie tak, ale: koszt rośnie liniowo, a spójność narracyjna powyżej ~3 minut jest teraz autentycznie trudna. Widzieliśmy twórców zszywających trzy 90-sekundowe łuki w 5-minutowe odcinki. Czyste 5-minutowe end-to-end jest do zrobienia, ale to więcej pracy niż 90 sekund.

Co jeśli nie umiem narysować ani sfotografować obrazu referencyjnego?

Wygeneruj go w image AI (Midjourney, DALL-E, Stable Diffusion). Wybierz wynik najbardziej pasujący do twojej wizji postaci. Użyj go jako referencji do kroku wideo.

Moja platforma nie ma character lock. Czy mogę i tak to zrobić?

Możesz, ale oczekuj 3–5x więcej czasu na obróbkę spójności. Obejścia:

Używaj dosłownie tego samego promptu do opisu postaci w każdym ujęciu
Zawsze dołączaj obraz referencyjny
Generuj 3 wersje każdego ujęcia, wybieraj najbardziej spójną
Planuj regenerację ~30% ujęć, gdy dryf jest zbyt oczywisty

Dla pracy narracyjnej przejście na narzędzie z natywną spójnością postaci zwykle się opłaca.

Ile to kosztuje w kredytach / dolarach?

Bardzo różnie zależnie od platformy. Na Juying 90-sekundowy projekt z 30 ujęciami zwykle zużywa 200–400 kredytów, co mieści się w tierze darmowym (500 kredytów/miesiąc) lub jest trywialne na Pro ($49/mies z 3000 kredytów).

Na platformach per-clip oczekuj $5–30 za projekt, zależnie od długości i ustawień jakości.

Czego nikt ci nie mówi

60-minutowy workflow jest realny, ale pierwsza próba większości początkujących zajmuje 3–4 godziny. Spowolnienie nie jest po stronie AI; to:

Zbyt długie siedzenie nad scenariuszem (po prostu napisz coś, iteruj później)
Wybór złego obrazu referencyjnego (poświęć 5 minut na znalezienie dobrego)
Pominięcie kroku storyboardu (każde ujęcie staje się „szerokim średnim planem"; wynik czuje się płaski)
Regenerowanie wszystkiego (regeneruj najgorsze 10%, resztę zostaw)

Po 2–3 projektach workflow ściska się do poniżej godziny. Po 5 projektach możesz to zrobić w 40 minut.

Wypróbuj workflow

Juying wspiera ten cały workflow end-to-end z tier darmowym. Jeśli zrobisz coś tym workflow, chętnie zobaczymy.