如何在 1 小時內製作 90 秒 AI 短劇

完整工作流程:從一句故事點子到 90 秒、含 30 個以上一致鏡頭的 AI 短劇,全程在一小時內完成。

·9 min read·tutorial

網路上多數「AI 短片」教學都做出 15 至 30 秒、只有一個角色的片段就喊收工。那不是短劇那是情緒板。

真正的短劇需要:

本指南示範如何在一小時內完成上述全部,使用的是 2026 年現有的工具。

我們會用一個真實案例:一支 90 秒短劇《孟婆嫌我煩》,創作者在 Juying 上花 60 分鐘完成。整支片有 30 個以上鏡頭,主角從頭到尾外觀一致,並在亞洲短影音平台上爆紅。

下面的工作流程就是當時實際使用的流程。

開始之前:你需要什麼

工具:

時間預算:共 60 分鐘。

技能水準:新手。不需要任何 AI 影片經驗。

步驟 1:故事點子(1 分鐘)

從一句話開始。就一句。

《孟婆》的種子句是:

「孟婆,那位在中國地府服侍忘川湯的女神,被一個喋喋不休的靈魂惹煩了。」

就這樣。這個階段別過度規劃。結構在步驟 2 才出現。

限制:選一個不需要超過 2 至 3 個不同角色能塞進 60 至 90 秒的故事。多數爆紅短劇都是一兩個主角、清晰的衝突、迅速的化解。

如果卡住了,三個適合 AI 短片的故事模式:

步驟 2:產生劇本(5 分鐘)

把你的一句話點子餵給 LLM,搭配以下提示詞:

Write a 90-second short drama script based on this idea:
[your one-sentence idea]

Requirements:
- 8-12 scenes, each scene 6-10 seconds
- Specify camera framing for each scene (close-up, medium, wide, etc.)
- Specify lighting and mood
- Include 2-3 lines of dialogue or voiceover where appropriate
- Build a clear arc: setup, conflict, resolution
- End with a memorable beat

輸出是結構化的劇本。檢視它。調整節奏、把無聊的場景換成更強的段落。別捨不得改短劇劇本本來就常重寫。

《孟婆》的 LLM 產出 11 場戲。創作者保留 9 場,刪掉 2 場拉不起力道的。

步驟 3:鎖定主要角色(5 分鐘)

這是多數工作流程跳過、然後事後付出代價的步驟。

把一張好的主角參考照片上傳到你的 AI 影片平台。參考圖應該:

平台處理參考圖並建立角色資產通常要 30 至 90 秒。資產建立後,後續每次引用此角色的生成都會使用鎖定的身份。

為何這很重要:沒有角色鎖定,到第 6 個鏡頭你就在看另一個人。有了它,第 30 個鏡頭仍與第 1 個鏡頭一致。

如果你的平台不支援持久化角色資產,這就是多鏡頭 AI 短劇失敗的關鍵點。

《孟婆》的參考圖是一張 AI 生成的肖像,描繪一位嚴肅又慈祥、身穿紅袍的年長女性。五分鐘上傳、處理、鎖定完成。

步驟 4:自動產生分鏡(15 分鐘)

現代 AI 影片平台都有分鏡規劃器。把劇本與鎖定角色餵給它,會逐鏡頭產出分鏡,包含:

如果你的平台不會自動生成分鏡,可以手動逐鏡頭寫提示詞。手動的話請預留 15 至 20 分鐘。

規劃完善的分鏡能避免新手常見的「每個鏡頭看起來都一樣」問題。請大膽變化構圖:特寫、中景、廣角交替;用推軌或前推增加動感;別每場戲都用平視。

《孟婆》的分鏡橫跨 9 場戲共 30 個以上鏡頭包含靈魂的反應特寫、湯上的手部細節、地府場景的廣角,以及透過蒸氣的主觀鏡頭。

步驟 5:生成鏡頭(30 分鐘)

這是最長的步驟,但多半是閒置時間平台會並行生成鏡頭。

按下生成。離開電腦。30 分鐘後回來。

幕後在做什麼:

如果你的平台沒有並行生成或無排隊的專屬運算容量,這個步驟可能要花數小時而非數十分鐘。這就是 60 分鐘工作流程與一整天工作流程的差別。

《孟婆》這步耗時 28 分鐘30 個鏡頭,全部並行,全部一致。

步驟 6:組裝(3 分鐘)

多數現代 AI 影片平台會自動產出粗剪按分鏡順序串接所有鏡頭。

檢視粗剪,留意:

真正的連戲問題,就針對該鏡頭重生。節奏問題就在平台編輯器裡修剪或延長。

《孟婆》需要重生兩個鏡頭,並把結尾鏡頭修剪掉 1 秒。共三分鐘。

步驟 7:字幕清除 + 升級(5 分鐘)

多數 AI 生成影片有細微瑕疵:小型文字錯亂、類浮水印元素、偶爾的異常。智能清除工具能在不損及底層幀的情況下清除這些。

然後升級。4K 輸出比 1080p 看起來更專業,特別是在現代大型螢幕上播放短影音時。

這兩項現在都已內建於整合型平台。若使用零散工具,預期此處要花 15 至 30 分鐘而非 5 分鐘。

步驟 8:最終潤飾(1 分鐘)

加入:

《孟婆》的最終點綴:一張中文片名卡,以及一個同時署名創作者與 Juying 的浮水印。

總時間檢查

步驟時間
1. 故事點子1 分
2. 劇本產生5 分
3. 角色鎖定5 分
4. 分鏡15 分
5. 生成鏡頭30 分(多半閒置)
6. 組裝3 分
7. 字幕清除 + 升級5 分
8. 最終潤飾1 分
總計約 65 分

步驟 5 的 30 分鐘多半閒置。如果你按下生成就走開,總主動時間約 35 分鐘。

提升品質的訣竅

挑對的參考圖。差的參考圖=差的角色鎖定。模糊或燈光怪異的參考圖會纏著你每個鏡頭。花 5 分鐘找對的那一張。

大膽變化構圖。新手都用平視中景拍每場。專業的會用特寫、低角度、高角度、推軌。多樣性讓作品有電影感。

善用沉默。90 秒短劇不需要 90 秒對白。最好的短劇有一半時間是沉默的反應。

動手前先看真的短片。TikTok 與 YouTube Shorts 上搜尋「短片」,第一頁就有意外有電影感的短片。偷學節奏。

別跟模型對著幹。如果劇本要求 AI 不擅長的東西,就簡化。配合模型擅長的內容。

常見問題

這個工作流程能處理多角色嗎?

可以。在步驟 3 開頭鎖定 2 至 3 個角色,然後在提示詞中以名字引用。限制:如果兩個角色共處同一畫面且特徵相似(同性別、年齡、族裔),共享畫面中偶爾會出現身份滲漏約 10% 的多角色場景需要人工修補。

適用於更長的影片(5 分鐘以上)嗎?

理論上可以,但成本線性增加,超過約 3 分鐘後敘事連貫性目前確實困難。我們看過創作者把三段 90 秒劇情拼成 5 分鐘集數。純粹做完整 5 分鐘是可行的,但工作量遠超 90 秒。

如果我畫不出也拍不到參考圖怎麼辦?

用圖像 AI(Midjourney、DALL-E、Stable Diffusion)生一張。挑最符合你角色構想的結果,當作影片步驟的參考圖。

我的平台沒有角色鎖定,還能做嗎?

可以,但預期會花 3 至 5 倍時間在一致性修補上。變通方案:

對敘事作品而言,換用支援原生角色一致性的工具通常很值得。

這要花多少點數/費用?

因平台差異很大。在 Juying,90 秒、30 鏡頭的專案通常用 200 至 400 點,免費方案就足夠涵蓋,付費方案更是輕鬆。

按單鏡頭計費的平台,依長度與品質設定,通常每個專案落在中低費用區間。

沒人告訴你的事

60 分鐘工作流程是真的,但多數新手第一次嘗試要花 3 至 4 小時。慢的不是 AI,而是:

做過 2 至 3 個專案後,工作流程會壓縮到一小時內。做過 5 個後,40 分鐘就能完成。

動手試試

Juying 端到端支援整個流程,並提供免費方案。如果你用這個流程做了什麼,歡迎分享給我們看。

相關閱讀