1 घंटे में 90-सेकंड का AI शॉर्ट ड्रामा कैसे बनाएं — 2026 की पूरी workflow
सुसंगत characters के साथ 30+ शॉट्स में 90-सेकंड का AI शॉर्ट ड्रामा बनाने की पूरी workflow — script, character lock, storyboard, generation, assembly, upscale से final polish तक.
ऑनलाइन अधिकांश “AI short film” ट्यूटोरियल एक कैरेक्टर के साथ 15-30 सेकंड क्लिप बनाते हैं और इसे पूरा कह देते हैं. यह ड्रामा नहीं है — यह एक moodboard है.
एक असली शॉर्ट ड्रामा के लिए चाहिए:
- एक पूर्ण narrative चाप (setup → conflict → resolution)
- विभिन्न angles से कई shots
- एक कैरेक्टर जो throughout एक ही व्यक्ति की तरह दिखे
- सही pacing
- Production-quality finish (कोई watermarks, captions, या AI artifacts नहीं)
यह गाइड बताती है कि 2026 के मौजूदा tooling का उपयोग करके यह सब एक घंटे से कम में कैसे करें.
हम एक वास्तविक उदाहरण का उपयोग करेंगे: 90-सेकंड का शॉर्ट ड्रामा 《孟婆嫌我烦》 (“Lady Mengpo is annoyed with me”), जिसे एक creator ने Juying पर 60 मिनट में बनाया. पूरे काम में 30+ shots हैं, मुख्य कैरेक्टर throughout समान दिखता है, और यह एशियाई short-form प्लेटफ़ॉर्म्स पर viral हो गया.
नीचे का workflow बिल्कुल वही है जो उपयोग किया गया था.
शुरू करने से पहले: आपको क्या चाहिए
टूल्स:
- एक AI वीडियो प्लेटफ़ॉर्म जो शॉट्स में character consistency का समर्थन करता है. हम इस गाइड के लिए Juying का उपयोग करेंगे; सिद्धांत transfer होते हैं.
- script generation के लिए एक LLM. Claude या GPT-4 अच्छी तरह काम करते हैं. कई AI वीडियो प्लेटफ़ॉर्म इस चरण को शामिल करते हैं.
- आपके मुख्य कैरेक्टर की एक रेफरेंस इमेज (असली फोटो, AI-जेनरेटेड portrait, या sketch).
समय बजट: कुल 60 मिनट.
कौशल स्तर: Beginner. कोई पूर्व AI वीडियो अनुभव आवश्यक नहीं.
चरण 1: कहानी का विचार (1 मिनट)
एक वाक्य से शुरू करें. बस एक.
Mengpo के लिए, बीज वाक्य था:
“Lady Mengpo, चीनी underworld में विस्मरण का सूप परोसने वाली देवी, एक आत्मा से चिढ़ी हुई है जो लगातार बकबक कर रही है.”
बस इतना ही. इस चरण पर over-plan न करें. Structure चरण 2 में आएगा.
बाधा: ऐसी कहानी चुनें जो 2-3 से अधिक distinct कैरेक्टर्स की आवश्यकता न हो और 60-90 सेकंड में फिट हो. अधिकांश viral शॉर्ट ड्रामा में एक या दो leads, एक स्पष्ट conflict, और एक त्वरित resolution होती है.
अगर आप अटके हैं, तो AI shorts के लिए तीन कहानी पैटर्न जो अच्छी तरह काम करते हैं:
- Reaction beat: कुछ होता है, कैरेक्टर तीव्रता से प्रतिक्रिया करता है, twist resolution. (Mengpo यही follow करता है.)
- The misunderstanding: A सोचता है B, X कर रहा है, B वास्तव में Y कर रहा है, खुलासा.
- The escalation: छोटी चीज़ बार-बार होती है, बदतर होती है, climax पर पहुँचती है.
चरण 2: Script जेनरेट करें (5 मिनट)
अपने एक-वाक्य विचार को इस prompt के साथ LLM को दें:
Write a 90-second short drama script based on this idea:
[your one-sentence idea]
Requirements:
- 8-12 scenes, each scene 6-10 seconds
- Specify camera framing for each scene (close-up, medium, wide, etc.)
- Specify lighting and mood
- Include 2-3 lines of dialogue or voiceover where appropriate
- Build a clear arc: setup, conflict, resolution
- End with a memorable beatआउटपुट एक संरचित script है. इसकी समीक्षा करें. Pacing समायोजित करें, dull scenes को मज़बूत beats से बदलें. precious न बनें — शॉर्ट ड्रामा scripts लगातार rewrite होते हैं.
Mengpo के लिए, LLM ने 11 scenes बनाए. creator ने 9 रखे, 2 हटाए जो वज़न नहीं उठाते थे.
चरण 3: मुख्य कैरेक्टर लॉक करें (5 मिनट)
यह वह चरण है जिसे अधिकांश workflows skip करते हैं और बाद में भुगतान करते हैं.
अपने AI वीडियो प्लेटफ़ॉर्म पर अपने मुख्य कैरेक्टर की एक अच्छी रेफरेंस फोटो अपलोड करें. रेफरेंस होनी चाहिए:
- उच्च resolution (न्यूनतम 1024×1024)
- Front-facing या 3/4 view
- Even lighting (चेहरे पर भारी shadows नहीं)
- एकल कैरेक्टर स्पष्ट रूप से framed (इमेज में अन्य चेहरे नहीं)
प्लेटफ़ॉर्म रेफरेंस को process करता है और एक character asset बनाता है — आमतौर पर 30-90 सेकंड लगते हैं. एक बार asset बन जाए, इस कैरेक्टर का संदर्भ देने वाला हर भविष्य का generation locked पहचान का उपयोग करेगा.
यह क्यों मायने रखता है: character lock के बिना, शॉट 6 तक आप एक अलग व्यक्ति को देख रहे होंगे. इसके साथ, शॉट 30 अभी भी शॉट 1 के समान कैरेक्टर जैसा दिखता है.
अगर आपका प्लेटफ़ॉर्म persistent character assets का समर्थन नहीं करता, तो यहीं multi-shot AI dramas विफल होते हैं.
Mengpo के लिए, रेफरेंस लाल वस्त्रों में एक कठोर, दयालु बूढ़ी महिला का एक AI-जेनरेटेड portrait था. पाँच मिनट अपलोड, processed, locked.
चरण 4: Storyboard ऑटो-जेनरेट करें (15 मिनट)
आधुनिक AI वीडियो प्लेटफ़ॉर्म एक storyboard planner शामिल करते हैं. इसे अपनी script + अपना locked कैरेक्टर दें; यह shot-by-shot storyboard बनाता है:
- Shot framing (close-up, medium shot, wide)
- Camera motion (static, push-in, pan, dolly)
- Lighting setup
- Character pose / expression
- Time code (यह शॉट कब शुरू और समाप्त होता है)
अगर आपका प्लेटफ़ॉर्म storyboards ऑटो-जेनरेट नहीं करता, तो आप प्रत्येक शॉट के लिए prompts लिखकर manually यह कर सकते हैं. manually करने पर 15-20 मिनट का प्लान करें.
एक अच्छी तरह से नियोजित storyboard “हर शॉट एक जैसा दिखता है” समस्या को रोकता है जो beginners को होती है. अपने framings को विविध करें: close-ups को mediums और wides के साथ वैकल्पिक करें; motion जोड़ने के लिए dolly या push-in का उपयोग करें; हर scene को eye level पर शूट न करें.
Mengpo के लिए, storyboard में 9 scenes में 30+ shots थे — आत्मा के reaction close-ups, सूप पर हाथ details, underworld setting के wide shots, और भाप के माध्यम से subjective POV.
चरण 5: शॉट्स जेनरेट करें (30 मिनट)
यह सबसे लंबा चरण है लेकिन अधिकतर idle समय — आपका प्लेटफ़ॉर्म parallel में shots जेनरेट करता है.
Generate पर क्लिक करें. चले जाएं. 30 मिनट में वापस आएं.
पर्दे के पीछे क्या हो रहा है:
- 30+ shots parallel में queue (अगर आपका प्लेटफ़ॉर्म इसका समर्थन करता है; serial generation बहुत अधिक समय लेगा)
- प्रत्येक शॉट आपके locked character embedding का उपयोग करता है
- Auto-generated negative prompts आम drift modes को रोकते हैं
- Post-hoc consistency checks किसी भी शॉट को regenerate करते हैं जो बहुत drift करता है
अगर आपके प्लेटफ़ॉर्म में parallel generation या no-queue dedicated capacity नहीं है, तो यह चरण मिनटों के बजाय घंटों ले सकता है. यही 60-मिनट workflow और एक-दिन workflow का अंतर है.
Mengpo के लिए, इस चरण में 28 मिनट लगे — 30 shots, सभी parallel में, सभी consistent.
चरण 6: Assemble (3 मिनट)
अधिकांश आधुनिक AI वीडियो प्लेटफ़ॉर्म स्वचालित रूप से एक rough assembly बनाते हैं — वे shots को storyboard order में जोड़ते हैं.
Assembly की समीक्षा करें. खोजें:
- Pacing समस्याएँ (एक शॉट जो बहुत लंबा रहता है, एक cut जो बहुत त्वरित है)
- Continuity errors (lighting jumps, character pose discontinuity)
- कोई शॉट जहाँ character drift slip हो गया हो
वास्तविक continuity मुद्दों के लिए, उस single शॉट को regenerate करें. pacing के लिए, प्लेटफ़ॉर्म के editor में trim या extend करें.
Mengpo को दो शॉट्स regenerate और closing शॉट पर 1-second trim की आवश्यकता थी. कुल तीन मिनट.
चरण 7: Caption removal + upscale (5 मिनट)
अधिकांश generated AI वीडियो में सूक्ष्म artifacts होते हैं: छोटे text glitches, watermark-like elements, कभी-कभार anomalies. Smart-removal टूल्स इन्हें underlying frame को खराब किए बिना साफ करते हैं.
फिर upscale करें. 4K आउटपुट 1080p से अधिक professional दिखते हैं, विशेष रूप से बड़ी आधुनिक screens पर play होने वाले short-form content के लिए.
ये दोनों अब integrated प्लेटफ़ॉर्म्स में built-in हैं. disconnected टूल्स का उपयोग करते समय, यहाँ 5 के बजाय 15-30 मिनट की उम्मीद करें.
चरण 8: Final polish (1 मिनट)
जोड़ें:
- Title card (शुरुआत में 1-2 सेकंड)
- credit / handle के साथ end card (अंत में 1 सेकंड)
- उपयुक्त होने पर background music (अधिकांश प्लेटफ़ॉर्म एक music selection शामिल करते हैं)
- प्लेटफ़ॉर्म compatibility के लिए subtitle track
Mengpo का अंतिम स्पर्श: एकल चीनी-कैरेक्टर title card और creator और Juying दोनों को credit देने वाला watermark.
कुल समय जाँच
| चरण | समय |
|---|---|
| 1. कहानी का विचार | 1 मिनट |
| 2. Script generation | 5 मिनट |
| 3. Character lock | 5 मिनट |
| 4. Storyboard | 15 मिनट |
| 5. Shots जेनरेट करें | 30 मिनट (अधिकतर idle) |
| 6. Assembly | 3 मिनट |
| 7. Caption removal + upscale | 5 मिनट |
| 8. Final polish | 1 मिनट |
| कुल | ~65 मिनट |
चरण 5 के 30 मिनट अधिकतर idle हैं. अगर आप इसे शुरू करके चले जाते हैं, कुल active समय ~35 मिनट है.
उच्च गुणवत्ता के लिए टिप्स
सही रेफरेंस इमेज चुनें. खराब reference = खराब character lock. एक धुंधली या अजीब रोशनी वाली reference हर शॉट को परेशान करेगी. सही चुनने में 5 मिनट बिताएं.
Framing को आक्रामक रूप से विविधता दें. Beginners सब कुछ eye level, medium shot पर शूट करते हैं. Pros close-ups, low angles, high angles, dollies का उपयोग करते हैं. विविधता इसे cinematic महसूस कराती है.
Silence का उपयोग करें. 90-सेकंड के ड्रामा को 90 सेकंड संवाद की आवश्यकता नहीं है. कुछ बेहतरीन शॉर्ट ड्रामा 50% silent reactions हैं.
अपना बनाने से पहले असली शॉर्ट फिल्में देखें. TikTok और YouTube Shorts पर किसी भी “short film” खोज के पहले page पर आश्चर्यजनक रूप से cinematic shorts हैं. Pacing पैटर्न चुराएं.
मॉडल से न लड़ें. अगर आपकी script कुछ ऐसा माँगती है जिसमें AI संघर्ष करता है, तो सरल बनाएं. मॉडल जो अच्छा करता है उसके साथ काम करें.
सामान्य प्रश्न
क्या यह workflow कई characters को संभाल सकता है?
हाँ. चरण 3 की शुरुआत में 2-3 characters लॉक करें, फिर prompts में नाम से उन्हें संदर्भित करें. सीमा: अगर दो characters स्क्रीन समय साझा करते हैं और समान features (समान लिंग, आयु, जातीयता) हैं, तो साझा frames में कभी-कभार identity bleed की उम्मीद करें — लगभग 10% multi-character scenes को manual cleanup pass की आवश्यकता होती है.
क्या यह लंबे वीडियो (5+ मिनट) के लिए काम करता है?
सैद्धांतिक रूप से हाँ, लेकिन: लागत linearly बढ़ती है, और ~3 मिनट से अधिक narrative coherence अभी वास्तव में कठिन है. हमने creators को तीन 90-सेकंड arcs को 5-मिनट episodes में जोड़ते देखा है. शुद्ध 5-मिनट end-to-end संभव है लेकिन 90 सेकंड से अधिक काम.
अगर मैं रेफरेंस इमेज draw या photograph नहीं कर सकता/सकती तो?
एक image AI (Midjourney, DALL-E, Stable Diffusion) के साथ एक जेनरेट करें. वह परिणाम चुनें जो आपके कैरेक्टर vision से सबसे अच्छा मेल खाता है. इसे वीडियो चरण के लिए अपने reference के रूप में उपयोग करें.
मेरे प्लेटफ़ॉर्म में character lock नहीं है. क्या मैं फिर भी यह कर सकता/सकती हूँ?
आप कर सकते हैं, लेकिन consistency cleanup पर 3-5x समय बिताने की उम्मीद करें. वैकल्पिक तरीके:
- हर शॉट में character description के लिए वही prompt verbatim उपयोग करें
- हमेशा एक रेफरेंस इमेज शामिल करें
- हर शॉट के 3 versions जेनरेट करें, सबसे consistent चुनें
- ~30% शॉट्स को regenerate करने का प्लान बनाएं जब drift बहुत स्पष्ट हो
narrative work के लिए, native character consistency वाले टूल पर स्विच करना आमतौर पर इसके लायक है.
credits / dollars में इसकी क्या लागत है?
प्लेटफ़ॉर्म के अनुसार बहुत भिन्न होता है. Juying पर, 30 शॉट्स के साथ 90-सेकंड परियोजना आमतौर पर 200-400 credits उपयोग करती है, जो free tier (500 credits/month) के भीतर है या Pro ($49/mo with 3000 credits) पर तुच्छ है.
per-clip प्लेटफ़ॉर्म पर, लंबाई और गुणवत्ता settings के आधार पर per project $5-30 की उम्मीद करें.
जो कोई आपको नहीं बताता
60-मिनट workflow असली है, लेकिन अधिकांश beginners का पहला प्रयास 3-4 घंटे लेता है. धीमापन AI नहीं है; यह है:
- script पर बहुत अधिक समय बिताना (बस कुछ लिखें, बाद में iterate करें)
- एक खराब रेफरेंस इमेज चुनना (अच्छी एक खोजने में 5 मिनट बिताएं)
- storyboard चरण को skip करना (हर शॉट “wide medium shot” बन जाता है; परिणाम flat लगता है)
- सब कुछ regenerate करना (सबसे खराब 10% regenerate करें, बाकी छोड़ दें)
2-3 परियोजनाओं के बाद, workflow एक घंटे से कम में compress हो जाता है. 5 परियोजनाओं के बाद, आप इसे 40 मिनट में कर सकते हैं.
Workflow आज़माएं
Juying इस पूरे workflow का end-to-end समर्थन एक free tier के साथ करता है. अगर आप इस workflow से कुछ बनाते हैं, तो हम इसे देखना चाहेंगे.