1 ঘণ্টায় 90-সেকেন্ডের AI শর্ট ড্রামা কীভাবে তৈরি করবেন — 2026-এর সম্পূর্ণ workflow
ধারাবাহিক চরিত্র সহ 30+ শটে 90-সেকেন্ডের AI শর্ট ড্রামা তৈরির সম্পূর্ণ workflow — script, character lock, storyboard, generation, assembly, upscale থেকে final polish পর্যন্ত।
অনলাইনে বেশিরভাগ “AI short film” টিউটোরিয়াল একটি চরিত্র সহ 15-30 সেকেন্ডের ক্লিপ তৈরি করে এবং এটি সম্পন্ন বলে। এটি ড্রামা নয় — এটি একটি moodboard।
একটি প্রকৃত শর্ট ড্রামার প্রয়োজন:
- একটি সম্পূর্ণ narrative চাপ (setup → conflict → resolution)
- বিভিন্ন কোণ থেকে একাধিক shots
- একটি চরিত্র যা throughout একই ব্যক্তির মতো দেখায়
- সঠিক pacing
- Production-quality finish (কোন watermarks, captions, বা AI artifacts নয়)
এই গাইডটি ব্যাখ্যা করে যে 2026-এর বর্তমান tooling ব্যবহার করে এটি সব এক ঘণ্টার কম সময়ে কীভাবে করবেন।
আমরা একটি বাস্তব উদাহরণ ব্যবহার করব: 90-সেকেন্ডের শর্ট ড্রামা 《孟婆嫌我烦》 (“Lady Mengpo is annoyed with me”), যা একজন creator Juying-এ 60 মিনিটে তৈরি করেছে। সম্পূর্ণ কাজে 30+ shots আছে, প্রধান চরিত্র throughout অভিন্ন দেখায়, এবং এটি এশীয় short-form প্ল্যাটফর্মে viral হয়েছে।
নিচের workflow-টি ঠিক যা ব্যবহার করা হয়েছিল।
শুরু করার আগে: আপনার যা দরকার
টুল:
- একটি AI ভিডিও প্ল্যাটফর্ম যা শট জুড়ে character consistency সমর্থন করে। আমরা এই গাইডের জন্য Juying ব্যবহার করব; নীতিগুলি transfer হয়।
- script generation-এর জন্য একটি LLM। Claude বা GPT-4 ভাল কাজ করে। অনেক AI ভিডিও প্ল্যাটফর্ম এই ধাপ অন্তর্ভুক্ত করে।
- আপনার প্রধান চরিত্রের একটি রেফারেন্স ছবি (বাস্তব ছবি, AI-জেনারেটেড portrait, বা sketch)।
সময় বাজেট: মোট 60 মিনিট।
দক্ষতা স্তর: Beginner। কোন পূর্ব AI ভিডিও অভিজ্ঞতা প্রয়োজন নেই।
ধাপ 1: গল্পের ধারণা (1 মিনিট)
একটি বাক্য দিয়ে শুরু করুন। শুধু একটি।
Mengpo-এর জন্য, বীজ বাক্য ছিল:
“Lady Mengpo, চীনা underworld-এ বিস্মৃতির স্যুপ পরিবেশনকারী দেবী, একটি আত্মার সাথে বিরক্ত যে অনবরত বকবক করছে।”
এই পর্যন্তই। এই ধাপে over-plan করবেন না। কাঠামো ধাপ 2-এ আসে।
সীমাবদ্ধতা: এমন একটি গল্প বাছুন যা 2-3-এর বেশি স্বতন্ত্র চরিত্রের প্রয়োজন নেই এবং 60-90 সেকেন্ডে ফিট হয়। বেশিরভাগ viral শর্ট ড্রামায় এক বা দুই lead, একটি স্পষ্ট conflict, এবং একটি দ্রুত resolution আছে।
আপনি যদি আটকে থাকেন, AI shorts-এর জন্য তিনটি গল্পের প্যাটার্ন যা ভাল কাজ করে:
- Reaction beat: কিছু ঘটে, চরিত্র দৃঢ়ভাবে প্রতিক্রিয়া করে, twist resolution। (Mengpo এটি অনুসরণ করে।)
- The misunderstanding: A মনে করে B, X করছে, B আসলে Y করছে, প্রকাশ।
- The escalation: ছোট জিনিস বারবার ঘটে, খারাপ হয়, climax হয়।
ধাপ 2: Script জেনারেট করুন (5 মিনিট)
আপনার এক-বাক্যের ধারণা এই prompt সহ LLM-কে দিন:
Write a 90-second short drama script based on this idea:
[your one-sentence idea]
Requirements:
- 8-12 scenes, each scene 6-10 seconds
- Specify camera framing for each scene (close-up, medium, wide, etc.)
- Specify lighting and mood
- Include 2-3 lines of dialogue or voiceover where appropriate
- Build a clear arc: setup, conflict, resolution
- End with a memorable beatআউটপুট একটি কাঠামোবদ্ধ script। এটি পর্যালোচনা করুন। Pacing সামঞ্জস্য করুন, dull scenes-কে শক্তিশালী beats দিয়ে প্রতিস্থাপন করুন। precious হবেন না — শর্ট ড্রামা scripts ক্রমাগত rewrite হয়।
Mengpo-এর জন্য, LLM 11টি scene তৈরি করেছে। creator 9টি রেখেছে, 2টি বাদ দিয়েছে যা ওজন বহন করেনি।
ধাপ 3: মূল চরিত্র লক করুন (5 মিনিট)
এটি সেই ধাপ যা বেশিরভাগ workflows skip করে এবং পরে মূল্য দেয়।
আপনার AI ভিডিও প্ল্যাটফর্মে আপনার প্রধান চরিত্রের একটি ভাল রেফারেন্স ছবি আপলোড করুন। রেফারেন্স হওয়া উচিত:
- উচ্চ resolution (ন্যূনতম 1024×1024)
- Front-facing বা 3/4 view
- Even lighting (মুখে ভারী shadows নয়)
- একক চরিত্র স্পষ্টভাবে framed (ছবিতে অন্য কোন মুখ নেই)
প্ল্যাটফর্ম রেফারেন্স process করে এবং একটি character asset তৈরি করে — সাধারণত 30-90 সেকেন্ড সময় লাগে। একবার asset তৈরি হলে, এই চরিত্রের রেফারেন্স প্রতিটি ভবিষ্যত generation locked পরিচয় ব্যবহার করবে।
এটি কেন গুরুত্বপূর্ণ: character lock ছাড়া, শট 6-এর মধ্যে আপনি একজন ভিন্ন ব্যক্তির দিকে তাকিয়ে থাকবেন। এর সাথে, শট 30 এখনও শট 1-এর মতো একই চরিত্রের মতো দেখায়।
আপনার প্ল্যাটফর্ম যদি persistent character assets সমর্থন না করে, এখানেই multi-shot AI dramas ব্যর্থ হয়।
Mengpo-এর জন্য, রেফারেন্স ছিল লাল পোশাকে একটি কঠোর, সদয় বয়স্ক মহিলার একটি AI-জেনারেটেড portrait। পাঁচ মিনিট আপলোড, processed, locked।
ধাপ 4: Storyboard স্বয়ংক্রিয় জেনারেট করুন (15 মিনিট)
আধুনিক AI ভিডিও প্ল্যাটফর্মে একটি storyboard planner অন্তর্ভুক্ত। এটিকে আপনার script + আপনার locked চরিত্র দিন; এটি shot-by-shot storyboard তৈরি করে:
- Shot framing (close-up, medium shot, wide)
- Camera motion (static, push-in, pan, dolly)
- Lighting setup
- Character pose / expression
- Time code (এই শট কখন শুরু এবং শেষ হয়)
আপনার প্ল্যাটফর্ম যদি storyboards স্বয়ংক্রিয় জেনারেট না করে, আপনি প্রতিটি শটের জন্য prompts লিখে এটি manually করতে পারেন। manually করার সময় 15-20 মিনিট পরিকল্পনা করুন।
একটি ভালভাবে পরিকল্পিত storyboard “প্রতিটি শট একই দেখায়” সমস্যা প্রতিরোধ করে যা beginners-এর সমস্যা। আপনার framings বৈচিত্র্যময় করুন: close-ups-কে mediums এবং wides-এর সাথে বিকল্প করুন; motion যোগ করতে dolly বা push-in ব্যবহার করুন; প্রতিটি scene eye level-এ shoot করবেন না।
Mengpo-এর জন্য, storyboard-এ 9টি scene-এ 30+ shots ছিল — আত্মার reaction close-ups, স্যুপের উপর হাতের details, underworld setting-এর wide shots, এবং বাষ্পের মধ্য দিয়ে subjective POV সহ।
ধাপ 5: শট জেনারেট করুন (30 মিনিট)
এটি দীর্ঘতম ধাপ কিন্তু বেশিরভাগই idle সময় — আপনার প্ল্যাটফর্ম parallel-এ shots জেনারেট করে।
Generate-এ ক্লিক করুন। চলে যান। 30 মিনিটে ফিরে আসুন।
পর্দার আড়ালে কী ঘটছে:
- 30+ shots parallel-এ queue (যদি আপনার প্ল্যাটফর্ম এটি সমর্থন করে; serial generation অনেক বেশি সময় নেবে)
- প্রতিটি শট আপনার locked character embedding ব্যবহার করে
- Auto-generated negative prompts সাধারণ drift modes প্রতিরোধ করে
- Post-hoc consistency checks যেকোনো শট পুনরায় জেনারেট করে যা অনেক drift হয়
আপনার প্ল্যাটফর্মে যদি parallel generation বা no-queue dedicated capacity না থাকে, এই ধাপ মিনিটের পরিবর্তে ঘণ্টা নিতে পারে। এটাই 60-মিনিট workflow এবং এক-দিন workflow-এর পার্থক্য।
Mengpo-এর জন্য, এই ধাপ 28 মিনিট নিয়েছে — 30 shots, সব parallel-এ, সব consistent।
ধাপ 6: Assemble (3 মিনিট)
বেশিরভাগ আধুনিক AI ভিডিও প্ল্যাটফর্ম স্বয়ংক্রিয়ভাবে একটি rough assembly তৈরি করে — তারা storyboard ক্রমে shots একসাথে জুড়ে দেয়।
Assembly পর্যালোচনা করুন। খুঁজুন:
- Pacing সমস্যা (একটি শট যা খুব বেশি থাকে, একটি cut যা খুব দ্রুত)
- Continuity errors (lighting jumps, character pose discontinuity)
- যেকোনো শট যেখানে character drift slip হয়েছে
প্রকৃত continuity সমস্যার জন্য, সেই single শট পুনরায় জেনারেট করুন। pacing-এর জন্য, প্ল্যাটফর্মের editor-এ trim বা extend করুন।
Mengpo-এর দুটি শট পুনরায় জেনারেট এবং closing শটে 1-second trim প্রয়োজন। মোট তিন মিনিট।
ধাপ 7: Caption removal + upscale (5 মিনিট)
বেশিরভাগ generated AI ভিডিওতে সূক্ষ্ম artifacts থাকে: ছোট text glitches, watermark-like elements, মাঝে মাঝে anomalies। Smart-removal টুল underlying frame degrade না করে এগুলি পরিষ্কার করে।
তারপর upscale করুন। 4K outputs 1080p-এর চেয়ে বেশি professional দেখায়, বিশেষ করে বড় আধুনিক screens-এ play করা short-form content-এর জন্য।
উভয়ই এখন integrated প্ল্যাটফর্মে built-in। disconnected টুল ব্যবহার করার সময়, এখানে 5-এর পরিবর্তে 15-30 মিনিট আশা করুন।
ধাপ 8: Final polish (1 মিনিট)
যোগ করুন:
- Title card (শুরুতে 1-2 সেকেন্ড)
- credit / handle সহ end card (শেষে 1 সেকেন্ড)
- উপযুক্ত হলে background music (বেশিরভাগ প্ল্যাটফর্ম একটি music selection অন্তর্ভুক্ত করে)
- প্ল্যাটফর্ম compatibility-এর জন্য subtitle track
Mengpo-এর চূড়ান্ত স্পর্শ: একটি একক চীনা-character title card এবং creator এবং Juying উভয়কে credit দেওয়া একটি watermark।
মোট সময় চেক
| ধাপ | সময় |
|---|---|
| 1. গল্পের ধারণা | 1 মিনিট |
| 2. Script generation | 5 মিনিট |
| 3. Character lock | 5 মিনিট |
| 4. Storyboard | 15 মিনিট |
| 5. Shots জেনারেট করুন | 30 মিনিট (বেশিরভাগ idle) |
| 6. Assembly | 3 মিনিট |
| 7. Caption removal + upscale | 5 মিনিট |
| 8. Final polish | 1 মিনিট |
| মোট | ~65 মিনিট |
ধাপ 5-এর 30 মিনিট বেশিরভাগই idle। আপনি যদি এটি শুরু করে চলে যান, মোট active সময় ~35 মিনিট।
উচ্চ মানের জন্য টিপস
সঠিক রেফারেন্স ছবি বাছুন। খারাপ reference = খারাপ character lock। একটি ঝাপসা বা অদ্ভুতভাবে আলোকিত reference প্রতিটি শটকে যন্ত্রণা দেবে। সঠিকটি খুঁজে পেতে 5 মিনিট ব্যয় করুন।
Framing আক্রমণাত্মকভাবে বৈচিত্র্যময় করুন। Beginners সবকিছু eye level, medium shot-এ shoot করে। Pros close-ups, low angles, high angles, dollies ব্যবহার করে। বৈচিত্র্য এটিকে cinematic অনুভব করায়।
Silence ব্যবহার করুন। 90-সেকেন্ডের ড্রামার 90 সেকেন্ড সংলাপের প্রয়োজন নেই। সেরা শর্ট ড্রামার কিছু 50% silent reactions।
আপনারটা তৈরি করার আগে প্রকৃত শর্ট ফিল্ম দেখুন। TikTok এবং YouTube Shorts-এর কোন “short film” অনুসন্ধানের প্রথম page-এ আশ্চর্যজনকভাবে cinematic shorts আছে। Pacing patterns চুরি করুন।
মডেলের সাথে লড়াই করবেন না। আপনার script যদি AI-এর জন্য কঠিন কিছু চায়, সরল করুন। মডেল যা ভাল করে তা নিয়ে কাজ করুন।
সাধারণ প্রশ্ন
এই workflow কি একাধিক চরিত্র সামলাতে পারে?
হ্যাঁ। ধাপ 3-এর শুরুতে 2-3টি চরিত্র লক করুন, তারপর prompts-এ নাম দ্বারা তাদের রেফারেন্স করুন। সীমাবদ্ধতা: যদি দুটি চরিত্র screen time শেয়ার করে এবং অনুরূপ বৈশিষ্ট্য (একই লিঙ্গ, বয়স, জাতিগত) থাকে, শেয়ার করা frames-এ মাঝে মাঝে identity bleed আশা করুন — প্রায় 10% multi-character scenes-এর একটি manual cleanup pass প্রয়োজন।
এটি কি দীর্ঘ ভিডিওর জন্য (5+ মিনিট) কাজ করে?
তাত্ত্বিকভাবে হ্যাঁ, কিন্তু: খরচ linearly বাড়ে, এবং ~3 মিনিটের বাইরে narrative coherence এখন আসলে কঠিন। আমরা creators-কে তিনটি 90-সেকেন্ড arcs-কে 5-মিনিটের episodes-এ stitch করতে দেখেছি। বিশুদ্ধ 5-মিনিট end-to-end সম্ভব কিন্তু 90 সেকেন্ডের চেয়ে বেশি কাজ।
আমি যদি একটি রেফারেন্স ছবি draw বা photograph করতে না পারি?
একটি image AI (Midjourney, DALL-E, Stable Diffusion) দিয়ে একটি জেনারেট করুন। আপনার চরিত্র vision-এর সাথে সবচেয়ে ভাল মেলে এমন ফলাফল বাছুন। ভিডিও ধাপের জন্য আপনার রেফারেন্স হিসাবে এটি ব্যবহার করুন।
আমার প্ল্যাটফর্মে character lock নেই। আমি কি এখনও এটি করতে পারি?
আপনি পারেন, কিন্তু consistency cleanup-এ 3-5x সময় ব্যয় করার আশা করুন। বিকল্প উপায়:
- প্রতিটি শটে character description-এর জন্য একই prompt verbatim ব্যবহার করুন
- সর্বদা একটি রেফারেন্স ছবি অন্তর্ভুক্ত করুন
- প্রতিটি শটের 3টি version জেনারেট করুন, সবচেয়ে consistent বাছুন
- ~30% শট পুনরায় জেনারেট করার পরিকল্পনা করুন যখন drift খুব স্পষ্ট
narrative work-এর জন্য, native character consistency সহ একটি টুলে স্যুইচ করা সাধারণত মূল্যবান।
credits / dollars-এ এর খরচ কত?
প্ল্যাটফর্ম অনুসারে ব্যাপকভাবে পরিবর্তিত হয়। Juying-এ, 30 শটের সাথে একটি 90-সেকেন্ড প্রকল্প সাধারণত 200-400 credits ব্যবহার করে, যা free tier-এর মধ্যে (500 credits/month) বা Pro ($49/mo with 3000 credits)-এ তুচ্ছ।
per-clip প্ল্যাটফর্মে, দৈর্ঘ্য এবং গুণমান settings-এর উপর নির্ভর করে per project $5-30 আশা করুন।
কেউ আপনাকে যা বলে না
60-মিনিট workflow বাস্তব, কিন্তু বেশিরভাগ beginners-এর প্রথম প্রচেষ্টা 3-4 ঘণ্টা নেয়। ধীরগতি AI নয়; এটি:
- script-এ অনেক বেশি সময় ব্যয় করা (শুধু কিছু লিখুন, পরে iterate করুন)
- একটি খারাপ রেফারেন্স ছবি বাছাই (ভাল একটি খুঁজতে 5 মিনিট ব্যয় করুন)
- storyboard ধাপ skip করা (প্রতিটি শট “wide medium shot” হয়ে যায়; ফলাফল flat অনুভব হয়)
- সবকিছু পুনরায় জেনারেট করা (সবচেয়ে খারাপ 10% পুনরায় জেনারেট করুন, বাকি ছাড়ুন)
2-3 প্রকল্পের পরে, workflow এক ঘণ্টার কম সময়ে compress হয়। 5 প্রকল্পের পরে, আপনি এটি 40 মিনিটে করতে পারেন।
Workflow চেষ্টা করুন
Juying এই সম্পূর্ণ workflow end-to-end একটি free tier সহ সমর্থন করে। আপনি যদি এই workflow দিয়ে কিছু তৈরি করেন, আমরা এটি দেখতে চাই।