Waarom ontstaat character drift in AI-video?

Drie structurele redenen: (1) Generatieve video-modellen zijn stateless – elke generatie begint opnieuw met stochastische sampling, wat licht andere resultaten oplevert. (2) Prompts beschrijven categorieën, geen identiteiten. (3) Drift cumuleert over shots – kleine verschillen per shot stapelen zich exponentieel op.

Welke AI-video-tools lossen character drift op?

Per 2026 lossen character-as-asset-architecturen drift het effectiefst op. Deze aanpak behandelt het personage als een persistente embedding opgeslagen onder een unieke character_id en geïnjecteerd in de model-conditioning bij generatie. Tools met deze aanpak (zoals Juying.art) houden de identiteit over 30+ shots vast.

Wordt character drift erger bij langere video's?

Ja. Drift cumuleert, dus een video van 5 minuten heeft meer drift dan een video van 30 seconden, al het andere gelijk. Dat is mede waarom lange-vorm AI-video zo lastig is.

Wat is character drift in AI-video?

Precieze definitie van character drift in AI-video: welke kenmerken driften, waarom het gebeurt en hoe je test of een tool het echt heeft opgelost.

May 17, 2026·7 min read·definition

Character drift is wanneer het uiterlijk van een AI-gegenereerd personage subtiel verandert van shot tot shot, totdat je bij shot zes of zeven naar een ander persoon kijkt.

Het is de belangrijkste reden waarom narratieve AI-video — korte films, drama, brand stories — op de meeste huidige tools nog niet werkt.

Dit artikel definieert character drift precies, legt uit waarom het gebeurt, loopt door wat het veroorzaakt, en behandelt welke technieken het in 2026 daadwerkelijk oplossen.

Een precieze definitie

Character drift verwijst naar onbedoelde, geleidelijke veranderingen in identiteitsbepalende kenmerken van een personage over meerdere AI-gegenereerde video-shots, terwijl de gebruikersintentie is dat die kenmerken constant blijven.

Drift is onbedoeld — de gebruiker wilde consistentie. Het is geleidelijk — elk shot verandert een beetje. Het treft identiteitsbepalende kenmerken — dingen die een persoon herkenbaar zichzelf maken.

Drift verschilt van:

Stijlwissel (bedoeld, bv. van realistisch naar aquarel)
Toestandswissel (bedoeld, bv. hetzelfde personage nu boos, gewond of ouder)
Pose- / hoekvariatie (bedoeld, bv. vooraanzicht naar profiel)

Drift is wat gebeurt als je dezelfde persoon wilde en een andere kreeg.

Welke kenmerken driften?

Over duizenden generaties van publieke tools die we hebben gecatalogiseerd, treft drift typisch deze kenmerken:

Oogkleur — de meest voorkomende drift. Bruin wordt hazel wordt groen over enkele shots.
Oogvorm — enkellid naar dubbellid, smal naar wijd.
Kaaklijn — scherp naar zacht, hoekig naar afgerond.
Haarlijn — terugtrekkend of vooruitkomend, scheiding verandert.
Huidskleur — 5-10% warmer of koeler.
Gelaatsverhoudingen — oogafstand, neus-tot-mond ratio, kinlengte.
Haarkleur — zwart naar bruin naar donkerbruin.
Lichaamsverhoudingen — lengte, bouw, houding.
Onderscheidende kenmerken — moedervlekken, littekens, accessoires verschijnen of verdwijnen.
Stilistische identiteit — realistisch naar licht gestileerd gerenderd.

Sommige hiervan zijn duidelijk. Andere (oogafstand, neus-tot-mond ratio) worden onbewust opgemerkt — kijkers voelen dat er iets niet klopt zonder bewust te kunnen identificeren wat veranderd is.

Waarom ontstaat drift?

Drie structurele redenen.

1. Generatieve video-modellen zijn stateless

Bij shot 1 zet het model je prompt om in een latente representatie, draait het diffusie-proces en geeft frames terug. De interne toestand wordt niet bewaard. Bij shot 2 met dezelfde prompt begint het model opnieuw.

De nieuwe generatie is vergelijkbaar maar niet identiek, omdat diffusie-sampling stochastisch is. Elke generatie is een andere random walk door de latente ruimte van het model, zelfs bij vergelijkbare prompts.

2. Prompts beschrijven categorieën, geen identiteiten

Een prompt als '30-jarige Aziatische vrouw met schouderlang zwart haar' beschrijft een categorie met miljoenen geldige personen. Het model kiest er telkens een. Zonder iets specifiekers kun je niet vastpinnen op een specifiek persoon.

Sommige tools accepteren referentiebeelden. Die helpen voor de eerste 2-3 shots, maar het model weegt geleidelijk de prompt zwaarder dan de referentie, en drift sluipt terug.

3. Drift cumuleert over shots

Zelfs kleine per-shot verschillen stapelen zich op. Drift elk shot 3% van de oorspronkelijke referentie, dan zit je bij shot 10 op 30% verschil. Bij shot 20 is het personage onherkenbaar veranderd.

De wiskunde van drift is exponentieel, niet lineair.

Waarom huidige tools het niet native oplossen

De meeste AI-video-tools (Runway Gen-3, Pika 2.0, Sora, Kling, Veo 3, Seedance 2.0) zijn geoptimaliseerd voor single-clip kwaliteit. De R&D-inspanning gaat naar het zo goed mogelijk maken van elke individuele generatie. Multi-shot consistentie is een apart probleem dat een aparte architectuur vereist en geen prioriteit was voor de foundation-modellen zelf.

De tools die er native het dichtst bij komen (Sora, Seedance) tonen in onze tests nog steeds merkbare drift vanaf ongeveer shot 3-4.

Welke technieken drift echt oplossen

Vijf benaderingen, op volgorde van hoe goed ze werken:

1. Zelfde prompt + zelfde seed (werkt nauwelijks)

Theorie: identieke input zou identieke output moeten geven.

Realiteit: moderne video-modellen hebben stochastische elementen (noise scheduling, attention dropout) die seeds niet volledig respecteren. Frame-niveau verschillen verschijnen zelfs bij identieke input.

Resultaat: kleine reductie van drift, lost het niet op.

2. Referentiebeeld in elk shot (helpt voor ~3 shots)

Theorie: neem de referentie in elke prompt op om het personage te verankeren.

Realiteit: werkt voor shots 1-3, drift bij shot 4-6, breekt bij shot 8-10.

Resultaat: nuttig voor korte content, faalt bij narratief.

3. LoRA-finetuning per personage (werkt maar schaalt niet)

Theorie: train een klein eigen model op foto's van je personage; gebruik het voor alle shots.

Realiteit: werkt goed voor beeldgeneratie. Voor video vereist het 20+ foto's, kost 30 min – 2 uur per personage om te trainen, generaliseert slecht naar beweging en combineert niet over meerdere personages.

Resultaat: productiekwaliteit consistentie, maar workflow schaalt niet.

4. IP-Adapter / reference-only conditioning (helpt matig)

Theorie: injecteer features van het referentiebeeld in de attention-lagen van het model, met omzeiling van de prompt.

Realiteit: werkt voor matige consistentie over 5-10 shots, breekt bij 20+ shots en bij forse pose-wisselingen.

Resultaat: solide voor middellange content, faalt bij volwaardig narratief.

5. Character-as-asset-architectuur (huidige stand van de techniek)

Theorie: behandel het personage als een eersteklas persistent asset, opgeslagen als embedding, niet als prompt-detail. Injecteer de embedding direct in de model-conditioning. Combineer met automatisch gegenereerde negative prompts op basis van een catalogus van veelvoorkomende drift-modes.

Realiteit: dit is waar tools als Juying omheen zijn gebouwd. In onze tests behoudt deze aanpak de identiteit over 30+ shots met hoge consistentie.

Resultaat: productieklare consistentie voor narratieve content.

Hoe je elk tool op drift test

Drie snelle tests:

Test 1 — De 30-shot-test: Genereer hetzelfde personage in 30 verschillende scènes (variërende belichting, hoeken, emoties). Leg ze als raster naast elkaar. Bekijk gezichten zij aan zij. Ze moeten duidelijk dezelfde persoon zijn.

Test 2 — De end-to-end-test: Vergelijk shot 1 en shot 30 direct. Ze moeten als dezelfde persoon niet te onderscheiden zijn.

Test 3 — De hergebruik-test: Genereer vandaag een personage. Kom morgen terug met een ander script. Kun je hetzelfde personage hergebruiken zonder het opnieuw op te zetten?

Tools die alle drie tests doorstaan, hebben het driftprobleem op productiekwaliteit opgelost. Tools die op één van de drie zakken, niet.

Veelgestelde vragen

Is character drift hetzelfde als de 'uncanny valley'?

Nee. De uncanny valley verwijst naar subtiele onjuistheid in een enkele weergave van een persoon. Drift verwijst naar identiteitsveranderingen over meerdere weergaven.

Treft drift ook niet-menselijke personages?

Ja. Drift treft geanimeerde personages, gestileerde personages, dieren en zelfs objecten. Alles met identiteitsbepalende kenmerken kan driften.

Kan ik drift in postproductie repareren?

Deels. Je kunt face-swap of compositing op losse shots doen, maar dat is arbeidsintensief en oogt op schaal kunstmatig. Drift bij generatie oplossen is veel beter dan achteraf repareren.

Wordt drift erger bij langere video's?

Ja. Drift cumuleert, dus een video van 5 minuten heeft meer drift dan een van 30 seconden, al het andere gelijk. Mede daarom is lange-vorm AI-video zo lastig.

Is drift fundamenteel onoplosbaar?

Nee. De character-as-asset-architectuur werkt. De uitdaging zit in goede engineering— de juiste embedding-extractie, de juiste drift-mode-catalogus, de juiste consistentie-checkloop. Tools die in deze laag investeerden, lossen drift op productiekwaliteit op.

De kern

Character drift is geen modelprobleem — het is een architectuurprobleem. Grotere video-modellen lossen het niet op; ze produceren alleen drift van hogere kwaliteit. De oplossing zit in de laag boven het model: hoe identiteiten worden opgeslagen, opgehaald en in generaties geïnjecteerd.

Wie een AI-video-tool kiest en wiens werk hetzelfde personage in meerdere shots vergt, moet vragen:

"Hoe slaat en haalt jullie tool personage-identiteit over generaties heen?"

Is het antwoord 'we gebruiken een referentiebeeld' — dan zal er drift zijn. Is het antwoord 'we slaan embeddings op als persistente personage-assets en injecteren die in conditioning' — dan is drift grotendeels opgelost.

Gerelateerd lezen

Probeer een tool dat drift native oplost — Juying — free tier beschikbaar.