Upp emot 30 bilder per sekund
Videor som konstrueras av ord med hjälp av AI bygger på samma principer som att när man skapar en stillbild utifrån text med hjälp av två neurala nätverk.
Ett neuralt nätverk tar fram bilder utifrån dina ord. Det andra AI-nätverket kontrollerar kontinuerligt de framtagna bilderna mot ett stort bildarkiv och poäng för noggrannhet, något som systemet hela tiden försöker överträffa för att förbättra dina slutliga bilder.
I webbvideor med vanligtvis 24 till 30 bilder per sekund behöver AI-systemet även hantera rörelser i motivet med pixelperfekt precision.
"Make-A-Video löser problemet genom att lägga till ett lager av inlärning som gör det möjligt för systemet att förstå rörelser i den fysiska världen och tillämpa den på traditionell text-till-bild-generering", förklarar Metas vd Mark Zuckerberg i ett Facebook-inlägg.
Känn igen fysiska lagar
För att förstå rörelser i rörliga bilder har Metas AI för videoproduktion integrerat fysiska lagar som gravitation för att styra interaktionen mellan människor och objekt i videorna.
Dessutom tränas den artificiella intelligensen i att optimera rörelserna realistiskt när objekten i videor interagerar med varandra och bland annat bildar skuggor.
I en video med en artist som håller på att måla en bild har Meta exempelvis tränat AI:n i att förstå att en pensel på en duk lämnar nya linjer och färger på duken.
Hittills har Meta dock bara publicerat den här typen av förproducerade femsekunders AI-videor för att demonstrera tekniken, men du kan redan nu registrera dig för tjänsten för att bli en av de första AI-producenterna när den är klar för vanliga användare.
Google är också på gång
Flera videotjänster skryter redan med att ha AI som medproducent, men urvalet är något enklare än Metas visioner om innehåll där enbart fantasin sätter gränser.
På tjänsten Synthesia kan du till exempel skriva in text på en webbplats, varefter datorgenererade avatarer uttalar dina ord som en nyhetsuppläsare .
Eller så kan du skapa mer konstnärligt innehåll från befintliga videomallar på tjänsten InVideo, där det också finns begränsningar i form av antalet mallar.
Även Google har en text-till-video-tjänst som heter Phenaki och är uppkallad efter det första animeringsverktyget, som med hjälp av motiv ritade på en roterande pappaskiva ger en illusion av rörelse.
Googles AI-animationer, är precis som Metas videor, ännu inte tillgängliga för allmänheten.
Samtidigt arbetar Google med verktyg för att förhindra spridning av falska nyheter – något som behövs inte minst när vem som helst kan producera trovärdiga filmer med Hitler som förskolepedagog eller annat kontroversiellt innehåll.