Zu erschwinglichem Preis? Revolutionäre Video-KI Sora soll noch dieses Jahr kommen

// 16:34 Do, 14. Mär 2024von

Als OpenAI seinen KI-Videogenerator Sora vor einem Monat vorstellte, betonte das Unternehmen, es würde noch dauern, bis das Text-zu-Video-Modell öffentlich zugänglich gemacht werde - zunächst gelte es, mögliche Risiken zu identifizieren, die von den damit generierten Videos ausgehen können, um entsprechende Sicherheitsmaßnahmen ergreifen zu können. Es hieß sogar, möglicherweise werde Sora nie für die breite Öffentlichkeit angeboten.


In einem Interview mit dem Wall Street Journal sagte nun jedoch OpenAIs CTO Mira Murati, sie gehe davon aus, dass Sora noch dieses Jahr für alle verfügbar werde ("I´m hoping definitly this year"), allerdings werde es noch einige Monate dauern, bis es so weit sei. Das aktuelle KI-Modell sei für Forschungszwecke ausgelegt; eine kommerziell nutzbare Version müsse nicht nur über Sicherheitsfilter verfügen, sondern auch deutlich effizienter beim Generieren sein. Denn um die bis zu eine Minute langen Clips zu erzeugen, werde sehr viel teure Rechenpower benötigt, jedoch sei das Ziel, die KI-Videogenerierung zu Preisen ähnlich wie bei der Bilderzeugung mit Dall-E anzubieten.




Derzeit kostet diese 0,08 Dollar für ein Bildquadrat in HD-Qualität mit Dall-E 3 bzw. 0,12 Dollar für eine Auflösung von 1792×1024. Wie könnte nun eine ähnliche Preisgestaltung für Videoclips gemeint sein, die ja aus einer Vielzahl Einzelbilder bestehen? Bei einer Framerate von 30 käme man ganz analog etwa auf einen Sekundenpreis von 3,60 Dollar, eine Minute würde dann ganze 216 Dollar kosten. Das wäre quasi geschenkt für eine professionell anmutende Footage, dürfte jedoch für ein schnelles Internetmeme zu teuer sein, zumal ja meist mehrere Anläufe beim Prompting benötigt werden.



Wir schätzen daher, dass wir eine gestaffelte Preisgebung für Sora sehen werden, mit einem irgendwie limitierten und einfacher zu errechnenden Output für die Hobbyanwendung und einer State-of-the-Art-Generierung für professionellere Ansprüche.



Hier nochmal eine Zusammenstellung der von OpenAI präsentierten Sora-Clips - immer noch als KI-generiert zu erkennen, vor allem wenn Menschen im Bild sind, jedoch deutlich besser als die Konkurrenz:





Laut Murati arbeitet OpenAI übrigens auch an Möglichkeiten, die errechneten Videos nachträglich gezielt anpassen zu können, Anwendern also mehr Kontrolle über die Videoerzeugung zu bieten. So wechseln in einem von Sora für WSJ generierten Clip Taxis im Bildhintergrund plötzlich die Farbe - so etwas ließe sich dann idealerweise per Nachprompt verbessern. Videos mit Ton wird es dagegen von Sora nicht in näherer Zukunft geben.



Auf die Frage, mit welchen Videos Sora trainiert wurde, gab es nur ausweichende Antworten - es wurde im Internet frei zugängliches sowie lizensiertes Videomaterial von Shutterstock verwendet. Ob beispielsweise auch YouTube-Clips im Corpus enthalten waren, wurde weder bestätigt noch dementiert. Das Thema Copyright ist in Sachen generativer KI ja weiterhin ein großes Fragezeichen - in einem anderen der im Interview gezeigten Videos ist beispielsweise ein Comic-Stier zu sehen, der eine gewisse Ähnlichkeit mit Disneys Ferdinand aufweist. Wurde Sora also vielleicht mit Ausschnitten aus dem gleichnamigen Film gefüttert, und wenn ja, gab es ein Einverständnis von Disney dafür? Fragen über Fragen.





Fassen wir zusammen: für die allgemeine Nutzung dürfte OpenAI zum Herbst (eventuell erst nach der US-Wahl im November) eine Version von Sora freigeben, die sich allerdings von dem jetzt gezeigten Modell unterscheiden wird, damit die Kosten für eine breite Nutzung nicht prohibitiv werden. Auch werden Filter installiert sein, die einen Mißbrauch verhindern sollen, sodass sich beispielsweise keine Abbilder von bekannten Personen generieren lassen. Ferner sollen die von Sora erstellten Videos sogenannte Content Credentials eingebettet bekommen, damit sich künstlich generierte Videos identifizieren lassen (das bereits jetzt enthaltene Wasserzeichen läßt sich wiederum mit anderen KI-Tools ja leicht entfernen).



Ob das reicht? OpenAI betont, die Sicherheit stünde an erster Stelle, sonst hätte man Sora längst freigegeben. Die Gefahr von Desinformationskampagnen, welche durch einigermaßen fotorealistische KI-Videos, wie sie Sora erstellen kann, enorm befeuert werden können, ist allzu real. O-Ton Mira Murati: "I´d say the hard part is really figuring out the safety questions and the societal questions. That´s really what keeps me up at night."


Leserkommentare // Neueste
iasi  //  15:03 am 16.3.2024
Mantas  //  10:46 am 16.3.2024
Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash