Google Research VideoPoet - mehr Konsistenz für KI-Bewegtbilder durch LLMs

// 11:06 Fr, 22. Dez 2023von Rudi Schmidts

Passend zur Weihnachts- und damit Geschichten-Zeit stellt Google Research VideoPoet vor. Hierbei handelt es sich auf den ersten Blick einfach nur um ein weiteres KI-Modell zur Videogenerierung, das jedoch bei näherer Betrachtung dann doch ein paar Besonderheiten aufweist. Grundsätzlich soll besonderer Wert darauf gelegt worden sein, "kohärente große Bewegungen zu erzeugen". Denn vergleichbare Modelle erzeugen bislang noch meistens nur "kleine Bewegungen" oder weisen bei größeren Bewegungen sehr auffällige Artefakte auf.

Genauer betrachtet ist VideoPoet, ein großes Sprachmodell (LLM - Large Language Model), das in der Lage ist, eine Vielzahl von Videogenerierungsaufgaben auszuführen, einschließlich Text-zu-Video, Bild-zu-Video, Videostilisierung, Video Inpainting und Outpainting sowie Video-zu-Audio.

Dies ist insofern bemerkenswert, weil die meisten SOTA-Modelle fast ausschließlich ausschließlich diffusionsbasiert arbeiten. Dagegen hat man bei einem LLM den Vorteil, dass sich hier mehrere Modalitäten (also auch Sprache, Code oder Audio) zur Generierungs-Steuerung nutzen lassen. Und ebendiese sorgen für bislang kaum gesehene Eingriffsmöglichkeiten bei der Generierung. Vielleicht sollte man sich zum Einstieg die folgende Geschichte zu Gemüte führen, die mittel VideoPoet entstanden ist:

Das Drehbuch für diese Kurzgeschichte über einen reisenden Waschbären hat übrigens Googles KI Bart geschrieben - mit einer Aufschlüsselung der einzelnen Szenen und einer Liste von begleitenden Aufforderungen. Anschließend hat VideoPoet daraus dann Videoclips für jeden Take generiert.

Um sich eine vielzahl an so entstanden Videos zu gemüte zu führen, hat Google Research wie üblich eine dedizierte Webseite zum Projekt erstellt, die einen zeitraubenden Überblick über die Fähigkeiten von VideoPoet gibt - was durchaus positiv gemeint ist.

mehr Infos bei
sites.research.google

Auf Socials teilen:

Leserkommentare // Neueste

Rick SSon // 12:16 am 22.12.2023

Immerhin kann die KI schon auf Kindergartenniveau erzählen 😅

Im Forum mitdiskutieren >>

Ähnliche News //

News

Text-zu-Video KI jetzt auch von Google: Imagen Video

Nachdem Meta gerade seine Make-a-Video KI zur Generierung von Videos nach Textbeschreibung vorgestellt hatte, hat Google jetzt nachgezogen und mit Imagen Video auch eine solche KI ...

// 16:48 Do, 6. Okt 2022von Thomas Richter

News

Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach ...

Forscher von Google haben eine neue KI vorgestellt, die nach einem ähnlichen Muster wie die gerade sehr populären Text-2-Image KIs wie DALL-E 2, Midjourney oder Stable Diffusion .....

// 10:57 Mo, 30. Jan 2023von Thomas Richter

News

Neue Studie Was werden KI-Videogeneratoren wie Open AI Sora im kommerziellen Einsatz kosten?

Sora hatte vor nicht einmal zwei Monaten die Welt verblüfft, weil es eine bisher noch niemals dagewesene Qualität bei KI-generierten Videos demonstrierte. In einem Blogbeitrag der ...

// 11:14 Mo, 8. Apr 2024von Rudi Schmidts

News

Qualitätssprung bei KI-Video-Konsistenz? MagicVideo-V2 mit TikTok-Nähe

ByteDance, die Muttergesellschaft von TikTok und Douyin, hat nach rund einem Jahr eine zweite Version von MagicVideo vorgestellt. Hierbei handelt es sich um ein KI-Modell zur ...

// 14:53 Sa, 13. Jan 2024von Rudi Schmidts

News

W.A.L.T. - Google zeigt neues KI-Videomodell mit sehr guter Konsistenz

W.A.L.T. bei Bewegtbildern steht nicht mehr nur für Disney sondern für einen transformerbasierten Ansatz zur fotorealistischen KI-Videoerzeugung mittels Diffusionsmodellierung. ...

// 11:13 Di, 12. Dez 2023von Rudi Schmidts

zur Newsübersicht >

Ohne Führerschein Mini 4K - DJIs günstigste 4K/30p Drohne kostet nur 299 US-Dollar

DJIs neueste Kameradrohne, die Mini 4K, bleibt weiterhin unter 250 Gramm und darf deswegen ohne Führerschein geflogen werden. Mit einem Preis von 299 Dollar ist sie zugleich DJIs ....

// 13:45 Di, 30. Apr 2024von Rudi Schmidts

News

Update: Postproduktions-Suite DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt

Am Blackmagic-Stand auf der NAB 2024 gibt uns Simon von Blackmagic Design einen detaillierten Einblick in die neuen Funktionen von DaVinci Resolve 19. Wir schauen uns ColorSlice, ....

// 15:38 Di, 23. Apr 2024von Rob

News

Profi-Kamera App kostenlos Blackmagic Camera App bald auch für Android Smartphones

Blackmagic hatte ja im Vorfeld der NAB 2024 seine beliebte Camera App für das iPhone in einer erneuerten Version 1.3 vorgestellt. Doch eine "Kleinigkeit" blieb dabei im News-...

// 14:31 Mo, 15. Apr 2024von Rudi Schmidts

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Praxis

Fußballer-Portrait Ausherzspiel - auf der Suche nach cinematischer Stimmung mit kleinen Mitteln

Die YouTube-Doku Ausherzspiel begleitet den gebürtigen Stuttgarter Odysseas Vlachodimos, Stammtorhüter bei Benfica Lissabon, durch seinen Alltag - wir haben Yannick Galaske zum ...

// 17:46 Do, 28. Jul 2022von blip

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Für rund 500 Euro Hollyland Pyro H 4K: HDMI Videofunkstrecke sendet an bis zu vier Empfänger

Hollyland hat gerade das neue Videoübertragungssystem Pyro H 4K auf den Markt gebracht, welches UltraHD 4K Video mit bis zu 30 fps über Strecken von bis zu 400 Metern drahtlos ...

// 14:17 So, 5. Mai 2024von Thomas Richter

News

Postproduktions Suite DaVinci Resolve 19 Public-Beta 2 zum freien Download verfügbar

Blackmagic bleibt seinen gewohnt zügigen Beta-Releases treu und hat soeben Version 2 von DaVinci Resolve und DaVincie Resolve Studio Public Beta 19 zum freien Download zur ...

// 09:12 Fr, 3. Mai 2024von Rob

zur Newsübersicht >