Generative KI-Forschung ConsiStory in Stable Diffusion - Endlich konsistente KI-Charaktere ohne Finetuning?

// 09:12 Mi, 14. Feb 2024von Rudi Schmidts

Auf der Projektwebseite steht zwar noch "anonyme Autoren", jedoch stellt das arxiv.org/pdf/2402.03286.pdf (verlinkte PDF-Paper) klar, dass "ConsiStory" aus den Forschungseinrichtungen von Nvidia stammt. Dieses Projekt nimmt sich dabei dem Problem an, dass es oft schwer fällt, einen oder mehrere Charaktere über mehrere Bildgenerationen konsistent zu nutzen. So sieht ein "Alter Mann mit Hut" je nach den übrigen Prompt-Tokens meistens mit jedem Gernerierungsversuch signifikant anders aus. Dies versteht man unter dem aktuellen Konsistenz-Problem der Generativen KI.

Bisher begegnete man diesem Problem mit dem sogenannten Finetuning - das heißt, man "personalisierte" ein bereits trainiertes KI-Modell mit weiteren Bildern einer oder mehrerer spezieller Personen. Dies ist jedoch rechenaufwendig und erfordert zudem ein gewisses Know-How.

Mit ConsiStory soll es nun dagegen ohne zusätzliches Training möglich sein, innerhalb von Stable Diffusion XL (SDXL) konsistente Motive über eine Reihe von Bildern hinweg zu generieren. Die Forscher von Nvidia nutzen dafür ein ein neues Feature, welches sie "korrespondenzbasierte Feature-Injection" nennen. ConsiStory soll sich hiermit sogar auf Multi-Subject-Szenarien erweitern lassen und eine trainingsfreie Personalisierung für gängige Objekte ermöglichen.

ConsiStory erlaubt ohne Finetuning die Nutzung konsistenter Charaktere

Durch das ausbleibende Training sollen solche Bilder auf einer einzigen Nvidia H100 bereits in zehn Sekunden zu erstellen sein - was laut Paper rund zwanzig mal schneller sei, als bisherige State-of-the-Art-Methoden.

Der Qualität der bislang veröffentlichten Ergebnisse nach zu schließen, dürfte Nvidia hier ein kleiner Meilenstein in der generativen KI Forschung gelungen zu sein - denn Konsistenz bei Charakteren ist eines der großen Probleme, an denen aktuell viele praktische Einsatzszenarien für generative KI "hängen". Und natürlich auch einige eher ungewollte KI-Projekte, wie beispielsweise vollautomatisierte, virtuelle KI-Influencer.

Selbst nutzbarer Code zum Ausprobieren von ConsiStory soll "in Kürze" auf der Github-Projektseite für Interessierte als Link zur Verfügung gestellt werden.

mehr Infos bei
consistory-paper.github.io

Auf Socials teilen:

Leserkommentare // Neueste

jakob123 // 12:40 am 16.2.2024

bedeutet das man kann das bald über provider wie replicate nutzen oder andere Zugänge via api? Oder nur wenn man eine eigene ai Instanz auf eigenem server, Rechner baut? danke...weiterlesen

balkanesel // 22:19 am 14.2.2024

ja, Karte um 350.000.- Euronen, und man kann 256 koppeln man gönnt sich ja sonst nix

Frank Glencairn // 09:55 am 14.2.2024

Genau was ich gerade brauche.

Im Forum mitdiskutieren >>

Ähnliche News //

News

Kostenlose Bildgenerierung per KI: Stable Diffusion jetzt mit einfachem Installer

Vor kurzem wurde die Text-zu-Bild KI Stable Diffusion veröffentlicht, mit deren Hilfe man kostenlos auf dem eigenen Computer auch zuhause auf dem eigenen PC phantastische Bildern ....

// 11:00 Di, 13. Sep 2022von Thomas Richter

News

Microsoft Olive: Neues kostenloses Tool verdoppelt Performance von Stable Diffusion

Microsoft hat ein neues, freies Tool namens Olive vorgestellt, welches vielen KI-Modellen wie zum Beispiel Stable Diffusion ermöglicht, automatisch die Hardwarebeschleunigung von ....

// 18:08 Mi, 24. Mai 2023von Thomas Richter

News

KI Bilder mit Stable Diffusion jetzt auch direkt in Photoshop und Gimp erzeugen

Die bildgenerierende KI Stable Diffusion kann seit kurzem einfach auf dem eigenen PC genutzt werden, doch gibt es jetzt einen noch einfacheren Weg. Der Programmierer und Künstler ....

// 10:51 So, 18. Sep 2022von Thomas Richter

News

Stable Diffusion XL: KI-Bilder werden fotorealistischer

Stable Diffusion ist ein Open Source KI Bildgenerator, der sich gerade aufgrund seiner Offenheit großer Beliebtheit erfreut. So ist Stable Diffusion grundsätzlich frei verfügbar .....

// 14:48 Sa, 10. Jun 2023von Rudi Schmidts

News

Pro Bild nur 15 Sekunden: Stable Diffusion läuft auf Smartphone

Ursprünglich war eine dedizierte Grafikkarte mit mindestens 8 GB VRAM die Voraussetzung, um auf dem eigenen Computer Bilder mittels der freien Text-zu-Bild-KI Stable Diffusion zu ....

// 17:35 Di, 14. Mär 2023von Thomas Richter

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

High Speed Cine Objektive DZOFILM gibt ersten Ausblick auf High-Speed Objektivserie ARLES T1.4 Vista Vision

Auf der NAB haben wir auch am Stand von DZOFILM vorbeigeschaut und hier zwei spannende Neuigkeiten entdeckt: Nach der südfranzösischen Stadt „Arles“ benannt - hat DZOFILM eine ...

// 16:26 Mo, 29. Apr 2024von Rob

News

Prager Urteil Können KI-generierte Bilder, Klänge und Videos von jedermann frei genutzt werden?

Die Rechtslage bei KI generierten Inhalten ist zwar keinesfalls eindeutig, jedoch gibt es immer wieder Einzelentscheidungen, die bereits einen zukünftigen Interpretations-Korridor ...

// 11:48 Mo, 29. Apr 2024von Rudi Schmidts

zur Newsübersicht >