Aktuelles

ControlNet - Die nächste Stufe der KI-Bilderzeugung?

Auch wenn die Ergebnisse mittels KI geschaffener Bilder oft bemerkenswert sind - es lässt sich nicht leugnen, dass momentan die Schöpfer der meisten Werke relativ wenig Einfluss auf das Ergebnis hatten. Doch das dürfte sich schon bald ändern...

// 17:34 Do, 23. Feb 2023von Rudi Schmidts

Als Eingabe erwarten Modelle wie Stable Diffusion, Midjourney oder DALL-E 2 bislang entweder ein bereits vorhandenes Bild (pic2pic) oder eine Texteingabe (text2pic), mittels derer ein Bild generiert wird. Doch eigentlich sind diese Eingabe-Texte und -Bilder "nur" Koordinaten in einem Raum mit sehr vielen Dimensionen, dem sogenannten Latent Space. Ein entsprechender Eingabe-Satz (der sogenannte Prompt) deutet also nur auf einen Punkt in diesem Latent Space, der anschließend das Bild durch eine sehr große, aber feste Formel mit diesen Koordinaten als Parameter erzeugt.

Ist nur ein einziges (Satz)-Zeichen im Prompt anders, so zeigt dieser auf eine ganz andere Stelle im Latent Space und errechnet somit auch ein komplett anderes Bild. Zudem bestimmt eine Startzufallszahl (die sogenannte Seed) wie das Rauschen erstellt wird, das den Ausgangszustand der Bildberechnung darstellt. Ändert man auch nur nur eine Ziffer in der Seed, erhält man ebenfalls ein komplett anderes Bild.

Mehr Zufall als Kontrolle

Die bisherige Arbeitsweise mit KI-Bildgeneratoren besteht also darin, beim Prompting viele Kombinationen auszuprobieren und irgendwann mit einem ausgespuckten Ergebnis zufrieden zu sein. Will man beispielsweise eine bestimmte Körperhaltung oder einen Kamerawinkel im Bild haben, so muss man dies bei der Texteingabe beschreiben und hoffen, dass die KI das auch entsprechend deutet - was keineswegs selbstverständlich funktioniert, sondern in der Regel eher daneben geht. Auch wenn man ein Bild als Input verwendet, ist es keineswegs sicher, dass die KI beispielsweise auch dessen Kamerawinkel übernimmt. Die Erzeugung ist also aktuell sehr stark von Trial and Error bestimmt und für jedes gelungene Bild, das medial bestaunt werden kann, wurden in der Regel zuvor hunderte misslungene Versuche verworfen. In den meisten Fällen landet man zwar irgendwann bei einem überraschend guten Ergebnis, jedoch war dessen konkrete Bildkomposition meistens keineswegs vom Anwender vorher exakt geplant...

Doch genau dies könnte sich nun mit ControlNet ändern, das seit einigen Tagen durch die StableDiffusion-Community geistert. Control Net erlaubt es, den Text Prompt mit einem zusätzlichen Bild zur Erläuterung der eigenen Idee zu füttern. Und damit eine Richtung der Bildkomposition vorzugeben, wie Gegenstände und Menschen im Bild angeordnet sein sollen.

Gamechanger durch mehr Kontrolle?

Die bislang veröffentlichten Beispiele zeigen bereits deutlich das Potential dieser neuen Technologie und in den Kommentaren fiel seit längerem auch mal wieder der Begriff "Gamechanger". Doch zurecht?

Nach allem, was wir bisher gesehen (und selbst ausprobiert haben), erweitert ControlNet die Möglichkeiten der KI-Bilderzeugung deutlich. Allerdings muss man zur Bedienung (noch) von Hand speziell angepasste Modelle einbinden. Diese Modelle bestimmen, an welcher Art von Bildvorlagen sich ControlNet anschließend orientieren soll. Hier kann man beispielsweise ein "Scribble Modell" wählen, welches einfache Skizzen als Input akzeptiert:

ControlNet - Die nächste Stufe der KI-Bilderzeugung? : Scribble

Oder ein Modell für Strichmännchen-Posen:

ControlNet - Die nächste Stufe der KI-Bilderzeugung? : Posing

Oder ein Modell mit Z-Puffer Tiefeninformationen als Input:

ControlNet - Die nächste Stufe der KI-Bilderzeugung? : Depth

Wer etwas Zeit mitbringt, kann ControlNet aktuell selbst auf Hugginface online ausprobieren - sogar ohne auf seinem Rechner etwas installieren zu müssen. Die dort kostenlos zur Verfügung gestellte Umgebung ist allerdings bei der Berechnung der Prompts ziemlich langsam und benötigte bei uns pro Änderung mindestens zwei Minuten Rechenzeit. Dies Zeiten sind jedoch stark davon abhängig, wie viele Nutzer aktuell mit ControlNet herumspielen.

Nächste Seite >>

Bequemer Einstieg

Leserkommentare // Neueste

MK // 12:23 am 3.3.2023

Goofy-Ohren-Gummibärchen-Stormtrooper aus Entenhausen auf der Reeperbahn? :D

rudi // 10:28 am 3.3.2023

Das war mein zweiter Versuch beim herumspielen in Control Net -nach 5 Minuten! Ich wüsste nicht, wie lange jemand anders in Blender für so ein Bild brauchen würde. (ich würde...weiterlesen

medienonkel // 16:24 am 28.2.2023

Geht so, ist schon auch Geschmackssache. Ich kenne genügend Leute, die meiner Meinung nach weder Technik beherrschen, noch ein Auge haben, sich aber dumm und dämlich verdienen...weiterlesen

Im Forum mitdiskutieren >>

Kameratests auf einen Blick Die besten Kameras 2023: Welche Kameras haben uns in diesem Jahr besonders beeindruckt?

Acht Kameras haben es auf unsere Liste der besten Kameras 2023 geschafft. Tatsächlich könnten die Kameras kaum unterschiedlicher sein: Von kostenlos bis 70.000 Euro, von Ultra-...

// 09:10 Sa, 23. Dez 2023von Rob

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

Test

Apple Log + Blackmagic Cam App Apple iPhone 15 Pro Max im Praxistest: 10 Bit Apple Log - Gamechanger für Smartphone-Filmer?

Mit der iPhone 15 Generation hat Apple hochspannende Funktionen - insbesondere auch für Filmer - vorgestellt: Fünfach-Zoom, erstmalig USB-C, externe SSD-Aufnahme, Apple Log und ...

// 14:51 Do, 12. Okt 2023von Rob

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Wissen

Wichtige KI-Begriffe einfach erklärt - Was bedeutet Seed und wofür braucht man das?

Nein, Generative KI geht ganz sicher nicht mehr weg und darum ist es sicherlich niemals zu früh, sich mit den Basics vertraut zu machen. Wie beispielsweise mit dem sogenannten ...

// 09:33 Di, 11. Apr 2023von Rudi Schmidts

Praxis

A Father´s Job: Bildgewaltige, anamorphotische Indieproduktion auf hohem Niveau

Wir freuen uns sehr, hier spannende Einblicke in die qualitativ herausragende Kurzfilmproduktion "A Father´s Job" von Frank Christian Wagner präsentieren zu können. Frank ist ...

// 08:09 Fr, 2. Jul 2021von Rob

Test

Gut genug für Pro? MacBook Air M3 13" im Performance-Test mit Arri, Sony, Panasonic, Canon und Blackmagic

Mit dem Macbook Air M3 in der 13" Ausführung haben wir den derzeit kompaktesten und leichtesten Laptop von Apple getestet. Wir wollten wissen, wie gut Apples ultra-mobiles ...

// 12:06 So, 7. Apr 2024von Rob

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Test

Die besten DSLMs für Video 2023: Sony, Canon, Panasonic, Nikon, Blackmagic ...

Mit der Canon EOS R6 Mark II, der Panasonic S5 II sowie der Fujifilm X-H2S sind wichtige neue Vollformat und APS-C DSLMs auf den Markt gekommen. Zeit für ein Update der slashCAM ...

// 18:01 Do, 23. Mär 2023von Rob

zur Artikelübersicht >

Mobile Videoproduktion Apple stellt neue Final Cut Pro Versionen für iPad und Mac vor

Zusammen mit der Einführung der neuen iPad Pro und iPad Air Modelle hat Apple auch neue Versionen von Final Cut Pro für Mac und Final Cut Pro für iPad zusammen mit neuen Logic Pro ...

// 17:57 Di, 7. Mai 2024von Rob

News

Frische Tablets von Apple iPad Pro und Air jetzt auch mit OLED und M4-Prozessor von 699 bis 3.100 Euro

Die zwei neuen iPad-Air-Modelle sind mit einem M2-SoC ausgestattet und unterscheiden sich vor allem durch ihre Displaygröße. Das große Modell mit 13 Zoll soll zudem gegenüber dem ...

// 17:33 Di, 7. Mai 2024von Rudi Schmidts

News

Für rund 500 Euro Hollyland Pyro H 4K: HDMI Videofunkstrecke sendet an bis zu vier Empfänger

Hollyland hat gerade das neue Videoübertragungssystem Pyro H 4K auf den Markt gebracht, welches UltraHD 4K Video mit bis zu 30 fps über Strecken von bis zu 400 Metern drahtlos ...

// 14:17 So, 5. Mai 2024von Thomas Richter

News

Ohne Führerschein Mini 4K - DJIs günstigste 4K/30p Drohne kostet nur 299 US-Dollar

DJIs neueste Kameradrohne, die Mini 4K, bleibt weiterhin unter 250 Gramm und darf deswegen ohne Führerschein geflogen werden. Mit einem Preis von 299 Dollar ist sie zugleich DJIs ....

// 13:45 Di, 30. Apr 2024von Rudi Schmidts

TOP THEMEN //

MEHR ARTIKEL

zur Artikelübersicht >

PASSENDE DISKUSSIONEN

zum Forum >>

Aktuelle News //

News

Zur Datensicherung SanDisk Desk Drive - externe 4TB /8TB SSDs vorgestellt

Mit SanDisk Desk Drive stellt Western Digital eine neue Komplettlösung für die Desktop-Datensicherung vor. Die Desk Drive SSDs bieten eine Kapazität von 4 TB und 8 TB und sind ...

// 14:23 Do, 9. Mai 2024von blip

News

Pro Editing Suite Magix Video Pro X 16: Vorgezogenes Update mit mehr KI-Funktionen

Trotz oder vielleicht auch gerade wegen der aktuell etwas angespannten Firmensituation will Magix zeigen, dass das man keineswegs gedenkt, die Flinte ins Korn zu werfen. Sogar ...

// 17:16 Mi, 8. Mai 2024von Rudi Schmidts

zur Newsübersicht >

zum Forum >>

Neueste Artikel //

Test

Pro Gimbal System DJI RS4 Pro und LiDAR: Bestes AF/Tracking (inkl. Stabilisierung) für Cine-Setups?

Wir hatten Gelegenheit den neuen DJI RS4 Pro Gimbal im Verbund mit DJIs LiDAR System zu testen und waren vor allem an der Autofokus- und Tracking Performance im Cine-Setup mit ...

// 16:02 Mo, 6. Mai 2024von Rob

Die Zukunft des Editing Adobe auf der NAB - Frame.io Redesign & KI-Tools für die Schnitt-Praxis

KI-basierte Workflows und Tools waren in diesem Jahr viel stärker als in der Vergangenheit auf der NAB vertreten und Adobe darf hier durchaus als Vorreiter gelten – schließlich ...

// 13:57 Do, 2. Mai 2024von slashCAM

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen