KI auf dem Vormarsch

Wie künstliche Intelligenz die Welt der Bilder (und Texte) auf den Kopf stellt

mit Dall-E 2 entwickelte Weihnachtsbilder
Fast nostalgisch erinnern wir uns an die Zeit, in der gewiefte Photoshop-Profis nahezu jedes Bild manipulieren konnten. Allerdings bedurfte es dazu einer möglichst perfekten Beherrschung der Bildbearbeitungssoftware sowie eines entsprechenden grafischen Talentes.

Neue KI-gestützte Technologien schreiben dieses Kapitel nun neu. Mit Midjourney, Dall-E oder Stable Diffusion kommen eine Reihe von Tools auf den Markt bzw. sind Beta verfügbar, um Bilder ohne größeres technisches Know-how per künstlicher Intelligenz (KI) zu erzeugen. Während diese Anwendungen auf die reine Bilderstellung begrenzt sind, wissen wir, dass KI längst mehr kann.
Stable Diffusion kann beispielsweise zusätzlich Texteingaben und Zeichnungen kombinieren und dann anhand beider Elemente ein neues Bild erzeugen. Dabei kann die KI Bilder wie von Zauberhand völlig neu erstellen, diese im Style oder inhaltlich verändern und sie sogar an den Rändern fortzusetzen. Die Anwendungsmöglichkeiten scheinen unendlich.

Der Bildgenerator DALL·E 2

Wir haben uns DALL·E 2 stellvertretend etwas näher angesehen. DALL-E 2 von Open-AI ist ein KI-System, das auf Basis einer Textbeschreibung hin realistische Bilder und Kunstwerke erstellen kann. Zum Test haben wir dem System folgende Aufgabe gestellt: „antique female sculpture with headphones“. Das Ergebnis sehen Sie hier ganz unten.

Möglich wird diese faszinierende Anwendung dadurch, dass das Programm zuvor mit Millionen von Bildern aus dem Netz und deren jeweiligen Beschriftungen trainiert wurde. Auf diese Weise konnte das Programm lernen, wie Bilder und Fragmente davon sprachlich zu deuten sind. Die KI stellt logische Verbindungen her und erstellt auf Wunsch ein Bild, das oft schwer von manuell erstellten Bildern und Grafiken unterscheidbar ist.

ChatGPT

Aber Machine Learning erobert nicht nur die Welt der Bilder und Grafiken. Ähnliche Technologien können ebenfalls heute schon verwendet werden, um Artikel zu schreiben, Content zu erstellen, Gedichte, Kochrezepte – ja sogar einen einfachen Programmiercode kann der intelligente Chatbot ChatGPT von Open AI beispielsweise auf textlicher Eingabe des Lösungswunsches hin entwickeln. Aktuell haben dieses und vergleichbare Systeme zwar noch einige Limits was Aktualität, weniger bekannte Themen, strategische Content-Generierung, allgemeinen Konsens vs. Expertenmeinungen betrifft, es bleibt aber zu sehen, wie es mit zukünftigen Entwicklungen ausschauen wird.

Für die Erstellung unserer Weihnachtsgrafik wollten wir uns in diesem Jahr 2022 von beiden KI inspirieren lassen: ChatGPT haben wir die Aufgabe gegeben, uns eine DALL-E Anweisung zu schreiben, in welcher der Weihnachtsmann mit VR Brille vorkommt. Das Ergebnis haben wir daraufhin in DALL-E eingegeben. Die erstellten Bilder sehen Sie oben in der Einleitung. :)

Fazit

Wir sind gespannt auf die zukünftigen Entwicklungen dieser neuen Technologien und wollen sie u.a. auch für die Erstellung von Inhalten für Onlineshops testen. KI-gestütztes Texting für Produkt-Detailtexte oder Kategorie-Beschreibungstexte könnte ein interessanter Anwendungsbereich werden, wobei es aktuell noch klar erscheint, dass dabei strategische Kontrolle, Überwachung und Korrektur von Menschenhand von Nöten ist.

Sie können sich schon Mal gefasst machen – diese neuen technischen Möglichkeiten werden unsere Informationswelt maßgeblich und nachhaltig verändern. Es ist an uns Anwendern, diese moralisch und ethisch vertretbar einzusetzen.
jetzt kontakt aufnehmen