Der Papst und der Dalai Lama beim Kaffeetrinken ...

 

Was schon lange gilt, weil man mit Photoshop bereits seit geraumer Zeit Bilder manipulieren kann, wird mit KI noch offensichtlicher: Traue keinem Bild, das du nicht selbst gefälscht hast. Deshalb sei es gleich hier am Anfang gesagt: Alle Bilder in dieser Newsmeldung sind mit künstlicher Intelligenz erzeugt.


AI (Artificial intelligence) oder auf Deutsch KI (Künstliche Intelligenz) ist in aller Munde. Mich hat die Neugier gepackt und ich habe etwas mit Midjourney experimentiert, einem der führenden Tools, um eine Bildbeschreibung in ein Foto umzusetzen. Man gibt eine möglichst detaillierte Bildbeschreibung in Englisch ein, und das System generiert daraus vier Varianten eines Bildes. Quelle dafür sind offenbar fünf Milliarden Fotos, die im Internet kursieren. Das Ganze bewegt sich derzeit noch in einem rechtsfreien Raum, denn bis auf einen Anbieter greifen die Tools auf Bilder zurück, für die sie kein Verwendungsrecht haben. Für Experimente ist das (noch) kein Problem, aber was passiert, wenn ein Unternehmen oder eine Marke KI-generierte Bilder verwendet, auf denen eines oder mehrere der Originalbilder noch deutlich zu erkennen sind? Es ist nur eine Frage der Zeit, bis sich Gerichte mit der Frage beschäftigen müssen, ob ein durch KI generiertes Bild ein völlig neues Werk ist oder ob den Urhebern der verwendeten Fotos eine Lizenzgebühr gezahlt werden muss.

Je nach Motiv sehen die Bilder oder zumindest Teile davon immer noch sehr künstlich aus. Manchmal stimmt auch nicht ganz alles – schau Dir zum Beispiel die Hände auf dem letzten Bild genauer an (für vergrösserte und komplette Ansicht auf das Bild klicken). Ich bin mir ziemlich sicher, dass sich das in Zukunft noch verbessern wird, und wahrscheinlich haben auch meine noch recht geringen Kenntnisse in der Erzeugung von KI-Bildern einen Einfluss auf die Bildqualität.


Warum der Papst und der Dalai Lama?

Ich habe mir erlaubt – und man möge es mir verzeihen – den Papst und den Dalai Lama als Aufhänger für diesen Artikel zu verwenden. Ich wollte ein Bild schaffen, dass es so geben könnte. Das hat mir von einem lieben Freund, den ich sehr schätze, Kritik eingebracht. Denn zu Recht sagt er, dass sich dieses Bild im Internet weiterverbreiten könnte, und irgendwann ist das Bild dann so aus dem Zusammenhang gerissen, dass man nicht mehr weiss, dass es ein KI-generiertes Bild ist. Er hat vorgeschlagen, das Bild als KI-Foto kennzuzeichnen, doch leider ist die KI sehr gut in der Lage, irgendwelche Vermerke in einem Bild wieder herauszurechnen. Die neuesten Versionen von Adobe Photoshop zeigen, wie beängstigend und faszinierend weit die Bildbearbeitungsprogramme in diesem Bereich schon sind. Ein anderer Bekannter fand die Idee mit den beiden geistlichen Oberhäuptern sehr gut und schlug vor, ein ähnliches Bild mit Putin und Selenskyj zu generieren – so als Beitrag zum Friedensprozess … Diese Feedbacks zeigen die grosse Gefahr dieser Technologie. Niemand weiss mehr, was echt ist und was nicht. Zur Zeit sehen die KI-generierten Bilder noch etwas künstlich aus, und hie und da weisen sie – wie oben erwähnt – kleine Fehler auf. Deshalb kann man beim genaueren Betrachten oft feststellen, ob es sich beim Bild um eine echte Fotografie oder um ein KI-Bild handelt. Aber es ist aus meiner Sicht nur eine Frage der Zeit, bis die KI-generierten Bilder nicht mehr von einer Original-Fotografie zu unterscheiden sind.


Was macht das mit uns als Gesellschaft?

Wenn ich mit Freunden über KI-generierte Bilder spreche oder ihnen zeige, wie man mit KI Fotos generieren kann, spüre ich zwei Emotionen: Faszination und Frustration. Faszination deshalb, weil es spannend ist, dass man eine Szene in Worten beschreiben kann und die KI ein Bild daraus generiert. The sky (oder eben die eigene Phantasie) is the limit – ein abgedroschener Spruch, der sich auch hier bewahrheitet. Wir nehmen die Schwingen der Technologie, um immer höher zu fliegen. Doch nach etwas Nachdenken tritt bei meinen Gesprächspartnerinnen und -partnern oft der Ikarus-Effekt ein: Absturz. Sie formulieren dann Sätze wie beispielsweise «Jetzt kann ich einem Bild endgültig nicht mehr trauen». Schon die Bildbearbeitungsprogramme haben den Glauben an das Foto als eine Reflektion der Realität stark reduziert. Und es scheint mir, dass die KI das, was an Glaube noch vorhanden war, komplett zerstört. In einer Gesellschaft, die sowieso schon verunsichert ist durch die Ereignisse der letzten Jahre und die angespannte Weltlage, vergrössert diese neue Technologie die Verunsicherung weiter. Durch den Missbrauch von extremistischen Gruppen sind zudem absolute Werte sind verpönt, doch jetzt, wo alles relativ wird, spüren wir einen Verlust, weil es keinen Halt mehr zu geben scheint. Vielleicht ist das etwas dramatisch formuliert, und KI-basierete Bilder sind in diesem ganzen Geflecht der Verunsicherung vielleicht nur ein Mosaiksteinchen, aber es scheint mir, dass dieses künstliche Generieren von Bildern die Verunsicherung plötzlich greifbarer und realer werden lässt. Wir stehen als Gesellschaft vor grossen Herausforderungen, und die Technologie – die auch viel Positives mit sich bringt, das sei hier explizit erwähnt – lässt sich sicher nicht aufhalten. Wir dürfen als Menschen und als Gesellschaft die Authentizität nicht verlieren. Darüber wurde und wird viel geschrieben, und es fordert jede/n Einzelne/n von uns heraus, sich der Frage nach Authentizität zu stellen. Interessanterweise hat die Fotoindustrie diese Entwicklung sehen kommen und eine spannende Initiative ins Leben gerufen:


Content Credentials

Content Credentials ist eine Organisation, die meinem Verständnis nach das RAW-File in der Kamera mit einem Code versieht, der das Originalfile als unbearbeitetes Orginal erkennen lässt. So kann man jederzeit beweisen, ob ein Bild manipuliert worden ist oder nicht. Fotografinnen und Fotografen werden in Zukunft die Möglichkeit haben, gleich beim Fotografieren den Content-Credentials-Code ihren Bildern hinzufügen zu lassen. Die erste Firma, die Content Credtials in eine Kamera eingebaut hat, ist Leica in der Leica M11P. Wie das Ganze funktioniert, erfährst Du hier.


Die Resultate meines Experiments

Als neugieriger und offener Mensch, der in der Werbung und in der Fotografie arbeitet, ist diese Technologie auf jeden Fall so wichtig, dass ich sie verfolge. Die Kunst besteht darin, den sogenannten «Prompt» zu formulieren. «Prompt» ist der Name der Bildbeschreibung, die man eingibt. Meine ersten Versuche mit der KI-basierten Bilderzeugung haben mir gezeigt, dass schon kleine Änderungen im Text grosse Auswirkungen auf das Bild haben können. Das «Prompten» ist also eine Art Programmiersprache, in der man die Bilder beschreibt. Die Krux ist, dass man manchmal ein Bild im Kopf hat und die KI dann etwas ganz anderes generiert. Man kann bei Midjourney zwar eigene Bilder als Stilvorlage hochladen, aber mein erster Test mit einem hochgeladenen Bild hat gezeigt, dass zwar der Stil des Bildes einigermassen übernommen wird, aber ansonsten habe ich mein Foto in der KI-generierten Version nicht wiedererkannt (was ja für die Urheberrechtsfrage für die Nutzer sehr gut ist...).

Hier die ersten Resultate meiner Experimente mit Midjourney:

Keines dieser Bilder ist real. Es sind alles Werke, die die KI aufgrund meiner Eingaben erstellt hat.


Und special thanks to Christian Habermeier, der mich in die Midjourney-Welt eingeführt hat.


 
Zurück
Zurück

KI zweite Runde

Weiter
Weiter

Alles Gute für 2024