In diesem Beitrag geht es um die Frage: Kann Künstliche Intelligenz kreativ sein?
Und wenn ja, was bedeutet diese Kreativität?
Künstliche Intelligenz und Kreativität
Quelle: Wikipedia Portrait of Edmond de Belamy (Ausschnitt)
Im Jahr 2018 versteigerte das Aktionshaus
Christie's ein KI-generiertes Kunstwerk mit dem Titel
Portrait of Edmond de Belamy, zu einem Erstaunen auslösenden Preis von 432.500 US-Dollar. Dahinter steckte das Pariser Künstlerkollektiv
Obvious. Die Person Edmond de Belamy hat es nie gegeben, sie ist eine fiktive Person, die im Stil der Malerei des 18. Jahrhunderts von einem KI-Programm der Rubrik
Generative Adversarial Networks als Portrait erzeugt wurde.
Ein Generative Adversarial Network ist ein Programm, das aus zwei gegeneinander antretenden Neuronalen Netzwerken besteht, einem Generator und einem Diskriminator. In unserem Fall hatte der Generator die Aufgabe, ein Bild zu erzeugen, das als „echtes“ Gemälde aus dem 18. Jahrhundert gelten kann und ist mit einem zufällig erzeugten Bild gestartet. Die Aufgabe des Diskriminators bestand darin, zu erkennen, ob das vom Generator erzeugte Bild als Gemälde aus dem 18. Jahrhundert anerkannt werden könnte. Dazu wurde er mit einer Vielzahl von Abbildungen echter Gemälde trainiert. Nach jedem Durchlauf wurden gemäß dem üblichen Verfahren beim maschinellen Lernen die Verbindungswerte (Parameter) zwischen den Neuronen des Generator-Netzes minimal verändert. Dabei verbesserte sich der Generator immer mehr. Die Prozedur kann durchaus ein paar Millionen Mal durchlaufen werden, bis der Diskriminator zu dem Ergebnis kommt, dass der Output des Generators als echtes Bild aus dem 18. Jahrhundert durchgehen könnte.
Eine ausführlichere Beschreibung gibt es in dem Reclam-Bändchen Künstliche Intelligenz - Das Ende der Kunst?
aus dem Jahr 2023 von
Catrin Misselhorn, S. 22-24.
Kunst und KI
Signatur des Belamy-Portraits
Das künstliche Gemälde zeigt mit leicht verschwommenen Konturen das Bildnis eines Mannes im Stil klassischer Portraitmalerei des 18. Jahrhunderts. Das Autorenkollektiv hat es unterzeichnet mit Ausschnitten aus dem Algorithmus, der bei der Konzeption der Neuronalen Netze eine Rolle gespielt haben soll. Bei der Auktion wurde ausdrücklich darauf hingewiesen, dass das Bild von einer Künstlichen Intelligenz hergestellt wurde und nicht von einem menschlichen Geist. Kunstkritiker bescheinigten dem Bild zwar die Möglichkeit seiner Herkunft aus dem 18. Jahrhundert, zeigten sich aber wenig begeistert von der Qualität des Werkes. Aber darum ging es ja auch nicht.
Kunst gilt gemeinhin als eine Domäne von Kreativität. Wenn ein KI-Programm ein Kunstwerk herstellen kann, so stellt sich die Frage, ob man der Künstlichen Intelligenz Kreativität zusprechen muss.
KI-Programme lässt man inzwischen ganze Sequenzen von Filmen entwickeln und auch realisieren. Chatbots wie ChatGPT oder Gemini können mit wenig Vorgaben Geschichten erzählen, die es bis dato nicht gab. Schachprogramme schlagen Großmeister mit bisher nie gespielten Zugkombinationen. Alles weitere Beweise für die Kreativität Künstlicher Intelligenz?
Spricht man den Leistungen der Künstlichen Intelligenz Kreativität zu, so stellt sich allerdings die Frage, worin diese Kreativität eigentlich besteht. Das KI-Programm, das das Belamy-Portrait hervorgebracht hat, wurde mit Tausenden von Gemälden aus der Zeit des 18. Jahrhunderts trainiert und hat seinem „Gedächtnis“ die in diesen Gemälden zum Ausdruck kommende Kreativität zahlreicher Künstler sozusagen einverleibt.
Verhält es sich nicht ähnlich wie bei der Konzeptkunst, bei der es mehr um die Idee hinter dem Kunstwerk als um seine Realisierung geht? Die kreative Leistung ist dabei die Formulierung der Aufgabe. Die Ausführung kann dann dem Handwerk überlassen werden.
Bestand nicht die eigentliche Kreativität in der Auswahl und dem Inhalt des Trainigsdatenmaterials und der Fragestellung an das System?
Xbox, Ubisoft und andere große Namen der Gaming-Branche setzen bei der Spiele-Entwicklung immer mehr auf generative KI. Sie lassen Dialoge schreiben und vertonen, Charaktere entwerfen und ganze Spiel-Level umsetzen, mit minimalem menschlichem Input.
Seltsamerweise nicht so Nitendo, interessant was der Firmenboss Shuntaro Furukawa dazu sagt. Er meint, die von seiner Firma erschaffenen Spiele zeichne entschieden ihre menschliche Kreativität aus. Er ist weiter der Auffassung, wer sich eines der vielen preisgekrönten Nintendo-Switch-Spiele der letzten Jahre vor Augen führt, kann den Games genau deswegen den Status als Kunstwerk kaum absprechen. Wer das Schaffen von Charakteren, Welten oder anderen zentralen Spiel-Elementen einer generativen KI überlässt, hat dagegen seiner Meinung nach keine kreative oder künstlerische Leistung erbracht, sondern schlicht ein kommerzielles Produkt bauen lassen. Somit würde eine der größten Qualitäten Nintendos verloren gehen – von den desaströsen Folgen für die Jobs der Studio-Mitarbeiter gar nicht erst zu reden, so zitiert Gregor Elsholz
den Firmen-Chef (Quelle: „Nintendo geht eigenen Weg: Boss erteilt Gaming-Trend klare Absage“, Giga online vom 4.7.2024).
Experten geraten in Streit, wenn sie definieren sollen, was Kunst und Kreativität ist. Vermutlich können sich aber alle darauf verständigen, das es kreativ ist, wenn man etwas Neues, noch nie Dagewesenes zustande bringt oder - um ein Beispiel aus der Wissenschaft zu bemühen - zu Erkenntnissen gelangt, die noch kein Mensch bisher gedacht hat.
Kreativität und KI
Die aufgezählten und seitenlang fortsetzbaren Beispiele erwecken durchaus den Eindruck, dass etwas Neues, noch nicht Dagewesenes entstehen kann. Aber was geschieht eigentlich, wenn eine KI-Maschine eine Geschichte erzählt?
Das damit beauftragte Programm, sagen wir ein Chatbot, bemüht sich zunächst um die Erkennung des Musters in der Benutzeranforderung und greift auf sein Sprachmodell (eines der zahlreichen Large Language Models) zu. Was das System nach in Millionen von Trainigsläufen gelernten Wahrscheinlichkeiten hergibt, lässt sich im Rahmen vorgegebener Muster aus dem Vokabular des Systems zusammenstellen. Es handelt sich dabei immer um eine Kombinatorik von bereits bekannten Elementen und in der Datenmasse erkennbaren Mustern. Dabei können selbstredend Kombinationen entstehen, die bisher niemand gesehen hat. Wenn man dies für kreativ hält, dann ist in diesem Sinne die KI-Technik kreativ.
Was genau in unserem Gehirn geschieht, wenn wir kreativ sind, kann die heutige Neurologie noch nicht mit Sicherheit sagen. Was wir bisher wissen, lässt sich grob wie folgt beschreiben: Das in Clustern organisierte Netzwerk der rund hundert Milliarden Neurone des menschlichen Gehirns ist ständig in Aktion. Jedes dieser Neurone kann seine Information an Tausende anderer Neuronen weitergeben. Dies eröffnet Billionen oder Billiarden von Kombinationsmöglichkeiten. Vor allem aber lernt dieses Netzwerk ständig aus den Erfahrungen im sich Bewegen in einer Welt mit einem permanenten Bombardement von Sinneseindrücken, die Empfindungen, schlichtes faktenbezogenes Wissen und vor allem Emotionen auslösen. Ob wir es wollen oder nicht unterliegt dieser Input einer ständigen Bewertung nicht nur für die Bewältigung der augenblicklichen Situation, sondern auch für die Erinnerung in späteren Situationen. Neuere Forschungen gehen davon aus, dass in dem Gegenwartsfenster, in dem wir leben, bereits eine Vorschau auf das erfolgt, was uns als Nächstes erwartet bzw. was wir vermuten, dass es uns erwartet, Irrtum natürlich nicht ausgeschlossen. Alles das ist individuell und nicht identisch wiederholbar.
Die kognitiven Leistungen unseres Gehirns bestechen weiter durch die Fähigkeit zur Abstraktion. Unsere Gedanken können sich lösen von der konkreten Situation. Sie sind metaebenenfähig, will sagen, sie verfügen über die Eignung zum Nachdenken über unser Denken (Fähigkeit zur Selbstreflexion). Dies begründet auch das sich Anpassen-Können an eine sich verändernde Welt. Wir können Muster ersinnen, die nicht nur aus der Unentdecktheit von bereits Vorhandenem herausgefunden werden, sondern im wahrsten Sinne des Wortes Neuland darstellen. Und wir sind dabei nicht allein auf kognitive Prozesse begrenzt.
KI-Systeme bleiben weit hinter diesem Leistungsspektrum zurück. Sie verfügen nicht über die Befähigung zur Abstraktion. Sie können Emotionen nur simulieren. Sie haben kein Zeitempfinden und deshalb auch kein Gegenwartsfenster, sie haben keine autonome Wahrnehmung und „erleben“ nichts. Sie können nicht aus eigenem Impuls handeln. Man muss ihnen sagen, was sie zu tun haben und ihnen einen Input geben, den sie im Rahmen trainierter Muster oder nach vorgegebenen Algorithmen abarbeiten können. Stoßen sie auf Anforderungen, zu denen sie nichts in ihrem Trainingsmaterial finden, müssen sie mit Tricks arbeiten, um ihr Handling mit Statistik und Wahrscheinlichkeitsrechnung fortsetzen zu können. Dabei laufen sie Gefahr zu halluzinieren. Somit stellt sich die Frage, ob ihre Kreativität nicht auf die Mustererkennung in ihren aufbereiteten Trainingsdaten begrenzt bleibt.
Fazit
Unser Gehirn befähigt uns, zu empfinden, zu erleben und zu handeln. Unser Leben ist permanentes Lernen. Wir können kreativ sein nicht nur in dem Sinne, uns einfallen zu lassen, was wir als nächstes tun, sondern darüber hinaus uns auch Dinge ausdenken, die bisher noch niemand gedacht hat.
KI-Systeme können nur digital. Sie liefern nur nach Veranlassung Ergebnisse, und dies nur auf der Basis von Mustern, die sie in ihrem Training gelernt haben. Anstelle von permanentem, aus Erfahrungen rückgekoppeltem Lernen leben sie von schubweisen Erweiterungen ihrer Datenbasis und ihren von Zeit zu Zeit geänderten Algorithmen, die für uns nicht oder nur wenig transparent sind, Manipulationsverdacht nicht zweifelsfrei ausgeschlossen.
Wer es nicht glauben will, dem sei empfohlen, die gleichen Fragen ChatGPT von der US-amerikanischen Firma OpenAI und Ernie, dem Chatbot der chinesischen Firma Beidu zu stellen.
Will man die Frage beantworten, ob Künstliche Intelligenz kreativ sein kann, so kommt es also darauf an, was man unter kreativ versteht. Keine einfache Frage, die Dinge bleiben kompliziert.