Kurzfassung
Der Anspruch der KI-Technik: eine Maschine zu bauen, die wie das menschlichen Denken funktioniert. Alles beginnt mit Wahrnehmung. Die Bandbreite unserer Wahrnehmung ist auf einen schmalen Korridor weniger Sinne begrenzt. Unsere Wahrnehung wird durch unsere Erfahrung und unser Erleben entscheidend geprägt. Sie steht in enger Verbindung mit unserem Gedächtnis. Computer stehen vor der Frage, ob und wie sie ihre Wahrnehmung auf usere Bandbreite begrenzen sollen. Sie benötigen digitalisiertes Input und können nur mit Modellen der realen Welt arbeiten. Sie verstehen nicht was sie sehen, haben keinen eigenen Willen und können somit auch keine autonomen Entscheidungen treffen.
Wahrnehmung: Die Basics der Künstlichen Intelligenz
Um der Spur zu folgen, wie man eine menschlichem Geist nachempfundene „intelligente Maschine“ bauen kann, liegt es nahe, mit dem Thema Wahrnehmung zu beginnen.
Menschliche Wahrnehmung
Quelle: ChatGPT, Trainingsdaten und
Karl Schmitz
Wenn man Computern Wahrnehmung beibringen will, sollte man verstehen, wie Wahrnehmung bei uns Menschen funktioniert. Gehen wir einmal davon aus, dass die Welt außerhalb von uns existiert und entscheiden uns im philosophischen Streit um diese Frage gegen den Idealismus und für den Realismus. Wir kennen die Wege, wie Eindrücke aus dieser Welt durch die sehr schmalen Korridore der Sensorik unserer Sinnesorgane in unser Gehirn gelangen. Mit medizinischen Verfahren können wir das gut sichtbar machen.
Menschliche Wahrnehmung
Konzentrieren wir uns der Einfachheit halber auf das Sehen, für andere Sinne läuft alles mit großer Wahrscheinlichkeit sehr ähnlich ab. Wenn wir wissen, in welchen unterschiedlichen Gehirnarealen zigtausende von Neuronen „feuern“, wissen wir immer noch nicht, was da vor sich geht, bis wir etwas sehen. Wenn ein blind geborener Mensch durch ein medizinisches Wunder plötzlich sehen kann, wir er vermutlich nichts erkennen können. Wir müssen erst mühsam gelernt haben, Muster zu erkennen. Mit zunehmender Erfahrung können wir dann immer mehr Details erkennen. An unserer Wahrnehmung ist immer unser Gedächtnis beteiligt. Wahrnehmung funktioniert nur, weil wir das Gesehene erleben, ähnliches bereits erlebt haben und durch Erfahrung gelernt haben, ihm eine Bedeutung zuzuordnen.
Wir haben eine Empfindung für das Wahrgenommene. Das ist kein allein durch unseren Verstand getriebener kognitiver Prozess, sondern ist untrennbar begleitet von Emotionen, die unter Mithilfe unseres Verstandes zu Gefühlen werden. Erfahrung ist nur möglich, weil wir ein Gedächtnis haben. Es hilft uns bei der Einordnung neuer Eindrücke. Wir können neue Dinge in Beziehung setzen zu bereits Bekanntem.
Theoretische Hintergründe
Der nicht gefundene Stein der Weisen ist die fehlende Antwort auf die Frage nach dem Hard Problem of Consciousness (David Chalmers), der Frage, warum und wie physikalische Prozesse im Gehirn subjektives Erleben („Qualia“) erzeugen. Manche Neurowissenschaftler meinen zwar, die physikalischen Vorgänge bei einfachen Problemen (das sog. Easy Problem of Conciousness) wie Wahrnehmung, Aufmerksamkeit und Gedächtnis erklären zu können, aber nicht das Erleben des Wahrgenommenen.
In diesem Zusammenhang ist oft die Rede von neurologischen Korrelaten (NCC). Damit sind die teilweise messbaren, mit bildgebenden Verfahren der Neurologie (fMRT- und EEG-Scans) sichtbar machbaren Aktivitätsmuster in bestimmten Hirnarealen gemeint. Sie zeigen, wo Gehirnprozesse bei bewusster Wahrnehmung, beim Nachdenken und bei Gefühlen stattfinden. Sie können aber nicht erklären, warum sie subjektives Erleben erzeugen. Dennoch meinen manche Hirnforscher, dass diese Korrelate in direkter Verbindung mit Bewusstsein stehen und man eines schönen Tages Bewusstsein vollständig durch physikalische Prozessse erklären kann.
Nicht ganz so weit geht die Global Neuronal-Workplace-Theorie (GNW). Sie behauptet, dass Bewusstsein sich aus der Komplexität der Informationsverarbeitung in vernetzten Gehirnregionen ergibt und so das Erleben des Wahrgenommenen ermöglicht. Die in verschiedenen Regionen massiv parallel verarbeiteten und verbreiteten Informationen stünden in einem permanenten Wettbewerb miteinander. Nur wenige, die am stäksten aktivierten Reize gewinnen die Aufmerksamkeit. Sie sind so wichtig, dass sie es in den von dieser Theorie angenommenen „globalen Neuronalen Workspace“ schaffen. Jetzt werden sie über das stark vernetzte Netzwerk von Neuronen über verschiedene Gehirnregionen verbreitet und sollen nun für kognitive Prozesse verfügbar sein, also für Sprache, Gedächtnis, Entscheidungsfindung und vor allem bewusste Wahrnehmung.
Bewusstsein ist damit zwar nicht erklärt, auch nicht, wie die Selektion der Informationen nach Wichtigkeit erfolgt. Aber immerhin meinen die Vertreter dieser Theorie, einen Beitrag für die Lösung des Easy Problem of Conciousness geleistet zu haben. Beweis dafür seien die messbaren elektromagnetischen Wellen mit einer Frequenz um 40 Herz, die sog. Gamma-Oszillationen. Diese werden durch synchronisierte Feuer-Muster der masssenhaft aktivierten Neurone bei verstärkter Hirnaktivität erzeugt.
Wir sehen: noch reichlich Nebel beim Stapfen durch das Wattenmeer.
Computerwahrnehmung
Um etwas wahrnehmen zu können, braucht ein Computer technisches Equipment, z.B. ein Kamerasystem für das Selbstfahrende Auto. Für andere wahrzunehmende Eigenschaften der Welt, also für Hören, Tasten usw. braucht es ähnliche Apparaturen. Sie sorgen dafür, dass die wahrgenommenen Eindrücke in eine digitale Form gebracht werden.
Vergleichen wir die Computer-Wahrnehmung mit unserer, so stellt sich als erstes das Bandbreiten-Problem. Wir können versuchen, die visuellen Impulse auf das unserem Sehsinn entsprechende schmale Spektrum von elektromagnetischen Wellen der Wellenlänge von 400 bis 800 Micrometer zu begrenzen. Maschinen haben hier andere Möglichkeiten. Sie könnten z.B. auch Wellen im Bereich der Radioaktivität „sehen“. Ähnliches gilt für unsere anderen Sinne. Maschinen könnten aber auch ganz andere Eigenschaften der Welt wahrnehmen, z.B. Magnetismus.
- Wir haben also als erste Differenz: Das Matching der Wahrnehmungs-Bandbreite von Mensch und Maschine ist nicht identisch. Man kann sich Mühe geben, es einigermaßen ähnlich zu gestalten.
- Ein zweiter wichtiger Unterschied besteht darin, dass alles, was eine Maschine wahrnehmen kann, digitalisiert werden muss. Unser Gehirn arbeitet nicht digital.
- Eine dritte Differenz betrifft den Tatbestand, dass Computer nicht nach außen sehen können. Sie haben nur eine interne Sicht auf eine in einem Modell simulierte Welt, die nur Teile der reale Welt umfasst.
- Traditionelle Computer müssen mit einer strikten Trennung von Hardware und Software zurecht kommen. Ihre Wahrnehmung verändert nicht die Hardware und in der Regel auch nicht die Software, sondern nur die gespeicherten Daten. Bei uns Menschen gibt es diese Trennung nicht. Jede Wahrnehmung verändert unser Gehirn, physikalisch und chemisch.
- Computer (genauer: ihre Software) haben keine Empfindungen und haben keine Gefühle. Sie „verstehen“ ihre Wahrnehmungen nicht und können ihnen nicht autonom Bedeutungen zuordnen, sondern diese nur im Rahmen ihrer internen Modelle einordnen. Sie betreiben nur im engeren Sinn Informationsverarbeitung.
- Das schließt nicht das Erkennen von emotionalen Zuständen der von ihnen wahrgenommenen Objekte aus, aber dieses Erkennen bleibt im Rahmen ihrer internen Modelle. Da man ihnen exzellent Mustererkennung beibringen kann, sind sie durchaus in der Lage, Freude, Trauer oder Angst im Gesicht eines Menschen zu erkennen. Dies geschieht aber nur im Rahmen ihres Softwaremodells, z.B. eines Neuronalen Netzes, das darauf trainiert wurde, welche Merkmale welchen emotionalen Zuständen zugeordnet werden können.
- Computer verfügen über keine autonome Aufmerksamkeit. Man muss ihnen sagen, auf was sie zu achten haben. Von selber fällt ihen buchstäblich nichts ein. Sie haben keinen eigenen Willen und können somit auch keine autonomen Entscheidungen treffen.
Somit wird klar, dass man sich gründlicher mit Aufmerksamkeit, genauer der Ausmerksamkeitsfähigkeit der Computer befassen muss, wenn man eine Maschine bauen will, die dem menschlichen Wahrnehmen, Denken, Empfinden und Entscheiden näher kommen will, wie es der ursprüngliche Anspruch der Künstlichen Intelligenz war (Dartmouth Summer Reseach-Projekt von 1956).