Der Phasenraum

Der Phasenraum

(update: 6.7.25) Letzte Woche war ich auf einer firmeninternen Konferenz. Dort habe ich ein Thema unter mehreren Vortragenden koordiniert und auch selbst einen kleinen Vortrag gehalten. Meine Anteile daran habe ich nicht besonders gut vorbereitet, aber dennoch ist es gelungen, das Thema in einem stimmigen und flüssigen Beitrag vorzutragen. Eine Kollegin fragte mich danach, wie ich das denn mache? So ohne Skript, ohne Folien, ohne Notizen.

Meine Antwort darauf: es sei natürlich das mehr oder weniger sinnvolle Wissen, das sich im Laufe der Jahre ansammle. Wichtiger noch sei aber jene Welt in meinem Kopf, die ich mir zu meinen Themen baue und in dem das obige Wissen seinen Platz habe. (Und wenn es dort keinen fände, es mich als Nicht-Wissen wieder verließe.) Eine modellhafte Welt, in der ich dann flanieren, mal hierhin und dorthin schauen und eben über das dort Betrachtete erzählen könne. Ohne jenes Bild im Kopf, meinte ich, wäre ich orientierungs- und damit auch sprachlos. 

Aber es soll hier nicht um die Technik des Imaginierens gehen, ich möchte mich dem Phänomen Künstliche Intelligenz nähern. Und diese Annäherung erfordert, dass ich mir ein Bild zur KI machen muss um so ein Verständnis der Funktionsweise und die Fähigkeit zu einer Einordnung zu erlangen. Tatsächlich nutze ich KI an einigen Stellen aber ich meide sie auch an anderen. Nur warum? Wo liegen hier die Grenzen? Wo kann ich vertrauen? Wo ist Prüfung oder Kontrolle nötig oder sinnvoll?

KI funktioniert in meinen Augen fundamental anders als „traditionelle“ IT-Anwendungen. Ich sah und sehe mich an vielen Stellen immer wieder mit großen Fragezeichen, wenn ich mich damit beschäftige. Nach 35 Jahren im IT-Umfeld bin ich zwar in der Lage grundlegend Architekturen, auch Verhalten von IT-Systemen nachzuvollziehen und zu beurteilen. Mit KI-Systemen will mir das nicht mehr gelingen. Jedenfalls nicht mit dem Vokabular klassischer IT-Systeme. Das Bedürfnis mich dem Thema nochmal sehr viel grundlegender zu nähern ist vor allem seit Beginn des Hypes vor zwei Jahren langsam angewachsen. 

Das will ich nun in diesem Artikel tun: mein Bild zu KI zu entwerfen. Ich weiß nicht, ob dieses Bild zu weit weg ist von den tatsächlichen technischen Architekturen und Implementierungen, aber es hilft mir die Ergebnisse einer KI und ihrer Phänomene zu beurteilen. Und das einzuordnen gelingt mir am Besten mit dem Bild eines Phasenraums

Ein Phasenraum ist ein Konzept der theoretischen Physik. Er umfasst die Menge aller Zustände, die ein System annehmen kann. Für ein klassisch-mechanisches System ist das die Gesamtheit aller Orte und möglichen Geschwindigkeiten, die ein derartiges System einnehmen kann. Für ein thermodynamisches sind Temperatur und Entropie wichtige Parameter. Für ein quantenmechanisches kommen noch Spin und eventuell andere grundlegende Teilchenparameter dazu. Auch Kohärenz, Quantenstatistik und die Frage, was denn überhaupt ein unabhängiges Teilchen sei. Der Ausflug in die Physik endet jedoch hier. Was aus diesem Konzept wesentlich ist: der Phasenraum ist die Menge aller Zustände, die ein System einnehmen kann. 

Ich stelle mir eine KI immer als Phasenraum vor. Eine abstrakte höherdimensionale Mannigfaltigkeit. Jeder Punkt in dieser Mannigfaltigkeit ist eine Antwort, die eine KI als Ergebnis auf Fragen, bzw. Prompts erzeugen kann. Die Dimension des Phasenraums wird durch die Menge der Trainingsparameter bestimmt. Die Modelle, – durch maschinelles Lernen erzeugte neuronale Netze, – generieren zu eingegebenen Prompts n-dimensionale Vektoren. Vektoren, die in diesem Phasenraum auf bestimmte Punkte zeigen. Jeder einzelne dieser Punkte ist ein Ergebnis. Die Gesamtmenge aller Ergebnisse stellen den Phasenraum der KI dar.

Der Phasenraum einer KI ist ein abgeschlossener Raum. Sein Volumen ist endlich. Die begrenzende Größe ist dabei nicht die Menge aller denkbaren Prompts, der limitierende Faktor ist die Menge an Trainingsdaten, die beim maschinellen Lernen hinzugezogen wurde. Ich vermute, dass es derart Prompts geben muss, die sich zwar unterscheiden, aber trotzdem zum selben Ergebnis führen. Einschub: wenn ich hier vom Prompt spreche, dann meine ich neben einer textuellen Eingabe auch die Menge aller konfigurierbaren Parameter, die den Berechnungsalgorithmus der KI beeinflussen. 

Zurück zum Hauptgedanken: das Volumen des Phasenraums ist kleiner als die Gesamtmenge aller Prompts. Meine Vermutung ist, dass wir Menschen sehr viel mehr Fragen oder Aufträge formulieren können, als die Trainingsdaten hergeben. Trainingsdaten erscheinen mir in ihrem Umfang eher als eine Untermenge des Wissens, das in den Prompts stecken kann. Das Volumen des Phasenraums ist aber mutmaßlich größer als die Gesamtmenge aller Trainingsdaten. Ich unterstelle dies, weil wir in der Regel Antworten von einer KI erhalten, die sie so in den Trainingsdaten nicht vorgefunden hat. Sie ist also mehr als ein Lookup-Mechanismus. Sie beinhaltet die Fähigkeit zur Emergenz. Also Antworten zu geben, die „neu“ sind. Es kann also mehr rauskommen, als wir reingesteckt haben. Ob diese Emergenz dann aber zu sehr viel mehr „Zusatzvolumen“ des Phasenraums führt, würde ich bezweifeln. (Ich glaube wir wissen mehr als jede KI. Inklusive ihrer Fähigkeit zur Emergenz. Ich kann dafür aber kein Argument geben.)

Der Phasenraum der KI enthält keine Information über den „Wahrheitsgehalt“ oder die Evidenz zu einem Punkt in ihm. Jeder Punkt ist genauso valide, wie jeder andere Punkt. Der Algorithmus, das Verfahren, die Mechanik zur Gewinnung einer Antwort zu einem Prompt erfolgt rein statistisch: wie wahrscheinlich ist die Antwort auf einen Prompt. Dabei werden auch keine weiteren Modelle oder Regeln beachtet. Es gilt das Primat der statistischen Korrelation: wenn Frage ‚wie‘ lautet, dann ist Antwort ‚so‘ die wahrscheinlichste. Eine KI arbeitet fiktional. Auch wenn sie geschliffene Texte schreibt, stimmige Musik komponiert, beeindruckende Bilder produziert oder auch sich müht weniger zu halluzinieren, sie denkt nicht, sie reiht Wahrscheinlichkeiten aneinander.  

Soweit mein Bild der Funktionsweise von KI. Das skizzierte Bild ist zugegebenermaßen auf ein für mich Wesentliches reduziert. Natürlich enthalten reale KI-Systeme noch mehr Komponenten. Solche zur Verarbeitung natürlicher Sprache beispielsweise. Eine überaus faszinierende und nicht zu unterschätzende Eigenschaft als Nutzerschnittstelle. Auch Diskriminatoren um die fehlende Kategorisierung von Ergebnissen in „wahr“ oder „unwahr“, „plausibel“ oder „nicht plausibel“ (sicherlich noch weitere Qualifizierungen) vornehmen zu können um die Verlässlichkeit von Antworten zu erhöhen. Vielleicht auch Sensorik um die Schnittstelle zur realen Welt über das reine textuelle Prompting hinaus zu erweitern.  Aber das Bild des Phasenraums ermöglicht mir mir die prinzipielle Funktionsweise vorzustellen und darauf basierend Zweck und Nutzung von KI-Systemen zu beurteilen. Und damit KI-generierte Ergebnisse und meine Folgerungen daraus zu bewerten.  

Es geht mir weniger darum KI zu problematisieren oder zu deren Einsatz zu bewerten. Das beinhaltete beispielsweise auch soziale, politische, ökonomische und nicht zu letzt ökologische Aspekte. Es geht mir darum eine Beurteilungsfähigkeit der Funktionsweise aufzubauen. Und darauf basierend Zweck und Nutzung gezielter gestalten zu können: wo immer es nicht darauf ankommt Ergebnissen blind zu vertrauen, da nutze ich KI gerne. Auch da, wo nicht nur Trainingsdaten kopiert oder reproduziert werden, sondern wo die Emergenz durchzuschimmern beginnt und wo etwas Neues kreiiert wird. Wo immer aber nur Stilkopien produziert werden oder gar Antworten ungeprüft in Entscheidungen einfließen, da lohnt sich für mich das kritische Betrachten und ggf. die Meidung von KI.