Oder warum Super-KI eine andere Art von Technologie erfordern wird
Verzichten wir auf lange Einleitungen und kommen wir gleich zur Sache: Die größte Stärke großer Sprachmodelle (LLMs) liegt darin, dass sich nahezu alles auf der Welt in irgendeiner Form durch Text beschreiben lässt. Und genau das ist gleichzeitig ihre größte Einschränkung.
Text ist ein universeller Code – eine geniale Erfindung des menschlichen Geistes, die es uns ermöglicht, nahezu alles zu beschreiben und diese Beschreibung so zu bewahren, dass andere sie verstehen können. Und nicht nur Menschen können ihn verstehen – auch Maschinen. Allein mit Text können große Sprachmodelle mit Menschen und ihrer Umwelt interagieren. Beschreibt man Fakten, Objekte, Ereignisse oder Phänomene in Worten und Sätzen, kann das Modell sie erfassen. In gewisser Weise lässt sich eine „intelligente Maschine“ ohne Sinne bauen, die die Welt ausschließlich als Text erlebt.
Andererseits ist jede textliche Beschreibung naturgemäß nur annähernd. Egal wie detailliert wir vorgehen, Text allein kann niemals alles perfekt erfassen. Nehmen wir zum Beispiel einen Apfel. Stellen Sie sich vor, Sie müssten seine Oberfläche unter einer Lupe beschreiben – die Form und Größe jedes einzelnen Flecks und jeder Ader. Stellen Sie sich nun vor, Sie müssten dasselbe unter einem Mikroskop tun. Das würde Tausende von Wörtern erfordern – und das nur für die Oberfläche, einen winzigen Teil des Apfels. Kurz gesagt: Text kann immer nur ein unvollständiges Bild eines Objekts oder Phänomens vermitteln und dabei ein Gleichgewicht zwischen Genauigkeit und Kürze finden.
Für Menschen ist das kein großes Problem. Text dient meist als Anhaltspunkt, und wir ergänzen den Rest mit Erfahrung und Vorstellungskraft. Maschinen hingegen haben keine Verankerung in der Realität – keine direkte Erfahrung der Welt. Ihnen fehlen die Sinne, um sie unmittelbar wahrzunehmen. Daher ist das Wissen, das LLM-basierte Modelle über die Welt besitzen, begrenzt. Es mangelt ihnen schlichtweg an detaillierten Informationen.
Hinzu kommt, dass ihre Aus- und Weiterbildung größtenteils auf Internetdaten basiert. Das bedeutet, dass viele der erlernten Informationen nicht wirklich als „qualifiziert, präzise oder detailliert“ bezeichnet werden können. Außerdem ist anzumerken, dass ein zunehmender Anteil der Online-Inhalte selbst KI-generiert ist.
Würden wir versuchen, eine KI auf Basis von LLMs so zu trainieren, dass ihr Weltverständnis und ihre Realitätswahrnehmung auch nur annähernd mit denen eines Menschen vergleichbar wären, bräuchten wir Unmengen an Text – akribisch detaillierte Beschreibungen all dessen, was ein Mensch in einem flüchtigen Blick oder wenigen Sekunden der Berührung eines Objekts erfassen kann. Offensichtlich – und das obige Beispiel mit dem Apfel verdeutlicht dies perfekt – wäre dieser Ansatz extrem arbeitsintensiv und letztlich eine Sackgasse. Er würde Unmengen an Ressourcen verschlingen und schließlich an seine Grenzen stoßen, doch der Detailgrad wäre immer noch weit davon entfernt, der Maschine ein menschenähnliches Verständnis der Realität zu vermitteln.
Die Schlussfolgerung ist einfach: LLMs eignen sich zwar zum Aufbau verschiedener spezialisierter KI-Modelle, aber nicht zur Entwicklung einer vollwertigen allgemeinen KI, die alle menschlichen Aufgaben auch nur durchschnittlich gut bewältigen könnte. Und natürlich sind sie auch nicht geeignet, eine leistungsstarke allgemeine KI zu entwickeln, die menschliche Experten in jedem Bereich übertreffen könnte.
Kurz gesagt, LLMs sind ein unglaublich vielseitiges Werkzeug, das auf einem anderen vielseitigen Werkzeug basiert – Text. Es gibt noch viel Raum für Verbesserungen und die Erweiterung ihrer Anwendungsmöglichkeiten. Doch schon jetzt ist klar, dass sie gravierende Einschränkungen aufweisen, die sie zu einer ungeeigneten Grundlage für die Entwicklung allgemeiner KI machen, geschweige denn einer leistungsstarken, übermenschlichen KI.
Es erscheint wahrscheinlich, dass zur Bewältigung dieser Herausforderung ein anderes Modell erforderlich sein wird – eines, das durch direkte Interaktion mit der realen Welt lernen kann, beispielsweise mithilfe menschlicher Sinne. Dennoch ist anzunehmen, dass LLMs auch in diesen zukünftigen Systemen eine wichtige Rolle spielen werden.
Das Thema fortgeschrittener KI-Modelle ist so faszinierend, dass es eine eigene Diskussion verdient.