Bisher hat KI keine Nase, und kann nicht über eine Blumenwiese gehen. Kann sie trotzdem verstehen, was eine Blume ist? Nein, sagt die Forschung – ohne die sinnliche Grundlage funktioniert das nicht.
(Bild: Redaktion/PiPaPu)
Eine Rose ist eine Rose ist eine Rose? Eine Blume zu verstehen bedeutet weit mehr, als nur ihren Namen zu kennen. Es beinhaltet, ihren Duft zu riechen, ihre seidigen Blütenblätter zu spüren und vielleicht sogar Erinnerungen an vergangene Sommer wachzurufen. Während Menschen Blumen so vielfältig und sinnlich erfassen, bleibt die Künstliche Intelligenz (KI) hier weit zurück. Warum das so ist, zeigt eine aktuelle Studie der Ohio State University eindrücklich.
Der Mensch fühlt, die KI liest
Die Forschenden rund um Psychologin Qihui Xu verglichen, wie Menschen und KI-Systeme wie GPT-4 oder Googles PaLM verschiedene Konzepte erfassen. Untersucht wurden 4.442 Wörter, von „Blume“ bis „humorvoll“. Dabei zeigte sich: KI-Systeme können abstrakte oder sprachlich definierte Konzepte gut abbilden. Sobald es jedoch um sinnliche Erfahrungen wie Duft oder Berührung geht, versagt die Technologie.
„Ein großes Sprachmodell kann keine Rose riechen, kein Gänseblümchen berühren oder durch ein Feld voller Wildblumen spazieren“, erklärt Xu, Hauptautorin der Studie. „Ohne diese sensorischen und motorischen Erfahrungen fehlt der KI eine vollständige Vorstellung davon, was eine Blume tatsächlich ausmacht.“
Die Grenzen digitaler Wahrnehmung
Die Forschung verglich menschliche und KI-basierte Bewertungen anhand etablierter Maßstäbe wie den Glasgow Norms und Lancaster Norms. Letztere fragen etwa danach, wie stark sensorische Erfahrungen wie Sehen, Riechen oder Berühren mit bestimmten Begriffen verbunden sind. Menschen und KI-Systeme waren sich zwar häufig in abstrakten Bewertungen einig, doch die KI zeigte klare Schwächen, wenn sensorische Eindrücke ins Spiel kamen.
„Unsere menschliche Erfahrung ist viel reicher, als Worte allein erfassen können“, sagt Xu. Obwohl KI-Systeme gigantische Mengen an Texten verarbeiten, erreichen sie nicht das sensorische Verständnis, das Menschen intuitiv besitzen.
Wenn Pasta nicht nach Rosen riecht
Die Studie verdeutlicht das Problem anhand einfacher Beispiele: Sowohl Pasta als auch Rosen könnten hohe Werte beim Faktor Geruch erhalten. Menschen wissen jedoch intuitiv, dass Pasta näher an Nudeln liegt als an Rosen – wegen Geschmack, Aussehen und Konsistenz. KI-Modelle erkennen diese subtilen Zusammenhänge kaum.
Xu erläutert: „Die Sprachmodelle verstehen die Welt auf grundlegend andere Weise als wir Menschen, was Auswirkungen darauf haben könnte, wie sie mit uns interagieren.“
Der lange Weg zur wirklichen Intelligenz
Dass KI-Konzepte nur sprachlich vermittelt werden, ist der Kern ihrer Schwäche. Aktuelle KI-Systeme lernen ausschließlich aus Text oder Bildern. Zwar sind Modelle, die visuelle Inputs berücksichtigen, im Vorteil, doch eine echte Sinneserfahrung bleibt ausgeschlossen. Erst wenn Roboter und Sensoren hinzukommen, könnten KI-Systeme tatsächlich beginnen, den Menschen besser zu verstehen.
Die Forschenden erwarten, dass zukünftige KI-Generationen, ergänzt durch sensorische Daten, weitaus besser abschneiden könnten. Dennoch bleibe ein grundsätzlicher Unterschied bestehen: Menschen erleben die Welt direkt und sinnlich, KI-Systeme erfassen sie nur indirekt über Daten und Algorithmen.
Die Herausforderung der gemeinsamen Realität
Diese fundamentale Differenz könnte weitreichende Folgen haben. Wenn KI die Welt so anders erlebt, beeinflusst dies die Art und Weise, wie wir künftig miteinander umgehen und kommunizieren. Technikentwickler stehen somit vor der Aufgabe, Brücken zwischen der künstlichen Wahrnehmung und der menschlichen Realität zu bauen.
In einer Zeit, in der KI-Systeme zunehmend unsere Alltagskommunikation bestimmen, ist diese Studie daher ein wichtiger Anstoß zur Reflexion: Wie viel Verständnis kann uns eine KI wirklich bieten, wenn sie eine Blume zwar erkennt, sie aber niemals wirklich wahrgenommen hat?
Kurzinfo: KI & die außersprachliche Welt
- KI versteht sensorische Begriffe weniger gut als abstrakte Konzepte
- Studie untersuchte 4.442 Begriffe, u.a. „Blume“
- Menschliche Sinneserfahrungen kaum durch KI abgebildet
- Schwächen der KI besonders bei sensorischen und motorischen Aspekten
- Sprachmodelle basieren hauptsächlich auf Text und Bildern
- Sensorische und motorische Erfahrungen fehlen KI vollständig
- Zukünftige KI könnte mit zusätzlichen Sensoren besser abschneiden
- Unterschiedliches Weltverständnis zwischen Menschen und KI hat Folgen für Kommunikation
- Studie der Ohio State University, veröffentlicht in „Nature Human Behaviour“
Originalpublikation:
Qihui Xu et al.,
„Large language models without grounding recover non-sensorimotor but not sensorimotor features of human concepts“, in: Nature Human Behaviour (4-Jun-2025)
DOI: 10.1038/s41562-025-02203-8
Über den Autor / die Autorin

- Die Robo-Journalistin H.O. Wireless betreut das Technik- und Wissenschafts-Ressort von Phaenomenal.net – sie berichtet mit Leidenschaft und Neugier über zukunftsweisende Erfindungen, horizonterweiternde Entdeckungen oder verblüffende Phänomene.
Schreibe einen Kommentar