KI versagt beim Ablesen von Uhren, während Menschen bei Tests zur Zeiterfassung besser abschneiden

Heim

Nachricht

16. Oktober 2025

RalphGarcia

# ai

Eine bahnbrechende Bewertung, bei der 11 hochmoderne Systeme der künstlichen Intelligenz mit der menschlichen Leistung beim Ablesen analoger Uhren verglichen wurden, hat erhebliche Schwachstellen in den derzeitigen Architekturen des maschinellen Lernens offenbart. Während menschliche Teilnehmer eine bemerkenswerte Genauigkeit von 89,1 % beim Ablesen der Uhrzeit zeigten, erreichte selbst das leistungsstärkste KI-Modell von Google unter identischen Testbedingungen nur eine Erfolgsquote von 13,3 %.

Die von dem Forscher Alek Safar geleitete ClockBench-Untersuchung unterstreicht, dass grundlegende visuelle Denkaufgaben, die Kinder in der Regel beherrschen, auch für die anspruchsvollsten KI-Algorithmen eine Herausforderung darstellen. Die strenge Bewertung untersuchte Plattformen von Branchenführern wie Google, OpenAI und Anthropic unter Verwendung von 180 speziell angefertigten analogen Uhrendesigns.

Die Ergebnisse deuten auf tiefere strukturelle Probleme bei der Verarbeitung und Interpretation visueller Daten durch neuronale Netzwerke hin. "Das genaue Ablesen analoger Uhren erfordert ein ausgeklügeltes räumliches Denken in visuellen Kontexten", erklärt Safar in der veröffentlichten Studie. Der mehrstufige kognitive Prozess umfasst Handerkennung, Positionsanalyse und numerische Umrechnung - Operationen, die kritische KI-Mängel offenbaren.

Der Kontrast in den Fehlermustern ist besonders aufschlussreich. Menschliche Fehler führten in der Regel zu geringfügigen Abweichungen von etwa drei Minuten, während die KI-Systeme sehr ungenaue Schätzungen von durchschnittlich 1 bis 3 Stunden lieferten - was in etwa den zufälligen Schätzungen auf einem Standarduhrblatt entspricht.

Wesentliche Leistungseinschränkungen

Die Plattformen der künstlichen Intelligenz zeigten bemerkenswerte Schwierigkeiten mit:

Zifferblättern mit römischen Ziffern (nur 3,2 % Genauigkeit)
Umgekehrte oder gespiegelte Ausrichtungen der Uhr
Visuell komplexe Hintergründe und künstlerische Designs
Präzise Messung der Position des Sekundenzeigers

Eine aufschlussreiche Beobachtung: Wenn die KI-Systeme die anfänglichen Uhrenwerte richtig interpretierten, waren sie anschließend bei zeitbasierten Berechnungen wie Umrechnungen und arithmetischen Berechnungen besonders gut. Dies deutet darauf hin, dass das Haupthindernis im visuellen Verständnis und nicht in den mathematischen Verarbeitungsfähigkeiten liegt.

Vergleichende Branchenanalyse

Googles Gemini 2.5 Pro führte die kommerziellen Angebote mit 13,3 % Genauigkeit an, dicht gefolgt von Gemini 2.5 Flash mit 10,5 %. OpenAIs GPT-5 erreichte 8,4 % korrekte Antworten, während die Claude-Modelle von Anthropic mit Claude 4 Sonnet nur 4,2 % und Claude 4.1 Opus 5,6 % erreichten.

Grok 4 von xAI lieferte mit einer Genauigkeit von 0,7 % besonders besorgniserregende Ergebnisse, was in erster Linie darauf zurückzuführen ist, dass 63 % der gültigen Uhrenanzeigen fälschlicherweise als unmögliche Zeiten identifiziert wurden - obwohl nur 20,6 % tatsächlich falsche Konfigurationen enthielten.

Grundlegende Implikationen für den Fortschritt der KI

Diese Forschung erweitert das Paradigma der "Mensch-einfach, KI-komplex"-Benchmarks, das durch Initiativen wie ARC-AGI und SimpleBench veranschaulicht wird. Während künstliche Intelligenz bei zahlreichen wissensbasierten Tests und Berufsprüfungen übermenschliche Leistungen erzielt hat, stellt primitives visuelles Denken eine ständige Herausforderung dar.

Safars Analyse deutet darauf hin, dass die derzeitigen Methoden zur Skalierung der Modellgröße und der Trainingsdaten diese Einschränkungen der visuellen Verarbeitung möglicherweise nicht wirksam angehen. Zu den zwei vermuteten Faktoren gehören die unzureichende Darstellung analoger Uhren in Trainingskorpora und inhärente Schwierigkeiten bei der Übersetzung von räumlichen Beziehungen zwischen grafischen Uhrenkomponenten und textuellen Darstellungen.

ClockBench reiht sich in eine wachsende Reihe von Diagnosetools ein, die dazu dienen, nicht offensichtliche Lücken in der KI-Fähigkeit aufzudecken. Um die Integrität der Bewertung zu wahren, bleibt der gesamte Datensatz eingeschränkt, um eine Kontaminierung des zukünftigen Modelltrainings zu verhindern, wobei nur kontrollierte Teilmengen zur Überprüfung zur Verfügung stehen.

Die Ergebnisse werfen die entscheidende Frage auf, ob inkrementelle Verbesserungen bestehender Architekturen diese Defizite im Denken überbrücken können oder ob grundlegend neue Ansätze erforderlich sind - ähnlich wie bei historischen Durchbrüchen, die durch Innovationen wie die Testzeitberechnung in anderen KI-Bereichen ermöglicht wurden.

Auf absehbare Zeit wird die mechanische Analoguhr ein unerwartet robuster Maßstab für die menschliche Intelligenz sein - eine Technologie, die wir mühelos interpretieren können und die unsere fortschrittlichsten Berechnungen weiterhin vor ein Rätsel stellt.

Verwandter Artikel

Kakao Mobility stellt einen Fahrplan für autonomes Fahren der Stufe 4 im Bereich der physischen KI vor Kakao Mobility plant, im Rahmen seiner Strategie für physische KI Technologien für autonomes Fahren der Stufe 4 intern zu entwickeln.Auf der Konferenz „World IT Show 2026“ im COEX in Seoul stellte Ki

Barry Diller: Das Vertrauen in Sam Altman spielt keine Rolle, da die allgemeine künstliche Intelligenz (AGI) immer näher rückt Barry Diller, der milliardenschwere Medienmogul, hält OpenAI-CEO Sam Altman nicht für unglaubwürdig, obwohl jüngste Berichte das Gegenteil nahelegen. Bei seiner Rede auf der „Future of Everything“-Kon

YouTube weitet die KI-basierte Deepfake-Erkennung auf Politiker, Regierungsvertreter und Journalisten aus Am Dienstag gab YouTube bekannt, dass es seine Deepfake-Erkennungstechnologie auf eine ausgewählte Gruppe von Regierungsbeamten, politischen Kandidaten und Journalisten ausweiten wird. Das Tool identi

Empfehlungen zu verwandten Spezialthemen

Chatbot

Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf

Entdecken Sie die besten KI-Romantik-Chatbots des Jahres 2026, mit denen Sie echte, langfristige Beziehungen aufbauen können. Unsere sorgfältig zusammengestellte Liste bietet Ihnen überzeugende, konsistente Persönlichkeiten, Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten sowie Tests aus der Praxis. Finden Sie Ihren perfekten Begleiter und legen Sie noch heute bei XIX.AI los.

10 Tools

xix.ai

Bildung und Lernen

Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.

Entdecken Sie die besten AI-Data-Science-Mentoren von 2026, um SQL, Pandas und ML-Arbeitsabläufe zu meistern. Erfahren Sie mehr über unsere hochbewerteten, sorgfältig ausgewählten Angebote bei XIX.AI – für effektive und bahnbrechende Anleitung. Vergleichen Sie kostenlose und bezahlte Optionen mit praktischen Einblicken aus der Praxis. Entfalten Sie Ihr Potenzial in der Data Science noch heute.

10 Tools

xix.ai

Chatbot

Die besten KI-Flirt- und Konversationstrainer: Steigere dein soziales Charisma und dein Selbstvertrauen in Echtzeit

Entdecken Sie auf XIX.AI die besten KI-Flirt- und Konversationstrainer des Jahres 2026. Unsere sorgfältig zusammengestellte, erstklassige Auswahl hilft Ihnen dabei, Ihr soziales Charisma und Ihr Selbstvertrauen in Echtzeit zu stärken. Entdecken Sie unverzichtbare, bahnbrechende Tools mit Vergleichen zwischen kostenlosen und kostenpflichtigen Angeboten sowie wöchentlich aktualisierten Rankings. Schaffen Sie sich noch heute einen sozialen Vorsprung.

10 Tools

xix.ai

Code

Die besten KI-Tools für automatisierte Einheitstests: Generieren Sie mit nur einem Klick Jest-, PyTest- und JUnit-Testfälle.

Entdecken Sie die neuesten, hochbewerteten KI-Tools von 2026 für den automatisierten Unit-Testing-Prozess. Unsere sorgfältig ausgewählten Lösungen bieten leistungsstarke und bahnbrechende Funktionen, um sofort Jest-, PyTest- und JUnit-Testfälle zu generieren. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von tatsächlichen Tests sowie wöchentlich aktualisierten Rankings auf XIX.AI. Entfalten Sie Ihr KI-Potenzial und steigern Sie noch heute die Produktivität Ihrer Entwicklungstätigkeit.

10 Tools

xix.ai

Datenanalyse

Die besten KI-Tools zur Datenvisualisierung: Interaktive BI-Dashboards automatisch aus Rohdaten generieren

Entdecken Sie bei XIX.AI die besten KI-Tools zur Datenvisualisierung für 2026. Unsere sorgfältig zusammengestellte Auswahl der besten Tools hilft Ihnen dabei, leistungsstarke, interaktive BI-Dashboards sofort aus Rohdaten automatisch zu erstellen. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Schöpfen Sie noch heute das Potenzial Ihrer Daten aus.

10 Tools

xix.ai

Soziale Medien

KI-Branding-Kits für soziale Medien: Sorgen Sie für ein einheitliches Markenbild auf allen Kanälen

Entdecken Sie die besten KI-Branding-Kits für Social Media im Jahr 2026. Die von XIX.AI zusammengestellte Liste enthält erstklassige, bahnbrechende Tools, mit denen Sie ein einheitliches Markenbild auf allen Kanälen gewährleisten können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Verschaffen Sie Ihrer Marke noch heute einen visuellen Vorsprung.

10 Tools

xix.ai

Kommentare (1)

0/500

Bitte melden Sie sich zuerst an

JonathanMiller

21. April 2026 06:00:45 MESZ

Interessant, dass selbst moderne KI bei so simplen Aufgaben wie Uhrenlesen scheitert. Das zeigt, wie spezifisch menschliche Wahrnehmung und Alltagserfahrung sind. Vielleicht sollten wir weniger auf 'Allgemeine' Intelligenz hoffen und mehr auf spezialisierte Tools setzen, die mit Menschen zusammenarbeiten. 🤔

Top -Nachrichten

AI Builder und Power Automate Revolutionieren die Dokumentenzusammenfassung KI -Hosts des Notebooklm -Podcasts, das jetzt für Interviews verfügbar ist China stellt nationale Standards für humanoide Roboter und verkörperte Intelligenz vor Ramp-Daten zeigen, dass die Akzeptanz von KI in Unternehmen sinkt Bing Image Creator Tutorial: Anleitung zur KI-Kunstgenerierung Lernen Sie, AI-Musik mit Ihrer Stimme zu erstellen: ein Schritt-für-Schritt-Suno-Tutorial iMyFone MagicMic: Echtzeit-AI-Stimmerveränderer Bewertung und Tutorial Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen DeepSeek V4 revolutioniert multimodale KI Embodied Intelligence stellt ersten Branchenstandard zur Eindämmung unkontrollierten Wachstums vor

Mehr

Vorgestellt