Grok von xAI erhält leistungsstarke Funktionen für Baldur's Gate-Abfragen

Verschiedene KI-Labore verfolgen unterschiedliche Ziele. So hat sich OpenAI in der Vergangenheit vor allem auf Verbraucheranwendungen konzentriert, während sein Konkurrent Anthropic in der Regel den Unternehmensmarkt im Visier hat. Wie aktuelle Berichte zeigen, hat Elon Musks xAI den Schwerpunkt eindeutig auf die Entwicklung von Walkthroughs für Videospiele gelegt.
Am Freitag veröffentlichte Grace Kay von Business Insider eine umfassende Untersuchung zu xAI, dem kürzlich von SpaceX übernommenen Start-up für künstliche Intelligenz, in der sie die Herausforderungen hervorhob, die Musk seinen Mitarbeitern angeblich auferlegt. Ein Detail war dabei besonders auffällig:
Laut mit der Situation vertrauten Quellen wurde die Einführung eines Modells im letzten Jahr um mehrere Tage verschoben, weil Musk mit den Antworten des Chatbots auf komplizierte Fragen zum Videospiel „Baldur's Gate“ unzufrieden war. Berichten zufolge wurden leitende Ingenieure aus anderen Projekten abgezogen, um diese Antworten vor der Veröffentlichung zu verfeinern.
Natürlich kann man mit einem erfahrenen Ingenieur mitfühlen, der erwartet, tiefgreifende Herausforderungen in der maschinellen Intelligenz zu lösen, nur um dann dazu abgezogen zu werden, einem 54-jährigen Mann dabei zu helfen, in einem Videospiel voranzukommen. Diese Geschichte wirft jedoch eine unmittelbarere Frage auf: Hat Musk letztendlich das gewünschte Gaming-Know-how erhalten?
Um dies herauszufinden, hat unser hauseigener RPG-Experte Ram Iyer fünf allgemeine Fragen zu Baldur's Gate zusammengestellt. Diese haben wir Grok von xAI und den drei führenden KI-Modellen in einem informellen Test gestellt, den wir BaldurBench getauft haben.
Im Sinne der Transparenz sind alle Chat-Protokolle öffentlich einsehbar: Grok, ChatGPT, Claude und Gemini.
Zunächst das positive Ergebnis: Grok liefert tatsächlich recht fundierte Informationen. Seine Antworten waren etwas schwerfällig in Bezug auf Gaming-Terminologie – es verwendete „Save-Scumming” anstelle von einfach „Speichern” und „DPS” für Schaden –, aber die Anleitung war sowohl hilfreich als auch sachkundig, vorausgesetzt, man verstand die Fachsprache. Wie zu erwarten, zeigt Grok auch eine starke Vorliebe für Tabellen und Theorycrafting.
Es gibt zahlreiche Baldur's Gate-Anleitungen, und die Modelle beziehen sich in der Regel auf ähnliche Quellen, sodass stilistische Unterschiede das Hauptunterscheidungsmerkmal sind. ChatGPT bevorzugt Aufzählungslisten und prägnante Formulierungen, während Gemini Schlüsselbegriffe durch Fettdruck hervorhebt.
Techcrunch-VeranstaltungSparen Sie bis zu 300 $ oder 30 % beim TechCrunch Founder Summit
Treffen Sie über 1.000 Gründer und Investoren auf dem TechCrunch Founder Summit 2026, um sich einen Tag lang intensiv mit Wachstum, Umsetzung und Skalierung in der realen Welt zu beschäftigen. Gewinnen Sie Einblicke von Gründern und Investoren, die die Branche geprägt haben. Knüpfen Sie Kontakte zu Kollegen in ähnlichen Wachstumsphasen. Nehmen Sie umsetzbare Strategien mit, die Sie sofort anwenden können.
Das Angebot endet am 13. März.
Sparen Sie bis zu 300 $ oder 30 % beim TechCrunch Founder Summit
Treffen Sie über 1.000 Gründer und Investoren auf dem TechCrunch Founder Summit 2026 und verbringen Sie einen Tag voller Informationen zu Wachstum, Umsetzung und Skalierung in der realen Welt. Erhalten Sie Einblicke von Gründern und Investoren, die die Branche geprägt haben. Knüpfen Sie Kontakte zu Kollegen in ähnlichen Wachstumsphasen. Nehmen Sie umsetzbare Strategien mit, die Sie sofort anwenden können.
Das Angebot endet am 13. März.
Boston, MA | 9. Juni 2026JETZT ANMELDENDie überraschendste Antwort kam von Claude, der besonders vorsichtig war, Details preiszugeben, die die Überraschungen des Spiels ruinieren könnten. Auf die Frage nach der optimalen Zusammensetzung der Gruppe schloss er seinen Rat mit den Worten: „Stress dich nicht zu sehr und spiel einfach das, was dir Spaß macht.“ Danke, Claude!
Es ist wichtig, sich daran zu erinnern, dass dies laut dem Bericht von Business Insider ein spezifischer Bereich ist, auf den sich xAI konzentriert hat, um mit der Konkurrenz mithalten zu können. Daher sollten wir die Tatsache, dass Groks Ratschläge nach der intensiven Arbeit vergleichbar mit denen anderer Modelle waren, nicht überinterpretieren. Dennoch ist es beruhigend zu sehen, dass xAI Ergebnisse liefern kann, wenn es seine Ressourcen konzentriert.
Laden des Players…
Verwandter Artikel
Trace sammelt 3 Millionen Dollar, um die Hürden bei der Einführung von künstlichen Intelligenz-Agenten in Unternehmen zu überwinden.
Trotz ihres Potenzials haben künstliche Intelligenz-Agenten Schwierigkeiten, in Unternehmen Fuß zu fassen. Ein aufstrebendes Start-up ist der Ansicht, dass das Kernproblem ein Mangel an Kontext ist.Trace, ein als Teil der Sommerausbildung von Y Comb
Hightouch erreicht mit KI-gestützten Marketing-Tools einen Jahresumsatz von 100 Millionen US-Dollar
Früher waren Marketingfachleute auf Designer und andere Kreativfachleute angewiesen, um Bilder und Videos für personalisierte Online-Werbekampagnen zu erstellen.Ende 2024 führte das sieben Jahre alte
Der Erdgasboom bei Meta könnte das Stromnetz von South Dakota ankurbeln
Rechenzentren sind mittlerweile so riesig geworden, dass ihr Stromverbrauch dem ganzer US-Bundesstaaten entspricht. Man denke nur an das Hyperion-KI-Rechenzentrum von Meta: Nach seiner Fertigstellung
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Verschiedene KI-Labore verfolgen unterschiedliche Ziele. So hat sich OpenAI in der Vergangenheit vor allem auf Verbraucheranwendungen konzentriert, während sein Konkurrent Anthropic in der Regel den Unternehmensmarkt im Visier hat. Wie aktuelle Berichte zeigen, hat Elon Musks xAI den Schwerpunkt eindeutig auf die Entwicklung von Walkthroughs für Videospiele gelegt.
Am Freitag veröffentlichte Grace Kay von Business Insider eine umfassende Untersuchung zu xAI, dem kürzlich von SpaceX übernommenen Start-up für künstliche Intelligenz, in der sie die Herausforderungen hervorhob, die Musk seinen Mitarbeitern angeblich auferlegt. Ein Detail war dabei besonders auffällig:
Laut mit der Situation vertrauten Quellen wurde die Einführung eines Modells im letzten Jahr um mehrere Tage verschoben, weil Musk mit den Antworten des Chatbots auf komplizierte Fragen zum Videospiel „Baldur's Gate“ unzufrieden war. Berichten zufolge wurden leitende Ingenieure aus anderen Projekten abgezogen, um diese Antworten vor der Veröffentlichung zu verfeinern.
Natürlich kann man mit einem erfahrenen Ingenieur mitfühlen, der erwartet, tiefgreifende Herausforderungen in der maschinellen Intelligenz zu lösen, nur um dann dazu abgezogen zu werden, einem 54-jährigen Mann dabei zu helfen, in einem Videospiel voranzukommen. Diese Geschichte wirft jedoch eine unmittelbarere Frage auf: Hat Musk letztendlich das gewünschte Gaming-Know-how erhalten?
Um dies herauszufinden, hat unser hauseigener RPG-Experte Ram Iyer fünf allgemeine Fragen zu Baldur's Gate zusammengestellt. Diese haben wir Grok von xAI und den drei führenden KI-Modellen in einem informellen Test gestellt, den wir BaldurBench getauft haben.
Im Sinne der Transparenz sind alle Chat-Protokolle öffentlich einsehbar: Grok, ChatGPT, Claude und Gemini.
Zunächst das positive Ergebnis: Grok liefert tatsächlich recht fundierte Informationen. Seine Antworten waren etwas schwerfällig in Bezug auf Gaming-Terminologie – es verwendete „Save-Scumming” anstelle von einfach „Speichern” und „DPS” für Schaden –, aber die Anleitung war sowohl hilfreich als auch sachkundig, vorausgesetzt, man verstand die Fachsprache. Wie zu erwarten, zeigt Grok auch eine starke Vorliebe für Tabellen und Theorycrafting.
Es gibt zahlreiche Baldur's Gate-Anleitungen, und die Modelle beziehen sich in der Regel auf ähnliche Quellen, sodass stilistische Unterschiede das Hauptunterscheidungsmerkmal sind. ChatGPT bevorzugt Aufzählungslisten und prägnante Formulierungen, während Gemini Schlüsselbegriffe durch Fettdruck hervorhebt.
Techcrunch-VeranstaltungSparen Sie bis zu 300 $ oder 30 % beim TechCrunch Founder Summit
Treffen Sie über 1.000 Gründer und Investoren auf dem TechCrunch Founder Summit 2026, um sich einen Tag lang intensiv mit Wachstum, Umsetzung und Skalierung in der realen Welt zu beschäftigen. Gewinnen Sie Einblicke von Gründern und Investoren, die die Branche geprägt haben. Knüpfen Sie Kontakte zu Kollegen in ähnlichen Wachstumsphasen. Nehmen Sie umsetzbare Strategien mit, die Sie sofort anwenden können.
Das Angebot endet am 13. März.
Sparen Sie bis zu 300 $ oder 30 % beim TechCrunch Founder Summit
Treffen Sie über 1.000 Gründer und Investoren auf dem TechCrunch Founder Summit 2026 und verbringen Sie einen Tag voller Informationen zu Wachstum, Umsetzung und Skalierung in der realen Welt. Erhalten Sie Einblicke von Gründern und Investoren, die die Branche geprägt haben. Knüpfen Sie Kontakte zu Kollegen in ähnlichen Wachstumsphasen. Nehmen Sie umsetzbare Strategien mit, die Sie sofort anwenden können.
Das Angebot endet am 13. März.
Boston, MA | 9. Juni 2026JETZT ANMELDENDie überraschendste Antwort kam von Claude, der besonders vorsichtig war, Details preiszugeben, die die Überraschungen des Spiels ruinieren könnten. Auf die Frage nach der optimalen Zusammensetzung der Gruppe schloss er seinen Rat mit den Worten: „Stress dich nicht zu sehr und spiel einfach das, was dir Spaß macht.“ Danke, Claude!
Es ist wichtig, sich daran zu erinnern, dass dies laut dem Bericht von Business Insider ein spezifischer Bereich ist, auf den sich xAI konzentriert hat, um mit der Konkurrenz mithalten zu können. Daher sollten wir die Tatsache, dass Groks Ratschläge nach der intensiven Arbeit vergleichbar mit denen anderer Modelle waren, nicht überinterpretieren. Dennoch ist es beruhigend zu sehen, dass xAI Ergebnisse liefern kann, wenn es seine Ressourcen konzentriert.
Laden des Players…
Trace sammelt 3 Millionen Dollar, um die Hürden bei der Einführung von künstlichen Intelligenz-Agenten in Unternehmen zu überwinden.
Trotz ihres Potenzials haben künstliche Intelligenz-Agenten Schwierigkeiten, in Unternehmen Fuß zu fassen. Ein aufstrebendes Start-up ist der Ansicht, dass das Kernproblem ein Mangel an Kontext ist.Trace, ein als Teil der Sommerausbildung von Y Comb
Hightouch erreicht mit KI-gestützten Marketing-Tools einen Jahresumsatz von 100 Millionen US-Dollar
Früher waren Marketingfachleute auf Designer und andere Kreativfachleute angewiesen, um Bilder und Videos für personalisierte Online-Werbekampagnen zu erstellen.Ende 2024 führte das sieben Jahre alte
Der Erdgasboom bei Meta könnte das Stromnetz von South Dakota ankurbeln
Rechenzentren sind mittlerweile so riesig geworden, dass ihr Stromverbrauch dem ganzer US-Bundesstaaten entspricht. Man denke nur an das Hyperion-KI-Rechenzentrum von Meta: Nach seiner Fertigstellung





Heim






