Grok by xAI acquiert de solides capacités pour les requêtes Baldur's Gate

Différents laboratoires d'IA poursuivent des objectifs distincts. Par exemple, OpenAI a toujours concentré ses efforts sur les applications grand public, tandis que son concurrent Anthropic cible généralement le marché des entreprises. Comme l'indiquent des rapports récents, xAI, la société d'Elon Musk, a notamment donné la priorité à l'accompagnement pour les soluces de jeux vidéo.
Vendredi, Grace Kay, de Business Insider, a publié une enquête approfondie sur xAI, la start-up spécialisée dans l'intelligence artificielle récemment rachetée par SpaceX, soulignant les défis que Musk imposerait à son personnel. Un détail particulier a particulièrement retenu l'attention :
Selon des sources proches du dossier, le lancement d'un modèle a été reporté de plusieurs jours l'année dernière parce que Musk n'était pas satisfait des réponses du chatbot à des questions complexes sur le jeu vidéo « Baldur's Gate ». Des ingénieurs seniors auraient été réaffectés à d'autres projets afin de peaufiner ces réponses avant la sortie du produit.
On peut naturellement comprendre qu'un ingénieur qualifié, qui s'attendait à résoudre des défis complexes en matière d'intelligence artificielle, ait été détourné de sa tâche pour aider un homme de 54 ans à progresser dans un jeu vidéo. Cependant, cette histoire soulève une question plus immédiate : Musk a-t-il finalement obtenu l'expertise en matière de jeux vidéo qu'il recherchait ?
Pour le savoir, notre expert interne en jeux de rôle, Ram Iyer, a compilé cinq questions générales sur Baldur's Gate. Nous les avons posées à Grok de xAI et aux trois principaux modèles d'IA dans le cadre d'un test informel que nous avons baptisé BaldurBench.
Dans un souci de transparence, toutes les transcriptions des conversations sont accessibles au public : Grok, ChatGPT, Claude et Gemini.
Tout d'abord, le résultat positif : Grok fournit en fait des informations assez solides. Ses réponses étaient quelque peu chargées en terminologie vidéoludique (utilisant « save-scumming » au lieu de simplement « sauvegarder » et « DPS » pour désigner les dégâts), mais les conseils étaient à la fois utiles et pertinents, à condition de comprendre le jargon. Comme on pouvait s'y attendre, Grok montre également une forte préférence pour les tableaux et la théorie.
Il existe de nombreux guides sur Baldur's Gate, et les modèles s'inspirent généralement de sources similaires, ce qui fait que les différences stylistiques constituent la principale distinction. ChatGPT privilégie les listes à puces et les phrases concises, tandis que Gemini met l'accent sur les termes clés en les mettant en gras.
Événement TechcrunchÉconomisez jusqu'à 300 $ ou 30 % au TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée consacrée à la croissance, à l'exécution et à la mise à l'échelle dans le monde réel. Bénéficiez des connaissances de fondateurs et d'investisseurs qui ont défini le secteur. Réseautez avec des pairs à des stades de croissance similaires. Repartez avec des stratégies concrètes que vous pouvez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Économisez jusqu'à 300 $ ou 30 % au TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée consacrée à la croissance, à l'exécution et à la mise à l'échelle dans le monde réel. Bénéficiez des connaissances de fondateurs et d'investisseurs qui ont défini le secteur. Réseautez avec des pairs à des stades de croissance similaires. Repartez avec des stratégies concrètes que vous pouvez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Boston, MA | 9 juin 2026INSCRIVEZ-VOUS MAINTENANTLa réponse la plus inattendue est venue de Claude, qui s'est montré particulièrement prudent quant au partage d'informations susceptibles de gâcher les surprises du jeu. Interrogé sur la composition optimale des équipes, il a conclu son conseil en disant : « Ne vous prenez pas trop la tête et jouez simplement à ce qui vous semble amusant. » Merci, Claude !
Il est essentiel de garder à l'esprit que, selon le rapport de Business Insider, il s'agit d'un domaine spécifique dans lequel xAI a concentré ses efforts pour rivaliser avec ses concurrents. Par conséquent, nous ne devons pas surinterpréter le fait qu'après le travail intensif rapporté, les conseils de Grok se sont avérés comparables à ceux des autres modèles. Néanmoins, il est rassurant de voir que xAI peut tenir ses promesses lorsqu'elle concentre ses ressources.
Chargement du lecteur...
Article connexe
Trace a levé 3 millions de dollars pour surmonter les obstacles à l’adoption des agents intelligents d'entreprise
Malgré leur potentiel, les agents intelligents ont du mal à s'imposer dans le monde des entreprises. Une start-up émergente estime que le problème fondamental réside dans le manque de contexte.Lancée au sein de la promotion d'été 2025 de Y Combinato
Hightouch atteint les 100 millions de dollars de chiffre d'affaires annuel récurrent grâce à ses outils marketing basés sur l'IA
Autrefois, les spécialistes du marketing comptaient sur des graphistes et d’autres professionnels de la création pour produire des images et des vidéos destinées à des campagnes publicitaires en ligne
L'essor du gaz naturel chez Meta pourrait alimenter le réseau électrique du Dakota du Sud
Les centres de données ont pris une telle ampleur que leur consommation d'électricité équivaut désormais à celle de certains États américains. Prenons l'exemple du centre de données Hyperion AI de Met
Recommandations de sujets spéciaux liés
commentaires (0)

Différents laboratoires d'IA poursuivent des objectifs distincts. Par exemple, OpenAI a toujours concentré ses efforts sur les applications grand public, tandis que son concurrent Anthropic cible généralement le marché des entreprises. Comme l'indiquent des rapports récents, xAI, la société d'Elon Musk, a notamment donné la priorité à l'accompagnement pour les soluces de jeux vidéo.
Vendredi, Grace Kay, de Business Insider, a publié une enquête approfondie sur xAI, la start-up spécialisée dans l'intelligence artificielle récemment rachetée par SpaceX, soulignant les défis que Musk imposerait à son personnel. Un détail particulier a particulièrement retenu l'attention :
Selon des sources proches du dossier, le lancement d'un modèle a été reporté de plusieurs jours l'année dernière parce que Musk n'était pas satisfait des réponses du chatbot à des questions complexes sur le jeu vidéo « Baldur's Gate ». Des ingénieurs seniors auraient été réaffectés à d'autres projets afin de peaufiner ces réponses avant la sortie du produit.
On peut naturellement comprendre qu'un ingénieur qualifié, qui s'attendait à résoudre des défis complexes en matière d'intelligence artificielle, ait été détourné de sa tâche pour aider un homme de 54 ans à progresser dans un jeu vidéo. Cependant, cette histoire soulève une question plus immédiate : Musk a-t-il finalement obtenu l'expertise en matière de jeux vidéo qu'il recherchait ?
Pour le savoir, notre expert interne en jeux de rôle, Ram Iyer, a compilé cinq questions générales sur Baldur's Gate. Nous les avons posées à Grok de xAI et aux trois principaux modèles d'IA dans le cadre d'un test informel que nous avons baptisé BaldurBench.
Dans un souci de transparence, toutes les transcriptions des conversations sont accessibles au public : Grok, ChatGPT, Claude et Gemini.
Tout d'abord, le résultat positif : Grok fournit en fait des informations assez solides. Ses réponses étaient quelque peu chargées en terminologie vidéoludique (utilisant « save-scumming » au lieu de simplement « sauvegarder » et « DPS » pour désigner les dégâts), mais les conseils étaient à la fois utiles et pertinents, à condition de comprendre le jargon. Comme on pouvait s'y attendre, Grok montre également une forte préférence pour les tableaux et la théorie.
Il existe de nombreux guides sur Baldur's Gate, et les modèles s'inspirent généralement de sources similaires, ce qui fait que les différences stylistiques constituent la principale distinction. ChatGPT privilégie les listes à puces et les phrases concises, tandis que Gemini met l'accent sur les termes clés en les mettant en gras.
Événement TechcrunchÉconomisez jusqu'à 300 $ ou 30 % au TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée consacrée à la croissance, à l'exécution et à la mise à l'échelle dans le monde réel. Bénéficiez des connaissances de fondateurs et d'investisseurs qui ont défini le secteur. Réseautez avec des pairs à des stades de croissance similaires. Repartez avec des stratégies concrètes que vous pouvez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Économisez jusqu'à 300 $ ou 30 % au TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée consacrée à la croissance, à l'exécution et à la mise à l'échelle dans le monde réel. Bénéficiez des connaissances de fondateurs et d'investisseurs qui ont défini le secteur. Réseautez avec des pairs à des stades de croissance similaires. Repartez avec des stratégies concrètes que vous pouvez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Boston, MA | 9 juin 2026INSCRIVEZ-VOUS MAINTENANTLa réponse la plus inattendue est venue de Claude, qui s'est montré particulièrement prudent quant au partage d'informations susceptibles de gâcher les surprises du jeu. Interrogé sur la composition optimale des équipes, il a conclu son conseil en disant : « Ne vous prenez pas trop la tête et jouez simplement à ce qui vous semble amusant. » Merci, Claude !
Il est essentiel de garder à l'esprit que, selon le rapport de Business Insider, il s'agit d'un domaine spécifique dans lequel xAI a concentré ses efforts pour rivaliser avec ses concurrents. Par conséquent, nous ne devons pas surinterpréter le fait qu'après le travail intensif rapporté, les conseils de Grok se sont avérés comparables à ceux des autres modèles. Néanmoins, il est rassurant de voir que xAI peut tenir ses promesses lorsqu'elle concentre ses ressources.
Chargement du lecteur...
Trace a levé 3 millions de dollars pour surmonter les obstacles à l’adoption des agents intelligents d'entreprise
Malgré leur potentiel, les agents intelligents ont du mal à s'imposer dans le monde des entreprises. Une start-up émergente estime que le problème fondamental réside dans le manque de contexte.Lancée au sein de la promotion d'été 2025 de Y Combinato
Hightouch atteint les 100 millions de dollars de chiffre d'affaires annuel récurrent grâce à ses outils marketing basés sur l'IA
Autrefois, les spécialistes du marketing comptaient sur des graphistes et d’autres professionnels de la création pour produire des images et des vidéos destinées à des campagnes publicitaires en ligne
L'essor du gaz naturel chez Meta pourrait alimenter le réseau électrique du Dakota du Sud
Les centres de données ont pris une telle ampleur que leur consommation d'électricité équivaut désormais à celle de certains États américains. Prenons l'exemple du centre de données Hyperion AI de Met





Maison






