Les élèves du secondaire crée un site Web pour les défis de construction de l'AI Minecraft

Maison

Nouvelles

18 avril 2025

EdwardEvans

224

Benchmarking de l'IA créative avec Minecraft

Alors que les méthodes traditionnelles de benchmarking de l'IA montrent leurs limites, les développeurs explorent des approches innovantes pour évaluer les capacités des modèles d'IA générative. L'une de ces méthodes créatives consiste à utiliser Minecraft, le jeu sandbox populaire appartenant à Microsoft. Un groupe de développeurs a lancé Minecraft Benchmark, ou MC-Bench, une plateforme où les modèles d'IA s'affrontent en créant des constructions Minecraft basées sur des prompts donnés.

Sur MC-Bench, les utilisateurs peuvent voter pour la création de modèle d'IA qu'ils préfèrent, et ce n'est qu'après avoir voté qu'ils découvrent quel modèle a réalisé chaque construction. Cette approche interactive engage non seulement la communauté, mais offre également une manière unique d'évaluer les capacités de l'IA.

Crédits image : Minecraft Benchmark

Adi Singh, lycéen en terminale et initiateur de MC-Bench, estime que la reconnaissance mondiale de Minecraft est essentielle. En tant que jeu vidéo le plus vendu de tous les temps, il est familier à beaucoup, ce qui facilite l'évaluation de la qualité des constructions générées par l'IA, même pour ceux qui n'ont jamais joué au jeu. « Minecraft permet aux gens de voir les progrès [du développement de l'IA] beaucoup plus facilement », a expliqué Singh à TechCrunch. « Les gens sont habitués à Minecraft, à son apparence et à son ambiance. »

MC-Bench est soutenu par une équipe de huit contributeurs bénévoles. Des entreprises comme Anthropic, Google, OpenAI et Alibaba ont fourni leurs produits pour exécuter des prompts de benchmarking, bien qu'elles ne soient pas autrement impliquées dans le projet.

Singh envisage d'élargir MC-Bench au-delà des constructions simples pour inclure des tâches plus complexes et orientées vers des objectifs. « Les jeux pourraient être un moyen de tester le raisonnement agentique, plus sûr qu'en conditions réelles et plus contrôlable à des fins de test, ce qui le rend plus idéal à mes yeux », a-t-il déclaré.

Autres jeux comme benchmarks pour l'IA

Outre Minecraft, d'autres jeux comme Pokémon Red, Street Fighter et Pictionary ont été utilisés comme benchmarks expérimentaux pour l'IA. Le défi du benchmarking de l'IA réside dans sa complexité, car les tests standardisés traditionnels favorisent souvent les modèles d'IA en raison de leurs méthodes d'entraînement, qui excellent dans des domaines de résolution de problèmes spécifiques comme la mémorisation par cœur ou l'extrapolation de base.

Par exemple, alors que GPT-4 d'OpenAI peut atteindre le 88e centile au LSAT, il a du mal avec des tâches plus simples comme compter le nombre de R dans « strawberry ». De même, Claude 3.7 Sonnet d'Anthropic a obtenu une précision de 62,3 % sur un benchmark d'ingénierie logicielle, mais est moins performant que la plupart des enfants de cinq ans pour jouer à Pokémon.

Crédits image : Minecraft Benchmark

MC-Bench : Plus qu'un simple benchmark de programmation

Techniquement, MC-Bench est un benchmark de programmation, car il exige que les modèles d'IA écrivent du code pour créer des constructions comme « Frosty le bonhomme de neige » ou « une charmante cabane de plage tropicale sur une côte de sable immaculée ». Cependant, l'attrait de la plateforme réside dans son accessibilité. Il est plus facile pour les utilisateurs d'évaluer la qualité visuelle d'une construction que d'analyser du code, ce qui élargit la portée du projet et son potentiel pour la collecte de données sur les performances des modèles.

Le débat se poursuit sur la question de savoir si ces scores reflètent véritablement l'utilité de l'IA. Singh, cependant, pense qu'ils sont un indicateur solide. « Le classement actuel reflète assez fidèlement ma propre expérience d'utilisation de ces modèles, ce qui est différent de nombreux benchmarks purement textuels », a-t-il déclaré. « Peut-être que [MC-Bench] pourrait être utile aux entreprises pour savoir si elles vont dans la bonne direction. »

Article connexe

Haier lance le robot exosquelette sportif doté d'une intelligence artificielle le plus léger au monde, pesant seulement 1,75 kg Le groupe Haier a présenté le robot exosquelette sportif doté d'une intelligence artificielle le plus léger au monde : le Haier Exoskeleton Robot W3. Ce lancement établit un nouveau record de légèreté

La première série dramatique AIGC de Yaoke Media, « Le mystère du bronze dans le Qinling », sort aujourd'hui avec des rôles principaux interprétés par des personnages générés par l'IA C'est aujourd'hui que sort officiellement la mini-série fantastique et policière en IA générée (AIGC) de Yaoke Media, intitulée « L'histoire secrète du bronze de Qinling ». Mettant en s

Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour

Recommandations de sujets spéciaux liés

Entreprise

Les meilleurs outils de suivi des dépenses basés sur l'IA : numérisez vos reçus et classez automatiquement les dépenses de l'entreprise

Les meilleurs outils de gestion des dépenses basés sur l'IA en 2026 : les outils les mieux notés pour numériser vos reçus et classer automatiquement les dépenses de votre entreprise. Découvrez des solutions puissantes et révolutionnaires pour une gestion des dépenses sans effort, un suivi financier précis et une conformité simplifiée. Notre comparatif, mis à jour chaque semaine, qui oppose les options gratuites aux options payantes, vous aide à trouver la solution qui vous convient le mieux. Tirez pleinement parti de l'IA grâce aux recommandations d'experts de XIX.AI.

10 outils

xix.ai

Entreprise

Les meilleurs outils de recrutement basés sur l'IA : triez les CV et automatisez la planification des entretiens avec les candidats

Découvrez les meilleurs outils de recrutement basés sur l'IA de 2026 sur XIX.AI. Notre sélection propose des solutions performantes et révolutionnaires pour l'analyse des CV et l'automatisation de la planification des entretiens avec les candidats. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Trouvez l'assistant de recrutement idéal et optimisez votre processus de recrutement dès aujourd'hui !

10 outils

xix.ai

Productivité

Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale

Découvrez sur XIX.AI les meilleurs coachs IA de 2026 spécialisés dans le bien-être personnel et la concentration. Notre classement, soigneusement établi, présente les outils les mieux notés et les plus innovants pour gérer le surmenage et booster votre énergie mentale. Comparez les options gratuites et payantes grâce à des avis concrets. Ouvrez-vous dès aujourd’hui la voie vers une productivité et un bien-être optimaux.

10 outils

xix.ai

chatbot

Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes

Découvrez les meilleurs chatbots romantiques basés sur l'IA de 2026, sélectionnés pour vous aider à nouer des relations authentiques et durables. Notre sélection comprend des personnalités fortes et cohérentes, des comparaisons entre versions gratuites et payantes, ainsi que des tests en conditions réelles. Trouvez le compagnon idéal et commencez dès aujourd'hui sur XIX.AI.

10 outils

xix.ai

Éducation et apprentissage

Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique

Découvrez les meilleurs mentors en sciences des données et en intelligence artificielle pour 2026 afin de maîtriser SQL, Pandas et les workflows d'apprentissage automatique. Explorez notre sélection soigneusement élaborée sur XIX.AI pour bénéficier d'une guidance puissante et révolutionnaire. Comparez les options gratuites et payantes en tenant compte de perspectives pratiques. Développez rapidement vos compétences en sciences des données.

10 outils

xix.ai

chatbot

Les meilleurs outils d'IA pour apprendre à flirter et à converser : renforcez votre charisme social et votre confiance en vous en temps réel

Découvrez les meilleurs outils d'entraînement au flirt et à la conversation basés sur l'IA de 2026 sur XIX.AI. Notre sélection triée sur le volet et très bien notée vous aide à développer votre charisme social et votre confiance en vous en temps réel. Découvrez des outils incontournables qui changent la donne, avec des comparaisons entre versions gratuites et payantes ainsi que des classements mis à jour chaque semaine. Développez dès aujourd'hui vos compétences sociales.

10 outils

xix.ai

commentaires (27)

0/500

Veuillez vous connecter d'abord

DouglasMartinez

16 avril 2026 16:00:52 UTC+02:00

Interesting approach! Using Minecraft for AI benchmarking sounds way more engaging than standard tests. Wonder if this could lead to AI that actually helps design game worlds? The student's project is a cool example of how gaming and AI research can mix. Hope they share the results! 🎮

RaymondGreen

9 mars 2026 05:00:46 UTC+01:00

高校生がAI建築チャレンジのサイトを作ったのか…！Minecraftの世界でAIの創造性を測るってアイデア、すごく面白いな。でも、これって結局マイクロソフトのプロモーションみたいなものじゃないの？AIがどんどんゲーム内に溶け込んでいくの、ちょっと怖い気もする😅 未来のゲームはすべてAIが作っちゃうのかな？

NicholasYoung

20 octobre 2025 20:30:49 UTC+02:00

AIが建築対決するなんて面白すぎる！🏗️ Minecraftでベンチマークを取る発想が新鮮だけど、これってゲームバランス崩さないのかな？ちょっと心配…

JamesMiller

15 octobre 2025 20:30:35 UTC+02:00

É sempre incrível ver jovens inovando com IA! Alguém já testou se esses desafios do Minecraft realmente conseguem medir bem a criatividade dos modelos? Ou será que é só mais uma moda passageira? 😅

RalphRoberts

21 septembre 2025 00:30:34 UTC+02:00

这个高中生用Minecraft来测试AI生成建筑也太有创意了吧！😂 传统AI评测标准太死板了，确实需要这种更直观有趣的方式。不过我很好奇评判标准是什么，是美观度还是还原度？也想试试看用我的世界来测试Stable Diffusion效果

JasonJohnson

23 août 2025 03:01:25 UTC+02:00

This high school kid building an AI Minecraft challenge site is wild! 🧱 Makes me wonder how far AI can push creativity in games. Could it outbuild my epic castle? 😎

Top nouvelles

AI Builder et Power Automate Révolutionnent la Synthèse de Documents Podcast Hosts Of NoteBookLM maintenant disponible pour les interviews La Chine dévoile ses normes nationales relatives aux robots humanoïdes et à l'intelligence incarnée L'adoption de l'IA par les entreprises plafonne, selon les données de Ramp Tutoriel Créateur d'Images Bing : Guide de Génération d'Art IA Apprenez à créer de la musique AI en utilisant votre voix: un tutoriel Suno étape par étape iMyFone MagicMic : Revue et tutoriel sur le changeur de voix AI en temps réel Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives DeepSeek V4 s'impose comme une technologie multimodale révolutionnaire dans le domaine de l'IA Embodied Intelligence dévoile la première norme sectorielle visant à freiner la croissance anarchique

Plus

En vedette