O aluno do ensino médio cria um site para os desafios de construção da AI Minecraft
Creative AI Benchmarking com Minecraft
À medida que os métodos tradicionais de benchmarking de IA ficam aquém, os desenvolvedores estão explorando abordagens inovadoras para avaliar a proeza dos modelos generativos de IA. Um desses métodos criativos envolve o uso do Minecraft, o popular jogo de sandbox de propriedade da Microsoft. Um grupo de desenvolvedores lançou o Minecraft Benchmark, ou MC-Bench, uma plataforma em que os modelos de IA competem na criação de compilações do Minecraft com base em determinados prompts.
No MC-Bench, os usuários podem votar na qual a criação do modelo de IA preferem, e somente depois de votar seu voto, eles descobrem qual modelo fez cada construção. Essa abordagem interativa não apenas envolve a comunidade, mas também fornece uma maneira única de avaliar os recursos de IA.

Créditos da imagem: referência do Minecraft
Adi Singh, aluno da 12ª série e iniciador do MC-banch, acredita que o reconhecimento generalizado de Minecraft é fundamental. Como o videogame mais vendido de todos os tempos, é familiar para muitos, facilitando para as pessoas julgar a qualidade das construções geradas pela IA, mesmo que elas não jogassem o jogo. "O Minecraft permite que as pessoas vejam o progresso [do desenvolvimento da IA] com muito mais facilidade", explicou Singh ao TechCrunch. "As pessoas estão acostumadas a minecraft, acostumadas com a aparência e a vibração".
O MC-Bench é apoiado por uma equipe de oito colaboradores voluntários. Empresas como Anthropic, Google, Openai e Alibaba forneceram seus produtos para a execução de instruções de referência, embora não estejam envolvidos no projeto.
Singh prevê expandir o MC-banch além das compilações simples para tarefas mais complexas e orientadas a objetivos. "Os jogos podem ser apenas um médio para testar o raciocínio agêntico que é mais seguro do que na vida real e mais controlável para fins de teste, tornando -o mais ideal aos meus olhos", disse ele.
Outros jogos como benchmarks de IA
Além do Minecraft, outros jogos como Pokémon Red, Street Fighter e Pictionary foram usados como benchmarks experimentais para a IA. O desafio da AI de benchmarking reside em sua complexidade, pois os testes padronizados tradicionais geralmente favorecem os modelos de IA devido aos seus métodos de treinamento, que se destacam em áreas estreitas de solução de problemas, como memorização mecânica ou extrapolação básica.
Por exemplo, embora o GPT-4 do Openai possa marcar no percentil 88 no LSAT, ele luta com tarefas mais simples, como contar o número de Rs em "Strawberry". Da mesma forma, o claude de 3,7 sonetos da Anthropic alcançou 62,3% de precisão em uma referência de engenharia de software, mas fica aquém do jogo de Pokémon em comparação com a maioria das crianças de cinco anos.

Créditos da imagem: referência do Minecraft
MC-BENCH: Mais do que apenas um benchmark de programação
Tecnicamente, o MC-Bench é um benchmark de programação, porque exige que os modelos de IA escreviam código para criar construções como "Frosty the Snowman" ou "uma encantadora cabana de praia tropical em uma costa arenosa intocada". No entanto, o apelo da plataforma está em sua acessibilidade. É mais fácil para os usuários avaliar a qualidade visual de uma construção do que analisar o código, que amplia o alcance do projeto e o potencial de coleta de dados no desempenho do modelo.
O debate continua sobre se essas pontuações realmente refletem a utilidade da IA. Singh, no entanto, acredita que eles são um forte indicador. "A tabela de classificação atual reflete muito de perto minha própria experiência de usar esses modelos, o que é diferente de muitos benchmarks de texto puro", disse ele. "Talvez [MC-banch] possa ser útil para as empresas para saber se estão indo na direção certa".
Artigo relacionado
Fábrica de Quadrinhos com IA: Crie Quadrinhos Facilmente de Graça Usando IA
No mundo digital de hoje, a fusão de inteligência artificial e artes criativas está gerando novas e fascinantes formas de expressão. A Fábrica de Quadrinhos com IA lidera essa revolução, oferecendo um
Bots de Negociação de IA: Você Realmente Pode Ganhar o Salário de um Mês em um Dia?
Se você já sonhou em ganhar o salário de um mês em um único dia, o mundo dos bots de negociação de IA pode parecer o bilhete dourado. Esses sistemas automatizados prometem usar inteligência artificial
LinkFi: Revolucionando DeFi com IA e Machine Learning
No mundo em constante evolução das finanças descentralizadas (DeFi), estar à frente é crucial. Conheça o LinkFi, um projeto que está agitando as coisas ao integrar inteligência artificial (IA) e machi
Comentários (20)
0/200
KennethLee
20 de Abril de 2025 à0 00:00:00 GMT
This high school student's Minecraft AI challenge website is super cool! It's a fun way to see how AI can build stuff in Minecraft. The only thing is, sometimes the challenges are too hard for beginners. Still, it's a great project and I can't wait to see what comes next! 🎮
0
HenryJackson
19 de Abril de 2025 à0 00:00:00 GMT
この高校生が作ったマインクラフトのAIチャレンジウェブサイトは超クール!マインクラフトでAIが何を建てられるかを見る楽しい方法です。ただ、初心者にはチャレンジが難しすぎることがあります。それでも素晴らしいプロジェクトで、次に何が来るのか楽しみです!🎮
0
RalphSanchez
20 de Abril de 2025 à0 00:00:00 GMT
이 고등학생이 만든 마인크래프트 AI 챌린지 웹사이트 정말 멋져요! 마인크래프트에서 AI가 어떤 것을 만들 수 있는지 보는 재미있는 방법이에요. 다만, 초보자에게는 챌린지가 너무 어려울 때가 있어요. 그래도 훌륭한 프로젝트고 다음에 뭐가 나올지 기대돼요! 🎮
0
AlbertWalker
18 de Abril de 2025 à0 00:00:00 GMT
Esse site de desafios de construção de AI no Minecraft criado por um estudante do ensino médio é super legal! É uma maneira divertida de ver como a AI pode construir coisas no Minecraft. A única coisa é que às vezes os desafios são muito difíceis para iniciantes. Ainda assim, é um ótimo projeto e estou ansioso para ver o que vem a seguir! 🎮
0
ChristopherTaylor
18 de Abril de 2025 à0 00:00:00 GMT
El sitio web de desafíos de construcción de AI en Minecraft creado por un estudiante de secundaria es súper genial. Es una forma divertida de ver cómo la IA puede construir cosas en Minecraft. Lo único es que a veces los desafíos son demasiado difíciles para los principiantes. Aún así, es un gran proyecto y estoy emocionado de ver qué viene después. 🎮
0
PaulTaylor
18 de Abril de 2025 à0 00:00:00 GMT
This Minecraft AI build-off thing is so cool! I love how it turns a game into a way to test AI. It's like watching your favorite AI models compete in a virtual world. Only downside is sometimes the builds are a bit too simple, but hey, it's still awesome! Keep up the good work! 😎
0
Creative AI Benchmarking com Minecraft
À medida que os métodos tradicionais de benchmarking de IA ficam aquém, os desenvolvedores estão explorando abordagens inovadoras para avaliar a proeza dos modelos generativos de IA. Um desses métodos criativos envolve o uso do Minecraft, o popular jogo de sandbox de propriedade da Microsoft. Um grupo de desenvolvedores lançou o Minecraft Benchmark, ou MC-Bench, uma plataforma em que os modelos de IA competem na criação de compilações do Minecraft com base em determinados prompts.
No MC-Bench, os usuários podem votar na qual a criação do modelo de IA preferem, e somente depois de votar seu voto, eles descobrem qual modelo fez cada construção. Essa abordagem interativa não apenas envolve a comunidade, mas também fornece uma maneira única de avaliar os recursos de IA.
Adi Singh, aluno da 12ª série e iniciador do MC-banch, acredita que o reconhecimento generalizado de Minecraft é fundamental. Como o videogame mais vendido de todos os tempos, é familiar para muitos, facilitando para as pessoas julgar a qualidade das construções geradas pela IA, mesmo que elas não jogassem o jogo. "O Minecraft permite que as pessoas vejam o progresso [do desenvolvimento da IA] com muito mais facilidade", explicou Singh ao TechCrunch. "As pessoas estão acostumadas a minecraft, acostumadas com a aparência e a vibração".
O MC-Bench é apoiado por uma equipe de oito colaboradores voluntários. Empresas como Anthropic, Google, Openai e Alibaba forneceram seus produtos para a execução de instruções de referência, embora não estejam envolvidos no projeto.
Singh prevê expandir o MC-banch além das compilações simples para tarefas mais complexas e orientadas a objetivos. "Os jogos podem ser apenas um médio para testar o raciocínio agêntico que é mais seguro do que na vida real e mais controlável para fins de teste, tornando -o mais ideal aos meus olhos", disse ele.
Outros jogos como benchmarks de IA
Além do Minecraft, outros jogos como Pokémon Red, Street Fighter e Pictionary foram usados como benchmarks experimentais para a IA. O desafio da AI de benchmarking reside em sua complexidade, pois os testes padronizados tradicionais geralmente favorecem os modelos de IA devido aos seus métodos de treinamento, que se destacam em áreas estreitas de solução de problemas, como memorização mecânica ou extrapolação básica.
Por exemplo, embora o GPT-4 do Openai possa marcar no percentil 88 no LSAT, ele luta com tarefas mais simples, como contar o número de Rs em "Strawberry". Da mesma forma, o claude de 3,7 sonetos da Anthropic alcançou 62,3% de precisão em uma referência de engenharia de software, mas fica aquém do jogo de Pokémon em comparação com a maioria das crianças de cinco anos.
MC-BENCH: Mais do que apenas um benchmark de programação
Tecnicamente, o MC-Bench é um benchmark de programação, porque exige que os modelos de IA escreviam código para criar construções como "Frosty the Snowman" ou "uma encantadora cabana de praia tropical em uma costa arenosa intocada". No entanto, o apelo da plataforma está em sua acessibilidade. É mais fácil para os usuários avaliar a qualidade visual de uma construção do que analisar o código, que amplia o alcance do projeto e o potencial de coleta de dados no desempenho do modelo.
O debate continua sobre se essas pontuações realmente refletem a utilidade da IA. Singh, no entanto, acredita que eles são um forte indicador. "A tabela de classificação atual reflete muito de perto minha própria experiência de usar esses modelos, o que é diferente de muitos benchmarks de texto puro", disse ele. "Talvez [MC-banch] possa ser útil para as empresas para saber se estão indo na direção certa".




This high school student's Minecraft AI challenge website is super cool! It's a fun way to see how AI can build stuff in Minecraft. The only thing is, sometimes the challenges are too hard for beginners. Still, it's a great project and I can't wait to see what comes next! 🎮




この高校生が作ったマインクラフトのAIチャレンジウェブサイトは超クール!マインクラフトでAIが何を建てられるかを見る楽しい方法です。ただ、初心者にはチャレンジが難しすぎることがあります。それでも素晴らしいプロジェクトで、次に何が来るのか楽しみです!🎮




이 고등학생이 만든 마인크래프트 AI 챌린지 웹사이트 정말 멋져요! 마인크래프트에서 AI가 어떤 것을 만들 수 있는지 보는 재미있는 방법이에요. 다만, 초보자에게는 챌린지가 너무 어려울 때가 있어요. 그래도 훌륭한 프로젝트고 다음에 뭐가 나올지 기대돼요! 🎮




Esse site de desafios de construção de AI no Minecraft criado por um estudante do ensino médio é super legal! É uma maneira divertida de ver como a AI pode construir coisas no Minecraft. A única coisa é que às vezes os desafios são muito difíceis para iniciantes. Ainda assim, é um ótimo projeto e estou ansioso para ver o que vem a seguir! 🎮




El sitio web de desafíos de construcción de AI en Minecraft creado por un estudiante de secundaria es súper genial. Es una forma divertida de ver cómo la IA puede construir cosas en Minecraft. Lo único es que a veces los desafíos son demasiado difíciles para los principiantes. Aún así, es un gran proyecto y estoy emocionado de ver qué viene después. 🎮




This Minecraft AI build-off thing is so cool! I love how it turns a game into a way to test AI. It's like watching your favorite AI models compete in a virtual world. Only downside is sometimes the builds are a bit too simple, but hey, it's still awesome! Keep up the good work! 😎












