opção
Lar
Notícias
O aluno do ensino médio cria um site para os desafios de construção da AI Minecraft

O aluno do ensino médio cria um site para os desafios de construção da AI Minecraft

18 de Abril de 2025
119

Benchmarking de IA Criativa com Minecraft

À medida que os métodos tradicionais de benchmarking de IA ficam aquém, os desenvolvedores estão explorando abordagens inovadoras para avaliar a capacidade dos modelos de IA generativa. Um desses métodos criativos envolve o uso do Minecraft, o popular jogo sandbox pertencente à Microsoft. Um grupo de desenvolvedores lançou o Minecraft Benchmark, ou MC-Bench, uma plataforma onde modelos de IA competem na criação de construções no Minecraft com base em prompts fornecidos.

No MC-Bench, os usuários podem votar em qual criação de modelo de IA preferem, e somente após votar descobrem qual modelo fez cada construção. Essa abordagem interativa não apenas envolve a comunidade, mas também oferece uma maneira única de avaliar as capacidades da IA.

Créditos da Imagem: Minecraft Benchmark

Créditos da Imagem: Minecraft Benchmark

Adi Singh, um estudante do 12º ano e o iniciador do MC-Bench, acredita que o amplo reconhecimento do Minecraft é fundamental. Como o videogame mais vendido de todos os tempos, ele é familiar para muitos, facilitando a avaliação da qualidade das construções geradas por IA, mesmo para aqueles que não jogaram o jogo. "O Minecraft permite que as pessoas vejam o progresso [do desenvolvimento da IA] muito mais facilmente," explicou Singh à TechCrunch. "As pessoas estão acostumadas com o Minecraft, com a aparência e a vibe."

O MC-Bench é apoiado por uma equipe de oito colaboradores voluntários. Empresas como Anthropic, Google, OpenAI e Alibaba forneceram seus produtos para executar prompts de benchmark, embora não estejam diretamente envolvidas com o projeto.

Singh planeja expandir o MC-Bench além de construções simples para tarefas mais complexas e orientadas a objetivos. "Os jogos podem ser apenas um meio para testar o raciocínio agentivo que é mais seguro do que na vida real e mais controlável para fins de teste, tornando-o mais ideal aos meus olhos," disse ele.

Outros Jogos como Benchmarks de IA

Além do Minecraft, outros jogos como Pokémon Red, Street Fighter e Pictionary têm sido usados como benchmarks experimentais para IA. O desafio de benchmarking de IA reside em sua complexidade, pois os testes padronizados tradicionais frequentemente favorecem modelos de IA devido aos seus métodos de treinamento, que se destacam em áreas específicas de resolução de problemas, como memorização mecânica ou extrapolação básica.

Por exemplo, enquanto o GPT-4 da OpenAI pode alcançar o 88º percentil no LSAT, ele enfrenta dificuldades em tarefas mais simples, como contar o número de Rs em "strawberry". Da mesma forma, o Claude 3.7 Sonnet da Anthropic alcançou 62,3% de precisão em um benchmark de engenharia de software, mas fica aquém ao jogar Pokémon em comparação com a maioria das crianças de cinco anos.

Créditos da Imagem: Minecraft Benchmark

Créditos da Imagem: Minecraft Benchmark

MC-Bench: Mais do que Apenas um Benchmark de Programação

Tecnicamente, o MC-Bench é um benchmark de programação porque exige que os modelos de IA escrevam código para criar construções como "Frosty, o Boneco de Neve" ou "uma charmosa cabana tropical em uma praia de areia intocada". No entanto, o apelo da plataforma está em sua acessibilidade. É mais fácil para os usuários avaliarem a qualidade visual de uma construção do que analisar o código, o que amplia o alcance do projeto e o potencial para coleta de dados sobre o desempenho do modelo.

O debate continua sobre se essas pontuações refletem verdadeiramente a utilidade da IA. Singh, no entanto, acredita que elas são um forte indicador. "A tabela de classificação atual reflete de forma bastante próxima minha própria experiência ao usar esses modelos, o que é diferente de muitos benchmarks puramente textuais," disse ele. "Talvez [o MC-Bench] possa ser útil para as empresas saberem se estão indo na direção certa."

Artigo relacionado
Amazon Estreia Alexa+ Aprimorada com Capacidades Avançadas de IA Amazon Estreia Alexa+ Aprimorada com Capacidades Avançadas de IA Em um evento em Nova York na quarta-feira, a Amazon apresentou uma experiência avançada de Alexa+, impulsionada por tecnologia de IA generativa de ponta. Panos Panay, chefe de dispositivos e serviços
Guia para Criar Vídeos de Histórias de Chat Virais com Ferramentas de IA em 2025 Guia para Criar Vídeos de Histórias de Chat Virais com Ferramentas de IA em 2025 No dinâmico mundo das redes sociais, produzir conteúdo cativante é essencial para atrair o interesse do público e estabelecer uma forte presença online. Vídeos de histórias de chat cresceram em popula
Google Adere ao Código de Prática de IA da UE em Meio a Debate na Indústria Google Adere ao Código de Prática de IA da UE em Meio a Debate na Indústria Google comprometeu-se a adotar o código de prática de IA voluntário da União Europeia, um quadro projetado para auxiliar desenvolvedores de IA a alinharem-se com a Lei de IA da UE, implementando proce
Comentários (21)
0/200
BenGarcía
BenGarcía 4 de Agosto de 2025 à0 07:01:00 WEST

This high school kid building an AI Minecraft challenge site is wild! 🤯 I love how Minecraft’s open world is being used to test AI creativity. Wonder if we’ll see AI build epic castles or just glitchy dirt huts? 🏰

GregoryJones
GregoryJones 20 de Abril de 2025 à52 22:02:52 WEST

マインクラフトでAIの性能を評価するなんて面白いアイデアだね!ただ、AIの建築物が時々変な感じになるのが残念。でも全体的に見て、すごいと思うよ!高校生が作ったなんて信じられない!😲

JonathanKing
JonathanKing 20 de Abril de 2025 à35 09:42:35 WEST

¡Usar Minecraft para evaluar AI es una idea genial! Es como ver a los modelos de AI compitiendo en un mundo virtual. Lo único malo es que a veces las construcciones son demasiado simples, pero en general es fantástico. ¡Sigan así! 😄

RalphHill
RalphHill 20 de Abril de 2025 à36 04:41:36 WEST

Usar o Minecraft para testar AI é uma ideia incrível! Parece que estamos assistindo a uma competição de AI em um mundo virtual. A única coisa ruim é que às vezes as construções são muito simples, mas no geral é fantástico! Continuem o bom trabalho! 😊

CharlesThomas
CharlesThomas 19 de Abril de 2025 à16 23:49:16 WEST

マインクラフトを使ったAIのベンチマーク、面白いですね!ゲームがAIのテストに使われるなんて、まるでAI同士が仮想世界で競っているみたい。ただ、時々ビルドがシンプルすぎるのが残念。でも全体的に素晴らしいアイデアだと思います!👍

KennethLee
KennethLee 19 de Abril de 2025 à54 22:58:54 WEST

This high school student's Minecraft AI challenge website is super cool! It's a fun way to see how AI can build stuff in Minecraft. The only thing is, sometimes the challenges are too hard for beginners. Still, it's a great project and I can't wait to see what comes next! 🎮

De volta ao topo
OR