opción
Hogar
Noticias
El estudiante de secundaria crea un sitio web para los desafíos de AI Minecraft Build-Off

El estudiante de secundaria crea un sitio web para los desafíos de AI Minecraft Build-Off

18 de abril de 2025
72

Benchmarking creativo de IA con Minecraft

A medida que los métodos de evaluación comparativa tradicional de IA se quedan cortas, los desarrolladores están explorando enfoques innovadores para evaluar la destreza de los modelos de IA generativos. Uno de esos métodos creativos implica usar Minecraft, el popular juego de sandbox propiedad de Microsoft. Un grupo de desarrolladores ha lanzado Minecraft Benchmark, o MC-Bench, una plataforma donde los modelos de IA compiten en la creación de compilaciones de Minecraft basadas en indicaciones dadas.

En MC-Bench, los usuarios pueden votar sobre la creación de AI Model que prefieren, y solo después de emitir su voto descubren qué modelo hizo cada construcción. Este enfoque interactivo no solo involucra a la comunidad, sino que también proporciona una forma única de evaluar las capacidades de IA.

Créditos de imagen: Minecraft Benchmark

Créditos de imagen: Minecraft Benchmark

Adi Singh, estudiante de 12º grado e iniciador de MC-Bench, cree que el reconocimiento generalizado de Minecraft es clave. Como el videojuego más vendido de la historia, es familiar para muchos, lo que facilita a las personas juzgar la calidad de las construcciones generadas por IA, incluso si no han jugado el juego ellos mismos. "Minecraft permite a las personas ver el progreso [del desarrollo de IA] mucho más fácilmente", explicó Singh a TechCrunch. "La gente está acostumbrada a Minecraft, acostumbrada al aspecto y al ambiente".

MC-Bench cuenta con el apoyo de un equipo de ocho colaboradores voluntarios. Empresas como Anthrope, Google, Openai y Alibaba han proporcionado sus productos para ejecutar indicaciones de referencia, aunque de otro modo no participan con el proyecto.

Singh prevé expandir el bancario MC más allá de las simples construcciones a tareas más complejas y orientadas a objetivos. "Los juegos podrían ser un razonamiento agente medio para probar que sea más seguro que en la vida real y más controlable para fines de prueba, lo que lo hace más ideal en mis ojos", dijo.

Otros juegos como puntos de referencia de AI

Además de Minecraft, otros juegos como Pokémon Red, Street Fighter y Pictionary se han utilizado como puntos de referencia experimentales para la IA. El desafío de la evaluación comparativa de IA radica en su complejidad, ya que las pruebas estandarizadas tradicionales a menudo favorecen los modelos de IA debido a sus métodos de entrenamiento, que se destacan en áreas estrechas de resolución de problemas como la memorización de memoria o extrapolación básica.

Por ejemplo, si bien el GPT-4 de OpenAI puede obtener en el percentil 88 en el LSAT, lucha con tareas más simples como contar el número de RS en "Strawberry". Del mismo modo, el soneto Claude 3.7 de Anthrope alcanzó una precisión del 62.3% en un punto de referencia de ingeniería de software, pero se queda corto en jugar Pokémon en comparación con la mayoría de los niños de cinco años.

Créditos de imagen: Minecraft Benchmark

Créditos de imagen: Minecraft Benchmark

MC-Bench: más que un simple punto de referencia de programación

Técnicamente, MC-Bench es un punto de referencia de programación porque requiere que los modelos de IA escriban código para crear construcciones como "Frosty the Snowman" o "una encantadora cabaña de playa tropical en una orilla arenosa virgen". Sin embargo, el atractivo de la plataforma radica en su accesibilidad. Es más fácil para los usuarios evaluar la calidad visual de una compilación que analizar el código, lo que amplía el alcance del proyecto y el potencial para la recopilación de datos sobre el rendimiento del modelo.

El debate continúa si estos puntajes realmente reflejan la utilidad de AI. Singh, sin embargo, cree que son un indicador fuerte. "La tabla de clasificación actual se refleja bastante estrechamente con mi propia experiencia de usar estos modelos, que es diferente a muchos puntos de referencia de texto puro", dijo. "Tal vez [MC-Bench] podría ser útil para las empresas para saber si se dirigen en la dirección correcta".

Artículo relacionado
Fábrica de Cómics AI: Crea Cómics Fácilmente Gratis con AI Fábrica de Cómics AI: Crea Cómics Fácilmente Gratis con AI En el mundo digital actual, la fusión de inteligencia artificial y artes creativas está abriendo nuevas vías fascinantes para la expresión. La Fábrica de Cómics AI lidera esta revolución, ofreciendo u
Bots de Trading con IA: ¿Realmente Puedes Ganar el Salario de un Mes en un Día? Bots de Trading con IA: ¿Realmente Puedes Ganar el Salario de un Mes en un Día? Si alguna vez has soñado con ganar el salario de un mes en un solo día, el mundo de los bots de trading con IA podría parecerte el boleto dorado. Estos sistemas automatizados prometen aprovechar la in
LinkFi: Revolucionando DeFi con IA y Aprendizaje Automático LinkFi: Revolucionando DeFi con IA y Aprendizaje Automático En el mundo en constante evolución de las finanzas descentralizadas (DeFi), mantenerse a la vanguardia es crucial. Llega LinkFi, un proyecto que agita las cosas al integrar inteligencia artificial (IA
comentario (20)
0/200
KennethLee
KennethLee 20 de abril de 2025 00:00:00 GMT

This high school student's Minecraft AI challenge website is super cool! It's a fun way to see how AI can build stuff in Minecraft. The only thing is, sometimes the challenges are too hard for beginners. Still, it's a great project and I can't wait to see what comes next! 🎮

HenryJackson
HenryJackson 19 de abril de 2025 00:00:00 GMT

この高校生が作ったマインクラフトのAIチャレンジウェブサイトは超クール!マインクラフトでAIが何を建てられるかを見る楽しい方法です。ただ、初心者にはチャレンジが難しすぎることがあります。それでも素晴らしいプロジェクトで、次に何が来るのか楽しみです!🎮

RalphSanchez
RalphSanchez 20 de abril de 2025 00:00:00 GMT

이 고등학생이 만든 마인크래프트 AI 챌린지 웹사이트 정말 멋져요! 마인크래프트에서 AI가 어떤 것을 만들 수 있는지 보는 재미있는 방법이에요. 다만, 초보자에게는 챌린지가 너무 어려울 때가 있어요. 그래도 훌륭한 프로젝트고 다음에 뭐가 나올지 기대돼요! 🎮

AlbertWalker
AlbertWalker 18 de abril de 2025 00:00:00 GMT

Esse site de desafios de construção de AI no Minecraft criado por um estudante do ensino médio é super legal! É uma maneira divertida de ver como a AI pode construir coisas no Minecraft. A única coisa é que às vezes os desafios são muito difíceis para iniciantes. Ainda assim, é um ótimo projeto e estou ansioso para ver o que vem a seguir! 🎮

ChristopherTaylor
ChristopherTaylor 18 de abril de 2025 00:00:00 GMT

El sitio web de desafíos de construcción de AI en Minecraft creado por un estudiante de secundaria es súper genial. Es una forma divertida de ver cómo la IA puede construir cosas en Minecraft. Lo único es que a veces los desafíos son demasiado difíciles para los principiantes. Aún así, es un gran proyecto y estoy emocionado de ver qué viene después. 🎮

PaulTaylor
PaulTaylor 18 de abril de 2025 00:00:00 GMT

This Minecraft AI build-off thing is so cool! I love how it turns a game into a way to test AI. It's like watching your favorite AI models compete in a virtual world. Only downside is sometimes the builds are a bit too simple, but hey, it's still awesome! Keep up the good work! 😎

Volver arriba
OR