вариант
Дом
Новости
Студент средней школы создает веб-сайт для создания AI Minecraft.

Студент средней школы создает веб-сайт для создания AI Minecraft.

18 апреля 2025 г.
141

Креативное тестирование ИИ с помощью Minecraft

Поскольку традиционные методы тестирования ИИ оказываются недостаточными, разработчики исследуют инновационные подходы для оценки возможностей генеративных моделей ИИ. Одним из таких креативных методов является использование Minecraft, популярной песочницы, принадлежащей Microsoft. Группа разработчиков запустила Minecraft Benchmark, или MC-Bench, платформу, где модели ИИ соревнуются в создании построек в Minecraft на основе заданных подсказок.

На MC-Bench пользователи могут голосовать за понравившуюся постройку модели ИИ, и только после голосования они узнают, какая модель создала каждую постройку. Этот интерактивный подход не только вовлекает сообщество, но и предоставляет уникальный способ оценки возможностей ИИ.

Изображение предоставлено: Minecraft Benchmark

Изображение предоставлено: Minecraft Benchmark

Ади Сингх, ученик 12-го класса и инициатор MC-Bench, считает, что широкая известность Minecraft играет ключевую роль. Как самая продаваемая видеоигра в истории, она знакома многим, что облегчает людям оценку качества построек, созданных ИИ, даже если они сами не играли в игру. «Minecraft позволяет людям гораздо проще увидеть прогресс [развития ИИ],» — объяснил Сингх в интервью TechCrunch. «Люди привыкли к Minecraft, к его внешнему виду и атмосфере.»

MC-Bench поддерживается командой из восьми добровольных участников. Компании, такие как Anthropic, Google, OpenAI и Alibaba, предоставили свои продукты для выполнения тестовых подсказок, хотя в остальном они не участвуют в проекте.

Сингх планирует расширить MC-Bench за пределы простых построек до более сложных, ориентированных на цели задач. «Игры могут быть просто средством для тестирования агентного мышления, которое безопаснее, чем в реальной жизни, и более контролируемо для целей тестирования, что делает его более идеальным в моих глазах,» — сказал он.

Другие игры как тесты для ИИ

Помимо Minecraft, другие игры, такие как Pokémon Red, Street Fighter и Pictionary, использовались в качестве экспериментальных тестов для ИИ. Сложность тестирования ИИ заключается в его комплексности, поскольку традиционные стандартизированные тесты часто благоприятствуют моделям ИИ из-за их методов обучения, которые превосходят в узких областях решения задач, таких как механическое запоминание или базовая экстраполяция.

Например, GPT-4 от OpenAI может набрать 88-й процентиль на LSAT, но испытывает трудности с более простыми задачами, такими как подсчет количества букв «R» в слове «strawberry». Аналогично, Claude 3.7 Sonnet от Anthropic достиг точности 62,3% в тесте по разработке программного обеспечения, но уступает большинству пятилетних детей в игре Pokémon.

Изображение предоставлено: Minecraft Benchmark

Изображение предоставлено: Minecraft Benchmark

MC-Bench: больше, чем просто программный тест

Технически MC-Bench является программным тестом, поскольку требует от моделей ИИ написания кода для создания построек, таких как «Снеговик Фрости» или «очаровательная тропическая хижина на нетронутом песчаном берегу». Однако привлекательность платформы заключается в ее доступности. Пользователям легче оценить визуальное качество постройки, чем анализировать код, что расширяет охват проекта и потенциал для сбора данных о производительности моделей.

Дискуссия о том, действительно ли эти результаты отражают полезность ИИ, продолжается. Однако Сингх считает, что они являются сильным индикатором. «Текущая таблица лидеров довольно точно отражает мой собственный опыт использования этих моделей, в отличие от многих чисто текстовых тестов,» — сказал он. «Возможно, [MC-Bench] может быть полезен компаниям, чтобы понять, движутся ли они в правильном направлении.»

Связанная статья
"Графический ИИ преобразует бизнес-аналитику с помощью графиков знаний" Ключевые моментыГрафовый ИИ использует графы знаний для выявления скрытых связей в сложных массивах данных.Графы знаний визуализируют информацию в виде взаимосвязанных узлов и отношений.Выявление нере
Minecraft Villager AI переосмысливает музыку с помощью уникальной звуковой обложки Minecraft Villager AI переосмысливает музыку с помощью уникальной звуковой обложки Ландшафт музыкального производства продолжает трансформироваться, поскольку технологии искусственного интеллекта расширяют творческие границы неожиданными способами. Одна из особенно интересных разраб
Midjourney представляет передовой видеогенератор с искусственным интеллектом для креативного контента Midjourney представляет передовой видеогенератор с искусственным интеллектом для креативного контента Прорыв Midjourney в создании видео с помощью искусственного интеллектаКомпания Midjourney представила свой первый инструмент для создания видео на основе искусственного интеллекта, что знаменует собой
Комментарии (23)
RalphRoberts
RalphRoberts 21 сентября 2025 г., 1:30:34 GMT+03:00

这个高中生用Minecraft来测试AI生成建筑也太有创意了吧!😂 传统AI评测标准太死板了,确实需要这种更直观有趣的方式。不过我很好奇评判标准是什么,是美观度还是还原度?也想试试看用我的世界来测试Stable Diffusion效果

JasonJohnson
JasonJohnson 23 августа 2025 г., 4:01:25 GMT+03:00

This high school kid building an AI Minecraft challenge site is wild! 🧱 Makes me wonder how far AI can push creativity in games. Could it outbuild my epic castle? 😎

BenGarcía
BenGarcía 4 августа 2025 г., 9:01:00 GMT+03:00

This high school kid building an AI Minecraft challenge site is wild! 🤯 I love how Minecraft’s open world is being used to test AI creativity. Wonder if we’ll see AI build epic castles or just glitchy dirt huts? 🏰

GregoryJones
GregoryJones 21 апреля 2025 г., 0:02:52 GMT+03:00

マインクラフトでAIの性能を評価するなんて面白いアイデアだね!ただ、AIの建築物が時々変な感じになるのが残念。でも全体的に見て、すごいと思うよ!高校生が作ったなんて信じられない!😲

JonathanKing
JonathanKing 20 апреля 2025 г., 11:42:35 GMT+03:00

¡Usar Minecraft para evaluar AI es una idea genial! Es como ver a los modelos de AI compitiendo en un mundo virtual. Lo único malo es que a veces las construcciones son demasiado simples, pero en general es fantástico. ¡Sigan así! 😄

RalphHill
RalphHill 20 апреля 2025 г., 6:41:36 GMT+03:00

Usar o Minecraft para testar AI é uma ideia incrível! Parece que estamos assistindo a uma competição de AI em um mundo virtual. A única coisa ruim é que às vezes as construções são muito simples, mas no geral é fantástico! Continuem o bom trabalho! 😊

Вернуться к вершине
OR