Học sinh trung học tạo trang web cho các thử thách xây dựng AI Minecraft
Điểm chuẩn AI sáng tạo với Minecraft
Khi các phương pháp điểm chuẩn AI truyền thống giảm, các nhà phát triển đang khám phá các cách tiếp cận sáng tạo để đánh giá năng lực của các mô hình AI tổng quát. Một phương pháp sáng tạo như vậy liên quan đến việc sử dụng Minecraft, trò chơi Sandbox phổ biến thuộc sở hữu của Microsoft. Một nhóm các nhà phát triển đã ra mắt điểm chuẩn Minecraft, hoặc MC Bench, một nền tảng nơi các mô hình AI cạnh tranh trong việc tạo các bản dựng Minecraft dựa trên các lời nhắc nhất định.
Trên băng ghế MC, người dùng có thể bỏ phiếu cho việc tạo ra mô hình AI mà họ thích và chỉ sau khi bỏ phiếu, họ mới phát hiện ra mô hình nào đã tạo ra mỗi bản dựng. Cách tiếp cận tương tác này không chỉ thu hút cộng đồng mà còn cung cấp một cách độc đáo để đánh giá khả năng AI.

Tín dụng hình ảnh: Điểm chuẩn Minecraft
Adi Singh, một học sinh lớp 12 và là người khởi xướng MC băng ghế, tin rằng sự công nhận rộng rãi của Minecraft là chìa khóa. Là trò chơi video bán chạy nhất từ trước đến nay, nó quen thuộc với nhiều người, giúp mọi người dễ dàng đánh giá chất lượng của các bản dựng do AI tạo ra, ngay cả khi họ không tự chơi trò chơi. "Minecraft cho phép mọi người thấy sự tiến bộ [phát triển AI] dễ dàng hơn nhiều", Singh giải thích với TechCrunch. "Mọi người đã quen với Minecraft, đã quen với vẻ ngoài và sự rung cảm."
MC ghế được hỗ trợ bởi một nhóm gồm tám người đóng góp tình nguyện. Các công ty như Anthropic, Google, Openai và Alibaba đã cung cấp sản phẩm của họ để điều hành các lời nhắc điểm chuẩn, mặc dù họ không liên quan đến dự án.
Singh hình dung mở rộng băng ghế MC vượt ra ngoài các công trình đơn giản đến các nhiệm vụ hướng đến mục tiêu phức tạp hơn. "Các trò chơi có thể chỉ là một lý luận trung bình để kiểm tra lý luận an toàn hơn so với trong cuộc sống thực và kiểm soát nhiều hơn cho mục đích thử nghiệm, làm cho nó trở nên lý tưởng hơn trong mắt tôi", ông nói.
Các trò chơi khác như điểm chuẩn của AI
Bên cạnh Minecraft, các trò chơi khác như Pokémon Red, Street Fighter và Pictionary đã được sử dụng làm điểm chuẩn thử nghiệm cho AI. Thách thức của việc điểm chuẩn AI nằm ở sự phức tạp của nó, vì các thử nghiệm tiêu chuẩn hóa truyền thống thường ủng hộ các mô hình AI do các phương pháp đào tạo của chúng, vượt trội trong các khu vực giải quyết vấn đề hẹp như ghi nhớ vẹt hoặc ngoại suy cơ bản.
Chẳng hạn, trong khi GPT-4 của Openai có thể ghi điểm trong phần trăm thứ 88 trên LSAT, thì nó phải vật lộn với các nhiệm vụ đơn giản hơn như đếm số lượng RS trong "Dâu". Tương tự, Sonnet Claude 3.7 của Anthropic đạt được độ chính xác 62,3% trên điểm chuẩn Kỹ thuật phần mềm nhưng không chơi Pokémon so với hầu hết những đứa trẻ năm tuổi.

Tín dụng hình ảnh: Điểm chuẩn Minecraft
MC-Bench: Không chỉ là một điểm chuẩn lập trình
Về mặt kỹ thuật, MC ghế dài là một chuẩn mực lập trình vì nó đòi hỏi các mô hình AI phải viết mã để tạo ra các bản dựng như "Frosty the Snowman" hoặc "một túp lều nhiệt đới quyến rũ trên bờ cát nguyên sơ". Tuy nhiên, sự hấp dẫn của nền tảng nằm ở khả năng tiếp cận của nó. Người dùng dễ dàng đánh giá chất lượng trực quan của bản dựng hơn là phân tích mã, giúp mở rộng phạm vi của dự án và tiềm năng thu thập dữ liệu về hiệu suất mô hình.
Cuộc tranh luận tiếp tục về việc những điểm số này có thực sự phản ánh tính hữu dụng của AI hay không. Singh, tuy nhiên, tin rằng họ là một chỉ số mạnh mẽ. "Bảng xếp hạng hiện tại phản ánh khá chặt chẽ với trải nghiệm của tôi về việc sử dụng các mô hình này, không giống như nhiều điểm chuẩn văn bản thuần túy", ông nói. "Có lẽ [MC-Bench] có thể hữu ích cho các công ty để biết liệu họ có đi đúng hướng không."
Bài viết liên quan
Nhà máy truyện tranh AI: Dễ dàng tạo truyện tranh miễn phí bằng AI
Trong thế giới số hiện nay, sự kết hợp giữa trí tuệ nhân tạo và nghệ thuật sáng tạo đang mở ra những con đường mới đầy hấp dẫn cho việc thể hiện. AI Comic Factory đứng đầu cuộc cách mạng này, cung cấp
Robot Giao Dịch AI: Có Thực Sự Kiếm Được Lương Một Tháng Trong Một Ngày?
Nếu bạn từng mơ ước kiếm được lương một tháng chỉ trong một ngày, thế giới của robot giao dịch AI có thể giống như tấm vé vàng. Những hệ thống tự động này hứa hẹn sử dụng trí tuệ nhân tạo để giao dịch
LinkFi: Cách mạng hóa DeFi với AI và Machine Learning
Trong thế giới tài chính phi tập trung (DeFi) không ngừng phát triển, việc đi đầu là rất quan trọng. LinkFi xuất hiện, một dự án đang làm sôi động thị trường bằng cách kết hợp trí tuệ nhân tạo (AI) và
Nhận xét (20)
0/200
KennethLee
00:00:00 GMT Ngày 20 tháng 4 năm 2025
This high school student's Minecraft AI challenge website is super cool! It's a fun way to see how AI can build stuff in Minecraft. The only thing is, sometimes the challenges are too hard for beginners. Still, it's a great project and I can't wait to see what comes next! 🎮
0
HenryJackson
00:00:00 GMT Ngày 19 tháng 4 năm 2025
この高校生が作ったマインクラフトのAIチャレンジウェブサイトは超クール!マインクラフトでAIが何を建てられるかを見る楽しい方法です。ただ、初心者にはチャレンジが難しすぎることがあります。それでも素晴らしいプロジェクトで、次に何が来るのか楽しみです!🎮
0
RalphSanchez
00:00:00 GMT Ngày 20 tháng 4 năm 2025
이 고등학생이 만든 마인크래프트 AI 챌린지 웹사이트 정말 멋져요! 마인크래프트에서 AI가 어떤 것을 만들 수 있는지 보는 재미있는 방법이에요. 다만, 초보자에게는 챌린지가 너무 어려울 때가 있어요. 그래도 훌륭한 프로젝트고 다음에 뭐가 나올지 기대돼요! 🎮
0
AlbertWalker
00:00:00 GMT Ngày 18 tháng 4 năm 2025
Esse site de desafios de construção de AI no Minecraft criado por um estudante do ensino médio é super legal! É uma maneira divertida de ver como a AI pode construir coisas no Minecraft. A única coisa é que às vezes os desafios são muito difíceis para iniciantes. Ainda assim, é um ótimo projeto e estou ansioso para ver o que vem a seguir! 🎮
0
ChristopherTaylor
00:00:00 GMT Ngày 18 tháng 4 năm 2025
El sitio web de desafíos de construcción de AI en Minecraft creado por un estudiante de secundaria es súper genial. Es una forma divertida de ver cómo la IA puede construir cosas en Minecraft. Lo único es que a veces los desafíos son demasiado difíciles para los principiantes. Aún así, es un gran proyecto y estoy emocionado de ver qué viene después. 🎮
0
PaulTaylor
00:00:00 GMT Ngày 18 tháng 4 năm 2025
This Minecraft AI build-off thing is so cool! I love how it turns a game into a way to test AI. It's like watching your favorite AI models compete in a virtual world. Only downside is sometimes the builds are a bit too simple, but hey, it's still awesome! Keep up the good work! 😎
0
Điểm chuẩn AI sáng tạo với Minecraft
Khi các phương pháp điểm chuẩn AI truyền thống giảm, các nhà phát triển đang khám phá các cách tiếp cận sáng tạo để đánh giá năng lực của các mô hình AI tổng quát. Một phương pháp sáng tạo như vậy liên quan đến việc sử dụng Minecraft, trò chơi Sandbox phổ biến thuộc sở hữu của Microsoft. Một nhóm các nhà phát triển đã ra mắt điểm chuẩn Minecraft, hoặc MC Bench, một nền tảng nơi các mô hình AI cạnh tranh trong việc tạo các bản dựng Minecraft dựa trên các lời nhắc nhất định.
Trên băng ghế MC, người dùng có thể bỏ phiếu cho việc tạo ra mô hình AI mà họ thích và chỉ sau khi bỏ phiếu, họ mới phát hiện ra mô hình nào đã tạo ra mỗi bản dựng. Cách tiếp cận tương tác này không chỉ thu hút cộng đồng mà còn cung cấp một cách độc đáo để đánh giá khả năng AI.
Adi Singh, một học sinh lớp 12 và là người khởi xướng MC băng ghế, tin rằng sự công nhận rộng rãi của Minecraft là chìa khóa. Là trò chơi video bán chạy nhất từ trước đến nay, nó quen thuộc với nhiều người, giúp mọi người dễ dàng đánh giá chất lượng của các bản dựng do AI tạo ra, ngay cả khi họ không tự chơi trò chơi. "Minecraft cho phép mọi người thấy sự tiến bộ [phát triển AI] dễ dàng hơn nhiều", Singh giải thích với TechCrunch. "Mọi người đã quen với Minecraft, đã quen với vẻ ngoài và sự rung cảm."
MC ghế được hỗ trợ bởi một nhóm gồm tám người đóng góp tình nguyện. Các công ty như Anthropic, Google, Openai và Alibaba đã cung cấp sản phẩm của họ để điều hành các lời nhắc điểm chuẩn, mặc dù họ không liên quan đến dự án.
Singh hình dung mở rộng băng ghế MC vượt ra ngoài các công trình đơn giản đến các nhiệm vụ hướng đến mục tiêu phức tạp hơn. "Các trò chơi có thể chỉ là một lý luận trung bình để kiểm tra lý luận an toàn hơn so với trong cuộc sống thực và kiểm soát nhiều hơn cho mục đích thử nghiệm, làm cho nó trở nên lý tưởng hơn trong mắt tôi", ông nói.
Các trò chơi khác như điểm chuẩn của AI
Bên cạnh Minecraft, các trò chơi khác như Pokémon Red, Street Fighter và Pictionary đã được sử dụng làm điểm chuẩn thử nghiệm cho AI. Thách thức của việc điểm chuẩn AI nằm ở sự phức tạp của nó, vì các thử nghiệm tiêu chuẩn hóa truyền thống thường ủng hộ các mô hình AI do các phương pháp đào tạo của chúng, vượt trội trong các khu vực giải quyết vấn đề hẹp như ghi nhớ vẹt hoặc ngoại suy cơ bản.
Chẳng hạn, trong khi GPT-4 của Openai có thể ghi điểm trong phần trăm thứ 88 trên LSAT, thì nó phải vật lộn với các nhiệm vụ đơn giản hơn như đếm số lượng RS trong "Dâu". Tương tự, Sonnet Claude 3.7 của Anthropic đạt được độ chính xác 62,3% trên điểm chuẩn Kỹ thuật phần mềm nhưng không chơi Pokémon so với hầu hết những đứa trẻ năm tuổi.
MC-Bench: Không chỉ là một điểm chuẩn lập trình
Về mặt kỹ thuật, MC ghế dài là một chuẩn mực lập trình vì nó đòi hỏi các mô hình AI phải viết mã để tạo ra các bản dựng như "Frosty the Snowman" hoặc "một túp lều nhiệt đới quyến rũ trên bờ cát nguyên sơ". Tuy nhiên, sự hấp dẫn của nền tảng nằm ở khả năng tiếp cận của nó. Người dùng dễ dàng đánh giá chất lượng trực quan của bản dựng hơn là phân tích mã, giúp mở rộng phạm vi của dự án và tiềm năng thu thập dữ liệu về hiệu suất mô hình.
Cuộc tranh luận tiếp tục về việc những điểm số này có thực sự phản ánh tính hữu dụng của AI hay không. Singh, tuy nhiên, tin rằng họ là một chỉ số mạnh mẽ. "Bảng xếp hạng hiện tại phản ánh khá chặt chẽ với trải nghiệm của tôi về việc sử dụng các mô hình này, không giống như nhiều điểm chuẩn văn bản thuần túy", ông nói. "Có lẽ [MC-Bench] có thể hữu ích cho các công ty để biết liệu họ có đi đúng hướng không."




This high school student's Minecraft AI challenge website is super cool! It's a fun way to see how AI can build stuff in Minecraft. The only thing is, sometimes the challenges are too hard for beginners. Still, it's a great project and I can't wait to see what comes next! 🎮




この高校生が作ったマインクラフトのAIチャレンジウェブサイトは超クール!マインクラフトでAIが何を建てられるかを見る楽しい方法です。ただ、初心者にはチャレンジが難しすぎることがあります。それでも素晴らしいプロジェクトで、次に何が来るのか楽しみです!🎮




이 고등학생이 만든 마인크래프트 AI 챌린지 웹사이트 정말 멋져요! 마인크래프트에서 AI가 어떤 것을 만들 수 있는지 보는 재미있는 방법이에요. 다만, 초보자에게는 챌린지가 너무 어려울 때가 있어요. 그래도 훌륭한 프로젝트고 다음에 뭐가 나올지 기대돼요! 🎮




Esse site de desafios de construção de AI no Minecraft criado por um estudante do ensino médio é super legal! É uma maneira divertida de ver como a AI pode construir coisas no Minecraft. A única coisa é que às vezes os desafios são muito difíceis para iniciantes. Ainda assim, é um ótimo projeto e estou ansioso para ver o que vem a seguir! 🎮




El sitio web de desafíos de construcción de AI en Minecraft creado por un estudiante de secundaria es súper genial. Es una forma divertida de ver cómo la IA puede construir cosas en Minecraft. Lo único es que a veces los desafíos son demasiado difíciles para los principiantes. Aún así, es un gran proyecto y estoy emocionado de ver qué viene después. 🎮




This Minecraft AI build-off thing is so cool! I love how it turns a game into a way to test AI. It's like watching your favorite AI models compete in a virtual world. Only downside is sometimes the builds are a bit too simple, but hey, it's still awesome! Keep up the good work! 😎












