lựa chọn
Trang chủ
Tin tức
AI của DeepMind vượt trội hơn các huy chương vàng IMO

AI của DeepMind vượt trội hơn các huy chương vàng IMO

Ngày 10 tháng 4 năm 2025
110

AI mới nhất của Google DeepMind, AlphaGeometry2, đã gây chú ý khi vượt trội hơn thí sinh trung bình đạt huy chương vàng trong việc giải các bài toán hình học tại Kỳ thi Olympic Toán học Quốc tế (IMO). Phiên bản nâng cấp của AlphaGeometry, được giới thiệu vào tháng 1 vừa qua, đã giải được 84% bài toán hình học từ các kỳ thi IMO trong 25 năm qua.

Bạn có thể tự hỏi tại sao DeepMind lại tập trung vào một cuộc thi toán học cấp trung học. Họ tin rằng việc giải các bài toán hình học Euclide đầy thách thức này có thể là bước đệm để phát triển AI tiên tiến hơn. Giải các bài toán này đòi hỏi cả tư duy logic và khả năng điều hướng qua các con đường giải pháp khác nhau, những kỹ năng quan trọng cho các hệ thống AI đa năng trong tương lai.

Mùa hè này, DeepMind đã giới thiệu hệ thống kết hợp AlphaGeometry2 với AlphaProof, một mô hình AI khác được thiết kế cho tư duy toán học chính quy. Cùng nhau, họ đã giải được bốn trong sáu bài toán từ IMO 2024. Cách tiếp cận này có thể mở rộng ra ngoài hình học sang các lĩnh vực toán học và khoa học khác, như các phép tính kỹ thuật phức tạp.

AlphaGeometry2 được cung cấp bởi một số thành phần chính, bao gồm mô hình ngôn ngữ từ gia đình Gemini của Google và một "cỗ máy biểu tượng." Mô hình Gemini hỗ trợ cỗ máy biểu tượng, áp dụng các quy tắc toán học để tìm giải pháp, trong việc tạo ra các chứng minh khả thi cho các định lý hình học.

Một sơ đồ hình học điển hình trong IMO.

Sơ đồ bài toán hình học điển hình trong kỳ thi IMO. Tín dụng hình ảnh: Google (mở trong cửa sổ mới)

Trong IMO, các bài toán hình học thường yêu cầu thêm các "cấu trúc" như điểm, đường thẳng hoặc đường tròn vào sơ đồ trước khi giải. Mô hình Gemini của AlphaGeometry2 dự đoán cấu trúc nào có thể hữu ích, hướng dẫn cỗ máy biểu tượng đưa ra các suy luận.

Cách hoạt động: Mô hình Gemini đề xuất các bước và cấu trúc bằng ngôn ngữ toán học chính quy, sau đó cỗ máy kiểm tra tính nhất quán logic. AlphaGeometry2 sử dụng thuật toán tìm kiếm để khám phá nhiều con đường giải pháp đồng thời và lưu trữ các phát hiện tiềm năng trong một cơ sở tri thức chung.

Một bài toán được coi là "giải được" khi AlphaGeometry2 kết hợp các gợi ý của mô hình Gemini với các nguyên tắc đã biết của cỗ máy biểu tượng để tạo thành một chứng minh hoàn chỉnh.

Do khan hiếm dữ liệu huấn luyện hình học có thể sử dụng, DeepMind đã tạo dữ liệu tổng hợp để huấn luyện mô hình ngôn ngữ của AlphaGeometry2, tạo ra hơn 300 triệu định lý và chứng minh với độ phức tạp khác nhau.

Nhóm DeepMind đã thử nghiệm AlphaGeometry2 trên 45 bài toán hình học từ các kỳ thi IMO từ năm 2000 đến 2024, mở rộng thành 50 bài. AlphaGeometry2 giải được 42 bài, vượt qua điểm trung bình của huy chương vàng là 40.9.

Tuy nhiên, AlphaGeometry2 có hạn chế. Nó gặp khó khăn với các bài toán liên quan đến số lượng điểm thay đổi, phương trình phi tuyến và bất đẳng thức. Mặc dù không phải là AI đầu tiên đạt hiệu suất cấp huy chương vàng trong hình học, nhưng nó là AI đầu tiên làm được điều này với bộ bài toán lớn như vậy.

Khi đối mặt với bộ 29 bài toán được đề cử cho IMO nhưng chưa xuất hiện trong các kỳ thi, AlphaGeometry2 chỉ giải được 20 bài.

Kết quả nghiên cứu có thể sẽ khơi mào thêm tranh luận về cách tiếp cận tốt nhất để xây dựng hệ thống AI. Nên tập trung vào thao tác biểu tượng, nơi AI sử dụng quy tắc để xử lý các biểu tượng đại diện cho tri thức, hay vào mạng nơ-ron, mô phỏng cấu trúc não người và học từ dữ liệu?

AlphaGeometry2 áp dụng cách tiếp cận lai, kết hợp kiến trúc mạng nơ-ron của mô hình Gemini với cỗ máy biểu tượng dựa trên quy tắc.

Những người ủng hộ mạng nơ-ron cho rằng hành vi thông minh có thể xuất hiện từ lượng dữ liệu khổng lồ và sức mạnh tính toán. Ngược lại, những người ủng hộ AI biểu tượng tin rằng nó phù hợp hơn để mã hóa tri thức, suy luận qua các tình huống phức tạp và giải thích giải pháp.

Vince Conitzer, giáo sư khoa học máy tính tại Đại học Carnegie Mellon chuyên về AI, đã bình luận về sự tương phản giữa tiến bộ ấn tượng trên các chuẩn mực như IMO và những khó khăn dai dẳng của các mô hình ngôn ngữ với các vấn đề thông thường đơn giản. Ông nhấn mạnh sự cần thiết phải hiểu rõ hơn về các hệ thống này và những rủi ro mà chúng đặt ra.

AlphaGeometry2 cho thấy việc kết hợp thao tác biểu tượng và mạng nơ-ron có thể là một hướng đi đầy hứa hẹn trong việc tìm kiếm AI tổng quát. Điều thú vị là nhóm DeepMind phát hiện ra rằng mô hình ngôn ngữ của AlphaGeometry2 có thể tạo ra các giải pháp một phần cho các bài toán mà không cần sự hỗ trợ của cỗ máy biểu tượng, gợi ý về tiềm năng tự chủ của các mô hình ngôn ngữ trong tương lai.

Tuy nhiên, nhóm nghiên cứu lưu ý rằng cho đến khi tốc độ của mô hình ngôn ngữ được cải thiện và vấn đề ảo giác được giải quyết, các công cụ như cỗ máy biểu tượng sẽ vẫn thiết yếu cho các ứng dụng toán học.

Bài viết liên quan
Google Cam Kết Với Quy Tắc Thực Hành AI của EU Giữa Lúc Ngành Công Nghiệp Thảo Luận Google Cam Kết Với Quy Tắc Thực Hành AI của EU Giữa Lúc Ngành Công Nghiệp Thảo Luận Google đã cam kết áp dụng quy tắc thực hành AI tự nguyện của Liên minh Châu Âu, một khung công tác được thiết kế để hỗ trợ các nhà phát triển AI tuân thủ Đạo luật AI của EU bằng cách triển khai các qu
Google Ra Mắt Các Mô Hình AI Gemini 2.5 Sẵn Sàng Sản Xuất để Cạnh Tranh với OpenAI trên Thị Trường Doanh Nghiệp Google Ra Mắt Các Mô Hình AI Gemini 2.5 Sẵn Sàng Sản Xuất để Cạnh Tranh với OpenAI trên Thị Trường Doanh Nghiệp Google tăng cường chiến lược AI vào thứ Hai, ra mắt các mô hình Gemini 2.5 tiên tiến cho doanh nghiệp và giới thiệu biến thể tiết kiệm chi phí để cạnh tranh về giá và hiệu suất.Công ty thuộc sở hữu củ
Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao Meta đã phát hành các công cụ bảo mật Llama mới để thúc đẩy phát triển AI và bảo vệ chống lại các mối đe dọa mới nổi.Các công cụ bảo mật mô hình AI Llama nâng cấp này được kết hợp với các tài nguyên m
Nhận xét (27)
0/200
AlbertSmith
AlbertSmith 04:00:59 GMT+07:00 Ngày 10 tháng 8 năm 2025

Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮

JackCarter
JackCarter 09:13:31 GMT+07:00 Ngày 28 tháng 7 năm 2025

This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.

LarryMartin
LarryMartin 16:52:37 GMT+07:00 Ngày 20 tháng 4 năm 2025

AlphaGeometry2는 정말 놀랍네요! IMO 기하 문제를 금메달리스트보다 더 잘 풀어요. 하지만 저는 수학 천재가 아니라서 마술 쇼를 보는 기분이에요. 좀 더 이해할 수 있으면 좋겠어요! 🤯

JerryGonzález
JerryGonzález 06:58:03 GMT+07:00 Ngày 17 tháng 4 năm 2025

DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて信じられない!まるでAIが人間より賢いSF映画を見ているよう。でも本当に、私の宿題を手伝ってくれるのかな?😂

RaymondBaker
RaymondBaker 18:21:57 GMT+07:00 Ngày 16 tháng 4 năm 2025

AlphaGeometry2 is mind-blowing! It's solving IMO geometry problems better than gold medalists. But I'm no math whiz, so it's more like watching a magic show for me. Wish I could understand it better! 🤯

JonathanAllen
JonathanAllen 15:15:26 GMT+07:00 Ngày 16 tháng 4 năm 2025

AlphaGeometry2 é impressionante! Resolve problemas de geometria do IMO melhor que medalhistas de ouro. Mas eu não sou um gênio em matemática, então pra mim é como assistir a um show de mágica. Queria entender melhor! 🤯

Quay lại đầu
OR