AI của DeepMind vượt trội hơn các huy chương vàng IMO
AI mới nhất của Google DeepMind, Alphageometry2, đã tạo ra sóng bằng cách vượt trội hơn huy chương vàng trung bình trong việc giải quyết các vấn đề hình học tại Olympic toán học quốc tế (IMO). Phiên bản nâng cao này của phép đo bảng chữ cái được phát hành trước đó, được giới thiệu vào tháng 1 năm ngoái, được cho là đã giải quyết 84% vấn đề hình học từ 25 năm trước của các cuộc thi IMO.
Bạn có thể tự hỏi tại sao DeepMind tập trung vào một cuộc thi toán học trung học. Chà, họ tin rằng việc bẻ khóa các vấn đề hình học Euclide đầy thách thức này có thể là một bước đệm để phát triển AI tiên tiến hơn. Giải quyết các vấn đề này đòi hỏi cả lý luận logic và khả năng điều hướng qua các đường dẫn giải pháp khác nhau, các kỹ năng có thể rất quan trọng đối với các hệ thống AI đa năng trong tương lai.
Mùa hè này, DeepMind đã giới thiệu một hệ thống kết hợp Alphageometry2 với Alphaproof, một mô hình AI khác được thiết kế để lý luận toán học chính thức. Cùng nhau, họ đã giải quyết bốn trong số sáu vấn đề từ IMO năm 2024. Cách tiếp cận này có khả năng mở rộng ra ngoài hình học cho các lĩnh vực toán học và khoa học khác, như các tính toán kỹ thuật phức tạp.
Alphageometry2 được cung cấp bởi một vài thành phần chính, bao gồm mô hình ngôn ngữ từ gia đình Song Tử của Google và "động cơ tượng trưng". Mô hình Gemini hỗ trợ động cơ tượng trưng, áp dụng các quy tắc toán học để tìm các giải pháp, trong việc tạo ra các bằng chứng khả thi cho các định lý hình học.

Sơ đồ vấn đề hình học điển hình trong bài kiểm tra IMO. Tín dụng hình ảnh: Google (Mở trong một cửa sổ mới)
Trong IMO, các vấn đề về hình học thường yêu cầu thêm "các cấu trúc" như các điểm, đường hoặc vòng tròn vào sơ đồ trước khi giải quyết chúng. Mô hình Song Tử của Alphageometry2 dự đoán các cấu trúc nào có thể hữu ích, hướng dẫn động cơ tượng trưng để thực hiện các khoản khấu trừ.
Đây là cách nó hoạt động: Mô hình Gemini gợi ý các bước và cấu trúc bằng ngôn ngữ toán học chính thức, mà động cơ sau đó kiểm tra tính nhất quán logic. AlphageOmetry2 sử dụng thuật toán tìm kiếm để khám phá đồng thời nhiều đường dẫn giải pháp và lưu trữ những phát hiện có khả năng hữu ích trong một cơ sở kiến thức chung.
Một vấn đề được coi là "được giải quyết" khi Alphageometry2 kết hợp các đề xuất của mô hình Gemini với các nguyên tắc đã biết của động cơ tượng trưng để tạo thành một bằng chứng hoàn chỉnh.
Do sự khan hiếm của dữ liệu đào tạo hình học có thể sử dụng, DeepMind đã tạo ra dữ liệu tổng hợp để đào tạo mô hình ngôn ngữ của Alphageometry2, tạo ra hơn 300 triệu định lý và bằng chứng về độ phức tạp khác nhau.
Nhóm DeepMind đã thử nghiệm Alphageometry2 về 45 vấn đề hình học từ các cuộc thi IMO kéo dài từ năm 2000 đến 2024, họ đã mở rộng thành 50 vấn đề. Alphageometry2 đã giải quyết 42 trong số này, vượt qua điểm huy chương vàng trung bình là 40,9.
Tuy nhiên, Alphageometry2 có những hạn chế của nó. Nó đấu tranh với các vấn đề liên quan đến một số lượng điểm khác nhau, phương trình phi tuyến và bất bình đẳng. Mặc dù đây không phải là AI đầu tiên đạt được hiệu suất ở mức độ vàng trong hình học, nhưng đây là lần đầu tiên làm như vậy với một vấn đề lớn như vậy.
Khi phải đối mặt với một tập hợp khó khăn hơn 29 vấn đề được đề cử IMO chưa xuất hiện trong các cuộc thi, Alphageometry2 chỉ có thể giải quyết 20.
Kết quả của nghiên cứu có khả năng gây ra cuộc tranh luận thêm về cách tiếp cận tốt nhất để xây dựng các hệ thống AI. Chúng ta có nên tập trung vào thao tác biểu tượng, trong đó AI sử dụng các quy tắc để thao túng các biểu tượng đại diện cho kiến thức, hoặc trên các mạng lưới thần kinh, bắt chước cấu trúc của bộ não con người và học hỏi từ dữ liệu?
Alphageometry2 có một cách tiếp cận lai, kết hợp kiến trúc mạng thần kinh của mô hình Gemini với động cơ tượng trưng dựa trên quy tắc.
Những người ủng hộ mạng lưới thần kinh cho rằng hành vi thông minh có thể xuất hiện từ một lượng lớn dữ liệu và sức mạnh tính toán. Ngược lại, những người đề xuất AI tượng trưng tin rằng nó phù hợp hơn để mã hóa kiến thức, lý luận thông qua các kịch bản phức tạp và giải thích các giải pháp.
Vince Conitzer, giáo sư khoa học máy tính của Đại học Carnegie Mellon chuyên về AI, đã nhận xét về sự tương phản giữa những tiến bộ ấn tượng về các điểm chuẩn như IMO và các mô hình ngôn ngữ đang diễn ra với các vấn đề đơn giản. Ông nhấn mạnh sự cần thiết phải hiểu rõ hơn về các hệ thống này và những rủi ro mà chúng gây ra.
Alphageometry2 cho thấy rằng việc kết hợp thao tác biểu tượng và mạng lưới thần kinh có thể là một cách đầy hứa hẹn trong cuộc tìm kiếm AI tổng quát. Điều thú vị là, nhóm DeepMind nhận thấy rằng mô hình ngôn ngữ của Alphageometry2 có thể tạo ra các giải pháp một phần cho các vấn đề mà không cần sự trợ giúp của động cơ tượng trưng, gợi ý về tiềm năng cho các mô hình ngôn ngữ tự lập trong tương lai.
Tuy nhiên, nhóm lưu ý rằng cho đến khi tốc độ mô hình ngôn ngữ được cải thiện và ảo giác được giải quyết, các công cụ như động cơ tượng trưng sẽ vẫn cần thiết cho các ứng dụng toán học.
Bài viết liên quan
억만장자들이 이번 주 AI 업데이트에서 일자리 자동화에 대해 논의하다
안녕하세요, TechCrunch의 AI 뉴스레터에 다시 오신 것을 환영합니다! 아직 구독하지 않으셨다면, 매주 수요일마다 받은 편지함으로 바로 배달받을 수 있도록 여기를 클릭해 구독하세요.지난주에는 잠시 쉬었지만, 그럴만한 이유가 있었습니다—중국의 AI 회사 DeepSeek의 갑작스러운 급부상 덕분에 AI 뉴스 사이클이 뜨거웠습니다. 정신없는 시간이였지만,
NotebookLM 앱 출시: AI 기반 지식 도구
NotebookLM 모바일 출시: 이제 Android와 iOS에서 만나는 AI 연구 보조 도구NotebookLM에 대한 여러분의 뜨거운 반응에 깊이 감사드립니다. 수백만 사용자가 복잡한 정보를 이해하는 필수 도구로 NotebookLM을 선택해주셨습니다. 하지만 가장 많이 받은 요청은 바로 "언제 모바일에서 사용할 수 있나
Imagen 4: 구글 최신 AI 이미지 생성기
구글이 최신 이미지 생성 AI 모델 '이마젠 4(Imagen 4)'를 공개하며 전작 대비 향상된 시각적 경험을 약속했습니다. 이번 주 초 구글 I/O 2025에서 발표된 이 신형 모델은 품질과 다용도성 측면에서 큰 도약으로 평가받고 있습니다. 구글에 따르면 이마젠 4는 직물 표면, 물방울, 동물 털 같은 정교한 디테일 구
Nhận xét (25)
0/200
HarryPerez
00:00:00 GMT Ngày 12 tháng 4 năm 2025
DeepMind's AlphaGeometry2 beating IMO gold medalists is mind-blowing! It's amazing to see AI tackling such complex problems. But, does it really understand geometry, or is it just pattern matching? Either way, it's a huge step forward for AI in education!
0
JackSanchez
00:00:00 GMT Ngày 12 tháng 4 năm 2025
DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて驚きです!AIがこんなに複雑な問題に取り組むのを見るのは素晴らしいです。でも、本当に幾何学を理解しているのか、それともただのパターンマッチングなのか?どちらにしても、教育におけるAIの大きな一歩ですね!
0
HenryJackson
00:00:00 GMT Ngày 11 tháng 4 năm 2025
DeepMind의 AlphaGeometry2가 IMO 금메달리스트를 능가하다니 놀랍네요! AI가 이렇게 복잡한 문제를 다루는 걸 보는 건 정말 멋져요. 하지만 정말 기하학을 이해하는 건지, 아니면 단순히 패턴 매칭을 하는 건지 궁금해요. 어쨌든 교육에서의 AI 발전에 큰 걸음이에요!
0
HarryRoberts
00:00:00 GMT Ngày 11 tháng 4 năm 2025
O AlphaGeometry2 da DeepMind superar os medalhistas de ouro do IMO é impressionante! É incrível ver a IA lidando com problemas tão complexos. Mas, será que ela realmente entende geometria, ou é apenas correspondência de padrões? De qualquer forma, é um grande avanço para a IA na educação!
0
BillyRoberts
00:00:00 GMT Ngày 10 tháng 4 năm 2025
¡Que AlphaGeometry2 de DeepMind supere a los medallistas de oro del IMO es alucinante! Es increíble ver a la IA abordando problemas tan complejos. Pero, ¿realmente entiende la geometría, o solo está haciendo coincidencia de patrones? De cualquier manera, es un gran paso adelante para la IA en la educación!
0
AlbertHarris
00:00:00 GMT Ngày 14 tháng 4 năm 2025
DeepMind's AlphaGeometry2 is mind-blowing! It's solving geometry problems better than IMO gold medalists. I used it to help with my math homework and it was spot on! The only thing is, it's a bit too advanced for casual users like me. Still, it's a solid 4 out of 5. 📚
0
AI mới nhất của Google DeepMind, Alphageometry2, đã tạo ra sóng bằng cách vượt trội hơn huy chương vàng trung bình trong việc giải quyết các vấn đề hình học tại Olympic toán học quốc tế (IMO). Phiên bản nâng cao này của phép đo bảng chữ cái được phát hành trước đó, được giới thiệu vào tháng 1 năm ngoái, được cho là đã giải quyết 84% vấn đề hình học từ 25 năm trước của các cuộc thi IMO.
Bạn có thể tự hỏi tại sao DeepMind tập trung vào một cuộc thi toán học trung học. Chà, họ tin rằng việc bẻ khóa các vấn đề hình học Euclide đầy thách thức này có thể là một bước đệm để phát triển AI tiên tiến hơn. Giải quyết các vấn đề này đòi hỏi cả lý luận logic và khả năng điều hướng qua các đường dẫn giải pháp khác nhau, các kỹ năng có thể rất quan trọng đối với các hệ thống AI đa năng trong tương lai.
Mùa hè này, DeepMind đã giới thiệu một hệ thống kết hợp Alphageometry2 với Alphaproof, một mô hình AI khác được thiết kế để lý luận toán học chính thức. Cùng nhau, họ đã giải quyết bốn trong số sáu vấn đề từ IMO năm 2024. Cách tiếp cận này có khả năng mở rộng ra ngoài hình học cho các lĩnh vực toán học và khoa học khác, như các tính toán kỹ thuật phức tạp.
Alphageometry2 được cung cấp bởi một vài thành phần chính, bao gồm mô hình ngôn ngữ từ gia đình Song Tử của Google và "động cơ tượng trưng". Mô hình Gemini hỗ trợ động cơ tượng trưng, áp dụng các quy tắc toán học để tìm các giải pháp, trong việc tạo ra các bằng chứng khả thi cho các định lý hình học.
Trong IMO, các vấn đề về hình học thường yêu cầu thêm "các cấu trúc" như các điểm, đường hoặc vòng tròn vào sơ đồ trước khi giải quyết chúng. Mô hình Song Tử của Alphageometry2 dự đoán các cấu trúc nào có thể hữu ích, hướng dẫn động cơ tượng trưng để thực hiện các khoản khấu trừ.
Đây là cách nó hoạt động: Mô hình Gemini gợi ý các bước và cấu trúc bằng ngôn ngữ toán học chính thức, mà động cơ sau đó kiểm tra tính nhất quán logic. AlphageOmetry2 sử dụng thuật toán tìm kiếm để khám phá đồng thời nhiều đường dẫn giải pháp và lưu trữ những phát hiện có khả năng hữu ích trong một cơ sở kiến thức chung.
Một vấn đề được coi là "được giải quyết" khi Alphageometry2 kết hợp các đề xuất của mô hình Gemini với các nguyên tắc đã biết của động cơ tượng trưng để tạo thành một bằng chứng hoàn chỉnh.
Do sự khan hiếm của dữ liệu đào tạo hình học có thể sử dụng, DeepMind đã tạo ra dữ liệu tổng hợp để đào tạo mô hình ngôn ngữ của Alphageometry2, tạo ra hơn 300 triệu định lý và bằng chứng về độ phức tạp khác nhau.
Nhóm DeepMind đã thử nghiệm Alphageometry2 về 45 vấn đề hình học từ các cuộc thi IMO kéo dài từ năm 2000 đến 2024, họ đã mở rộng thành 50 vấn đề. Alphageometry2 đã giải quyết 42 trong số này, vượt qua điểm huy chương vàng trung bình là 40,9.
Tuy nhiên, Alphageometry2 có những hạn chế của nó. Nó đấu tranh với các vấn đề liên quan đến một số lượng điểm khác nhau, phương trình phi tuyến và bất bình đẳng. Mặc dù đây không phải là AI đầu tiên đạt được hiệu suất ở mức độ vàng trong hình học, nhưng đây là lần đầu tiên làm như vậy với một vấn đề lớn như vậy.
Khi phải đối mặt với một tập hợp khó khăn hơn 29 vấn đề được đề cử IMO chưa xuất hiện trong các cuộc thi, Alphageometry2 chỉ có thể giải quyết 20.
Kết quả của nghiên cứu có khả năng gây ra cuộc tranh luận thêm về cách tiếp cận tốt nhất để xây dựng các hệ thống AI. Chúng ta có nên tập trung vào thao tác biểu tượng, trong đó AI sử dụng các quy tắc để thao túng các biểu tượng đại diện cho kiến thức, hoặc trên các mạng lưới thần kinh, bắt chước cấu trúc của bộ não con người và học hỏi từ dữ liệu?
Alphageometry2 có một cách tiếp cận lai, kết hợp kiến trúc mạng thần kinh của mô hình Gemini với động cơ tượng trưng dựa trên quy tắc.
Những người ủng hộ mạng lưới thần kinh cho rằng hành vi thông minh có thể xuất hiện từ một lượng lớn dữ liệu và sức mạnh tính toán. Ngược lại, những người đề xuất AI tượng trưng tin rằng nó phù hợp hơn để mã hóa kiến thức, lý luận thông qua các kịch bản phức tạp và giải thích các giải pháp.
Vince Conitzer, giáo sư khoa học máy tính của Đại học Carnegie Mellon chuyên về AI, đã nhận xét về sự tương phản giữa những tiến bộ ấn tượng về các điểm chuẩn như IMO và các mô hình ngôn ngữ đang diễn ra với các vấn đề đơn giản. Ông nhấn mạnh sự cần thiết phải hiểu rõ hơn về các hệ thống này và những rủi ro mà chúng gây ra.
Alphageometry2 cho thấy rằng việc kết hợp thao tác biểu tượng và mạng lưới thần kinh có thể là một cách đầy hứa hẹn trong cuộc tìm kiếm AI tổng quát. Điều thú vị là, nhóm DeepMind nhận thấy rằng mô hình ngôn ngữ của Alphageometry2 có thể tạo ra các giải pháp một phần cho các vấn đề mà không cần sự trợ giúp của động cơ tượng trưng, gợi ý về tiềm năng cho các mô hình ngôn ngữ tự lập trong tương lai.
Tuy nhiên, nhóm lưu ý rằng cho đến khi tốc độ mô hình ngôn ngữ được cải thiện và ảo giác được giải quyết, các công cụ như động cơ tượng trưng sẽ vẫn cần thiết cho các ứng dụng toán học.




DeepMind's AlphaGeometry2 beating IMO gold medalists is mind-blowing! It's amazing to see AI tackling such complex problems. But, does it really understand geometry, or is it just pattern matching? Either way, it's a huge step forward for AI in education!




DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて驚きです!AIがこんなに複雑な問題に取り組むのを見るのは素晴らしいです。でも、本当に幾何学を理解しているのか、それともただのパターンマッチングなのか?どちらにしても、教育におけるAIの大きな一歩ですね!




DeepMind의 AlphaGeometry2가 IMO 금메달리스트를 능가하다니 놀랍네요! AI가 이렇게 복잡한 문제를 다루는 걸 보는 건 정말 멋져요. 하지만 정말 기하학을 이해하는 건지, 아니면 단순히 패턴 매칭을 하는 건지 궁금해요. 어쨌든 교육에서의 AI 발전에 큰 걸음이에요!




O AlphaGeometry2 da DeepMind superar os medalhistas de ouro do IMO é impressionante! É incrível ver a IA lidando com problemas tão complexos. Mas, será que ela realmente entende geometria, ou é apenas correspondência de padrões? De qualquer forma, é um grande avanço para a IA na educação!




¡Que AlphaGeometry2 de DeepMind supere a los medallistas de oro del IMO es alucinante! Es increíble ver a la IA abordando problemas tan complejos. Pero, ¿realmente entiende la geometría, o solo está haciendo coincidencia de patrones? De cualquier manera, es un gran paso adelante para la IA en la educación!




DeepMind's AlphaGeometry2 is mind-blowing! It's solving geometry problems better than IMO gold medalists. I used it to help with my math homework and it was spot on! The only thing is, it's a bit too advanced for casual users like me. Still, it's a solid 4 out of 5. 📚












