DeepMindのAIはIMOの金メダリストを上回ります
Google DeepMindの最新AI、AlphaGeometry2は、国際数学オリンピック(IMO)の幾何学問題解決において、平均的な金メダリストを上回る成果を上げ、注目を集めています。この昨年1月に発表されたAlphaGeometryの進化版は、過去25年間のIMO競技の幾何学問題の84%を解いたと報告されています。
なぜDeepMindが高校の数学コンテストに注力しているのか疑問に思うかもしれません。彼らは、これらの挑戦的なユークリッド幾何学問題を解くことが、より高度なAI開発への足がかりになると考えています。これらの問題を解くには論理的推論と複数の解決経路を進む能力が必要であり、将来の汎用AIシステムにとって重要なスキルとなる可能性があります。
この夏、DeepMindはAlphaGeometry2と、形式的な数学推論のために設計されたもう一つのAIモデルAlphaProofを組み合わせたシステムを披露しました。このシステムは、2024年IMOの6問中4問を解決しました。このアプローチは、幾何学を超えて、複雑な工学計算など他の数学や科学の分野にも拡張される可能性があります。
AlphaGeometry2は、GoogleのGeminiファミリーの言語モデルと「シンボリックエンジン」を含むいくつかの主要コンポーネントで動作します。Geminiモデルは、数学的ルールを適用して解を見つけるシンボリックエンジンを支援し、幾何学定理の実行可能な証明を作成します。

IMO試験の典型的な幾何学問題の図形。画像提供:Google(新しいウィンドウで開く) IMOでは、幾何学問題を解く前に、点、線、円などの「構成要素」を図形に追加することがよく求められます。AlphaGeometry2のGeminiモデルは、どの構成要素が役立つかを予測し、シンボリックエンジンが推論を行うのを導きます。
その仕組みは次のとおりです:Geminiモデルは、形式的な数学言語でステップや構成要素を提案し、エンジンはそれらの論理的一貫性を確認します。AlphaGeometry2は、検索アルゴリズムを使用して複数の解決経路を同時に探索し、潜在的に有用な発見を共有知識ベースに保存します。
問題は、AlphaGeometry2がGeminiモデルの提案とシンボリックエンジンの既知の原理を組み合わせて完全な証明を形成したときに「解決済み」と見なされます。
利用可能な幾何学トレーニングデータの不足のため、DeepMindはAlphaGeometry2の言語モデルを訓練するために、3億を超えるさまざまな複雑さの定理と証明を生成する合成データを作成しました。
DeepMindチームは、2000年から2024年までのIMO競技の45の幾何学問題を拡張して50の問題にし、AlphaGeometry2をテストしました。AlphaGeometry2はこれらのうち42を解き、平均金メダリストのスコア40.9を上回りました。
しかし、AlphaGeometry2には限界があります。点の数が変動する問題、非線形方程式、不等式に関する問題には苦戦します。幾何学で金メダルレベルの性能を達成した最初のAIではありませんが、これほど多くの問題セットで達成したのは初めてです。
まだ競技に登場していない29のIMO推薦問題のより難しいセットに直面したとき、AlphaGeometry2は20しか解けませんでした。
この研究の結果は、AIシステム構築の最適なアプローチについてのさらなる議論を引き起こす可能性があります。知識を表すシンボルを操作するルールを使用するシンボル操作に焦点を当てるべきか、ヒトの脳の構造を模倣しデータから学習するニューラルネットワークに焦点を当てるべきか?
AlphaGeometry2は、Geminiモデルのニューラルネットワークアーキテクチャとルールベースのシンボリックエンジンを組み合わせたハイブリッドアプローチを採用しています。
ニューラルネットワークの支持者は、膨大なデータと計算能力から知的な行動が生まれると主張します。一方、シンボリックAIの支持者は、知識のエンコード、複雑なシナリオの推論、解決策の説明に適していると信じています。
カーネギーメロン大学のコンピュータサイエンス教授でAIを専門とするビンス・コンイツァー氏は、IMOのようなベンチマークでの印象的な進歩と、言語モデルが単純な常識問題に依然として苦戦していることの対比についてコメントしました。彼は、これらのシステムとそのリスクをよりよく理解する必要性を強調しました。
AlphaGeometry2は、シンボル操作とニューラルネットワークの組み合わせが、汎用AIへの有望な道であることを示唆しています。興味深いことに、DeepMindチームは、AlphaGeometry2の言語モデルがシンボリックエンジンの助けなしに問題の部分的な解決策を生成できることを発見し、将来、言語モデルが自立する可能性を示唆しています。
しかし、チームは、言語モデルの速度が向上し、幻覚が解決されるまで、シンボリックエンジンのようなツールは数学アプリケーションに不可欠であると述べました。
関連記事
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示
カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
関連特集おすすめ
コメント (34)
0/500
C'est impressionnant de voir à quelle vitesse AlphaGeometry2 a été développé après la première version ! 😮 Mais je me demande comment cela se traduirait dans le monde réel, au-delà des compétitions. Peut-être pour la conception d'algorithmes complexes ? Cela donne aussi un peu peur pour l'avenir des métiers très spécialisés...
AlphaGeometry2って前回のバージョンからかなり進化してるんですね。IMO金メダリストを超えるって凄すぎる😳 でもこれがどんどん研究が進んで、いずれ人間が解けない問題もAIが解く時代が来るのかな?ちょっと怖いかも
Impressionnant mais un peu flippant... Si une IA peut battre des médaillés d'or aux Olympiades, qu'est-ce qui nous reste comme domaines où les humains sont encore les meilleurs ? 😅 J'espère qu'on va pas tous devenir obsolètes !
This AI beating IMO champs is wild! 🧠 Geometry’s tough, but AlphaGeometry2’s out here crushing it. Makes me wonder if it’ll start tutoring kids soon! 😄
Google DeepMindの最新AI、AlphaGeometry2は、国際数学オリンピック(IMO)の幾何学問題解決において、平均的な金メダリストを上回る成果を上げ、注目を集めています。この昨年1月に発表されたAlphaGeometryの進化版は、過去25年間のIMO競技の幾何学問題の84%を解いたと報告されています。
なぜDeepMindが高校の数学コンテストに注力しているのか疑問に思うかもしれません。彼らは、これらの挑戦的なユークリッド幾何学問題を解くことが、より高度なAI開発への足がかりになると考えています。これらの問題を解くには論理的推論と複数の解決経路を進む能力が必要であり、将来の汎用AIシステムにとって重要なスキルとなる可能性があります。
この夏、DeepMindはAlphaGeometry2と、形式的な数学推論のために設計されたもう一つのAIモデルAlphaProofを組み合わせたシステムを披露しました。このシステムは、2024年IMOの6問中4問を解決しました。このアプローチは、幾何学を超えて、複雑な工学計算など他の数学や科学の分野にも拡張される可能性があります。
AlphaGeometry2は、GoogleのGeminiファミリーの言語モデルと「シンボリックエンジン」を含むいくつかの主要コンポーネントで動作します。Geminiモデルは、数学的ルールを適用して解を見つけるシンボリックエンジンを支援し、幾何学定理の実行可能な証明を作成します。

IMOでは、幾何学問題を解く前に、点、線、円などの「構成要素」を図形に追加することがよく求められます。AlphaGeometry2のGeminiモデルは、どの構成要素が役立つかを予測し、シンボリックエンジンが推論を行うのを導きます。
その仕組みは次のとおりです:Geminiモデルは、形式的な数学言語でステップや構成要素を提案し、エンジンはそれらの論理的一貫性を確認します。AlphaGeometry2は、検索アルゴリズムを使用して複数の解決経路を同時に探索し、潜在的に有用な発見を共有知識ベースに保存します。
問題は、AlphaGeometry2がGeminiモデルの提案とシンボリックエンジンの既知の原理を組み合わせて完全な証明を形成したときに「解決済み」と見なされます。
利用可能な幾何学トレーニングデータの不足のため、DeepMindはAlphaGeometry2の言語モデルを訓練するために、3億を超えるさまざまな複雑さの定理と証明を生成する合成データを作成しました。
DeepMindチームは、2000年から2024年までのIMO競技の45の幾何学問題を拡張して50の問題にし、AlphaGeometry2をテストしました。AlphaGeometry2はこれらのうち42を解き、平均金メダリストのスコア40.9を上回りました。
しかし、AlphaGeometry2には限界があります。点の数が変動する問題、非線形方程式、不等式に関する問題には苦戦します。幾何学で金メダルレベルの性能を達成した最初のAIではありませんが、これほど多くの問題セットで達成したのは初めてです。
まだ競技に登場していない29のIMO推薦問題のより難しいセットに直面したとき、AlphaGeometry2は20しか解けませんでした。
この研究の結果は、AIシステム構築の最適なアプローチについてのさらなる議論を引き起こす可能性があります。知識を表すシンボルを操作するルールを使用するシンボル操作に焦点を当てるべきか、ヒトの脳の構造を模倣しデータから学習するニューラルネットワークに焦点を当てるべきか?
AlphaGeometry2は、Geminiモデルのニューラルネットワークアーキテクチャとルールベースのシンボリックエンジンを組み合わせたハイブリッドアプローチを採用しています。
ニューラルネットワークの支持者は、膨大なデータと計算能力から知的な行動が生まれると主張します。一方、シンボリックAIの支持者は、知識のエンコード、複雑なシナリオの推論、解決策の説明に適していると信じています。
カーネギーメロン大学のコンピュータサイエンス教授でAIを専門とするビンス・コンイツァー氏は、IMOのようなベンチマークでの印象的な進歩と、言語モデルが単純な常識問題に依然として苦戦していることの対比についてコメントしました。彼は、これらのシステムとそのリスクをよりよく理解する必要性を強調しました。
AlphaGeometry2は、シンボル操作とニューラルネットワークの組み合わせが、汎用AIへの有望な道であることを示唆しています。興味深いことに、DeepMindチームは、AlphaGeometry2の言語モデルがシンボリックエンジンの助けなしに問題の部分的な解決策を生成できることを発見し、将来、言語モデルが自立する可能性を示唆しています。
しかし、チームは、言語モデルの速度が向上し、幻覚が解決されるまで、シンボリックエンジンのようなツールは数学アプリケーションに不可欠であると述べました。
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
C'est impressionnant de voir à quelle vitesse AlphaGeometry2 a été développé après la première version ! 😮 Mais je me demande comment cela se traduirait dans le monde réel, au-delà des compétitions. Peut-être pour la conception d'algorithmes complexes ? Cela donne aussi un peu peur pour l'avenir des métiers très spécialisés...
AlphaGeometry2って前回のバージョンからかなり進化してるんですね。IMO金メダリストを超えるって凄すぎる😳 でもこれがどんどん研究が進んで、いずれ人間が解けない問題もAIが解く時代が来るのかな?ちょっと怖いかも
Impressionnant mais un peu flippant... Si une IA peut battre des médaillés d'or aux Olympiades, qu'est-ce qui nous reste comme domaines où les humains sont encore les meilleurs ? 😅 J'espère qu'on va pas tous devenir obsolètes !
This AI beating IMO champs is wild! 🧠 Geometry’s tough, but AlphaGeometry2’s out here crushing it. Makes me wonder if it’ll start tutoring kids soon! 😄





家






