GoogleのAI研究所DeepMindが開発したAIシステムが、国際数学オリンピック(IMO)の金メダリストより優れた成果を上げたことが報じられています。このシステムは「AlphaGeometry2」と呼ばれ、昨年1月に発表された旧バージョンの「AlphaGeometry」の進化版です。最新の研究によると、AlphaGeometry2は過去25年間の国際数学オリンピックの幾何学問題の84%を解く能力を持っているとされています。

なぜDeepMindは高校レベルの数学コンペティションに注目するのでしょうか。彼らの答えは新しいAIの開発にあるといいます。特に、幾何学問題を解決する新しい方法を探求することが、今後のAIモデルにとって鍵となると彼らは考えています。数学的な定理を証明することは、論理的な推論を含むため、今後のAIモデルにとって不可欠なスキルとなるでしょう。
前夏、DeepMindはAlphaGeometry2と形式的数学推論のAIモデル「AlphaProof」を組み合わせ、2024年のIMOからの問題の一部を解決しました。数学や科学の他の領域にも応用できる可能性がある手法です。AlphaGeometry2の中心的な要素には、GoogleのGemini AIモデルと「シンボリックエンジン」が含まれており、数学ルールを用いて問題の解決を推論します。
IMOの幾何学問題は、解くために図に補助的な「構造物」を加える必要があるという特性があります。AlphaGeometry2は、どの構造物が役立つかを予測し、エンジンによる推論を行います。具体的には、Geminiモデルが形式的な数学的言語で手順を提案し、エンジンがそれに従って論理的整合性をチェックします。これにより、AIは平行に解決策を探索し、得られた知見を共通の知識ベースに蓄積します。
問題が「解決された」と判断されるのは、Geminiモデルの提案とシンボリックエンジンの原則が統合された証明を導き出した場合です。DeepMindは自ら300以上の複雑さを持つ定理と証明を生成し、AlphaGeometry2の言語モデルをトレーニングします。過去25年間のIMOの幾何学問題45題を選び、それに基づいてさらに50の問題を生成しました。結果、AlphaGeometry2は50題の問題のうち42題を解決し、金メダリストの平均得点を上回るスコアを達成しました。
ただし、制約も存在します。技術的な制約により、AlphaGeometry2は可変数の点や非線形方程式、不等式の問題を解けないことがあるため、全ての問題に対して金メダルレベルのパフォーマンスを発揮するわけではありません。しかし、その研究成果は、AIシステムにおけるシンボル操作と視覚的な神経ネットワークの融合についての議論を活性化させるでしょう。AlphaGeometry2は、神経ネットワークのアーキテクチャと、ルールベースのシンボリックエンジンを組み合わせたHybridアプローチをとっています。
これにより、AIは特定のタスクを定義したルールを基に処理するだけでなく、膨大なデータから学ぶことで、より人間らしい思考を実現可能へと近づいています。DeepMindのチームは、AlphaGeometry2の言語モデルがシンボリックエンジンを用いなくとも部分的な解を生成できる可能性を発見したとしています。この進展は、今後のAIにおける道筋を示唆しています。AIがいかに複雑な課題を解決できるのか、そしてそれが私たちの未来にいかなる影響を与えるのか、今後の研究に期待が寄せられます。