ディープマインド、大規模言語モデルで数学の未解決問題を解く

Google DeepMind used a large language model to solve an unsolvable math problem ディープマインド、大規模言語モデルで数学の未解決問題を解く

グーグル・ディープマインドは、大規模言語モデル(LLM)で純粋数学の有名な未解決問題を解くことに成功したと発表した。LLMが、訓練データに含まれない未知の解を導き出すことに成功した例になる。 by Will Douglas Heaven2023.12.19

グーグル・ディープマインド(Google DeepMind)が大規模言語モデルを使用し、純粋数学の有名な未解決問題を解いた。研究チームは、2023年12月14日付でネイチャー誌に掲載された論文の中で、「長年の科学的パズルの解を発見するために大規模言語モデルが使用されたのは初めてのことであり、以前は存在しなかった検証可能な価値ある新情報を生み出すことができました」と述べている。「得られた解は訓練データには含まれておらず、これまで知られてもいませんでした」と、論文の共著者であるグーグル・ディープマインドの研究担当副社長、プッシュミート・コーリーは言う。

大規模言語モデルは、新しい事実を提供するのではなく、物事をでっち上げることで定評がある。グーグル・ディープマインドの新ツールである「ファンサーチ(FunSearch)」は、この状況を変えるかもしれない。今回の成果は、大規模言語モデルが本当に発見をすることも可能であることを示唆している。ただし、うまく誘導しなければならず、モデルが思いつく内容の大半は捨て去る必要がある。

ファンサーチ(「楽しい」という意味のファンではなく、「数学関数」という意味のファンクションを検索することからその名が付けられた)は、ディープマインドが人工知能(AI)で実行してきた基礎数学とコンピューター科学における一連の発見を続けるものだ。最初は「アルファテンサー(AlphaTensor)」が、さまざまな種類のコードの中心となる計算を高速化する方法を発見し、50年ぶりに記録を更新した。次に「アルファデブ(AlphaDev)」が、世界中で1日に何兆回も使用される重要なアルゴリズムを高速化する方法を発見した。

しかし、これらのツールは大規模言語モデルを使用していなかった。どちらもディープマインドのゲームプレイAI「アルファゼロ(AlphaZero)」をベースにして構築されており、数学の問題を囲碁やチェスのパズルのように扱うことで解決を導き出したのだ。アルファテンサーとファンサーチの両方に取り組んだグーグルの研究者、ベルナルディーノ・ロメラ・パレディスは、「これらのツールの問題は、一定の思考回路から抜け出せないことです」と言う。「アルファテンサーは行列の乗数は得意ですが、それ以外は基本的に何もできません」。

ファンサーチは、異なるアプローチをとる。これはコンピューターコード生成向けに微調整された、グーグルの「PaLM2(パーム2)」のバージョンの一種である大規模言語モデル「Codey(コーディ)」に、不正確または無意味な回答を拒否して適切な回答を出し直しをさせるシステムを組み合わせたものだ。

「正直なところ、仮説は立てたのですが、なぜこれがうまく機能するのかはよく分かっていません」と、グーグル・ディープマインドの研究科学者であるアルフセイン・ファウジは言う。「プロジェクト開始当初はうまくいくかどうか、皆目見当がつきませんでした」。

研究チームは、一般的なプログラミング言語であるパイソン(Python)を使用し、解決したい問題の概略を記述することから始めた。しかし、問題の解き方を指定するプログラムの行は空白にしておいた。そこにファンサーチを使用する。つまり、Codeyに空白を埋めさせ、実際に問題を解決できるコードを提案させるのだ。

2番目のアルゴリズムは、Codeyの思いついた提案を確認し、採点する。最適な提案があれば、まだ正しくない段階であっても保存され、Codeyに差し戻される。Codeyはそれを元に、プログラムを完成させようと再試行する。「提案のほとんどは無意味ですが、一部は筋が通っており、そしてごく一部の提案からは本当にインスピレーションを受けます」とコーリー副社長は言う。「本当にインスピレーションを受けた内容を選び、それを使って作業を繰り返すように命じるのです」。

ファンサーチは数百万回の提案と数十回のプロセス全体の繰り返しに数日を費やした後、「特定のタイプセットの最大サイズを見つける」というキャップセット問題に対し、これまで知られていなかった正しい解を導き出すコードを思いつくことに成功した。方眼紙に点を描くことを想像してほしい。キャップセット問題とは、3つの点が直線にならないよう、いくつの点を配置できるかを考えるようなものだ。

非常にニッチだが、重要な問題だ。数学者たちは、その解法はおろか、解き方にさえ同意していない(これはアルファテンサーが高速化の方法を見つけた行列乗算の計算にも関連する)。カリフォルニア大学ロサンゼルス校のテレンス・タオ教授は、フィールズ賞など数学の最高賞を多数受賞しているが、2007年のブログ投稿で、キャップ セット問題は「たぶん一番好きな未解決の問題」だと述べている。

タオ教授は、ファンサーチで何ができるかに興味を持っており、「ファンサーチは有望なパラダイムです」と言う。「大規模言語モデルの能力を活用する興味深い方法です」。

ファンサーチがアルファテンサーよりも優れている主な点は、理論上、幅広い問題の解を見つけるのに利用できることだ。ファンサーチは、解そのものではなく、解を導き出す道筋となるコードを生成するからだ。コードが異なれば、解決される問題も異なる。加えて、ファンサーチの結果は分かりやすい。「ファンサーチが生成する道筋は、ファンサーチが生成するおかしな数学的解法よりも明確な場合が多いのです」と、ファウジは言う。

ファンサーチの汎用性をテストするため、研究チームはファンサーチを使用し、別の数学の難問である「瓶詰め問題」に挑戦した。これは「できるだけ少ない瓶に物を詰め込む」という問題だ。データセンター管理から電子商取引に至るまで、コンピューター科学のさまざまな用途にとって重要な問題である。ファンサーチは、人間が考案したものよりも高速な解決方法を考え出した。

タオ教授によると、数学者たちは「大規模言語モデルの欠点を軽減しつつその能力を活用する方法に関して、研究ワークフローに組み込む最良策を模索している途中」なのだという。「これは確かに、今後に向けたひとつの可能性を示すものです」。