数学好きな人へ問題です。yについて次の微分方程式を解いてください。
解答時間は30秒。ぐずぐずしている暇はありません。急いで!
答えは次の通り。
ーーーもし、解答できなかったとしても気にする必要はない。これはとてもややこしい問題で、さまざまな高性能記号計算ソフトウェアが30秒かけても解答できなかったのだ。
パリのフェイスブックAI研究所のギヨーム・ランプルとフランソワ・チャートンは、この問題を一瞬で解くアルゴリズムを開発したと発表した。2人はニューラル・ネットワークを訓練し、数式の微分積分に必要な記号推論を初めて実行させることに成功した。この研究は、より高度な数学的推論と、従来のパターン認識タスクを超えたニューラル・ネットワークの新たな応用に向けての大きな前進である。
まず、基礎的な知識を少し説明しておこう。ニューラル・ネットワークはこれまで、パターン認識のタスクで非常に大きな成果をあげてきた。顔や物体の認識、特定の種類の自然言語処理、さらにはチェスや囲碁、スペースインベーダーといったゲームのプレイなどが挙げられる。
しかし、多くの取り組みにもかかわらず、数学に関与する記号推論タスクを実行させられるようにニューラル・ネットワークを訓練した者はこれまでにいなかった。整数の加算と乗算ができるように訓練するのがせいぜいだった。
ニューラル・ネットワークと人間の両方にとって、高等数学における数式の難しさの1つに、そこで使われる簡略表記がある。たとえば、式 x 3 は、「xかけるxかけるx」を簡潔に表記したものだ。この例では、「かける:乗算」は累加の略記であり、それ自体が2つの数値を組み合わせた合計値の略記だ。
そのように見れば、簡単な数式であっても、一連のより単純な数学演算が凝縮して表現されていることをすぐに理解できるだろう。
したがって、ニューラル・ネットワークがこの種の論理を扱うのに苦戦してきたのも不思議ではない。略記が何を表しているのかわからなければ、その使い方を学ぶ可能性はほとんどない。実際、人間も同様の問題を抱えており、幼い頃から数式に悩まされている人も多い。
とはいえ、数学的な略記によって隠されてはいるが、微分積分のような処理の基本的なレベルではパターン認識タスクが関与している。
ランプルとチャートンは、この問題を解決するために、数学的略記を元の基本単位に展開する優れた方法を考案した。彼らは、数式を基本単位に展開した後、微分積分に相当する数式処理パターンを認識するようにニューラル・ネットワークを訓練した。そして最後に、訓練で与えていない数式をニューラル …