The hype around DeepMind's new AI model misses what's actually cool about it

汎用人工知能の道筋見えた——ディープマインド「Gato」で勇み足

世界最高峰のAI企業の1つであるディープマインドが発表した新しいAIモデル「ガトー（Gato）」が話題だ。600種類以上のタスクをこなせるといい、開発者は「汎用人工知能（AGI）への道筋が見えた」という。 by Melissa Heikkilä2022.05.26

アルファベット傘下の人工知能（AI）企業であるディープマインド（DeepMind）は5月12日、新しい「ジェネラリスト（万能型）」人工知能（AI）モデル「ガトー（Gato）」を発表した。ガトーは、アタリ（Atari）のビデオゲームをプレイしたり、画像にキャプションを付けたり、チャットをしたり、本物のロボット・アームでブロックを積み上げたりできるという。全部で604種類のタスクをこなせると謳うモデルだ。

ガトーは紛れもなく魅力的だ。だがリリース後の1週間で、一部の研究者はやや調子に乗ってしまったようだ。

ディープマインドのトップ研究者の一人で、ガトー論文の共著者でもあるナンド・デ・フレイタスは、興奮を抑えきれなかった。フレイタスは「ゲームは終わった！」とツイートし、ガトーから汎用人工知能、つまり人間または超人レベルのAIという漠然とした概念である「AGI（Artificial General Intelligence）」への明確な道筋ができたことを示唆したのだ。AGIを構築する方法は、おもに規模の問題であり、ガトーのようなモデルをより大きく良いものにすることだとフレイタスは主張した。

当然のことながらフレイタスの発言は、ディープマインドが人間レベルのAIを実現する「間際にいる」という驚くべきマスコミ報道を引き起こした。誇大広告が現実を上回るのは、今回が初めてではない。オープンAIのテキストジェネレーター「GPT-3」や画像ジェネレーター「ダリ（DALL-E）」など、他の画期的なAIモデルも、同様の大言壮語を生んできた。こうした熱狂的な言説は、多くのAI研究者にとって他の重要な研究分野に影を落とすものだ。

ガトーはAIの世界での興味深い一歩であるからこそ、残念なことだ。テキストの記述から画像を生成するダリのように、いくつかのモデルは異なるスキルを組み合わせ始めている。また、単一の訓練手法で、絵や文章の認識を学習するモデルもある。そして、ディープマインドのアルファゼロ（AlphaZero）は、囲碁とチェス、将棋を覚えた。

しかし、ここに決定的な違いがある。アルファゼロは一度に1つのタスクしか学習できないのだ。囲碁を覚えても、次にチェスを覚える前にすべて忘れてしまわなければならないといった調子だ。同時に2つのゲームを学ぶことはできない。ガトーは、複数の異なるタスクを同時に学習する。つまり、1つのスキルを忘れてから別のスキルを学習するのではなく、複数のタスクを切り替えられる。小さな一歩だが、重要な一歩なのだ。

ただし、ガトーは、1つのことしかできないモデルよりもパフォーマンスが悪い。マサチューセッツ工科大学（MIT）で人工知能と自然言語処理・音声処理を専門とするジェイコブ・アンドレアス助教授によると、ロボットはまだ、テキストから世界の仕組みに関する「常識的判断（common sense）」を学ぶ必要があるという。

これはたとえば、家の中で人を助けるようなロボットに役立つかもしれない。「キッチンに（ロボットを）置いて、紅茶を入れるように初めて頼んでも、ロボットは紅茶を入れる手順やティーバッグがどの棚にありそうなのかを知っているのです」とアンドレアス助教授は語る。

外部の研究者の中には、フレイタスの主張を明確に否定する者もいた。深層学習に批判的なAI研究者のゲイリー・マーカス（ニューヨーク大学教授）は、「これは『知性』とは程遠いものです」と言う。ガトーをめぐる誇大広告は、AIの分野が役に立たない「勝利至上主義的な文化」によって台無しにされたことを示しているとマーカス教授は言う。

人間レベルの知能に到達する可能性があるとして、しばしば大きな期待が寄せられている深層学習モデルについてマーカス教授は、「もし人間がこんな間違いをしたら、この人はどこかおかしいと思われるような」間違いをすると主張している。

「自然界はここで何かを伝えようとしています。つまり、実際には機能していないにもかかわらず、AI分野では自分たちの報道記事を信じるあまり、それが見えていないのです」とマーカス教授は付け加えた。

フレイタスの同僚で、ガトーを共同開発したジャッキー・ケイとスコット・リードでさえ、私がフレイタスの主張について直接尋ねると、慎重な態度を示していた。ガトーがAGIに向かっているのかどうかという質問に対して、彼らは明言しようとしなかった。「このようなことに対して予測を立てるのは、実のところあまり現実的ではないと思っています。私はそれを避けるようにしています。株式市場を予測するようなものです」とケイは述べた。

リードは、これは難しい質問だと返した。「ほとんどの機械学習の研究者は、慎重に答えを避けると思います。予測するのは非常に難しいですが、いつかはそこに到達できればと願っています」。

ある意味、ディープマインドがガトーを「ジェネラリスト（万能型）」と呼んだことで、ガトーをAI分野のAGIをめぐる過剰な誇大広告の犠牲にしてしまったのかもしれない。現在のAIシステムは「狭い」AI（特化型AI）と呼ばれており、テキストの生成など、特定の限られたタスクしか実行できない。

ディープマインドを含む一部の技術者は、いつの日か人間も、人間と同等かそれ以上に機能する「より広い」AIシステムを開発するだろうと考えている。これを人工的な「汎用」知能と呼ぶ人もいる。一方で、「魔法を信じる」ようなものという人もいる。メタ（Meta）の主任AI科学者であるヤン・ルカンを始めとする多くのトップ研究者たちは、そんなことがそもそも可能なのかと疑問を投げかけている。

ガトーは、同時に多くの異なることができるという意味において、「ジェネラリスト」である。しかしそれは、モデルが訓練されたものとは異なる新しいタスクに有意義に適応できる「汎用的」なAIとは別世界の話だと、MITのアンドレアス助教授は言う。「それが実現するのは、まだかなり先のことです」。

また、モデルを大きくしても、モデルに「生涯学習（Lifelong learning）」が備わっていない問題に対処することにはならないとアンドレアス助教授はいう。生涯学習とは、一度物事を教えれば、その含意をすべて理解して、それ以降のすべての意思決定に利用できることである。

AI／ロボット工学研究者で、ティムニット・ゲブルと共同創設した非営利団体「ブラック・イン・AI（Black in AI）」のメンバーでもあるエマニュエル・カヘンブエは、ガトーのようなツールをめぐる誇大広告はAI全般の発展にとって有害だと主張している。「脇に追いやられ、資金不足に陥り、もっと注目されるべき興味深いトピックはたくさんありますが、それは大手テック企業やそのようなテック企業の研究者の大部分が興味を持つものではありません」とカヘンブエはいう。

「社会をよくする」ためのAIプロジェクトに資金を提供する慈善団体パトリック・J・マクガバーン財団のヴィラス・ダール理事長は、テック企業は一歩引いて、自分たちがなぜこのようなものを作っているのかを考えるべきだという。

「AGIは、人間の深層にあるものに語りかけます。つまり、人間を偉大な存在へと押し上げるツールを作ることによって、人間は人間を超えられるという考えなのです」とダール理事長は言う。「それは本当にすばらしいことですが、同時に、私たちが今直面している、AIを使用して取り組むべき現実の問題から目をそらす方便にもなってしまっています」。

人気の記事ランキング

メリッサ・ヘイッキラ [Melissa Heikkilä]米国版 AI担当上級記者: MITテクノロジーレビューの上級記者として、人工知能とそれがどのように社会を変えていくかを取材している。MITテクノロジーレビュー入社以前は『ポリティコ（POLITICO）』でAI政策や政治関連の記事を執筆していた。英エコノミスト誌での勤務、ニュースキャスターとしての経験も持つ。2020年にフォーブス誌の「30 Under 30」（欧州メディア部門）に選出された。