ディープマインド、未知のゲームもプレイできるAIエージェント

An AI that can play Goat Simulator is a step towards more useful AI ディープマインド、未知のゲームもプレイできるAIエージェント

グーグル・ディープマインドの新しいAIエージェントは、人間のプレイヤーを観察することで、これまで見たことのないさまざまなゲームをプレイできる。 by Melissa Heikkilä2024.03.15

ヤギよ、もっと飛べ! グーグル・ディープマインド (Google Deepmind)の新しい人工知能(AI)エージェントは、大げさな物理的挙動が特徴の楽しいアクション・ゲーム「ゴートシミュレーター3(Goat Simulator)」など、AIが初めてプレイするゲームを含むさまざまなゲームをプレイできる。研究者はテキスト・コマンドを使ってAIに指示を出し、7つの異なるゲームをプレイさせ、3つの異なる3D研究環境で動き回らせることに成功した。これは複数の環境間でスキルを伝達できる、より汎用化されたAIへの一歩である。

グーグル・ディープマインドは、ゲームプレイAIシステムの開発で大きな成功を収めてきた。2016年に、囲碁のトッププロ棋士の李 世乭(リ・セドル)を破った「アルファ碁(AlphaGo)」は、深層学習の力を示す大きなマイルストーンとなった。1つのゲームだけをマスターしたり、単一の目標やコマンドにしか従うことができなかった以前のゲームプレイAIシステムとは異なり、この新しいAIエージェントは、「ヴァルヘイム(Valheim)」や「ノーマンズスカイ(No Man’s Sky)」など、さまざまなゲームをプレイすることが可能だ。

ゲーム内でAIシステムを訓練することは、現実世界のタスクの優れた代替手段となる。スタンフォード大学のマイケル・バーンスタイン准教授(コンピューター科学)は、「一般的なゲームをプレイをするAIエージェントは、原理的には単一の環境で何かをするよりも、我々の世界をナビゲートする方法についてより多くのことを学べるのです」と話す。

「いつの日か、超人的なエージェントと対戦するのではなく、SIMAのようなエージェントがあなたやあなたの友人と一緒に、ゲームをプレイする日が来るかもしれません」。SIMA(スケーラブル、インストラクタブル、マルチワールド・エージェント)と呼ばれるこのエージェントを開発したチームの一員である、グーグル・ディープマインドの研究エンジニア、ティム・ハーレーは言う。

https://wp.technologyreview.com/wp-content/uploads/2024/03/sima_blog_video_1.mp4

グーグル・ディープマインドの研究エンジニアであるフレデリック・ベッセによると、同チームは、キーボードやマウスの入力、ゲーム内でのプレイヤーの行動に関する注釈とともに、人間が個人または共同でビデオゲームをプレイする多くの例に基づいてSIMAを訓練したという。

研究チームは模倣学習と呼ばれるAI技術を使い、人間と同じようにゲームをプレイするようにAIエージェントに教えた。SIMAは「左に曲がれ」「はしごを登れ」「マップを開け」といった600の基本的な指示に従うことができ、それらを約10秒以内に完了できる。

研究チームはまた、多くのゲームで訓練を受けたSIMAエージェントの方が、1つのゲームだけをプレイする方法を学んだAIエージェントよりも優れていることを発見した。これは、ゲーム間の共通概念を利用して、より優れたスキルを学習し、指示を実行する能力が向上したためだとベッセは述べている。

「これは本質的に、まだ見たことのないゲームをプレイできるAIエージェントを手に入れたという点で、非常に刺激的かつ重要なことなのです」

ロンドンのクイーン・メアリー大学のパウロ・ラウバー講師は、この種のゲーム間での知識の伝達を見ることは、AI研究にとって重要なマイルストーンだと語る。

人間が提供した例に基づいて命令の実行方法を学習するという基本的な考え方は、将来、特に大規模なデータセットを使用する場合に、より強力なシステムにつながる可能性があるとラウバー講師は言う。そしてSIMAのデータセットが比較的限られていることが、そのパフォーマンスを妨げていると指摘する。

訓練対象のゲーム環境の数はまだ少ないものの、SIMAはスケールアップに向けて正しい軌道に乗っていると、エヌビディア(Nvidia)でAIエージェント・イニシアチブ(AI Agents Initiative)を運営するジム・ファン上級研究科学者は述べている。

ただ、AIシステムはまだ人間のレベルには程遠い、とグーグル・ディープマインドのハーレーは言う。たとえば、「ノーマンズスカイ」では、AIエージェントは人間が実行できるタスクの60%しか実行できなかった。そして研究チームが、人間がSIMAに指示を与える機能を削除したところ、エージェントのパフォーマンスが以前よりも大幅に低下してしまった。

次に、ベッセはチームはエージェントのパフォーマンスの向上に取り組んでいると述べた。研究チームは、AIシステムをできるだけ多くの環境で動作させて新しいスキルを学習させ、ユーザーがチャットをしてAIエージェントから応答を得られるようにしたいと考えている。チームはまた、SIMAがより汎用化されたスキルを身につけ、人間と同じように、まだ見たことのないゲームをすぐに覚えられるようにしたいと考えている。

人間は、「初めての環境や状況に対して非常にうまく一般化することができます。そして、私たちはAIエージェントにもそうあることを望んでいるのです」とベッセは語った。

SIMAは、自律エージェントのための「チャットGPTの瞬間」に私たちを少しずつ近づけてくれると、カリフォルニア大学アーバイン校のロイ・フォックス助教授は話す。

ただし、SIMAは実際の自律型AIにはほど遠いものだ。自律型AIは「まったくの別物」になるとフォックス助教授は述べた。