ブロック状でどこかまぬけなコンピューター・ゲーム「マインクラフト」(2014年にマイクロソフトが買収したインディーズ・ゲーム)は、人間と人工知能(AI)がどう協力するかを学ぶ素晴らしい場になるかもしれない。
マイクロソフトの研究者が今月発表したマインクラフトの実験的新バージョンでは、AIを訓練して、橋を渡ったり、複雑な物体を作り上げたりと、あらゆるタスクをこなせる。新プラットフォーム「プロジェクト・マルモ」では、通常は人間のプレイヤーが操作するマインクラフトのキャラクターを、学習アルゴリズムが操作できるようになった。しかも、人間のプレイヤーとAIエージェントが協力したり、チャット・ウィンドウで人間が出来たてのAIと会話したりできる。
「長期的には、どのユーザーからも学んで、その人たちがしたいことを助けるAIを目指しています」というのはマイクロソフトリサーチ・ケンブリッジでプロジェクトを指揮したカーチャ・ホフマン研究員。
ニューヨークの学会で先週、人工知能研究者にプロジェクト・マルモをデモンストレーションしたホフマン研究員は、人間とA間の共同作業こそがプロジェクトの重要目標だという。
「私たちは、協力的なAIの開発に取り組む研究者に必要なあらゆる機能をこのソフトウェアに組み込みました」
プロジェクト・マルモの狙いは、強化学習アルゴリズム(望ましい行動をとったとき、疑似的に報酬を与えてコンピュータを学習する方法)の検証だ。たとえば、マインクラフトのキャラクターを操作するAIが、障害物でいっぱいの部屋の中を通り抜けるよう学習させ、部屋の向こう側にたどりついたら報酬を与える。人間のマインクラフト・プレイヤーも、AIに助言することで学習過程に参加するようになれば、AIはやがて指示内容からも学習するだろう。
機械学習アルゴリズムはますます賢くなっており、人間をより生産的で効率的にする可能性がある。この考えは、マイクロソフトのサティア・ナデラCEOが、マイクロソフトにとって特に重要だと強調してきた。しかしこれまで、人間とAIの協力を重点的に研究することは比較的少なかった。
ホフマン研究員は、この研究は、最終的には通常のゲームにも影響を与えると信じている。
「将来、人間がAIエージェントを訓練し、退屈な作業を任せることになるでしょう」
ホフマン研究員によれば、マインクラフト・プレイヤーを補助するAIの開発は、日常生活で人間の能力を補なうコンピューター・ソフトウェアへの第一歩だ。
「確実に便利で、人間の能力を高めてくれるAIを私たちが本当に開発すべきです」
人工知能の研究者は、最新の機械学習の手法を試す場として、コンピューター・ゲームに頼るようになった。昨年の初めには、グーグルのディープマインドがアタリのさまざまな2Dゲームを神業レベルでプレーできるようになるアルゴリズムをデモンストレーションして注目を浴びた。使われたのは、深層学習(入力データに反応するように訓練された、非常に大きなニューラール・ネットワーク)と強化学習を連携させたアルゴリズムだ。以降、グーグルの研究者はより複雑な3Dゲーム世界でも迷わずに行動する学習アルゴリズムの映像を公開したが、研究の詳細は明かされていない。
マインクラフトはグラフィックスが単純で明確なゴールが一切ないのに大人気だ。マインクラフトのファンは、その中で驚くほど複雑な構造物や機械を数多く作り上げている(”The Secret to a Video-Game Phenomenon“参照)。また、マインクラフトは比較的単純ではあるが、ロボット・アルゴリズムの実験場として最適かもしれない。(”Minecraft Shows Robots How to Stop Dithering“参照)。
マインクラフトを実際にアルゴリズムの実験に使っているブラウン大学のステファニー・テレックス教授は、プロジェクト・マルモは、研究者が自分の手法を他の研究者と比較検討しやすく、とても価値があるという。「マインクラフトを人工知能のオリンピックのように利用するのは素晴らしい考えだと思います」という。また、たとえば人間と人工知能のコミュニケーションに関するデータは、現代の機械学習には欠かせず、大量のデータを集めるのプラットフォームとしても有効だともいう。
マルモの対象は、人工知能や機械学習、ロボット工学に取り組む人々だが、十分な技術的能力を持つ人なら誰でもダウンロードしてゲーム内のAIを試せる。ソフトウェアには機械学習パッケージとサンプルAIをいくつか含んでおり、実際、マニアや人工知能が専門ではないソフトウェア・エンジニアもダウンロードした。