ディープマインド(DeepMind)は、カラフルで広大なバーチャル・プレイグラウンド(遊び場)を開発し、課すタスクを次々に際限なく変化させて、人工知能(AI)に一般的なスキルを学ばせている。バーチャル・プレイグラウンドで学ぶAIは、特定のタスクの解決に必要なスキルだけを身につけるのではなく、実験や探索をすることを学んでスキルを身につけ、そのスキルを使って、これまでに出会ったことのないタスクを遂行する。これは、汎用人工知能(AGI)への小さな一歩だ。
https://www.youtube.com/watch?v=lTmL7jwFfdw
AIのバーチャル・プレイグラウンドである「エックスランド(XLand)」は、ビデオゲームの3D世界に似ており、AIのプレイヤーが色で物体を感知できる。エックスランドは、中央AIが管理しており、環境やゲームのルール、プレイヤーの数を変更するなどして、AIプレイヤーにさまざまなタスクを課す。AIプレイヤーもプレイグラウンドの管理者である中央AIも、強化学習を使って、試行錯誤によって能力を向上させていく。
訓練では、AIプレイヤーはまず、紫色のキューブを見つけたり、黄色のボールを赤い床に置いたりする1人用の単純なゲームをプレイする。続いて、「かくれんぼ」や、チーム対抗で互いの旗を先に見つけて奪い合う「旗取りゲーム」のような複雑な多人数用のゲームに挑戦する。中央AIに特定の目標はないが、時間の経過とともにAIプレイヤーの一般的な能力を向上させることを目指している。
ディープマインドの「 …