地球上に生命が誕生したばかりの頃、生物は極めて単純だった。それは微細な単細胞生物であり、協調する能力もほとんどなかった。しかし、何十億年にもわたる競争と自然選択による進化を経て、現在のような複雑な生命体、そして人間の複雑な知性が生まれた。
サンフランシスコに拠点を置く人工知能(AI)研究機関である「オープンAI(OpenAI)」の研究チームは、現在、ある仮説を検証している。それは、生物の進化を促した競争をバーチャル世界で真似ることができれば、より洗練されたAIが生まれるのではないか、というものだ。
オープンAIの実験は、AI分野における2つの既存のアイデアに基づいている。複数のアルゴリズムを競合または協調させて創発的な行動を引き起こす「マルチエージェント学習」というアイデアと、試行錯誤しながら目標を達成することを学習する機械学習の一手法である「強化学習」だ(強化学習は、ディープマインド(DeepMind)が開発したプログラム「アルファ碁(AlphaGo)」が囲碁で人間の最強棋士を破るという画期的な成果を上げたことで、広く知られるようになった)。
オープンAIは2019年9月に発表した論文の中で、初期の研究結果を明らかにした。単純なかくれんぼのゲームを何億回もプレイすることで、対峙する2つのAIエージェントチームは、道具を使用したり連携したりする複雑なかくれんぼ戦略を編み出したのだ。この研究は、オープンAIで主流となっている研究戦略を理解する上での手がかりにもなる。その戦略とは、既存のAI手法を劇的にスケールアップして、どのような特性が現れるかを確認するというものだ。
戦略の6つのフェーズ
このゲームを作るために、研究者らは、ブロックやスロープ、移動が可能もしくは不可能なバリケードなど、さまざまな物体が置かれた閉ざされた空間で構成されるバー …