ディープマインドの新AI、スタークラフトでプロゲーマーに初勝利
アルファベット(グーグル)の人工知能(AI)専門子会社であるディープマインドが、新たな快挙を発表した。銀河戦争で人間を打ち負かしたのだ。
ディープマインドの最新学習アルゴリズムである「アルファスター(AlphaStar)」は、スタークラフト2のプロプレイヤーたちに初勝利を収めた。プロゲーマーのTLOとMaNaに対し、10勝1敗の対戦成績を挙げたのだ。この人気のリアルタイムの戦略ゲームでは、プレイヤーは3つの種族のうちの1つとして戦い、建物を建てたり、だだっ広い戦場で戦闘を繰り広げたりする。
アルファスターは、アルファスター・リーグと呼ばれる環境の中でゲームの仕方を学習した。最初に、大規模なニューラル・ネットワークが熟練者によるゲームの再現を観察した。その後、強化学習と呼ばれる機械学習の手法を使って、自らの分身を相手に戦うことで次第に腕を上げていく。ここで重要なのは、アルファスターのアクションスピードと戦場の視界が、生身の人間に対して不公平にならないよう制限されていたことだ。
アルファスターはスタークラフト2をマスターするために新種の知能を駆使する必要があった。このゲームのために開発された手法は今後、貿易や軍事作戦といった複雑な戦略を要するさまざまな実世界の状況でも有用であることを示せるかもしれない。
スタークラフトIIは極めて複雑であるばかりではない。「不完全情報」のゲームでもあり、プレイヤーはいつも敵の動きを見られるわけではない。さらに、プレイする際の単一の最善戦略も存在しない。プレイヤーの操作の結果がはっきりするのに時間がかかることが、アルゴリズムが経験を通して学習するのを一層難しくしている。ディープマインドの開発チームは、非常に特化したニューラル・ネットワーク構造を使ってこれらの問題に対処した。
ディープマインドは、世界最強の囲碁とチェスの選手に勝利した学習アルゴリズムの開発でもっともよく知られている。しかしそれ以前にも、同社は単純なビデオゲームの仕方を学習したアルゴリズムを数種類開発している。AIにビデオゲームをプレイさせるのは、AIの進歩を測定したり、コンピューターを人間と比較したりするためのうまい手段なのだ。しかしながら同時に、極めて限られた範囲でのテストでもある。アルファスターはこれまでのAIと同様に、驚異的ではあるものの、たったひとつのタスクしかこなせない。