ディープマインド、バーチャル道場で鍛え続けるマルチスキルAIを開発
ディープマインドは、バーチャル3D空間でさまざまな課題を際限なく課すことによって、AIが初見のタスクにも短時間で適応できるようにする手法を開発した。 by Will Douglas Heaven2021.08.03
ディープマインド(DeepMind)は、カラフルで広大なバーチャル・プレイグラウンド(遊び場)を開発し、課すタスクを次々に際限なく変化させて、人工知能(AI)に一般的なスキルを学ばせている。バーチャル・プレイグラウンドで学ぶAIは、特定のタスクの解決に必要なスキルだけを身につけるのではなく、実験や探索をすることを学んでスキルを身につけ、そのスキルを使って、これまでに出会ったことのないタスクを遂行する。これは、汎用人工知能(AGI)への小さな一歩だ。
https://www.youtube.com/watch?v=lTmL7jwFfdw
AIのバーチャル・プレイグラウンドである「エックスランド(XLand)」は、ビデオゲームの3D世界に似ており、AIのプレイヤーが色で物体を感知できる。エックスランドは、中央AIが管理しており、環境やゲームのルール、プレイヤーの数を変更するなどして、AIプレイヤーにさまざまなタスクを課す。AIプレイヤーもプレイグラウンドの管理者である中央AIも、強化学習を使って、試行錯誤によって能力を向上させていく。
訓練では、AIプレイヤーはまず、紫色のキューブを見つけたり、黄色のボールを赤い床に置いたりする1人用の単純なゲームをプレイする。続いて、「かくれんぼ」や、チーム対抗で互いの旗を先に見つけて奪い合う「旗取りゲーム」のような複雑な多人数用のゲームに挑戦する。中央AIに特定の目標はないが、時間の経過とともにAIプレイヤーの一般的な能力を向上させることを目指している。
ディープマインドの「 …
- 人気の記事ランキング
-
- This company claims a battery breakthrough. Now they need to prove it. すべてのパラメーターが矛盾——「出来すぎ」全固体電池は本物か?
- OpenAI’s “compromise” with the Pentagon is what Anthropic feared アンソロピック排除の裏で進んだオープンAIの軍事契約、その代償は
- AI is rewiring how the world’s best Go players think 「アルファ碁」から10年、 AIは囲碁から 創造性を奪ったのか
- How uncrewed narco subs could transform the Colombian drug trade 中には誰もいなかった—— コカイン密輸組織が作った 「自律潜水ドローン」の脅威