ディープマインド、バーチャル道場で鍛え続けるマルチスキルAIを開発
ディープマインドは、バーチャル3D空間でさまざまな課題を際限なく課すことによって、AIが初見のタスクにも短時間で適応できるようにする手法を開発した。 by Will Douglas Heaven2021.08.03
ディープマインド(DeepMind)は、カラフルで広大なバーチャル・プレイグラウンド(遊び場)を開発し、課すタスクを次々に際限なく変化させて、人工知能(AI)に一般的なスキルを学ばせている。バーチャル・プレイグラウンドで学ぶAIは、特定のタスクの解決に必要なスキルだけを身につけるのではなく、実験や探索をすることを学んでスキルを身につけ、そのスキルを使って、これまでに出会ったことのないタスクを遂行する。これは、汎用人工知能(AGI)への小さな一歩だ。
https://www.youtube.com/watch?v=lTmL7jwFfdw
AIのバーチャル・プレイグラウンドである「エックスランド(XLand)」は、ビデオゲームの3D世界に似ており、AIのプレイヤーが色で物体を感知できる。エックスランドは、中央AIが管理しており、環境やゲームのルール、プレイヤーの数を変更するなどして、AIプレイヤーにさまざまなタスクを課す。AIプレイヤーもプレイグラウンドの管理者である中央AIも、強化学習を使って、試行錯誤によって能力を向上させていく。
訓練では、AIプレイヤーはまず、紫色のキューブを見つけたり、黄色のボールを赤い床に置いたりする1人用の単純なゲームをプレイする。続いて、「かくれんぼ」や、チーム対抗で互いの旗を先に見つけて奪い合う「旗取りゲーム」のような複雑な多人数用のゲームに挑戦する。中央AIに特定の目標はないが、時間の経過とともにAIプレイヤーの一般的な能力を向上させることを目指している。
ディープマインドの「 …
- 人気の記事ランキング
-
- A Google Gemini model now has a “dial” to adjust how much it reasons 推論モデルは「考えすぎ」、グーグルがGeminiに調整機能
- What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
- Meet the researchers testing the “Armageddon” approach to asteroid defense 惑星防衛の最終戦略 科学者たちが探る 「核爆発」研究の舞台裏
- Anthropic can now track the bizarre inner workings of a large language model 大規模言語モデルは内部で 何をやっているのか? 覗いて分かった奇妙な回路