オープンAI、互いに訓練することで賢くなるバーチャルロボを開発
オープンAIは、一方のAIを使って他方のAIを訓練することより、多様なタスクに対応できるようAIを学習させる手法を開発した。オープンAIが目標とする、人間が改めて訓練しなくても様々なタスクをこなせる汎用的なAIを構築する際に重要な要素となる可能性がある。 by Will Douglas Heaven2021.01.29
オープンAI(OpenAI)は、それぞれのタスクに応じて再訓練しなくても、広範囲にわたるさまざまな課題を解決することを学習するバーチャル・ロボットアームを開発した。このロボットアームは、徐々に難しくなる課題を与えるよう訓練されたもう一つのロボットアームと対戦することで、ブロックを積み上げたり、テーブルを設置したり、チェスの駒を並べたりするといった課題の解決法を学習する。
互いにそっくりなロボットアームである「アリス」と「ボブ」は、人が情報を入力しなくても、シミュレーションの中で互いにゲームをすることで学習する。このロボットには、試行錯誤させることで、特定の目標を達成するためにさまざまな状況下でどのようなアクションを取るべきか人工知能(AI)を訓練する「強化学習」の手法が用いられている。ゲームでは、バーチャルなテーブル上で物体を動かす作業を実施する。アリスは、物体を特定の方法で配置し、ボブには解くのが難しそうな課題を提示する。ボブはアリスの出した課題を解こうとする。学習が進むに …
- 人気の記事ランキング
-
- Quantum physicists have shrunk and “de-censored” DeepSeek R1 量子技術でDeepSeekを55%小型化、「検閲解除」にも成功
- Promotion Innovators Under 35 Japan Summit 2025 2025年のイノベーターが集結「IU35 Summit」参加者募集
- Google’s new Gemini 3 “vibe-codes” responses and comes with its own agent グーグルが「Gemini 3」発表、質問に応じて回答形式もAIが判断
- How to help friends and family dig out of a conspiracy theory black hole 家族が陰謀論にハマったら: 専門家が語る、 5つの現実的アプローチ
- What is the chance your plane will be hit by space debris? 空からゴミが降ってくる—— 衛星10万基時代のリスク、 航空への影響は?【解説】
