1年以上前、サンフランシスコに本拠を持ち、営利目的でAI研究をするオープンAI(OpenAI)は、驚くべき器用さで立方体を動かせるロボットハンドを訓練したと発表した。
それ自体は驚異的には聞こえないかもしれないが、人工知能(AI)の世界では2つの意味で画期的だった。まず、このロボットハンドが、動物の学習方法をモデルにした強化学習アルゴリズムという手法を使って立方体の動かし方を学んだことだ。次に、すべての訓練はシミュレーションで実施されたが、実世界にうまく変換できたことだ。どちらの成果も、産業用および消費者用のより機敏なロボットを製造するための重要な一歩だ。
この2018年の結果について「やや驚きました」とマサチューセッツ工科大学(MIT)のレスリー・ケルブリング教授(ロボット工学)は話している。「こんなことが可能だとは、正直想像していませんでした」。
オープンAIは10月15日に発表した新しい論文で、ロボットハンド「ダクティル(Dactyl)」による最新の成果を披露した。 ダクティルは片手でルービックキューブを動かせるようになっていた。この成果も、前回同様シミュレーションでの強化学習によるものだ。注目すべきなのは、ロボットが古くからあるルービックキューブというパズルを解けるようになったというよりは、以前よりもさらにレベルアップした器用さの獲得に成功したことにある。
機器操作を専門とするロボット工学者のドミトリ・ベレンソン博士(ミシガン大学)は「これは本当に難しい課題です」と話す。「ルービックキューブのパーツを回転させるのに必要な操作は、立方体自体を回転させるよりも、本当にはるかに難しいのです」。
バーチャルの世界から物理世界へ
従来、ロボットによる物体操作は、非常に簡単な操作のみに限られていた。強化学習アルゴリズムによって、 囲碁で、ソフトウェアが最高の棋士を破るなど、ソフトウェアにおける複雑なタスクの達成には大きな成功を収めてきた。しかし、物理的な機械の訓練にもこの方法が使えるかといえば、話は別だ。その理由は、アルゴリズムは試行錯誤を繰り返して磨きをかける必要があるからだ。多くの場合、この試行錯誤は何百万回にも及ぶが、現実の世界で物理的なロボットが実際に繰り返すには、極めて長い時間がかかり、多くの物理的な消耗や困難にも対応しなければならない。また、ロボットが闇雲にデータを収集しようとすると、危険が生じる可能性すらある。
…