生成AIは、ロボットの訓練方法にパラダイム・シフトを起こしている。何十年もの間、サイエンス・フィクション(SF)の世界で語られるにとどまっていたような本当に有能なロボットを構築できるかもしれない方法が、とうとう解明されたのだ。
ロボット工学分野において、人工知能(AI)は目新しいものではない。たとえば、ロボットが進路上の物体を検出するのにAIが長年利用されてきた。しかし、数年前からロボット研究者たちは大規模言語モデルの進歩に驚嘆し始めた。大規模言語モデルの開発者は大量のテキスト(書籍や詩、マニュアル)をモデルに入力し、プロンプト(指示テキスト)に基づいてテキストを生成するようにモデルを調整できる。
この方法をロボット工学に持ち込むというアイデアは魅力的だったが、とてつもなく複雑だった。AIを使って画面上に文章を作成することと、AIを使って物理的なロボットに動き方や役立つことをするように教えるのはまったく別のことなのだ。
そして今、ロボット研究者は大きなブレークスルーを成し遂げた。ひとつは、さまざまな種類のデータを組み合わせて、そのすべてをロボットにとって判読可能で有用なものにする方法を見つけ出したことだ。たとえば、皿洗いのデータを収集するとする。まず、センサーを装着した状態で皿洗いをしている人からデータを収集できる。次に、そのデータをロボットアームを利用して遠隔操作で同じように皿洗いしている人から収集したデータと組み合わせることができる。さらに、インターネットから皿洗いをしている人の画像や動画を収集することもできる。
これらのさまざまなデータソースを新しいAIモデルに適切に統合することで、完璧ではないにせよ、より手作業に近い方法で訓練されたロボットよりも圧倒的な優位性を持つロボットを訓練することが可能になる。単一タスクを実行する方法が多数あることがわかれば、AIモデルが即興で対応しやすくなり、現実世界でロボットが次にとるべき行動を推測しやすくなる。
これは、ロボットの学習方法を再定義する画期的なブレークスルーだ。倉庫のような商業スペースで働くロボットには、すでにこのような高度な訓練方法が使用されており、そのような実験から得られた教訓は、家庭用スマートロボットの土台となるかもしれない。