見よう見まねでエビ料理を作る自律型ロボット(動画あり)

Watch this robot cook shrimp and clean autonomously 見よう見まねでエビ料理を作る自律型ロボット(動画あり)

スタンフォード大学の研究グループが、遠隔操作で覚えたタスクをこなすAIロボットを開発した。安価なハードウェアでも複雑なタスクをこなすことができ、エビを調理したりフライパンをすすいだりできる。 by Melissa Heikkilä2024.01.16

洗練されたロボットは、必ずしも高価である必要はない。比較的安価なロボットでも、人工知能(AI)を使えば複雑な操作タスクを実行し、新しいスキルを迅速に学習できることが新研究で明らかになった。

スタンフォード大学の研究グループは、人間の遠隔操作によって3種類の広東料理を調理できる車輪付きロボットを、わずか3万2000ドルの費用で構築した(以下の動画)。

 

研究グループはその後、AIを使って、エビを調理したり、汚れを落としたり、エレベーターを呼んだりするなどの個々のタスクを自律的に実行できるようにロボットを訓練した。このような複雑なタスクを実行できるロボットには数十万ドルの費用がかかることが多い。だが、研究グループは既製のロボット部品と3Dプリントされたハードウェアを組み合わせることで、プロジェクトのコストを低く抑えることに成功した。

モバイルALOHA(「両手操作用のローコスト・オープンソース・ハードウェア・テレオペレーション・システム」の頭文字をとったもの)と呼ばれるこのロボットに、研究グループはフライパンをすすいだり、誰かにハイタッチをしたりといった、さまざまな運動能力や器用さを必要とする7種類のタスクを教えた。例えば、エビの調理の場合、研究グループはロボットを遠隔で20回操作し、エビを計画通りに配置してひっくり返し、盛り付けるといった動きを繰り返した。プロジェクトの共同リーダーでスタンフォード大学の博士課程生であるジペン・フーは、毎回少しずつやり方を変えていったので、ロボットは同じタスクでもさまざまなやり方を覚えたと話す。

https://wp.technologyreview.com/wp-content/uploads/2024/01/cook_shrimp.mp4
動画提供:研究グループ

その後、このロボットはこれらの料理のデモンストレーションに加え、車輪のない初期型の「ALOHA」で収集したペーパータオルやテープを引きちぎるなどのタスク(エビの調理とは関係のないさまざまな種類のタスク)について、人間が操作した他のデモンストレーションで訓練したという。新しいデータと古いデータを組み合わせるこの「共同訓練」のアプローチは、何百万とは言わないまでも何千もの例でAIシステムを訓練する通常のアプローチに比べ、モバイルALOHAが比較的早く新しい仕事を学習することにつながった。プロジェクトの顧問を務めたスタンフォード大学のチェルシー・フィン助教授によると、こうした古いデータから、目の前の仕事とは関係のない新しいスキルをロボットは学ぶことができたとフィン助教授は言う。

https://wp.technologyreview.com/wp-content/uploads/2024/01/wash_pan.mp4
動画提供:研究グループ

この種の家事は、人間にとっては(少なくとも私たちがその気になれば)簡単なことだが、ロボットにとってはまだ非常に難しい。ロボットには人間が本来持っているような精度、協調性、周囲の環境に対する理解が欠けているため、物体を掴んだり、操作したりするのに苦労してしまうからだ。だが、AI技術をロボット工学に応用しようとする最近の取り組みは、ロボットの新たな能力を引き出すことの大きな可能性を示している。例えばグーグルのRT-2システムは、言語ビジョンモデルとロボットを組み合わせたもので、人間がロボットに言葉で命令を与えることができる。

「本当に興味深いことの1つは、この模倣学習のレシピが非常に一般的だということです。非常にシンプルで、非常に拡張性があるのです」とフィン助教授は述べている。ロボットが模倣するためのより多くのデータを収集すれば、ロボットはさらに多くの台所でのタスクをこなせるようになるかもしれない、とフィン助教授は言う。

「モバイルALOHA は、ユニークなことを実証しました。比較的安価なロボット・ハードウェアで、非常に複雑なタスクを解決することができるということです」。今回の研究には関与していないニューヨーク大学のレレル・ピント准教授(コンピューターサイエンス)は言う。同じくこの研究には参加していないカーネギーメロン大学のディーパック・パタック助教授は、モバイルALOHAはロボットのハードウェアがすでに非常に有能であることを示しており、より便利なロボットを作るには、AIこそが欠けているピースであることを強調するものだ、と話す。

ピント准教授は、このモデルはロボットの訓練データが転送可能であることも示しており、あるタスクを訓練すると、他のタスクのパフォーマンスを向上させることができると述べている。「非常に望ましい特性です。データが増加すると、必ずしも関心のあるタスクのためでなくても、ロボットのパフォーマンスが向上する可能性があるからです」。

研究グループのメンバーであるスタンフォード大学の博士課程の学生のトニー・Z・ザオによると、より多くのデータを使ってロボットを訓練し、くしゃくしゃになった洗濯物を拾って畳むといった、さらに難しいタスクにも現在挑戦しているという。洗濯物はロボットが理解しにくい形状に束になっているため、非常に困難な作業である。だがザオは、こうした難しいと考えていたタスクにロボットが取り組むのにも、今回の技術が役立つだろうと述べている。