生成AIブームの先にある知的ロボットへの道、データ争奪戦が始まった

The robot race is fueling a fight for training data 生成AIブームの先にある
知的ロボットへの道、
データ争奪戦が始まった

生成AIが席捲する中、次なる目標として知的ロボットの実現への関心が高まっている。実現には大量の実世界のデータが必要だ。企業や研究者たちはより多くの訓練用データを手に入れようと躍起になっている。 by James O'Donnell2024.05.13

「チャットGPT(ChatGPT)」がリリースされて以来、私たちはかつてないほど直接的に、そして定期的に人工知能(AI)ツールとやり取りをするようになった。

しかし、それとは対照的に、ロボットと触れ合うことはまだほとんどの人にとって珍しいことだ。複雑な手術を受ける人や、物流業界で働く人以外、日常生活で遭遇する最先端のロボットはまだ掃除機なのかもしれない(最近のことに感じるかもしれないが、最初のルンバが発売されたのは22年も前のことだ)。

しかし、その状況が変わろうとしている。ロボット研究者たちは、新しいAIテクノロジーを利用することによって、この分野で何十年も前から切望されてきたことを達成できると信じている。つまり、見知らぬ環境を自由に動き回り、見たことのない課題に取り組むことができる、より有能なロボットの実現である。

「まるでロケットの前面に縛り付けられているようです」と、トヨタ・リサーチ・インスティテュート(TRI)でロボット研究担当副社長を務めるラス・テドレイクは、この分野の現在の進展スピードについて話す。テドレイク副社長によれば、これまでに何度も大げさに宣伝されては下火になっていく繰り返しを見てきたが、今回のような状況は初めてだという。「私はこの分野に20数年携わっています。今回は違います」。

しかし、そのロケットを減速させているものがある。それは、ロボットの訓練に使えるデータが不足していることだ。ロボットが物理的な世界とよりスムーズにやり取りできるようにするためには、訓練用のデータが必要不可欠である。それらのデータは、GPTのような最先端のAIモデルの訓練に使われるデータ(ほとんどがインターネットからかき集められたテキストや画像や動画)よりも、入手がはるかに困難だ。シミュレーション・プログラムは、ロボットがさまざまな場所や物体とやり取りする方法を学習するのに役立つが、その結果はまだ「シミュレーションと現実世界とのギャップ(sim-to-real gap)」の餌食になる傾向がある。つまり、シミュレーションから現実世界へと移行する際に、失敗することが多いのだ。

今のところまだ、ロボットを訓練するには、物理的な現実世界のデータを利用する必要がある。そのようなデータは比較的少なく、収集には多くの時間と労力、そして高価な機器を必要とすることが多い。この希少性こそが、現在のロボット工学の進歩を妨げている主な要因の1つである。

そのため、大手の企業や研究所は、必要なデータを収集するための新たなより優れた方法を見つけようと、激しい競争を繰り広げている。その競争が企業や研究所を奇妙な道へと導いてきた。たとえば、ロボットアームを使って何時間も延々とパンケーキをひっくり返したり、ユーチューブ(YouTube)から引っ張ってきた何千時間分もの生々しい手術動画を見たり、エアビーアンドビー(Airbnb)の多数の宿泊施設に研究者を配置してありとあらゆる場所を撮影したりといった具合だ。そしてその過程で、チャットボットの分野で経験したのと同じ種類の、プライバシー、倫理、著作権の問題にぶつかっている。

データに対する新たなニーズ

何十年もの間、ロボットはテニスボールを拾い上げるとか、前転をするといった特定のタスクについて訓練されていた。人間が観察や試行錯誤を通じて物理的な世界のことを学ぶのに対し、多くのロボットは方程式やコードを通じて学んでいた。この方法は時間がかかった。さらに悪いことに、ロボットはあるタスクから新しいタスクにスキルを移転できなかった。

しかし今、AIの進歩が、すでに始まっていた変化を急速に前進させている。その変化とは、データを通じてロボットに自己学習させることだ。言語モデルが図書館一棟分もの小説から学習できるのと同じように、ロボットモデルは、たとえば人間がロボットハンドを使って皿からケチャップを洗い流している実際の様子を数百回見せられることで、その作業を真似ることができる。ケチャップがどのようなものかということや、蛇口のひねり方を明確に教えられる必要はない。このアプローチが、より急速な進歩と、はるかに一般的な能力を持つマシンを可能にしている。

現在、あらゆる大手企業や研究所が、AIを利用してロボットが新たなタスクへの対処方法を推論できるようにしようとしている。それらの取り組みが成功するかどうかは、ロボットのモデルを微調整するために必要な、多様な種類のデータを見つけられるかどうかにかかっている。また、強化学習を使ってロボットに正しい場合と間違っている場合を教える、新たな方法を見つけられるかどうかも重要になる。

「次の大きなデータソースになるのは何なのか、多くの人々が先を争って見つけ出そうとしています」と、アジリティ・ロボティクス(Agility Robotics)のプラス・ヴェラガプディ最高技術責任者(CTO)は言う。同社は、アマゾンなどの顧客の倉庫で作業する人型ロボットを製造している。ヴェラガプディCTOの疑問に対する答えは、将来のマシンが得意とすることや、それらのマシンが家庭や職場で果たす役割を明確にするのに役立つだろう。

最高級の訓練用データ

ロボット研究者たちがどのようにデータを探し回っているのか理解するために、肉屋のことを想像してみよう。すぐに調理に使える高価な最高級の肉がある。日常的に食べる質素な肉がある。そして、後ろの方に切り落とし肉や小間切れ肉がひっそりと置かれている場合があり、そのような肉はクリエイティブなシェフがおいしい料理に仕上げる必要がある。すべて使える肉だが、どれも同じではない。

ロボットにとっての最高級データとはどのようなものか、少し理解するために、トヨタ・リサーチ・インスティテュートが採用している手法を考えてみよう。マサチューセッツ州ケンブリッジにある広大な研究室には、ロボットアームやコンピューターが設置されているほか、ちりとりや泡だて器などの日用品が無造作に置かれている。その中で研究者たちは、遠隔操作によってロボットに新しいタスクを教え、実演データと呼ばれるものを作成している。たとえば、人間がロボットアームを使って午後の間にパンケーキを300回ひっくり返す、というような作業を実施する。

同社によれば、モデルがそのデータを一晩かけて処理し、多くの場合、翌朝にはロボットが自律的にそのタスクを実行できるようになっているという。実演では同じタスクが何度も繰り返し示されるため、遠隔操作によって正確なラベル付きデータが豊富に生み出される。それらのデータを役立てることで、ロボットは新しいタスクをうまく実行できるようになる。

厄介なのは、そのようなデータの作成には時間がかかることだ。また、ロボットは高価であるため、購入できる数には限りがある。質の高い訓練用データをより安く効率的に作成するため、スタンフォード大学のロボット工学・身体性AI研究所で責任者を務めるシュラン・ソング助教授は、手を使ってより素早く使用でき、わずかなコストで製造可能な装置を設計した。基本的には軽量のプラスチック製ロボットハンドである。それを使って卵を割るとか、テーブルをセッティングするといった日常的な活動をする間に、データを収集できる。そのデータを利用してロボットを訓練すると、それらの作業を模倣させることが可能になる。このようなよりシンプルな装置を使うことで、データ収集プロセスをより迅速化できるかもしれない。

オープンソースの取り組み

ロボット研究者たちは最近、より多くの遠隔操作データを得るための別の方法を考え出した。収集したデータを互いに共有することである。単独でデータセットを作成するのは手間のかかる作業だが、データを共有することでその手間を省くことができる。

今年3月に公開された「分散型ロボット・インタラクション・データセット(Distributed Robot I …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。