KADOKAWA Technology Review
×
10/9「生成AIと法規制のこの1年」開催!申込み受付中
未知の環境でもタスクを完了、ロボット訓練の新AIモデル
Sarah Rogers/MIT Technology Review | Getty Images
AI models let robots carry out tasks in unfamiliar environments

未知の環境でもタスクを完了、ロボット訓練の新AIモデル

米国の研究チームは、5種類の基本的なタスクをさまざまな環境で実行できるように教えられるAIモデルを開発した。このモデルを使用すると、ロボットに未知の環境で何かをさせる際に、追加の訓練や微調整が不要になる。 by Rhiannon Williams2024.09.24

この記事の3つのポイント
  1. 米研究チームがロボットに未知の環境下でタスクを実行させるAIモデルを開発
  2. ドアを開けるなどの5種類の基本的なタスクを90%以上の成功率で実行可能
  3. 将来的に家庭へのロボット導入がより簡単かつ低コストになる可能性
summarized by Claude 3

未知の環境下でロボットに何かをさせるのは難しい。研究者は通常、直面する場所が変わるごとに新しいデータを使ってロボットを訓練する必要があるが、訓練は場合によってはかなりの時間と費用を要する。

米国の研究チームは今回、追加の訓練やファインチューニング(微調整)をすることなしに、新しい環境で基本的なタスクをこなせるようにロボットに教えるための一連の人工知能(AI)モデルを開発した。「ロボット・ユーティリティ・モデル(RUM:robot utility model)」と呼ばれるこの5種類のAIモデルを使えば、5種類の別個のタスクをロボットに実行させられる。未知の環境において、ドアと引き出しを開ける、ティッシュ、バッグ、そして円筒形の物体を拾うというタスクを90%以上の成功率で実行可能だ。

ニューヨーク大学、メタ(Meta)、ロボット工学企業のハロー・ロボット(Hello Robot)の研究者から成る研究チームは、今回の成果によって、ロボットに新しいスキルをより迅速かつ容易に教えられるようになると同時に、ロボットがこれまで見られなかった領域で動作できるようになると期待している。このアプローチによって、将来的には家庭へのロボット導入がより簡単かつ低コストになるかもしれない。

「これまで研究者は、どうすれば万能のロボットを作れるかという問題にかなり注力してきた一方、ロボットが学習済みのタスクをあらゆる場所で実行させるにはどうすればいいかという問題にはあまり目を向けてきませんでした」。そう語るのは、このプロジェクトに携わったニューヨーク大学の博士課程学生、マヒ・シャフィウラだ。「私たちが考えたのは、たとえば、どんな場所にあるどんなドアでも開けられるようロボットに教える方法です」。

ロボットに新しいスキルを教えるには一般的に膨大なデータが必要だが、それを手に入れるのはかなり難しい。ロボットの訓練データは物理的に収集する必要があり、時間とコストがかかる。インターネットからかき集めた情報で訓練する大規模言語モデル(LLM)のような他の種類のAIに比べると、訓練データベースの構築と拡張ははるかに難しい。

ロボットに新しいスキルを教えるため不可欠なデータをすばやく収集するために、研究チームは過去の研究で使用したツールの新バージョンを開発した。それはゴミ拾いに使われるような安価なマジックハンドにアイフォーン(iPhone)を取り付けたものだ。

研究チームはこのツールを使い、ニューヨーク市やジャージー市の家など40通りの異なる環境において、5つのタスクそれぞれについて約1000回のデモンストレーションを記録した。一部のデータは以前の研究の一環で収集されたものだ。こうしてできた5つのデータセットを使って学習アルゴリズムを訓練し、5つのRUMモデルを作成した。

次にこれらのモデルを、車輪ユニット、高いポール、そしてiPhoneを持つ伸縮式アームを備えた「ストレッチ(Stretch)」というロボットに実装し、追加の調整なしに新しい環境でどれほどうまくタスクを実行できるかをテストした。完了率は74.4%を記録したが、研究者がiPhoneとストレッチの頭部マウントカメラの画像をオープンAIの新型LLMである「GPT-4o」モデルに渡し、タスクが成功したかどうかを尋ねたところ、成功率は90%まで向上した。GPT-4oが失敗したと回答したら、単にストレッチをリセットして再トライさせたのだ。

ロボット工学者が直面する重要な課題は、実験室環境でのモデルの訓練やテストが、現実世界で起こりうることのお手本にはならないということである。それはつまり、新しい環境において機械が確実に動作する助けになるような研究が待ち望まれているということだ。ロボットマニピュレーションを専門とする研究科学者で、この研究には参加していないモヒト・シュリダール博士はこう語る。

「さまざまな家やキッチンでロボットを評価するというのはよい方法です。なぜなら、無作為に選ばれた家の中で、ロボットが実環境において動作できるなら、それこそがロボット工学の真に目指すべき場所だからです」と同博士は言う。

この研究プロジェクトは、他のタスクを実行させるための実用ロボット向けのモデルを作るための汎用レシピとして役立つかもしれない。これによって、最小限の追加作業でロボットに新しいスキルを教えやすくなるほか、訓練を受けたロボット工学者以外の人々も将来的にはロボットを家庭に導入しやすくなる、とシャフィウラは言う。

「私が訓練してインターネット上に公開したモデルを、誰かがダウンロードしてロボットに組み込めば家の中で動かせるような世界を夢見ています」。

人気の記事ランキング
  1. Why OpenAI’s new model is such a big deal GPT-4oを圧倒、オープンAI新モデル「o1」に注目すべき理由
  2. Promotion MITTR Emerging Technology Nite #30 MITTR主催「生成AIと法規制のこの1年」開催のご案内
  3. Google says it’s made a quantum computing breakthrough that reduces errors グーグルが量子エラー訂正でブレークスルー、実用化へ前進
  4. Why a ruling against the Internet Archive threatens the future of America’s libraries 主張:インターネットアーカイブ敗訴、図書館の未来を守れ
  5. Google’s new tool lets large language models fact-check their responses AIが自らファクトチェック、グーグル「幻覚」撲滅で新ツール
リアノン・ウィリアムズ [Rhiannon Williams]米国版 ニュース担当記者
米国版ニュースレター「ザ・ダウンロード(The Download)」の執筆を担当。MITテクノロジーレビュー入社以前は、英国「i (アイ)」紙のテクノロジー特派員、テレグラフ紙のテクノロジー担当記者を務めた。2021年には英国ジャーナリズム賞の最終選考に残ったほか、専門家としてBBCにも定期的に出演している。
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年も候補者の募集を開始しました。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る