見落とされてきた「耳」、音を学んだロボットはもっと賢くなる

ロボットを訓練するのにはこれまで、主に視覚データが用いられてきた。だが、タスクによっては、聴覚データも含めて訓練に使用すると成功率があがることが分かっている。 by James O'Donnell2024.07.09

この記事の3つのポイント

AI搭載ロボットの訓練に音声データが有用であることが判明
音声によりロボットは視界が限られた環境でもタスクを遂行できる
さらなるデータ収集によりロボットの機能向上が期待される

summarized by Claude 3

最近の人工知能（AI）搭載ロボットの多くはカメラを使って周囲の状況を把握し、新しいタスクを学習している。だが、ロボットを音声で訓練することも容易になってきており、視界が限られたタスクや環境に適応させるのに役立っている。

視覚は重要だが、音声のほうが学習に役立つ日常の作業もある。コンロの上で玉ねぎがジュージューと焼ける音を聞いてフライパンの温度が適切かどうかを判断するのはその一例だ。ただ、音声を使ったロボットの訓練は、高度な管理下にあるラボ環境でのみ実施されてきたのが現状で、その手法は他の高速のロボット教育方法に比べると遅れている。

スタンフォード大学のロボット工学・エンボディドAI研究所の研究チームが、この状況を変えようとしている。研究チームはまず、音声データを収集するため、ゴープロ（GoPro）のカメラと、バックグラウンドノイズを除去するマイクが付いたグリッパーから成るシステムを構築した。人間のデモンストレーターが、グリッパーを使ってさまざまな家事を実行し、そのデータを活用してロボットアームに自力で作業を進める方法を教えた。この研究チームの新しい訓練アルゴリズムは、ロボットが音声信号から手がかりを集めて動作の能率を上げられるようにするものだ。

「これまでロボットは、音声を消した動画を使って訓練されてきました」。スタンフォード大学博士課程の学生で、この研究の主著者であるツェイ・リウは言う。「しかし、音声には非常に有用なデータがたくさんあります」。

研究チームは、ロボットが「聞く」能力を持った場合にどれだけ機能が向上するかをテストするための4つのタスクを選定した。フライパンでベーグルをひっくり返す、ホワイトボードの字を消す、2枚の面ファスナーをくっつける、カップからサイコロ …

こちらは会員限定の記事です。 メールアドレスの登録で続きを読めます。

有料会員にはメリットがいっぱい！

毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
重要テーマが押さえられる。
各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。

【春割】実施中！年間購読料20%オフ！

人気の記事ランキング

▼Promotion