ロボット版「イメージネット」目指す、UCバークレーの巨大映像DB
ニューラル・ネットワークを用いてロボットに新しいタスクを学習させようとすると、大量の学習用データを用意する必要がある。カリフォルニア大学バークレー校の研究者らは、ロボットを動かすニューラルネットを訓練するための映像を大量に蓄積した公開データベースを作成しようとしている。 by Emerging Technology from the arXiv2019.11.15
人工知能(AI)革命の陰の立役者として、データベースである「イメージネット(ImageNet)」の存在がある。プリンストン大学の研究者が開発したイメージネットには、約1400万枚の画像が含まれ、各画像には画像内容を説明する注釈テキストがクラウドソーシングで付けられている。
イメージネットは現在の高性能ニューラル・ネットワークの多くが初期経験を積むのに使う重要なデータベースだ。ニューラル・ネットワークはデータベース上の画像と付随テキストを使って学習し、データベースが大きいほど学習効果が上がる。イメージネットやその他の画像データセットがなければ、最も高性能なニューラル・ネットワークでさえ何も認識できない。
ロボット工学者は現在、同様の手法で、映像を使って、周囲の環境との相互作用の方法をニューラル・ネットワークに学習させたいと考えている。カリフォルニア大学バークレー校の大学院生であるスディープ・ダサリらの研究チームが作成している「ロボネット(RoboNet)」と呼ばれるデータベースは、まさにその目的を達成するためのものだ。ロボネットには、テーブルの向こう側へカップを動かすロボットの映像データなど、動作中のロボットの注釈付き映像データが多数含まれている。ロボネットのデータは誰でもダウンロードでき、ロボットを制御するニューラル・ネットワークの訓練に使える。訓練によって、たとえば、そのニューラル・ネットワークがカップを扱うのが初めてだとしても、カップを動かせるようになる。
ダサリらの研究チームは、ロボネットを、ほぼすべてのロボットに対し、ほぼすべてのタスクの実行を事前に訓練させられるリソースに成長させたいと考えている。いわば、一種の「ロボット大学」である。
ロ …
- 人気の記事ランキング
-
- Anthropic can now track the bizarre inner workings of a large language model 大規模言語モデルは内部で 何をやっているのか? 覗いて分かった奇妙な回路
- Promotion MITTR Emerging Technology Nite #32 Plus 中国AIをテーマに、MITTR「生成AI革命4」開催のご案内
- AI companions are the final stage of digital addiction, and lawmakers are taking aim SNS超える中毒性、「AIコンパニオン」に安全対策求める声
- What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
- Tariffs are bad news for batteries トランプ関税で米電池産業に大打撃、主要部品の大半は中国製