KADOKAWA Technology Review
×
始めるならこの春から!年間サブスク20%オフのお得な【春割】実施中
米独大学の研究グループ、家庭内ロボ訓練用の巨大データ集を作成
A Massive New Library of 3-D Images Could Help Your Robot Butler Get Around Your House

米独大学の研究グループ、家庭内ロボ訓練用の巨大データ集を作成

家庭で仕事をこなすロボットを開発するには、家庭にあるモノを認識し、場面全体がどんな状況にあるのかをコンピューターが認識する必要がある。米独の大学の研究グループは、3D画像の訓練用巨大データ集を作成した。 by Will Knight2017.04.26

ロボットが家庭で実際に仕事をこなすには、コーヒー・テーブルとベビー・ベッドを区別する能力が必要だ。

スタンフォード大学とプリンストン大学、ミュンヘン工科大学の研究者が新開発した大容量3D画像データセットなら、人工知能を訓練できるかもしれない。画像データセット「スキャンネット」は、コーヒー・テーブルやソファ、電気スタンド、テレビなど、数百万件もの説明情報(注釈データ)付きの、何千もの場面を網羅している。コンピューター・ビジョンが過去5年間で飛躍的に進歩した一因に、スタンフォード大学の研究グループ(スキャンネットに参加したのは別の研究グループ)が開発したデータセット「イメージネット」(ずっとシンプルな2Dの標識化画像データセット)の貢献がある。スキャンネットはさらに大量のデータで認識精度向上に貢献するだろう。

スキャンネットの開発に携わったミュンヘン工科大学のマティアス・ ナイセル教授は「イメージネットは注釈データの量が半端ではなく、それによって人工知能革命を引き起こしました」という。

スキャンネットにより、機械が物理的世界をより深く理解し、実用的な応用につながることが期待される。ナイセル教授は「誰もが思いつくのは家庭用ロボットです。家庭用ロボットは、周囲で何が起きているかを判断しなければなりません」という。

スタンフォード大学の客員准教授時代に開発に携わったナイセル教授は、コンピューターが三次元で場面を理解するよう訓練するために深層学習(イメージネットに使われているのと同じ機械学習の手法)を応用することになると考えている(“10 Breakthrough Technologies 2013: Deep Learning”参照)。ナイセル教授は、スタンフォード大学時代の学生アンジェラ・ダイ、プリンストン大学のトーマス ・ ファンクハウザー教授、他の学生数名とスキャンネットを開発した。

研究内容は、研究グループが最近Webに投稿した論文で説明されている。研究グループは、マイクロソフトのキネクトに似た3Dカメラで1513場面をスキャンしてデータセットを作った。3Dカメラは、従来型カメラと赤外線深度センサーを使って、撮影中の場面の3D画像を生成する。さらに研究グループは、アマゾンのクラウド・ソーシング「メカニカル・ターク」(人間の作業者を動的に割り当てるサービス)を通じて、ボランティアにiPadアプリで画像に注釈をつけてもらった。全体の精度を上げるために、ボランティアの一方がスキャン画像内のモノを塗り分けてラベルを付け、もう一方のボランティアには3Dモデルで場面を新たに作るよう依頼した。

家庭用ロボットの実用化を研究しているブラウン大学のステファニー・テレクス助教授は、スキャンネットは以前のどの研究にも優る大きな成果だという。「大規模なデータセットを作り上げたのは大きな貢献です。3D情報は、ロボットが環境を認知して、反応するのに不可欠です」

ナイセル教授は、研究グループが深層学習を適用してみたところ、奥行き情報や形状だけで、機械は多くのモノを十分な精度で認識できるとわかったという。3Dデータによって、機械は物理的世界をより深く理解できるとわかったが、3D情報の活用は、動物がモノを認知する手法をまねたよい方法だ、とナイセル教授はいう。

カーネギーメロン大学のシダルタ・ シュリニバーサ教授(ロボット工学)は、新たなデータセットは機械が家庭内を理解する「よいスタート」になりうるという。シュリニバーサ教授は「イメージネットの人気は、部分的にはデータセットの膨大さにありますが、概して、画像のラベルがそのまま数多くの分野、特にWebアプリに応用できたことが大きかったのです」という。一方、3D画像データセットの明白な応用分野はロボット工学や建築学に限られている。ただしシュリニバーサ教授は、応用分野は急速に出現するだろう、と述べた。

シュリニバーサ教授は、人工的またはバーチャルな場面でマシン・ビジョン・システムを訓練する研究者もいるという。「現実の画像は非現実的にしかシミュレートできないこともありますが、映画のコンピューター合成画像(CGI)でわかるように、奥行き情報のシミュレートは十分現実的です」

人気の記事ランキング
  1. Promotion MITTR Emerging Technology Nite #32 Plus 中国AIをテーマに、MITTR「生成AI革命4」開催のご案内
  2. AI companions are the final stage of digital addiction, and lawmakers are taking aim SNS超える中毒性、「AIコンパニオン」に安全対策求める声
  3. What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
  4. Tariffs are bad news for batteries トランプ関税で米電池産業に大打撃、主要部品の大半は中国製
ウィル ナイト [Will Knight]米国版 AI担当上級編集者
MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。
▼Promotion
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る