米独大学の研究グループ、家庭内ロボ訓練用の巨大データ集を作成
家庭で仕事をこなすロボットを開発するには、家庭にあるモノを認識し、場面全体がどんな状況にあるのかをコンピューターが認識する必要がある。米独の大学の研究グループは、3D画像の訓練用巨大データ集を作成した。 by Will Knight2017.04.26
ロボットが家庭で実際に仕事をこなすには、コーヒー・テーブルとベビー・ベッドを区別する能力が必要だ。
スタンフォード大学とプリンストン大学、ミュンヘン工科大学の研究者が新開発した大容量3D画像データセットなら、人工知能を訓練できるかもしれない。画像データセット「スキャンネット」は、コーヒー・テーブルやソファ、電気スタンド、テレビなど、数百万件もの説明情報(注釈データ)付きの、何千もの場面を網羅している。コンピューター・ビジョンが過去5年間で飛躍的に進歩した一因に、スタンフォード大学の研究グループ(スキャンネットに参加したのは別の研究グループ)が開発したデータセット「イメージネット」(ずっとシンプルな2Dの標識化画像データセット)の貢献がある。スキャンネットはさらに大量のデータで認識精度向上に貢献するだろう。
スキャンネットの開発に携わったミュンヘン工科大学のマティアス・ ナイセル教授は「イメージネットは注釈データの量が半端ではなく、それによって人工知能革命を引き起こしました」という。
スキャンネットにより、機械が物理的世界をより深く理解し、実用的な応用につながることが期待される。ナイセル教授は「誰もが思いつくのは家庭用ロボットです。家庭用ロボットは、周囲で何が起きているかを判断しなければなりません」という。
スタンフォード大学の客員准教授時代に開発に携わったナイセル教授は、コンピューターが三次元で場面を理解するよう訓練するために深層学習(イメージネットに使われているのと同じ機械学習の手法)を応用することになると考えている(“10 Breakthrough Technologies 2013: Deep Learning”参照)。ナイセル教授は、スタンフォード大学時代の学生アンジェラ・ダイ、プリンストン大学のトーマス ・ ファンクハウザー教授、他の学生数名とスキャンネットを開発した。
研究内容は、研究グループが最近Webに投稿した論文で説明されている。研究グループは、マイクロソフトのキネクトに似た3Dカメラで1513場面をスキャンしてデータセットを作った。3Dカメラは、従来型カメラと赤外線深度センサーを使って、撮影中の場面の3D画像を生成する。さらに研究グループは、アマゾンのクラウド・ソーシング「メカニカル・ターク」(人間の作業者を動的に割り当てるサービス)を通じて、ボランティアにiPadアプリで画像に注釈をつけてもらった。全体の精度を上げるために、ボランティアの一方がスキャン画像内のモノを塗り分けてラベルを付け、もう一方のボランティアには3Dモデルで場面を新たに作るよう依頼した。
家庭用ロボットの実用化を研究しているブラウン大学のステファニー・テレクス助教授は、スキャンネットは以前のどの研究にも優る大きな成果だという。「大規模なデータセットを作り上げたのは大きな貢献です。3D情報は、ロボットが環境を認知して、反応するのに不可欠です」
ナイセル教授は、研究グループが深層学習を適用してみたところ、奥行き情報や形状だけで、機械は多くのモノを十分な精度で認識できるとわかったという。3Dデータによって、機械は物理的世界をより深く理解できるとわかったが、3D情報の活用は、動物がモノを認知する手法をまねたよい方法だ、とナイセル教授はいう。
カーネギーメロン大学のシダルタ・ シュリニバーサ教授(ロボット工学)は、新たなデータセットは機械が家庭内を理解する「よいスタート」になりうるという。シュリニバーサ教授は「イメージネットの人気は、部分的にはデータセットの膨大さにありますが、概して、画像のラベルがそのまま数多くの分野、特にWebアプリに応用できたことが大きかったのです」という。一方、3D画像データセットの明白な応用分野はロボット工学や建築学に限られている。ただしシュリニバーサ教授は、応用分野は急速に出現するだろう、と述べた。
シュリニバーサ教授は、人工的またはバーチャルな場面でマシン・ビジョン・システムを訓練する研究者もいるという。「現実の画像は非現実的にしかシミュレートできないこともありますが、映画のコンピューター合成画像(CGI)でわかるように、奥行き情報のシミュレートは十分現実的です」
- 人気の記事ランキング
-
- What’s on the table at this year’s UN climate conference トランプ再選ショック、開幕したCOP29の議論の行方は?
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- This AI-generated Minecraft may represent the future of real-time video generation AIがリアルタイムで作り出す、驚きのマイクラ風生成動画
- ウィル ナイト [Will Knight]米国版 AI担当上級編集者
- MITテクノロジーレビューのAI担当上級編集者です。知性を宿す機械やロボット、自動化について扱うことが多いですが、コンピューティングのほぼすべての側面に関心があります。南ロンドン育ちで、当時最強のシンクレアZX Spectrumで初めてのプログラムコード(無限ループにハマった)を書きました。MITテクノロジーレビュー以前は、ニューサイエンティスト誌のオンライン版編集者でした。もし質問などがあれば、メールを送ってください。