シュラン・ソン（スタンフォード大学）

深層学習テクノロジーは、ロボットが新しいタスクを習得する方法を根本的に変革した。その変化の最前線にいるのが、スタンフォード大学の「ロボット工学・身体化AI研究室（Robotics and Embodied AI Lab）」の責任者であるシュラン・ソン（33歳）だ。彼女は、ロボットをより有用で、日常生活に適応できる存在にするための革新的な方法を模索している。

最近、ソンらの研究チームは、ロボットに「聴覚」を持たせる低コストな方法を開発した。多くのロボットはカメラを使った視覚情報に依存して移動するが、視界が悪い環境では問題となる。ソンの研究室が開発した音声を活用するシステムにより、ロボットはホワイトボードを消す、カップを空にするといったタスクをより正確に実行できるようになった。

この新システムは、ソンの研究における最も重要な貢献の1つを基に構築された。彼女は、マイクを搭載したハンドヘルド・グリッパー（把持装置）を設計した。このデバイスは、誰でも簡単に使用でき、皿洗いから自転車の修理まで、さまざまな作業を記録できる。作業中、グリッパーはユーザーの動きをリアルタイムで追跡しながら、音声と映像を記録する。このデータは、大規模言語モデル（LLM）の訓練と同様に、ロボットの訓練にも活用できる。

さらに、ソンは収集したすべての訓練データをオープンソースとして公開している。彼女は、学術研究者がより多くの訓練データを利用できるようにするため「DROID」などの共同データセットを開発している。これにより、ベンチャー・キャピタルの支援を受ける企業に比べてデータへのアクセスが限られている研究者たちも、最先端のロボット開発に貢献できるようになる。

家庭で安全かつ実用的なロボットが私たちの日常をサポートするには、まだ時間がかかるかもしれない。しかし、ソンの研究のおかげで、その未来は確実に近づいている。

Shuran Song シュラン・ソン（スタンフォード大学）