深層学習に代表される人工知能(AI)技術の発展に伴い、新たな応用先として注目が高まっているのが、ロボットだ。ロボットという身体を手に入れることで、AIはバーチャル空間を飛び出し、いよいよ実世界へと活躍の場を広げようとしている。この深層学習とロボット工学両分野の最先端研究領域に精通した研究者は世界でもごく一握りに限られる。早稲田大学基幹理工学部表現工学科の尾形哲也教授はそのひとりだ。
深層学習とロボット工学の現在地
尾形教授が専門としているのは「認知発達ロボティクス」という研究分野。ロボットに深層学習などの神経回路モデルを導入して学習、発達過程を観察する——いわば、ロボット開発を通じて人間が持つ『知能』の本質に迫るというものだ。研究を志したきっかけは、人型ロボット研究のパイオニアであり、恩師でもある加藤一郎氏(故人、元早稲田大学理工学部長)から託された、ロボットの「心」という研究課題に強く惹かれたことだという。ロボットに心を持たせるためには「知能」に関する理論は欠かせない。そこで着目したのが人間の脳が持つシナプスの結合を模した数理モデルである「ニューラル・ネットワーク」だ。
「1990年代当時、ニューラル・ネットワークの研究は一時期のピークを過ぎて停滞気味でした。しかし、僕はこの考えがとても面白いと思ったんです。というのも、人間がロボットに知能を教え込むにはいくつかのアプローチがあって、すべてをプログラムとして書いて教え込むか、ある程度書いておいて学習させるという方法があります。ニューラル・ネットワークはその後者で、ボトムアップで学習していくというところに面白さがあります。人間は遺伝子に多くの情報があらかじめ書き込まれていると言う人もいますが、僕はあらかじめプログラムされているものはかなり少ないと考えています。加藤先生も知能の仕組みは、自己保存の本能にニューラル・ネットワークなどの学習機構が組み合わさったものだろうと仰っていました」
機械工学の枠を超えて脳や神経回路モデルの知見を積極的にロボット研究へ取り入れていった尾形教授は、これまで機械工学の専門領域であったロボット開発と情報科学の分野である深層学習研究の視点の違いにも気づいたという。
「機械工学は、物理世界を物理の微分方程式で解きたいという人たちが集まっています。ロボットはプログラムされた軌道に矛盾なく追従することが普通で、彼らにとっての情報とは、機械を動かすための『ライブラリ』くらいの認識であることが多いです。一方、情報工学に属するAI研究者は世界を確率統計の式で解きたいと考えていて、彼らにとってロボットなどの機械は多くの場合『情報端末』です。これからの知能ロボット開発ではこの大きなギャップを乗り越えていくことが求められるでしょう」
「反射」で動くロボット、
「経験」から学習するロボット
現在、知能ロボット応用については大きく2つの流れがあると語る尾形教授。1つはモデルベースと呼ばれる方法である。最も一般的な方法で、たとえば、移動ロボットであれば、カメラを用いた自己位置推定・マッピング技術を使い、環境のモデルを利用して移動する。もう1つは、ロドニー・ブルックス(元MITコンピューター科学・AI研究所所長、アイロボット共同創業者)らが作ったサブサンプション・アーキテクチャーの流れだ。1990年代以降で成功例として語られるのが、アイロボットの自動掃除機「ルンバ」である。
「サブサンプションは昆虫の知能をモチーフとしていて、簡単な『反射』をするモジュールをたくさん組み合わせて階層化することで結果的に目的とする行動を達成しています。このビヘイビア(振る舞い)ベースでのロボットの成功例がルンバで、カメラなどの情報は利用せず、実際の身体を使って部屋のあちこちにぶつかって方向を変えていくことの積み重ねで、結果的に『掃除をする』ロボットとして成立します。いったんうまく動くようになれば環境のノイズにも強い手法ですが、さらに進化させるならば人間が試行錯誤を繰り返す必要があります。つまり、この設計方法も学習ロボットとは呼びにくい面があります」
近年発達を遂げた深層学習は、人間によるモデリングを大きく省略できることが最大の特徴である。すでに画像解析や音声認識、自然言語処理の分野ではその成果が表れていて、たとえば、画像解析の分野では大量のデータと答えを与えることで画像の規則性(特徴量)を計算し、それが何であるかを判別できる。この「データ」と「答え」を与えておくだけで細かい部分まで学習したように振る舞う深層学習は、先のビヘイビアベースドロボットを拡張する上で相性が良いという。
「今はまだロボットへの深層学習の導入は、この物体を見る(認識する)というところに使われるのが大半です。しかし、僕の興味はその先にあって、身体のコントロールまでを含めた学習に用いることを考えています。この場合に学習するのは人間がラベリングした『データ』ではなく、ビヘイビアベースドロボットのような身体を持ったシステムが自身の行動とその結果から創られるもの、これを『エクスペリエンス(経験)』と呼んでいます」
人の動きを模倣し、世界の変化を予測する
複数のセンサーを用いて外部環境を知覚し、ロボット自らの行動によって世界(環境)がどう変わるか、その変わった世界でロボットはどう動くべきかという「経験」ベースのロボット開発には、与えられたエ …