谷口忠大教授が考える、「システム3」時代のAI研究の未来像
AI・ロボティクスの研究開発が加速度的に進んでいる。記号創発ロボティクスの研究に長年取り組んできた谷口忠大・京都大学情報学研究科教授はこの現状をどのように見ているのか。話を聞いた。 by MIT Technology Review Japan2024.08.03
MITテクノロジーレビューが主催する世界的なアワードの日本版「Innovators Under 35 Japan(イノベーターズ・アンダー35ジャパン)」が、「コンピューター/電子機器」、「ソフトウェア」、「インターネット」、「通信」、「AI/ロボット工学」、「輸送/宇宙開発」、「エネルギー/持続可能性」、「医学/生物工学」の8分野で、8月8日まで応募を受け付けている。事前審査を経て、書類による専門家審査によって本年度のイノベーターが決定される。
本年度の審査員の1人である谷口忠大氏は、京都大学大学院情報学研究科教授を務める一方、パナソニックのシニアテクニカルアドバイザーも務めている。アカデミック、民間企業の双方向から、AI・ロボット研究、新規事業の技術戦略の策定に携わっている谷口氏に、研究の現状や課題、イノベーターの条件についてインタビューした。
◆◆◆
知能の本質的な基底にあるものを探り続ける
──谷口先生が研究されている記号創発システム、記号創発ロボティクスとは、どのような内容でしょうか?
京都大学工学研究科の博士課程在籍時に、記号創発システムという概念に至り、2010年に書籍『コミュニケーションするロボットは創れるか 記号創発システムへの構成論的アプローチ』(NTT出版)を出版し、記号創発ロボティクスとしてロボットへの応用を続けています。
言語(より一般的には記号システム)は個人の視点からは発達的に学習されるものである一方で、それ自体が進化的に形成されるものでもあります。このようにボトムアップに言語や記号が立ち現れる様を広く言語(記号)創発と呼んでいます。人工知能(AI)における言語学習や表現学習における議論は個体のエージェントによる学習の議論に終始しがちです。しかし、言語とは外在する言語資源を一体のエージェントがただ内化し保持するだけのものではありません。言語とは社会の中で分散的に保持されて、また常にその使用を通して変容していくものです。その言語を使用し他者とコミュニケーションし、その言語からのトップダウンな影響を受けながら私たちは世界を認識しています。記号創発システムはそのような記号システムそのものが個人の環境適応を起点としながら、社会の中で創発し、機能する様を表した図式的なモデルです(参照:谷口忠大「集合的予測符号化に基づく言語と認知のダイナミクス:記号創発ロボティクスの新展開に向けて」認知科学第31巻第1号,2024.pp.186–204)。
我々の言語は事前に形式化されたものだけではなく、たとえば掛け声によるコミュニケーションなど、さまざまなサインを使います。自らから出すサインで他者の行動を変化させ、また他者から受けるサインで自らの行動を変化させることで,集団としての環境適応的な行動を実現させています。記号創発システムは記号システムそのものではなく、ある条件を満たした認知ダイナミクスを有するエージェント集団を表す言葉です。各エージェントは人間であっても、ロボットであっても構いません。
日常の中でその意味を柔軟に変えながらコミュニケーションしていくことが、人間同士のコミュニケーションの本質的な部分で、人間と共にある存在としてのAIロボットとのコミュニケーションでも重要であると考えて、研究を続けてきました。技術的な細部はもちろん機械学習技術等の進化に伴い変わってきているのですが、今後も貫こうと思っているところです。
また、他者と同じ環境でコミュニケーションを図るという意味では、身体が大事になります。人間や(未来の)ロボットは環境との身体的相互作用に基づき記号的相互作用の影響を受けながら内的表象系を形成します。AIの研究自体もマルチモーダル大規模言語モデルが実用に付されるようになり、マルチモーダルが大事であると全世界的な合意がなされてきた感じですが。
──AIの進展を見ると、先生が目指している研究内容が世間とが合致してきた印象があります。
合致してきましたが、自分たちの研究が世界を牽引するメインストリームになれていないのは残念に思っているとことではあります。これからの学術展開としては、言語創発の議論に重ねながら、マルチエージェント的、社会的な方向への理論的な展開にも力を入れていきたいと思っています。
──スマートシティとは異なるかもしれませんが、社会を自動化するマルチエージェントシステムのようなことを京都大学の方で進められるのでしょうか?
スマートシティと呼ぶのは語弊がありますね。記号創発システムの視点で知能を考えると言語とは多種エージェントの集合的予測符号化により、世界の情報をコーディングしているものと考えられます。私たちの知能とは個に閉じたものではない。社会的な知能というものを身体に接地した形で、創発的にとらえていきたいと思います。
──大学での研究に加えて、パナソニックではシニアテクニカルアドバイザーとして、新規事業の創出、社会課題の解決などにも取り組んでいますね。
パナソニックとは2017年に日本で始めての学から産のクロスアポイントメント契約を実現させていただいてから、長いコラボレーションをさせていただいています。産と学の深いレベルでのコラボレーションは様々な視点で重要だと思います。
僕は学術研究を農業に例えることが多いのですが、基礎的な研究的を進めることは、樹木の幹や枝を育てることであり、そして樹木の先になるリンゴのような果実が応用研究の応用であると考えています。応用だけを狙うことは、果実を取るために成長した木の先に目を向けることになります。一方で、樹木を生やすことに興味がある場合、基礎研究を進めることになるのですが、樹木に果実がなることを示していかないと、現代社会においては木を伸ばしているだけだと言われます。
「システム3」の世界で人間とAIはどのように共生していくか
──現在、特に関心を持たれているのはどのような分野ですか?
関心を持っている分野は広いですが、自分自身の軸として持ってきた記号創発システム論がある意味で新しいフェーズに入っていて、それに関わって最近「システム3」という言葉を使いだしています。それに関わって広く人文社会科学系の分野にも広がりを持って議論を広げているところです。
ディープラーニングの父とも呼ばれるシュア・ベンジオ氏が、国際会議NeurIPSの講演で「システム1」と「システム2」という概念を引用したことで、一躍AI分野で多く語られるようになりました。この概念は元々、ダニエル・カーネマン氏が著書『ファスト&スロー』(ハヤカワ文庫)において広く知らしめたことで一般に有名になりましたが、人間の意思決定を直感的かつ感情的な「速い(ファストな)思考:システム1」と、意識的かつ論理的な「遅い(スローな)思考:システム2」に分類したものです。
5年ほど前までは、ディープラーニングはパターン認識などのシステム1に対応する「速い思考」を実現することが得意であったが、システム2に対応する「遅い思考」は苦手だという認識でした。そこにディープラーニングが手を伸ばすにはどうしたらよいか? というのが当時の問いでした。しかし、近年では大規模言語モデルがこの「遅い思考」の部分を担当しているように見えます。その意味で、システム2として語られた部分に関しても相当な水準で処理できるようになっています。
大規模言語モデルは言語を学習して賢くなります。ただ言語はそれ自体が、創発的な存在です。私たち人間は言語を作ることによって、集団として世界を把握し、適応しているわけです。私自身は記号創発システム論を提唱し、そういった言語自体の適応を通した、人間の環境適応を議論していました。最近では集合的予測符号化という概念を提唱し、言語とは多くの人間によって担われる分散的なベイズ推論の結果だというような理論を議論しています。この視点によると、言語や社会というより上位の主体が、人間というシステムの上に立ち現れてくるというような描像が生まれます。これをシステム3と名付けています。
イノベーターは信念を貫き通せ
──テスラが二足歩行ロボットを開発に取り組んだり、グーグル・ディープマインドがRobotic Transformer 2(RT-2)を発表したり、ロボティクスの研究開発が進んでいます。海外のAI企業の動向についてはどのように見ていますか?
加速度的に進展していますよね。いろいろな分野が資本主義経済下では「産業とつながったら、資本投下で一気に加速するよ」と言われていますが、それを今、肌身で感じていています。特に米国西海岸の大学の周りにさまざまなステークホルダーが集い、資本と人材を回しながら、事業化を進めるようなエコシステムがあり、これが本質的な役割を担っているように思います。東京大学の松尾豊先生などは明確にエコシステムを生み出す意思を持って十年来されていますが、例えば京都をはじめとした関西圏においても個々の研究のみならずエコシステムの形成に目を向けて努力していく必要があると考えています。
──これほど変化が激しいと、若い人はどのように研究していけば良いのでしょうか。谷口先生が考えるイノベーターとはどんな人でしょうか?
イノベーションは、時代の中で生まれてくる面があります。それゆえにアイデアが本質的に良くても、不遇の時代を過ごすこともあります。そんな中で、ニューラルネットワークは「冬の時代」を生き抜きました。ジェフリー・ヒントン氏やベンジオ氏を初めとした主要な研究者が、ニューラルネットワーク「冬の時代」を超えて、ディープラーニングとして分野を花咲かせたことは尊敬すべきことだと考えています。
イノベーターにはある種の信念を持っていてほしいし、イノベーターはリーダーシップと共にあってほしいと思っています。
──信念を持つこともイノベーターには重要なのですね。
そうですね。信念と共に生き抜くこともまた大事です。ヒントン氏やベンジオ氏の周辺のコミュニティの動きを見ると、その時代の理論をうまく取り込みながら生き抜いているところがあります。新しいアイデアも取り込み、微調整を図りながら、でも一貫して続けるというのが大事なのではないでしょうか。
また、研究を続ける中で「量が質に転化する」こともまたあります。自分の核心となるアイデアは中心に据えつつ、様々なことに取り組み、学んだことを取り入れていくことも大切でしょう。イノベーターにはそういうさまざまなエクスプラレーションは非常に大事だし、それを通じた人とのネットワーク形成も重要だなと思っています。
MITテクノロジーレビューは[日本版]は、才能ある若きイノベーターたちを讃え、その活動を支援することを目的とした「Innovators Under 35 Japan」の候補者を募集中(8月8日まで締め切りを延長)。詳しくは公式サイトをご覧ください。
- 人気の記事ランキング
-
- What’s on the table at this year’s UN climate conference トランプ再選ショック、開幕したCOP29の議論の行方は?
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- This AI-generated Minecraft may represent the future of real-time video generation AIがリアルタイムで作り出す、驚きのマイクラ風生成動画
- MITテクノロジーレビュー編集部 [MIT Technology Review Japan]日本版 編集部
- MITテクノロジーレビュー(日本版)編集部