「人工知能(AI)」研究は、これまで3度の大きなブームを経験している。最初の第1次AIブームは1956年のダートマス会議において「人工知能(ArtificialIntelligence)」という言葉が提唱されてから1960年代までの時期。第2次AIブームは専門家の知的能力をエミュレートする「エキスパートシステム」や通産省(当時)が570億円を投じた「第五世代コンピュータ・プロジェクト」が登場した1980年代のことだ。そして、Webやビッグデータの発展、コンピューターの処理能力の飛躍的な向上を背景に、機械学習(マシンラーニング)やその一種である「深層学習(ディープラーニング)」の成果が花開いた2013年以降が第3次AIブームとされる。
進化を遂げたAI研究と取り残された日本
この第3次AIブームの動きと全体像を国内で広く紹介したのが、松尾豊教授の著書『人工知能は人間を超えるか ディープラーニングの先にあるもの』(2015年、KADOKAWA)だ。現在、松尾教授が取り組む研究領域はAI全般に渡り、深層学習を利用して画像や文書などを生み出す「深層生成モデル」やロボットを用いたマルチモーダル学習、それらを発展させて環境そのものを収集した情報から学習する「世界モデル」などが主要なテーマとなっている。特にこの世界モデルはディープマインドが発表した「GQN(Generative Query Network)」で注目を集めた機械学習の重要な理論で、汎用A(I AGI)を目指す方向で最もホットな分野と言える。
2017年には日本ディープラーニング協会代表理事に就任し、AI・深層学習研究や人材育成を国や産業界にも強く働きかけてきた松尾教授が、この5年間を振り返って語ったのは「絶望的」とも形容される日本の状況であった。
「2015年頃は、深層学習がこれから本格的に来るぞ!という期待に満ちた時期でした。ちょうどインターネットの黎明期とよく似た段階だと言えるでしょう。画像認識系の深層学習技術はかなり出尽くして、ビジネスになるものは飛躍的に成功していったという5年間でした。日本はそうした流れの中で大きく出遅れた印象です」
もちろん、第3次AIブーム自体が停滞しているわけではないという。特に深層学習と、話し言葉や書き言葉による「シンボル・マニュピレーション(記号操作)」を融合させる研究が近年盛り上がりを見せているという。
「画像認識に加えて、これからは運動の制御や、記号の処理と融合する時代。深層学習と記号処理が融合するハイブリッドなシステムが注目を集め、非常にエキサイティングなタイミングに差し掛かっていると思います」
深層学習を基礎にした高次のレベルの特徴量を言語と紐付ける研究はすでにかなりの段階にまで進んでいて、その成果の一部は「DeepL翻訳」などの自動翻訳技術にも反映され始めているという。しかし、言語理解を超えたコンセプト・マニピュレーション(概念操作)や知識理解へと至る道のりはまだこれからの課題だという。
「言語理解は2025年から2030年頃には実現できるだろうと5年前に予想していました。一時期は予想よりもずっと研究開発は早かったのですが、このところスピードが落ちついて、だいたい予想どおりになってきました。それはハードウェアの開発を伴うため時間がかかるという要素もありますし、人間が持つ知能の最も優れた特性である『言語』というAI研究の本丸にいよいよ差し掛かる段階を迎えたからだと考えています」
世界的に見ると、AIの学術的研究はカリフォルニア大学バークレー校(UCバークレー)やスタンフォード大学などがリードし、そこから輩出される多くの優秀な人材はシリコンバレーに向けて供給されてきた。そして、グーグルやフェイスブックなどの大手テック企業は有望なAIベンチャーを買収するなど大規模な投資によって先進的な研究開発の規模とスピードを加速させ、それに魅かれた優秀な人材が世界中からさらに集まってくるという好循環を生んでいる。
一方、中国は先進的な研究では米国に及ばないものの、すでに確立している深層学習の技術を産業分野に応用し、こちらも膨大な投資と圧倒的なス …