2014年のある夜、イアン・グッドフェロー博士は博士課程を修了したばかりの友人を祝うために、モントリオールで人気のビアパブ、レ・トロア・ブラッスールへ出かけた。そのとき、数名の友人が取り組み中のプロジェクトについてグッドフェロー博士に助言を求めてきた。コンピューターに写真を作らせる研究で困っているというのだ。
研究者らはそのときすでに、ニューラル・ネットワークを「生成」モデルとして使って、もっともらしい写真をコンピューターに新たに作らせようとしていた。ニューラル・ネットワークとは人間の脳の中の神経細胞網を大まかにモデル化したアルゴリズムのことだ。だが、結果はあまり芳しくなかった。コンピューターが作った顔写真はぼやけていたり、耳がないなどの間違いがあったりした。相談を持ち掛けてきた友人たちは、機械自身が画像を考え出せるように、写真の構成要素の複雑な統計分析をしようと考えていた。これは膨大で煩雑な処理が必要になりそうなもので、うまくいかないのではないかとグッドフェロー博士は言った。
ビールを飲みながらグッドフェロー博士はこの問題についてあれこれ考えるうちに、あることを思いついた。2つのニューラル・ネットワークを競わせたらどうだろう? 友人たちは懐疑的だった。そこでグッドフェロー博士は、すでにガールフレンドが熟睡していた家にいったん戻ると、試しにやってみた。朝まで寝ないでコーディングして出来上がったソフトウェアを試したところ、1回目でうまくいった。
その夜グッドフェロー博士が考案したモデルは現在、「競争式生成ネットワーク(GAN: Generative Adversarial Networks)」と呼ばれている。GANは機械学習分野の研究者を熱狂させ、グッドフェロー博士は一躍、人工知能(AI)界の有名人になった。
ここ数年、AI研究は深層学習という手法を使って目覚ましい進歩を遂げてきた。充分な数の画像を深層学習システムに与えれば、たとえば、道を横切ろうとする歩行者を認識するように学習できる。自動運転車や、アレクサやSiriなどのバーチャル・アシスタントに使われている会話技術は、この手法を使って実現している。
だが、深層学習AIは何かを認識することはできても、何かを創り出すことは得意ではない。GANの目標は、機械に想像力のようなものを与えることだ。
そうすれば、機械が美しい絵画を描いたり作曲できたりするようになるだけでなく、世界やその仕組みについて人間が教えなければならないことを減らせるだろう。現在のAIプログラマーは、機械に与える訓練用データの内容を正確に機械に教えなければならない。たとえば、この100万枚は道路を横切る歩行者の写真で、こちらの100万枚はそうではないといった具合だ。こうした作業はコストがかかるだけでなく人手も必要となる。それにこの手法では、訓練された内容からわずかでも乖離があるものについては、正確に取り扱うのが難しくなる。コンピューターは将来、大量の生データを取り込んで、何を学習する必要があるのかを、誰からも指示されずにうまく決められるようになるはずだ。
そのことは「教師なし学習」として知られるAIに飛躍的な進歩をもたらすだろう。自動運転車が、ガレージに止まったままで多くの異なる道路の状態を学べるかもしれない。煩雑な倉庫で働くロボットが、あたりを連れ回されなくても、ぶつかりそうな障害物を予測できるようになるかもしれない。
想像力を働かせて多くの異なるシナリオを想定する能力があるがゆえに、われわれは人間だといえる。未来のテクノロジー史の学者が過去を振り返ったとき、GANは、人間のような意識を持った機械の創造へ向けての大きな一歩と見られるだろう。フェイスブックのAI主任科学者であるヤン・レクン博士は、GANを「深層学習における最近20年で最高の発明」だと呼んだ。また、バイドゥの元主任科学者でAI界の …