AIに創造性を吹き込む「GAN」とはどんなテクノロジーか?
知性を宿す機械

Inside the world of AI that forges beautiful art and terrifying deepfakes AIに創造性を吹き込む「GAN」とはどんなテクノロジーか?

敵対的生成ネットワーク(GAN)はAIの創造性を伸長させると同時に、ある種の「危うさ」をもたらしている。その基礎となる考え方を紹介しよう。 by Karen Hao2018.12.07

この3週間、MITテクノロジーレビューは人工知能(AI)の基本を紹介してきた(関連記事1関連記事2)。以下に要約する。

 

さて、お楽しみはここからだ。ニューラル・ネットワークを1つ使用すると、パターンを学習するのにとても役立つ。そしてこれを2つ使用すると、パターンを作り上げるのに素晴らしく役立つのだ。「GAN(Generative Adversarial Network)」と呼ばれる敵対的生成ネットワークの、不思議で恐ろしい世界を紹介しよう。

GANは現在、文化面でちょっとした話題になっている。AIによって制作された芸術作品として初めてクリスティーズ(Christie’s)で競売された作品に関わっているのがGANなのだ。さらに「ディープフェイク」と呼ばれる、一連のニセ物のデジタル画像の背後にもGANが存在する。

GANの秘密は、2つのニューラル・ネットワークが協働して、というよりむしろ敵対しながら作用することにある。まず、両方のニューラル・ネットワークに訓練データをたくさん与え、それぞれのネットワークに別々のタスクを与える。生成器(generator)と呼ばれる最初のネットワークは、訓練例を見て模倣することによって、手書き文字や動画、音声といった人工的な出力を生成する。次に、識別器(discriminator )と呼ばれる第2のネットワークは、各出力を生成ネットワークと同じ訓練例と比較し、その出力が本物がどうかを判定する。

識別器が生成器の出力の却下に成功するたびに、生成器はまた最初からやり直そうとする。MITテクノロジーレビューのサンフランシスコ支局長マーティン・ジャイルズのたとえを借りると、このプロセスは「互いに出し抜こうと繰り返し試みる絵の贋作師と鑑定士のやり取りを真似て」いる。最終的に識別器は出力と訓練例との違いが分からなくなってしまう。言い換えると、模倣と現実の見分けがつかなくなるのだ。

GANの存在する世界が美しくもあり、醜くくもある理由がこれでお分かりだと思う。一方ではメディアを合成したり他のデータ・パターンを模倣したりできる能力が、写真の編集やアニメーション、さらには医学(医用画像の画質改善や、患者のデータ不足を克服するなど)の分野で役に立つかもしれない。また、このような楽しい作品も見られるようになる。

これも、そうだ。

だがその一方で、GANを倫理的に好ましくない方法や、危険な方法で使おうという人も出てくるかもしれず、そうした能力を示したニューヨーク大学とミシガン州の研究者チームの論文も最近発表された。たとえば、ポルノスターの顔の上に有名人の顔を重ねたり、バラク・オバマに何でも好きなことを言わせる、あるいは他人の指紋やその他の生体データを偽造するといったことだ。

幸いなことに、GANの能力にはまだ限度があり、ある程度はガード・レール代わりになっている。GANが本当に信じられるようなものを生み出すには、相当な計算能力と狭い範囲のデータが必要となる。たとえば、GANが本物そっくりのカエルの画像を生成するには、特定の種の、できれば同じ方向を向いたカエルの画像が大量に必要となる。このように細かく指定しなければ、まるで最悪な悪夢に出てくるこの生き物のように、本当に不気味な結果を招いてしまう。

(クモを見せないことに感謝してね)。

だが専門家たちは、私たちが目にしているのはまだ氷山の一角にすぎないと危惧している。アルゴリズムがますます洗練されるにつれ、動きのおかしい動画やピカソの絵に出てくるような動物は過去のものとなるだろう。デジタル画像フォレンジック(鑑定)の専門家であるハニー・ファリド教授(ダートマス大学)が以前話しているように、私たちはこの問題を解決する準備が十分にできていないのだ。