KADOKAWA Technology Review
×
【春割】実施中!年間購読料20%オフ!
AIに創造性を吹き込む「GAN」とはどんなテクノロジーか?
Nvidia
Inside the world of AI that forges beautiful art and terrifying deepfakes

AIに創造性を吹き込む「GAN」とはどんなテクノロジーか?

敵対的生成ネットワーク(GAN)はAIの創造性を伸長させると同時に、ある種の「危うさ」をもたらしている。その基礎となる考え方を紹介しよう。 by Karen Hao2018.12.07

この3週間、MITテクノロジーレビューは人工知能(AI)の基本を紹介してきた(関連記事1関連記事2)。以下に要約する。

  • AIの進歩と応用のほとんどが、データのパターンを見つけて再適用する、機械学習と呼ばれる種類のアルゴリズムに基づいている
  • 機械学習の強力なサブセットである深層学習は、ニューラル・ネットワークを使用して最小のパターンさえも見つけ、それを増幅する
  • ニューラル・ネットワークとは単純な計算ノード層で、複数のノードが同時に働いてデータを分析する。人間の脳内のニューロンのようなものだと考えればよい

 

さて、お楽しみはここからだ。ニューラル・ネットワークを1つ使用すると、パターンを学習するのにとても役立つ。そしてこれを2つ使用すると、パターンを作り上げるのに素晴らしく役立つのだ。「GAN(Generative Adversarial Network)」と呼ばれる敵対的生成ネットワークの、不思議で恐ろしい世界を紹介しよう。

GANは現在、文化面でちょっとした話題になっている。AIによって制作された芸術作品として初めてクリスティーズ(Christie’s)で競売された作品に関わっているのがGANなのだ。さらに「ディープフェイク」と呼ばれる、一連のニセ物のデジタル画像の背後にもGANが存在する。

GANの秘密は、2つのニューラル・ネットワークが協働して、というよりむしろ敵対しながら作用することにある。まず、両方のニューラル・ネットワークに訓練データをたくさん与え、それぞれのネットワークに別々のタスクを与える。生成器(generator)と呼ばれる最初のネットワークは、訓練例を見て模倣することによって、手書き文字や動画、音声といった人工的な出力を生成する。次に、識別器(discriminator )と呼ばれる第2のネットワークは、各出力を生成ネットワークと同じ訓練例と比較し、その出力が本物がどうかを判定する。

識別器が生成器の出力の却下に成功するたびに、生成器はまた最初からやり直そうとする。MITテクノロジーレビューのサンフランシスコ支局長マーティン・ジャイルズのたとえを借りると、このプロセスは「互いに出し抜こうと繰り返し試みる絵の贋作師と鑑定士のやり取りを真似て」いる。最終的に識別器は出力と訓練例との違いが分からなくなってしまう。言い換えると、模倣と現実の見分けがつかなくなるのだ。

GANの存在する世界が美しくもあり、醜くくもある理由がこれでお分かりだと思う。一方ではメディアを合成したり他のデータ・パターンを模倣したりできる能力が、写真の編集やアニメーション、さらには医学(医用画像の画質改善や、患者のデータ不足を克服するなど)の分野で役に立つかもしれない。また、このような楽しい作品も見られるようになる。

これも、そうだ。

だがその一方で、GANを倫理的に好ましくない方法や、危険な方法で使おうという人も出てくるかもしれず、そうした能力を示したニューヨーク大学とミシガン州の研究者チームの論文も最近発表された。たとえば、ポルノスターの顔の上に有名人の顔を重ねたり、バラク・オバマに何でも好きなことを言わせる、あるいは他人の指紋やその他の生体データを偽造するといったことだ。

幸いなことに、GANの能力にはまだ限度があり、ある程度はガード・レール代わりになっている。GANが本当に信じられるようなものを生み出すには、相当な計算能力と狭い範囲のデータが必要となる。たとえば、GANが本物そっくりのカエルの画像を生成するには、特定の種の、できれば同じ方向を向いたカエルの画像が大量に必要となる。このように細かく指定しなければ、まるで最悪な悪夢に出てくるこの生き物のように、本当に不気味な結果を招いてしまう。

(クモを見せないことに感謝してね)。

だが専門家たちは、私たちが目にしているのはまだ氷山の一角にすぎないと危惧している。アルゴリズムがますます洗練されるにつれ、動きのおかしい動画やピカソの絵に出てくるような動物は過去のものとなるだろう。デジタル画像フォレンジック(鑑定)の専門家であるハニー・ファリド教授(ダートマス大学)が以前話しているように、私たちはこの問題を解決する準備が十分にできていないのだ。

人気の記事ランキング
  1. A new US phone network for Christians aims to block porn and gender-related content ポルノもLGBTも遮断、キリスト教徒向けMVNOが米国で登場
  2. Musk v. Altman week 1: Elon Musk says he was duped, warns AI could kill us all, and admits that xAI distills OpenAI’s models 「オープンAIを蒸留した」マスク対アルトマン第1週、法廷がざわめく
  3. Will fusion power get cheap? Don’t count on it. 核融合は本当に安くなるのか? 楽観論に「待った」をかける新研究
カーレン・ハオ [Karen Hao]米国版 寄稿者
受賞歴のあるフリー・ジャーナリスト。人工知能が社会に与える影響について取材している。ウォール・ストリート・ジャーナル紙の海外特派員として中国のテクノロジー業界を担当。2022年4月まではMITテクノロジーレビューのAI担当上級編集者を務めた。
MITテクノロジーレビューが選んだ、 世界を変える10大技術

MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。

特集ページへ
AI革命の真実 誇大宣伝の先にあるもの

AIは人間の知能を再現する。AIは病気を根絶する。AIは人類史上、最大にして最も重要な発明だ——。こうした言葉を、あなたも何度となく耳にしてきたはずだ。しかし、その多くは、おそらく真実ではない。現在地を見極め、AIが本当に可能にするものは何かを問い、次に進むべき道を探る。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る