何を手に入れたと思う?テキサス州選出のテッド・クルーズ上院議員がティナ・ターナーの曲に合わせて歌い踊る、バツの悪い映像だ。11月の中間選挙では、クルーズ上院議員のライバル候補たちがこの映像を流して茶化すことだろう。ドナルド・トランプがクルーズ上院議員を「ダンシング・テッド」と呼ぶ姿が目に浮かぶ。
オーケー、白状しよう。この動画を作ったのは私だ。だがここで厄介なのは、この動画を編集するのに特別なスキルは必要ないということだ。私は、機械学習を使って本物らしく見えるデジタル顔交換(フェイススワップ)を実行するソフトウェアをダウンロードし、設定した。こうして出来上がった「ディープフェイク」と呼ばれる映像では、クルーズ上院議員特有の垂れ目顔が、クチパクで歌う俳優のポール・ラッドの顔とすげ替えられている。若干不自然で、完璧ではないが、騙される人がいるかもしれない。
写真の偽造に目新しさはないが、人工知能(AI)によって状況は一変するだろう。つい最近まで、フェイススワップ映像を作り出せるのは、莫大な予算のある映画スタジオだけだった。おそらく数百万ドルの費用がかかったはずだ。今ではAIのおかげで、まともなコンピューターを持つ人なら誰でも2〜3時間で同様のことができる。さらに、機械学習の進歩でさらに複雑な偽造が可能になり、本物と見分けるのは困難になるだろう。
こういった進歩により、政界における、真実とフィクションの間の一線がますます曖昧になるおそれがある。すでにインターネット上の偽のソーシャルメディア・アカウントを通して、虚偽情報の流布が加速し増加している。「もう1つの事実(オルタナティブ・ファクト)」や陰謀説は一般的になり、広く信じられている。フェイクニュースは、前回の米国大統領選挙に影響を及ぼした可能性があるだけでなく、ここ一年でミャンマーやスリランカでの民族紛争を引き起こした。本物らしく見える新しい種類のフェイク映像を混乱の中に投じたと想定してみよう。たとえば、ばかげたことや民族を侮辱するようなことを言う政治家や、不適切な振る舞いをとらえられた政治家のフェイク映像だ。もちろん、実際にそんなことは起きていない。
「ディープフェイクは政治演説を妨害する可能性を秘めています」というのは、『Virtual Unreality: Just Because the Internet Told You, How Do You Know It's True?(バーチャル・アンリアリティ)』(2014年、未邦訳)の著者であるニューヨーク大学のチャールズ・セアイフ教授だ。セアイフ教授は、本を出版した2014年から、世の中が大きく進歩したことに驚いているという。「テクノロジーは驚異的な速さで「現実」に対する私たちの概念を変えています」(セアイフ教授)。
本当の「ニュース」を映しているように見える本物のような映像ですら疑うような、何も信じられなくなる時代へ突入しようとしているのだろうか? 何を信頼すべきかを、どう決めたら良いのだろうか? 誰を信じたらいいのだろうか?
リアルなフェイク
いくつかのテクノロジーを集めれば、偽造は簡単だ。誰でもスマホで動画を撮影できるし、高性能なコンピューター・グラフィックス・ツールの価格は極めて安くなった。テクノロジーを入手することも容易なのだ。これにAIソフトウェアを加えてみよう。AIソフトウェアは圧倒的に新しい方法で、映像をひずませたり、混ぜ合わせたり、合成したりする。AIはフォトショップ(Photoshop)やアイムービー(iMovie)の高性能版ではない。AIによってコンピューターは、世界がどのように見え、どのように聞こえるかを学習し、本物そっくりの画像を描き出すのだ。
私は、無料でダウンロードできるフェイススワッピング・プログラムの1つ「オープン・フェイス・スワップ(OpenFaceSwap)」を用いてクルーズ上院議員の映像を作った。数千ドルかかる高性能グラフィックチップを搭載したコンピューターが必要だが、「ペーパースペース(Paperspace)」のようなクラウド機械学習プラットフォームを利用すれば、分当たり2〜3セントで仮想マシンへのアクセス権を得られる。2つの映像を入力し、2〜3時間放っておけば、アルゴリズムがそれぞれの顔の特徴や動きを解析し、片方をもう1つの顔に貼り付けてくれる。成功させるにはセンスが必要だ。あまりにも異なる映像を選んでしまうと、鼻や耳、あごなどが一緒くたになり散々な結果になってしまう。
しかし、その工程は極めて簡単だ …