機械学習で誰でも「憧れの声」になれる新技術、なりすまし危険も
機械学習の手法を使うことで、自分の声を、あらゆる年齢やジェンダーの声にリアルタイムで変換できるテクノロジーが開発された。訓練用の音声データさえあれば誰の声でも模倣することが可能で、声による「なりすまし」に悪用される可能性もある。 by Will Knight2019.03.19
これが私のもう1人の自分、ケイティだ。
しゃべり声のアクセントや感情、抑揚はすべて私のものだ。だが、声の高い若い女性のように聞こえる。
私の女性的な「ボイス・スキン」を作ったのは、マサチューセッツ州ケンブリッジにあるモデュレート・ドットAI(Modulate.ai)という企業だ。同社は機械学習を用いた強力な新種の手法によって、声の特徴をコピーして、モデリングし、操作することを可能にした。
このテクノロジーは、カイロ・レン(スター・ウォーズの登場人物)のような声で話せるようにする単純な音声フィルターを遥かに超えるものだ。この手法を使えば、あらゆる年齢、ジェンダー、声のトーンなどをすべて、リアルタイムで装うことが可能になる。有名人の声を模倣することもできる。その気になれば、私はケイティになりすまして電話で長々と話すこともできるのだ。
私はモデュレートの本社を訪れ、同社のテクノロジーや目標について聞き、人工知能(AI)を使って他人の声を模倣することの倫理的影響について話した。防音ブースに入った私は、同社のボイス・スキンをいくつか試してみた。
これが私の実際の声だ。
そしてこちらが別の人格の声だ。
2つの人格の間を、リアルタイムで行き来することもできる。
このボイスモデリング・テクノロジーは完璧ではない。作られた声には若干の震えがある。だが非常に質が高く、音声データを与えていくとさらに改善される。このことは、機械学習の発展がいかにデジタル・リアリティを急速に変化させ始めているかを示している。モデュレートは敵対的生成ネットワーク(GANs)を用いて、音声信号のオーディオ特性のキャプチャーとモデリン …
- 人気の記事ランキング
-
- What’s on the table at this year’s UN climate conference トランプ再選ショック、開幕したCOP29の議論の行方は?
- Why AI could eat quantum computing’s lunch AIの急速な進歩は 量子コンピューターを 不要にするか
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール