機械学習で誰でも「憧れの声」になれる新技術、なりすまし危険も
機械学習の手法を使うことで、自分の声を、あらゆる年齢やジェンダーの声にリアルタイムで変換できるテクノロジーが開発された。訓練用の音声データさえあれば誰の声でも模倣することが可能で、声による「なりすまし」に悪用される可能性もある。 by Will Knight2019.03.19
これが私のもう1人の自分、ケイティだ。
しゃべり声のアクセントや感情、抑揚はすべて私のものだ。だが、声の高い若い女性のように聞こえる。
私の女性的な「ボイス・スキン」を作ったのは、マサチューセッツ州ケンブリッジにあるモデュレート・ドットAI(Modulate.ai)という企業だ。同社は機械学習を用いた強力な新種の手法によって、声の特徴をコピーして、モデリングし、操作することを可能にした。
このテクノロジーは、カイロ・レン(スター・ウォーズの登場人物)のような声で話せるようにする単純な音声フィルターを遥かに超えるものだ。この手法を使えば、あらゆる年齢、ジェンダー、声のトーンなどをすべて、リアルタイムで装うことが可能になる。有名人の声を模倣することもできる。その気になれば、私はケイティになりすまして電話で長々と話すこともできるのだ。
私はモデュレートの本社を訪れ、同社のテクノロジーや目標について聞き、人工知能(AI)を使って他人の声を模倣することの倫理的影響について話した。防音ブースに入った私は、同社のボイス・スキンをいくつか試してみた。
これが私の実際の声だ。
そしてこちらが別の人格の声だ。
2つの人格の間を、リアルタイムで行き来することもできる。
このボイスモデリング・テクノロジーは完璧ではない。作られた声には若干の震えがある。だが非常に質が高く、音声データを与えていくとさらに改善される。このことは、機械学習の発展がいかにデジタル・リアリティを急速に変化させ始めているかを示している。モデュレートは敵対的生成ネットワーク(GANs)を用いて、音声信号のオーディオ特性のキャプチャーとモデリン …
- 人気の記事ランキング
-
- OpenAI has created an AI model for longevity science オープンAI、「GPT-4b micro」で科学分野に参入へ
- Promotion Innovators Under 35 Japan × CROSS U 無料イベント「U35イノベーターと考える研究者のキャリア戦略」のご案内
- AI means the end of internet search as we’ve known it 「ググる」時代の終わり、 世界の知識を解き放つ 生成AI検索がもたらすもの
- 10 Breakthrough Technologies 2025 MITTRが選んだ 世界を変える10大技術 2025年版
- Driving into the future 「世界を変える10大技術」の舞台裏、2024年の誤算とは?