KADOKAWA Technology Review
×
機械学習で誰でも「憧れの声」になれる新技術、なりすまし危険も
Ms. Tech | Getty images
ニュース 無料会員限定
This AI lets you deepfake your voice to speak like Barack Obama

機械学習で誰でも「憧れの声」になれる新技術、なりすまし危険も

機械学習の手法を使うことで、自分の声を、あらゆる年齢やジェンダーの声にリアルタイムで変換できるテクノロジーが開発された。訓練用の音声データさえあれば誰の声でも模倣することが可能で、声による「なりすまし」に悪用される可能性もある。 by Will Knight2019.03.19

これが私のもう1人の自分、ケイティだ。

しゃべり声のアクセントや感情、抑揚はすべて私のものだ。だが、声の高い若い女性のように聞こえる。

私の女性的な「ボイス・スキン」を作ったのは、マサチューセッツ州ケンブリッジにあるモデュレート・ドットAI(Modulate.ai)という企業だ。同社は機械学習を用いた強力な新種の手法によって、声の特徴をコピーして、モデリングし、操作することを可能にした。

このテクノロジーは、カイロ・レン(スター・ウォーズの登場人物)のような声で話せるようにする単純な音声フィルターを遥かに超えるものだ。この手法を使えば、あらゆる年齢、ジェンダー、声のトーンなどをすべて、リアルタイムで装うことが可能になる。有名人の声を模倣することもできる。その気になれば、私はケイティになりすまして電話で長々と話すこともできるのだ。

私はモデュレートの本社を訪れ、同社のテクノロジーや目標について聞き、人工知能(AI)を使って他人の声を模倣することの倫理的影響について話した。防音ブースに入った私は、同社のボイス・スキンをいくつか試してみた。

これが私の実際の声だ。

そしてこちらが別の人格の声だ。

2つの人格の間を、リアルタイムで行き来することもできる。

このボイスモデリング・テクノロジーは完璧ではない。作られた声には若干の震えがある。だが非常に質が高く、音声データを与えていくとさらに改善される。このことは、機械学習の発展がいかにデジタル・リアリティを急速に変化させ始めているかを示している。モデュレートは敵対的生成ネットワーク(GANs)を用いて、音声信号のオーディオ特性のキャプチャーとモデリン …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. What’s on the table at this year’s UN climate conference トランプ再選ショック、開幕したCOP29の議論の行方は?
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者決定!授賞式を11/20に開催します。チケット販売中。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る