KADOKAWA Technology Review
×
【3/14東京開催】若手研究者のキャリアを語り合う無料イベント 参加者募集中
ニュース Insider Online限定
Baidu’s Artificial Intelligence Lab Unveils Synthetic Speech System

バイドゥ、音声合成の調整を深層学習で短縮しグーグルを出し抜く

バイドゥの人工知能研究所が、グーグルの子会社ディープマインドを上回る成果を発表した。グーグルの研究では実用化が難しかった音声合成の微調整を、深層学習により、人間が関わらずに数時間で完了できるようにしたのだ。 by Emerging Technology from the arXiv2017.03.09

深層学習の手法を実社会に適用する競争では、1社が独走の状態だ。グーグルの子会社であるディープマインドは、ビデオゲームや古典的ゲーム「囲碁」で人間を打ち負かせる機械の開発に強化学習を使った。さらに昨年に、グーグルの翻訳サービスがバックエンドで深層学習の手法を導入したことで、翻訳精度が劇的に改善された。

こうなると、競合他社がグーグルに追いつくため、どう奔走しているのかを見るのは興味深い。今回は「中国版グーグル」と称されることもあるインターネット検索企業バイドゥの出番だ。バイドゥは2013年に人工知能研究所をシリコンバレーに開設した。「この研究所は最近何をしているのか?」は興味深い疑問ではないだろうか。

バイドゥの人工知能研究所は、音声合成の研究を初公開した。音声を合成できるまでに必要な微調整の量をどう削減できるか、という音声合成における課題のひとつに挑んだ研究だ。バイドゥはこの点で、人間がほとんど干渉せずに済む深層学習マシンを開発し、大きな飛躍を遂げた。ほとんど、あるいはまったく人間が干渉することなく、わずか数時間で話すことを学習できるテキスト読み上げ(Text-to-Speech)システム「ディープ・ボイス」を成果として発表したのだ。

まず、いくつかの背景について説明しておこう。テキスト読み上げシステムは、案内アプリや音声時計、電話応答システムなど、私たちの日常にありふれている。ただし、従来の音声合成システムは、ひとりの人物の話す言葉を録音して巨大データベースを作り、発声を組み替えて新しいフレーズを作る方法で開発されてきた。

従来型システムには、新しい話し手への切り替えや音声データベースを完全に新しく作り替えずに語勢を変えにくいのが難点だった。そこでコンピューター科学者は、必要なときにゼロからリアルタイムで音声を合成することを目標に、別の手法に取り組んできた。

昨年、グーグル子会社ディープマインドは、この研究領域で重大な飛躍を果たした。ディープマインドは、実際の会話の …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. AI crawler wars threaten to make the web more closed for everyone 失われるWebの多様性——AIクローラー戦争が始まった
  2. Promotion Innovators Under 35 Japan × CROSS U 好評につき第2弾!研究者のキャリアを考える無料イベント【3/14】
  3. From COBOL to chaos: Elon Musk, DOGE, and the Evil Housekeeper Problem 米「DOGE暴走」、政府システムの脆弱性浮き彫りに
  4. What a major battery fire means for the future of energy storage 米大規模バッテリー火災、高まる安全性への懸念
  5. A new Microsoft chip could lead to more stable quantum computers マイクロソフト、初の「トポロジカル量子チップ」 安定性に強み
▼Promotion
U35イノベーターと考える 研究者のキャリア戦略 vol.2
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る