KADOKAWA Technology Review
×
資料を入力、AIが語り出す
ポッドキャスト自動生成の
グーグル新ツールが話題
Stephanie Arnett/MIT Technology Review | rawpixel, envato
人工知能(AI) 無料会員限定
People are using Google study software to make AI podcasts—and they’re weird and amazing

資料を入力、AIが語り出す
ポッドキャスト自動生成の
グーグル新ツールが話題

グーグルの新機能「オーディオ・オーバービュー(Audio Overview)」がネット上で意外な人気を集めている。テキストや動画をアップロードするだけで、AIが自動的にポッドキャストを生成。人間らしい会話と豊かな表現力で内容を解説する。その活用例をいくつか紹介しよう。   by Melissa Heikkilä2024.10.08

「さて、今日は最先端のテクノロジーを詳しく掘り下げていくとしよう」。砕けた調子の米国人男性の声がする。ただし、この声を発しているのは人間ではない。声の源は、「オーディオ・オーバービュー(Audio Overview)」というグーグルの新しい人工知能(AI)ポッドキャストツールだ。このツールが予想外のバイラルヒットとなっている。

Audio Overviewは、およそ1年前にリリースされたAIリサーチ・アシスタント「ノートブックLM(NotebookLM)」の一部として、今年9月中旬に提供が始まった。グーグルの「ジェミニ(Gemini) 1.5」モデルを搭載したNotebookLMは、ユーザーがリンクや動画、PDFファイル、テキストなどのコンテンツをアップロードして関連する質問を投げると、それに回答。コンテンツの短い要約も提供する。

このツールは、「ディープダイブ(Deep Dive)」と呼ばれるポッドキャストを生成する。アップロードした内容について、男性と女性の声で議論するのだ。その声は息をのむほどリアルだ。エピソードには、「おや」「わぁ」「ええ」「ちょっと待って、ちゃんと理解させて」 といった、人間らしく聞こえる語句が散りばめられている。 「ホスト」たちは、お互いの発言を遮ることさえある。

この機能をテストするため、私はMIT テクノロジーレビュー(米国版)の創刊125周年記念号からすべての記事をNotebookLMにコピーし、それを元に10分間のポッドキャストを生成するよう求めた。すると、NotebookLMは注目する記事をいくつか選び出し、ホスト役のAIが記事の要点を見事に伝えてくれた。ぜひ聴いてみてほしい。

MIT テクノロジーレビュー創刊125周年記念号

NotebookLMのプロダクトリーダーを務めるライザ・マーティンは、X(旧ツイッター)で、このAIシステムは、「ほんの少しのコンテンツと引き換えに魔法を創り出す」 ように設計されていると語っている。音声モデルは、感情的で人を惹きつける音声を生み出すように意図されており、「明るく、強い関心を示す口調」でそれを表現しているとマーティンは言う。

もともと学習用ツールとして登場したNotebookLMは、ユーザーたちの間で独自の使い方をされている。マーティンによると、グーグルは現在、長さ、形式、音声、言語の変更など、多くのカスタマイズ・オプションの開発に取り組んでいるという。今のところ、ポッドキャストは英語でのみ生成可能となっているが、レディット(Reddit)ではフランス語とハンガリー語でのオーディオ作成に成功した例も紹介されている。

確かにクールな機能だ。胸が躍るような、と表現することもできるかもしれない。とはいえ、生成AIを悩ませる幻覚(ハルシネーション)やバイアスなどの問題と無縁というわけではない。

NotebookLMのこれまでの主な活用例をいくつか紹介しよう。

オンデマンド型ポッドキャスト

オープンAI(OpenAI)の創業メンバーの一人で、かつてテスラのAI部長を務めたアンドレイ・カルパシーは、Deep Diveが現在のお気に入りポッドキャストであるとXで述べている。カルパシーは、『Histories of Mysteries(ミステリーの歴史)』という独自のAIポッドキャスト・シリーズを作成した。狙いは、「歴史上最も興味深い謎を明らかにする」こ …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. The three big unanswered questions about Sora 時間も資金も溶かす? AI動画SNS「Sora」3つの疑問
  2. EV tax credits are dead in the US. Now what? 米EV減税が正式廃止、今後の動きをドイツの先例から予想
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
気候テック企業10 2025

MITテクノロジーレビューは毎年、気候テック分野で注目すべき企業を選出し、その一覧を発表している。 今回で3回目となる本特集では、なぜこれらの企業を選出したのか、そして米国の政治的変化をどのように考慮したのかについても詳しく解説している。併せてお読みいただきたい。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る