KADOKAWA Technology Review
×
【3/14東京開催】若手研究者のキャリアを語り合う無料イベント 参加者募集中
資料を入力、AIが語り出す
ポッドキャスト自動生成の
グーグル新ツールが話題
Stephanie Arnett/MIT Technology Review | rawpixel, envato
人工知能(AI) 無料会員限定
People are using Google study software to make AI podcasts—and they’re weird and amazing

資料を入力、AIが語り出す
ポッドキャスト自動生成の
グーグル新ツールが話題

グーグルの新機能「オーディオ・オーバービュー(Audio Overview)」がネット上で意外な人気を集めている。テキストや動画をアップロードするだけで、AIが自動的にポッドキャストを生成。人間らしい会話と豊かな表現力で内容を解説する。その活用例をいくつか紹介しよう。   by Melissa Heikkilä2024.10.08

「さて、今日は最先端のテクノロジーを詳しく掘り下げていくとしよう」。砕けた調子の米国人男性の声がする。ただし、この声を発しているのは人間ではない。声の源は、「オーディオ・オーバービュー(Audio Overview)」というグーグルの新しい人工知能(AI)ポッドキャストツールだ。このツールが予想外のバイラルヒットとなっている。

Audio Overviewは、およそ1年前にリリースされたAIリサーチ・アシスタント「ノートブックLM(NotebookLM)」の一部として、今年9月中旬に提供が始まった。グーグルの「ジェミニ(Gemini) 1.5」モデルを搭載したNotebookLMは、ユーザーがリンクや動画、PDFファイル、テキストなどのコンテンツをアップロードして関連する質問を投げると、それに回答。コンテンツの短い要約も提供する。

このツールは、「ディープダイブ(Deep Dive)」と呼ばれるポッドキャストを生成する。アップロードした内容について、男性と女性の声で議論するのだ。その声は息をのむほどリアルだ。エピソードには、「おや」「わぁ」「ええ」「ちょっと待って、ちゃんと理解させて」 といった、人間らしく聞こえる語句が散りばめられている。 「ホスト」たちは、お互いの発言を遮ることさえある。

この機能をテストするため、私はMIT テクノロジーレビュー(米国版)の創刊125周年記念号からすべての記事をNotebookLMにコピーし、それを元に10分間のポッドキャストを生成するよう求めた。すると、NotebookLMは注目する記事をいくつか選び出し、ホスト役のAIが記事の要点を見事に伝えてくれた。ぜひ聴いてみてほしい。

MIT テクノロジーレビュー創刊125周年記念号

NotebookLMのプロダクトリーダーを務めるライザ・マーティンは、X(旧ツイッター)で、このAIシステムは、「ほんの少しのコンテンツと引き換えに魔法を創り出す」 ように設計されていると語っている。音声モデルは、感情的で人を惹きつける音声を生み出すように意図されており、「明るく、強い関心を示す口調」でそれを表現しているとマーティンは言う。

もともと学習用ツールとして登場したNotebookLMは、ユーザーたちの間で独自の使い方をされている。マーティンによると、グーグルは現在、長さ、形式、音声、言語の変更など、多くのカスタマイズ・オプションの開発に取り組んでいるという。今のところ、ポッドキャストは英語でのみ生成可能となっているが、レディット(Reddit)ではフランス語とハンガリー語でのオーディオ作成に成功した例も紹介されている。

確かにクールな機能だ。胸が躍るような、と表現することもできるかもしれない。とはいえ、生成AIを悩ませる幻覚(ハルシネーション)やバイアスなどの問題と無縁というわけではない。

NotebookLMのこれまでの主な活用例をいくつか紹介しよう。

オンデマンド型ポッドキャスト

オープンAI(OpenAI)の創業メンバーの一人で、かつてテスラのAI部長を務めたアンドレイ・カルパシーは、Deep Diveが現在のお気に入りポッドキャストであるとXで述べている。カルパシーは、『Histories of Mysteries(ミステリーの歴史)』という独自のAIポッドキャスト・シリーズを作成した。狙いは、「歴史上最も興味深い謎を明らかにする」こ …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. One option for electric vehicle fires? Let them burn. EV電池火災、どう対応?「燃え尽きるまで待つしかない」と専門家
  2. Promotion Innovators Under 35 Japan × CROSS U 好評につき第2弾!研究者のキャリアを考える無料イベント【3/14】
  3. OpenAI just released GPT-4.5 and says it is its biggest and best chat model yet 限界説に挑むオープンAI、最後の非推論モデル「GPT-4.5」 
  4. One option for electric vehicle fires? Let them burn. EV電池火災、どう対応?「燃え尽きるまで待つしかない」と専門家
▼Promotion
U35イノベーターと考える 研究者のキャリア戦略 vol.2
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る