KADOKAWA Technology Review
×
世界を驚かせたグーグルの「アストラ」、生成AIのキラーアプリとなるか
Google DeepMind
人工知能(AI) Insider Online限定
Google’s new Project Astra could be generative AI’s killer app

世界を驚かせたグーグルの「アストラ」、生成AIのキラーアプリとなるか

料理のレシピを読み取り、ワインを推薦し、時には謝罪も——。カメラに映る世界と会話できるグーグルの次世代AIアシスタント「アストラ(Astra)」は、生成AI時代の新しい可能性を予感させるものだ。MITテクノロジーレビューが非公開デモを体験。現時点の実力を探った。 by Will Douglas Heaven2024.12.13

この記事の3つのポイント
  1. グーグルが生成AI技術を使った多数の新製品を発表した
  2. マルチモーダルLLM「Gemini 2.0」ほか注目のアプリ「Astra」も披露
  3. Astraはキラーアプリになる可能性がある実用化にはまだ時間がかかる
summarized by Claude 3

グーグル・ディープマインド(Google Deepmind)は12月11日、生成AIテクノロジーを使った消費者向け製品市場で巻き返しを図るべく、多数の新製品とプロトタイプを発表した。

最注目は、マルチモーダル大規模言語モデル・ファミリー「Gemini(ジェミニ)」の最新版で、エージェントを制御する機能を中心に再設計された「Gemini 2.0」だ。また、今年5月にグーグルの開発者向け年次イベント「グーグルI/O」でデモが披露された実験的な万能アプリ「プロジェクト・アストラ(Project Astra)」の新バージョンも発表された。

MITテクノロジーレビューは先週、非公開のライブデモでAstraを試す機会を得た。それは驚くべき体験だったが、洗練されたプロモーション映像とライブデモの間には大きなギャップがあった。

Astraは、Gemini 2.0のビルトイン・エージェント・フレームワークを活用し、テキスト、音声、画像、動画を通じて質問に答えたりタスクを実行したりする。また、必要に応じて検索、マップ、レンズなどの既存のグーグルアプリを呼び出すことができる。「これは、現代で最もパワフルな情報検索システムのいくつかを統合したものです」と、Astraのプロダクト・マネージャーであるビボ・シューは語る。

Gemini 2.0とAstraに加え、Geminiを基盤に構築され、ユーザーの代わりにWeb検索を実行する新しいエージェント「Mariner(マリナー)」、Geminiを搭載した新しいコーディング・アシスタント「Jules(ジュールズ)」、ビデオゲーム・プレイヤーがプレイ中にチャットしてヒントを求めることができる実験的アシスタント「Gemini for Games(ゲーム用ジェミニ)」も発表された。

さらに、新しい動画生成モデル「Veo(ベオ)」、画像生成モデルの最新バージョン「Imagen 3(イマジェン3)」、そして量子コンピューター向けの新型チップ「Willow(ウィロウ)」も見逃せない。まさに目を見張るような新製品のリストである。一方、グーグル・ディープマインドの最高経営責任者(CEO)であるデミス・ハサビスは12月10日、スウェーデンでノーベル賞を受け取った。

グーグル・ディープマインドは、Gemini 2.0が前バージョンのGemini 1.5よりも2倍高速化しており、数学、物理学、健康、心理学、哲学などの幅広い分野にわたる大規模言語モデルの能力を評価するために設計された多肢選択問題の大規模セット「MMLU-Pro」を含む複数の標準ベンチマークで、前バージョンを上回っていると主張している。

だが、Gemini 2.0のような最上位モデルと、オープンAIやアンソロピック(Anthropic)など競合企業の最上位モデルとの差は、今やごくわずかなものになっている。最近では、大規模言語モデルの進歩は、そのモデルがどれだけ優れているかではなく、それを使って何ができるかのほうが重要になっている。

そこで注目されるのが、「エージェント」である。

Astraを実際に体験

先週、私はロンドンのキングス・クロス地区にあるビルにいた。上層階の何も書かれていないドアを通され、案内されたのは、秘密プロジェクトの雰囲気が漂う部屋だ。壁の一面には巨大な文字で「ASTRA」と描かれていた。このプロジェクトの事実上のマスコットであるシューの愛犬チャーリーが、研究者やエンジニアたちの机の間を歩き回っていた。彼らはグーグルが未来を賭ける製品の開発に忙しく取り組んでいた。

「母に説明するときは、私たちは目と耳と声を持つAIを作っていると言っています。それはどこでも一緒にいて、どんなことでも助けてくれる存在です」とアストラチームの共同リーダーであるグレッグ・ウェインは語る。「まだそこまで到達していませんが、そうしたビジョンを持っています」。

シューやウェイン、そして同僚たちが開発しているものの正式名称は「ユニバーサル・アシスタント」だ。しかし、それが実際に何を意味するのかについては、まだ模索している段階だという。

Astraが開発されている部屋の一端には、チームがデモに使用する2つのステージセットが設置されていた。ドリンクバーと模擬アートギ …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. Why handing over total control to AI agents would be a huge mistake 「AIがやりました」 便利すぎるエージェント丸投げが危うい理由
  2. OpenAI has released its first research into how using ChatGPT affects people’s emotional wellbeing チャットGPTとの対話で孤独は深まる? オープンAIとMITが研究
  3. An ancient man’s remains were hacked apart and kept in a garage 切り刻まれた古代人、破壊的発掘から保存重視へと変わる考古学
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る