5月にグーグルがお披露目したデュープレックス(Duplex)は大きな注目を浴びた。デュープレックスは、レストランや美容院に予約を入れることができる、恐ろしいほど人間じみた音声アシスタントだ。デュープレックスの登場は、音声生成と自然言語理解の分野での新たな節目となり、人間と人工知能(AI)のやりとりの未来図を見せつけてくれたと言える。
グーグルがデュープレックスを一部ユーザーを対象に限定的にリリースする一方、アリババの音声アシスタントはすでに早々とその先を行っている。12月2日に開催された、AI研究における最大規模の年次大会である神経情報処理システム(NeurIPS)カンファレンスでは、アリババがグループ会社の物流企業「菜鳥(ツァイニャオ)」向けに提供しているAIカスタマーサービス・エージェントのデモを披露。同社データサイエンス研究所の責任者であるジン・ロンが、すでに1日あたり数百万人もの顧客のリクエストに対応しているという現状を語った。
デモで披露されたのが、AIエージェントが顧客に荷物の配達先を尋ねる場面だ。この電話でのやりとりでエージェントは複数の会話要素をうまくこなしており、デモはエージェントの幅広い自然言語能力を示すものだった。
以下は、電話の冒頭でのやりとりを、中国語から翻訳したものだ。
エージェント、以下A:もしもし、私は菜鳥の音声アシスタントです。私は……
客:もしもし。
A:ええ、こんにちは。午前中にカルチャーウエストロード588の住所に配達予定の荷物があります。ご都合はいかがでしょうか?
客:あなたは誰?
A:私は菜鳥の音声アシスタントです。カルチャーウエストロード588へ午前中に配達してもい …
- 人気の記事ランキング
-
- What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
- A Google Gemini model now has a “dial” to adjust how much it reasons 推論モデルは「考えすぎ」、グーグルがGeminiに調整機能
- Meet the researchers testing the “Armageddon” approach to asteroid defense 惑星防衛の最終戦略 科学者たちが探る 「核爆発」研究の舞台裏
- Anthropic can now track the bizarre inner workings of a large language model 大規模言語モデルは内部で 何をやっているのか? 覗いて分かった奇妙な回路