5月にグーグルがお披露目したデュープレックス(Duplex)は大きな注目を浴びた。デュープレックスは、レストランや美容院に予約を入れることができる、恐ろしいほど人間じみた音声アシスタントだ。デュープレックスの登場は、音声生成と自然言語理解の分野での新たな節目となり、人間と人工知能(AI)のやりとりの未来図を見せつけてくれたと言える。
グーグルがデュープレックスを一部ユーザーを対象に限定的にリリースする一方、アリババの音声アシスタントはすでに早々とその先を行っている。12月2日に開催された、AI研究における最大規模の年次大会である神経情報処理システム(NeurIPS)カンファレンスでは、アリババがグループ会社の物流企業「菜鳥(ツァイニャオ)」向けに提供しているAIカスタマーサービス・エージェントのデモを披露。同社データサイエンス研究所の責任者であるジン・ロンが、すでに1日あたり数百万人もの顧客のリクエストに対応しているという現状を語った。
デモで披露されたのが、AIエージェントが顧客に荷物の配達先を尋ねる場面だ。この電話でのやりとりでエージェントは複数の会話要素をうまくこなしており、デモはエージェントの幅広い自然言語能力を示すものだった。
以下は、電話の冒頭でのやりとりを、中国語から翻訳したものだ。
エージェント、以下A:もしもし、私は菜鳥の音声アシスタントです。私は……
客:もしもし。
A:ええ、こんにちは。午前中にカルチャーウエストロード588の住所に配達予定の荷物があります。ご都合はいかがでしょうか?
客:あなたは誰?
A:私は菜鳥の音声アシスタントです。カルチャーウエストロード588へ午前中に配達してもい …