「ヘイ、アレクサ」――米国の家庭で何百万人もが、そのときどきの希望をアマゾンに伝える直前に口にしているのがこのフレーズだ。アマゾンは台所用品を注文したり、部屋の電気をつけたり、音楽を流したりと、アレクサに何かを依頼する人全員から、競合企業の追撃をかわし、音声操作型アシスタントの可能性を高めるブレークスルー実現に欠かせないデータを大量に取得している。
音声認識技術の専門家で、アレクサとエコーを生んだ開発チームの創設メンバーでもあるアマゾンのニッコ・ストロム上級主任科学者は、AIフロンティア会議(カリフォルニア州サンタクララで先週開かれた)で「家庭内に何百万台も設置されたアマゾン・エコーが集めているのは、塵やホコリではありません。ものすごい量のデータが手に入るのです。私たちの研究に有用なデータがね」と述べた。
ストロム上級主任科学者によると、エコーが集めたデータはすでに、音声認識分野の積年の課題である「カクテル・パーティー問題」(大勢が同時に話している中で、ひとりの声を認識させる研究)をアマゾンが解決する手がかりになったという。
アレクサは当初から誰かに「アレクサ」と話しかけられたことは認識できたが、他の音声認識システム同様、名前の前後に話された言葉のうち、どれがユーザーの依頼を指すのかは、なかなか判別できなかった。そこでストロム上級主任科学者のチームは「アレクサ」と話しかけられたときの声の特徴を記録し、ユーザーの依頼を示す言葉を探り当てるシステムを開発した。
カクテル・パーティー問題等に挑むため、アマゾンは他にはないデータを収集して …