私が音声アシスタント「アレクサ(Alexa)」を使い始めたのは、まだ世の中で重宝され始める前のことだった。新しいスピーカーを探しているときにアマゾンのサイトのバナー広告で第1世代のエコー(Echo)を目にし、発売から数カ月後に購入した。グーグルのソフトウェア・エンジニアだった当時のルームメイトは、アレクサの機能をグーグル・アシスタントの機能と熱心に比較した。実際、アレクサの機能はグーグル・アシスタントに匹敵するものではなかったが、私が望むすべてがあった。お気に入りの曲を再生し、毎朝アラームを鳴らし、時々ニュースと天気を教えてくれた。
5年後、アマゾンの野望は私の単純な望みを大きく上回った。どこででも手に入るようになったアレクサは現在、テレビからドアベル、イヤホンに至るまで8万5000以上のスマート・ホーム製品をコントロールできるようになった。実行できる「スキル」は10万本を超え、その数は現在も増え続けている。週に数十億件のやり取りを処理し、ユーザーのスケジュールや好み、居場所に関する膨大な量のデータを生成している。シンプルなアレクサはアレクサ「帝国」に変貌を遂げた。そして、アマゾンはまだその入口に立っただけにすぎない。
アレクサのロヒット・プラサード研究責任者は、MITテクノロジーレビューのインタビューで、アレクサの今後の方向性についての詳細を明らかにした。計画の中心は、アレクサのユーザーとの対話を、受動的なものから、ニーズを察知する積極的な対話へ変えることだ。指示が出されるまで待ち、応答するのではなく、ユーザーが望むものを予測するようになる。いつでもどこでも一緒にいて積極的にユーザーの生活全般に影響を与え、支援する伴侶にアレクサを変えることを目指す。そのためには、アレクサがこれまで以上にユーザーについて詳しく知る必要がある。
ポルトガルのリスボンで開催されたテクノロジー・カンファレンス「ウェブサミット2019(WebSummit 2019)」で11月5日、プラサード責任者はアレクサの今後のビジョンの要点を説明した。だが、アレクサの方向性の転換についてはすでに少し紹介済みだ。6月に開催されたアマゾンのカンファレンス「リマーズ(Re:MARS)」で、プラサード責任者は新機能「アレクサ・カンバセーションズ(Alexa Conversations)」をデモし、夜の外出計画を例に挙げてどのように役立つかを示した。外出に関連する複数の指示を1つずつアレクサに依頼する代わりに、たとえば映画チケットの予約指示から会話を開始するだけで済む。その後、アレクサはレストランの予約をしたいか、ウーバー(Uber)に電話したいかと質問してくる。
この転換を強力に推し進めるため、アマゾンにはハードウェアとソフトウェアの両方が必要だ。アマゾンは9月、ワイヤレス・イヤフォンの「エコー・バズ(Echo Buds)」やスマート指輪の「エコー・ループ(Echo Loop)」など、「外出時」に使えるアレクサ関連デバイスをまとめて発表した。新製品はすべて、ユーザーの生活に関してこれまでよりも格段に広範囲の情報をアレクサに送り込み、データを記録する。ユーザーの居場所、行動、好みの情報を持つアシスタントを提供するには好都合だ。
ソフトウェアの観点で言えば、このようなアシスタントを実現するために、アレクサは新しい手法でさまざまな異なる情報源のデータを処理および理解する必要がある。プラサード責任者のチームはこれまで5年間、基本的な音声認識やビデオ認識など、アレクサに人工知能(AI)の基礎を習得させ、自然言語の理解の向上に注力してきた。これまで構築してきた基盤の上に、チームは現在、アレクサのインテリジェントな予測および意思決定能力の開発を始め、より高度な推論のための能力を強化している。言い換えれば、数年以内にアレクサのAI能力の精度向上を目標としている。
さらに高い知能を持つアレクサ
ソフトウェア・アップデートでアレクサがどの …