アマゾンの音声アシスタント
Amazon Echoの実力と限界
アマゾンは、アプリこそ音声認識スピーカーEcho成功の鍵だとわかっている。 by Stacey Higginbotham2016.08.11
高さ23センチの円筒に話掛けるだけでこれ程多くのことができるとは、まさに驚きだ。
アマゾンのホームスピーカー「Echo」と装置内蔵する音声アシスタントに「Alexa」と呼びかければいつでも動き出す。聞きたい音楽の頭出しをしたり、ウーバーで車を呼んだり、ゲームしたりできる。もしインターネットに接続したホームデバイスが有れば、両腕が食料品で一杯に塞がっていても、照明が付けられるし、指一本動かさずに、エアコンの温度も調節できる。信じられないくらい便利だ。
アマゾンは既に推定400万台のEchoデバイスを販売しており、グーグルも真似をしてGoogle Homeを作った。eコマースの巨大企業であるアマゾンは今や、他社のサービスとAlexaを組み込ませることによって、他社にAlexaの能力を拡大させようとしている。
この発想は、ちょうどアプリがスマートフォンをより便利にして、より人気になるようにしたのと似ている。Alexaのアプリは「スキル」と呼ばれていて、アマゾンにとって、Echoをさらに強力で儲かるようにしている。既にEchoに対応する2000以上のスキルが存在する。5月のコードカンファレンスでアマゾンのジェフ・ベゾスCEOは、このテクノロジーの現状を「まさに氷山の一角」だといった。
開発者が追加する機能は、プラットフォームの有望さを示す一方で、機能の限界も露呈させてしまう。
Echoの最も有益なスキルの多くは、スマートホームデバイスと共に機能する。たとえば、スマートホームの主要企業インステオンは、Echoから「Alexa、寝室の設定温度を3度下げて」といって制御できるエアコンをはじめ、電球など数十種類のスマートデバイスを扱っている。他にも、ドミノでピザを注文したり、キャピタルワンのクレジットカードで支払えたりするアプリもある。ところが、スマートロック「August」の所有者は、音声命令でドアを施錠できるが、ドアの解錠はできない。アマゾンは、セキュリティ上の予期しない結果に懸念を抱いているからだ。
Alexaはビジネスでも役に立つ。会議の席に座らせて、文字通り意見を述べられる立場にあるのだ。ビジネス分析企業サイセンスの顧客は「ヨーロッパ地域の第4四半期の総収入はいくらか」といった質問を、Alexaにインストールしたサイセンスのスキルに尋ねれば、答えが得られる。同社の顧客は、今や会議室にEchoを設置している、とサイセンスのアミール・オラドCEOはいう。
コラボレーションソフトウエア企業シトリックス・システムズもEchoを職場に導入している。シトリックスは顧客が会議室を予約し、音声命令によって、照明と設備を制御する方法を構築している。IT管理者は、シトリックスのプログラムが動作しているかを確認するために、Alexaに声を掛けるだけでいい。
しかしEchoとAlexaには、多くの限界がある。まず、「自然に」Alexaに話し掛けるように説明されているが、具体的な言葉とフレーズを使わなければならない。たとえば、一度にひとつのことしか指示できないので、ベッドに行く時「Alexa、階段の電灯を消したらエアコンの設定温度を21度に設定して、アラームを午前7時にして」とは声をかけられないのだ。それぞれの行動を別々に要求し、その都度反応を待たなければならない。
Echoのプラットフォームに乗っかりながら、Echoの至らないところを補って自社の仕事を見つける会社もある。スマートホーム事業者のヨノミは、Alexaに一回の音声命令で、全てを制御できる複合ホームデバイスと接続するソフトウエアを構築している。ちょっとした設定後なら、テレビを付け、画面上のネットフリックスを開いて、照明を薄暗くするために「Alexa、NetflixとChillをオンにして」と指示できる。
デザイン企業のアルゴデザイン創業者で、フロッグデザインの元クリエイティブ担当重役マーク・ロルストンは、現在のAlexaは、もっと多くの基本的な問題を抱えているという。もしAlexaを今の便利な商品以上にするには、聴覚情報だけではなく、たとえば画面上にAlexaが情報を示すことによって、人間とコミュニケーションが取れるようにするべきだ、とロルストンはいう。
「もしアマゾンがこんなふうにAlexaを販売し続けたいなら、Alexaには壁にぶつかります」とロルストンいう。シトリックスのコアインフラストラクチャーを担当するスティーブ・ウィルソン副社長も「Alexaはアップストアが登場する以前のiPhoneのようなものです」と同意している。「音声だけでは、十分なインタラクションになりません。もしさらに詳細なインタラクションを実現したいなら、画面を見る必要があります」と以前シトリックスでAlexaスキルの開発に関わっていたウィルソン副社長もいった。
アマゾンはAlexaに対する質問の答えを、Alexaと連動するスマホアプリ上に確かに表示させてはいる。だが、ほとんど全ての場合、Alexaに質問したことは音声で答えが返ってくる。たとえば、Alexaに近くのレストランのランチメニューを尋ねても、スマートフォンには表示されない(近日発売予定のGoogle Homeのプロモーションビデオでは、地図のような情報をスマートフォンに教示させる装置があるが、その機能が最終製品に搭載されるかは不明だ)。
音声インターフェイスのもう別の課題は、認証問題だ。現在、ユーザーはセットアップ時にPINを設定できる。ユーザーはAlexaで何かを購入するとき、必ずPINを声に出さなければならないが、PINで安全を保つには、PINが誰にも知られないことが前提だ。たとえば、保護者は、クレジットカードでモノを買うのに必要なPINを子どもに聞かれたくはないだろう。
Echoの驚くべき成功により、問題点の解決でも先手を打てたことは、アマゾンは競合他社より有利なスタートを切れた。何百万人のユーザーや、Echoのプラットフォームに統合しようと取り組んでいるたくさんの企業は、おしゃべりな円筒を、あらゆる家庭の必需品のひとつにする手段を考えようと、Echoが使えるデータをたくさんアマゾンに提供するだろう。
- 人気の記事ランキング
-
- What’s on the table at this year’s UN climate conference トランプ再選ショック、開幕したCOP29の議論の行方は?
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- This AI-generated Minecraft may represent the future of real-time video generation AIがリアルタイムで作り出す、驚きのマイクラ風生成動画
タグ | |
---|---|
クレジット | Image courtesy of Amazon |
- ステイシー ヒギンボサム [Stacey Higginbotham]米国版
- 現在編集中です。