KADOKAWA Technology Review
×
Developers Expand Amazon Alexa’s Skills—Exposing Both Its Potential and Its Limitations

アマゾンの音声アシスタント
Amazon Echoの実力と限界

アマゾンは、アプリこそ音声認識スピーカーEcho成功の鍵だとわかっている。 by Stacey Higginbotham2016.08.11

高さ23センチの円筒に話掛けるだけでこれ程多くのことができるとは、まさに驚きだ。

アマゾンのホームスピーカー「Echo」と装置内蔵する音声アシスタントに「Alexa」と呼びかければいつでも動き出す。聞きたい音楽の頭出しをしたり、ウーバーで車を呼んだり、ゲームしたりできる。もしインターネットに接続したホームデバイスが有れば、両腕が食料品で一杯に塞がっていても、照明が付けられるし、指一本動かさずに、エアコンの温度も調節できる。信じられないくらい便利だ。

アマゾンは既に推定400万台のEchoデバイスを販売しており、グーグルも真似をしてGoogle Homeを作った。eコマースの巨大企業であるアマゾンは今や、他社のサービスとAlexaを組み込ませることによって、他社にAlexaの能力を拡大させようとしている。

Amazon’s voice-activated assistant Alexa is built into (left to right) the Tap portable speaker, FireTV set-top box, Echo speaker, and Echo Dot speaker.
アマゾンの音声作動アシスタントAlexaは、左から、タップボータブルスピーカー、FireTVセットトップボックス、EchoDotスピーカーに内蔵されている

この発想は、ちょうどアプリがスマートフォンをより便利にして、より人気になるようにしたのと似ている。Alexaのアプリは「スキル」と呼ばれていて、アマゾンにとって、Echoをさらに強力で儲かるようにしている。既にEchoに対応する2000以上のスキルが存在する。5月のコードカンファレンスでアマゾンのジェフ・ベゾスCEOは、このテクノロジーの現状を「まさに氷山の一角」だといった。

開発者が追加する機能は、プラットフォームの有望さを示す一方で、機能の限界も露呈させてしまう。

Echoの最も有益なスキルの多くは、スマートホームデバイスと共に機能する。たとえば、スマートホームの主要企業インステオンは、Echoから「Alexa、寝室の設定温度を3度下げて」といって制御できるエアコンをはじめ、電球など数十種類のスマートデバイスを扱っている。他にも、ドミノでピザを注文したり、キャピタルワンのクレジットカードで支払えたりするアプリもある。ところが、スマートロック「August」の所有者は、音声命令でドアを施錠できるが、ドアの解錠はできない。アマゾンは、セキュリティ上の予期しない結果に懸念を抱いているからだ。

Alexaはビジネスでも役に立つ。会議の席に座らせて、文字通り意見を述べられる立場にあるのだ。ビジネス分析企業サイセンスの顧客は「ヨーロッパ地域の第4四半期の総収入はいくらか」といった質問を、Alexaにインストールしたサイセンスのスキルに尋ねれば、答えが得られる。同社の顧客は、今や会議室にEchoを設置している、とサイセンスのアミール・オラドCEOはいう。

コラボレーションソフトウエア企業シトリックス・システムズもEchoを職場に導入している。シトリックスは顧客が会議室を予約し、音声命令によって、照明と設備を制御する方法を構築している。IT管理者は、シトリックスのプログラムが動作しているかを確認するために、Alexaに声を掛けるだけでいい。

しかしEchoとAlexaには、多くの限界がある。まず、「自然に」Alexaに話し掛けるように説明されているが、具体的な言葉とフレーズを使わなければならない。たとえば、一度にひとつのことしか指示できないので、ベッドに行く時「Alexa、階段の電灯を消したらエアコンの設定温度を21度に設定して、アラームを午前7時にして」とは声をかけられないのだ。それぞれの行動を別々に要求し、その都度反応を待たなければならない。

Echoのプラットフォームに乗っかりながら、Echoの至らないところを補って自社の仕事を見つける会社もある。スマートホーム事業者のヨノミは、Alexaに一回の音声命令で、全てを制御できる複合ホームデバイスと接続するソフトウエアを構築している。ちょっとした設定後なら、テレビを付け、画面上のネットフリックスを開いて、照明を薄暗くするために「Alexa、NetflixとChillをオンにして」と指示できる。

デザイン企業のアルゴデザイン創業者で、フロッグデザインの元クリエイティブ担当重役マーク・ロルストンは、現在のAlexaは、もっと多くの基本的な問題を抱えているという。もしAlexaを今の便利な商品以上にするには、聴覚情報だけではなく、たとえば画面上にAlexaが情報を示すことによって、人間とコミュニケーションが取れるようにするべきだ、とロルストンはいう。

「もしアマゾンがこんなふうにAlexaを販売し続けたいなら、Alexaには壁にぶつかります」とロルストンいう。シトリックスのコアインフラストラクチャーを担当するスティーブ・ウィルソン副社長も「Alexaはアップストアが登場する以前のiPhoneのようなものです」と同意している。「音声だけでは、十分なインタラクションになりません。もしさらに詳細なインタラクションを実現したいなら、画面を見る必要があります」と以前シトリックスでAlexaスキルの開発に関わっていたウィルソン副社長もいった。

アマゾンはAlexaに対する質問の答えを、Alexaと連動するスマホアプリ上に確かに表示させてはいる。だが、ほとんど全ての場合、Alexaに質問したことは音声で答えが返ってくる。たとえば、Alexaに近くのレストランのランチメニューを尋ねても、スマートフォンには表示されない(近日発売予定のGoogle Homeのプロモーションビデオでは、地図のような情報をスマートフォンに教示させる装置があるが、その機能が最終製品に搭載されるかは不明だ)。

音声インターフェイスのもう別の課題は、認証問題だ。現在、ユーザーはセットアップ時にPINを設定できる。ユーザーはAlexaで何かを購入するとき、必ずPINを声に出さなければならないが、PINで安全を保つには、PINが誰にも知られないことが前提だ。たとえば、保護者は、クレジットカードでモノを買うのに必要なPINを子どもに聞かれたくはないだろう。

Echoの驚くべき成功により、問題点の解決でも先手を打てたことは、アマゾンは競合他社より有利なスタートを切れた。何百万人のユーザーや、Echoのプラットフォームに統合しようと取り組んでいるたくさんの企業は、おしゃべりな円筒を、あらゆる家庭の必需品のひとつにする手段を考えようと、Echoが使えるデータをたくさんアマゾンに提供するだろう。

人気の記事ランキング
  1. What’s on the table at this year’s UN climate conference トランプ再選ショック、開幕したCOP29の議論の行方は?
  2. This AI-generated Minecraft may represent the future of real-time video generation AIがリアルタイムで作り出す、驚きのマイクラ風生成動画
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者決定!授賞式を11/20に開催します。チケット販売中。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る