利用者は5億人超、謎のAI企業の音声アプリが変える中国の風景
中国では新しいテクノロジーがものすごいスピードで日常生活に溶け込んでいく。アイフライテックが開発した音声による自然言語処理もその1つだ。音声入力アプリのユーザー数は5億人を超え、自動車や医療などの分野でも使われ始めている。 by Yiting Sun2017.09.19
家賃の支払いや電気代のことをカナダ人の賃借人に連絡しなければならない時、北京在住のシュー・ガンさん(46歳)は、スマホにダウンロードしてあるアイフライテック・インプット(iFlytek Input)というアプリを開き、マイクのアイコンをタップして話しかける。すると、ソフトウェアが中国語の音声メッセージを英語のテキスト・メッセージに変換し、カナダ人に送信してくれる。このアプリは、カナダ人が入力する英語のテキストメッセージを中国語に翻訳することもでき、二言語間でのコミュニケーションを可能にしてくれる。
中国では、ガンさんが抱えているようなコミュニーケーションの障害を乗り越えるために、5億人を超える人々がアイフライテック・インプットを利用している。運転中に音声コマンドでテキスト・メッセージを送ったり、異なる方言を話す中国語話者とコミュニケーションをとるためにアプリを使うユーザーもいる。アイフライテック・インプットを開発したのは、中国のAI企業、アイフライテック (iFlytek)だ。同社は、深層学習や音声認識、自然言語処理、機械翻訳、データマイニングなどさまざまな技術を応用してアイフライテック・インプットを開発した(「2017年版スマート・カンパニー50」参照)。
裁判所では、長時間の裁判記録の書き起こしに、アイフライテックの音声認識技術を利用している。企業のコールセンターは、アイフライテックの音声合成技術を使って、自動返答音声を作成している。また、中国で人気の配車アプリ、ディディ(Didi)でも、ドライバーに向けた配車注文の通知にアイフライテックのテクノロジーが活用されている。
音声認識と即時翻訳の目覚ましい進歩がガンさんとカナダ人とのやり取りを可能にした一方で、言語理解と翻訳が機械にとってとても困難な仕事であることに変わりはない(「AI’s Language Problem」参照)。
ガンさんは、アプリによって誤解が生じた体験談を語ってくれた。賃貸契約の更新のために賃借人のサインが必要だったガンさんは、相手が仕事を終えて、サインをするために来ることができるのが、何時になるのか訊ねようとした。しかし、アプリで送信されたのは「今日は何時に仕事に行きますか?」というテキスト・メッセージだった。誤訳が生じたのは、恐らく「今日は何時までお仕事ですか?」という言い回しで質問をしたため …
- 人気の記事ランキング
-
- What’s on the table at this year’s UN climate conference トランプ再選ショック、開幕したCOP29の議論の行方は?
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- This AI-generated Minecraft may represent the future of real-time video generation AIがリアルタイムで作り出す、驚きのマイクラ風生成動画