中国の首都北京のクリエイティブ産業の中心地「798芸術区」にあるカフェで話していると、顧嘉唯(グー・ジアウェイ)は、スマホが発したテンセントのWeChat(中国全土で利用できるメッセージアプリ)の通知音を消した。画面を一目見て確認すると「1万7000件の未読メッセージがあった」という。顧によれば、情報テクノロジーによる人々の対話は機能不全を起こしているという。「わずらわしい通知をチェックするのは面倒です」
顧はバイドゥの秘蔵エンジニアで、最先端の「ヒューマン・コンピューター・インタラクション」のモデルを設計している。たとえば視覚障害者を支援する人工知能(AI)インターフェイスであるDuLightは、ヘッドセット付きのカメラやユーザーのスマホで、レシートや電車の時刻表、箱に貼られたラベル等をスキャンし、深層学習アルゴリズムやスマホのCPUを使って、画像内の文字を認識して音声化し、ユーザーは音として目の前にあることを理解できる装置だ。「顔認識機能の改良も進んでいます」と顧はいう。
顧の今後の構想は、わずらわしい通知等に縛られることなく人々がテクノロジーの恩恵を受けられる世界である。「人々を簡素な昔の時代に導きたい」と顧はいう。
(クリスティーナ・ラーソン)
- 人気の記事ランキング
-
- How a top Chinese AI model overcame US sanctions 米制裁で磨かれた中国AI「DeepSeek-R1」、逆説の革新
- OpenAI has created an AI model for longevity science オープンAI、「GPT-4b micro」で科学分野に参入へ
- 10 Breakthrough Technologies 2025 MITTRが選んだ 世界を変える10大技術 2025年版
- AI means the end of internet search as we’ve known it 「ググる」時代の終わり、 世界の知識を解き放つ 生成AI検索がもたらすもの