アリババ「DAMO」のAIプログラム、言語理解で新記録を達成
アリババが開発した人工知能(AI)プログラムが、読解力のテストで史上最高点を記録した。この結果から、機械による文章や話し言葉の処理能力が、着実に向上していることが伺える。
今回の最高記録は、「マイクロソフト・マシン・リーディング・コンプリヘンション(MS MARCO)」データセットを使用して達成された。MS MARCOは、マイクロソフトの検索エンジンである「ビング(Bing)」のユーザーが過去に尋ねた実際の質問応答を集めて作られたデータセットである。「法人とは何か?」といった質問に答えられるようになるために、アリババのAIプログラムは、情報が掲載された多数のWebページを読む必要があった(この場合の答えは、「法人とは、単一の存在として行動する権限を有し、法律でそのように認められている人々の集まり」となるだろう)。2つの評価において、アリババのAIプログラムの得点は人間に近いか、上回っていた。
Congrats to Ming Yan on their new Multi-doc Enriched BERT QnA model. It is now the leader of the MSMARCO QA Task! Their model achievs a rouge-l of 0.540 and BLEU of 0.565!
— MSMarco (@MSMarcoAI) June 21, 2019
大規模かつ柔軟性のある学習アルゴリズムと、大量のデータのおかげで、AIアルゴリズムはこのような質問と回答のタスクを適切に処理する性能を向上させている。アリババのチームは、質問に答える前に不適切な文章を実質的に取り除く手法を開発した。
「言語理解力の向上は、小規模小売業者を支援するためにアリババが提供しているチャットボットを改善するのに役立ちます」と語るのは、アリババの「DAMOアカデミー(達磨院:DAMOはDiscovery/発見、Adventure/冒険、Momentum/機運、Outlook/展望の頭文字)」の副所長であり、新たなアルゴリズムを開発したチームのリーダーであるルオ・シーだ。新しいアルゴリズムはまた、より自然なWeb検索も可能にする。ルオ副所長はさらに、同社のクラウドサービスの重要な部分となり、企業間の言語の壁を壊すのに役立つかもしれないと付け加えた。
しかしながら、この新しいAIプログラムは「人間より読解力が優れている」わけではない。一部の文章に関する質問に答える能力が平均して、人間より優れていたに過ぎない。依然として、単語の意味を理解することなく、本質的には統計的なパターン認識をしているだけだ。
「機械が人間と同じように自由に言葉を使えるようになるまでには、まだ長い道のりがあります。たいていの場合、機械は文書から集めた事実に基づいて質問に回答しますが、推論能力が欠けており、(中略)人間の言葉の使い方とは異なります」。