アレン人工知能研究所(AI2: Allen Institute for Artificial Intelligence)は11月16日、同社の主力製品であるAIを活用した科学論文検索エンジン「セマンティック・スカラー(Semantic Scholar)」に、科学文献を要約するための新たなAIモデルを導入した。研究者が読みたい最新の論文を探し出して読むのを支援する。ユーザーが検索機能を使うか執筆者のページを訪れると、「tl;dr」(「長過ぎるから読まなかった(too long; didn’t read)」の意味)と呼ばれる一文の要約が、コンピューターサイエンス分野の全論文で(現在のところ)表示される。この取り組みは、11月16日から20日に開催された「自然言語処理のための経験的手法会議( Conference on Empirical Methods in Natural Language Processing)」でも発表された。
情報過多の時代にあって、AIを使って文章の要点をまとめることは、自然言語処理(NLP)の問題としてよく取り上げられるようになってきた。文章を要約する際の一般的な手法はふたつある。ひとつは「抜粋(extractive)」で、文字通りのテキストの中からその本質を捉えた一文、あるいは一連の文を見つけ出そうとするアプローチである。もうひとつは「要約(abstractive)」で、新たな文を生成するアプローチだ。NLPシステムの限界が理由で抜粋の手法の方がよく使われていたが、近年の自然言語生成の進歩によって要約の手法の方がはるかに優れたものになってきた。
AI …