「インターネットの出現とそれに伴う情報量の増加によって、ジャーナリストが正確かつ迅速にニュースを伝えることは、ますます困難になってきている」——。こんな書き出しで始まる論文を、世界的な通信社であるロイターの研究開発チームがアーカイブ(arXiv)に投稿した。
事実をねじ曲げる「ねつ造ニュース」の出現によって、ロイターが指摘する問題はさらに深刻化している。それにもかかわらず、APなどの通信社は、自動ニュース作成サービスへの移行を推進中だ。自動ニュース作成サービスは、決算発表や特定のスポーツの試合結果などの決まり切った内容を、事前に用意したひな形にコピー&ペーストして記事を作成するのだ。たとえば、「ウォール街の予想に反し、Xは第3四半期にY百万の利益を上げました」といった具合だ。
こうした状況から、他の通信社にもニュース作成の自動化を進めなければならないという大きなプレッシャーがかかっている。11月27日、ロイターは特定のニュース速報の作成をほぼ完全に自動化する方法の概要を発表した。ロイターのリウ・シャオモら研究開発チームと、中国のアリババ・グループは、新しいシステムはうまく動作していると述べた。確かに、このシステムはニュース・ビジネスに革命を起こす可能性がある。しかし同時に、悪意ある人物によって操られてしまう可能性があるかもしれない、という懸念も高まっている。
新しいシステムは「ロイター・トレーサー(Reuters Tracer)」と呼ばれ、ツイッターをある種の世界的な探知機として使い、ニュースがあればすぐに記録する。その後、システムは、さまざまな種類のデータ・マイニングと機械学習を使って、最も関連性の高いニュースを選択し、テーマを決め、優先順位を付け、見出しと要約を書く。そうして出来上がったニュースはロイターの世界的な配信網を使って配信される。
プロセスの第1段階は、ツイッターのデータの流れを捕らえることから始まる。ロイター・トレーサーは全ツイート数の2%、約1200万件のツイートを毎日検証する。約1200万件の半数は無作為に抽出され、残りの半数はロイターの …