ロイター、ネタの選定から執筆までほぼ完全自動のAI記者を開発
ロイターはツイッターからニュースを発見、選定し、自動的に記事を作成するAIシステムを開発した。全ニュースの70%をツイッターから自動生成できるという。 by Emerging Technology from the arXiv2017.12.25
「インターネットの出現とそれに伴う情報量の増加によって、ジャーナリストが正確かつ迅速にニュースを伝えることは、ますます困難になってきている」——。こんな書き出しで始まる論文を、世界的な通信社であるロイターの研究開発チームがアーカイブ(arXiv)に投稿した。
事実をねじ曲げる「ねつ造ニュース」の出現によって、ロイターが指摘する問題はさらに深刻化している。それにもかかわらず、APなどの通信社は、自動ニュース作成サービスへの移行を推進中だ。自動ニュース作成サービスは、決算発表や特定のスポーツの試合結果などの決まり切った内容を、事前に用意したひな形にコピー&ペーストして記事を作成するのだ。たとえば、「ウォール街の予想に反し、Xは第3四半期にY百万の利益を上げました」といった具合だ。
こうした状況から、他の通信社にもニュース作成の自動化を進めなければならないという大きなプレッシャーがかかっている。11月27日、ロイターは特定のニュース速報の作成をほぼ完全に自動化する方法の概要を発表した。ロイターのリウ・シャオモら研究開発チームと、中国のアリババ・グループは、新しいシステムはうまく動作していると述べた。確かに、このシステムはニュース・ビジネスに革命を起こす可能性がある。しかし同時に、悪意ある人物によって操られてしまう可能性があるかもしれない、という懸念も高まっている。
新しいシステムは「ロイター・トレーサー(Reuters Tracer)」と呼ばれ、ツイッターをある種の世界的な探知機として使い、ニュースがあればすぐに記録する。その後、システムは、さまざまな種類のデータ・マイニングと機械学習を使って、最も関連性の高いニュースを選択し、テーマを決め、優先順位を付け、見出しと要約を書く。そうして出来上がったニュースはロイターの世界的な配信網を使って配信される。
プロセスの第1段階は、ツイッターのデータの流れを捕らえることから始まる。ロイター・トレーサーは全ツイート数の2%、約1200万件のツイートを毎日検証する。約1200万件の半数は無作為に抽出され、残りの半数はロイターの …
- 人気の記事ランキング
-
- These companies are creating food out of thin air 大豆・昆虫の次は微生物、 空気からタンパク質を作る 「夢の食品工場」
- Google DeepMind is making its AI text watermark open source AI生成テキストを見抜く「電子透かし」、グーグルが無償公開
- The race to find new materials with AI needs more data. Meta is giving massive amounts away for free. メタ、材料科学向けの最大規模のデータセットとAIモデルを無償公開
- Kids are learning how to make their own little language models 作って学ぶ生成AIモデルの仕組み、MITが子ども向け新アプリ