データマイニングが開く、新しい政治史の扉
コロンビア大学の研究者たちがデータマイニングの手法を用いて、膨大な政府記録から歴史的に重要な出来事を自動的にランク付けするツールを開発した。米国国務省が公開している1973~1977年の外交文書で試してみたところ、世界的に重要な出来事を押さえていることがわかった。 by Emerging Technology from the arXiv2018.02.14
政治史の研究に革命が起こりつつある。変化の原動力となっているのは、政府活動の電子記録が利用可能になったことと、かつては不可能だった方法でこのデータを大量に処理できるようになったことである。
歴史学者は、世界の重要な出来事に関する同時代の報道記事にすぐにアクセスできる。だが、報道記事は、重要かつ知られざる点で当時の政府の記録と異なっている可能性があり、比較して検証する必要がある。ところが、政府の記録は通常、一定の年数が経過した後でしか公けにならず、膨大な政府文書の検証作業は困難なものになっている。研究者が何か重要なことを見落とすのは目に見えているのだ。
それらの政府記録から重要な出来事を自動的に探す方法があれば、非常に有益なものとなるだろう。
ニューヨーク州コロンビア大学のユアンジュン・ガオ博士と数名の仲間は、政府記録から重要な出来事を自動的に探すことができる統計ツール一式を開発した。ガオ博士らはこのツールを使って国立公文書記録管理局が公開している米国政府の電子記録を分析し、結果を同時代の報道記録との比較を試みている。
研究が可能になった背景には、米国国務省が1973年以降、機密通信を電子記録していることがある。1973年から1977年までの記録の多くは現在公開されており、機密解除された140万通の電報と、外交封印袋で配達された40万通の文書に関連するメタデータから成り立っている。
これらの電子記 …
- 人気の記事ランキング
-
- The humans behind the robots 家事ロボット、実は8割は遠隔操作 あなたは受け入れられますか?
- Promotion Innovators Under 35 Japan × CROSS U 無料イベント「U35イノベーターと考える研究者のキャリア戦略」のご案内
- Can Afghanistan’s underground “sneakernet” survive the Taliban? タリバン政権下で生き残りをかける「コンテンツ密売人」たち
- The 8 worst technology failures of 2024 MITTRが選ぶ、 2024年に「やらかした」 テクノロジー8選
- The biggest AI flops of 2024 「7つの失敗」で振り返る 2024年のAIシーン