バチカン秘密文書館に眠る中世文書、新方式のOCRでデータ化
知性を宿す機械

AI tackles the Vatican’s secrets バチカン秘密文書館に眠る中世文書、新方式のOCRでデータ化

バチカンの秘密文書にどんなミステリーが隠されているかは誰も分からない。現在、文書のデータ化が進められているが、中世文字特有の合字や略語に、従来の光学文字認識アルゴリズムは使えなかった。だが、イタリアの研究チームが試行錯誤の末、ある方法を考案した。 by Emerging Technology from the arXiv2018.04.05

バチカン秘密文書館には伝説が詰まっている。伝えられているところでは、バチカン市国にある長さ85キロメートルにもおよぶ書棚に所蔵されている文書には、過去の教皇の個人的な手紙やその他の書類が含まれており、その中には8世紀にまでさかのぼるものもある。

この文書館は厳重に警備されている。だが1881年以降、学者は限定的にそれらの文書の一部にアクセスできるようになり、それだけでも非常に多くのことが明らかになってきた。

たとえば、1307年に始まり、その後数年間続いたテンプル騎士団の宗教裁判についての詳細は所蔵されている60メートルの巻物に書かれている。歴代の教皇に宛てられたミケランジェロからの手紙、ヘンリー8世からの離婚嘆願書、そして斬首前の仲裁を乞うスコットランド女王メアリー1世からの書簡もある。

この文書館には比較的最近の書簡も含まれている。たとえば、エイブラハム・リンカーンとジェファーソン・デイヴィスがそれぞれ教皇ピウス9世に対して北軍または南軍に味方してくれるように懇願している書簡がある。また、教皇ピウス12世に関する記録や、ピウス12世と第二次世界大戦中のナチス政権との取引に関する文書も含まれているが、まだ公開されていない。実際のところ、1939年以降、現在までのすべての文書は完全に機密となっている。

文書の公開は禁じられているものの、文書館には独自の撮影・保存作業室がある。世界中の多くの歴史的アーカイブと同様に、この文書館でも保全やさらなる研究を可能にする目的で、特定文書の画像保存が進められている。

だが、バチカンの記録はあまりに膨大で、合理的な期間内に手作業で文字をデータ化することは非現実的である。マシン・ビジョンを活用できないだろうか。

今日、イタリアにあるローマ・トレ大学のドナテッラ・フィルマーニ博士とそのチームのおかげで答えが得られた。研究チームはイン・コーディチェ・ラティオ(In Codice Ratio、ラテン語で「コードシステム」の意)と呼ばれるプロジェクトを開始した。プロジェクト …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。