バチカン秘密文書館に眠る中世文書、新方式のOCRでデータ化
バチカンの秘密文書にどんなミステリーが隠されているかは誰も分からない。現在、文書のデータ化が進められているが、中世文字特有の合字や略語に、従来の光学文字認識アルゴリズムは使えなかった。だが、イタリアの研究チームが試行錯誤の末、ある方法を考案した。 by Emerging Technology from the arXiv2018.04.05
バチカン秘密文書館には伝説が詰まっている。伝えられているところでは、バチカン市国にある長さ85キロメートルにもおよぶ書棚に所蔵されている文書には、過去の教皇の個人的な手紙やその他の書類が含まれており、その中には8世紀にまでさかのぼるものもある。
この文書館は厳重に警備されている。だが1881年以降、学者は限定的にそれらの文書の一部にアクセスできるようになり、それだけでも非常に多くのことが明らかになってきた。
たとえば、1307年に始まり、その後数年間続いたテンプル騎士団の宗教裁判についての詳細は所蔵されている60メートルの巻物に書かれている。歴代の教皇に宛てられたミケランジェロからの手紙、ヘンリー8世からの離婚嘆願書、そして斬首前の仲裁を乞うスコットランド女王メアリー1世からの書簡もある。
この文書館には比較的最近の書簡も含まれている。たとえば、エイブラハム・リンカーンとジェファーソン・デイヴィスがそれぞれ教皇ピウス9世に対して北軍または南軍に味方してくれるように懇願している書簡がある。また、教皇ピウス12世に関する記録や、ピウス12世と第二次世界大戦中のナチス政権との取引に関する文書も含まれているが、まだ公開されていない。実際のところ、1939年以降、現在までのすべての文書は完全に機密となっている。
文書の公開は禁じられているものの、文書館には独自の撮影・保存作業室がある。世界中の多くの歴史的アーカイブと同様に、この文書館でも保全やさらなる研究を可能にする目的で、特定文書の画像保存が進められている。
だが、バチカンの記録はあまりに膨大で、合理的な期間内に手作業で文字をデータ化することは非現実的である。マシン・ビジョンを活用できないだろうか。
今日、イタリアにあるローマ・トレ大学のドナテッラ・フィルマーニ博士とそのチームのおかげで答えが得られた。研究チームはイン・コーディチェ・ラティオ(In Codice Ratio、ラテン語で「コードシステム」の意)と呼ばれるプロジェクトを開始した。プロジェクト …
- 人気の記事ランキング
-
- Bringing the lofty ideas of pure math down to earth 崇高な理念を現実へ、 物理学者が学び直して感じた 「数学」を学ぶ意義
- Promotion Innovators Under 35 Japan × CROSS U 無料イベント「U35イノベーターと考える研究者のキャリア戦略」のご案内
- The 8 worst technology failures of 2024 MITTRが選ぶ、 2024年に「やらかした」 テクノロジー8選
- Google’s new Project Astra could be generative AI’s killer app 世界を驚かせたグーグルの「アストラ」、生成AIのキラーアプリとなるか
- AI’s search for more energy is growing more urgent 生成AIの隠れた代償、激増するデータセンターの環境負荷