無限のデータ、保存に限界
デジタル時代の歴史を
未来にどう残すべきか?
人類はかつてないほど多くのデータを日々作り出している。デジタルデータは劣化せずに保存できるのが利点だが、膨大なデータを後世に残す取り組みは多くの課題を抱えている。未来のために、何を保存すべきなのか。そして後世の人々は残されたデータを読み取り、理解することができるのだろうか。 by Niall Firth2024.09.05
- この記事の3つのポイント
-
- 現代社会は大量のデータを生み出しているが、そのデータは脆弱で消失しやすい
- アーキビストは重要なデータを保存し、未来に残すことに尽力している
- 未来の人類が私たちの時代を理解するためには、データの長期保存が不可欠である
私の最愛の娘の写真がある。古い裏庭に座って微笑み、ぽっちゃりした手で涼しげな芝生をつかんでいる。娘がもうすぐ1歳になろうという2013年に、古くなったサムスンのデジタルカメラで撮影したものだ。当初はこの写真をノートPCに保存していたが、その後、外付けハードディスクに移した。
それから数年後、グーグル・フォト(Google Photos)にアップロードした。「芝生」という単語で検索すると、グーグルのアルゴリズムがその写真を引っ張り出してくる。いつも私を笑顔にしてくれる写真だ。
私は思い出を安全に保つため、グーグルに毎月1.79ポンドを支払っている。たった26年しか存在していない企業に、私が寄せる信頼は相当なものだ。しかし、省かれる手間を考えれば、それだけの価値はある。今の時代は本当にたくさんの「もの」があふれている。それらの更新や安全な保管を続けるのに必要な手間は、あまりにも煩わしい。
両親にはこうした問題はなかった。フィルムカメラでたまに私の写真を撮り、定期的に紙にプリントしてアルバムに貼った。1年あたり数枚の写真は、40年あまり経った今でも、色あせて黄ばんだ写真用紙上で見られる。
その後数十年間の私の思い出の多くも紙の上にある。20代の頃、海外旅行に行った友人たちからもらった手紙は、罫線入りの紙に手書きされたものだった。それら手紙は今でも靴箱にぎっしり詰まっていて、私を楽しませてくれる。オフライン時代の比較的小さなアーカイブだ。
今ではそのようなスペースの制限はない。私はアイフォーン(iPhone)で年間数千枚の写真を撮る。インスタグラムやティックトック(TikTok)のフィードは常に更新されている。ワッツアップ(Whatsapp)のメッセージやテキスト、メールやツイートは一斉に何十億通も送信される。
ただ、これらすべてのデータは大量である一方で、より刹那的でもある。そう遠くない将来、ユーチューブは存在しなくなり、その動画は永遠に失われるかもしれない。フェイスブックも、あなたのおじさんの休日の投稿も消えてしまうだろう。前例がある。大規模ソーシャルネットワークの草分けであるマイスペース(MySpace)は、2016年以前にアップロードされたすべての写真、映像、音声ファイルをどうやらうっかり削除してしまったようだ。インターネット初期におけるユーザー同士のコミュニケーションの場であったユーズネット(Usenet)のニュースグループ(newsgroups)は、全体が永遠にオフラインとなり、歴史から消えてしまった。そして今年6月、MTVニュースのアーカイブがオフラインになり、20年以上にわたる音楽ジャーナリズムに幕が引かれた。
多くのアーキビスト(archivist:歴史的または重要な文書、記録、データなどを収集、保存、管理する専門家)からしてみれば、警鐘は鳴り続けている。彼らは世界のいたる所で、廃止されたWebサイトや消滅の危機に曝されているデータ・コレクションをかき集めて、私たちのデジタルライフを可能な限り保存しようとしている。また、数百年、いや数千年保存可能なフォーマットでデータを保存する方法の開発に取り組んでいる人たちもいる。
この取り組みは複雑な問題を提起する。私たちにとって何が重要なのか? 何を残し、何を手放すのかを、どのように決めるのか?
そして、未来の世代は、私たちが保存できたものを、どう解釈するのか?
「すべての歴史学者、考古学者、小説家が直面する難題へようこそ」。文化人類学者のジュヌビエーブ・ベル(オーストラリア国立大学副学長)は言う。「人は(過去の遺物や文献など)残されたものの意味をどう解釈するのでしょうか? そして、過去の物事を紐解くとき、『現在』というレンズ(現代の価値観や視点)が影響しないようにするにはどうすれば良いのでしょうか?」
最後のチャンス
現在、歴史上のどの時点よりも多くのものが生み出されている。今年のグーグルI/Oカンファレンスで、サンダー・ピチャイ最高経営責任者(CEO)は、毎日60億の写真と動画がグーグル・フォトにアップロードされていると述べた。また、毎分4000万通以上のワッツアップ・メッセージが送信されている。
しかし、これほどの量にもかかわらず、私たちのデータはかつてないほど脆いものになっている。書籍は図書館の予期せぬ火災で燃えてしまうかもしれないが、データを永久に消去することははるかに簡単だ。私たちはそれを目撃してきた。また、マイスペースのデータが誤って削除されたようなケースだけでなく、時には意図的に削除されることもある。
2009年、ヤフーはWebホスティング・プラットフォームのジオシティーズ(GeoCities)を廃止すると発表し、手間暇かけて作成された数百万ものWebページを窮地に追い込んだ。それらページのほとんどは取るに足らないものかもしれないが、ジオシティーズはそのアマチュアっぽさや初期のWebの美学、さらにはさまざまなコレクション、こだわり、ファンダム(大規模なファンコミュニティ)に特化したページで有名だった。ジオシティーズはWeb初期の代名詞的存在であり、永遠に失われようとしていた。
ジェイソン・スコット率いる寄せ集めのボランティア・アーキビストのグループが介入しなければ、実際にそうなっていただろう。
「私たちはすぐに行動を開始しました。しかし、当時の怒りと混乱の一因は、ほんの一握りの興味深いWebサイトをダウンロードしていたところ、突然、初期のWebの中心的なWebサイト(全体)を扱うことになったことでした」とスコットは振り返る。
アーカイブ・チーム(Archive Team)というスコットのグループは、すぐに動員をかけ、永久に閉鎖される前にできるだけ多くのジオシティーズのページをダウンロードした。そして、2009年4〜10月までの間に数百万というページをアーカイブし、サイトの大部分を保存できた。スコットの推定によると、ダウンロードと保存に成功したのは約1テラバイトだが、ジオシティーズのサイズは増減を繰り返し、ピーク時には約9テラバイトだったという。おそらく、その多くが永久に消えてしまったのだろう。「ジオシティーズには、100%ユーザーが作成した作品、フォーク・アート(郷土芸術)、情報や歴史について書いた人間の実直さを語るものなど、他のどこにもないものが含まれていました」とスコットは話す。
シルクハットとサイバーパンク風のスタイルで知られるスコットは、失われる危険性のあるWebの一部を救う手助けを生涯の使命としている。「アーカイブや保存というのは潮の満ち引きのように自然に起こるものではなく、選択であり、義務であるという理解が広まりつつあります」とスコットは話す。
スコットは現在、インターネットのパイオニアで起業家のブリュースター・ケールによって1996年に創設された非営利団体のオンライン・ライブラリー「インターネット・アーカイブ(Internet Archive)」で「気ままなアーキビスト兼ソフトウェア・キュレーター」として働いている。
過去20年にわたり、インターネット・アーカイブは、ジオシティーズのコンテンツも含め、Webのあちこちからかき集めた膨大な資料を蓄積してきた。また、純粋にデジタルな資料だけでなく、スキャンによって救い出した膨大な量のデジタル化された書籍も保有している。インターネット・アーカイブは設立以来、145ペタバイト以上のデータを収集しており、その中には映画、画像、テキストなど、9500万以上の公共メディアファイルが含まれる。また、MTVニュースも50万ページ近く保存することに成功した。
インターネット・アーカイブの「ウェイバック・マシン(Wayback Machine)」は、特定のWebサイトがどの時点でどのように表示されていたかをユーザーが巻き戻して見ることができる。そこには8000億以上のWebページが保存されており、毎日6億5000万ページを追加記録している。また、世界中のテレビチャンネルを録画・保存し、ティックトック(TikTok)やユーチューブ動画も保存している。これらはすべて、インターネット・アーカイブが自ら所有する複数のデータセンターに保管されている。
果てしなく骨の折れる仕事だ。ハーバード大学図書館イノベーション研究室で室長を務め、図書館と科学技術者が互いに学び合うことを支援しているジャック・クッシュマンは、社会では非常に多くの新しいものが生み出されているため、毎年、前の年よりも多くのものを削除しなければならないという。「何を保存し、何を保存しないかを考えなければなりません」と話す。そして、「その決定方法も考えなければなりません」と付け加えた。
アーキビストは常にそのような(保存・非保存の)決断を下さなければならない。例えば、「どのティックトック(コンテンツ)を後世に残すべきか?」といった具合だ。
デンマークのオーフス大学でインターネットを研究するニールス・ブリュッガー教授は、未来の歴史学者が私たちについてどのようなことに興味を持つかを想像しすぎるべきではないと話す。「30年後の歴史学者が今のこの時代について何を研究したいかは、なんの手がかりもないので想像できません」と同教授は言う。「ですから、未来の歴史学者が何を問いかけるのかという予想や、ある種の絞り込みはするべきではないのです」。
その代わり、できるだけ多くのものを保存しておき、後世の歴史学者に考えてもらうべきだとブリュッガー教授は話す。「歴史学者として、私は間違いなくこう言うでしょう。すべてを残しておけば、歴史学者はそれを使って一体何を …
- 人気の記事ランキング
-
- These AI Minecraft characters did weirdly human stuff all on their own マイクラ内に「AI文明」、 1000体のエージェントが 仕事、宗教、税制まで作った
- Promotion MITTR Emerging Technology Nite #31 MITTR主催「再考ゲーミフィケーション」開催のご案内
- The startup trying to turn the web into a database Webをデータベースに変える、新発想のLLM検索エンジン
- 3 things that didn’t make the 10 Breakthrough Technologies of 2025 list 2025年版「世界を変える10大技術」から漏れた候補3つ
- OpenAI’s new defense contract completes its military pivot オープンAIが防衛進出、「軍事利用禁止」から一転