公開されているDNAデータベースを使って、警察が一般人を特定できる確率はどれくらいだろうか?
この答えをめぐって最近私は賭けをした。そして、カリフォルニア州にいる2人の数学研究者のおかげで答えが判明した。
賭けは私の負けだったが、それほど大きく外していたわけではない。
ことの始まりは、この4月に「ゴールデン・ステート・キラー」と呼ばれる連続殺人犯の容疑者が逮捕されたことだ。警察は、犯行現場に残されていたDNAを、誰でもアクセスできる家系図サービスサイト「GEDマッチ(GEDmatch)」にアップロードし、容疑者の血縁者数人を特定、そこから本人を突き止めたのである。
今回の事件は、系図学者やジャーナリスト、遺伝学者、その他ありとあらゆる私立探偵まがいの面々から大きな関心を集めた。捜査官らはどうやったのか? 我々の遺伝子のプライバシーは危険にさらされているのだろうか? これまでこのようなことが起こらなかったのはなぜなのか?
中でも気になったのは、たとえ犯罪とは無縁の人にとっても、自分が誰かに見つけられてしまう確率はどれくらいあるのか、ということだ。
私は推測してみた。折しも、自分の先祖が分かるDNA系図検査が爆発的な人気を集め、すでに1200万人以上が検査を受けているという記事を書いたばかりだ。人には誰でも数十人の血縁者がいるだろうから、今ならすべての米国人が少なくとも1人の血縁者をDNAデータベースで見つけられることに賭けてもいい、とツイッターでつぶやいたのである。
「いくら賭ける?」さっそく、スタンフォード大学のヘンリー・グリーリー教授(法学部)が飛びついてきた。
こうして賭けは始まった。まずは条件の設定からだ。私は血縁者探しのデータベースとして最大規模の「アンセストリー・ドットコム(Ancestry.com)」で、95%以上の人が少なくとも1人の「またいとこ」を見つけられることに賭けた。
ヨーロッパに起源を持つ人に限るという重要な条件も付けた。これまでにDNA検査を受けているのが、ほと …