安全で効果的なワクチンが幅広く利用できるようになるまでは、新型コロナウイルス(SARS-CoV-2)の感染をくい止めることが最も重要となる。そのためには、誰が新型コロナウイルスに感染しているのかを知る必要がある。最近になり、検査能力は向上しているが、感染者の半数近く近くを占める無症状患者の検査に必要なレベルには程遠い。
私たちの研究によると、データサイエンスを活用することで、現在の検査能力を効果的に向上させられることが分かった。機械学習とプーリング検査(複数の人の検体を混ぜ合わせて一度に検査すること)を組み合わせれば、大規模な人口集団が毎週または毎日でも、1日1人当たり3ドルから5ドル程度で検査を受けられる。
つまり、検査ごとにかかる費用はコーヒー1杯分ほどだ。それだけの費用で政府は、新しい研究所を建築したり、新しい薬やワクチンを作ったりしなくても、安全に経済活動を再開させて、今も続いている新型コロナウイルスの感染を止めることが可能となる。
新型コロナウイルスの検査を受けている人々のほとんどは、症状があるか、感染者の濃厚接触者だ。しかし、会社や学校の再開を迫る声が高まる中で、組織は不都合な真実に対処せざるを得なくなっている。それは、症状を頼りに検査をすると、無症状の症例や症状が出る前の症例を見逃すことになり、すべての人を危険に晒してしまうということだ。
しかし、現在の選択肢は魅力的ではない。頻繁ではない検査(多くの提案では毎月がデフォルトになっている)や闇雲なスクリーニングでは、感染者が発症するまでの数週間にウイルスを拡散してしまう。また、費用はいまだに100ドルから200ドル以上と高額だ。
機械学習アルゴリズムに基づいた「プーリング検査」によって、こうした状況を変えることができる。プーリング検査では、多くの人の検体を混ぜて1つにする。そこからウイルスが検出されなければ、検体を混ぜ合わせた集団(「プール」と呼ぶ)内の人は誰も感染していないことになる。たった1度の検査でプール全体の人々の検査結果が判明するのだ。
しかし、落とし穴もある。プール内の誰か1人でも感染していれば、検査結果は陽性反応を示し、誰がウイルスに感染しているのかを特定するためにさらに検査が必要となる。
そのため、プールにひとまとめにして検査をする人々を選ぶ際に、陽性になる可能性の高い人たちを特定し、そうでない人たちと分けることが重要となる。そこで登場するのが機械学習だ。
米 …