米国疾病予防管理センター(CDC)は毎年、インフルエンザの流行予測を競い合うコンペを開催している。全米からさまざまな研究チームが参加し、独自の予測方法を使って競い合う。最優秀成績を収めたチームは研究資金を獲得し、CDCと協力して次のインフルエンザ・シーズンへ向けて米国の準備態勢を改善する。
CDCは現在、より多くの情報に基づいた意思決定をする取り組みの一環として、インフルエンザ流行予測の手法を使って新型コロナウイルスの感染拡大を予測するように数十の研究チームに要請している。要請を受けたチームの1つに、これまで5年間連続で最優秀レベルの結果を出してきたカーネギーメロン大学(CMU)の研究グループがある。昨年、CMUのこの研究グループは、インフルエンザ予測における「卓越した国家研究拠点(National Centers of Excellence)」の2つのうちの1つに指定され、コミュニティ全体の予測プロセスの設計を主導するよう要請された。
同グループの責任者であり、CMUの機械学習部門を率いるロニ・ローゼンフェルド教授は、当初、新型コロナウイルスの予測に乗り気ではなかったと認める。素人考えでは、2つの病気の予測はそれほど変わらないように思えるが、新型コロナウイルスのアウトブレイク予測の方がはるかに難しいという。ローゼンフェルド教授は、正しい予測が出せるかどうか、そして有意義な予測が出せるかどうかを心配したが、最終的には、とにかくまい進しようと考えるに至った。
「人々は、紙の上であろうと頭の中であろうと、予測モデルに基づいて行動します」と、ローゼンフェルド教授は言う。「直感に基づくのではなく、合理的な議論ができるように、予測モデルに基づいた推測を定量化した方がうまくいくでしょう」。
ローゼンフェルド教授らの研究チームは、インフルエンザ・シーズン中の症例数の増減を正確に特定するために3つの方法を使用している。1つ目の方法は、現在の感染者数を予測する「ナウキャスト」だ。CDCやその他のパートナー組織(インフルエンザ関連のグーグル検索、ツイッター投稿、CDCや各種医療サイト、ウィキペディアのWebトラフィックなど)から、最新データおよび過去データを集める。そして、これらのデータを機械学習アルゴリズムに送り込んでリアルタイムに予測する。
他の2つの方法は厳密な意味での「予測」、すなわち、将来の予測だ。1つは、機械学習を利用する方法、もう1つはクラウドソーシングした意見を利用する方法である。予測には、最大4週間先までの傾向予測に加えて、インフルエンザ・シーズンのピーク時期などの重要な節目や予想される最大症例数が含まれる。このような情報は、CDCと医療機関の両方が事前の備えとして対 …