3月にインド周辺で新型コロナウイルス(SARS-CoV-2)の感染者数が急増し始めると、ニューデリーにあるCSIRゲノミクス・統合生物学研究所(CSIR Institute of Genomics and Integrative Biology)の博士課程3年生であるバニ・ジョリーは、ウイルスの遺伝子コードにその答えを探し求めた。
それはちょうど、B.1.1.7と呼ばれる新型コロナウイルスの変異株(まもなくアルファ株と呼ばれるようになった)が英国内での感染者数急増の原因になっているというニュースで、英国の研究者が科学界を震撼させたばかりのころであった。ジョリーは、アルファ株がインドでも感染を拡大させているのではないかと考えたのだ。
CSIRゲノミクス・統合生物学研究所はインドにおける新型コロナウイルス研究の最前線であり、全国各地から収集された何千もの新型コロナウイルスのサンプルの遺伝子配列にアクセスできる。ジョリーは、新型コロナウイルスの系統樹の枝に従って遺伝子配列をグループ化するソフトウェアを使ってサンプルの解析を実行し始めた。
ジョリーは、B.1.1.7変異株の密集した塊ではなく、既知の変異株とは似ても似つかない遺伝子配列の集団を発見した。そのうちのいくつかには、スパイクタンパク質に2つの突然変異があり、その変異はウイルスをより危険なものに変えることがすでに疑われていた。
ジョリーが指導教授にこの話をすると、指導教授は、インド国内にある他の遺伝子配列解析ラボに連絡するように提案した。他のラボのデータもまた、局所的なアウトブレイクによって新型コロナウイルスに新しい系統が生まれたという兆候が示されていたからだ。
ほどなくして、ジャーナリストは変異株の新たな進展のことをかぎつけ、ジョリーは「二重突然変異」や「インド型変異株」についての記事を目にし始めた。
変異株の「恐ろし気な」ニックネームを使うよりも、便利な分類を使ったほうが研究者にとってより役に立つ。そこで、少人数の科学者グループが新しい変異株に名前を付けているサイトに目を向けた。スコットランドの博士課程の学生が主に率い、世界各地から少数のボランティアが運営しているギットハブ(GitHub)のページである。
ボランティアたちが管理している「パンゴ(Pango)」と呼ばれるシステムは静かに浸透し、今や、新型コロナウイルスのグローバルな研究には欠かせない。そのソフトウェアツールと命名システムは、世界中の科学者が約250万件の新型コロナウイルスのサンプルを理解して分類するために活用されている。
4月にジョリーは、自身が発見した遺伝子配列をギットハブのページに投稿し、それらが新型コロナウイルスの重大な変化を意味する理由の説明を添えた(ジョリーは新しい変異株について警告した2人目のユーザーであった。最初の警告は英国の研究者によって数日前になされていた)。パンゴ・チームはすぐさま、「B.1.167」という新しい名前を提案した。この系統には、現在メディアで「デルタ株」と呼ばれ、強い感染力を持つことで知られている変異株が含まれている。
「パンゴを使うと、私たちの調べている新型コロナウイルスが、ほかの国で見られるものと同じものであるかどうかを簡単に確認できます」とジョリーは言う。「異なる場合は、インドで見つかった変異株を本当に簡単に報告できるので、他の国でも追跡できるようになります」。
世界中の研究者、公衆衛生担当者、ジャーナリストがパンゴを活用して新型コロナウイルスの進化を理解しようとしている。しかし、新型コロナウイルスのゲノミクスという新しい分野では多くがそうであるように、こういった試み全体が若い研究者の小規模なチームによって支えられている。そして、そうした作業のために、彼らがしばしば自身の研究を一旦保留していることは、ほとんど知られていない。
多すぎるデータ
ウイルスが進化し、次々と人に感染するにつれて、ウイルスの系統樹の新しい枝に名前を付けるための正式で実績あるプロセスが昔からあったと、読者は思うかもしれない。実際のところ、研究者は20年間、遺伝子配列の解析を用いてウイルスを研究してきた。
しかし、その作業は歴史的には、桁違いに少ないデータに対処すれば済んだ。新型コロナウイルスの遺伝子配列解析がそうであったように、そのほとんどは世界中の科学者たちの間で協調的に共有されてこなかった。標準化された名前を付ける差し迫った必要性はまったくなかったのだ。
2020年3月に世界保健機関(WHO)がパンデミックを宣言したとき、遺伝子配列の公開データベースを提供するGISAIDには、524件の新型コロナウイルスが登録されていた。4月にかけて、科学者はさらに6000件をアップロードし、5月末までに、その合計は3万5000件を超えた(一方、2019年通年で、世界の科学者は4万件のインフルエンザウイルスの遺伝子配列をGISAIDのデータベースに追加した)。
「名前がなければ、用を成しません。他の人が話していることを理解できません」と、イェール大学公衆衛生大学院のゲノム疫学博士研究員で、パンゴの取り組みに貢献しているアンダーソン・ブリトは言う。
新型コロナウイルスの遺伝子配列の数が急増するにつれて、それらを研究しようとする研究者は、まったく新しいインフラと標準を急いで作ることを余儀なくされた。汎用命名システムは、この取り組みの最も重要な要素の …