世界の仕組みを理解することは、原因と結果を理解することを意味する。物事はどうしてこうなっているのか? それをすると何が起こるか? 相関関係は、特定の複数の現象が一緒に起こるということを示すに過ぎない。因果の繋がりのみが、あるシステムがそうある理由やどのように進化する可能性があるのかを示す。簡潔に言えば、相関関係と因果関係は異なる。
このことは、膨大な数の変数が相互に関連付けられる医学において大きな問題となる。病気の診断は、どの状態がどの症状を引き起こすかを知ることにかかっており、病気の治療は、さまざまな薬やライフスタイルを変えることの効果を知ることにかかっている。そのような絡み合った問題のもつれを解くには、通常、厳密な観察研究やランダム化比較試験を実施する。
これらの結果は豊富な医療データを作成するが、さまざまなデータセットに分散しているため、多くの疑問が解決されていない。1つのデータセットが肥満と心臓病の相関を示し、別のデータセットが低ビタミンDと肥満の相関を示す場合、低ビタミンDと心臓病の関係はどうなるのか。通常、調べるには別の臨床試験が必要だ。
この断片的な情報をどのように活用すればよいのだろうか。コンピューターはパターンを見つけるのに優れているが、それは単なる相関関係だ。ここ数年、コンピューター科学者は、単一のデータセット内の因果関係を特定できるアルゴリズムをいくつか発明した。しかし、単一のデータセットに注目することは、鍵穴を覗くようなものだ。必要なのは、全体像を把握する方法である。
英国に本拠を置くデジタル保健医療プロバイダーであるバビロン・ヘルス(Babylon Health)の研究者アニッシュ・ディールとシアラン・リーは、さまざまなデータセットにまたがる因果関係を見つけるための手法を考案した。この手法により、まだ活用されていない医療データの大規模なデータベースにおいて原因と結果を …