2013年、英国情報機関のあるグループが奇妙なことに気づいた。デジタルインフラの保護対策の大半は犯罪者の侵入を防ぐ目的に固定されており、その反対に情報漏洩の阻止を狙ったものは少ないということのだ。この考え方を基に、先ほどのグループは「ダークトレース(Darktrace)」という名の新たなサイバーセキュリティ企業を立ち上げた。
ダークトレースはケンブリッジ大学の数学者と提携し、内部不正を捕捉するための機械学習用ツールの開発に着手した。彼らには過去の攻撃の例を基にアルゴリズムを訓練する方法ではなく、異常な行動の新たな事例をシステムが認識できる手法が必要だった。そこで、機械学習のアルゴリズムとしては珍しい、何を求めるべきかを人間が指定する必要がない「教師なし学習」という手法に目を向けた。
「それは人間の免疫システムによく似ています」と、ダークトレースの共同CEO(最高経営責任者)であるニコール・イーガンは話す。「人間の身体は非常に複雑で、何が自分自身であり、何がそうでないかについての先天的な感覚を持っています。そして自分に属していないもの、つまり自分自身ではないものを見つけると、非常に正確に素早く反応します」。
圧倒的多数の機械学習アプリケーションは「教師あり学習」に依存している。この手法では、慎重にラベル付けされた大量のデータを機械に与え、狭義に定義されたパターンを認識できるように訓練する。たとえば、機械にゴールデンレトリバーを認識させたいとしよう。その場合は数百枚、または数千枚のゴ …