深層学習で創薬 ハーバード大学などが成果発表
知性を宿す機械

Software Dreams Up New Molecules in Quest for Wonder Drugs 深層学習で創薬 ハーバード大学などが成果発表

機械学習システムによる膨大な医薬品データの取り込みが、人類に新たな可能性を示してくれる。 by Tom Simonite2016.11.04

アスピリンとイブプロフェンを組み合わせたらどうなるか。ハーバード大学のアラン・アスプル=グジック教授(化学)にもその答えはわからない。しかしアスプル=グジック教授は、この疑問に答えられるようにソフトウェアを訓練した。ソフトウェアは、両方の薬品の属性を兼ね備えた分子構造を示し、答えてくれるかもしれない。

この人工知能は新薬の研究に役立つかもしれない。 薬学研究は候補分子で満たされた巨大なプールを隈なく探索するため、ソフトウェアに頼りがちだ。こうしたソフトウェアは化学者によって書かれたルールと有用な構造を推測するためのシミュレーションによって動いているが、人間の思考にもシミュレーションの正確性にも制約があり、コンピューターの処理能力には限界がある。

アスプル=グジック教授のシステムは人間とは全く違ったやり方で、長たらしいシミュレーション抜きに分子構造を構想できる。機械学習アルゴリズムと何万種もの「薬らしい」分子のデータによって蓄えられた自らの知識経験を活用するのだ。

アスプル=グジック教授は「このシステムは、まるで化学者のように、自らが学んだ化学知識を使ってより直感的に研究します。この種のソフトウェアを助手として活用すれば、人間はより優れた化学者になれるかもしれません」という。アスプル=グジック教授はMIT Technology Reviewが2010年に発表したヤング・イノベーター・リストに選出されている。

新システムは深層学習と呼ばれる機械学習の手法で構築された。深層学習はコンピューター業界の企業では普及しているが、自然科学分野では実例が少ない。深層学習では、膨大な量のデータを取り込んで、学習結果から妥当なデータを新規に生成できる「生成モデル」という設計方式が使われている。

生成モデルは特に画像、音声、テキストの自動生成に用いられる。 たとえばグーグルのスマート・リプライは、生成モデルによってメールの返信を自動作成している。しかしアスプル=グジック教授とハーバード大、トロント大、ケンブリッジ大のチームは先月、生成モデルに25万種の薬らしい分子を学習させた結果を発表した。

このシステムは、既存の薬剤化合物の属性を組み合わせて新しく有望な化学構造を生成したり、溶解性や合成の容易さなど特定の属性を強く示す分子を示したりできるかもしれない。

ベンチャー・キャピタルのアンドレッセン・ホロウィッツのパートナーである、スタンフォード大学のビジェイ・パンデ教授(化学)によると、このプロジェクトは機械学習に関する新しいアイデアが科学研究を一変させるという、最近増えつつある事例のひとつだという (「米国防総省、人工知能企業と協業で乳がんの分子標的治療薬を開発」参照)。

パンデ教授によると、今回の事例には深層学習ソフトウェアが習得したある種の化学知識によって、科学者を補助できる可能性が示されている。

「この技術はかなり広範に応用できると思います。主だった薬剤候補の特定や最適化に役立つかもしれませんし、太陽光電池や触媒など、他のものにも応用できるかもしれません」

研究グループはすでに、ディスプレー技術で重要な有機LED分子のデータベースについて、システムを応用する実験をした。しかし、まったく意味をなさない化学構造が示されることもあるため、実用化には化学的スキルの改善が求められる。

パンデ教授によると、ソフトウェアに化学を学習させる上で困難なことのひとつは、化学構造を深層学習ソフトウェアに読み込ませる際にどのようなデータフォーマットが最適なのかがまだ特定できていないことだ。画像音声認識翻訳の分野で深層学習が人間に迫る性能を発揮していることからも明らかなように、画像、音声、テキストは深層学習に適していた。しかし、化学構造をコード化する既存の方法は、そうともいえないようなのだ。

アスプル=グジック教授のチームは、この問題について考えながら、システムが誤判定する頻度を下げる新機能を追加している。

アスプル=グジック教授はシステムの化学知識を広げるため、さらに大量のデータを学習させようとしている。そうすれば、何百万ものデータベース画像によって画像認識機能が実用化したのと同様、システムの性能はさらに高まるだろう。 アスプル=グジック教授は近いうちにアメリカ化学会のデータベースで記録・公開されている約1億件の化学構造すべてを、自身のAIプロクラムに学習させたいとしている。