KADOKAWA Technology Review
×
メタ、材料科学向けの最大級データセットとAIモデルを無償公開
Stephanie Arnett/MITTR | Adobe Stock
The race to find new materials with AI needs more data. Meta is giving massive amounts away for free.

メタ、材料科学向けの最大級データセットとAIモデルを無償公開

メタは、材料科学において現在利用可能な最大級のデータセットとなる「オープン・マテリアルズ2024」を無償公開した。気候変動の緩和に寄与する特性を備えた新材料などの発見を加速するのに貢献しそうだ。 by Melissa Heikkilä2024.10.23

メタ(Meta)は、新材料の発見を支援する科学者向けの大規模データセットとモデル「オープン・マテリアルズ2024(Open Materials 2024、OMat24)」を公開した。OMat24は、材料の発見プロセスにおける最大のボトルネックの1つである「データ」の問題に対処するものだ。

新しい材料を発見するために、科学者たちは周期表に記載された元素の特性を計算し、コンピューター上でさまざまな組み合わせをシミュレーションする。この作業は例えば、より優れた電池の製造や新しい持続可能な燃料の開発など、気候変動の緩和に寄与する特性を備えた新材料の発見につながるものだ。

ただし、この作業には大規模なデータセットが必要とされる一方で、これらのデータセットは入手困難なものでもある。データセットの作成には大量の計算能力が必要で、多額の費用がかかる。また、現存する主要なデータセットとモデルの多くは企業などが独自に専有するものであり、研究者はそれらを利用できない。メタが支援したいと考えているのが、この部分だ。同社は、新たなデータセットとモデルを10月18日に無償で公開し、それらをオープンソースとして提供する。このデータセットモデルはハギング・フェイス(Hugging Face)から誰でもダウンロードでき、編集・利用が可能だ。

「材料科学コミュニティに貢献し、オープンソースのデータモデルをもとに構築することで、コミュニティ全体がさらに速く、さらに遠くまで前進できると私たちは確信しています」。OMatプロジェクトで主任研究者を務めるラリー・ジトニックは語る。

ジトニックは、この新しいOMat24のモデルは、材料科学における最高の機械学習モデルをランク付けする「マットベンチ・ディスカバリー(Matbench Discovery)」リーダーボードでトップになるだろうと話す。OMat24のデータセットも、利用可能な最大級のものになるだろう。

「材料科学には機械学習革命が起こっています」と、カリフォルニア大学サンディエゴ校でナノエンジニアリングの教授を務め、このプロジェクトには関わっていないシュエ・ピン・オンは言う。

「これまで科学者は、たいへん小規模なシステムで材料特性のとても正確な計算をするか、たいへん大規模なシステムでそれほど正確ではない計算をするかしかできませんでした」とオン教授は話す。そういったプロセスは多くの時間と労力を要し、費用もかかる。「機械学習がそのギャップを埋め、AIモデルにより、科学者たちは周期表のあらゆる元素の組み合わせのシミュレーションを、はるかに迅速かつ安価に実行できるようになりました」と同教授は言う。

データセットを公開するという今回のメタの決定は、AIモデル自体を公開することよりも意義深い。そう話すのは、ケンブリッジ大学の分子モデリング関連の教授で、この取り組みには関わっていないガボル・ツァニである。

「グーグルやマイクロソフトといった他の業界大手プレーヤーとはまったく対照的です。両社とも最近、同様に大規模ですが、秘密のデータセットで訓練した競合モデルと思われるものを公開しました」とツァニ教授は言う。

OMat24のデータセットを作成するために、メタは既存の「アレキサンドリア(Alexandria)」というデータセットを使い、そこから材料をサンプリングした。その後、さまざまな原子のさまざまなシミュレーションと計算を実行して、データセットをスケールアップした。

メタのデータセットに含まれる約1億1000万のデータポイント数は、以前のデータセットの何倍も多い。加えて、他のデータセットは、必ずしもデータが高品質というわけではないとオン教授は話す。

メタは、材料科学コミュニティーの現在の取り組みを超えた規模にデータセットを大幅拡張すると同時に、高い精度を実現したと同教授は言う。

データセットの作成には膨大な計算能力が必要であり、メタはそれを提供できる世界でも数少ない企業の1つである。メタのジトニックによると、同社の取り組みには別の動機が存在する。スマート拡張現実(AR)メガネをより手頃な価格にするための新しい材料を発見したいと考えているのだ。

「マテリアルプロジェクト(Materials Project)」によって作成されたものをはじめ、オープンデータベースをめぐるこれまでの取り組みは、過去10年間で計算材料科学に変革をもたらしたと、ミネソタ大学で化学工学と材料科学の助教授を務め、メタの取り組みには関わっていないクリス・バーテルは語る。

グーグルの「材料探索のためのグラフィカル・ネットワーク(GNoMe:Graphical Networks for Material Exploration)」といったツールでは、訓練用データセットの規模に応じて新材料発見の可能性が高まることが示されている、とバーテル助教授は付け加えてこう語る。

「OMat24データセットの公開は、材料科学コミュニティーにとってまさに贈り物であり、この分野における研究がすぐに加速することは間違いないでしょう」。

人気の記事ランキング
  1. OpenAI says ChatGPT treats us all the same (most of the time) 相手の名前で回答が変わる?チャットGPTに潜むバイアス明らかに
  2.  A data bottleneck is holding AI science  back, says new Nobel winner ノーベル受賞者・ベイカー教授が指摘する「AI科学」の課題
  3. Trajectory of U35 Innovators: Hiroki Matsunaga 松永浩貴:「枠を超えた発想」が生み出す革新的なロケット推進剤
メリッサ・ヘイッキラ [Melissa Heikkilä]米国版 AI担当上級記者
MITテクノロジーレビューの上級記者として、人工知能とそれがどのように社会を変えていくかを取材している。MITテクノロジーレビュー入社以前は『ポリティコ(POLITICO)』でAI政策や政治関連の記事を執筆していた。英エコノミスト誌での勤務、ニュースキャスターとしての経験も持つ。2020年にフォーブス誌の「30 Under 30」(欧州メディア部門)に選出された。
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者は11月発表予定です。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る