オープンAI、「GPT-4b micro」で科学分野に参入へ
生命の再定義

OpenAI has created an AI model for longevity science オープンAI、「GPT-4b micro」で科学分野に参入へ

オープンAIは、若返り研究に取り組んでいるレトロ・バイオサイエンシズと共同で、新言語モデル「GPT-4b micro」を開発。科学分野に参入する。 by Antonio Regalado2025.01.20

人工知能(AI)の科学分野への貢献といえば、グーグル・ディープマインド(Google DeepMind)の「アルファフォールド(AlphaFold)」を思い浮かべる人も多いだろう。このタンパク質折り畳み構造予測プログラムの開発者には昨年、ノーベル賞が授与された。

そしてオープンAI(OpenAI)もまた、タンパク質を設計するモデルを携えて科学分野に参入する。

同社が開発した言語モデルは、通常の細胞を幹細胞に変化させる能力を持つタンパク質を考案できる。そして、そのモデルが人間を圧倒的に上回る成果を示したと発表した。

この研究は、オープンAIにとって初めて生物学的データに特化したモデルの開発であり、同社がAIによって予期せぬ科学的成果を生み出せると公言した初めての事例である。これで、AIが真の発見ができるかどうかの判断に一歩近づいたと言える。このような発見能力は、「汎用AI(AGI:Artificial General Intelligence)」実現へ向けた大きな試金石だという専門家もいる。

先週、オープンAIの最高経営責任者(CEO)であるサム・アルトマンは、オープンAIがAGIの構築法を理解していると「確信している」と述べ、「超知能(スーパー・インテリジェンス)ツールは、科学的発見とイノベーションを大幅に加速させる可能性があり、そのスピードは人間が独力で達成できるレベルをはるかに超えている」と付け加えた。

このタンパク質設計プロジェクトは、サンフランシスコに拠点を置く長寿研究企業、レトロ・バイオサイエンシズ(Retro Biosciences)が1年前、オープンAIに協力を持ちかけたことから始まった。

この提携は偶然に実現したわけではない。2023年にMITテクノロジーレビューが最初に報じたように、オープンAIのCEOであるサム・アルトマンは、レトロ・バイオサイエンシズに1億8000万ドルを個人名義で出資している

レトロ・バイオサイエンシズは、人間の平均寿命を10年延ばすことを目標としている。そのために、同社は「山中因子(Yamanaka factors)」と呼ばれるものを研究している。山中因子とは、特定のタンパク質群であり、人間の皮膚細胞に加えることで、それを若々しい幹細胞へと変化させる「リプログラミング(細胞初期化)」という現象を引き起こす。幹細胞は、体内のあらゆる細胞組織を生成する能力を持つ。

レトロ・バイオサイエンシズや、潤沢な資金を持つアルトス・ラボ(Altos Labs)などの企業の研究者は、この現象が動物を若返らせたり、人間の臓器を作ったり、代替細胞を供給したりする出発点になり得ると考えている。

しかし、そのような細胞のリプログラミングは効率が悪い。数週間もの時間を要し、実験室のシャーレで処理された細胞のうち、若返りの過程を完了できるのは1%にも満たない。

オープンAIの新しいモデル「GPT-4b micro」は、山中因子を組み換えてその機能を高める方法を提案するように訓練された。オープンAIによると、このモデルの提案を利用して、研究者は山中因子のうちの2つの効果を(少なくとも予備計測では)50倍以上も上げることができたという。

オープンAIの研究者であるジョン・ホールマンは、「全体的に、(GPT-4b microが生成した)タンパク質は科学者が独自に設計したものより優れているようです」と語っている。

このモデルの開発責任者は、ホールマンとオープンAIのアーロン・ジェック、そしてレトロ・バイオサイエンシズのリコ・マイネルである。

この結果の信憑性については、研究成果が発表されるまで外部の科学者には判断できない。オープンAIとレトロ・バイオサイエンシズは発表を予定しているようだが、このモデルが広く公開されることはない。まだ特別な試作品の段階にとどまっており、正式な製品としての発表ではない。

「このプロジェクトは、オープンAIが本気で科学に貢献しようとしていることを示すためのものです」とジェックは語る。「しかし、その機能を独立したモデルとして世に出すのか、それともオープンAIの主要な推論モデルに組み込むのか、それはまだ未定です」。

このモデルは、グーグルのアルファフォールドのようにタンパク質がどのような形状を取るかを予測するものではない。オープンAIによると、山中因子は非常に柔軟で構造が定まらないタンパク質であるため、同社は自社の大規模言語モデルに適した別のアプローチを採用したという。

このモデルは、多くの生物種から得られたタンパク質配列の例と、どのタンパク質が互いに作用し合う傾向があるかという情報を使って訓練された。そのデータ量は膨大だが、オープンAIの主力チャットボットの訓練に使ったデータのほんの一部に過ぎない。したがって「GPT-4b micro」は、焦点を絞ったデータセットで機能する「小規模言語モデル」の一例であると言える。

このモデルを提供されたレトロ・バイオサイエンシズの科学者たちは、モデルを誘導し、山中因子の再設計案を生成させようと試みた。ここで用いられたプロンプト手法は、「Few-shotプロンプティング」に似たものであり、ユーザーがチャットボットに対して、一連の質問とその回答の例を提示し、その後にボットが回答すべき新たな質問を与えるという方法である。

遺伝子工学者は、実験室内で分子進化の方向をある程度誘導できるが、通常は試行できる可能性の数が限られている。さらに、一般的な長さのタンパク質でさえ、改変の方法はほぼ無限に存在する(タンパク質は数百のアミノ酸で構成され、アミノ酸は20種類ある)。

しかし、オープンAIのモデルは、タンパク質を構成するアミノ酸の3分の1を変更した提案を出力することが多い。

レトロ・バイオサイエンシズのCEOであるジョー・ベッツ・ラクロワは、「私たちはこのモデルをすぐに研究室に導入し、実際に成果をあげました」と話す。また、このモデルのアイデアは並外れて優れており、多くの場合でオリジナルの山中因子を改良することに成功したとも語っている。

ハーバード大学の老化研究者で、レトロ・バイオサイエンシズのコンサルタントでもあるヴァディム・グラディシェフ教授は、幹細胞を作るためのより優れた方法が必要だと語る。「私たちにとって、非常に役立つものになるでしょう。(皮膚細胞は)リプログラミングしやすいのですが、他の細胞はそうではありません」とグラディシェフ教授は指摘する。「さらに、新しい生物種でのリプログラミングは方法が極端に異なることが多く、何も得られないこともあります」。

GPT-4b microがどのようにして正確な推測を導き出したのかは、まだ明らかではない。これはAIモデルにはよくあることだ。「アルファ碁(AlphaGo)が囲碁で最強の人間を打ち負かしたときに似ています。その理由を突き止めるには長い時間がかかりました」とベッツ・ラクロワCEOは語る。「私たちはまだモデルの働きを解明している最中であり、その応用はまだ始まったばかりだと考えています」。

オープンAIによると、今回の共同研究で金銭の授受はなかったという。しかし、この研究は、アルトマンCEOが最大の出資者となっているレトロ・バイオサイエンシズに利益をもたらす可能性があるため、今回の発表はオープンAIのCEOであるアルトマンのサイドプロジェクトをめぐる疑念をさらに深めることになるかもしれない。

昨年、ウォール・ストリート・ジャーナル紙は、アルトマンが民間のテックスタートアップ企業に幅広く出資して「不透明な投資帝国」を築き上げており、出資先企業の一部はオープンAIとも取引があるため、「利益相反の可能性が山積している」と指摘した。

レトロ・バイオサイエンシズの場合、アルトマン、オープンAI、そしてAGIに向けた競争に関係するだけで、レトロ・バイオサイエンシズの知名度が上がり、社員の雇用や資金調達の能力が高まる可能性がある。ベッツ・ラクロワCEOは、創業してまだ数年のレトロ・バイオサイエンシズが現在資金調達中かどうかという質問には答えなかった。

オープンAIによると、アルトマンCEOは今回の研究に直接関与しておらず、オープンAIはアルトマンによる他社への投資に基づいて決定を下すことはないという。