2025年のAIはこう動く!本誌が予測する5大トレンド

What’s next for AI in 2025 2025年のAIはこう動く
本誌が予測する5大トレンド

AIエージェントと小規模言語モデルがAI業界の大きなトレンドであることは間違いない。ではそれ以外で2025年に注目すべき動きとは? MITテクノロジーレビューのAI担当記者・編集者が予測する5つのトレンドを紹介しよう。 by Melissa Heikkilä2025.01.10

ここ数年、MITテクノロジーレビューは人工知能(AI)の次の展開を予測しようと試みてきた(2024年、2023年の予測記事)。この業界の変化の激しさを考えれば、無謀な挑戦だ。しかし、勢いに乗っている私たちは、再び挑戦してみようと思う。

さて、前回の予測はどの程度的中したのだろうか。本誌が選んだ2024年の注目すべき4大トレンドの一つ目は、カスタマイズされたチャットボットであった。これは、マルチモーダルな大規模言語モデルを搭載した対話型ヘルパーアプリであり、当時はまだ明確に定義されていなかったが、現在AI分野で最も注目されている「AIエージェント」のことを指す。2つ目に取り上げたのは、生成AIの第2の波である「生成動画」だ。この技術はこの1年で急速に進歩し、オープンAI(OpenAI)とグーグル・ディープマインド(Google DeepMind)は昨年12月、数日差でそれぞれの主力動画生成モデルである「ソラ(Sora)」と「ベオ(Veo)」をリリースした。他には、より広範囲のタスクを実行できる汎用的なロボットも取り上げた。大規模言語モデルの恩恵は、テック業界の他の分野にも波及を続けており、ロボット工学はその筆頭である。

私たちはまた、AIによって生成された選挙の偽情報が、あらゆる場所で見られるようになるだろうとも予測した。だが、幸いなことに、この予測は外れた。昨年は気を揉む出来事が数多くあったが、政治的なディープフェイクはほとんど見られなかった。

では、2025年には何がやってくるのか? ここでは明白な予測は除外することにする。すなわち、エージェントと、より小型で効率的な言語モデル(小規模言語モデル)が引き続き業界を牽引していくのは間違いない。それ以外で、MITテクノロジーレビューのAIチームが予測したトレンドを5つ紹介しよう。

1. 生成バーチャル・プレイグラウンド

2023年が画像生成の年、2024年が動画生成の年だったとすると、2025年は何の年になるのだろうか? バーチャル世界生成(ビデオゲーム)の年になるだろう。同じように予測した読者も多いはずだ。

私たちがこのテクノロジーをほんの少し垣間見ることができたのは、2024年2月にグーグル・ディープマインドが生成モデル「Genie(ジーニー)」を発表したときのことだ。同社は1枚の静止画像を、横スクロールでプレイできる2Dゲームに変換できることを明らかにした。そして12月には、1枚の画像からバーチャル世界全体を生成できるモデル「Genie 2」を発表した。

他の企業も同様のテクノロジーを開発している。10月には、AIスタートアップ企業のデカルト(Decart)とエッチド(Etched)が、プレイ中にゲームのすべてのフレームが即座に生成される非公式のマインクラフト風ビデオゲームを発表した。また、深層学習ブームの火付け役となった膨大な写真のデータセット「イメージネット(ImageNet)」の開発者であるフェイ・フェイ・リーが共同創業したスタートアップ企業「ワールド・ラボ(World Labs)」は、大規模世界モデル(LWM)と呼ばれるものを構築している。

明らかな用途のひとつはビデオゲームである。これらの初期の実験には遊び心があり、生成AIを活用した3Dシミュレーションを使って新しいゲームのデザインコンセプトを探求し、スケッチを即座にプレイ可能な環境に変えることができる。ここから、まったく新しいタイプのゲームが生まれる可能性がある。

この技術はロボットの訓練にも使えるかもしれない。ワールド・ラボは、機械が日常世界を解釈し、日常世界と相互作用できる「空間知能」という能力を開発したいと考えている。しかし、ロボット工学の研究者には、そのようなテクノロジーを訓練するための現実世界のシナリオに関する優れたデータが不足している。無数のバーチャル世界を作り出し、そこにバーチャル・ロボットを投入して試行錯誤で学習させることで、データ不足の問題を補うことができるかもしれない。

(ウィル・ダグラス・ヘブン)

2. 「推論」する大規模言語モデル

うわさは正しかった。9月にオープンAIが「o1」を発表したとき、大規模言語モデルにパラダイムシフトがもたらされた。同社はその2カ月後、その新たなパラダイムをほぼ全面的に押し進める「o3」を発表した。o3は、このテクノロジーを良い方向に改変するかもしれない。

オープンAIの主力モデル「GPT-4」を含むほとんどのモデルは、最初に見つけ出した回答をそのまま出力する。それが正しいこともあれば、正しくないこともある。しかし、同社の新しいモデルは、難しい問題を一連のより単純な問題に分解しながら、段階を追って答えを導き出すように訓練されている。あるアプローチがうまくいかないときは、別のアプローチを試す。この手法は「推論(リーズニング)」として知られており(そう、私たちはこの言葉にどれだけ多くの意味が込められているかをよく知っている)、特に数学、物理学、論理学の問題において、このテクノロジーの正確さを高めることが …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。