アンソロピック主任科学者が語る「AIエージェント」4つの進化

エージェントは、現在のテック界で最もホットな話題である。グーグル・ディープマインドから、オープンAI（OpenAI）やアンソロピック（Anthropic）まで、大手AI企業各社は大規模言語モデルに自律的にタスクを実行する能力を付加しようと競争している。業界用語で「エージェント的AI（agentic AI）」と呼ばれるこうしたシステムは、急速にシリコンバレーの新たな注目の的となった。エヌビディア（Nvidia）からセールスフォースまで、業界のあらゆる関係者がエージェントAIによる業界への劇的な影響について語っている。

「2025年には最初のAIエージェントが『労働力に加わり』、企業の生産活動を実質的に変える可能性があると、私たちは確信しています」。オープンAIのサム・アルトマンCEOは先週のブログ記事でこう述べた。

最も広い意味で言えば、エージェントとは、通常は最小限または監督なしで自律的に物事を実行するソフトウェアシステムを指す。その実行するタスクが複雑であればあるほど、エージェントはより高度な賢さを必要とする。大規模言語モデルは、多くの人にとって十分に賢くなり、エージェントを動作させて私たちのためにさまざまな有用なタスクを実行ができるようになった。例えば、フォームへの記入、レシピの検索と食材のオンラインショッピングカートへの追加、会議前の調べ物、簡単な箇条書きの要約作成などが可能である。

昨年10月、アンソロピックはこれまでで最も先進的なエージェントの一つを発表した。同社のClaude（クロード）大規模言語モデルの拡張機能である「コンピューターユーズ（computer use）」である。この機能を使うことで、Claudeにカーソルの移動、ボタンのクリック、テキストの入力など、まるで人のようにコンピュータを操作させることができるようになった。つまり、単にClaudeと会話をするだけでなく、画面上のタスクを実行するよう指示できるのだ。

アンソロピックは、この機能がまだ扱いにくく、エラーが発生しやすいと指摘している。しかし、ドアダッシュ（DoorDash）、キャンバ（Canva）、アサナ（Asana）といった企業の第三者開発者を含む少数のテスターにはすでに利用可能となっている。

コンピューターユーズは、エージェントの未来を垣間見るものだ。2025年にAIエージェントどう進化するか？ MITテクノロジーレビューはアンソロピックの共同創業者で主任科学者であるジャレッド・カプランに話を聞いた。

なお、カプランの回答は、長さとわかりやすさを考慮して一部編集されている。

◆

1. エージェントは道具をより上手に使うようになる

「AIにできる …

こちらは有料会員限定の記事です。 有料会員になると制限なしにご利用いただけます。

有料会員にはメリットがいっぱい！

毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
重要テーマが押さえられる。
各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。

有料プランの詳細を見る

Anthropic’s chief scientist on 5 ways agents will be even better in 2025 アンソロピック主任科学者が語る「AIエージェント」4つの進化