エージェントは、現在のテック界で最もホットな話題である。グーグル・ディープマインドから、オープンAI(OpenAI)やアンソロピック(Anthropic)まで、大手AI企業各社は大規模言語モデルに自律的にタスクを実行する能力を付加しようと競争している。業界用語で「エージェント的AI(agentic AI)」と呼ばれるこうしたシステムは、急速にシリコンバレーの新たな注目の的となった。エヌビディア(Nvidia)からセールスフォースまで、業界のあらゆる関係者がエージェントAIによる業界への劇的な影響について語っている。
「2025年には最初のAIエージェントが『労働力に加わり』、企業の生産活動を実質的に変える可能性があると、私たちは確信しています」。オープンAIのサム・アルトマンCEOは先週のブログ記事でこう述べた。
最も広い意味で言えば、エージェントとは、通常は最小限または監督なしで自律的に物事を実行するソフトウェアシステムを指す。その実行するタスクが複雑であればあるほど、エージェントはより高度な賢さを必要とする。大規模言語モデルは、多くの人にとって十分に賢くなり、エージェントを動作させて私たちのためにさまざまな有用なタスクを実行ができるようになった。例えば、フォームへの記入、レシピの検索と食材のオンラインショッピングカートへの追加、会議前の調べ物、簡単な箇条書きの要約作成などが可能である。
昨年10月、アンソロピックはこれまでで最も先進的なエージェントの一つを発表した。同社のClaude(クロード)大規模言語モデルの拡張機能である「コンピューターユーズ(computer use)」である。この機能を使うことで、Claudeにカーソルの移動、ボタンのクリック、テキストの入力など、まるで人のようにコンピュータを操作させることができるようになった。つまり、単にClaudeと会話をするだけでなく、画面上のタスクを実行するよう指示できるのだ。
アンソロピックは、この機能がまだ扱いにくく、エラーが発生しやすいと指摘している。しかし、ドアダッシュ(DoorDash)、キャンバ(Canva)、アサナ(Asana)といった企業の第三者開発者を含む少数のテスターにはすでに利用可能となっている。
コンピューターユーズは、エージェントの未来を垣間見るものだ。2025年にAIエージェントどう進化するか? MITテクノロジーレビューはアンソロピックの共同創業者で主任科学者であるジャレッド・カプランに話を聞いた。
なお、カプランの回答は、長さとわかりやすさを考慮して一部編集されている。
◆
1. エージェントは道具をより上手に使うようになる
「AIにできる …