アンソロピック主任科学者が語る「AIエージェント」4つの進化
AIエージェントに注がれる期待が高まっている。グーグル・ディープマインドやオープンAIなど大手AI企業が、自律的にタスクを実行できるAIの開発にしのぎを削る中、アンソロピックの主任科学者が2025年のAIエージェントの進化の方向性を語った。 by Will Douglas Heaven2025.01.14
- この記事の3つのポイント
-
- AIエージェントの進化についてアンソロピックのジャレッド・カプランに聞いた
- AIエージェントはユーザーの状況を理解し適切に行動できるようになる
- 一方でAIエージェントの安全性確保が重要な課題となる
エージェントは、現在のテック界で最もホットな話題である。グーグル・ディープマインドから、オープンAI(OpenAI)やアンソロピック(Anthropic)まで、大手AI企業各社は大規模言語モデルに自律的にタスクを実行する能力を付加しようと競争している。業界用語で「エージェント的AI(agentic AI)」と呼ばれるこうしたシステムは、急速にシリコンバレーの新たな注目の的となった。エヌビディア(Nvidia)からセールスフォースまで、業界のあらゆる関係者がエージェントAIによる業界への劇的な影響について語っている。
「2025年には最初のAIエージェントが『労働力に加わり』、企業の生産活動を実質的に変える可能性があると、私たちは確信しています」。オープンAIのサム・アルトマンCEOは先週のブログ記事でこう述べた。
最も広い意味で言えば、エージェントとは、通常は最小限または監督なしで自律的に物事を実行するソフトウェアシステムを指す。その実行するタスクが複雑であればあるほど、エージェントはより高度な賢さを必要とする。大規模言語モデルは、多くの人にとって十分に賢くなり、エージェントを動作させて私たちのためにさまざまな有用なタスクを実行ができるようになった。例えば、フォームへの記入、レシピの検索と食材のオンラインショッピングカートへの追加、会議前の調べ物、簡単な箇条書きの要約作成などが可能である。
昨年10月、アンソロピックはこれまでで最も先進的なエージェントの一つを発表した。同社のClaude(クロード)大規模言語モデルの拡張機能である「コンピューターユーズ(computer use)」である。この機能を使うことで、Claudeにカーソルの移動、ボタンのクリック、テキストの入力など、まるで人のようにコンピュータを操作させることができるようになった。つまり、単にClaudeと会話をするだけでなく、画面上のタスクを実行するよう指示できるのだ。
アンソロピックは、この機能がまだ扱いにくく、エラーが発生しやすいと指摘している。しかし、ドアダッシュ(DoorDash)、キャンバ(Canva)、アサナ(Asana)といった企業の第三者開発者を含む少数のテスターにはすでに利用可能となっている。
コンピューターユーズは、エージェントの未来を垣間見るものだ。2025年にAIエージェントどう進化するか? MITテクノロジーレビューはアンソロピックの共同創業者で主任科学者であるジャレッド・カプランに話を聞いた。
なお、カプランの回答は、長さとわかりやすさを考慮して一部編集されている。
◆
1. エージェントは道具をより上手に使うようになる
「AIにできる …
- 人気の記事ランキング
-
- AI crawler wars threaten to make the web more closed for everyone 失われるWebの多様性——AIクローラー戦争が始まった
- Promotion Innovators Under 35 Japan × CROSS U 好評につき第2弾!研究者のキャリアを考える無料イベント【3/14】
- Inside the race to archive the US government’s websites 米政府系サイトが続々閉鎖、 科学者らが緊急保存作戦
- From COBOL to chaos: Elon Musk, DOGE, and the Evil Housekeeper Problem 米「DOGE暴走」、政府システムの脆弱性浮き彫りに
- What a major battery fire means for the future of energy storage 米大規模バッテリー火災、高まる安全性への懸念