テック企業が開発競う「AIエージェント」、アシスタントとの違いは?

What are AI agents?  テック企業が開発競う
「AIエージェント」
アシスタントとの違いは?

グーグルやオープンAIなどの大手テック企業が、AIエージェントの開発に膨大な資金を投入している。AIエージェントとはどのようなもので、どのように役に立つのだろうか? 解説する。 by Melissa Heikkilä2024.07.16

チャットGPT(ChatGPT)が初めてリリースされた当時、人工知能(AI)業界の誰もが新世代のAIアシスタントについて話していた。しかしこの1年で、人々の関心は新たなターゲットである「AIエージェント」に移った。

AIエージェントは、5月に開催されたグーグルの年次開発者会議「グーグルI/O」で大きく取り上げられた。グーグルは同会議で、ユーザーが音声や映像を使ってやりとりできる「アストラ(Astra)」と呼ばれる新しいAIエージェントを発表した。オープンAI(OpenAI)の新モデル「GPT-4o」もAIエージェントと呼ばれている。

単なる過大評価という面も確かにあるが、それだけではない。テック企業はAIエージェントの開発に莫大な資金を投入しており、その研究努力は、人々が何十年も夢見てきた便利なAIの到来を告げるかもしれない。サム・アルトマンをはじめとする多くの専門家が、AIエージェントこそ次なる重要なテクノロジーだと語っている。

しかし、AIエージェントとは何なのだろうか。また、どのように使えるのだろうか。

AIエージェントの定義とは?

AIエージェントの研究はまだ始まったばかりで、明確な定義は存在しない。しかし、AIエージェントとは、簡単に言えば、「動的に変化する世界で自律的に意思決定ができるAIモデルやアルゴリズム」である、とエヌビディア(Nvidia)のAIエージェント・イニシアチブを率いる上級研究科学者、ジム・ファンは説明する。

AIエージェントの壮大なビジョンは、人間のアシスタントのように幅広いタスクを実行できるシステムだ。将来的には、休暇の予約をサポートしてくれるかもしれない。しかも、あなたが高級ホテルを好むかどうかも記憶しているので、4つ星以上のホテルだけを提案し、その中からあなたが選んだホテルを予約してくれるのだ。また、あなたのスケジュールに最も適したフライトを提案し、あなたの好みに合わせて旅程を計画してくれるかもしれない。その計画と天気予報に基づいて、荷物のリストを作ることもできる。さらには、旅先に住んでいるとわかっている友人に旅程を送り、旅行に招待することもできるだろう。職場では、やるべきことのリストを分析し、その中からカレンダーの予定への招待、メモ、メールの送信といったタスクを実行できるかもしれない。

AIエージェントのひとつのビジョンは、マルチモーダルであること、つまり言語、音声、映像を処理できることだ。たとえば、グーグルのアストラのデモでは、ユーザーはスマホのカメラを物に向け、エージェントに質問することができた。エージェントはテキスト、音声、映像の入力に応答することができる。

このようなエージェントは、企業や公的機関のプロセスをよりスムーズにする可能性もあると、ユニバーシティ・カレッジ・ロンドン人工知能センターのデビッド・バーバー所長は言う。たとえば、AIエージェントはより洗練されたカスタマーサービス・ボットとして機能できるかもしれない。現世代の言語モデルベースのアシスタントは、文章の中で次に出てくる可能性の高い単語を生成することしかできない。しかし、AIエージェントは、自然言語のコマンドに基づき自律的に行動し、監督なしでカスタマーサービスのタスクを処理する能力を持つようになるだろう。たとえば、エージェントは、顧客からの苦情メールを分析し、顧客の参照番号を確認し、顧客関係管理や配送システムなどのデータベースにアクセスして苦情が正当なものであるかどうかを確認し、会社の方針に従って対応できるだろう、とバーバー所長は話す。

ファンによると、エージェントには、大まかに言って「ソフトウェア・エージェント」と「エンボディド・エージェント」という2つのカテゴリーが …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。