オープンAIは10月31日、チャットGPT(ChatGPT)にWeb検索機能を搭載したと発表した。ユーザーの質問に応じてWeb上の最新情報を提供する。
チャットGPTは従来、主にGPT-4oの訓練に使われた2023年10月までの訓練データに基づいて回答を生成する制約があった。Webを検索する機能も搭載されていたものの、限定的だった。新しいチャットGPTでも一般的なトピックについては引き続きモデルの訓練データを利用するが、スポーツや株式、今日のニュースといった最近の情報に関する質問に対しては自動的にWebを検索し、リッチな表示形式で結果を提供する。オープンAIの検索製品責任者であるアダム・フライによると、ユーザーが手動でWeb検索を指示することも可能だが、多くはWebから取得した情報の方が有益な回答になるとチャットボットが判断した場合に、自動的にWeb検索が実行されるという。
「私たちの目標は、チャットGPTを最も賢いアシスタントにすることです。今回は、Web上で利用できる情報を扱う能力を大幅に強化しました」。フライ責任者は本誌の取材にこう語った。新機能は10月31日からチャットGPTの有料版ユーザーに提供を開始している。
現時点でチャットGPT検索を利用できるのは有料版ユーザーだけだが、オープンAIは今後、無料版ユーザーにも提供を拡大し、ログアウトした状態でも利用可能にしたい考え。また同社は、検索機能を音声機能と組み合わせたり、コーディングと文章作成のための対話型プラットフォーム「キャンバス(Canvas)」と組み合わせたりすることも計画しているが、今回の初期リリースには含まれない。
オープンAIは今年7月、スタンドアローン型Web検索のプロトタイプを発表した。今回のリリースではこのWeb検索機能を統合した。オープンAIは、「サーチGPTの最高の体験をチャットGPTに組み込みました」と説明する。
AI検索アシストタントはグーグル、マイクロソフト、スタートアップ企業のパープレキシティ(Perplexity)といったテック企業がすでに提供しており、オープンAIは後発としての参入となる。メタも、独自のAI検索エンジンを開発中と報じられている。パープレキシティのインターフェースと同様、チャットGPT検索では自然言語でチャットボットと対話し、AIが生成した回答と併せて情報ソースと詳細情報へのリンクを受け取れる。対照的にグーグルのAIオーバービューでは、検索結果の上部にAIが生成した要約が表示され、従来と同様のインデックスされたリンクのリストが提供される。
これらの新たなツールは最終的に、オンライン検索市場で90%を占めるグーグルのシェアに挑戦する存在となる可能性がある。AI検索はユーザー獲得のための非常に重要な手段であると、オンライン検索を専門とするワシントン大学のチラグ・シャー教授は言う。ただ、シャー教授は、検索におけるグーグルの圧倒的なシェアが切り崩される可能性は低いだろうとの見方を示す。注目されたマイクロソフトのビング(Bing)による大規模な試みも、市場にはほとんど影響を与えていない。
一方でオープンAIは、現実世界で複雑な行動を実行できる、より強力でインタラクティブなAIエージェントの新市場創出を目指していると、シャー教授は言う。 チャットGPTの新たな検索機能は、そうしたエージェントに向けて踏み出した一歩である。
また、チャット履歴を活用して高度に文脈化された回答も提供することができるため、ユーザーは掘り下げた検索が可能になる。チャットGPT検索では、同じトピックに関する質問の際に会話履歴を呼び出し、そこから会話を続けることが可能だ。チャットGPT自体もユーザーに関する情報を自動的に記憶し、後でその情報を利用する。記憶してほしい情報をユーザーが指定することも可能で、こうした「長期的な」記憶が、チャットに対するチャットGPTの対応方法に影響を与えるようになる。
新しいWeb検索はゼロからのスタートとなるため、現時点ではこの機能は利用できないが、フライ責任者によれば、「次の2~3四半期」中には組み込まれる予定だという。実装されれば、チャットGPTが自分の知っていることに基づいて、はるかに高度にパーソナライズされた結果を提供できるようになるという。
「記憶するのは、『私はベジタリアンです』というような変わらない情報かもしれないし、『数日以内にニューヨークへ行く』というような状況的な情報かもしれません。『私は4日後にニューヨークに行く』と話せば、チャットGPTがその事実と、その時点でのニュアンスを記憶できます」。
オープンAIによると、チャットGPTのWeb検索機能の開発では、ロイター通信、アトランティック(the Atlantic)、ル・モンド(Le Monde)、フィナンシャル・タイムズ、アクセル・スプリンガー、コンデナスト、タイムなどの報道機関とのパートナーシップを活用したという。ただし、検索結果には、これらのパブリッシャーから取得した情報だけでなく、検索クローラーを積極的にブロックしていないネット上の他の情報源から得た情報も含まれる。
チャットGPTがそうした信頼性の高いネット上の情報源から情報を取得し、それに基づいて回答を生成できるようになるのは明るい進展であると、情報検索を研究するライデン大学のスザン・フェルベルン教授(自然言語処理)は評価する。また、ユーザーがフォローアップの質問をすることも可能になるという。
だが、Webを検索し、情報ソースを照合確認する能力が強化されたにもかかわらず、このツールはAI言語モデルが物事をでっち上げたり、間違えたりする根強い傾向から免れていない。本誌が新機能をテストするため、休暇旅行の目的地のアイデアをたずねたところ、チャットGPTは、「ヨーロッパの豪華な旅行先」として日本、ドバイ、カリブ海の島々、バリ、セイシェル、タイなどを提案した。情報ソースとして提供された英国紙タイムズ(Times)の記事には、それらの旅行先と共に、豪華な休日の選択肢として欧州の旅行先がリストアップされていた。
「特に、虚偽の事実や起こっていない出来事について質問する場合に、検索エンジンはまだ、もっともらしいけれど必ずしも正しくない回答を考案しようとする可能性があります」と、フェルベルン教授は言う。また、オープンAIが情報源を十分にフィルタリングしていない場合、インターネット上の誤った情報がチャットGPTの回答に入り込むリスクもあるという。
もう1つのリスクは、AI検索を通じてWebにアクセスさせようとする現在の動きが、インターネットのデジタル・エコノミーを混乱させることだ。ハーバード大学バークマン・センターのベンジャミン・ブルックス客員研究員は、MIT テクノロジーレビューの論説(日本語版は翻訳中)で主張している。ブルックス研究員は以前、スタビリティAIで公共政策担当責任者を務めていた。
「すべてを知っているチャットボットの背後にWebを隠すことで、クリエイターが生き残るために必要なユーザーの訪問と注目を奪ってしまう可能性があります」。ブルックス研究員は論説でこう述べている。