エクサ(Exa)というスタートアップ企業が、生成検索に新たな旋風を巻き起こそうとしている。大規模言語モデル(LLM)の基盤となる技術を使用することで、グーグルやオープンAI(OpenAI)を含む競合他社の検索エンジンよりも的確な検索結果のリストを返すことができると同社は主張している。その目的は、インターネット上の膨大で混沌としたWebページをルックアップ・テーブルに変え、クエリ(問い合わせ)が特定の正確な結果を返せるようにすることだ。
エクサはすでに、検索エンジン上に独自のアプリケーションを構築したい企業に向けて、バックエンド・サービスとして検索エンジンを提供している。12月3日、同社はその検索エンジンの最初の消費者向けバージョンである「Webセッツ(Websets)」を発表した。
「Webはデータの集合体ですが、混沌としています」とエクサの共同創業者で最高経営責任者(CEO)のウィル・ブライクは話す。「こっちにはジョー・ローガンの動画があり、あっちにはアトランティック(Atlantic)誌の記事があります。整理されていません。私の夢は、Webがデータベースのように感じられるようになることです」。
Webセッツは、他の検索エンジンが苦手とする、人や企業のタイプといったものを検索する必要のあるパワーユーザーを対象としている。「未来的なハードウェアを作るスタートアップ企業」と検索すれば、数百の特定の企業のリストが表示される。そのキーワードを含むというだけで、該当するものもあれば、しないものもあるようなWebページへのリンクではない。グーグルにはそれができない、とブライクCEOは言う。「投資家や人材採用担当者、あるいはWebから特定のデータセットを求めている人たちにとって、多くの貴重なユースケースがあります」。
MITテクノロジーレビューは2021年、グーグルの研究チームが、新しい検索エンジンで大規模言語モデルの使用を模索しているというニュースを報じた。それ以来、状況は急速に変化している。このアイデアはすぐに激しい批判を浴びた。しかし、テック企業はほとんど気に留めなかった。それから3年、グーグルやマイクロソフトのような巨大企業が、パープレキシティ(Perplexity)や、10月にチャットGPT検索(ChatGPT Search)を発表したオープンAIの …