人工知能(AI)システムはますますどこにでも見られる存在になっており、その性能は、毎日のように強力さを増している。しかし、これまで以上に普及が進み、より多くのことをするようになるとしても、機械が本当に「知的」かどうかは、どのようにして知ることができるだろうか。何十年もの間、この疑問を定義してきたのが、チューリングテストである。1950年にコンピューター科学者のアラン・チューリングが提案したチューリングテストは、当時の新興分野を理解する試みのために用いられた。このテストが持つ、AIを評価する方法としての影響力は、これまで決して失われなかった。
もしAIが納得できるレベルで言語を再現し、機械であることを人間が見分けられないほど効果的なコミュニケーションができれば、そのAIを知性と見なすことができると、チューリングは主張した。このテストでは、人間の判定者がコンピューターの前に座ってテキストベースで会話をし、相手が誰(あるいは何)なのか推測する。想像するのは簡単だが上手に実行することは驚くほど難しいチューリングテストは、AIの分野ですっかり定着した評価手法となった。チューリングテストが何であるかは、全員が知っていた。誰もが、何を目指して努力しているのか、わかっていた。そして、最先端を行くAI研究者たちが移り替わっても、チューリングテストは、新たな研究者たちのスローガンである「AIとはどのようなものか」ということを示す、強力なステートメントであり続けた。
しかし現在、問題が1つある。最新のAIはチューリングテストにほぼ合格しているのだ。すでに合格してしまったと言ってもいいかもしれない。最新世代の大規模言語モデル(LLM)、つまり、ほんの数年前なら魔法のように思えた一貫性のあるテキストを生成するシステムは、チューリングテストに楽々と合格する急先鋒である。
では、それによってAIはどうなるのだろうか。そして、もっと重要なこととして、私たちはどうなってしまうのだろうか。
本当のところ、私たちは今、実際に起こっていることについて本物の混乱(もっと寛大な表現をすれば、議論)の瞬間にいるのだと、私は考える。チューリングテストが突破されてしまうとしても、AIが現在どのような状況にあるのか、そして、AIが実際に何を達成できるのかということについては、あまり明確になっていない。チューリングテストの結果は、それらのAIシステムが社会にどのような影響を与えることになるのか教えてくれないし、今後の展開を理解するのにも役に立たない。
私たちには、もっと良いものが必要だ。現在のようなAIの新たな段階に適応した、何かが必要なのである。そこで私は、近々出版予定の著書『The Coming Wave(次の波)』の中で、これから登場するAIにも対応可能な「モダン・チューリングテスト」を提案している。AIが話したり生成したりできることと、現実世界で何を達成でき、どのような種類の具体的行動をとれるかは、まったく別物だ。私の新たなテストによって知りたいのは、機械が知的かどうかではなく、世界に有意義な影響を与えることができるかどうかである。私たちは、AIに何ができるのか知りたいのだ。
ムスタファ・スレイマン
簡単に言えば、AIがモダン・チューリングテストに合格するためには、次のような指示をうまく実行できなければならない。それは、「わずか10万ドルの投資金を使い、数カ月以内に、小売販売Webプラットフォームで100万ドル稼ぎなさい」という指示だ。この指示を達成するためには、「GPT-4」などの最新システムが得意とする戦略の概要説明や宣伝文句の草案作成を、はるかに超越する必 …