この記事は米国版ニュースレターを一部再編集したものです。
この夏に結婚する私は、婚約者と一緒にウキウキと新婚旅行の計画を立てている。忙しい仕事と結婚式の準備を両立させながら、さらに膨大な選択肢をあれこれ調べて決めていくのはなかなか大変だ。
幸いなことに、本誌のリアノン・ウィリアムズ記者が先日、人工知能(AI)を使って休暇の計画を立てる方法について書いていた。 願ってもないタイミングである。私はウィリアムズ記者のアドバイスに従って、実際にAIを使って新婚旅行の旅程を考えることにした。
まずチャットGPT(ChatGPT)に、3週間の旅行計画を提案して、と依頼した。行き先は、憧れの日本とフィリピンだ。私はチャットGPTに、東京ではアートやデザインに触れ、おいしいものを食べたい、フィリピンでは観光客の少ないのんびりとしたアウトドアが楽しめる場所に行きたいと伝えた。また、予約すべきホテルやアクティビティを具体的に挙げてほしい、と付け加えた。
結果はとても良く、これまでに自分で調べていたこととも一致していた。AIが、サーフィンで有名なフィリピンのシャルガオ島に行くといいと返してきたのは嬉しかった。私たちはいずれにしてもその島に行くつもりだったのだが、そこでできることについてはあまり調べていなかった。チャットGPTは、毒針を持たないクラゲのサンクチュアリや洞窟のプールなど、すばらしい日帰り冒険旅行をいくつか挙げた。
最初のざっくりした案としては十分な旅程を作成したと言える。AIを使うことで、シャルガオ島など、あまりよく知らない場所について調べる時間は大いに節約できたと思う。
ところが、私がよく知っている場所、たとえば東京について尋ねたときの答えは期待はずれだった。チャットGPTは、渋谷のスクランブル交差点に行って寿司屋で食事をとるといい、とすすめてきたのだ。おいおい、そんなことは観光客なら言われなくてもやるだろう。だが、それは私のせいかもしれない。プロンプトがいけなかったのかもしれない。プロンプトの具体性を高めるほど、結果が良くなるからだ。
だが、問題もある。文中で次にくる可能性のある単語を予測するというのが、言語モデルのしくみである。このAIシステムは、実際の体験がどういうものなのか、それにどのくらいの時間がかかるのかを理解していない。たとえばチャットGPTは、景色の美しい場所で朝から晩まで写真撮影をして過ごすといい、と言ってきた。そのとおりにしたら、すぐに飽きてしまうだろう。現状のAIシステムには、ロジスティクスや予算を考えるときに欠かせない、いわゆるラストマイルの推論や計画のスキルがない。また、私たちの予算の範囲をはるかに超える宿泊先も提案してくる。
ただ、次世代のAIエージェントが作られたら、旅行計画のプロセスのすべてがもっとスムーズになる可能性はある。
エージェントとは、現実の世界で複雑なタスクをこなすAIのアルゴリズムとモデルである。将来的には、AIエージェントがまさに人間のアシスタントのように、さまざまなタスクを実行できるようになることが期待されている。エージェントはAI関連で最近注目され始めたトピックで、私もその概要としくみを説明する記事を公開したばかりだ。
将来、AIエージェントは、新婚旅行に組み入れたいアクティビティや滞在先を提案するだけでなく、チャットGPTよりも一歩進んで航空券の予約もしてくれるようになるだろう。ホテルについての私の希望や予算を記憶し、条件に合う宿泊施設だけをすすめてくるようになるはずだ。また、過去に出かけた旅行の中で私がやりたがったことを覚えていて、好みに合わせたきわめて具体的なアクティビティを提案してくれるかもしれない。私の代わりにレストランの予約をしてくれるのも夢ではないだろう。
ただ、残念ながら、私の新婚旅行には間に合わなさそうだ。現在のAIシステムには推論、計画、記憶の能力が足りない。まだ初期段階であり、未解決の課題が数多く残されている。でも、もしかしたら結婚10周年の旅行のときには便利に使えるようになっているかもしれない。
ロボットは音声学習でさらに有用になる
最近のAI搭載ロボットの多くはカメラを使って周囲の状況を把握し、新しいタスクを学習している。だが、ロボットを音声で訓練することも容易になってきていて、視界が限られたタスクや環境に適応させるのに役立っている。
スタンフォード大学の研究者チームは、ロボットが「聞く」能力を持つとどのくらいパフォーマンスが上がるのかをテストした。選んだタスクは、フライパンでベーグルをひっくり返す、ホワイトボードの字を消す、2枚の面テープをくっつける、カップからサイコロを出す、の4つである。それぞれのタスクで、クリーナーがホワイトボードに適度に接触しているか、カップの中にサイコロが入っているか、など、カメラや触覚センサーでは判別が難しい手がかりが音から得られるようになっている。サイコロのテストで視覚のみを使った場合、ロボットはカップの中にサイコロが入っているか否かを27%の確率で判別できたが、音も使うとその確率は94%に上昇した。 ジェームス・オドネル記者の記事の続きはこちらで読める。
AI関連のその他のニュース
- AIのうそ発見器は人間よりもうそを見抜くのが得意。ドイツのヴュルツブルク大学の研究チームは、うその発言を見抜く能力は、AIシステムのほうが人間よりもはるかに優れていることを発見した。人間が真偽を判別できるのは通常半分程度だが、AIは67%の事例で発言の真偽を判別できた。ただ、うそ発見器は議論の余地がある信頼性の低いテクノロジーであり、そもそも使っていいのかという問題がある。(MITテクノロジーレビュー)
- ハッカーがオープンAIから秘密を盗む。ハッカーがオープンAI(OpenAI)の社内メッセージングシステムにアクセスし、同社のAIテクノロジーに関する情報を盗み出した。同社によるとハッカーはひとりの民間人だということだが、今回のインシデントによってオープンAIの社員の間では中国にテクノロジーも盗まれる可能性があるとの懸念が高まった。(ニューヨーク・タイムズ紙)
- AIのせいでグーグルにおける過去5年間の温室効果ガス排出量が大幅に増加。グーグルは、2023年の間に同社の温室効果ガス排出量は二酸化炭素換算で1430万トンに達すると発表した。グーグルによると、2019年と比較して48%増だという。原因は主に、グーグルがAIに大きな力を入れていることである。2030年までに二酸化炭素排出量をゼロにするという同社の目標達成はさらに難しくなりそうだ。私たちの社会は、全員にとって切迫した問題である気候の危機よりも利益を優先しているということであり、まったく気が滅入る。(ブルームバーグ)
- 140億ドル規模のスタートアップ企業が、博士に在宅でAIシステムの訓練を依頼する理由。AIとデータ処理作業にまつわる変化に着目した興味深い記事である。スケールAI(Scale AI)はこれまで、インドやフィリピンなどの国で低賃金のデータワーカーを雇用し、AIの訓練に使用するデータのタグ付けをしてきた。しかし、言語モデルが急成長したため、スケールAIは、モデルの訓練に必要な専門知識を持つ、高度なスキルを持つ請負業者を米国内で雇用するようになった。これは、AIにとってのデータ処理作業が本当に重要であることを浮き彫りにしている。(ジ・インフォメーション)
- まともな楽曲を書けない、新たな「倫理的」な音楽生成AI。著作権は、現在のAIにとってきわめて厄介な問題だ。先立って私は、AI企業が強力なAIを構築するために高品質の学習データに大金を注ぎ込まざるを得なくなっている事情について書いた。この記事はその重要性の説明になっている。記事のテーマは、ライセンスのある音楽の限定的なデータセットのみを用いる「倫理的」な音楽生成AIである。しかし、質の高いデータがなければ、まともなものは生み出せない。(ワイアード)