おすすめは渋谷と寿司屋? チャットGPTの残念な新婚旅行プラン

Can AI help me plan my honeymoon? おすすめは渋谷と寿司屋? チャットGPTの残念な新婚旅行プラン

この夏に結婚する筆者は、日本とフィリピンに行く新婚旅行の計画を立てるのを「チャットGPT」に手伝ってもらった。実際に使ってみた感想は、ざっくりとした計画を立てるには十分だが、まだまだ期待外れなものだった。 by Melissa Heikkilä2024.07.23

この記事は米国版ニュースレターを一部再編集したものです。

この夏に結婚する私は、婚約者と一緒にウキウキと新婚旅行の計画を立てている。忙しい仕事と結婚式の準備を両立させながら、さらに膨大な選択肢をあれこれ調べて決めていくのはなかなか大変だ。

幸いなことに、本誌のリアノン・ウィリアムズ記者が先日、人工知能(AI)を使って休暇の計画を立てる方法について書いていた。 願ってもないタイミングである。私はウィリアムズ記者のアドバイスに従って、実際にAIを使って新婚旅行の旅程を考えることにした。

まずチャットGPT(ChatGPT)に、3週間の旅行計画を提案して、と依頼した。行き先は、憧れの日本とフィリピンだ。私はチャットGPTに、東京ではアートやデザインに触れ、おいしいものを食べたい、フィリピンでは観光客の少ないのんびりとしたアウトドアが楽しめる場所に行きたいと伝えた。また、予約すべきホテルやアクティビティを具体的に挙げてほしい、と付け加えた。

結果はとても良く、これまでに自分で調べていたこととも一致していた。AIが、サーフィンで有名なフィリピンのシャルガオ島に行くといいと返してきたのは嬉しかった。私たちはいずれにしてもその島に行くつもりだったのだが、そこでできることについてはあまり調べていなかった。チャットGPTは、毒針を持たないクラゲのサンクチュアリや洞窟のプールなど、すばらしい日帰り冒険旅行をいくつか挙げた。

最初のざっくりした案としては十分な旅程を作成したと言える。AIを使うことで、シャルガオ島など、あまりよく知らない場所について調べる時間は大いに節約できたと思う。

ところが、私がよく知っている場所、たとえば東京について尋ねたときの答えは期待はずれだった。チャットGPTは、渋谷のスクランブル交差点に行って寿司屋で食事をとるといい、とすすめてきたのだ。おいおい、そんなことは観光客なら言われなくてもやるだろう。だが、それは私のせいかもしれない。プロンプトがいけなかったのかもしれない。プロンプトの具体性を高めるほど、結果が良くなるからだ。

だが、問題もある。文中で次にくる可能性のある単語を予測するというのが、言語モデルのしくみである。このAIシステムは、実際の体験がどういうものなのか、それにどのくらいの時間がかかるのかを理解していない。たとえばチャットGPTは、景色の美しい場所で朝から晩まで写真撮影をして過ごすといい、と言ってきた。そのとおりにしたら、すぐに飽きてしまうだろう。現状のAIシステムには、ロジスティクスや予算を考えるときに欠かせない、いわゆるラストマイルの推論や計画のスキルがない。また、私たちの予算の範囲をはるかに超える宿泊先も提案してくる。

ただ、次世代のAIエージェントが作られたら、旅行計画のプロセスのすべてがもっとスムーズになる可能性はある。

エージェントとは、現実の世界で複雑なタスクをこなすAIのアルゴリズムとモデルである。将来的には、AIエージェントがまさに人間のアシスタントのように、さまざまなタスクを実行できるようになることが期待されている。エージェントはAI関連で最近注目され始めたトピックで、私もその概要としくみを説明する記事を公開したばかりだ

将来、AIエージェントは、新婚旅行に組み入れたいアクティビティや滞在先を提案するだけでなく、チャットGPTよりも一歩進んで航空券の予約もしてくれるようになるだろう。ホテルについての私の希望や予算を記憶し、条件に合う宿泊施設だけをすすめてくるようになるはずだ。また、過去に出かけた旅行の中で私がやりたがったことを覚えていて、好みに合わせたきわめて具体的なアクティビティを提案してくれるかもしれない。私の代わりにレストランの予約をしてくれるのも夢ではないだろう。

ただ、残念ながら、私の新婚旅行には間に合わなさそうだ。現在のAIシステムには推論、計画、記憶の能力が足りない。まだ初期段階であり、未解決の課題が数多く残されている。でも、もしかしたら結婚10周年の旅行のときには便利に使えるようになっているかもしれない。


ロボットは音声学習でさらに有用になる

最近のAI搭載ロボットの多くはカメラを使って周囲の状況を把握し、新しいタスクを学習している。だが、ロボットを音声で訓練することも容易になってきていて、視界が限られたタスクや環境に適応させるのに役立っている。

スタンフォード大学の研究者チームは、ロボットが「聞く」能力を持つとどのくらいパフォーマンスが上がるのかをテストした。選んだタスクは、フライパンでベーグルをひっくり返す、ホワイトボードの字を消す、2枚の面テープをくっつける、カップからサイコロを出す、の4つである。それぞれのタスクで、クリーナーがホワイトボードに適度に接触しているか、カップの中にサイコロが入っているか、など、カメラや触覚センサーでは判別が難しい手がかりが音から得られるようになっている。サイコロのテストで視覚のみを使った場合、ロボットはカップの中にサイコロが入っているか否かを27%の確率で判別できたが、音も使うとその確率は94%に上昇した。 ジェームス・オドネル記者の記事の続きはこちらで読める。

AI関連のその他のニュース