グーグル、どんな会話もできる「最高」のチャットボットを発表
グーグルはニューラル・ネットワークを利用したチャットボット「ミーナ(Meena)」を発表した。同社は、ミーナが他の既存のチャットボットよりも優れていると主張している。
ミーナは、ソーシャルメディア上の341ギガバイトもの膨大な会話データを使って訓練された。オープンAI(OpenAI)の言語モデル「GPT-2」が訓練に使ったデータの8.5倍に相当する。ミーナは、ほぼどんなことでも話すことができ、(悪い)冗談さえ考え出せるとグーグルは説明する。
幅広い話題を含む取り留めのない会話は難しく、ほとんどのチャットボットは会話についていけない。ある時点で多くのチャットボットは意味をなさない言葉を発したり、実世界についての基本的な知識が無いことをさらけ出したりする。このような間違いを犯さないチャットボットがあれば、人工知能(AI)はより人間らしく感じられるようになり、ビデオゲームの登場人物もより生き生きとしたものになれるだろう。
ミーナの能力をテストするため、グーグルは「SSA(Sensibleness and Specificity Average:整合度・特有度平均値)」と呼ぶ新しい評価尺度を開発した。SSAは自然な会話に必要となる重要な特性を評価するもので、それぞれの発話が文脈の中で意味をなすかどうか(多くのチャットボットに可能である)、それまでの話に対して特有のものであるか(こちらの方が難しい)といったことが含まれる。
たとえば、もしあなたが「私はテニスが好きだ」と言い、チャットボットが「それはいいね」を返事したら、そのやり取りは意味は通っているものの、その会話特有のものではない。多くのチャットボットはこうしたトリックを使って、相手が話している中身を知らないことを悟られないようにする。一方、「私もです。ロジャー・フェデラーに夢中です」にような返事はその会話特有のものだ。グーグルはクラウドワーカーを使ってミーナとの会話のサンプルを生成し、約100の会話で発話を評価した。ミーナのSSAスコアは79%で、過去4年にわたってローブナー賞(Loebner prize、もっとも人間らしい受け答えをする会話ボットに毎年与えられる賞)を受賞した最先端のチャットボット「ミツク(Mitsuku)」の56%を上回った。SSAテストでは、人間の話し相手でさえスコアは86%だった。
ただし、ミーナとはまだ話すことはできない。グーグルは、安全性と偏向(バイアス)の問題がないか入念にチェックできるまで、一般向けのデモは公開しないとしている。おそらく賢明な判断だ。マイクロソフトが2016年にチャットボット「テイ(Tay)」をツイッターで公開したとき、何時間も経たないうちに人種差別的で女性蔑視の悪口雑言を吐き出し始めたからだ。