ディープマインドが開発した最新の人工知能(AI)プログラムは、優秀なだけでなく、とても柔軟だ。そしてかなり奇妙でもある。
12月第2週、ディープマインドは、従来から習得している囲碁に加えて、チェスと将棋の習得が可能な対戦プログラム「アルファ・ゼロ(Alpha Zero)」について記述した論文を発表した。
カリフォルニア州ロングビーチで開催された神経情報処理システム(NIPS)学会で詳細を説明したディープマインドの創業者、デミス・ハサビス最高経営責任者(CEO)によると、このプログラムは人間には思いもよらない手を指すことがよくあったという。ハセビスCEO自身、玄人はだしのチェス・プレイヤーでもある。
「アルファ・ゼロは人間のように指さず、かといって、いかにもプログラムが指しているようにも見えません。アルファ・ゼロは、人間でもない、プログラムでもない、第三の、ほとんど異星人のような思いもかけない手を指してきます」。
このことは、特定の課題に対して機械学習プログラムがいかに優秀かを示すだけでなく、AIが人間とはかなり異なった考え方をすることも示している。AIがよりありふれたものになるにつれ、こうした「思いもよらない振る舞い」を気にかける必要があるのかもしれない。
アルファ・ゼロは囲碁を指すために開発されたプログラム「アルファ碁(AlphaGo)」をより汎用化したものだ。アルファ・ゼロはわずか24時間で、既存の最強チェス・プログラムを打ち負かすほどの自己学習ができる。
驚くべきことに、アルファ・ゼロは時折、一見正気ではないようなサクリファイス(ある駒を犠牲にして局面を優位にする戦術)を選択したとハサビスCEOは説明する。たとえば、優位な形勢にするた …