サンフランシスコに拠点を置く非営利の研究機関オープンAI(OpenAI) は2019年2月、もっともらしい英語の文章を書ける人工知能(AI)システムを発表した。「GPT-2」と呼ばれるこのAIシステムに文章や段落の冒頭部分を入力すると、AIが文章の続きを勝手に考えてくれるというものだ。GPT-2はエッセー程度の長さの文章まで生成でき、その内容はまるで人間が書いた文章のように一貫性がある。
そして今、オープンAIは、GPT-2と同じアルゴリズムに、画像の一部を与えたら何が起きるのかを探っている。重大な影響力と可能性に満ちた新たな画像生成手法に通じる成果は、2020年7月12日から7月18日にかけて開催された「機械学習に関する国際会議(ICML)」で最優秀論文に選ばれた論文にまとめられている。
GPT-2の核となるのは、強力な予測エンジンだ。GPT-2は、インターネットの端々から集められた何十億という単語や文章、段落の例を基にして、英語の構造を把握することを学習した。学んだ言語構造を使って単語の出現順序を統計的に予想し、並べることで、新しい文章を生成できる。
そこで、オープンAIの研究者たちは単語を画素(ピクセル)に替えて、深層学習の分野で最もよく利用されている画像データベースである「イメージネット(ImageNet)」の画像を使って、GPT-2と同じアルゴリズムを訓練した。このアルゴリズムは文字列や …