「アルファ碁ゼロ」が登場、完全な教師なし学習で世界最強に
囲碁世界一の伝説の棋士に勝った人工知能(AI)プログラム「アルファ碁」を圧倒する新プログラムが登場した。多層ニューラルネットワークと強化学習に基づくこのプログラムは、人間が訓練用のデータを用意しなくても、自分自身で独学して強くなることができる。 by Will Knight2017.10.19
深層学習プログラムの「アルファ碁(AlphaGo)」が地上最強の棋士として君臨できたのは短い期間だった。匠の技を極めた怪物級の新人工知能(AI)プログラム「アルファ碁ゼロ(AlphaGo Zero)」が登場したのだ。アルファ碁ゼロはアルファ碁との対戦で100戦100勝と、まったく付け入る隙を与えなかった。
すごいのは、アルファ碁ゼロがいかにして技を極めたかである。オリジナルのアルファ碁は人間の棋士の無数の棋譜から対戦データを取り入れて学習した。これに対して、アルファ碁と同じく、アルファベット(グーグル)の子会社ディープマインドが開発したアルファ碁ゼロは、碁盤と囲碁のルール以外何も知らないところからスタートした。自分自身を相手に数百万回の対局をこなして、自分自身を改良していったのだ。
この新しいプログラムにより、本物の知能を持つ機械を構築する探究が大きく前進する。学習するための大量の訓練データがなくても、機械が難しい問題の解決法を導き出すからだ。
「最も衝撃なのは、もはや人間のデータを用意しなくても済むことです」とディープマインドの最高経営責任者(CEO)兼共同創業者のデミス・ハサビス(Demis Hassabis)はいう。ハサビスCEOによると、アルファ碁ゼロの構築に使った手法は、創薬や材料科学などさまざまな可能性を秘めた幅広い分野において、現実の状況に十分通用するものだという。アルファ碁ゼロに関する研究は10月18日、科学雑誌のネイチャー(Nature)に掲載された。
驚くべきことに、アルファ碁ゼロは独学中に、人間の棋士が数千年かけて培った技や手法を数多く発見した。「数日で優れた対局を再発見して、最終的にはそれらを超越し、さらに優れたものにします」とハサビスCEOは述べている。「見ていると、わくわくします」。
ロンドンに拠点を置くディープマインドは2014年グーグルに買収された。ゲームの対戦、シミュレーション、機械学習を通じて、人工知能の分野で大きな躍進を遂げることを目指しており、数百人のAI研究者を雇って目標を追求している。コンピューティング・リソースの観点 …
- 人気の記事ランキング
-
- The winners of Innovators under 35 Japan 2024 have been announced MITTRが選ぶ、 日本発U35イノベーター 2024年版
- Kids are learning how to make their own little language models 作って学ぶ生成AIモデルの仕組み、MITが子ども向け新アプリ
- These companies are creating food out of thin air 大豆・昆虫の次は微生物、 空気からタンパク質を作る 「夢の食品工場」
- The race to find new materials with AI needs more data. Meta is giving massive amounts away for free. メタ、材料科学向けの最大規模のデータセットとAIモデルを無償公開