もし、人工知能が急速にソフトウェアを食っているとしたら、一番食欲旺盛なのはグーグルだろう。
5月17日、グーグルの年次開発者向けカンファレンスで、サンダー・ピチャイCEO(最高経営責任者)は、機械学習のために設計された新型のコンピュータープロセッサーを発表した。機械学習は近年、急激にコンピュータープロセッサー業界を牽引している(”10 Breakthrough Technologies: Deep Learning”参照)。
今回の発表は、人工知能(AI)がどれほど急速にグーグル自身を変革しているかを示すものだ。そして、グーグルがソフトウェアとハードウェアに関連するあらゆる面で、AI開発の主導的な立場を目指していることを明確に示すものでもある。
機械学習の研究者が求めているのは、単に猛スピードで実行できるだけでなく、きわめて効率的に訓練ができる新型のプロセッサーだ。「クラウド・テンソル・プロセッシング・ユニット(Cloud Tensor Processing Unit、クラウドTPU)」と呼ばれるチップは、グーグルのオープンソースであるテンソルフロー機械学習フレームワーク(TensorFlow machine-learning framework)にちなんで名付けられた。
訓練は機械学習の基礎的な部分だ。例えば画像の中にあるホットドッグを認識する能力を持つアルゴリズムを作るためには、数千枚のホットドッグやホットドックではない画像を、違いを認識するまで入力する。しかし、大きなモデルの訓練に必要な計算は非常に複雑なため、訓練には数日から数週間必要だった。
ピチャイCEOは、高速のデータ・コネクションに接続したクラウドTPUのクラスターを基にした、機械学習スーパー・コンピューター「クラウドTPUポッド」も発表した。さらに、グーグルは数千のTPUで構成され、インターネット経由で利用できる「テンソルフロー・リサーチ・クラウド」も披露した。
「グーグルはAIファーストなデータセンターと考えられるものを構築しています。クラウドTPUは訓練と推測の両方に最適化しており、AIの重大な進歩の基礎になります」。
グーグルは、研究成果を公開できるAI研究者向けに、1000基のクラウドTPUシステムを作ろうとしている。
ピチャイCEOは、講演の中でいくつかの先進的なAI研究に関して発表した。時間のかかる機械学習アルゴリズムの高精度化の作業を学習する能力を持つアルゴリズムや、医療用画像処理、遺伝子解析、分子発見のためのAIツールも開発中であると述べた。
発表に先立つ講演で、グーグルのジェフ・ディーン上席研究員は、クラウドTPUポッドやテンソルフロー・リサーチ・クラウドの発表がAIの進歩を後押しするだろうと述べた。「多くの最先端の研究者たちは、コンピューターの強力な性能を自由に利用できていません」。
グーグルによる、AIに焦点を当てたハードウェアやクラウドサービスへの動きは、ある意味ではグーグルの本業を加速する取り組みによって前進している。現在、グーグルはパワーサーチや音声認識、翻訳、そして画像処理のためにテンソルフローを利用している。テンソルフローはアルファベット(グーグル)の子会社、ディープマインドが開発した囲碁ソフト、アルファ碁(AlphaGo)にも使われた。
しかし、戦略的にはグーグルはほかのハードウェア企業が、機械学習の世界のイニシアチブを握ることをはばむ可能性も秘めている。これまで深層学習に使われてきた画像処理チップを製造するエヌビディアは、さまざまな製品で特に有名になりつつある。(参照”Nvidia CEO: Software Is Eating the World, but AI Is Going to Eat Software”)。
グーグルは、クラウドTPUがもたらす性能向上の証明として、既存のハードウェアよりずっと早く翻訳アルゴリズムの性能が向上していると説明する。32基の最高性能のGPUを使って丸一日必要だった訓練が、TPUポッドの8分の1を使えばわずか数時間でできるというのだ。
「これらのTPUは128テラフロップスという驚異的な処理速度を実現します。そして、現在の機械学習の原動力となる複雑な計算のためだけに作られたものです」。グーグル・クラウドの主任研究者で、スタンフォード大学の人工知能(AI)研究所のフェイ・フェイ・リー所長はピチャイCEOの発表に先立ってこう述べた。
テラフロップスとは、1秒あたり1兆回の「浮動小数点」演算ができることで、数学的計算によって得られるコンピューターの性能を示す単位である。たとえばiPhone 6なら、およそ100ギガフロップス、つまり1秒あたり10億回の浮動小数点演算ができる性能だ。
グーグルは、他のハードウェアを使って設計したアルゴリズムも研究者たちはテンソルフロー研究クラウドに移植できるという。「これが機械学習の民主化です。設計の自由を守ることで、開発者たちを手助けするということなのです」と、リー所長は付け加えた。
2015年にグーグルが公開して以降、テンソルフローを利用する研究者の数は増え続けている。グーグルは、テンソルフローが今では世界でもっとも広く使われる深層学習フレームワークだと自慢している。