画像認識システムのほとんどは、 蛇からミルクセーキや靴まで、何百万枚もの日常物の写真が入った大規模データベースを使用して訓練されている。人工知能(AI)は、物体を繰り返し見せられることで、その種類を区別することを学ぶ。しかし、日本の研究者たちは今回、日常物の写真の代わりにコンピューターが生成するフラクタル図で訓練することで、AIが日常物の認識を学び始めることが可能であることを示した。
これは奇妙だが、画期的なアイデアなのかもしれない。訓練データの自動生成は、機械学習におけるエキサイティングなトレンドとなっている。インターネットから掻き集めた写真ではなく、無限に供給される合成画像を使用することで、手作業で作成された既存のデータセットに伴う問題を回避できるからだ。
より専門化したデータでAIを訓練する前に、基本的なスキルを学ばせる段階を「事前訓練」と呼ぶ。事前訓練を受けたモデルを使うと、より多くの人が強力なAIを使用できるようになる。モデルを一から訓練しなくても、既存のモデルをニーズに適応させられるからだ。
例えば、医用画像を診断するシステムであれば、日常物の写真のデータベースを使う事前訓練によって、まずは形や輪郭といった基本的な視覚的特徴を特定することを学ばせるだろう。その際には、1400万枚以上の写真を有する「イメージネット(ImageNet)」などが使われる。事前訓練を終えた後に、病気の微かな兆候を認 …