機械学習の能力はとても高くなっているが、それでも膨大な量の訓練データが必要だ。
たとえば深層学習アルゴリズムを訓練すれば、大の猫好きといえるほど、高度なレベルで猫を認識できるようになる。しかしアルゴリズムの訓練には、猫の大きさや輪郭、毛並み、照明の当たり具合、体の向きといった、違いがある画像を何万枚あるいは何十万枚も与えなければならない。アルゴリズムが少しでも人間と似た方法で、少ない事例から猫を認識できるようになれば、訓練の効率は格段に上がるはずだ。
スタートアップ企業ギャマロン(本社ボストン)では、状況によっては、少ない情報でコンピューターの認識力を向上できるテクノロジーを研究しており、研究に基づく2製品が2月14日に発売された。
応用範囲の広い手法であり、さまざまな課題に適用できれば、大きな影響をもたらす可能性がある。少ないデータで学習できれば、新たな環境をあっという間にロボットに探索させたり理解させたりできるかもしれない。また、コンピューターに大量の個人データを投入しなくても、その人の好みを少ないデータから学習できるかもしれない。
ギャマロンは「ベイズ式プログラム合成」の手法により、少ない事例から学習できるアルゴリズムを開発している。ベイズ確率は18世紀の数学者トーマス・ベイズ由来し、経験に基づく予測を正確にする数学的な枠組みのことだ。ギャマロンのシステムでは、確率的プログラミング(特定の変数ではなくコードで確率を扱う)を用いて、特定のデータセットを説明する予測モデルを設計している。たとえば確率的プログラムでは、猫には耳やひげ、尻尾がある確率が極めて高いと判断できる。さらに事例が加われば、予測モデルに使われているコードは書き直され、確率は調整される。こうした機能のおかげで、コンピューターはデータの特徴となる知識を効果的に学習できるのだ。
確率的プログラミングの手法が誕生したのは、しばらく前のことだ。たとえば、2015年にはマサチューセッツ工科大学(MIT)とニューヨーク大学による共同研究チ …