波紋を呼んだ「ゴリラ」誤認識、機械学習ではいまだ解決せず
2015年、グーグルは大きな非難を受けた。グーグル・フォトの画像認識システムが黒人女性をゴリラと認識してしまったからだ。しかし、2年経った今でも、問題は適切に修正されていない。その代わり、グーグルは多くの霊長類に関連する画像タグを検閲して削除している。
ワイアード(Wired)は多くの動物の写真を使ってグーグル・フォトを再度テストした。確かに、パンダからプードルといった動物については簡単に認識できることは分かった。しかし、ゴリラやチンパンジー、それにヒト科に分類されるチンパンジー属の画像については、ラベル付けされていなかった。ワイアードがグーグルに確認したところ、それらの画像のタグは検閲して削除されていることがわかった。
その反面、たとえば、グーグルのクラウド・ビジョン(Cloud Vision)などの他のコンピューター・ビジョン・システムは、ゴリラの写真に正しくタグ付けしてユーザーに答えを提供できる。要するにグーグル・フォトでのタグの削除は、ばつが悪いPRなのだ。
検閲よりも大きな問題は、機械学習用のデータ・セットに潜む偏見である。機械が学ぶ必要のない、人間の一面を反映しているのではないだろうか。しかし、偏見を減らし無くしていくのは、単にラベルのブラックリストを作るより、もっと大変な仕事なのだ。