IBMのAI訓練用データセット、フリッカー写真を無断使用か
対象者の同意なしに人々の顔写真がWeb上から日常的に取得され、顔認識アルゴリズムの開発に利用されていることがNBCの報道によって明らかになった。
その最新の事例が今年1月にIBMが公開したデータセットだ。このデータセットは写真共有サイトのフリッカーから取得されたおよそ百万枚の写真で構成され、肌の色などの詳細情報が注釈として付けられている。IBMはこれを顔認識におけるバイアス問題(これは実際に存在する)を減らす取り組みの一部だと主張している。だが、利用にあたって同意を得ておらず、写真を削除するのはほぼ不可能となっている。
こうした問題はIBMだけに限らない。顔認識テクノロジーの改善に取り組む企業は、自社のアルゴリズムを訓練するために大量の画像を利用する必要がある。インターネットにすでにアップロードされている画像を使うのが手っ取り早い方法だが、これは倫理的に問題がある。
顔認識はスマートフォンのロック解除に便利かもしれないが、強力な監視ツールにもなり得る。顔認識の利用は実質的に管理されないまま急速に発展しており、規制を求める声が高まっている。
顔認識アルゴリズムは非白人の顔認識においては低い精度しか示しておらず、たとえば髪の長さといった要素によってジェンダーを誤って認識する可能性がある。これに対処するには、黒人女性や髪の長い男性などの画像をアルゴリズムの訓練用データにより多く追加する方法が考えられる。しかし、人々の同意なしに写真を使えば、多くの人に深刻な不快感を与えることになるだろう。