KADOKAWA Technology Review
×
「非倫理的」なAI訓練データセット、削除するだけでは不十分
Ms Tech | Pixabay
人工知能(AI) 無料会員限定
Deleting unethical data sets isn’t good enough

「非倫理的」なAI訓練データセット、削除するだけでは不十分

人工知能(AI)の訓練用にはかつて、ネット上のデータを許可なく集められたものが使われた。後に批判され、データセットを撤回する例が相次いだがが、撤回するだけでは問題の解決にはならない。 by Karen Hao2021.08.23

2016年、マイクロソフトは、顔認識の進歩に拍車をかけることを期待して、世界最大の顔データベースを公開した。「MS-Celeb-1M」と呼ぶこのデータベースには、10万人の有名人の顔を撮影した1000万枚の画像が入っていた。しかし「有名人」といっても、その定義は曖昧なものだった。

3年後、研究者のアダム・ハーベイ(Adam Harvey)とジュール・ラプラス(Jules LaPlace)がこのデータセットを精査したところ、ジャーナリスト、アーティスト、活動家、学者など、仕事のためにネット上で活動している多くの一般人が見つかった。彼らはみな、データベースへの収録に同意していなかったが、彼らの顔写真は「MS-Celeb-1M」データベースにとどまらず、その向こう側へと渡ってしまった。大量の顔写真を集めたこのデータベースは、フェイスブック、IBM、バイドゥ、そして中国最大級の顔認識技術大手で、中国警察にシステムを販売しているセンスタイム(SenseTime)などの企業が研究に利用していた。

ハーベイとラプラスの調査から間もなく、ジャーナリストからの批判を受けたマイクロソフトは、「研究は終了した」とだけ述べてデータセットを削除した。しかし、この事件がもたらしたプライバシーに関する懸念は、インターネット上の永遠の地に残っている。さらに、問題はこのケースだけではない。

かつて、Web上の画像やテキストをスクレイピングすることは、現実世界のデータを収集する先進的な手法と考えられていた。しかし今では、GDPR(欧州データ保護規則)などの法律や、データ・プライバシーや監視に対して社会の懸念が高まったことにより、この行為は法的にもリスクが高く、不適切なものになっている。その結果、人工知能(AI)研究者らは、スクレイピングによって作成したデータセットを撤回することが多くなった。

しかし、新しい研究によれば、一旦作成し、公開したデータセットを撤回しても、問題のあるデータの拡散や不正利用を防ぐ効果はほとんどないという。この研究チームは、顔写真や人物画像を含むデータセットのうち最もよく引用されているものを3つ(うち2つは撤回されたもの)選び、それぞれが1000本近い論文でどのようにコピーされ、使用され、別の目的で再利用されたかを追跡した。

「MS-Celeb-1M」の場合、コピーされたデータが第三者のサイトや、オリジナルの上に構築された派生データセットに残存していた。このデータで事前に学習させたオープンソースのモデルも容易に入手できる。さらに、このデータセットとその派生物は、撤回後6カ月から18カ月の間に発表された数百本の論文で引用されている。

デュー …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. What’s on the table at this year’s UN climate conference トランプ再選ショック、開幕したCOP29の議論の行方は?
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者決定!授賞式を11/20に開催します。チケット販売中。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る