チャットGPTに最初の試練、GDPRの高いハードル
オープンAIのチャットGPT(ChatGPT)が扱うデータをめぐって、欧州のデータ保護当局が動き出した。現状ではGDPRに準拠することは困難との見方もある。 by Melissa Heikkilä2023.04.21
チャットGPT(ChatGPT)がイタリアで一時的に遮断され、他の欧州連合(EU)諸国でも多くの調査を受けたことで、オープンAI(OpenAI)は1週間余りで欧州のデータ保護法を遵守する体制を整える必要がある。できなければ、多額の罰金を科されたり、データの削除を余儀なくされたり、あるいは遮断されたりする可能性もある。
しかし専門家は、MITテクノロジーレビューに対し、オープンAIがこの規則を遵守することは不可能に近いだろうと述べている。というのも、AIモデルの訓練に使用されるデータは、インターネット上のコンテンツを無差別にスクレイピングするという、ずさんな方法で収集されているからだ。
AI開発においては、訓練データは多ければ多いほど良いというパラダイムが支配的だ。オープンAIの大規模言語モデル「GPT-2」では、40ギガバイトのテキストで構成されるデータセットが使われた。チャットGPTのベースとなったGPT-3の場合は、570ギガバイトだ。オープンAIは、最新モデルGPT-4のデータセットの規模を明らかにしていない。
しかし、オープンAIのそうしたより規模の大きなモデルを求める貪欲さが、今では仇となっている。ここ数週間で欧米のデータ保護当局は、オープンAIがチャットGPTの訓練のために使うデータの収集・処理方法について調査を開始した。当局は、オープンAIがユーザーの名前やメールアドレスといった個人データをスクレイピングし、同意なしに使用していると見ている。
イタリアのデータ保護当局は予防措置としてチャットGPTの使用を禁じ、フランス、ドイツ、アイルランド、カナダの当局も、オープンAIのシステムがどのようにデータを収集し、使用しているかを調査している。また、欧州各地のデータ保護当局を統括する組織、欧州データ保護会議(EDPB)は、チャットGPTに関する調査や法の執行を調整するために、EU全体でタスクフォースを立ち上げている。
イタリアはオープンAIに対し、4月30日までに法律を遵守するよう求めている。つまりオープンAIは、データを収集するためにユーザーの同意を求めるようにするか、データ収集に「正当な利益(legitimate interest)」があることを証明しなければならない。また、オープンAIはチャットGPTがユーザーのデータをどのように使っているのかを説明する必要がある。さらに、チャットGPTが出力したユーザーに関する情報の誤りを訂正し、ユーザーが希望する場合は自身に関するデータを消去し、コンピューター・プログラムによるそのデータの利用を拒否する権限をユーザーに与えなければならない。
もしオープンAIが、データの使用慣行が合法であることを当局に納得させられなければ、特定の国、あるいはEU全体で(チャットGPTが)遮断される可能性がある。フランスのデータ保護機関CNILのアレク …
- 人気の記事ランキング
-
- Google’s new Project Astra could be generative AI’s killer app 世界を驚かせたグーグルの「アストラ」、生成AIのキラーアプリとなるか
- These AI Minecraft characters did weirdly human stuff all on their own マイクラ内に「AI文明」、 1000体のエージェントが 仕事、宗教、税制まで作った
- Google’s new Project Astra could be generative AI’s killer app 世界を驚かせたグーグルの「アストラ」、生成AIのキラーアプリとなるか
- We saw a demo of the new AI system powering Anduril’s vision for war オープンAIと手を組んだ 防衛スタートアップが目指す 「戦争のアップデート」