チャットGPTに最初の試練、GDPRの高いハードル
オープンAIのチャットGPT(ChatGPT)が扱うデータをめぐって、欧州のデータ保護当局が動き出した。現状ではGDPRに準拠することは困難との見方もある。 by Melissa Heikkilä2023.04.21
チャットGPT(ChatGPT)がイタリアで一時的に遮断され、他の欧州連合(EU)諸国でも多くの調査を受けたことで、オープンAI(OpenAI)は1週間余りで欧州のデータ保護法を遵守する体制を整える必要がある。できなければ、多額の罰金を科されたり、データの削除を余儀なくされたり、あるいは遮断されたりする可能性もある。
しかし専門家は、MITテクノロジーレビューに対し、オープンAIがこの規則を遵守することは不可能に近いだろうと述べている。というのも、AIモデルの訓練に使用されるデータは、インターネット上のコンテンツを無差別にスクレイピングするという、ずさんな方法で収集されているからだ。
AI開発においては、訓練データは多ければ多いほど良いというパラダイムが支配的だ。オープンAIの大規模言語モデル「GPT-2」では、40ギガバイトのテキストで構成されるデータセットが使われた。チャットGPTのベースとなったGPT-3の場合は、570ギガバイトだ。オープンAIは、最新モデルGPT-4のデータセットの規模を明らかにしていない。
しかし、オープンAIのそうしたより規模の大きなモデルを求める貪欲さが、今では仇となっている。ここ数週間で欧米のデータ保護当局は、オープンAIがチャットGPTの訓練のために使うデータの収集・処理方法について調査を開始した。当局は、オープンAIがユーザーの名前やメールアドレスといった個人データをスクレイピングし、同意なしに使用していると見ている。
イタリアのデータ保護当局は予防措置としてチャットGPTの使用を禁じ、フランス、ドイツ、アイルランド、カナダの当局も、オープンAIのシステムがどのようにデータを収集し、使用しているかを調査している。また、欧州各地のデータ保護当局を統括する組織、欧州データ保護会議(EDPB)は、チャットGPTに関する調査や法の執行を調整するために、EU全体でタスクフォースを立ち上げている。
イタリアはオープンAIに対し、4月30日までに法律を遵守するよう求めている。つまりオープンAIは、データを収集するためにユーザーの同意を求めるようにするか、データ収集に「正当な利益(legitimate interest)」があることを証明しなければならない。また、オープンAIはチャットGPTがユーザーのデータをどのように使っているのかを説明する必要がある。さらに、チャットGPTが出力したユーザーに関する情報の誤りを訂正し、ユーザーが希望する場合は自身に関するデータを消去し、コンピューター・プログラムによるそのデータの利用を拒否する権限をユーザーに与えなければならない。
もしオープンAIが、データの使用慣行が合法であることを当局に納得させられなければ、特定の国、あるいはEU全体で(チャットGPTが)遮断される可能性がある。フランスのデータ保護機関CNILのアレク …
- 人気の記事ランキング
-
- What’s on the table at this year’s UN climate conference トランプ再選ショック、開幕したCOP29の議論の行方は?
- Why AI could eat quantum computing’s lunch AIの急速な進歩は 量子コンピューターを 不要にするか
- Google DeepMind has a new way to look inside an AI’s “mind” AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
- This AI-generated Minecraft may represent the future of real-time video generation AIがリアルタイムで作り出す、驚きのマイクラ風生成動画