チャットGPTに最初の試練、GDPRの高いハードル
知性を宿す機械

OpenAI’s hunger for data is coming back to bite it チャットGPTに最初の試練、GDPRの高いハードル

オープンAIのチャットGPT(ChatGPT)が扱うデータをめぐって、欧州のデータ保護当局が動き出した。現状ではGDPRに準拠することは困難との見方もある。 by Melissa Heikkilä2023.04.21

チャットGPT(ChatGPT)がイタリアで一時的に遮断され、他の欧州連合(EU)諸国でも多くの調査を受けたことで、オープンAI(OpenAI)は1週間余りで欧州のデータ保護法を遵守する体制を整える必要がある。できなければ、多額の罰金を科されたり、データの削除を余儀なくされたり、あるいは遮断されたりする可能性もある。

しかし専門家は、MITテクノロジーレビューに対し、オープンAIがこの規則を遵守することは不可能に近いだろうと述べている。というのも、AIモデルの訓練に使用されるデータは、インターネット上のコンテンツを無差別にスクレイピングするという、ずさんな方法で収集されているからだ。

AI開発においては、訓練データは多ければ多いほど良いというパラダイムが支配的だ。オープンAIの大規模言語モデル「GPT-2」では、40ギガバイトのテキストで構成されるデータセットが使われた。チャットGPTのベースとなったGPT-3の場合は、570ギガバイトだ。オープンAIは、最新モデルGPT-4のデータセットの規模を明らかにしていない。

しかし、オープンAIのそうしたより規模の大きなモデルを求める貪欲さが、今では仇となっている。ここ数週間で欧米のデータ保護当局は、オープンAIがチャットGPTの訓練のために使うデータの収集・処理方法について調査を開始した。当局は、オープンAIがユーザーの名前やメールアドレスといった個人データをスクレイピングし、同意なしに使用していると見ている。

イタリアのデータ保護当局は予防措置としてチャットGPTの使用を禁じ、フランス、ドイツ、アイルランド、カナダの当局も、オープンAIのシステムがどのようにデータを収集し、使用しているかを調査している。また、欧州各地のデータ保護当局を統括する組織、欧州データ保護会議(EDPB)は、チャットGPTに関する調査や法の執行を調整するために、EU全体でタスクフォースを立ち上げている。

イタリアはオープンAIに対し、4月30日までに法律を遵守するよう求めている。つまりオープンAIは、データを収集するためにユーザーの同意を求めるようにするか、データ収集に「正当な利益(legitimate interest)」があることを証明しなければならない。また、オープンAIはチャットGPTがユーザーのデータをどのように使っているのかを説明する必要がある。さらに、チャットGPTが出力したユーザーに関する情報の誤りを訂正し、ユーザーが希望する場合は自身に関するデータを消去し、コンピューター・プログラムによるそのデータの利用を拒否する権限をユーザーに与えなければならない。

もしオープンAIが、データの使用慣行が合法であることを当局に納得させられなければ、特定の国、あるいはEU全体で(チャットGPTが)遮断される可能性がある。フランスのデータ保護機関CNILのアレク …

こちらは会員限定の記事です。
メールアドレスの登録で続きを読めます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。