人気の画像生成AI(ジェネレーティブAI)モデルを使って、実在人物を特定できるような写真を生成できることが新たな研究によって明らかになった。プライバシーの侵害につながる恐れがある。また、著作権で保護されたアート作品や医用画像の正確なコピーも生成可能であることが明らかになり、人工知能(AI)企業を著作権侵害で訴えているアーティストたちの主張を補強する可能性がある。
グーグル、ディープマインド(DeepMind)、カリフォルニア大学バークレー校、チューリッヒ工科大学、プリンストン大学からなる研究チームは、ステーブル・ディフュージョン( Stable Diffusion)とグーグルのイメージェン(Imagen)に対して、個人名などの画像キャプションを入力し、その結果を得る実験を何度も繰り返した。次に、そうして生成された画像の中に、AIモデルのデータベース内にある元画像と一致するものがあるかどうかを分析した。その結果、訓練用データセットに含まれる画像の複製を100枚以上抽出することに成功した。
これらの画像生成AIモデルは、インターネット上から収集したテキスト説明付き画像からなる膨大なデータセットで訓練されている。最新の画像生成技術は、データセット内から取り出した元画像を1ピクセルずつ変化させ、ランダムなピクセル集合体へと変える。次に、そのプロセスを逆行させ、混とんとしたそのピクセル集合体を新たな画像へと作り替える。
フランスのカーン・ノルマンディー大学の博士課程生であるライアン・ウェブスターによると、今回の論文は、こうしたAIモデルが訓練用データセット内の画像を記憶していることを初めて証明する研究結果だという。ウェブスターは今回の研究には関与していないが、他の画像生成モデルでプライバシーについて研究している。今回の結果は、こうしたシス …