Cover Story
AI訓練データに個人情報、
身分証や履歴書など数百万件
生成AIモデルの訓練に使用される最大規模のオープンソースデータセットの1つに、個人を特定可能な機密情報が多数発見された。Webスクレイピングによって収集されたこれらのデータは、AIモデルに取り込まれて、プライバシーの侵害につながる恐れがある。 by Eileen Guo

生成AIモデルの訓練に使用される最大規模のオープンソースデータセットの1つに、個人を特定可能な機密情報が多数発見された。Webスクレイピングによって収集されたこれらのデータは、AIモデルに取り込まれて、プライバシーの侵害につながる恐れがある。 by Eileen Guo
グーグル・ディープマインドが古代ラテン語碑文を解読するAIツール「アイネアス(Aeneas)」を発表した。15万件の碑文データベースを活用し、風化で欠損した文字を補完、年代や起源地も推定する。