疑惑の選挙対策会社は
フェイスブックのデータから
何を得ていたのか?
フェイスブックから膨大な個人情報が外部に流出した事件は大きな衝撃を与えた。疑惑の選挙コンサル企業はすでにユーザーデータを削除し、破産手続きを進めているとされる一方、単なる個人情報以上の価値を持つという「行動モデル」の行方は不明なままだ。 by Jacob Metcalf2018.05.10
2018年4月9日、フェイスブックはユーザーが自分のプロフィールをケンブリッジ・アナリティカが収集したかどうかを確認できるツールを発表した。フェイスブックによると、8700万人のユーザーが被害を受けており、そのうち7100万人は米国在住とのことだ。選挙での勝利を追い求めるが故に犯された、とんでもないプライバシー侵害であり、信じられないようなストーリーだ。フェイスブックは問題に対処するため、ユーザー・データへのアクセスを厳しく取り締まるとともに、マーク・ザッカーバーグCEO(最高経営責任者)は4月中旬の議会証言において、フェイスブック・プラットホームでの政治広告の透明性をより高めると約束した。
だが、盗まれたデータだけに焦点を当てるのは間違っている。それよりも重要なのは、ケンブリッジ・アナリティカが入手したデータから構築した行動モデルだ。ケンブリッジ・アナリティカはフェイスブックの要請に応じて2015年に収集したデータ・セットを削除したと主張している。だが行動モデルは生き残っており、ユーザーの心理的特性を効果的に利用するように意図されたメッセージによって、特定の有権者グループを狙う目的で、今でも使えるのだ。盗まれたデータは個人のプライバシーを侵害して大量に集めたものだが、行動モデルは集団に対するプライバシー侵害であり、ずっと悪質だ。
このあと、ケンブリッジ・アナリティカとその親会社、子会社が行動アルゴリズムを「汎用性のある世界観」に作り変える方法を見つけた最初の会社であることを説明する。汎用性のある世界観とは、金銭的な価値と人間がどのように行動し、社会をどのように構築すべきかという政治的に有効なモデルのことだ。反民主的考え方を持ち、独自技術により実現される違法性の高い行動をとるケンブリッジ・アナリティカという会社を理解するためには、彼らが構築した行動モデルをはっきりと理解することだ。
(情報を完全に開示するために、私は、この件とは直接関係のない問題についてフェイスブックのコンサルタントとして働いたことを明かしておく)
日本版注:ケンブリッジ・アナリティカは5月2日、親会社のSCLエレクションズ(SCL Elections)とともに、すべての業務を終了し、英国で破産手続きに入ると発表した。
入手したデータ
ケンブリッジ・アナリティカが入手したデータについて、最初に説明しておく。広く報道されている通り、元のデータ・セットは、ケンブリッジ・アナリティカの政治部門の前身SCL(Strategic Communications Laboratories)の子会社、GSR(Global Science Research)によって収集された。GSRはケンブリッジ大学の定量心理学者アレクサンドル・コーガン講師が創業した会社だ。コーガン講師はフェイスブック上で動く「マイ・デジタル・ライフ(My Digital Life)」という名前の性格クイズを使って、クイズに答えた27万人のフェイスブック・ユーザーのプロフィールにアクセスした。コーガン講師はフェイスブックのAPI(当時は現在よりずっと制約が少なかった)を使い、クイズに答えたフェイスブック・ユーザーの友人のデータ(伝えられるところによれば8700万人分)を集めた。これは、SCLが自ら契約して入手したと主張している3000万人のプロフィールよりはるかに多い。ケンブリッジ・アナリティカは次にフェイスブックのデータを他のデータ・セットと組み合わせて、米国の有権者3000万人について強力な総合プロフィールを構築した。
依然としてうさん臭く、倫理的に疑わしいものの、コーガン講師はフェイスブックに対して、データを収集したのはあくまでも研究のためだったと言い張っている。しかしコーガン講師とSCLとの契約書の67ページには明確に商業目的と記載されており、所属するケンブリッジ大学とは商業目的の内容について論議されている。GSRの契約に書かれているようにデータを再販したことは、フェイスブックのサービス利用規約に明らかに違反している。コーガン講師はその学歴に信用があったゆえに、収集されたデータ量が多いことに赤信号が点滅していたにも関わらず、フェイスブックは目をつぶり、今になってコーガン講師はフェイスブックの担当者を騙してデータ収集の意図を隠していたと主張している。
しかしながらケンブリッジ・アナリティカが3000万人の米国有権者たちのプロフィールを構築したとしても、主たる目的は3000万人の人たちに向けた広告を作ることではなかった。それどころか、3000万人よりもずっと小さな集団であるクイズ参加者27万人から構築した行動モデルは、それよりも多い人数から類似したプロフィール・データを収集し代理プロフィールの作成を可能にした。この機能によって、心理的特性に基づいて少数の有権者集団を正確に対象とした広告を作成できる。行動モデルは、元データを削除した後でも使い続けられるのだ。
コーガン講師の手法
コーガン講師の手法は、ケンブリッジ心理統計学センター(Cambridge Psychometrics Centre)の心理学研究者、特にミハイル・コシンスキー准教授とデイビッド・スティルウェル副所長の画期的な考え方を模倣したものだ。フェイスブックのAPIシステム内部にある科学的に検証された心理学的クイズを使うものだった。ユーザーがクイズに答えると、コーガン講師はユーザーの行動データの宝庫(基本的にフェイスブックで何に「いいね!」をしたかの記録)へアクセスできるようになっていた。
おかげでコーガン講師は、一方で比較的安価な行動記録、他方で高価な心理学的測定値を手に入れ、相互に関連付けた。行動記録も心理学的測定値もフェイスブックが便利なフォーマットにまとめていた。ケンブリッジ・アナリティカがこの手法を2014年に取り入れた段階では比較的新しいものだったが、最近の研究によれば、ケンブリッジ心理統計学センターの研究者たちが心理学技法を使って作った商業広告は、非ターゲティング広告よりもはるかに効果的だと分かっている。
このデータの価値は、心理的、人格的特性を定量的に測定する科学であるデジタル心理統計学という新しい分野に基づいていることだ。すべての人は、ある特性が「高」と「低」の間のどこかに位置すると仮定される。ある特性とは、一般的には、「オーシャン(OCEAN)」または「ビッグ・ファイブ(Big 5)」と呼ばれ、「開放性(経験への開放性:Openness to experience)」「勤勉性(Conscientiousness)」「外向性(Extraversion)」「協調性(Agreeableness)」「神経症傾向(Neuroticism)」の5つのことだ。
ケンブリッジ・アナリティカは機械学習アルゴリズムを使って特性とフェイスブックでの行動の相互関係を発見した。このような分析の結果は、奇妙だったり、反直感的だったりする場合がしばしばある。たとえば、コシンスキー准教授とスティルウェル副所長の研究は、歌手のトム・ウェイツが好きな人たちは最も性格が「開放的」であり、バンド「プラシーボ(Placebo)」が好きな人は最も「神経質」なことを示している。
しかし、伝統的な選挙運動のデータ・セットと、このような反直感的なプロフィールを組み合わせると、はるかに有用な結果が得られる。たとえば、ケンブリッジ・アナリティカの行動モデルを使ったトランプのデジタル選挙運動では、特殊なマイクロ・ターゲティング広告によって、フェイスブック・ユーザーで特徴のある性格の人が住む小さな地域の政治的な傾向を認識できた。実際に各地を訪問したときにはその地域で有効なメッセージを織り込んだ遊説ができたわけだ。このようなスタイルの選挙運動の分析は、政策討論を好まず、キーワードや感情的なテーマを使って即興で非常に効果的な演説をするトランプのような候補者にはうってつけだった。
こうした分析のすべての中心となるのは、フェイスブックの広告ツール「カスタム・オーディエンス(Custom Audience)」と「類似オーディエンス(Lookalike)」である。これらのツールを使うことで、「類似している」代理プロフィールを持つフェイスブック・ユーザーを見つけ、限られたパラメーターに基づいて広告対象ユーザーを選べる。これらの標準的な広告ツールを利用して(しばしばフェイスブックのスタッフの支援も受けながら)、コーガン講師の盗んだデータから作られた行動モデルは、ケンブリッジ・アナリティカとトランプによるデジタル選挙運動では、希望する性格的特徴を持ったユーザーを見つけるための要素を特定できるようになった。
したがって、性格スコアと、たとえば、ユーザーがどんなバンドに「いいね」を押したかというこ …
- 人気の記事ランキング
-
- Kids are learning how to make their own little language models 作って学ぶ生成AIモデルの仕組み、MITが子ども向け新アプリ
- The winners of Innovators under 35 Japan 2024 have been announced MITTRが選ぶ、 日本発U35イノベーター 2024年版
- These companies are creating food out of thin air 大豆・昆虫の次は微生物、 空気からタンパク質を作る 「夢の食品工場」
- The race to find new materials with AI needs more data. Meta is giving massive amounts away for free. メタ、材料科学向けの最大規模のデータセットとAIモデルを無償公開