昨年7月25日、ウィスコンシン州デーン郡の巡回裁判所で、ある刑事事件の棄却を求める申し立てがあった。その理由となったのは、被告側弁護団が地元警察による「組織的な悪意ある行為」と説明するものだった。この証拠を掘り起こすことに一役買ったのが、人工知能(AI)だった。
弁護士のジェサ・ニコルソン・ゲッツは、2021年のティンダー・デートに起因する性的暴行容疑で起訴された依頼人の、弁護準備を進めていた。公判前の申し立て手続き中、ニコルソン・ゲッツ弁護士の共同弁護士が、警察の主任捜査官のボディ・カメラの使用について、本人の説明と記録との間に食い違いがあることに気づいた。ボディ・カメラは、警察の方針により常時身につけることが義務付けられていた。ニコルソン・ゲッツ弁護士によると、捜査と関係がある映像の再確認を求めたところ、警察は公判が始まる前に40時間分の映像を提出したという。
このような大量の資料提出はよくあることであり、それも裁判の直前のことが多い。ボディ・カメラの映像を目視で確認することが、必ずしも事件に関する有用な知見につながるとは限らない。むしろ多くの場合、特にリソースを持たない弁護士にとっては、そのような作業は悪夢である。実際、映像に目を通すのは非常に時間がかかる。また、費用をかけて文字起こしをすれば、ただでさえ厳しい予算に何万ドルもの負担が上乗せされることになりかねない。
しかし、このときのニコルソン・ゲッツ弁護士らの弁護団は、AIを搭載した証拠管理プログラム「ジェスティス・テキスト(JusticeText)」を使っていた。このプログラムは、シカゴ大学でコンピューター科学を学んでいた2人の元学生、デヴシ・メヘロトラとレスリー・ジョーンズダヴが、2014年に地元の街で起きた警察によるラクアン・マクドナルド殺害事件に憤慨して開発したものだ。ジェスティス・テキストは、ボディ・カメラの映像の音声を分析し、文字に起こして、注釈を加える。その一連の作業を数時間ではなく数分で完了できる。2021年に公開されたこのプログラムは、今では民間の刑事弁護士のほか、テキサス州、マサチューセッツ州、ケンタッキー州などの州の公選弁護人にも活用されている。
ジャスティス・テキストを使っても、ニコルソン・ゲッツ弁護士の依頼人の無実を直接証明するものは何も明らかにならなかったが、警察の違法行為の証拠となり得るものが見つかった。申し立てではその違法行為を具体的に、「無罪の証明になり得ると思われる証拠」の隠滅としている。
ニコルソン・ゲッツ弁護士は、ジャスティス・テキストの映像分析結果に少し目を通しただけで、凍りついてしまった。検察側の証人である被害者とされる人物に対して出された、次のような指示が書き起こされていたのだ。「私はここで曖昧に話そうとしています。うーん。なぜかというと、まあ、記録に残したくないからです」。この証人はその後、捜査官に対し、今話している内容は秘密なのかどうか尋ねた。すると捜査官は、2人の会話を警察の報告書に書くつもりはないと答えた。同弁護士は、このやり取りと、自分が申し立ての中で警察の「証拠を不適切に扱い、隠滅し、意図的に除外し、無謀にも保存を怠る」傾向と主張することを鑑み、起訴の棄却を求める申し立てを提出した。警察が不適切に扱ったとされた証拠の中には、事件の夜のボディ・カメラ映像も含まれており、無罪を証明する証拠としての価値があった可能性がある。裁判官は最終的に訴えを棄却し、3月8日の判決で、「(被告側の)弁護が、(捜査官の)行為によって回復不能な不利益を被った」と指摘した。
「ジャスティス・テキストがなければ、公判は延期されることも棄却されることもなく始まっていたでしょう」とニコルソン・ゲッツ弁護士は話す。「これがきっかけとなり、私の証拠開示手続きのやり方が変わりました。そこにどんな情報が存在するのか、とても知りたくなったからです」。
そこにどんな情報が存在するのか、誰も完全には分からない。2014年にミズーリ州ファーガソンで起きた、警察官によるマイケル・ブラウン殺害事件がきっかけとなり、警察が本格的なボディ・カメラの購入・配備を始めたとき、活動家たちは本物の変化がもたらされると期待した。ボディ・カメラは当初「監督機能を強化する装置」としてもてはやされたと、このテクノロジーを研究するサウスカロライナ大学の法学教授、セス・ストートンは言う。
数年後、それらのデバイスは数十億ドル規模の市場になったにもかかわらず、このテクノロジーは決して万能の解決策とは言えない。
問題の1つは、規模だ。ボディ・カメラは何百万時間分もの映像を生み出してきたが、そのほとんどは見られていない。また、警察が映像の公開を組織的に遅らせることがあり、ボディ・カメラを適切に装着しない警察官の処罰を拒否することも多い。そしてようやく映像が公開されても、しばしば選択的に編集さており、文脈が不足していて何が起こったのかが完全には分からない。ニューヨーク・タイムズ紙は最近の分析記事で、ボディ・カメラは「警察が守ることを誓った一般市民の利益よりも、警察自身の利益にかなう可能性がある」と結論付けた。
この問題をチャンスと考えている、少数のAIスタートアップも存在する。ボディ・カメラの記録をテキストに変換し、映像から不正行為を掘り起こすプログラムを開発すれば、司法界のさまざま関係者の役に立つ可能性がある。警察内におけるプロ意識の向上にも一役買うかもしれない。しかし、ボディ・カメラ自体と同様に、このテクノロジーも、成功を妨げる手続き的、法律的、文化的障壁に直面している。
基本的に、ボディ・カメラの分析プログラムは3段階で機能する。まず、音声認識アルゴリズムが音声をテキストに変換して下書き原稿を作成する。録音データが音の最小単位である音素に分解された後、確率分析によって、それらの構成要素が単語や文の中でどのように組み合わさっているのかが割り出される。次に、膨大な数のテキストや過去の会話データで訓練された機械学習アルゴリズムと自然言語処理プログラムが、下書き原稿をきれいに整え、誤りを取り除く。最後に、完成した原稿をシステムがチェックして特定のキーワードやパターンを探し出し、フラグを立てたり分析したりする。
何時間にも及ぶ未視聴の映像を正確にスキャンし、くまなく調べられるかどうかが、このテクノロジーの試金石となる。しかし、さらに重要な問題は、警察活動のプロセスと文化をより責任あるものに変えるという、もっと大きな課題に対応できるかどうかである。
ジャスティス・テキストは、裁判所レベルでそのような問題に取り組んでいる。ジャスティス・テキストの開発中、共同創業者のメヘロトラと同僚たちは、公選弁護人を対象に調査を実施し、担当事件のおよそ8割が何らかのデータと関係していることを見つけた。数十人の被告を同時に担当する大多数の弁護人は、この種の証拠を取り込み、理解し、法廷で提示することができず、不利な立場に置かれていた。この問題への対処を支援するため、ジャスティス・テキストは時間を費やして、弁護士がスケジュールを調整するためのツールの構築や、システムが確実にさまざまなベンダーや警察の資料を読み込め …