独自入手:グーグルが著名AI研究者を解雇した問題論文の中身
知性を宿す機械

We read the paper that forced Timnit Gebru out of Google. Here's what it says 独自入手:グーグルが
著名AI研究者を解雇した
「問題論文」の中身

グーグルのAI倫理チームの共同リーダーであったティムニット・ゲブルが解雇(グーグルは辞職と説明)されたことは関係者に衝撃を与えた。原因となった論文は、グーグルのビジネスの中核を支える大規模な言語モデルのリスクを指摘するものだった。 by Karen Hao2020.12.15

12月2日水曜日の午後、グーグルの人工知能(AI)倫理チームの共同リーダーを務めていたティムニット・ゲブルは、同社に解雇された旨をツイッターに投稿した。

AI倫理の研究分野における第一人者として名高いゲブルは、顔認識は女性や有色人種を識別する際の正確性が低く、差別に繋がりうることを指摘した革新的な論文の共著者として知られる。また、「ブラック・イン・AI(Black in A)」協同グループの共同設立者として、テック産業内での多様性を推進している。ゲブルがグーグルで設立に携わったAI倫理チームは、AI分野で最も多様性に富んだチームの1つであり、各々の分野の第一人者が数多く所属している。重要な成果を生み出し、それらがしばしばAI分野において主流の手法に対し挑戦的であることから、同業者らからは羨望あるいは嫉妬の眼差しを受けていた。

一連のツイート、漏洩したメール、メディア記事によるとゲブルの辞職は、同氏が共著した論文を巡る紛争の結果のようだ。グーグルAI部門のリーダーであるジェフ・ディーンは現在公開されている社内メールで社員に対し、論文は「公開の基準を満たさなかった」こと、ゲブルがグーグルに対し、同社がいくつかの条件を受け入れないならば辞任すると告げ、同社はそれを受け入れなかったことを明らかにした。ゲブルのツイートによると、同氏は休暇が明けてから雇用の「最終日」について協議したいと申し出ていたが、休暇から戻る前に社用メールアカウントにアクセスできなくなっていたという。

ネット上では、ゲブルがグーグルの研究における核心的な面、あるいは公にはできない面の不都合な真実を明らかにしようとしたために追い出されたのではないか、と多くのAI倫理分野のリーダーたちが議論している。グーグルのスタッフ1400人のほかに、1900人の賛同者がグーグルへの抗議状に署名している。

ゲブルの辞職までの経緯の詳細はまだ明らかになっていない。同氏とグーグルはソーシャルメディアへの投稿以外ではコメントしていないためだ。しかしMITテクノロジーレビュー編集部は、ワシントン大学で計算言語学の教授を務め、論文の共著者の1人であるエミリー・M・ベンダーから、問題となった論文を入手した。初期段階の草稿がインターネットに出回ることは避けたいため論文そのものの掲載は控えて欲しいとベンダー教授は希望している。この論文を読むと、ゲブルらが指摘するAIの問題点が見えてくる。そしてその問題点は、グーグルにとって懸念となり得るものなのだ。

「確率過程的なオウムたちの持つ危険性:大規模すぎる言語モデルは存在すべきなのか」と題されたこの論文は、大規模な言語モデル、つまり、凄まじい量のテキストデータを用いて訓練されたAIに伴うリスクを挙げている。こうした言語モデルはここ3年間でますます人気を博すようになり、その規模もますます大きくなっている。適切な条件下では、説得力があり意味のあるように見えるテキストを生成すること、あるいは言語から意味を推測することに関して、そうしたモデルの完成度は非常に高い。しかし、ゲブルらは論文の導入部で、「開発に伴い起こりうるリスクとその対策に関して、十分に検討がなされているかどうかは疑問です」と述べている。

論文の中身

論文は他の研究者たちの成果を基にしており、自然言語処理の歴史、大規模な言語モデルが抱える4つの主なリスクの概要、今後の研究についての提案からなる。グーグルとの揉めたのはリスクについての部分だと思われるので、以下にその要点をまとめた。

環境的コストと金銭的コスト

大規模なAIモデルの訓練には、多くのコンピュータ処理能力が必要であり、多くの電力を消費する。ゲブルと共著者らは、大規模な言語モデルの炭素排出量と金銭的コストについてのエマ・ストルーベル博士とその共著者らによる2019年の論文を引用している。同論文によると、言語モデルにますます多くのデータが入力されるようになるにつれて、同モデルのエネルギー消費量とカーボンフットプリントは2017年から爆発的に増加しているという。

ストルーベル博士の研究によると、「ニューラル・アーキテクチャー・サーチ(NAS)」という特定の手法を用いた1つの言語モデルは、二酸化炭素換算量 …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。