AI業界の不都合な真実
ラベル付け作業の底辺競争
フェアトレードは実現するか
人工知能(AI)サービスを支える大量の訓練用データの作成は、多くの場合、劣悪な条件で働く人々に頼っている。しかし、自らを「インパクト」企業と呼び、訓練用データ作成の作業に従事する労働者に対し、従来より好待遇の労働環境を提供していると主張する企業のグループが登場している。 by Kate Kaye2019.10.04
ニューヨーク独特の寒さが厳しいある2月の午後、レオン・キャンベルはマンハッタンのミッドタウンにあるオフィスのデスクに身を潜めた。ゲーム関連のポッドキャストを準備し、ノートパソコンのソフトウェア・プラットフォームを立ち上げると、キャンベルは数時間、画像内の車両の隅をクリックして、ソフトウェアで画像の周りに枠を描く作業を続けた。
- この記事はマガジン「SDGs Issue」に収録されています。 マガジンの紹介
キャンベルとその仲間たちは、自動車やSUVの画像を識別することにより、自律自動車などで使われるアルゴリズムの訓練用データを大量に作成している。24歳で、自閉症のキャンベルは、その作業が単調なものだったという。多くの場合、この作業には「似たような位置に枠を描いて、オブジェクトがフレームから少し外れても枠に囲まれた状態になるように再調整する」ことが必要になる。 それでもなお、キャンベルはこの業務に従事できることを喜んでいた。「この業務は、私が将来的にやりたいことの備えになっていると思います」。そうキャンベルは言い、ゲームプログラマーやデザイナーになりたいと付け加えた。
人工知能(AI)システムの構築には大量の人力が投入されている。その大半は、AIがパターンを見つけるために訓練用データを取り込む前のデータのクレンジング、分類やラベル付けなどの作業だ。AIの社会的意義を研究するAIナウ研究所(AI Now Institute)は、この作業をAIパイプライン上の「隠れた労働」と呼んでいる。AIシステムが製品やサービスに展開された際にAIの「魔法」を支える、表舞台に出ない人力作業であるからだ。
キャンベルは、この労働力プールに属する人々の中では、比較的恵まれているほうだ。ダイバージェント (Daivergent)で、毎週28時間作業をし、1時間あたり12ドルから20ドルの報酬を得ている。ダイバージェントは、自閉症の人々が、有益な職務経験を得て、就職の準備ができるよう考案されたオンライン・ワークプラットフォームだ。ダイバージェントはキャンベルの正確な賃金については打ち明けていないが、同社の「一般的な範囲」であり、ニューヨーク市の「市場相場」だと答えている。
キャンベルとは対照的に、データの注釈付け作業に従事する人々の大半は、マンハッタンのオフィスではなく、インドやケニア、マレーシア、フィリピンなどの自宅からオンライン・プラットフォームにログインする。そして、1日数分から数時間にわたって、たとえば、ねぎの束とセロリの茎や、キャッツアイとアビエータースタイルのサングラスなどを区別する作業に従事している。メアリー・グレイとシッダールタ・スーリーの近著『Ghost Work(ゴースト・ワーク)』に詳細が記されている通り、データの注釈付け作業に従事する人々の大半は、低賃金で、雇用が不安定で、キャリアアップの機会もないギグワーカーだ。
データの注釈付けをする少数の企業からなるグループが、こうした作業に対する社会の認識を変えようとしている。AIデータサービス分野において「善い行ないをしてよい結果を生み出す」ことを目指しているこれらの企業は、企業向けの啓蒙活動への道が険しいものになることを直感している。
数字あそび
一般的には、データの注釈付けをする労働者は、アマゾンのメカニカルターク(Mechanical Turk)、またはアッペン(Appen)などの企業が提供するギグワーク用プラットフォームにログオンする。プラットフォーム上でAI企業から外注された作業に従事すると、毎分1セントにも満たない金額が支払われる。ビジネスの熾烈な競争において、これらのプラットフォームは、規模、速度とコストの面で競い合っている。
たとえばアッペンは、100万人にものぼる請負労働者の労働力プールを誇り、こうした労働者が医療画像の分類や、チャットボット用テキストの翻訳作業に従事している。アッペンは2019年3月にデータの注釈付けサービス事業者のフィギュアエイト(Figure Eight)を3億ドルで買収したとき、この買収は顧客の「規模、速度と品質要件」を満たすのに役立つだろうと説明している。
「これはまさに、底辺への競争です」と話すのは、テキサス州オースティンのデータ注釈付けサービス会社、アリージョン(Alegion)のカスタマーサクセス部門責任者のダニエル・キャレンだ。「この業界全体の競争が、本当に激しいため、皆が世界中のあらゆるところから少しでも安い労働力を見つけようと躍起になっています」。
「インパクト 」が本当に意味するものとは?
アリージョンは、AIデータ業務の地位の向上を目指すプラットフォームの1つであり、こうしたプラットフォームとしてはほかに、クラウドファクトリー(CloudFactory)や、デジタル・ディバイド・データ(Digital Divide Data:DDD)、アイメリット(iMerit)、やサマソース(Samasource)などが挙げられる。これらの企業は、自らを「インパクト(impact)」企業と呼び、業界内のほとんどの企業より優れた労働条件やキャリアの将来性などを実現し、倫理的に調達したデータ労働力を提供していると主張している。膨大なデータセットを扱う点は異なるが、フェアトレードのコーヒー豆のようなものだ。
しかしながら、フェアトレードとの違いはそれだけではない。倫理的な調達に関する規制はなく、業界標準も脆弱なものしか策定されていない。加えて、倫理的な調達に関する定義は企業によって大きく異なっている。
たとえば、アイメリットの共同創業者兼最高経営責任者(CEO)であるラダ・バスーは、同社で数年間働いた人々はチーム・リーダーやプロジェクト・マネージャー、ドメイン・トレーナーとして昇進していると説明する …
- 人気の記事ランキング
-
- Bringing the lofty ideas of pure math down to earth 崇高な理念を現実へ、 物理学者が学び直して感じた 「数学」を学ぶ意義
- Google’s new Project Astra could be generative AI’s killer app 世界を驚かせたグーグルの「アストラ」、生成AIのキラーアプリとなるか
- These AI Minecraft characters did weirdly human stuff all on their own マイクラ内に「AI文明」、 1000体のエージェントが 仕事、宗教、税制まで作った
- AI’s search for more energy is growing more urgent 生成AIの隠れた代償、激増するデータセンターの環境負荷