現在、アフリカでは2000以上の言語が話されているが、欧米で開発された技術プラットフォームでは十分にサポートされていない。さらに、大規模言語モデル(LLM)に依存する生成AIの発展により、この問題は一層深刻化する可能性がある。LLMの多くは主に英語のテキストで訓練されており、アフリカの言語は後回しにされがちだからだ。
ジェイド・アボット(34歳)は、アフリカの言語がこの技術革新の恩恵を受けられるよう取り組んでいる。彼女の目標は、英語に比べて訓練データが極端に少ないアフリカの言語向けに、データセットや自然言語(NLP)処理ツールを開発することである。
2017年、ソフトウェアコンサルティング企業に勤めていたアボットは、南アフリカで開催された機械学習会議「ディープラーニング・インダバ(Deep Learning Indaba)」において、アフリカ言語の機械翻訳に関する論文を発表した。その際、アフリカ言語を簡単に分類できる再現可能なノートブックを共有した。さらに、この会議で出会った研究者たちとともに、2018年にアフリカ言語の自然言語処理を研究する草の根団体「マサハネ(Masakhane)」を共同設立した。
この団体はこれまでに400以上のオープンソースモデルと20種類のパン・アフリカ言語データセットを公開している。その開発のために、アボットはアフリカ全土からボランティアを募り、それぞれの地域の言語の分類やテキストの収集・複製をした。
2022年には、データサイエンティストのペロノミ・モイロアとともに「レラパAI (Lelapa AI)」を共同創業し、アフリカのビジネスが人工知能(AI)を活用して顧客と母語でコミュニケーションを取れるよう、ローカライズされた言語モデルの開発を進めている。現在、アボットはレラパAIの最高執行責任者(COO)を務める。
2023年には、レラパAI 初のAIツール「ブラブラ(Vulavula)」のベータ版を公開した。このツールは、南アフリカで話される英語、アフリカーンス語、ズールー語、セソト語の音声を認識・書き起こす機能を備えている。今後、さらなる言語の追加や、感情分析機能などの新機能の実装を予定している。
アボットの取り組みはまだ初期段階にある。Vulavulaは依然としてベータ版であり、2023年に公開されたAPIの商用版ユーザーは現在100人に過ぎない。しかし、アボットのような草の根のアプローチが成功すれば、AI開発における見落とされがちな領域に革命をもたらす可能性がある。アフリカの言語話者だけでなく、生成AIの恩恵を享受する世界全体にとって、大きな意義を持つだろう。