下品な言葉は発言NG? MND患者が感じたAIボイスの不自由さ
生命の再定義

A woman made her AI voice clone say “arse.” Then she got banned. 下品な言葉は発言NG? MND患者が感じたAIボイスの不自由さ

運動ニューロン疾患(MND)などで声を失った人向けに、AI技術を用いて本人の声を再現するサービスが登場している。ただ、日常会話で使うには少々お行儀が良すぎるようだ。 by Jessica Hamzelou2025.02.26

この記事は米国版ニュースレターを一部再編集したものです。

ここ数週間、私は声を失った人たちと話をしてきた。英国に住むジョイス・エッサーとフロリダ州マイアミに住むジュールズ・ロドリゲスは、ともに運動ニューロン疾患(MND:Motor Neuron Disease)を患っている。MNDは、筋肉を動かし操る能力が徐々に失われていく進行性疾患の総称だ。

これは関係者全員にとって非常に辛い診断である。ロドリゲスの妻であるマリアが言うには、正式な診断が下った日、夫と二人で号泣し、互いを支え合いながら診察室を後にしたそうだ。そして彼らの生活は一転した。それから4年半経った現在、ロドリゲスは手足を動かすことができず、気管を切開したために話すこともできない。

「この診断に打ちのめされた、というのはまだ控えめな表現です」と話すエッサーは、MNDの一種である進行性球麻痺を患っている。手足はまだ動かせるが、話すことや飲み込むことに苦労している。「私にとって、声を失うことはとても大きな出来事でした。声は私という人間の大きな一部でしたから」。

人工知能(AI)はこのような人々の失われた声を取り戻そうとしている。自分の声を再現させるため、ロドリゲスもエッサーも、イレブンラボ(ElevenLabs)が作ったAIツールに昔の自分の声の録音を提供している。今日、彼らは手や視線で文字を選択し、機器に文章を入力することで、自分の昔の声で「話す」ことができる。声を永遠に失ったと思っていた二人にとって、これは驚くべきことであり、非常に感動的な出来事だった。

しかし、機器を通して話すことには限界がある。話すスピードは遅い上に、完全に自然には聞こえない。また、不思議なことに、利用者が発言できる内容が制限されてしまう可能性がある。

エッサーは自身のボイスクローンをあまり使わない。ボイスクローンは日常会話には実用的でないと感じているからだ。しかし、彼女は自分の昔の声を聞くことは大好きで、ときどきボイスクローンを使うこともある。夫のポール・エッサーが出かける準備をしているのを待っていたある時、ジョイスはボイスクローンを使用した。

彼女はボイスクローンにメッセージを入力して読み上げさせた。「もう、ハニー、おケツにエンジンをかけて急いでよ!」そして彼女はこう付け加えた。「私もパンティを履き替えた方がいいわね!」

「次の日、私はイレブンラボから警告を受けました。不適切な言葉を使ったということです。そして、もうしないでくれとも言っていました!」と、エッサーはメールで教えてくれた(私たちはメール、直接の会話、テキストから音声を合成するツール、筆談ボードを組み合わせてコミュニケーションを取った)。何が不適切だったのか、彼女にはまったく分からなかった。エッサーが特別下品な言葉を使ったというわけではない。彼女の言葉を借りれば、ただの「出かける準備をしている英国人夫婦の間によくある冗談交じりの会話」だった。

エッサーは、彼女が使った言葉のどれかが「お上品な米国のコンピューター」によって自動的にフラグが立てられたのだと思った。イレブンラボのチームの誰かがその警告を適切に評価すれば、却下されるだろうと考えたのだ。

「どうやらそれは見当違いだったようです。次の日、人間のスタッフが私のアカウントを停止したのですから!」とエッサーは語る。彼女は非常に腹が立ったという。「せっかく自分の声を取り戻したのに、それを奪われてしまいました。このことが起こったのは、地元のMNDグループでイレブンラボがいかに素晴らしいのかを伝えるプレゼンをしたわずか2日後のことでした」。

エッサーがイレブンラボに連絡したところ、同社は謝罪し、彼女のアカウントを復旧した。しかし、そもそもなぜ彼女のアカウントが停止処分を受けたのかは、まだ明らかになっていない。イレブンラボの担当者であるソフィア・ノエルにこの件について尋ねたところ、彼女は同社の使用禁止規定を案内してくれた。

そこには、子どもの安全を脅かす、違法行為に関与する、医療アドバイスを提供する、他人になりすます、選挙を妨害するなどのルールが記されている。しかし、不適切な言葉の使用については特に記載されていなかった。ノエルにこのことを尋ねると、エッサーの発言は脅迫と解釈された可能性が高いと彼女は述べた。

イレブンラボの利用規約には、同社はコンテンツを選別、編集、監視する義務を負わないが、コンテンツが「法律または(ユーザーの)規約に違反する可能性が高いと当社が独自に判断した場合」、サービスの利用を「打ち切る、または停止する」ことがあると付記されている。イレブンラボには、「コンテンツが当社の利用規約に沿っているかどうかを審査する」モデレーション・ツールがあると同社のパートナーシップ責任者、ダスティン・ブランクはいう。

問題は、企業は運動ニューロン疾患を持つ人々の言葉遣いをスクリーニングすべきなのかということだ。

この病気を抱えている人々のための他のコミュニケーションデバイスは、そのような仕組みにはなっていない。MND患者は通常、できる限り早く自分の声を「預ける」よう勧められる。多少ロボットの音声のようではあるが、自分の声に似た合成音声を作るために使えるフレーズを録音するのだ(ロドリゲスは最近、自分の合成音声は「ダフト・パンクの曲を4分の1のスピードで聴いた」ようなものだと冗談めかして言った)。

預けた声が同じように調べられるわけではない、とエッサーの夫であるポールは語る。「妻は言われたんです。好きなように(言葉を)入れていいと」と彼は言う。MNDと診断された時点ですでに話す能力が衰えていたエッサーにとって、自身の声を預けることは選択肢とならなかった。ロドリゲスは自分の声を預けたが、ボイスクローンの方がずっとよく聞こえるので、預けた声を使うことはあまりない。

エッサーは今でも怒っているわけではない。また、彼女の経験はよくあることとは言い難い。ロドリゲスも同じテクノロジーを使用しているが、言葉遣いについて警告を受けたことはない。ロドリゲスがボイスクローンに発話させているお笑いのやり取りには汚い言葉がたくさん含まれているのに、と妻のマリアは語る。ロドリゲスは最近のお笑いの舞台の冒頭で、観客に向かって「このクソ野郎どもが!」と叫んだ。観客が彼の芸に対して同情で笑うことのないようにする彼なりのやり方だと彼は冗談めかして言った。その舞台の様子はイレブンラボのWebサイトでも宣伝されている。

エッサーが使ったような言葉はもう制限されることはないとイレブンラボのブランクは言う。「私が把握している限り、特定の汚い言葉を禁じる規則はありません」と同社のノエルは語る。それは当然のことだ。

「MNDを抱えて生きている人々は、心の中にあることを何でも言えるようにするべきです。それがたとえ汚い言葉だとしても」と、MND患者のボイスクローンの利用を支援している英国MND協会のリチャード・ケイヴは言う。「悪態をつきたくなるようなことはたくさんありますから」。

MITテクノロジーレビューの関連記事

ボイスクローンが運動ニューロン疾患のある人々の声をどのように再現しているかについては、この記事で詳しく読むことができる。

脳卒中や筋萎縮性側索硬化症の患者のリアルなアバターを作成し、脳インプラントで操作できるようにする研究が進行している。2024年、このような病気を抱える2人の人物が、この装置を使って1分間に約60~70語の速度で話すことができた。これは典型的な会話スピードの半分の速度ではあるが、以前同様の方法で実現した速度の4倍以上だ。

完全に体が麻痺しているが認知機能は損なわれていない状態のALS患者も、コミュニケーションをとるために脳インプラントを使用している。数年前、ドイツのある男性がこのような装置を使って、マッサージやビールを頼んだり、息子に愛していると伝えたりした

複数の企業が超リアルなアバターの作成に取り組んでいる。ディープフェイクとは呼ばないでほしい。彼らはそれを「合成メディア」と捉えることを好むと、本誌の元記者であり、シンセシア(Synthesia)で自分のアバターを作ったメリッサ・ヘイッキラは書いている。

イレブンラボのツールを使えば、32カ国語で「人間が話しているような音声」を作ることができる。メタは、100種類以上の言語を36種類の他の言語に翻訳できるモデルを構築中だ。

医学・生物工学関連の注目ニュース