失われた声を取り戻す
AIクローンがMND患者の
新しい声になるまで
運動ニューロン疾患(MND)によって声を失った患者たちに、新たな希望が生まれている。AI技術を用いた音声クローンだ。従来の人工音声とは異なり、患者本来の声に限りなく近い自然な発話を可能にする。 by Jessica Hamzelou2025.02.19
- この記事の3つのポイント
-
- 音声クローン技術がALSなどで声を失った人々のコミュニケーションを支援
- 課題は残るものの、従来よりもリアルな声の再現に希望が広がっている
- 患者の表情を再現するアバター技術の開発も進められている
ジュールズ・ロドリゲスは、昨年の10月に声を失った。彼は2020年に筋萎縮性側索硬化症(ALS:Amyotrophic Lateral Sclerosis)と診断され、それ以来、頭部や首の筋肉が全身の筋肉とともに徐々に衰え、発話能力が低下していった。
2024年になると、医師たちは彼が自発呼吸できなくなるのも時間の問題だと懸念していた。そこでロドリゲスは、呼吸を補助するために気管に小さなチューブを挿入する選択をした。気管切開は彼の命を延ばす一方で、発話能力を完全に奪うことにもなった。
「気管切開は、ALS患者にとって非常に恐ろしい決断です。それは人生の新たな段階に踏み入れること、つまり死に近づくことを意味するからです」と、ロドリゲスはコミュニケーション機器を使って私に伝えた。「手術を受ける前は、まだある程度の自立ができ、わずかに話すこともできました。しかし今では、私の呼吸を補助する機械に永久的につながれています」。
フロリダ州マイアミに住むロドリゲスと妻のマリア・フェルナンデスは、彼の声を二度と聞くことはないだろうと思っていた。しかし、2人は人工知能(AI)を使って彼の声を再現することに成功した。映画、テレビ、ラジオ、ポッドキャストの音声で訓練されたツールに、過去のロドリゲスの録音データを入力することで、夫妻は彼の「昔の声」のクローンを生成した。これにより、ロドリゲスはかつての自分の声でコミュニケーションができるようになったのだ。
「しばらく聞くことのなかった自分の声を再び耳にして、気持ちが高揚しました」とロドリゲスは語る。彼は現在、目の動きを追跡する装置を使って文章を入力し、その内容をクローン音声で「話す」ことでコミュニケーションしている。この音声クローンにより、他者との交流や意思疎通が容易になったと彼は言う。また、舞台でコメディを演じる際にもこの音声クローンを活用している。
ロドリゲスは、イレブンラボ(ElevenLabs)がこの音声クローンツールの無料提供を始めて以来、ずっと使い続けている人の一人だ。ツールは発話障害を持つ1000人以上の人たちに利用されている。多くの新技術と同様に、AI音声クローンも完璧ではなく、日常生活では実用的でないと感じる人もいる。しかし、その音声技術はこれまでのコミュニケーション支援技術と比べて大幅に進歩しており、すでに運動ニューロン疾患(MND:Motor Neuron Diseases)を持つ人々の生活を改善していると、英国の運動ニューロン疾患協会(MND協会)の言語聴覚士リチャード・ケイヴ博士は語る。「これはまさに、AIのよい使い道の一例です」。
声のクローン作成
運動ニューロン疾患とは、筋肉や運動を制御するニューロンが徐々に破壊されていく疾患の総称である。診断が難しいケースもあるが、通常、この疾患を持つ人々は、徐々にさまざまな筋肉を動かす能力を失っていく。そして最終的には、呼吸することも困難になる。現在、この疾患に対する治療法は存在しない。
ロドリゲスは2019年の夏にALSの症状を訴え始めた。「左肩の力が弱くなり始めたんです」と、ビデオ通話の際に隣に座っていた妻のフェルナンデスは語る。「私たちは、単なる昔のスポーツでの怪我の影響だと思っていました」。しかし、その後、彼の腕は細くなり始めた。11月には、ビデオゲームをしている最中に右手の親指が「動かなくなった」。2020年2月、ロドリゲスが手の専門医の診察を受けた際、ALSの可能性があると告げられた。彼が35歳のときだった。「手のことを診てもらった医師からそんな話を聞くなんて、本当にショックでした」とフェルナンデスは言う。「まさに打ちのめされました」。
他のALS患者と同様に、ロドリゲスも自身の声を「預ける」よう勧められた。つまり、何百ものフレーズを録音し、それをコミュニケーション機器で使用する「保存された声」として合成するのだ。しかし、その結果はぎこちなく、ロボットのような不自然な音声だった。
これまでに運動ニューロン疾患の患者およそ50人の声を保存する手伝いをしてきたケイヴ博士によると、これはよくあることだという。「私が7年ほど前にMND協会で働き始めた頃は、患者は1500ものフレーズを読み上げなければなりませんでした」。それは何カ月もかかる、非常に骨の折れる作業だった。
出来上がった音声がどれほど自然なものになるかを事前に予測する方法もなく、実際に生成される音声はしばしば非常に人工的に聞こえた。「多少は本人の声に似ているかもしれませんが、決して本人の声と間違えるほどではありません」とケイヴ博士は言う。その後、技術は進歩し、ここ1~2年で彼が支援した患者は、わずか30分ほどの録音で済むようになった。しかし、プロセスが短縮されたとはいえ、生成された合成音声は依然としてリアルなものとは言えなかったとケイヴ博士は話す。
そこへ登場したのが、AIによる音声クローン技術だった。イレブンラボは、3年前の創業当初から映画、テレビ、ポッドキャスト向けのAI音声を開発してきた。同社で非営利団体との提携を統括するソフィア・ノエルは説明する。当初の目標は、吹き替えの品質を向上させ、別の言語でのナレーションやセリフをより自然で違和感のないものにすることだった。しかしその後、ALS患者のコミュニケーションを支援する団体「ブリッジング・ボイス(Bridging Voice)」の技術責任者から、イレブンラボの音声クローン技術がALS患者にとって非常に有用であるとの報告を受けたという。そして昨年8月、イレブンラボは発話障害を持つ人たちがこの技術を自由に利用できるようにするプログラムを立ち上げた。
「突然、音声クローンの作成が格段に速く、簡単にな …
- 人気の記事ランキング
-
- AI crawler wars threaten to make the web more closed for everyone 失われるWebの多様性——AIクローラー戦争が始まった
- Promotion Innovators Under 35 Japan × CROSS U 好評につき第2弾!研究者のキャリアを考える無料イベント【3/14】
- Inside the race to archive the US government’s websites 米政府系サイトが続々閉鎖、 科学者らが緊急保存作戦
- Useful quantum computing is inevitable—and increasingly imminent それでもなお、 量子コンピューターが 人類に必要な理由
- Why the next energy race is for underground hydrogen 水素は「掘る」時代に? 地下水素は地球を救うか