KADOKAWA Technology Review
×
始めるならこの春から!年間サブスク20%オフのお得な【春割】実施中
「聞きたい音」を選べるノイズキャンセリング技術
Stephanie Arnett/MITTR | Getty, Envato
Noise-canceling headphones could let you pick and choose the sounds you want to hear

「聞きたい音」を選べるノイズキャンセリング技術

人間は騒がしい環境の中でも、特定の音を選んで聞き取ることができる。ニューラル・ネットワークを用いることで、それを可能にするシステムが開発された。 by Rhiannon Williams2023.11.13

未来のノイズキャンセリング・ヘッドフォンは、赤ちゃんの泣き声、鳥のさえずり、アラーム音など、ユーザーが聞きたい特定の音を選べるようになるかもしれない。

これを実現するセマンティック・ヒアリングと呼ばれるテクノロジーは、よりスマートな補聴器やイヤホン実現への道を開く可能性がある。そうした機器が実現すれば、装着者は、ある音を除去し、別の音を増幅することが可能になる。

ワシントン大学の研究チームが開発したシステムはまだ試作段階だが、市販のノイズキャンセリング・ヘッドフォンをスマホのアプリに接続することで機能する。ノイズを打ち消すために使用されるヘッドフォンの内蔵マイクは、このシステムでは装着者の周囲環境の音を検出する目的でも使われる。マイクが拾った音はアプリ上で動いているニューラル・ネットワークに取り込まれ、ユーザーの好みに応じて、特定の音がリアルタイムで増幅または抑制される。このシステムは、10月29日から11月1日にかけて開催された「ユーザー・インターフェイス・ソフトウェア・テクノロジー(UIST)に関するACMシンポジウム」で発表された。

研究チームは、オンラインのデータ・セットから得た何千もの音声サンプルと、さまざまな騒音環境から収集した音でニューラル・ネットワークを訓練した。そして、雷雨、トイレの水を流す音、ガラスが割れる音など、20の日常的な音を認識するように学習させた。

9人の実験参加者が、オフィス、公園、通りを歩き回ってこのシステムをテストしたところ、訓練を受けていない状況でも、音を上手く消したり増幅したりできることが分かった。しかし、人間の話し声を、BGM、特にラップミュージックから分離することは、あまりうまくいかなかった。

研究者らは長い間、「カクテルパーティー問題」を解決しようとしてきた。つまり、人間にできるように、騒がしい部屋の中でコンピューターが1つの声を聞き分けられるようにしようということだ。NTTコミュニケーション科学基礎研究所(京都市)の上席特別研究員で、音声強調と認識を研究しているマルク・デルクロワは、この新しい方法は大きな前進であり、このテクノロジーの可能性を示すものだと言う(同研究員はこのプロジェクトには参加していない)。

「このような成果は、この分野にとって非常に有益です」とデルクロワ研究員は言う。「似たようなアイデアは、特に音声分離の分野ではありましたが、完全なリアルタイム・バイノーラル・ターゲット・サウンド抽出システムを提案したのは、この研究チームが初めてです」。

「今日のノイズキャンセリング・ヘッドセットには、ノイズキャンセリングがオンになっていても音楽を再生できる機能があります」と、この研究プロジェクトに携わったワシントン大学のシャム・ゴラコタ助教授は言う。「音楽を再生する代わりに、聞き手に関心のある実際の音を、機械学習アルゴリズムを用いて環境から抽出して再生しているのです」。

ゴラコタ助教授は、このテクノロジーが難聴者の助けになる可能性に期待を寄せている。騒がしい環境では、補聴器を使ってもうまく聞き取れないことがある。「聴覚の強化を通じて、インテリジェント・ヒアラブルの未来を創造するまたとない機会です」と、同助教授は言う。

聞こえるものと聞こえないものをより選択できるようになれば、仕事で集中的な聞き取りが必要な人々にも恩恵をもたらすかもしれない。医療、軍事、エンジニアリングの専門家や、コミュニケーションを取れるようにしながらも聴覚を保護したい工場や建設現場の作業員などだ。

この種のシステムにより、私たちは初めて、良くも悪くも、自分たちを取り巻く音をある程度コントロールできるようになるかもしれないと語るのは、オハイオ州マイアミ大学のメディアおよびコミュニケーションが専門の准教授で、『Hush: Media and Sonic Self-Control(ハッシュ:メディア・アンド・ソニック・セルフコントロール)』(未邦訳)の著者であるマック・ヘイグッドだ(ヘイグッド准教授はこのプロジェクトには携わっていない)。

「夢のようです。人々が長い間このことを夢に描いているのを私は見てきました」と、ヘイグッド准教授は言う。「私たちは基本的に、その音を聞きたいか聞きたくないか、チェックマークを入れるようになっています。そして、このように体験を狭めることは本当に有益になることがあるかもしれません。本当に必要なことであり、実際により良いコミュニケーションの促進に役立つ可能性があります」。

しかしながら、私たちがコントロールや選択をするときはいつもセレンディピティ(幸せな偶然)を排除しているのだ、ともヘイグッド准教授は言う。「私たちは、聞きたいこと、聞きたくないことをあらかじめ決めています。そしてそのことは、私たちが何かを聞いて本当に楽しかったかどうかを知る機会を奪っているのです」。

人気の記事ランキング
  1. Promotion MITTR Emerging Technology Nite #32 Plus 中国AIをテーマに、MITTR「生成AI革命4」開催のご案内
  2. AI companions are the final stage of digital addiction, and lawmakers are taking aim SNS超える中毒性、「AIコンパニオン」に安全対策求める声
  3. What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
  4. Tariffs are bad news for batteries トランプ関税で米電池産業に大打撃、主要部品の大半は中国製
リアノン・ウィリアムズ [Rhiannon Williams]米国版 ニュース担当記者
米国版ニュースレター「ザ・ダウンロード(The Download)」の執筆を担当。MITテクノロジーレビュー入社以前は、英国「i (アイ)」紙のテクノロジー特派員、テレグラフ紙のテクノロジー担当記者を務めた。2021年には英国ジャーナリズム賞の最終選考に残ったほか、専門家としてBBCにも定期的に出演している。
▼Promotion
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る