要約:

  • ワシントン大学チームが開発したAIシステム「Target Speech Hearing」は、ヘッドフォンを着用したユーザーが話す人物を見て3〜5秒間「登録」し、周囲の音をキャンセルして登録者の声だけをリアルタイムで再生する。
  • このシステムはACM CHI Conferenceで発表され、プルーフ・オブ・コンセプトデバイスのコードは他の人が利用できるが、商業的には利用できない。
  • このシステムは21人の被験者でテストされ、登録者の声の明瞭さは平均で未加工の音声の約2倍だった。
  • TSHシステムは現在一度に1人の話者のみを登録でき、ターゲット話者の声の方向から別の大きな声が聞こえていない場合にのみ登録できる。
  • チームは将来的にこのシステムをイヤーバッドや補聴器に拡張することを目指している。

感想:

ワシントン大学チームが開発した「Target Speech Hearing」システムは、ユーザーにとって革新的な機能を提供していると感じます。ノイズキャンセリングの進化により、騒々しい環境でも特定の話者の声をクリアに聞くことが可能になるというのは非常に興味深いです。将来的には、このシステムがイヤーバッドや補聴器などさまざまな機器に拡張される可能性があることも期待されます。

元記事: https://www.sciencedaily.com/releases/2024/05/240524171429.htm