火. 3月 17th, 2026

Google が音声を復元する音声転送 AI を開発 – InfoQ

ByManagetech

10月 2, 2024

要約:

Google Researchチームがゼロショット音声転送（VT）モデルを開発
VTモデルは特定の人物の声をカスタマイズしたテキスト読み上げ（TTS）に使用可能
VTモデルは少数の音声サンプルで動作可能
VTモデルは100以上の言語でTTSを実行可能
人間の審査員が判定した結果、VTモデルによる生成音声と実際の話者の音声を同じ話者と誤認識する割合が高かった

感想:

GoogleのVTモデルは、声を失った人々が元の声を再現するために革新的な解決策を提供しています。音声サンプルが少なくても動作可能であり、100以上の言語でTTSを実行できる点は非常に興味深いです。VT技術の発展は、AIが音声クローニングにどのように使用されるかという懸念を引き起こしていますが、Googleの研究チームは出力に音声透かしを追加するなど、その問題に対処しているようです。

元記事: https://www.infoq.com/news/2024/10/google-voice-transfer-ai/

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech