- NVIDIAがFugattoという生成AIモデルを発表
- Fugattoは音声音と音楽を生成するために設計
- Fugattoは2.5 billionのパラメータを使用し、NVIDIA DGXシステムでトレーニング
- 音声生成と変換:Fugattoはテキストの説明から音楽スニペットを生成し、既存のトラックを変更
- 新しい音の創造:モデルはトランペットが吠える音やサックスが鳴き声を出すような独自の音を生成可能
- 新興プロパティ:Fugattoは新興プロパティを示し、テキストプロンプトから高品質な歌声を生成
- ユーザー制御:モデルは音声属性に対して細かい制御を提供、アクセント強度や感情のトーンを調整可能
NVIDIAはクリプトマイニングからAIモデルの解析に至るまで、自社のGPUを買う人々から莫大な利益を得てきたが、今回は創造的な領域に焦点を当てている。今後の展望がどうなるか、Fugattoが一般に利用可能になるまで待つ必要がある。NVIDIAはリリースの影響を慎重に考慮し、適切な利用と潜在的な誤用を緩和するための措置を講じている。
元記事: https://sonicstate.com/news/2024/11/27/nvidia-fugatto-the-future-of-sound-design