- Stability AI Ltd.がStable Diffusion 3.5をリリースし、3つの次世代のオープンソースのテキストから画像へのAIモデルのバリアントを含むことを発表
- 3つのモデルには、Stable Diffusion 3.5 Large、3.5 Large Turbo、3.5 Mediumが含まれており、それぞれ科学研究者、趣味家、企業顧客のニーズに対応して開発されている
- Stable Diffusion 3.5 Mediumは26億のパラメータを持ち、品質とカスタマイズのバランスを提供するために改良されたアーキテクチャとトレーニング方法を採用
- モデルの開発に際して、Query-Key Normalizationを使用し、カスタマイズ性を優先し、微調整を簡素化するための取り組みを行った
- Stable Diffusion Medium 3.5は10月29日に利用可能となり、モデルはオープンソースであり、非商用利用には無料で提供され、年間売上1,000万ドルまでの商用利用にはコミュニティライセンスが適用される
私の意見:
Stability AI Ltd.のStable Diffusion 3.5は、カスタマイズ性と品質のバランスが向上したテキストから画像へのAIモデルであり、科学研究者から企業顧客まで幅広いニーズに対応しているようです。Query-Key Normalizationの導入により、ユーザーはモデルのカスタマイズが容易になり、自然言語プロンプトに対する適合性が向上しています。無料の非商用利用から始められるオープンソースのモデル提供は、AIの進化において興味深い展開だと感じます。