技術記事要約:
- iGenius Inc.はColosseum 355Bを発表。規制の厳しい産業向けの新しい大規模言語モデルで、データの安全性を確保。
- Colosseum 355Bは、Nvidia Corp.と協力して開発され、3,000以上のNvidia H100 GPUsを使用して構築された。
- モデルは50以上の言語をサポートし、コーディングに優れ、単一のH100 GPUノードに最適化されている。
- Colosseum 355BはFP8精度を使用して事前トレーニングされ、メモリ使用量を大幅に削減し、推論コストを50%削減。
- モデルは企業のファイアウォール内で実行可能で、クラウドにホストする必要がないため、完全な制御を維持。
- Colosseum 355BはNvidia NIMマイクロサービスとしてパッケージ化され、Nvidia APIカタログを介して利用可能。
ご意見:
Colosseum 355Bは高度に規制された産業向けに設計された強力なAIモデルであり、Nvidiaとの協力により開発されたことが注目されます。特に、FP8精度の使用や単一のH100 GPUノードで実行可能な点が、メモリ使用量を削減し推論コストを下げるなど、効率的なモデルとしての特長です。さらに、企業が独自の専門AIモデルを構築し、長期的なニーズに適応させるための手段として、Colosseum 355Bの継続的な事前トレーニングと微調整に焦点を当てた設計は有益です。