- イントロ:Yotta Data Servicesは、人工知能(AI)スタートアップのSarvam AIと協力して、インド初の大規模なオープンソース言語モデル(LLM)であるSarvam-1を構築
- トレーニング:YottaのShakti Cloudインフラを使用して、約4兆トークンのデータセットでトレーニングされた
- 目的:インドの企業に高度なAIテクノロジーへのアクセスを提供し、外国のクラウドサービスに依存せずに現地のイノベーションを支援
- 特徴:Sarvam-1は、英語に加えてヒンディー語、タミル語、テルグ語、マラヤーラム語、パンジャブ語、オディア語、グジャラート語、マラーティー語、カンナダ語、ベンガル語の10のインド言語で動作する最初のネイティブ多言語LLM
- 技術:NVIDIA H100 GPUを使用し、約20億のパラメータを活用して高速で高品質な言語表現と推論効率を確保
この記事は、インドのAIに関する興味深い取り組みを紹介しています。Yotta Data ServicesとSarvam AIのパートナーシップによって開発されたSarvam-1は、インドの言語に焦点を当てた最初の大規模な多言語モデルであり、AI技術へのアクセスを促進し、地元産業とコミュニティにAIを実用的に提供しています。また、NVIDIAの先進的なコンピューティングソリューションを活用したインフラストラクチャにより、高速かつ正確なデータ処理を実現しています。