Sarvam AI が多言語 AI モデル Sarvam 1 を発表、インド系言語の AI を強化

ByManagetech

10月 29, 2024

技術記事要約

サルヴァムAIはSarvam 1 LLMを発表し、ベンガル語、英語、グジャラート語、ヒンディー語、カンナダ語、マラーティー語、マラヤーラム語、オリヤー語、パンジャブ語、タミル語、テルグ語の11言語でトレーニングされた新しいオープンソースAIモデルをリリース。
Sarvam 1は20億のパラメータを持ち、Nvidia H100 Tensor Core GPUs上で4兆のトークンを使用してトレーニングされたカスタムトークナイザーを使用しており、他のインド言語でトレーニングされたAIモデルよりも最大4倍効率的であると主張。
マルチリンガルタスクを可能にするために、Sarvam-2Tトレーニングコーパスには、ヒンディー語、英語、プログラミング言語のデータセットが20％含まれており、インド言語の高品質なトレーニングデータの不足に対処するために合成データ生成方法が使用されている。
2023年12月には、Sarvam AIがメタAIのLlamaモデルを使用して構築された国内初のヒンディー語LLMであるOpen Hathiを発表。2024年8月には、Sarvam AIが最初の基礎となるAIモデルであるSarvam 2Bを発表。

感想

インドの言語にAIを前進させ、リソースが限られている中でヒンディー語のLLMを作成しているSarvam AIは、インド言語向けのAI開発を推進している。Metaが主催するAI HackathonやLlama 3.1 Impact Grantsなど、イベントや助成金を通じてAIの革新を促進している様子が伺える。

元記事: https://www.etvbharat.com/en/!technology/sarvam-ai-launches-multilingual-ai-model-sarvam-1-enn24102806187

Sarvam AI が多言語 AI モデル Sarvam 1 を発表、インド系言語の AI を強化

ByManagetech

技術記事要約

感想

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

You missed

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

JFrogとNVIDIAが提携し、安全なAI導入を強化

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY