• インドには22の憲法で認められた言語と、国勢調査で記録された1,500以上の言語があり、英語を話す住民は約10%。
  • インドは急速なデジタル化を進めており、国内企業と地元のスタートアップは多言語AIモデルを開発し、AIを母国語で扱えるようにしている。
  • NVIDIAは、インドの最も普及している言語であるヒンディー語向けの小規模言語モデルをリリースし、Tech Mahindraがそれを使用してAIモデルIndus 2.0を開発。
  • これらの取り組みをサポートするため、NVIDIAはNemotron Hindiモデルをリリースし、Tech MahindraはNVIDIA NeMoを使用してソブリンLMMプラットフォームTeNoを開発。
  • インドの革新者や大手企業は、NVIDIA NeMoを使用してカスタマイズされた言語モデルを構築しており、NVIDIA Inceptionプログラムの企業もNeMoを使用している。

自然言語処理技術の進歩は、言語多様性に配慮したAIの開発を可能にしています。インドの多言語環境に合わせたAIモデルの構築や、NVIDIAのツールを活用した取り組みが進められており、これにより地域固有の文化や言語に即したサービスが提供される可能性が高まっています。

元記事: https://blogs.nvidia.com/blog/llms-indian-languages/