• インドには、憲法で認められた22の言語と国勢調査で記録された1,500以上の言語が存在する。
  • インドのAIモデルは、地域の方言、文化、実践を反映したローカルデータセットに基づいて構築されている。
  • NVIDIAは、インドの最も一般的な言語であるヒンディー語向けに小規模な言語モデルをリリースしている。
  • インドの企業は、NVIDIA NeMoを使用してカスタマイズされた言語モデルを構築している。
  • Gnani.aiは、多言語スピーチtoスピーチLLMを構築し、仮想顧客サービスアシスタント向けにAIを最適化している。
  • WiproとTCSは、NeMo Curatorの合成データ生成パイプラインを使用して、クライアント向けにLLMをカスタマイズしている。

自然言語処理の分野において、インドの多様な言語環境に合わせたAIモデルの開発が進んでいることがわかります。NVIDIAを中心としたテクノロジー企業やインドの大手企業が、地域の言語や文化を考慮したAIモデルを構築し、顧客サービスや情報アクセスの向上に取り組んでいます。これにより、インドの多様な人口に対応したサービス提供が可能となり、AIの発展において国内のデータセットを活用することが重要であることが示唆されています。

元記事: https://indiatechnologynews.in/india-enterprises-serve-over-a-billion-local-language-speakers/