- ITサービス会社のTech Mahindraは、金曜日に人工知能イニシアチブ「Project Indus」を発表。
- Project Indusは2023年12月からベータ版として導入され、Tech Mahindraがインディック言語や方言に特化した独自の大規模言語モデル(LLM)を構築する試み。
- 同社は、このプラットフォームを構築するためにDellとIntelとの提携を活用している。
- Indus LLMは、Dell Technologiesのコンピューティングソリューション、ストレージ、ネットワーキング機能を使用して実装される。
- さらに、LLMは、Intel Xeonプロセッサ、OneAPIソフトウェア、およびCPU機能を活用した将来の製品を採用するIntelベースのインフラソリューションを採用している。
- Tech Mahindraは、IntelのGaudi AIアクセラレータとAIトレーニング資産を活用して、Indusモデルの次世代をトレーニングし、従業員をIntelの製品ポートフォリオ(ハードウェアとソフトウェア)でスキルアップする予定。
- 同社は最近、インドネシアの公用語であるバハサ・インドネシアおよびその方言を保存するLLMを構築していることを発表。
- Project Indusの第一フェーズのLLMは、ヒンディー語とその37以上の方言を対象として設計されている。
- Project Indusのチームは、Common Crawlなどの重要なオンラインソースからデータを取得し、「Bhasha Daan」を通じて人々が自分の言語でデータを貢献できるprojectindus.inというポータルを設立。
- 重要な方言が不十分であった場合、Tech Mahindraはラジャスターンやマディヤ・プラデーシュなどの地域にチームを派遣し、現地からデータを収集。
私の考え:Tech MahindraのProject Indusは、インディック言語や方言に特化した大規模言語モデルを構築する取り組みであり、DellとIntelとの提携を通じて先端のAIソリューションを提供することが目的となっています。データ収集やトレーニングにおいても独自のアプローチを取り、地域の言語文化の保存に貢献している点が注目されます。