• Google DeepMindは、インド科学研究所(IISc)およびARTPARK(人工知能・ロボティクス技術パーク)と協力して、プロジェクトVaaniを立ち上げた。
  • プロジェクトVaaniは、国内各地から音声データを収集し、オープンソースの素材として提供することに焦点を当てている。
  • Google DeepMindのインドユニットは、Morniと呼ばれるプロジェクトに取り組んでおり、125のインドの言語と方言を理解し表現するAIモデルを開発することを目指している。
  • インドは言語が非常に多様であり、公式に認識されている言語は22言語だが、日常的に使用される言語は100を超える。
  • プロジェクトVaaniは、国内各地から音声データを収集し、オープンソースの素材として提供することに焦点を当てており、最初の段階では58言語で14,000時間の音声データを収集した。
  • プロジェクトVaaniは、2022年12月に最初に発表され、インドのすべての773地区から154,000時間の音声データを収集し文字起こしすることを目標としている。
  • プロジェクトMorniとプロジェクトVaaniにおけるGoogle DeepMindの取り組みは、技術に留まらず、どんなに小さな言語でもデジタル時代において位置を持たせることに関わっている。

私の考え:Google DeepMindのプロジェクトVaaniとMorniは、インドの言語多様性を反映するAIを開発するための重要な取り組みであり、デジタル世界においてすべての言語が存在感を持つことを目指しています。このような幅広い言語に焦点を当てることで、インドの豊かな言語遺産を保存し、日常的にこれらの言語を話す人々に技術をよりアクセスしやすくしています。この取り組みは、誰もが声を上げられる包括的なデジタル世界を作り上げるための重要な一歩です。

元記事: https://www.firstpost.com/tech/google-deepminds-indian-unit-working-on-project-morni-to-create-llm-with-125-indic-languages-13809683.html