要約:

  • 非営利団体のSwechaは、エンジニアリング学生向けの人工知能(AI)インターンシッププログラムを発表し、Telugu言語中心の大規模言語モデル(LLM)の開発を支援。
  • IIIT Hyderabad、クラウド通信ソリューションのリーディングプロバイダーであるOzonetel、Meta、およびTASKとの協力のもと、プロジェクト「Summer of AI」を実施。
  • プロジェクトのアプローチは、大規模なインターンシッププログラムとして、AIの基礎を学んだ1、2年生の学生が、村や町での人々へのインタビューを通じて非常に大規模なデータ収集に参加することを目指す。
  • プロジェクトでは、スピーチの収集、スピーチの転記、およびスピーチと基本的なLLM用のデータセットの作成を行う。また、複数の大規模図書館やTelugu Academyとも協力し、多くの書籍を取り込む予定。
  • このプロジェクトが成功すれば、他の言語や地域のデータ収集にも同様のアプローチが採用される予定。

感想:

このプロジェクトは、AI技術を学ぶ学生にとって貴重な機会であり、地域の情報や文化を収集し、言語モデルの開発に役立つ取り組みである。インドの言語や文化に焦点を当てたプロジェクトは、重要性が高く、他の言語や地域にも展開されることで、多言語対応のAI技術の発展に寄与する可能性がある。


元記事: https://www.thehindu.com/news/national/telangana/swecha-to-develop-telugu-language-centric-large-language-models/article68193678.ece