• ヨーロッパ最大の民間AI研究所「Silo AI」は、トゥルク大学の研究グループ「TurkuNLP」とHPLTと共同で、北欧の全言語を対象とした多言語大規模言語モデル(LLM)「Viking」をリリース。
  • Vikingは、北欧言語だけでなく英語とプログラミング言語にも対応しており、北欧言語での最高クラスのパフォーマンスを英語のパフォーマンスを損なうことなく実現。
  • Viking 7Bは、全ヨーロッパ言語を対象としたLLMの開発への重要なステップとされ、多言語モデルの訓練には高い努力と専門知識が必要。
  • 少数言語のデータを高品質で収集し、それをキュレーションおよび処理した後、多言語間のクロストレーニング技術を取り入れている。
  • 「Viking」は、ヨーロッパのデジタル主権を強化し、LLMを活用した製品やアプリケーションの普及を加速させるためのデジタルインフラとして機能。
  • 訓練にはヨーロッパのスーパーコンピュータ「LUMI」を使用し、LUMIは水力発電による100%エコな電力で稼働し、排出される廃熱は近隣都市の地区暖房の約20%を占める。
  • カスタマイズのニーズに応えるため、Silo AIはベースモデルの提供に加え、組織がAIソリューションを特定の用途に合わせてカスタマイズできるモデル提供プラットフォームも提供。

新しい「Viking」モデルは、AIにおける英語の支配を打破し、すべての北欧言語と英語、プログラミング言語において優れたパフォーマンスを発揮します。ヨーロッパのグリーンスーパーコンピューターで訓練されたこのモデルは、デジタル主権を促進し、文化的な隔たりを埋める包括的なAIアプリケーションの開発を開発者に可能にします。これにより、様々な言語や文化に敏感であり、地域の価値観や文化を尊重する技術の進歩が期待されます。

元記事: https://tech.eu/2024/05/15/silo-ai-s-new-release-viking-7b-bridges-the-gap-for-low-resource-languages/