- 2024年5月16日、Fraunhofer IAISとAI SwedenのNLUグループは、バルセロナスーパーコンピューティングセンターの新しい高性能コンピュータMareNostrum 5で計算能力を共同で受け取った。
- 新しいモデルファミリーは、45のヨーロッパ言語、方言、コードからなるトレーニングデータセットを基に作成される。
- モデルのトレーニングは2024年5月末に開始され、最初の共同モデルが数か月以内に公開される予定。
- このプロジェクトは1年間続き、ヨーロッパの大規模多言語オープンソースモデルの実現が期待されている。
- Fraunhofer IAISとAI Swedenの専門知識を結集し、新しい言語モデルを開発している。
この記事では、Fraunhofer IAISとAI SwedenがEuroHPC JUからの計算能力を活用してヨーロッパの大規模多言語モデルの開発に取り組んでいることが述べられています。両組織がヨーロッパ言語に重点を置いたトレーニングデータセットを使用し、多言語大規模言語モデルの開発を進めている点が注目されます。また、Fraunhofer IAISとAI Swedenが専門知識を結集して共同でモデルを訓練し、オープンソースで公開するという取り組みが示されています。
元記事: https://idw-online.de/de/news833766