要約:

  • Mistral AIとAllen Institute for AIは新しい大規模言語モデルをリリースした。
  • Mistral Small 3は24億のパラメータを含み、MacBooksで実行可能。
  • Mistral Small 3は高速な応答時間と比較可能な出力品質を提供。
  • 開発者はMistral Small 3をプロジェクト要件に合わせて微調整可能。
  • Tülu 3 405BはオリジナルのLlamaモデルよりも優れたパフォーマンスを示す。
  • Ai2は複数のトレーニング方法を使用してTülu 3 405Bを開発。
  • RLVRというトレーニング方法を用いてTülu 3 405Bの能力を向上。

感想:

新しい大規模言語モデルのリリースは、AI技術の進化を示しています。Mistral Small 3の小さなパラメータ数にも関わらず、高速な応答時間と比較可能な出力品質を提供することは注目に値します。Ai2のTülu 3 405Bはオリジナルのモデルを凌駕する性能を示し、Ai2独自のトレーニング方法による開発過程も興味深いです。これらの新しいモデルは、AIのさまざまな分野で革新的な活用が期待されます。


元記事: https://siliconangle.com/2025/01/30/mistral-ai2-release-new-open-source-llms/