• Codestralのコンテキストウィンドウ(AIモデルが一度に処理できるトークンの数)は32,000トークンであり、既存のコーディングAIと比較して非常に大きい。
  • 他社のAIモデルとのコーディングパフォーマンスベンチマークのスコアを比較した表がある。
  • Codestralはオープンとされているが、商業活動でのCodestralやその成果物の使用を禁止し、ライセンスも「企業の業務活動の文脈で社内でのCodestralの使用を禁止する」と明記している。
  • これは、TechCrunchが指摘したように、「Codestralは一部が著作権のあるコンテンツで訓練されている可能性がある」という理由によるものである。
  • TechCrunchは、Mistral AIはこれについてコメントしていないが、「Mistral AIの以前のトレーニングデータセットには著作権のあるデータが含まれていた」と指摘している。
  • TechCrunchはさらに、「Codestralは220億パラメータを持ち、高性能なPCが必要である。ベンチマークでは競合他社を上回っているが、大幅な差ではない。」と述べている。
  • 「Codestralはほとんどの開発者にとって非現実的であり、その性能向上はわずかである。しかし、コード生成モデルをプログラミングアシスタントとして利用する議論を引き起こすことは間違いない。」

私の考え:Codestralの大規模なコンテキストウィンドウとパフォーマンスは注目に値するが、著作権の問題や使用制約などにより開発者にとっては実用的でない可能性があります。コード生成モデルの進化についての議論が重要であると感じます。

元記事: https://gigazine.net/gsc_news/en/20240530-codestral-mistral-ai/