• Codestralは、Python、Java、C++、JavaScriptなど80以上のプログラミング言語でコードを書いたり対話したりする開発者を支援するAIツール。
  • Codestralは220億のパラメータモデルであり、コード関数の補完、テストの作成、部分的なコードの”埋め込み”などの機能を持つ。また、コードベースに関する質問にも平易な英語で回答可能。
  • Mistralは、CodestralがCodeLlama 70BやDeepseek Coder 33Bなど以前のコーディングに焦点を当てたモデルを凌駕すると主張。新ツールは開発者の作業を加速し、時間と労力を節約すると考えている。
  • Codestralは、JetBrains、SourceGraph、LlamaIndexなどの業界パートナーによるテストを経て公開された。Meital Zilberstein(AIコーディングアシスタント企業TabnineのR&Dリード)は、「比較的コンパクトなサイズでありながら、顧客に提供しているより大きなモデルと同等の結果を提供する」と述べている。
  • MistralはCodestralを「オープンウェイト」生成モデルと表現しているが、伝統的な意味でのオープンソースではない。モデルはMistral AI Non-Production Licenceに従い、「研究およびテスト目的」での使用を許可している。
  • CodestralはHugging FaceでMistralによって非製品用ライセンスとして提供されており、2つのAPIエンドポイントも利用可能。
  • Codestralの登場により、Mistralはコーディングアシスタント分野でGitHub、AWS、Metaなどの既存の主要プレーヤーに挑戦する重要な存在となる一方、AI生成コードへの依存に関する議論を活発化させている。
  • 2023年6月のStack Overflowの調査によると、44%の開発者がすでにAIツールを使用しており、26%が今後使用する予定。しかし、これらのツールには明らかな欠陥がある。
  • GitClearの分析によると、1億5000万行を超えるコードラインでの調査で、生成AIツールがリポジトリに誤ったコードをより多くプッシュしていることが明らかになっている。他の研究でも、ChatGPTのプログラミングに関する質問への回答の半数以上が間違っていることが指摘されている。
  • セキュリティ研究者は、これらのツールが既存のバグや脆弱性を増幅させる可能性に懸念を表明している。

新しいAIツールCodestralの登場は、開発者の作業を効率的に支援する一方、AI生成コードへの依存に関する議論を巻き起こしています。プログラミングコミュニティにとって、これらのツールの利点と課題についての議論が今後ますます重要になるでしょう。

元記事: https://www.computing.co.uk/news/4266809/mistral-unveils-ai-code-generation-model-codestral