• IBMは、オープンソースの大規模言語モデル(LLM)「Granite code」を公開しました。
  • このモデルは、GitHub Code CleanやStarcoder dataなどの公開データセットを事前学習データとして使用しています。
  • Graniteモデルは、3TBから4TBのコードデータと自然言語コード関連データセットで訓練されています。
  • これらのモデルは、研究と商用利用のためにApache 2.0ライセンスの下でライセンスされています。
  • IBMの研究主任であるルチル・プリ氏は、「ソフトウェアのための生成AIの風景を変える」と述べています。
  • Graniteモデルは、特定のビジネス用途に特化しており、116のプログラミング言語で訓練されたデコーダのみのモデルです。
  • IBMは、これらのLLMを内部的にWatsonx Code Assistant製品で使用しています。
  • これらのモデルは、IBMとRed HatのInstructLabを通じて利用可能です。
  • InstructLabは、開発者がLLMを使用するためのエントリーレベルを下げることを目指しています。
  • Graniteモデルは、開発者がコードを書く際に時間とエネルギーを節約するのに役立つとIBMは見ています。

私の考え:

  • IBMによるGraniteモデルのオープンソース化は、特に法的な問題や著作権の問題を避けるための詳細な配慮がされている点で非常に重要です。
  • 商用利用が可能であること、そして特定のビジネスケースに特化している点が、他のLLMとは一線を画しています。
  • この取り組みにより、より多くの企業や開発者がAIを活用したプログラミングやその他の開発作業に積極的に取り組むきっかけになるでしょう。


元記事: https://www.zdnet.com/article/ibm-open-sources-its-granite-ai-models-and-they-mean-business/