記事の要約
- IBMは広範な公開データセットを使用して、Graniteコードベースの大規模言語モデル(LLM)をオープンソース化しました。
- このモデルは、3TBから4TBのコードデータおよび自然言語コード関連データセットでトレーニングされています。
- IBMのGraniteモデルは、Apache 2.0ライセンスの下で研究および商用利用が可能です。
- IBMは、特にプログラミング用途に特化したモデルを提供しており、116のプログラミング言語をカバーしています。
- IBMはこれらのモデルを内部製品で利用しており、現在はIBMおよびRed HatのInstructLabを通じて一般に提供しています。
- InstructLabは開発者がLLMを使用するための障壁を下げることを目的としています。
コメント
- IBMの取り組みは、オープンソース化が商用利用を含めた幅広い形で可能になることを示しており、プログラミングの効率化だけでなく、アクセシビリティの向上にも寄与しています。
- 特に、商用ライセンスを明確にすることで、法的な不確かさが減り、より多くの企業が安心してこれらのツールを使用できるようになる点は評価できます。
- IBMが提供するGraniteモデルのアプローチは、特定のビジネスケースにフォーカスを当てた効率的なリソースの使用を可能にしている点で、他のオープンソースプロジェクトと一線を画しています。
元記事: https://www.zdnet.com/article/ibm-open-sources-its-granite-ai-models-and-they-mean-business/