- Architectural experimentationに関する記事では、チームがこの有力なツールをあまり使用しない理由と、成功を収めるためにそのツールを活用する方法について探求している。
- Shruti Bhatは、AIのインフラ整備を進め、エンタープライズ環境でのAIのフル機能を活用する準備をしている。
- Michael Friedrichは、経験豊富な痛みのポイント、無駄な時間のデバッグと解決、そしてAIの少しの助けがDevSecOpsワークフローを再び効率的にする方法について語っている。
Granite 3.2は、新しいビジョン言語モデル、Chain of Thought Reasoning、改善されたTimeSeriesをもたらすIBMの新しいモデルである。
IBMのアプローチは、推論スケーリング手法を使用して、MATH500やAIME2024数学推論ベンチマークでのパフォーマンスを向上させ、Granite 3.2をGPT-4o-0513やClaude3.5-Sonnet-1022などのはるかに大きなモデルよりも単一パスの推論で勝るようにしている。
Granite 3.2には、企業のベンチマークで大きなモデルと競合するGranite Vision 3.2 2BというVLMも含まれており、文書理解を目的としている。
Granite Guardian 3.2は、リスクを検知するガードレールモデルであり、高速で推論コストとメモリ使用量が低下するとともに、新機能のverbalized confidenceを導入している。
Granite 3.2は、企業向けに設計されており、Apache 2.0ライセンスの下でライセンスされており、HuggingFace、watsonx.ai、Ollama、LM Studioで利用可能である。
Graniteモデルは、Enterprisesをターゲットにしており、トレーニングに使用されるデータセットに関する潜在的なIP問題や問題が発生した場合の法的保証が重要であるという推測もある。
IBMの発表は、いくつかのRedditユーザーにとって印象的な業績に見えるが、報告されたパフォーマンスは一部のベンチマークにオーバーフィットしているように見え、他のベンチマークを無視していると指摘するユーザーもいる。
元記事: https://www.infoq.com/news/2025/03/ibm-granite-3-2/