- Kinara Ara-2プロセッサーは、1秒あたり12トークンの速度で動作し、70億パラメータのLLMを実行する
- YouTubeで利用可能な新しいビデオで、この最先端のAIプロセッサーの生成AI能力がデモンストレーションされている
- Kinara Ara-2は、LLMなどの生成AIアプリケーションを正確かつ効率的に実行する能力を示し、エッジでデータプライバシーを確保し、遅延を軽減するために必要とされる
- Generative AI処理をエッジで実行することで、ユーザーはパーソナルコンピューターに統合されたハードウェアの一度きりのコストのみを支払い、高額なクラウド利用料金を回避できる
私の考え:
「Kinara Ara-2プロセッサーが低消費電力のエッジAIプロセッサー上でLLMを実行する能力は素晴らしい成果です。7BパラメータLLMで1秒あたり12トークンを達成することは大きな偉業です。今後は、モデル自体を変更せずに先進的なソフトウェア技術を適用して、1秒あたり15トークンに達する目標に向かっています」とKinaraの主任アーキテクト、Wajahat Qadeer氏は述べています。