要約:

  • TetrateとBloombergは人工知能(AI)ゲートウェイの開発で協力することを発表
  • Envoy Gatewayプロジェクトに基づくAIゲートウェイを開発
  • Envoy AI GatewayにはLLM使用量を管理し、複数のLLMを呼び出す機能が含まれる
  • KServeを利用し、TensorFlow、XGBoost、scikit-learn、PyTorch、ONNXなどの機械学習フレームワークのサーバーレス推論を可能に
  • 企業はLLMだけでなく、ドメイン固有の小さな言語モデルを展開する必要がある

感想:

AIゲートウェイの開発は、複数のLLMを効率的に管理するための重要な取り組みであり、オープンソースコミュニティと共有されることは業界全体にとって有益であると考えられます。


元記事: https://cloudnativenow.com/social-x/tetrate-allies-with-bloomberg-to-build-ai-gateway-based-on-envoy-and-kubernetes-apis/