水. 7月 2nd, 2025

AI software development

Meta スケールでの広告推論のテール利用を制御する – Meta でのエンジニアリング

ByManagetech

7月 11, 2024

要約：

メタの広告配信システムで使用されている洗練された機械学習モデルをサポートする推論プラットフォームは、CPU、GPU、ストレージ、ネットワーキング、データベースなどのインフラ容量が必要。
尾部利用率の改善は、インフラを効率的かつ持続可能に運用するために重要。
広告推論サービスに実装されたソリューションは、計算利用率を35％向上させ、タイムアウトエラー率を2/3、p99での尾部レイテンシを半減させた。
推論サービスは、ServiceRouterを活用し、シャーディングされたサービスとして構成され、Shard Managerを使用してロードバランシングとシャードの拡張を行っている。
サービスローターは、ランダムなロードバランシングメカニズムを使用して尾部利用率を改善。シャードマネージャーには、モデルごとのロードカウンターが追加され、より正確なバランシングが実現された。

感想：

この記事では、メタの広告配信システムにおける推論プラットフォームの最適化について詳細に説明されています。尾部利用率の改善やロードバランシングの最適化を通じて、計算利用率の向上やエラーレートの低減、レイテンシの削減など、効果的なソリューションが実装されていることが示されています。特に、サービスローターとシャードマネージャーを活用したアプローチが効果的であり、機械学習モデルの推論サービスにおける効率的な運用を実現しています。

元記事: https://engineering.fb.com/2024/07/10/production-engineering/tail-utilization-ads-inference-meta/

By Managetech

Related Post

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech