- Alibaba Cloudが専用に作成したEthernetベースのネットワークデザインを8ヶ月間の製品で使用
- HPN(High Performance Network)はECMPの使用頻度を減らし、ネットワークパスの選択を正確に行うことでハッシュの偏りを回避
- それぞれのホストには8つのGPUと9つのNICがあり、NICごとに一つのGPUにサービスを提供
- Alibaba Cloudは単一チップのスイッチを好み、51.2Tb/secのEthernetシングルチップスイッチを採用
- Alibaba Cloudは独自のネットワーク構造を設計し、次世代のネットワークアーキテクチャに向けた準備を進めている
Alibaba Cloudのネットワークデザインは、ネットワークパスの選択を最適化し、高性能なネットワークインフラを構築することに成功しています。特に、GPUを効果的に活用するために、単一チップのスイッチを使用することで信頼性を高めています。今後のデータセンターの設計やネットワークアーキテクチャの進化に期待が寄せられます。
元記事: https://www.theregister.com/2024/06/27/alibaba_network_datacenter_designs_revealed/