AMD の Instinct MI300A APU は、従来のディスクリート GPU と比較して、HPC ワークロードのパフォーマンスを大幅に向上させます。
AMD Instinct MI300A は、数年前に構想された「エクサスケール APU」プラットフォームの実現です。そのアイデアは、統合メモリ プールを利用する同じパッケージに、高性能 GPU と高性能 CPU をパッケージ化するというものでした。HPC の場合、これらのアクセラレータ/コプロセッサ設計はワットあたりのパフォーマンスが向上しますが、数百万行のコードを含むアプリケーションの移植、チューニング、保守が大量に必要となり、少々複雑になることがあります。しかし、研究者は、AMD の次世代 APU の巨体をフル活用するために、2 つの一般的なプログラミング モデル、OpenMP と OpenACC を使用しているようです。
「統合メモリと OpenMP を使用して HPC アプリケーションを AMD Instinct MI300A に移植する」というタイトルのこの研究論文では、オープンソースの C++ ライブラリである OpenFOAM フレームワークが使用されています。
AMD Instinct MI300A アクセラレータは統合 HBM インターフェイスを使用しているため、データ複製の必要がなくなり、ホストとデバイスのメモリ空間を区別するプログラミングも不要になります。さらに、AMD の ROCm ソフトウェア スイートは、APU のすべてのセグメントを 1 つの一貫性のある異種パッケージに統合するのに役立つ追加の最適化を提供します。AMD の Instinct MI300A APU について簡単にまとめると、次のようになります。
その結果、パフォーマンスが大幅に向上します。OpenFOAM の HPC モーター バイク ベンチマークを使用した評価では、AMD Instinct MI300A APU を AMD Instinct MI210、NVIDIA A100 80 GB、NVIDIA H100 (80 GB) GPU と比較テストしました。AMD GPU は ROCm 6.0 スタックで実行され、NVIDIA GPU は CUDA 12.2.2 スタックで実行されました。ベンチマークは 20 タイム ステップ実行するように構成され、タイム ステップあたりの実行時間の平均 (秒) が性能指数 (FOM) として採用されました。Instinct MI300A を除く 3 つの構成はすべてディスクリート CPU を使用していたため、ソケット付き CPU は異種メモリ管理で構成され、GPU がシステム メモリをアドレス指定してベンチマークを実行できるようにしました。
テストに関しては、結果は 3 つのディスクリート チップの中で最高のディスクリート GPU パフォーマンスを提供した NVIDIA H100 システムに正規化されましたが、Instinct MI300A APU は NVIDIA H100 の 4 倍、Instinct MI210 アクセラレータの 5 倍のパフォーマンスを達成しました。
また、単一の Zen 4 CPU パッケージを搭載した AMD Instinct MI300A は、ディスクリート GPU ソリューションで実行されるシングル ソケット Zen 4 CPU よりも 2 倍高速であることも判明しました。MI300A APU に複数のプロセスをオーバーロードすると、パフォーマンスがさらに 2 倍向上しました (APU あたり 3 ~ 6 個の CPU コアでテスト)。これは、dGPU+dCPU 構成でのスケーラビリティの欠如よりもはるかに優れています。
その結果、AMD Instinct MI300A APU のコンピューティング能力は、HPC セグメントでは比類のないものになりそうです。NVIDIA は、AI が最近の大きな流行であるように思われることから、次世代 Blackwell ラインナップで従来の HPC パフォーマンスから後退しました。AMD は、MI300X アクセラレータと今後のリフレッシュでこれに対処しますが、HPC セグメントでは AMD が注目を集めることになりそうです。
購読すると、最新のテクノロジーニュースのダイジェストが毎日受信トレイに届きます
wccftech.com の投稿にはアフィリエイトリンクが含まれている場合があります。当社は Amazon Services LLC Associates Program に参加しています。これは、サイトが amazon.com を宣伝およびリンクすることで広告料を獲得できる手段を提供するアフィリエイト広告プログラムです。
© 2024 WCCF TECH INC. 700 – 401 West Georgia Street、バンクーバー、BC、カナダ

元記事: https://wccftech.com/amd-instinct-mi300a-apu-cdna-3-gpu-zen-4-cpu-unified-memory-up-to-4x-speedup-versus-discrete-gpus/