跳到主要内容

GPU 互联

本文用于整理多 GPU 场景下的互联方式和通信影响。

待展开内容:

  • PCIe
  • NVLink
  • NVSwitch
  • GPU Direct RDMA
  • 拓扑对 tensor parallel 的影响
  • MoE expert parallel 中的通信
  • all-reduce、all-to-all
  • 单机多卡互联选型
  • 如何查看 GPU 拓扑