跳到主要内容

硬件精度与算力

本文用于整理 GPU 算力指标和精度支持。

待展开内容:

  • FLOPS、TFLOPS、TOPS
  • FP32、TF32、FP16、BF16
  • FP8、INT8、INT4
  • Tensor Core
  • 理论算力与实际吞吐
  • 计算瓶颈与访存瓶颈
  • 训练和推理对精度的需求差异
  • 不同 GPU 架构的精度支持