知识体系硬件硬件精度与算力硬件精度与算力 本文用于整理 GPU 算力指标和精度支持。 待展开内容: FLOPS、TFLOPS、TOPS FP32、TF32、FP16、BF16 FP8、INT8、INT4 Tensor Core 理论算力与实际吞吐 计算瓶颈与访存瓶颈 训练和推理对精度的需求差异 不同 GPU 架构的精度支持