Attention 注意力机制从“为什么需要”到 QKV、Self-Attention、Causal Attention、Multi-Head Attention 和 KV Cache,系统理解大语言模型中的注意力机制。