跳到主要内容

1 篇文档带有标签「Attention」

查看所有标签

Attention 注意力机制

从“为什么需要”到 QKV、Self-Attention、Causal Attention、Multi-Head Attention 和 KV Cache,系统理解大语言模型中的注意力机制。