用一条主线串起 Token、Embedding、Attention、Transformer、训练、微调、量化和评估等 LLM 基础知识。
从 token、logits、概率分布和下一个 token 预测理解大语言模型的基本工作方式。
解释 token embedding、语义向量、embedding 矩阵和向量空间的基础概念。