token embedding、embedding 矩阵和向量空间的基础概念。
用一条主线串起 Token、Embedding、Attention、Transformer、训练、微调、量化和评估等 LLM 基础知识。
从 token、logits、概率分布和 next token prediction 理解大语言模型的基本工作方式。