用一条主线串起大模型工程化中的模型文件、Tokenizer、推理、服务架构、RAG、部署、监控和发布。
从模型选择、格式转换、评估、压测到上线灰度的大模型部署流程。
大模型推理服务的核心组件、请求链路和常见部署架构。
Transformer 中位置编码的作用、常见方法和长上下文扩展中的注意点。