跳到主要内容

4 篇文档带有标签「推理服务」

查看所有标签

工程化总览

用一条主线串起大模型工程化中的模型文件、Tokenizer、推理、服务架构、RAG、部署、监控和发布。

模型部署流程

从模型选择、格式转换、评估、压测到上线灰度的大模型部署流程。

推理服务架构

大模型推理服务的核心组件、请求链路和常见部署架构。

AIPerf

Transformer 中位置编码的作用、常见方法和长上下文扩展中的注意点。