跳到主要内容

2 篇文档带有标签「部署」

查看所有标签

工程化总览

用一条主线串起大模型工程化中的模型文件、Tokenizer、推理、服务架构、RAG、部署、监控和发布。

硬件选型

根据训练、微调、推理、本地实验等场景选择硬件资源。