知识体系LLM 基础指令跟随指令跟随 本文用于解释模型为什么需要 instruction tuning,以及基础模型和聊天模型的区别。 待展开内容: Base Model 与 Chat Model 指令数据格式 system / user / assistant SFT 和指令微调 chat template 和训练格式 指令遵循能力如何评估 过度对齐和拒答倾向 指令跟随与工具调用、多轮对话的关系