跳到主要内容

指令跟随

本文用于解释模型为什么需要 instruction tuning,以及基础模型和聊天模型的区别。

待展开内容:

  • Base Model 与 Chat Model
  • 指令数据格式
  • system / user / assistant
  • SFT 和指令微调
  • chat template 和训练格式
  • 指令遵循能力如何评估
  • 过度对齐和拒答倾向
  • 指令跟随与工具调用、多轮对话的关系