跳到主要内容

1 篇文档带有标签「Benchmark」

查看所有标签

质量与评估

大语言模型质量评估的指标、方法、评估集设计和常见误区。