跳到主要内容

2 篇文档带有标签「next token prediction」

查看所有标签

Token 与概率

从 token、logits、概率分布和下一个 token 预测理解大语言模型的基本工作方式。

预训练

大语言模型预训练的目标、数据、训练方式和与后训练的区别。