跳到主要内容

2 篇文档带有标签「next token prediction」

查看所有标签

Pretraining 预训练

大语言模型预训练的目标、数据、训练方式和与后训练的区别。

Token 与概率

从 token、logits、概率分布和 next token prediction 理解大语言模型的基本工作方式。