跳到主要内容

RAG 工程化

本文用于整理 RAG 系统的工程实现和常见取舍。

待展开内容:

  • 文档解析
  • chunk 策略
  • embedding 模型选择
  • 向量库和倒排索引
  • hybrid search
  • rerank
  • 上下文拼接
  • 引用和溯源
  • 权限过滤
  • 增量更新
  • RAG 评估
  • 常见幻觉和召回问题