零度API 文档

重排序介绍

重排序(Reranker)介绍

重排序(Reranking)是 RAG 系统中的关键步骤,用于对检索结果按相关性重新排序,提升最终回答质量。

工作原理

用户查询
    ↓
向量检索 → Top-K 候选文档(粗排)
    ↓
Reranker 重排序(精排)
    ↓
Top-N 高质量文档
    ↓
输入给大语言模型

为什么要重排序

  • 向量检索:速度快,但精度有限(语义近似匹配)
  • Reranker:精度高,直接计算查询与文档的相关性分数
  • 组合使用:先向量检索 100 条,再 Reranker 精排取 Top 5,效果最佳

支持的重排序模型

模型 说明
bge-reranker-v2-m3 多语言,中文效果优秀
rerank-multilingual-v3.0 Cohere 多语言重排序
rerank-english-v3.0 Cohere 英文重排序
零度API 文档