重排序介绍
重排序(Reranker)介绍
重排序(Reranking)是 RAG 系统中的关键步骤,用于对检索结果按相关性重新排序,提升最终回答质量。
工作原理
用户查询
↓
向量检索 → Top-K 候选文档(粗排)
↓
Reranker 重排序(精排)
↓
Top-N 高质量文档
↓
输入给大语言模型
为什么要重排序
- 向量检索:速度快,但精度有限(语义近似匹配)
- Reranker:精度高,直接计算查询与文档的相关性分数
- 组合使用:先向量检索 100 条,再 Reranker 精排取 Top 5,效果最佳
支持的重排序模型
| 模型 | 说明 |
|---|---|
bge-reranker-v2-m3 |
多语言,中文效果优秀 |
rerank-multilingual-v3.0 |
Cohere 多语言重排序 |
rerank-english-v3.0 |
Cohere 英文重排序 |