POST
rerank
POST /v1/rerank — 对文档列表进行相关性重排序
Rerank(重排序)
对给定查询和候选文档列表进行相关性评分,并按分数重新排序。用于 RAG 系统中的二阶段检索,提升召回质量。
POST
https://api000.com/v1/rerank
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model |
string | 必填 | 重排序模型 ID |
query |
string | 必填 | 查询文本 |
documents |
array | 必填 | 候选文档列表(字符串数组) |
top_n |
integer | 可选 | 返回前 N 个结果,默认全部返回 |
return_documents |
boolean | 可选 | 是否在结果中返回文档原文,默认 true |
请求示例
cURL
curl https://api000.com/v1/rerank \
-H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "bge-reranker-v2-m3",
"query": "如何使用零度API调用大模型",
"documents": [
"零度API 提供兼容 OpenAI 格式的接口",
"今天天气很好,阳光明媚适合出游",
"使用 Bearer Token 进行 API 认证",
"通过替换 base_url 即可快速接入"
],
"top_n": 3
}'
Python
import requests
response = requests.post(
"https://api000.com/v1/rerank",
headers={
"Authorization": "Bearer sk-xxxxxxxxxxxxxxxx",
"Content-Type": "application/json"
},
json={
"model": "bge-reranker-v2-m3",
"query": "如何调用大模型API",
"documents": [
"零度API 提供 OpenAI 兼容接口",
"今天天气很好",
"使用 Bearer Token 进行认证",
"通过替换 base_url 即可接入",
],
"top_n": 3,
"return_documents": True
}
)
results = response.json()["results"]
for item in results:
print(f"[{item['relevance_score']:.4f}] {item['document']}")
响应示例
{
"object": "list",
"results": [
{
"index": 0,
"relevance_score": 0.9823,
"document": "零度API 提供 OpenAI 兼容接口"
},
{
"index": 3,
"relevance_score": 0.9241,
"document": "通过替换 base_url 即可接入"
},
{
"index": 2,
"relevance_score": 0.7641,
"document": "使用 Bearer Token 进行认证"
}
],
"usage": {
"total_tokens": 56
}
}
响应字段说明
| 字段 | 类型 | 说明 |
|---|---|---|
results[].index |
integer | 文档在原始输入中的位置索引 |
results[].relevance_score |
number | 与查询的相关性分数(0~1),越高越相关 |
results[].document |
string | 文档原文(return_documents=true 时包含) |
可用重排序模型
| 模型 ID | 特点 |
|---|---|
bge-reranker-v2-m3 |
多语言,中英文效果极佳(推荐) |
bge-reranker-large |
中文专项,精度高 |
rerank-multilingual-v3.0 |
Cohere 多语言重排序模型 |
rerank-english-v3.0 |
Cohere 英文专项 |
在 RAG 中的典型用法
用户查询
↓
【第一阶段】向量检索(Embedding)
召回 Top-50 候选文档(速度快,精度一般)
↓
【第二阶段】Rerank 重排序
对 Top-50 文档重新精排,取 Top-5
↓
将 Top-5 文档作为上下文传给大模型生成答案