零度API 文档
POST

rerank

POST /v1/rerank — 对文档列表进行相关性重排序

Rerank(重排序)

对给定查询和候选文档列表进行相关性评分,并按分数重新排序。用于 RAG 系统中的二阶段检索,提升召回质量。

POST https://api000.com/v1/rerank

请求参数

参数 类型 必填 说明
model string 必填 重排序模型 ID
query string 必填 查询文本
documents array 必填 候选文档列表(字符串数组)
top_n integer 可选 返回前 N 个结果,默认全部返回
return_documents boolean 可选 是否在结果中返回文档原文,默认 true

请求示例

cURL

curl https://api000.com/v1/rerank \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "bge-reranker-v2-m3",
    "query": "如何使用零度API调用大模型",
    "documents": [
      "零度API 提供兼容 OpenAI 格式的接口",
      "今天天气很好,阳光明媚适合出游",
      "使用 Bearer Token 进行 API 认证",
      "通过替换 base_url 即可快速接入"
    ],
    "top_n": 3
  }'

Python

import requests

response = requests.post(
    "https://api000.com/v1/rerank",
    headers={
        "Authorization": "Bearer sk-xxxxxxxxxxxxxxxx",
        "Content-Type": "application/json"
    },
    json={
        "model": "bge-reranker-v2-m3",
        "query": "如何调用大模型API",
        "documents": [
            "零度API 提供 OpenAI 兼容接口",
            "今天天气很好",
            "使用 Bearer Token 进行认证",
            "通过替换 base_url 即可接入",
        ],
        "top_n": 3,
        "return_documents": True
    }
)

results = response.json()["results"]
for item in results:
    print(f"[{item['relevance_score']:.4f}] {item['document']}")

响应示例

{
  "object": "list",
  "results": [
    {
      "index": 0,
      "relevance_score": 0.9823,
      "document": "零度API 提供 OpenAI 兼容接口"
    },
    {
      "index": 3,
      "relevance_score": 0.9241,
      "document": "通过替换 base_url 即可接入"
    },
    {
      "index": 2,
      "relevance_score": 0.7641,
      "document": "使用 Bearer Token 进行认证"
    }
  ],
  "usage": {
    "total_tokens": 56
  }
}

响应字段说明

字段 类型 说明
results[].index integer 文档在原始输入中的位置索引
results[].relevance_score number 与查询的相关性分数(0~1),越高越相关
results[].document string 文档原文(return_documents=true 时包含)

可用重排序模型

模型 ID 特点
bge-reranker-v2-m3 多语言,中英文效果极佳(推荐)
bge-reranker-large 中文专项,精度高
rerank-multilingual-v3.0 Cohere 多语言重排序模型
rerank-english-v3.0 Cohere 英文专项

在 RAG 中的典型用法

用户查询
  ↓
【第一阶段】向量检索(Embedding)
  召回 Top-50 候选文档(速度快,精度一般)
  ↓
【第二阶段】Rerank 重排序
  对 Top-50 文档重新精排,取 Top-5
  ↓
将 Top-5 文档作为上下文传给大模型生成答案
零度API 文档