零度API 文档
POST

创建转录(Whisper)

POST /v1/audio/transcriptions — 音频转文字

创建转录(Whisper)

将音频文件转录为文本,支持中文、英文、日文等 57 种语言。

POST https://api000.com/v1/audio/transcriptions

Content-Type: multipart/form-data(文件上传接口)


请求参数

参数 类型 必填 说明
file file 必填 音频文件,最大 25MB,支持 mp3/mp4/m4a/wav/webm 等
model string 必填 模型 ID,使用 whisper-1
language string 可选 音频语言(ISO 639-1,如 zhen),提供可提升精度
prompt string 可选 辅助提示词,帮助识别专有名词、缩写词等
response_format string 可选 返回格式:json(默认)、textsrt(字幕)、vtt(字幕)、verbose_json
temperature number 可选 采样温度 0~1,默认 0

请求示例

cURL

curl https://api000.com/v1/audio/transcriptions \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F file="@recording.mp3" \
  -F model="whisper-1" \
  -F language="zh" \
  -F response_format="json"

Python

from openai import OpenAI

client = OpenAI(
    base_url="https://api000.com/v1",
    api_key="sk-xxxxxxxxxxxxxxxx"
)

with open("recording.mp3", "rb") as f:
    transcript = client.audio.transcriptions.create(
        model="whisper-1",
        file=f,
        language="zh",
        prompt="这是一段关于零度API的介绍"  # 帮助识别专有名词
    )

print(transcript.text)

Python — 生成 SRT 字幕文件

with open("video.mp4", "rb") as f:
    srt_content = client.audio.transcriptions.create(
        model="whisper-1",
        file=f,
        response_format="srt",
        language="zh"
    )

with open("subtitles.srt", "w", encoding="utf-8") as f:
    f.write(srt_content)
print("✅ 字幕文件已生成: subtitles.srt")

响应示例

json 格式(默认)

{
  "text": "零度API 提供高性价比的人工智能推理服务,支持多种大语言模型。"
}

verbose_json 格式(含时间戳)

{
  "text": "零度API 提供...",
  "language": "chinese",
  "duration": 5.43,
  "segments": [
    {
      "id": 0,
      "start": 0.0,
      "end": 2.5,
      "text": "零度API 提供高性价比"
    }
  ]
}

支持的音频格式

格式 说明
mp3 最常用,推荐格式
m4a iOS 录音默认格式
wav 无损,文件较大
webm 浏览器录音格式
mp4mpegmpga 视频/音频文件

文件大小限制:25MB。如文件过大,建议先分割或压缩再上传。

零度API 文档