创建转录（Whisper）

将音频文件转录为文本，支持中文、英文、日文等 57 种语言。

POST https://api000.com/v1/audio/transcriptions

Content-Type: multipart/form-data（文件上传接口）

请求参数

参数	类型	必填	说明
`file`	file	必填	音频文件，最大 25MB，支持 mp3/mp4/m4a/wav/webm 等
`model`	string	必填	模型 ID，使用 `whisper-1`
`language`	string	可选	音频语言（ISO 639-1，如 `zh`、`en`），提供可提升精度
`prompt`	string	可选	辅助提示词，帮助识别专有名词、缩写词等
`response_format`	string	可选	返回格式：`json`（默认）、`text`、`srt`（字幕）、`vtt`（字幕）、`verbose_json`
`temperature`	number	可选	采样温度 0~1，默认 `0`

请求示例

cURL

curl https://api000.com/v1/audio/transcriptions \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F file="@recording.mp3" \
  -F model="whisper-1" \
  -F language="zh" \
  -F response_format="json"

Python

from openai import OpenAI

client = OpenAI(
    base_url="https://api000.com/v1",
    api_key="sk-xxxxxxxxxxxxxxxx"
)

with open("recording.mp3", "rb") as f:
    transcript = client.audio.transcriptions.create(
        model="whisper-1",
        file=f,
        language="zh",
        prompt="这是一段关于零度API的介绍"  # 帮助识别专有名词
    )

print(transcript.text)

Python — 生成 SRT 字幕文件

with open("video.mp4", "rb") as f:
    srt_content = client.audio.transcriptions.create(
        model="whisper-1",
        file=f,
        response_format="srt",
        language="zh"
    )

with open("subtitles.srt", "w", encoding="utf-8") as f:
    f.write(srt_content)
print("✅ 字幕文件已生成: subtitles.srt")

响应示例

json 格式（默认）

{
  "text": "零度API 提供高性价比的人工智能推理服务，支持多种大语言模型。"
}

verbose_json 格式（含时间戳）

{
  "text": "零度API 提供...",
  "language": "chinese",
  "duration": 5.43,
  "segments": [
    {
      "id": 0,
      "start": 0.0,
      "end": 2.5,
      "text": "零度API 提供高性价比"
    }
  ]
}

支持的音频格式

格式	说明
`mp3`	最常用，推荐格式
`m4a`	iOS 录音默认格式
`wav`	无损，文件较大
`webm`	浏览器录音格式
`mp4`、`mpeg`、`mpga`	视频/音频文件

文件大小限制：25MB。如文件过大，建议先分割或压缩再上传。

创建转录(Whisper)

创建转录（Whisper）

请求参数

请求示例

cURL

Python

Python — 生成 SRT 字幕文件

响应示例

json 格式（默认）

verbose_json 格式（含时间戳）

支持的音频格式