POST
创建转录(Whisper)
POST /v1/audio/transcriptions — 音频转文字
创建转录(Whisper)
将音频文件转录为文本,支持中文、英文、日文等 57 种语言。
POST
https://api000.com/v1/audio/transcriptions
Content-Type: multipart/form-data(文件上传接口)
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
file |
file | 必填 | 音频文件,最大 25MB,支持 mp3/mp4/m4a/wav/webm 等 |
model |
string | 必填 | 模型 ID,使用 whisper-1 |
language |
string | 可选 | 音频语言(ISO 639-1,如 zh、en),提供可提升精度 |
prompt |
string | 可选 | 辅助提示词,帮助识别专有名词、缩写词等 |
response_format |
string | 可选 | 返回格式:json(默认)、text、srt(字幕)、vtt(字幕)、verbose_json |
temperature |
number | 可选 | 采样温度 0~1,默认 0 |
请求示例
cURL
curl https://api000.com/v1/audio/transcriptions \
-H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
-F file="@recording.mp3" \
-F model="whisper-1" \
-F language="zh" \
-F response_format="json"
Python
from openai import OpenAI
client = OpenAI(
base_url="https://api000.com/v1",
api_key="sk-xxxxxxxxxxxxxxxx"
)
with open("recording.mp3", "rb") as f:
transcript = client.audio.transcriptions.create(
model="whisper-1",
file=f,
language="zh",
prompt="这是一段关于零度API的介绍" # 帮助识别专有名词
)
print(transcript.text)
Python — 生成 SRT 字幕文件
with open("video.mp4", "rb") as f:
srt_content = client.audio.transcriptions.create(
model="whisper-1",
file=f,
response_format="srt",
language="zh"
)
with open("subtitles.srt", "w", encoding="utf-8") as f:
f.write(srt_content)
print("✅ 字幕文件已生成: subtitles.srt")
响应示例
json 格式(默认)
{
"text": "零度API 提供高性价比的人工智能推理服务,支持多种大语言模型。"
}
verbose_json 格式(含时间戳)
{
"text": "零度API 提供...",
"language": "chinese",
"duration": 5.43,
"segments": [
{
"id": 0,
"start": 0.0,
"end": 2.5,
"text": "零度API 提供高性价比"
}
]
}
支持的音频格式
| 格式 | 说明 |
|---|---|
mp3 |
最常用,推荐格式 |
m4a |
iOS 录音默认格式 |
wav |
无损,文件较大 |
webm |
浏览器录音格式 |
mp4、mpeg、mpga |
视频/音频文件 |
文件大小限制:25MB。如文件过大,建议先分割或压缩再上传。