零度API 文档

Realtime (实时语音、对话)

Realtime (实时语音、对话)

Realtime API 支持低延迟的实时语音对话,适合构建语音助手、实时翻译等场景。

注意: Realtime API 采用 WebSocket 长连接,不同于普通 HTTP 接口。使用高级语音模式(Advanced Voice)的对话,以单次通话计费并一次性扣费


接入说明

Realtime API 目前基于 OpenAI Realtime 协议,请参考官方文档接入:

接入时将 WebSocket 地址的域名部分替换为 api000.com 即可。


连接示例

import WebSocket from "ws";

const ws = new WebSocket(
  "wss://api000.com/v1/realtime?model=gpt-4o-realtime-preview",
  {
    headers: {
      Authorization: "Bearer sk-xxxxxxxxxxxxxxxx",
      "OpenAI-Beta": "realtime=v1",
    },
  }
);

ws.on("open", () => {
  ws.send(JSON.stringify({
    type: "session.update",
    session: {
      voice: "alloy",
      instructions: "你是一个有帮助的中文语音助手。",
      turn_detection: { type: "server_vad" },
    },
  }));
});

ws.on("message", (data) => {
  const event = JSON.parse(data.toString());
  console.log("收到事件:", event.type);
});

支持的模型

模型 说明
gpt-4o-realtime-preview GPT-4o 实时语音版
gpt-4o-mini-realtime-preview 低成本实时语音版

计费说明

Realtime API 以每次通话为单位计费,开始通话后将一次性扣除本次对话费用。请在调用前确认账户有足够余额。

零度API 文档