音频克隆接口

接口描述

通过提供的音频和目标文本,克隆生成新的音频文件,支持自定义音色和文本内容。仅支持 WAV(16bit)、MP3(MPEG-1/MPEG-2)、M4A 格式,采样率需 ≥16000Hz,音频需包含 5–30 秒的连续语音,文件大小不超过 8MB。

克隆音频处理说明:

1. 处理时间较长:克隆音频的时间会根据文本长度决定,通常3000字大约需要1分30秒左右。2. 处理方式:可以通过提供的回调地址,在音频处理完成后自动接收通知。3. 测试:若是测试用途,也可以不填回调地址,通过查询音频信息接口获取处理状态。4. 注意:如果同时体验的人较多,也可能会导致处理时间变长。

请求方式

POST https://dlapi.tzaiapp.com/api/cloneAudio

请求参数
Header 参数
参数名 类型 是否必填 描述
Authorization string 身份验证令牌 (测试: a2190c3bf1652afb1dd1019a48079e67) 商用请联系商务获取
X-API-Key string API 密钥 (测试: 7672f6f065bd7c77251e2401f3547b5a) 商用请联系商务获取
Body 参数
参数名 类型 是否必填 描述
audioBase64 string 音频文件(Base64 编码,去掉头部信息,如 data:audio/wav;base64,)
targetTexts string 要生成音频的文本内容
cid string 默认传 1
返回参数
参数名 类型 描述
status int 状态码:200(成功),400(参数认证失败),500(服务器错误)
audioOldId int 音频ID
message string 处理信息,例如“音频正在处理中...”
返回示例
{
  "status": 200,
  "audioOldId": 12345,
  "message": "音频正在处理中..."
}

音频查询接口

接口描述

根据音频克隆返回音频ID查询相关信息。

请求方式

POST https://dlapi.tzaiapp.com/api/AudioInfo

请求参数
Header 参数
参数名 类型 是否必填 描述
Authorization string 身份验证令牌 (测试: a2190c3bf1652afb1dd1019a48079e67) 商用请联系商务获取
X-API-Key string API 密钥 (测试: 7672f6f065bd7c77251e2401f3547b5a) 商用请联系商务获取
Body 参数
参数名 类型 是否必填 描述
audioOldId string 音频克隆接口返回的音频ID
返回参数
参数名 类型 描述
status int 状态码:200(成功),400(参数认证失败),500(服务器错误)
audioAddr string 代理商传入的音频地址
cloneAudioAddr string 克隆后音频地址
audioOldId int 音频ID
time string 音频创建时间
返回示例
{
  "status": 200,
  "audioAddr": "https://example.com/original/audio.wav",
  "cloneAudioAddr": "https://example.com/cloned/audio.wav",
  "id": 12345,
  "time": "2025-04-10 12:00:00"
}