跳转到主要内容

接口

POST /api/v1/music/stem
同步接口。 实时处理,最多需要 5 分钟。处理完成后直接返回结果(无需轮询)。 从已有音乐片段中分离人声轨道。可选择指定时间范围,仅处理特定人声片段。

请求参数

字段类型是否必填说明
clip_idstring必填要处理的音频片段 ID。通过 音频上传 获取(data.clipId),或使用生成任务完成后的 results[].id
vocal_start_sfloat处理片段的起始时间(秒)。默认 0
vocal_end_sfloat处理片段的结束时间(秒)。默认:完整片段。

响应

{
  "code": 0,
  "message": "ok",
  "request_id": "req-1710000000000",
  "data": {
    "id": "stem-abc123",
    "source_clip_id": "abc123def456",
    "status": "complete",
    "vocal_audio_url": "https://cdn.example.com/tob/stem/abc123_vocal.mp3",
    "vocal_start_s": 0,
    "vocal_end_s": 87.4
  }
}
字段类型说明
idstring人声分离任务 ID
source_clip_idstring原始片段 ID
statusstring成功时为 "complete"
vocal_audio_urlstring提取的人声音频文件 URL
vocal_start_sfloat实际处理的起始时间
vocal_end_sfloat实际处理的结束时间

示例

curl -X POST https://api.example.com/api/v1/music/stem \
  -H "Authorization: Bearer sk-mm-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "clip_id": "abc123def456",
    "vocal_start_s": 30.0,
    "vocal_end_s": 90.0
  }'
本接口返回的 vocal_audio_url 可作为 叠加人声 接口的 chop_sample_clip_id 参数使用。