主题模式
阿里云百炼 视频生成 API 文档
支持的模型
| 模型名称 | 类型 | 说明 |
|---|---|---|
Wan2.6-T2V | 文生视频 | 通义万相文生视频模型,根据文本提示词生成视频 |
Wan2.6-I2V | 图生视频 | 通义万相图生视频模型,根据图片和文本提示词生成视频 |
Wan2.6-R2V | 视频生视频 | 通义万相视频生视频模型,根据参考视频和文本提示词生成视频 |
请求格式
支持两种输入格式:标准格式和服务商原生格式。
标准格式参数
通用参数
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
model | string | 是 | 模型名称 | Wan2.6-T2V、Wan2.6-I2V、Wan2.6-R2V |
prompt | string | 是 | 文本提示词,描述要生成的视频内容 | 非空字符串 |
seconds | integer | 否 | 视频时长(秒) | 正整数 |
size | string | 否 | 视频尺寸 | 见下方支持的尺寸列表 |
prompt_extend | boolean | 否 | 是否启用提示词扩展 | true、false,默认 true |
shot_type | string | 否 | 镜头类型 | single、multi,默认 multi |
audio_url | string | 否 | 音频 URL,用于音频驱动视频生成 | 有效的音频 URL |
callback_url | string | 否 | 任务结果回调地址 | 有效的 URL 地址 |
图生视频参数(Wan2.6-I2V)
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
img_url | string | 是 | 输入图片 URL | 有效的图片 URL |
视频生视频参数(Wan2.6-R2V)
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
reference_video_urls | array | 是 | 参考视频 URL 列表 | 有效的视频 URL 数组 |
支持的视频尺寸
720P 尺寸:
1280*720(横屏)720*1280(竖屏)960*960(方形)1088*832832*1088
1080P 尺寸:
1920*1080(横屏)1080*1920(竖屏)1440*1440(方形)1632*12481248*1632
注意:
size参数支持x或*作为分隔符,如1280x720会自动转换为1280*720。
服务商原生格式参数
本 API 支持服务商原生格式,具体参数说明请参考官方文档:
| 模型类型 | 官方文档 |
|---|---|
| 文生视频 | 阿里云百炼 文生视频 API |
| 图生视频 | 阿里云百炼 图生视频 API |
| 视频生视频 | 阿里云百炼 视频生视频 API |
优先级:服务商原生格式 > 标准格式。如果同时传入原生格式和标准格式参数,将使用原生格式。
请求示例
1. 文生视频(Wan2.6-T2V)
json
{
"model": "Wan2.6-T2V",
"prompt": "一只可爱的猫咪在草地上玩耍,阳光明媚",
"size": "1280*720",
"seconds": 5,
"prompt_extend": true,
"shot_type": "multi"
}2. 图生视频(Wan2.6-I2V)
json
{
"model": "Wan2.6-I2V",
"prompt": "一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由他的rap构成,没有其他对话或杂音。",
"img_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/wpimhv/rap.png",
"audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/ozwpvi/rap.mp3",
"size": "720P",
"seconds": 5
}3. 视频生视频(Wan2.6-R2V)
json
{
"model": "Wan2.6-R2V",
"prompt": "character1一边喝奶茶,一边随着音乐即兴跳舞。",
"reference_video_urls": ["https://cdn.wanx.aliyuncs.com/static/demo-wan26/vace.mp4"],
"size": "1280*720",
"seconds": 5
}4. 音频驱动视频
json
{
"model": "Wan2.6-T2V",
"prompt": "一个人随着音乐节奏跳舞",
"audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/ozwpvi/rap.mp3",
"size": "1080*1920",
"seconds": 5
}响应格式
任务提交响应
json
{
"id": "task_abc123",
"status": "pending",
"created_at": "2025-01-13T10:00:00.000000Z",
"model": "Wan2.6-T2V",
"seconds": 5,
"size": "1280*720"
}任务完成响应
json
{
"created": 1736758800,
"data": [
{
"url": "https://example.com/generated-video.mp4",
"duration": 10.0
}
],
"usage": {
"total_tokens": 0,
"input_tokens": 0,
"output_tokens": 0,
"video_count": 1,
"input_duration_seconds": 0,
"output_duration_seconds": 10.0,
"duration_seconds": 10.0
},
"provider": "阿里云百炼",
"model": "Wan2.6-T2V",
"origin_data": { ... }
}响应参数说明
| 参数名 | 类型 | 说明 |
|---|---|---|
created | integer | 响应创建时间,Unix 时间戳(秒) |
data | array | 生成的视频数据数组 |
data[].url | string | 生成的视频 URL |
data[].duration | float | 视频时长(秒) |
data[].b64_json | string | 视频的 Base64 编码(可选) |
usage.video_count | integer | 生成的视频数量 |
usage.input_duration_seconds | float | 输入视频时长(秒),文生视频和图生视频为 0,视频生视频为参考视频时长 |
usage.output_duration_seconds | float | 输出视频时长(秒) |
usage.duration_seconds | float | 总视频时长(秒),用于计费,计算公式:input_duration_seconds + output_duration_seconds |
provider | string | 服务商名称 |
model | string | 模型名称 |
origin_data | object | 服务商原始响应(可选) |
任务状态
| 状态 | 说明 |
|---|---|
pending | 任务排队中 |
processing | 任务处理中 |
completed | 任务完成 |
failed | 任务失败 |
canceled | 任务取消 |
查询任务
| 网络协议 | 请求地址 | 请求方法 | 请求格式 | 响应格式 |
|---|---|---|---|---|
| https | /videos/{task_id} | GET | - | application/json |
请求头
| 字段 | 值 | 描述 |
|---|---|---|
| Authorization | Bearer | 鉴权信息 |
请求路径参数
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
task_id | string | 是 | 任务 ID,创建任务时返回的 id 字段 |
查询参数(可选)
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
provider | string | 否 | 服务商名称,可选。如果任务不在缓存中可加快查询 |
响应体(任务进行中)
json
{
"id": "task_abc123",
"status": "processing",
"created_at": "2025-01-13T10:00:00.000000Z",
"model": "Wan2.6-T2V"
}响应体(任务完成)
json
{
"id": "task_abc123",
"status": "completed",
"created_at": "2025-01-13T10:00:00.000000Z",
"completed_at": "2025-01-13T10:03:00.000000Z",
"model": "Wan2.6-T2V",
"video_url": "https://example.com/output.mp4",
"usage": {
"seconds": 5.0,
"video_count": 1,
"size": "1280*720"
},
"raw_response": { ... }
}响应参数说明
| 字段 | 类型 | 说明 |
|---|---|---|
id | string | 任务 ID |
status | string | 任务状态:pending(等待中)、processing(处理中)、completed(完成)、failed(失败) |
created_at | string | 任务创建时间 |
completed_at | string | 任务完成时间(仅完成时返回) |
model | string | 模型名称 |
video_url | string | 生成的视频 URL(仅完成时返回) |
usage.seconds | float | 视频时长(秒) |
usage.video_count | int | 生成的视频数量 |
usage.size | string | 视频尺寸 |
raw_response | object | 服务商原始响应 |
error | string | 错误信息(仅失败时返回) |
注意事项
异步任务:视频生成是异步任务,提交后返回任务 ID,需要轮询查询任务状态。
模型选择:
- 文生视频使用
Wan2.6-T2V,只需prompt参数 - 图生视频使用
Wan2.6-I2V,需要prompt+img_url参数 - 视频生视频使用
Wan2.6-R2V,需要prompt+reference_video_urls参数
- 文生视频使用
尺寸格式:
size参数中的分隔符x会自动转换为*,如1280x720→1280*720。时长参数:使用
seconds参数指定视频时长。默认值:
prompt_extend: 默认trueshot_type: 默认multi
计费说明:计费按
duration_seconds计算,即input_duration_seconds + output_duration_seconds。对于视频生视频,输入参考视频也会计入时长。参数透传:未知参数不会被过滤,会透传给服务商 API。
格式优先级:服务商原生格式优先于标准格式。如果同时传入原生格式和标准格式参数,将使用原生格式。
官方文档: