Skip to content

火山引擎 图像生成 API 文档

请求格式

图像生成 API 支持 OpenAI 标准格式(推荐),同时也支持嵌套格式。嵌套格式的详细说明请参见文档末尾。

各模型支持的参数

Seedream 5.0 lite

Seedream 4.0–5.0 原生支持文本、单图和多图输入,可实现多图融合创作、图像编辑、组图生成等。Seedream 5.0 lite 此外支持联网搜索,可融合实时网络信息提升生图时效性(如天气、商品等)。

参数说明

参数名类型必填说明默认值取值范围/格式
promptstring用于生成图像的提示词,中英文均可。建议用简洁连贯的自然语言写明主体 + 行为 + 环境,可补充风格、色彩、光影、构图等。建议不超过 300 个汉字或 600 个英文单词-非空字符串。字数过多易导致模型忽略部分细节
imagestring/array第一张参考图像,用于图生图/多图融合。支持字符串格式(单张图像)或数组格式(多张图像,最多 10 张)-支持 URL(http://https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。图片格式:jpeg、png、webp、bmp、tiff、gif;图片文件大小:不超过 10 MB;总像素 ≤ 6000×6000;输入图宽高比 [1/16, 16]。数组格式示例:["url1", "url2", ...]多图输入说明:支持最多 10 张图,可通过 image 数组格式传入,或通过 imageimage2image3image10 等参数分别传入
image2string第二张参考图像(多图融合时使用)-image 参数要求
............-...
image10string第十张参考图像(多图融合时使用)-image 参数要求
sizestring输出尺寸。方式 1:分辨率关键词,并在 prompt 中描述宽高比/形状/用途,由模型判断具体像素。方式 2:直接指定宽高像素值(如 2048x2048)。两种方式不可混用2048x2048方式 1:2K3K。方式 2:总像素 [2560×1440=3686400, 3072×3072×1.1025≈10404496],宽高比 [1/16, 16]。详见下方推荐宽高像素值
output_formatstring生成图像的文件格式。Seedream 5.0 lite 支持 png/jpeg;4.5/4.0 仅支持 jpegpngpngjpeg
response_formatstring返回形式urlurl:返回图片下载链接;b64_json:返回 Base64 编码的 JSON
watermarkboolean是否在图片右下角添加「AI 生成」水印truetruefalse
streamboolean是否流式输出。为 true 时每生成一张即返回,可改善等待体验falsetruefalse
sequential_image_generationstring是否组图输出。auto 表示根据 prompt 生成多张内容关联的图;disabled 表示单图disabledautodisabled
sequential_image_generation_optionsobject组图选项,仅在 sequential_image_generationauto 时有效-{ "max_images": 4 },控制组图张数
toolsarray扩展能力。Seedream 5.0 lite 支持联网搜索,可传入 [{ "type": "web_search" }]-[{ "type": "web_search" }]。开启后会按需搜索互联网,提升时效性,但会增加时延
optimize_prompt_optionsobject提示词优化。5.0 lite/4.5 仅支持标准模式-{ "mode": "standard" }。4.0 可选 standardfast
providerobject调度配置。与其它模型一致,可包含 enable_image_base64enable_image_origin_data-服务商调度参数说明

分辨率与推荐宽高像素值

Seedream 5.0 lite 支持方式 1分辨率:2K3K(不支持 1K、4K)。方式 2总像素范围:[2560×1440=3686400, 3072×3072×1.1025≈10404496],宽高比 [1/16, 16]。

推荐宽高组合(Seedream 5.0 lite)

分辨率宽高比宽度高度总像素(约)
2K1:1204820484194304
2K3:4172823043981312
2K4:3230417283981312
2K16:9284816004556800
2K9:16160028484556800
2K3:2249616644153344
2K2:3166424964153344
2K21:9313613444214784
3K1:1307230729437184
3K3:4259234568957952
3K4:3345625928957952
3K16:9409623049437184
3K9:16230440969437184
3K3:2374424969345024
3K2:3249637449345024
3K21:9470420169483264

请求示例

文生图(单图)

json
{
  "model": "Doubao-Seedream-5.0-lite",
  "prompt": "充满活力的特写编辑肖像,模特眼神犀利,头戴雕塑感帽子,色彩拼接丰富,具有 Vogue 杂志封面的美学风格,中画幅拍摄,工作室灯光强烈。",
  "size": "2K",
  "output_format": "png",
  "watermark": false,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

图生图(单图输入单图输出)

json
{
  "model": "Doubao-Seedream-5.0-lite",
  "prompt": "保持模特姿势和液态服装的流动形状不变,将服装材质从银色金属改为完全透明的清水(或玻璃),光影从反射变为折射。",
  "image": "https://example.com/reference.png",
  "size": "2K",
  "output_format": "png",
  "watermark": false,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

多图融合(多图输入单图输出)

json
{
  "model": "Doubao-Seedream-5.0-lite",
  "prompt": "将图1的服装换为图2的服装",
  "image": [
    "https://example.com/photo1.png",
    "https://example.com/photo2.png"
  ],
  "sequential_image_generation": "disabled",
  "size": "2K",
  "output_format": "png",
  "watermark": false,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

文生组图(多图输出)

json
{
  "model": "Doubao-Seedream-5.0-lite",
  "prompt": "生成一组共4张连贯插画,核心为同一庭院一角的四季变迁,以统一风格展现四季独特色彩、元素与氛围",
  "size": "2K",
  "sequential_image_generation": "auto",
  "sequential_image_generation_options": { "max_images": 4 },
  "stream": false,
  "output_format": "png",
  "response_format": "url",
  "watermark": false,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

文生图 + 联网搜索(Seedream 5.0 lite)

json
{
  "model": "Doubao-Seedream-5.0-lite",
  "prompt": "制作一张上海未来5日的天气预报图,采用现代扁平化插画风格,清晰展示每日天气、温度和穿搭建议。整体为横向排版,标题为「上海未来5日天气预报」,包含5个等宽的垂直卡片。",
  "size": "2048x2048",
  "tools": [{ "type": "web_search" }],
  "output_format": "png",
  "response_format": "url",
  "watermark": false,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

Seedream 4.0 模型

参数说明

参数名类型必填说明默认值取值范围/格式
promptstring用于生成图像的提示词,中英文输入均可-非空字符串,最长不超过 800 字符。建议:除 "" 外不建议输入特殊的符号如 $;支持 prompt 中直接指定生图比例,模型会根据 size 字段智能判断生图宽高比
imagestring/array第一张参考图像,用于图生图。支持字符串格式(单张图像)或数组格式(多张图像,最多 10 张)-支持 URL(http://https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。图片格式:仅支持 JPEG、PNG 格式,建议使用 JPEG 格式;图片文件大小:最大 15 MB;图片分辨率:最大 4096*4096;输入图宽高比:(宽/高)范围:[1/3, 3]。数组格式示例:["url1", "url2", ...]["base64_1", "base64_2", ...]多图输入说明:支持最多输入 10 张图,可通过 image 数组格式传入,或通过 imageimage2image3...image10 等参数分别传入
image2string第二张参考图像(多图融合时使用)-image 参数要求
............-...
image10string第十张参考图像(多图融合时使用)-image 参数要求
sizestring/integer指定生成图像的尺寸信息,支持以下两种方式,不可混用。
方式 1:指定生成图像的分辨率,并在 prompt 中用自然语言描述图片宽高比、图片形状或图片用途,最终由模型判断生成图片的大小。可选值:1K2K4K
方式 2:指定生成图像的宽高像素值。总像素取值范围:[1280x720=921600, 4096x4096=16777216],宽高比取值范围:[1/16, 16]。需同时满足总像素取值范围和宽高比取值范围,其中总像素是对宽度和高度的像素乘积限制,而不是对宽度或高度的单独值进行限制。详见下方推荐宽高像素值
2048x2048方式 1:1K2K4K
方式 2:总像素范围 [921600, 16777216],宽高比范围 [1/16, 16]
widthinteger生成图像宽度,需同时传 widthheight 才会生效-宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高
heightinteger生成图像高度,需同时传 widthheight 才会生效-宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高
scalefloat文本描述影响的程度,该值越大代表文本描述影响程度越大,且输入图片影响程度越小0.5取值范围:[0, 1],精度:支持小数点后两位
force_singleboolean是否强制生成单图。若对延迟&价格敏感,建议使用该参数false布尔值。注意:生成的组图越多,耗时越久,且生成耗时会随图片数量增多而显著变长
min_ratiofloat生图结果的宽/高 ≥ min_ratio,如果智能选比例 < min_ratio,则用 min_ratio0.333 (1/3)取值范围:[1/16, 16)
max_ratiofloat生图结果的宽/高 ≤ max_ratio,如果智能选比例 > max_ratio,则用 max_ratio3取值范围:[1/16, 16)
optimize_prompt_optionsobject提示词优化配置参数-对象类型,包含以下可选字段:
- mode (string, 默认 standard): 设置提示词优化功能使用的模式。standard:标准模式,生成内容的质量更高,耗时较长;fast:快速模式,生成内容的耗时更短,质量一般
watermarkboolean是否在生成的图片中添加水印truefalse:不添加水印。
true:在图片右下角添加"AI生成"字样的水印标识
providerobject调度配置参数-对象类型,包含图像生成特有参数和服务商调度参数。

图像生成特有参数
- enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码
- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据

服务商调度参数:还支持 onlyordersortinput_price_rangeoutput_price_rangethroughput_rangelatency_rangeinput_length_rangeallow_filter_prompt_lengthignoreallow_fallbacks 等参数。

详细说明请参考:服务商调度参数说明

推荐宽高像素值

有效示例:1600x600

  • 总像素值 1600x600=960000,符合 [921600, 16777216] 的区间要求
  • 宽高比 1600/600=8/3,符合 [1/16, 16] 的区间要求,故该示例值有效

无效示例:800x800

  • 总像素值 800x800=640000,未达到 921600 的最低要求
  • 宽高 800/800=1,虽符合 [1/16, 16] 的区间要求,但因其未同时满足两项限制,故该示例值无效

推荐宽高组合

分辨率宽度高度宽高比总像素
1K102410241:11048576
2K204820481:14194304
2K230417284:33981312
2K249616643:24153344
2K2560144016:93686400
2K3024129621:93919104
4K409640961:116777216
4K469435204:316522880
4K499233283:216613376
4K5404304016:916428160
4K6198265621:916461888

请求示例

文生图示例

json
{
  "model": "Doubao-Seedream-4.0",
  "prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚",
  "size": "2K",
  "scale": 0.5,
  "force_single": false,
  "optimize_prompt_options": {
    "mode": "standard"
  },
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

图生图示例

json
{
  "model": "Doubao-Seedream-4.0",
  "prompt": "背景换成演唱会现场",
  "image": "https://example.com/reference-image.jpg",
  "scale": 0.6,
  "width": 2048,
  "height": 2048,
  "optimize_prompt_options": {
    "mode": "fast"
  },
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

Seedream 4.5 模型

参数说明

参数名类型必填说明默认值取值范围/格式
promptstring用于生成图像的提示词,中英文输入均可-非空字符串,最长不超过 800 字符。建议:除 "" 外不建议输入特殊的符号如 $;支持 prompt 中直接指定生图比例,模型会根据 size 字段智能判断生图宽高比
imagestring/array第一张参考图像,用于图生图。支持字符串格式(单张图像)或数组格式(多张图像,最多 10 张)-支持 URL(http://https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。图片格式:仅支持 JPEG、PNG 格式,建议使用 JPEG 格式;图片文件大小:最大 15 MB;图片分辨率:最大 4096*4096;输入图宽高比:(宽/高)范围:[1/3, 3]。数组格式示例:["url1", "url2", ...]["base64_1", "base64_2", ...]多图输入说明:支持最多输入 10 张图,可通过 image 数组格式传入,或通过 imageimage2image3...image10 等参数分别传入
image2string第二张参考图像(多图融合时使用)-image 参数要求
............-...
image10string第十张参考图像(多图融合时使用)-image 参数要求
sizestring/integer指定生成图像的尺寸信息,支持以下两种方式,不可混用。
方式 1:指定生成图像的分辨率,并在 prompt 中用自然语言描述图片宽高比、图片形状或图片用途,最终由模型判断生成图片的大小。可选值:2K4K
方式 2:指定生成图像的宽高像素值。总像素取值范围:[2560x1440=3686400, 4096x4096=16777216],宽高比取值范围:[1/16, 16]。需同时满足总像素取值范围和宽高比取值范围,其中总像素是对宽度和高度的像素乘积限制,而不是对宽度或高度的单独值进行限制。详见下方有效示例和无效示例
2048x2048方式 1:2K4K
方式 2:总像素范围 [3686400, 16777216],宽高比范围 [1/16, 16]
widthinteger生成图像宽度,需同时传 widthheight 才会生效-宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高
heightinteger生成图像高度,需同时传 widthheight 才会生效-宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高
scalefloat文本描述影响的程度,该值越大代表文本描述影响程度越大,且输入图片影响程度越小0.5取值范围:[0, 1],精度:支持小数点后两位
force_singleboolean是否强制生成单图。若对延迟&价格敏感,建议使用该参数false布尔值。注意:生成的组图越多,耗时越久,且生成耗时会随图片数量增多而显著变长
min_ratiofloat生图结果的宽/高 ≥ min_ratio,如果智能选比例 < min_ratio,则用 min_ratio0.333 (1/3)取值范围:[1/16, 16)
max_ratiofloat生图结果的宽/高 ≤ max_ratio,如果智能选比例 > max_ratio,则用 max_ratio3取值范围:[1/16, 16)
optimize_prompt_optionsobject提示词优化配置参数-对象类型,包含以下可选字段:
- mode (string, 默认 standard): 设置提示词优化功能使用的模式。standard:标准模式,生成内容的质量更高,耗时较长;fast:快速模式,生成内容的耗时更短,质量一般
watermarkboolean是否在生成的图片中添加水印truefalse:不添加水印。
true:在图片右下角添加"AI生成"字样的水印标识
providerobject调度配置参数-对象类型,包含图像生成特有参数和服务商调度参数。

图像生成特有参数
- enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码
- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据

服务商调度参数:还支持 onlyordersortinput_price_rangeoutput_price_rangethroughput_rangelatency_rangeinput_length_rangeallow_filter_prompt_lengthignoreallow_fallbacks 等参数。

详细说明请参考:服务商调度参数说明

推荐的宽高像素值

宽高比宽高像素值
1:12048x2048
4:32304x1728
3:41728x2304
16:92560x1440
9:161440x2560
3:22496x1664
2:31664x2496
21:93024x1296

请求示例

文生图示例

json
{
  "model": "Doubao-Seedream-4.5",
  "input": {
    "prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚"
  },
  "extra_body": {
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    },
    "size": "2K",
    "scale": 0.5,
    "force_single": false,
    "optimize_prompt_options": {
      "mode": "standard"
    }
  }
}

图生图示例

json
{
  "model": "Doubao-Seedream-4.5",
  "input": {
    "prompt": "背景换成演唱会现场",
    "image": "https://example.com/reference-image.jpg"
  },
  "extra_body": {
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    },
    "scale": 0.6,
    "width": 2048,
    "height": 2048,
    "optimize_prompt_options": {
      "mode": "fast"
    }
  }
}

即梦图片生成 4.0 模型

参数说明

参数名类型必填说明默认值取值范围/格式
promptstring用于生成图像的提示词,中英文输入均可-非空字符串,最长不超过 800 字符。建议:除 "" 外不建议输入特殊的符号如 $;支持 prompt 中直接指定生图比例,模型会根据 size 字段智能判断生图宽高比
imagestring/array第一张参考图像,用于图生图。支持字符串格式(单张图像)或数组格式(多张图像,最多 10 张)-支持 URL(http://https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。图片格式:仅支持 JPEG、PNG 格式,建议使用 JPEG 格式;图片文件大小:最大 15 MB;图片分辨率:最大 4096*4096;输入图宽高比:(宽/高)范围:[1/3, 3]。数组格式示例:["url1", "url2", ...]["base64_1", "base64_2", ...]多图输入说明:支持最多输入 10 张图,可通过 image 数组格式传入,或通过 imageimage2image3...image10 等参数分别传入
image2string第二张参考图像(多图融合时使用)-image 参数要求
............-...
image10string第十张参考图像(多图融合时使用)-image 参数要求
sizeinteger生成图片的面积,模型会根据用户 prompt 意图智能判断生图宽高比4194304 (2048*2048,即 2K 分辨率)取值范围:[1024*1024, 4096*4096],可生成 1K 到 4K 分辨率图像。
widthinteger生成图像宽度,需同时传 widthheight 才会生效-宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高
heightinteger生成图像高度,需同时传 widthheight 才会生效-宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高
scalefloat文本描述影响的程度,该值越大代表文本描述影响程度越大,且输入图片影响程度越小0.5取值范围:[0, 1],精度:支持小数点后两位
force_singleboolean是否强制生成单图。若对延迟&价格敏感,建议使用该参数false布尔值。注意:生成的组图越多,耗时越久,且生成耗时会随图片数量增多而显著变长
min_ratiofloat生图结果的宽/高 ≥ min_ratio,如果智能选比例 < min_ratio,则用 min_ratio0.333 (1/3)取值范围:[1/16, 16)
max_ratiofloat生图结果的宽/高 ≤ max_ratio,如果智能选比例 > max_ratio,则用 max_ratio3取值范围:[1/16, 16)
providerobject调度配置参数-对象类型,包含图像生成特有参数和服务商调度参数。

图像生成特有参数
- enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码
- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据

服务商调度参数:还支持 onlyordersortinput_price_rangeoutput_price_rangethroughput_rangelatency_rangeinput_length_rangeallow_filter_prompt_lengthignoreallow_fallbacks 等参数。

详细说明请参考:服务商调度参数说明

推荐宽高组合

1K 分辨率

  • 1024x1024 (1:1)

2K 分辨率

  • 2048x2048 (1:1)
  • 2304x1728 (4:3)
  • 2496x1664 (3:2)
  • 2560x1440 (16:9)
  • 3024x1296 (21:9)

4K 分辨率

  • 4096x4096 (1:1)
  • 4694x3520 (4:3)
  • 4992x3328 (3:2)
  • 5404x3040 (16:9)
  • 6198x2656 (21:9)

请求示例

文生图示例

json
{
  "model": "即梦图片生成 4.0",
  "prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚",
  "size": 4194304,
  "scale": 0.5,
  "force_single": false,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

图生图示例

json
{
  "model": "即梦图片生成 4.0",
  "prompt": "背景换成演唱会现场",
  "image": "https://example.com/reference-image.jpg",
  "scale": 0.6,
  "width": 2048,
  "height": 2048,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

即梦文生图 3.1 模型

参数说明

参数名类型必填说明默认值取值范围/格式
promptstring用于生成图像的提示词,中英文均可输入。建议长度<=120字符,最长不超过800字符,prompt过长有概率出图异常或不生效-非空字符串,最长不超过 800 字符
use_pre_llmbool开启文本扩写,会针对输入prompt进行扩写优化,如果输入prompt较短建议开启,如果输入prompt较长建议关闭true布尔值
seedint随机种子,作为确定扩散初始状态的基础,默认-1(随机)。若随机种子为相同正整数且其他参数均一致,则生成图片极大概率效果一致-1整数,-1 表示随机
widthint生成图像宽度,需同时传 widthheight 才会生效。系统默认生成 1328 * 1328 的图像。宽高比在 1:3 到 3:1 之间,宽高乘积在 [512*512, 2048*2048] 之间。详见下方推荐宽高组合-宽高乘积在 [512*512, 2048*2048],且宽高比在 [1/3, 3] 之间
heightint生成图像高度,需同时传 widthheight 才会生效。系统默认生成 1328 * 1328 的图像。宽高比在 1:3 到 3:1 之间,宽高乘积在 [512*512, 2048*2048] 之间。详见下方推荐宽高组合-宽高乘积在 [512*512, 2048*2048],且宽高比在 [1/3, 3] 之间

推荐宽高组合

分辨率宽度高度宽高比
标清 1K132813281:1
标清 1K147211044:3
标清 1K158410563:2
标清 1K166493616:9
标清 1K201686421:9
高清 2K204820481:1
高清 2K230417284:3
高清 2K249616643:2
高清 2K2560144016:9
高清 2K3024129621:9

请求示例

文生图示例

json
{
  "model": "即梦文生图 3.1",
  "prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚",
  "use_pre_llm": true,
  "seed": -1,
  "width": 1328,
  "height": 1328
}

即梦文生图 3.0 模型

参数说明

参数名类型必填说明默认值取值范围/格式
promptstring用于生成图像的提示词,中英文均可输入。建议长度<=120字符,最长不超过800字符,prompt过长有概率出图异常或不生效-非空字符串,最长不超过 800 字符
use_pre_llmbool开启文本扩写,会针对输入prompt进行扩写优化,如果输入prompt较短建议开启,如果输入prompt较长建议关闭true布尔值
seedint随机种子,作为确定扩散初始状态的基础,默认-1(随机)。若随机种子为相同正整数且其他参数均一致,则生成图片极大概率效果一致-1整数,-1 表示随机
widthint生成图像宽度,需同时传 widthheight 才会生效。系统默认生成 1328 * 1328 的图像。宽高比在 1:3 到 3:1 之间,宽高乘积在 [512*512, 2048*2048] 之间。详见下方推荐宽高组合-宽高乘积在 [512*512, 2048*2048],且宽高比在 [1/3, 3] 之间
heightint生成图像高度,需同时传 widthheight 才会生效。系统默认生成 1328 * 1328 的图像。宽高比在 1:3 到 3:1 之间,宽高乘积在 [512*512, 2048*2048] 之间。详见下方推荐宽高组合-宽高乘积在 [512*512, 2048*2048],且宽高比在 [1/3, 3] 之间

推荐宽高组合

分辨率宽度高度宽高比
标清 1K132813281:1
标清 1K147211044:3
标清 1K158410563:2
标清 1K166493616:9
标清 1K201686421:9
高清 2K204820481:1
高清 2K230417284:3
高清 2K249616643:2
高清 2K2560144016:9
高清 2K3024129621:9

请求示例

文生图示例

json
{
  "model": "即梦文生图 3.0",
  "prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚",
  "use_pre_llm": true,
  "seed": -1,
  "width": 1328,
  "height": 1328
}

响应示例

所有模型都返回标准化的响应格式,示例如下:

json
{
  "created": 1736123456,
  "data": [
    {
      "url": "https://example.com/generated-image-1.jpg",
      "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."  // 可选字段
    },
    {
      "url": "https://example.com/generated-image-2.jpg"
    }
  ],
  "usage": {
    "total_tokens": 0,
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": {
      "text_tokens": 0,
      "image_tokens": 0
    },
    "image_count": 2
  },
  "provider": "火山方舟",
  "model": "即梦图片生成 4.0",
  "origin_data": { ... }  // 可选字段
}

说明

  • data[].b64_json 字段:仅在 extra_body.provider.enable_image_base64 设置为 true 时返回。默认值为 false,此时响应中不包含 b64_json 字段
  • origin_data 字段:包含服务商 API 的完整原始响应数据。可通过设置 extra_body.provider.enable_image_origin_data 参数控制是否返回此字段(默认值为 false,不会返回)。如需查看不同模型的原始响应格式,请在请求中设置 extra_body.provider.enable_image_origin_data: true,然后在响应的 origin_data 字段中查看服务商返回的原始数据

响应参数说明

成功响应

参数名类型必填说明取值范围/格式
createdinteger响应创建时间,Unix 时间戳(秒)整数,Unix 时间戳(秒)
dataarray生成的图像数据数组数组对象,每个元素包含图像信息
data[].urlstring生成的图像 URLURL 字符串
data[].b64_jsonstring图像的 Base64 编码数据。控制参数:仅在请求参数 extra_body.provider.enable_image_base64 设置为 true 时返回此字段。默认值为 false,此时不返回此字段Base64 编码的字符串
usageobject使用情况统计对象类型
usage.total_tokensinteger总 token 数整数,图像生成场景通常为 0
usage.input_tokensinteger输入 token 数整数,图像生成场景通常为 0
usage.output_tokensinteger输出 token 数整数,图像生成场景通常为 0
usage.input_tokens_detailsobject输入 token 详情对象类型
usage.input_tokens_details.text_tokensinteger文本 token 数整数,图像生成场景通常为 0
usage.input_tokens_details.image_tokensinteger图像 token 数整数,图像生成场景通常为 0
usage.image_countinteger生成的图像数量整数,大于等于 1
providerstring服务商名称字符串,如"火山方舟"
modelstring模型名称字符串,如"Doubao-Seedream-4.0"
origin_dataobject服务商的原始响应数据。控制参数:仅在请求参数 extra_body.provider.enable_image_origin_data 设置为 true 时返回此字段。默认值为 false,此时不返回此字段对象类型,包含服务商 API 的完整原始响应

错误响应

当 API 调用失败时,会返回服务商的原始错误信息。

错误响应格式

  • 如果响应是 JSON 格式,返回完整的错误 JSON 对象
  • 如果响应是文本格式,返回错误文本
  • 如果无法解析,返回 HTTP {status_code}

错误响应示例

json
{
  "error": {
    "message": "Invalid parameter",
    "code": "invalid_param"
  }
}

注意事项

  1. 模型参数限制:不同模型支持的参数不同。对于不在白名单中的参数,系统会记录警告日志,但不会过滤,仍会传递给服务商 API 进行最终判断

  2. 参数透传:所有参数(包括 sizewidthheightscale 等)都会透传给服务商 API,由服务商进行校验和判断

  3. 面积和宽高参数使用规则

    • 文生图场景:面积(size)和宽高(width/height)需要 2 选 1 传入,都不传则默认面积取 2048*2048,即生成 2K 分辨率图像且模型智能判断宽高比
    • 面积和宽高同时输入时,优先使用宽高
    • 只传面积,模型会根据用户 prompt 意图智能判断生图宽高比
    • 图生图场景:结合用户 prompt 意图、参考图尺寸,由模型智能判断生图宽高比
  4. 输入输出限制

    • 输入图要求
      • 图片格式:仅支持 JPEG、PNG 格式,建议使用 JPEG 格式
      • 图片文件大小:最大 15 MB,支持最多输入 10 张图(通过 imageimage2image3...image10 等参数分别传入,每张图片需单独传入对应参数)
      • 图片分辨率:最大 4096*4096
      • 输入图宽高比:(宽/高)范围:[1/3, 3]
    • 输出图说明
      • 输出图宽高规则:参考 widthheight 参数描述
      • 输出图数量:输出图会以列表形式返回(data.binary_data_base64 数组),最大输出图数量 = 15 - 输入图数量
      • 输出图格式:图片以 Base64 编码格式返回在 data.binary_data_base64 数组中,同时提供 data.binary_list URI 列表
      • 延迟说明:输出图片的分辨率越大、输出图片数量越多、输入图片数量越多,延迟增加越明显
      • 计费说明:1 次调用可能输出多张图片,根据输出图片张数进行计费,默认根据 prompt 理解意图判断输出图片数量。成本信息在 data.comfyui_cost 字段中返回
  5. 输入图片数量建议

    • 输入图片建议控制在 6 张图片以内,图片过多,参考效果会降低
  6. 组图生成建议

    • 如需稳定的组图输出效果,建议 prompt 控制组图数量在 9 张及以内
    • 生成组图时,建议 prompt 明确指明图片分辨率或直接传参具体宽高值,避免模型生成组图分辨率不一致导致接口报错
  7. 未知参数处理:未知参数会被记录警告日志,但仍会传递给服务商 API,由服务商判断是否返回错误

  8. 服务商调度参数:关于 provider 参数的完整说明和使用示例,请参考服务商调度参数说明

嵌套格式(备选)

除了 OpenAI 标准格式,API 也支持嵌套格式。如果使用嵌套格式,参数分配规则如下:

  • 放入 input 对象的参数promptnegative_promptimageimage2image3 等图片相关输入参数
  • 放入 extra_body 对象的参数nsizewidthheightscaleforce_singleoptimize_prompt_optionsuse_pre_llmseed 等生成参数,以及 provider 对象

嵌套格式完整示例

json
{
  "model": "Doubao-Seedream-4.0",
  "input": {
    "prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚"
  },
  "extra_body": {
    "size": "2K",
    "scale": 0.5,
    "force_single": false,
    "optimize_prompt_options": {
      "mode": "standard"
    },
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    }
  }
}

注意:嵌套格式与 OpenAI 标准格式功能完全等价,系统会自动检测并处理。推荐使用 OpenAI 标准格式以获得更好的兼容性。