DeepImage¶
DeepImage 是 DeepExtension 的一个子模块,用于使用图像模型。支持任意比例的图像生成,包括 1:1、9:16、16:9 等比例。支持文生图、图生图、图生图+等功能。
DeepImage 有何优势¶
- 任意比例图像生成:原生支持 1:1、9:16、16:9 及任意自定义分辨率,无需裁剪即可输出高质量画面。
- 文生图 / 图生图 / 图生图+ 一体化:在同一画布完成文本到图像、图像到图像以及“图像+文本”混合生成,无需切换工具。
- 自定义模型即插即用:可直接加载本地或云端 PEFT 检查点(LoRA、DyLoRA 等),无需合并即可推理;模型列表自动标注“定制模型”或“第三方模型”,一眼区分。
- 批量生成:一次提示即可生成最多 4 张变体,并实时预览;支持对比不同模型生成结果。
DeepImage 注意事项¶
- 确保使用的图像模型与 DeepImage 兼容,建议使用最新版本的模型。
- 对于 训练模型,其对应的 定制模型(Customized Model) 在合并后,理论上应该生成相同的推理结果。
- 为了获得最佳效果,建议使用详细而准确的提示词,避免使用模糊或不具体的描述。
- 可以通过对比不同模型生成结果来选择最优模型。
- 比例可以使用上传图片的第一个图片的比例,也可以自定义比例。
典型用途¶
本模块核心功能是基于扩散模型技术,提供多种模式的图像生成与转换能力,旨在服务于模型评测、内容增强及创意生成等专业场景。
1. 文生图¶
功能描述 此功能实现了从文本语义到视觉内容的端到端生成。系统通过解析自然语言提示词,在潜在空间中合成与之匹配的像素级图像。
操作流程
-
输入提示词:在“提示词”文本框中输入对图像的具体描述。推荐使用结构清晰、细节丰富的语句(例如:“一位宇航员骑马穿越秋日森林,电影光效,超现实主义风格”)。
-
执行生成:点击 【开始生成】 按钮提交任务至渲染队列,生成结果将显示于输出区域。
典型应用场景 - 创意原型快速构建与视觉内容自动化生成。 - 验证模型对语义多样性与复杂场景的还原能力。
2. 图生图¶
功能描述 基于输入图像进行内容衍生、风格迁移或局部重建。系统将源图像作为初始化条件,在生成过程中融合语义与结构信息,输出多样化变体。
操作流程
1. **上传基准图像**:通过界面左下角 **【上传图像】** 加载参考图像。
2. **设置生成数量**:通过 **“生成图像数量/比例”** 参数控制单次任务输出的图像总数,用于批量生成或多结果筛选。
3. **执行生成**:点击 **【开始生成】**,系统将基于输入图像生成指定数量的衍生结果。
典型应用场景
- 基于同一构图生成多风格变体,用于A/B测试或内容延展。
- 在保留主体结构的前提下批量生成背景、材质或色调的替代方案。
3. 增强图生图¶
功能描述 融合图像与文本双条件输入,实现对生成结果的精细化控制。图像作为结构与内容的基底,文本作为语义修饰与风格引导,共同作用于生成过程。
操作流程
1. **输入双条件**:
- 上传基准图像作为视觉参考。
- 在提示词框中输入希望调整的内容或风格指令(例如:“替换天空为黄昏场景,加入飞鸟”)。
2. **执行与迭代**:
- 点击 **【开始生成】** 获取初步结果。
- 生成结果区域提供以下操作选项:
- **【保存】**:将符合要求的图像归档至项目或本地。
- **【引用】**:将当前生成图设为下一轮生成的基准图像,实现渐进式优化与视觉链路迭代。
- **【删除】**:移除不满意结果,维持工作流清晰。
典型应用场景
- 基于初始概念图进行多轮细化,逐步接近目标视觉表达。
- 角色设计、场景构建等需要连续视觉演进的创作任务。
DeepExtension — 让提示词更精准,模型管理更企业级