DeepImage¶

DeepImage 是 DeepExtension 的一个子模块，用于使用图像模型。支持任意比例的图像生成，包括 1:1、9:16、16:9 等比例。支持文生图、图生图、图生图+等功能。

DeepImage 有何优势¶

任意比例图像生成：原生支持 1:1、9:16、16:9 及任意自定义分辨率，无需裁剪即可输出高质量画面。
文生图 / 图生图 / 图生图+ 一体化：在同一画布完成文本到图像、图像到图像以及“图像+文本”混合生成，无需切换工具。
自定义模型即插即用：可直接加载本地或云端 PEFT 检查点（LoRA、DyLoRA 等），无需合并即可推理；模型列表自动标注“定制模型”或“第三方模型”，一眼区分。
批量生成：一次提示即可生成最多 4 张变体，并实时预览；支持对比不同模型生成结果。

DeepImage 注意事项¶

确保使用的图像模型与 DeepImage 兼容，建议使用最新版本的模型。
对于 训练模型，其对应的 定制模型（Customized Model） 在合并后，理论上应该生成相同的推理结果。
为了获得最佳效果，建议使用详细而准确的提示词，避免使用模糊或不具体的描述。
可以通过对比不同模型生成结果来选择最优模型。
比例可以使用上传图片的第一个图片的比例，也可以自定义比例。

典型用途¶

本模块核心功能是基于扩散模型技术，提供多种模式的图像生成与转换能力，旨在服务于模型评测、内容增强及创意生成等专业场景。

1. 文生图¶

功能描述 此功能实现了从文本语义到视觉内容的端到端生成。系统通过解析自然语言提示词，在潜在空间中合成与之匹配的像素级图像。

操作流程

输入提示词：在“提示词”文本框中输入对图像的具体描述。推荐使用结构清晰、细节丰富的语句（例如：“一位宇航员骑马穿越秋日森林，电影光效，超现实主义风格”）。
执行生成：点击 【开始生成】 按钮提交任务至渲染队列，生成结果将显示于输出区域。

典型应用场景 - 创意原型快速构建与视觉内容自动化生成。 - 验证模型对语义多样性与复杂场景的还原能力。

2. 图生图¶

功能描述 基于输入图像进行内容衍生、风格迁移或局部重建。系统将源图像作为初始化条件，在生成过程中融合语义与结构信息，输出多样化变体。

操作流程

1.  **上传基准图像**：通过界面左下角 **【上传图像】** 加载参考图像。

2.  **设置生成数量**：通过 **“生成图像数量/比例”** 参数控制单次任务输出的图像总数，用于批量生成或多结果筛选。

3.  **执行生成**：点击 **【开始生成】**，系统将基于输入图像生成指定数量的衍生结果。

典型应用场景

- 基于同一构图生成多风格变体，用于A/B测试或内容延展。

- 在保留主体结构的前提下批量生成背景、材质或色调的替代方案。

3. 增强图生图¶

功能描述 融合图像与文本双条件输入，实现对生成结果的精细化控制。图像作为结构与内容的基底，文本作为语义修饰与风格引导，共同作用于生成过程。

操作流程

1.  **输入双条件**：

    - 上传基准图像作为视觉参考。

    - 在提示词框中输入希望调整的内容或风格指令（例如：“替换天空为黄昏场景，加入飞鸟”）。

2.  **执行与迭代**：

    - 点击 **【开始生成】** 获取初步结果。

    - 生成结果区域提供以下操作选项：

        - **【保存】**：将符合要求的图像归档至项目或本地。

        - **【引用】**：将当前生成图设为下一轮生成的基准图像，实现渐进式优化与视觉链路迭代。

        - **【删除】**：移除不满意结果，维持工作流清晰。

典型应用场景

- 基于初始概念图进行多轮细化，逐步接近目标视觉表达。

- 角色设计、场景构建等需要连续视觉演进的创作任务。

DeepExtension — 让提示词更精准，模型管理更企业级