从重绘、控图到场景构建 Stable Diffusion 角色设计全流程解析

在 AI 绘画领域，如何从“随机抽卡”进阶到“精准控制”是每一位设计师面临的必修课。特别是在角色设计中，如何保持角色一致性、精准控制微表情、灵活调整姿态以及实现无缝换装，是决定作品落地质量的关键。本文深入解析 Stable Diffusion 在角色设计中的五大核心应用流程，结合 ControlNet、IP Adapter、After Detailer 等主流插件的实操技巧，提供一套可复刻的标准化工作流。无论你是想将二次元角色真人化，还是构建复杂的场景布局，这篇指南都将提升设计效率与作品可控性。

角色重绘：ControlNet 组合应用

将 Midjourney (MJ) 等工具生成的原始角色图输入 SD，通过 ControlNet 进行“图生图”重绘，是复刻角色特征并增强可控性的基础。

基础流程

输入： 将原图导入 SD 的图生图（Img2Img）模块。
工具： 启用 ControlNet 单元。
目的： 锁定原有构图与特征，进行二次细化或风格调整。

ControlNet 选型与配置技巧

Canny（硬边缘）：
- 作用： 提供精确的轮廓控制，能有效解决帽子与头发边界模糊的问题（例如原图中细小的徽章无法呈现时）。
- 建议权重： 调低至 0.8 – 0.9，避免线条过于死板或产生强干扰。
Depth（深度图）：
- 作用： 强化画面的前后层次关系与阴影表现，在纯肢体动态控制上优于 OpenPose。
- 注意： Depth 对边缘的控制弱于 Canny，通常建议两者组合使用以达到最佳效果。

提示词与尺寸处理

反推提示词： 使用 WD1.4 标签器 提取原图 Tag（如 solo girl, blue eyes, long braided hair, blue dress）。
注入提示词： 将提取的 Tag 填入正向提示词框，确保 AI 对角色的基础描述准确无误。
尺寸同步： 预处理器输入尺寸必须与最终出图尺寸保持一致（例如 560×984 ），以防止画面拉伸形变。

微表情控制：After Detailer 插件应用

在不重绘整张图的情况下，使用 After Detailer (ADetailer) 插件是对面部和手部细节进行“微创手术”的神器。

核心功能

局部重绘工具，专精于面部/手部细节的修复与微调，无需重新生成背景和身体。

操作流程

启用插件： 在 SD 界面中找到并勾选 After Detailer（通常在秋叶整合包中已预装）。
模型选择： 选择 face_yolov8n.pt 模型（此模型专门针对面部检测）。
关键词驱动： 在 AD 插件的提示词框（或主提示词框）中添加表情关键词。
- 示例： grinning（咧嘴笑）、crying with eyes open（睁眼流泪）、tears（眼泪）。

效果验证

输入 grinning 可生成牙齿外露的自然笑容。
输入 crying with eyes open 可生成精准的含泪效果，且能完美保留原角色的面部特征。

姿态控制：IP Adapter + OpenPose 协同

想要让角色动起来且不崩坏，需要结合“风格迁移”与“骨架控制”。

双 ControlNet 逻辑

IP Adapter： 负责“像谁”。识别并复刻角色的面部、身体比例、服装等固有特征。
- 素材要求： 需上传 256×256 的头像，分辨率可以低，但清晰度必须高。
OpenPose： 负责“做什么动作”。
- 预处理器选择： openpose_full（控制全身）或 openpose_hand（精细控制手部）。

头身比匹配原则（关键点）

原则： 参考图的头身比必须接近目标角色，否则会导致姿态严重变形或年龄感偏差。
- 卡通角色： 常用 1:1 – 1:3。
- 写实角色： 常用 1:6 – 1:7。
技巧： 使用角色的三视图（正面/侧面/背面）比单张动态图更容易匹配准确的头身比。

权重调节

IP Adapter 权重建议： 维持在 0.3 – 0.4 之间。
- 原因： 过高会过度强化二次元/原图风格，从而削弱 OpenPose 的动作控制效果。

角色换装：提示词驱动与 IP Adapter 结合

核心方法

保留特征： 开启 IP Adapter 控制面部特征。
释放动作： 关闭 OpenPose 等动作控制（除非需要特定姿势）。
快速切换： 利用 WebUI 的“提示词收藏列表”功能，快速切换服装 Tag（如 maid outfit, chef uniform）。

提示词优化策略

做减法： 必须删除原图中与新装冲突的描述（如原图是 blue dress，换装时必须删掉）。
做加法： 保留通用的特征词（如 solo, blue eyes, long braided hair），确保面部和发型的一致性。

分辨率提升

换装后，务必启用 高清修复（Hires. Fix） 进行 2倍放大，并配合 After Detailer 修复面部细节，以保证成图质量。

风格转换：2D → 真人（模型主导）

关键要素

大模型切换： 必须切换至写实风格的 Checkpoint 模型（如 Majic Realistic），这是决定整体画风的基础。
提示词强化： 在正向提示词中添加 photography（摄影）或 photographic（写实感）等词汇，大幅提升真实质感。

权重下调

操作： 将 IP Adapter 的权重降至 0.25 – 0.35。
目的： 降低二次元特征的干扰，让 AI 有更多空间去渲染写实的皮肤纹理和光影。

效果对比

真人化后，皮肤质感、衣物褶皱、光影层次应有显著增强。例如生成厨师帽时，写实模型能生成自然的布料纹理，验证了模型选择的核心作用。

场景设计：Controllable Layout 重构

ControlNet 选型

Canny（硬边缘）： 用于保留参考图的构图、景深和建筑轮廓（如建筑遮挡关系）。
Depth（深度图）： 叠加使用，确保前后层次关系准确，特别适合构建废墟、赛博朋克等结构复杂的场景。

提示词与模型协同

风格定义： 场景的具体风格由提示词决定（如 cyberpunk city, ancient Chinese architecture）。
细节表现： 大模型决定材质细节。
- DreamShaper：偏虚幻/艺术感。
- Realistic 系列：偏写实/摄影感。
- 建议： 多尝试不同大模型以寻找最佳质感。

分辨率适配

场景图基础分辨率（如 512×768）往往不足以展现细节，后续必须通过高清修复提升分辨率，避免远景模糊或细节丢失。