在 AI 绘画领域,如何从“随机抽卡”进阶到“精准控制”是每一位设计师面临的必修课。特别是在角色设计中,如何保持角色一致性、精准控制微表情、灵活调整姿态以及实现无缝换装,是决定作品落地质量的关键。本文深入解析 Stable Diffusion 在角色设计中的五大核心应用流程,结合 ControlNet、IP Adapter、After Detailer 等主流插件的实操技巧,提供一套可复刻的标准化工作流。无论你是想将二次元角色真人化,还是构建复杂的场景布局,这篇指南都将提升设计效率与作品可控性。
角色重绘:ControlNet 组合应用
将 Midjourney (MJ) 等工具生成的原始角色图输入 SD,通过 ControlNet 进行“图生图”重绘,是复刻角色特征并增强可控性的基础。
基础流程
- 输入: 将原图导入 SD 的图生图(Img2Img)模块。
- 工具: 启用 ControlNet 单元。
- 目的: 锁定原有构图与特征,进行二次细化或风格调整。
ControlNet 选型与配置技巧
- Canny(硬边缘):
- 作用: 提供精确的轮廓控制,能有效解决帽子与头发边界模糊的问题(例如原图中细小的徽章无法呈现时)。
- 建议权重: 调低至 0.8 – 0.9,避免线条过于死板或产生强干扰。
- Depth(深度图):
- 作用: 强化画面的前后层次关系与阴影表现,在纯肢体动态控制上优于 OpenPose。
- 注意: Depth 对边缘的控制弱于 Canny,通常建议两者组合使用以达到最佳效果。
提示词与尺寸处理
- 反推提示词: 使用 WD1.4 标签器 提取原图 Tag(如
solo girl, blue eyes, long braided hair, blue dress)。 - 注入提示词: 将提取的 Tag 填入正向提示词框,确保 AI 对角色的基础描述准确无误。
- 尺寸同步: 预处理器输入尺寸必须与最终出图尺寸保持一致(例如
560×984),以防止画面拉伸形变。
微表情控制:After Detailer 插件应用
在不重绘整张图的情况下,使用 After Detailer (ADetailer) 插件是对面部和手部细节进行“微创手术”的神器。
核心功能
局部重绘工具,专精于面部/手部细节的修复与微调,无需重新生成背景和身体。
操作流程
- 启用插件: 在 SD 界面中找到并勾选 After Detailer(通常在秋叶整合包中已预装)。
- 模型选择: 选择
face_yolov8n.pt模型(此模型专门针对面部检测)。 - 关键词驱动: 在 AD 插件的提示词框(或主提示词框)中添加表情关键词。
- 示例:
grinning(咧嘴笑)、crying with eyes open(睁眼流泪)、tears(眼泪)。
- 示例:
效果验证
- 输入
grinning可生成牙齿外露的自然笑容。 - 输入
crying with eyes open可生成精准的含泪效果,且能完美保留原角色的面部特征。
姿态控制:IP Adapter + OpenPose 协同
想要让角色动起来且不崩坏,需要结合“风格迁移”与“骨架控制”。
双 ControlNet 逻辑
- IP Adapter: 负责“像谁”。识别并复刻角色的面部、身体比例、服装等固有特征。
- 素材要求: 需上传 256×256 的头像,分辨率可以低,但清晰度必须高。
- OpenPose: 负责“做什么动作”。
- 预处理器选择:
openpose_full(控制全身)或openpose_hand(精细控制手部)。
- 预处理器选择:
头身比匹配原则(关键点)
- 原则: 参考图的头身比必须接近目标角色,否则会导致姿态严重变形或年龄感偏差。
- 卡通角色: 常用 1:1 – 1:3。
- 写实角色: 常用 1:6 – 1:7。
- 技巧: 使用角色的三视图(正面/侧面/背面)比单张动态图更容易匹配准确的头身比。
权重调节
- IP Adapter 权重建议: 维持在 0.3 – 0.4 之间。
- 原因: 过高会过度强化二次元/原图风格,从而削弱 OpenPose 的动作控制效果。
角色换装:提示词驱动与 IP Adapter 结合
核心方法
- 保留特征: 开启 IP Adapter 控制面部特征。
- 释放动作: 关闭 OpenPose 等动作控制(除非需要特定姿势)。
- 快速切换: 利用 WebUI 的“提示词收藏列表”功能,快速切换服装 Tag(如
maid outfit,chef uniform)。
提示词优化策略
- 做减法: 必须删除原图中与新装冲突的描述(如原图是 blue dress,换装时必须删掉)。
- 做加法: 保留通用的特征词(如
solo,blue eyes,long braided hair),确保面部和发型的一致性。
分辨率提升
换装后,务必启用 高清修复(Hires. Fix) 进行 2倍放大,并配合 After Detailer 修复面部细节,以保证成图质量。
风格转换:2D → 真人(模型主导)
关键要素
- 大模型切换: 必须切换至写实风格的 Checkpoint 模型(如
Majic Realistic),这是决定整体画风的基础。 - 提示词强化: 在正向提示词中添加
photography(摄影)或photographic(写实感)等词汇,大幅提升真实质感。
权重下调
- 操作: 将 IP Adapter 的权重降至 0.25 – 0.35。
- 目的: 降低二次元特征的干扰,让 AI 有更多空间去渲染写实的皮肤纹理和光影。
效果对比
真人化后,皮肤质感、衣物褶皱、光影层次应有显著增强。例如生成厨师帽时,写实模型能生成自然的布料纹理,验证了模型选择的核心作用。
场景设计:Controllable Layout 重构
ControlNet 选型
- Canny(硬边缘): 用于保留参考图的构图、景深和建筑轮廓(如建筑遮挡关系)。
- Depth(深度图): 叠加使用,确保前后层次关系准确,特别适合构建废墟、赛博朋克等结构复杂的场景。
提示词与模型协同
- 风格定义: 场景的具体风格由提示词决定(如
cyberpunk city,ancient Chinese architecture)。 - 细节表现: 大模型决定材质细节。
DreamShaper:偏虚幻/艺术感。Realistic系列:偏写实/摄影感。- 建议: 多尝试不同大模型以寻找最佳质感。
分辨率适配
场景图基础分辨率(如 512×768)往往不足以展现细节,后续必须通过高清修复提升分辨率,避免远景模糊或细节丢失。