ComfyUI
文生图
- 风格参考
- 风格融合
- 多图融合
- 遮罩混合
图生图
局部重绘
IP-Adapter
术语解释
- 文生图(Text-to-Image): 一种AI绘画工作流,用户输入文字描述(提示词),AI根据描述生成对应的图像。
- 大模型(Checkpoint Model): AI绘画中核心的模型文件,决定了生成图像的基本风格和能力,例如动漫风、写实风等。
- CLIP文本编码器(CLIP Text Encoder): 将人类输入的文本提示词(正面和负面提示词)编码成计算机能理解的数值向量,作为生成图像的条件。
- K采样器(K Sampler): ComfyUI中负责将大模型图像信息和文本编码器提供的条件信息进行比对和处理,逐步从噪声中生成目标图像的核心组件。
- VAE解码器(VAE Decode): 将K采样器生成的低维度潜在空间信息(计算机语言)解码并转换回高维度的、人类可识别的最终图像。
- CFG比例(Classifier Free Guidance Scale): K采样器中的一个参数,用于控制生成图像对文本提示词的遵循程度,值越高,图像与提示词的关联性越强。