什么是 AUTOMATIC1111 Stable Diffusion WebUI?
AUTOMATIC1111 Stable Diffusion WebUI 是在本地硬件上运行 Stable Diffusion 模型的事实标准。它是一个功能丰富、开源的浏览器界面,让用户能够精细控制图像生成过程的每一个方面。它最初由一位名为 AUTOMATIC1111 的用户开发,现已发展成为一个庞大的社区驱动项目,成为 AI 艺术爱好者、研究人员和开发人员的首选工具,他们希望在不依赖云服务的情况下,充分利用 Stable Diffusion 的全部功能。
主要特点
- 文生图 & 图生图: 核心功能,允许从文本提示生成图像或修改现有图像。
- 广泛的自定义选项: 可控制采样方法、步数、CFG 比例、种子、图像尺寸等等。
- 局部重绘 & 扩展绘制: 使用 AI 生成的内容轻松编辑或扩展图像的某些部分。
- 模型管理: 支持多种模型格式,包括 checkpoints (.ckpt, .safetensors)、LoRAs、VAEs 和 Textual Inversion 嵌入。
- 可扩展性: 强大的扩展系统允许社区添加新功能,例如用于精确姿势和构图控制的 ControlNet,或新的放大算法。
- API 访问: 提供 API,可将生成功能集成到其他应用程序和工作流程中。
- 批量处理: 从一组提示或使用变化的参数自动生成数百张图像。
使用案例
- AI 艺术与插画: 艺术家和业余爱好者用它来创作独特的艺术品、角色设计和概念艺术。
- 照片级成像: 为市场营销、图库摄影或创意项目生成逼真的照片。
- 设计原型制作: 快速可视化产品设计、建筑概念或 UI 模型。
- 图像编辑与修复: 使用局部重绘移除不需要的物体或修复旧照片。
- 研究与开发: 为研究人员提供一个实验新模型和生成技术的平台。
入门指南
入门需要克隆代码仓库并运行一个安装脚本。强烈建议使用具有足够显存(至少 4-6GB)的 GPU。
1. 安装 (以 Windows 上的 NVIDIA 为例): ```bash
1. 安装 Python 3.10.6 和 Git。
2. 克隆仓库:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
3. 进入目录:
cd stable-diffusion-webui
4. 运行 webui-user.bat 文件。它将自动下载依赖项和基础的 Stable Diffusion 模型。
2. “Hello World” 示例: 一旦 WebUI 运行并在浏览器中打开,您就可以进行第一次生成。
- 在 “txt2img” 选项卡中,输入以下提示:
a high-quality photograph of an astronaut riding a horse on Mars - 将其他设置保留为默认值。
- 点击 “Generate” 按钮。
根据您的硬件情况,一两分钟内,您将看到第一张由 AI 生成的图像。
定价
AUTOMATIC1111 Stable Diffusion WebUI 是完全免费和开源的,采用 AGPL-3.0 许可证。用户只需提供自己的计算机硬件即可运行。
社区与可扩展性
这个 WebUI 最大的优势在于其庞大而活跃的社区。这催生了一个无与伦比的扩展生态系统,几乎在新功能被发现的同时就添加了前沿功能。从高级动画工具到复杂的工作流管理器,如果存在一种新的 Stable Diffusion 技术,AUTOMATIC1111 中很可能就有相应的扩展。这使得该工具具有无限的适应性,并确保它始终处于生成式 AI 技术的前沿。