GPT-4O UPDATED // CLAUDE 3.5 SONNET TRENDING // NEW VECTOR DB RELEASED: CHROMA V0.5 // CURSOR RAISED $60M // GEMINI 1.5 PRO AVAILABLE // GPT-4O UPDATED // CLAUDE 3.5 SONNET TRENDING // NEW VECTOR DB RELEASED
Score: 95/100
Open Source
LANG: ZH

AUTOMATIC1111 Stable Diffusion WebUI

"终极本地AI图像生成工具包"

什么是 AUTOMATIC1111 Stable Diffusion WebUI?

AUTOMATIC1111 Stable Diffusion WebUI 是在本地硬件上运行 Stable Diffusion 模型的事实标准。它是一个功能丰富、开源的浏览器界面,让用户能够精细控制图像生成过程的每一个方面。它最初由一位名为 AUTOMATIC1111 的用户开发,现已发展成为一个庞大的社区驱动项目,成为 AI 艺术爱好者、研究人员和开发人员的首选工具,他们希望在不依赖云服务的情况下,充分利用 Stable Diffusion 的全部功能。

主要特点

  • 文生图 & 图生图: 核心功能,允许从文本提示生成图像或修改现有图像。
  • 广泛的自定义选项: 可控制采样方法、步数、CFG 比例、种子、图像尺寸等等。
  • 局部重绘 & 扩展绘制: 使用 AI 生成的内容轻松编辑或扩展图像的某些部分。
  • 模型管理: 支持多种模型格式,包括 checkpoints (.ckpt, .safetensors)、LoRAs、VAEs 和 Textual Inversion 嵌入。
  • 可扩展性: 强大的扩展系统允许社区添加新功能,例如用于精确姿势和构图控制的 ControlNet,或新的放大算法。
  • API 访问: 提供 API,可将生成功能集成到其他应用程序和工作流程中。
  • 批量处理: 从一组提示或使用变化的参数自动生成数百张图像。

使用案例

  • AI 艺术与插画: 艺术家和业余爱好者用它来创作独特的艺术品、角色设计和概念艺术。
  • 照片级成像: 为市场营销、图库摄影或创意项目生成逼真的照片。
  • 设计原型制作: 快速可视化产品设计、建筑概念或 UI 模型。
  • 图像编辑与修复: 使用局部重绘移除不需要的物体或修复旧照片。
  • 研究与开发: 为研究人员提供一个实验新模型和生成技术的平台。

入门指南

入门需要克隆代码仓库并运行一个安装脚本。强烈建议使用具有足够显存(至少 4-6GB)的 GPU。

1. 安装 (以 Windows 上的 NVIDIA 为例): ```bash

1. 安装 Python 3.10.6 和 Git。

2. 克隆仓库:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

3. 进入目录:

cd stable-diffusion-webui

4. 运行 webui-user.bat 文件。它将自动下载依赖项和基础的 Stable Diffusion 模型。

2. “Hello World” 示例: 一旦 WebUI 运行并在浏览器中打开,您就可以进行第一次生成。

  • “txt2img” 选项卡中,输入以下提示: a high-quality photograph of an astronaut riding a horse on Mars
  • 将其他设置保留为默认值。
  • 点击 “Generate” 按钮。

根据您的硬件情况,一两分钟内,您将看到第一张由 AI 生成的图像。

定价

AUTOMATIC1111 Stable Diffusion WebUI 是完全免费和开源的,采用 AGPL-3.0 许可证。用户只需提供自己的计算机硬件即可运行。

社区与可扩展性

这个 WebUI 最大的优势在于其庞大而活跃的社区。这催生了一个无与伦比的扩展生态系统,几乎在新功能被发现的同时就添加了前沿功能。从高级动画工具到复杂的工作流管理器,如果存在一种新的 Stable Diffusion 技术,AUTOMATIC1111 中很可能就有相应的扩展。这使得该工具具有无限的适应性,并确保它始终处于生成式 AI 技术的前沿。

System Specs

License
AGPL-3.0
Release Date
2026-01-27
Social
N/A
Sentiment
压倒性好评

Tags

stable diffusion / 图像生成 / 文生图 / 开源 / ai艺术 / webui

Alternative Systems

  • InvokeAI
    一个开源的 Stable Diffusion 工具包替代品,专注于提供精美的用户体验。
  • ComfyUI
    一个基于节点的 Stable Diffusion 图形用户界面,提供最大的灵活性和工作流定制能力。
  • Fooocus
    一个简化和优化的 Stable Diffusion 用户界面,专注于易用性和开箱即用的高质量输出。
  • Midjourney
    一种专有的、高质量的图像生成服务,以其艺术性和连贯的输出而闻名。
  • DALL-E 3
    OpenAI 的图像生成模型,集成在 ChatGPT 中,以其强大的提示理解能力而闻名。