简介
Stable Diffusion 是 2022 年发布的深度学习文本到图像生成模型。主要用于根据文本的描述产生详细图像,网上很火的 ALL-E 和 Midjourney 也都是基于 Stable Diffusion 实现的, Stable Diffusion 目前为开源程序,且支持在本地部署,并适配绝大多数人的电脑硬件,是 Ai 绘图里最推荐上手的方式,免费,无限制,隐私
写在前面
Stable Diffusion 本身安装和使用非常繁琐,不利于小白快速上手,如果不是 AI 深度学习爱好者,更推荐直接使用整合包,本文将基于 Stable Diffusion 开源整合包作为演示。
原始安装方式参考:How to install Stable Diffusion on Windows (AUTOMATIC1111) - Stable Diffusion Art
硬件要求:
- 内存:建议 16G 起
- 显卡:N 卡,且 4G 显存及以上( 最低配置需要4GB显存,基本配置6GB显存,推荐配置12GB显存或者以上。40系显卡有额外加速)
- 硬盘:200m/s以上
- 网络:魔法上网
Tips:
即便是整合包本地化部署,使用起来也相对比较繁琐,如果遇到各种报错自己无法解决可以去隔壁玩 Midjourney
本地快速部署
安装步骤
1. 下载
stable diffusion 整合包链接
2. 安装
解压
3. 运行
打开解压好的整合包文件夹
运行启动程序
快速上手
生成你的第一张图
运行成功后,默认会打开 web 界面,如果没有弹出,也可以点击这里跳转
将以下内容复制粘贴到框框里
tm style, a beautiful blonde woman white skin from the year 1800 in a dress of the time,movie frame, cinematic, a lot of haze, volumetric lights, realistic, 8k
Negative prompt: render, ugly face, deformed face, blurry, anime, cartoon, mature, old lady, low res, cross eyes,extra limb, bad anatomy,extra fingers,letters,
Size: 520x704, Seed: 3014889011, Model: realisticVisionV13_v13, Steps: 34, hashes: [object Object], Sampler: Euler a, CFG scale: 7, Model hash: c35782bad8, Face restoration: CodeFormer
点击处理信息按钮
点击生成
稍等片刻,你的第一张图生成完毕了,可能你生成的内容跟我的不一样,那是别着急,往下看
Web 页面介绍
想要快乐游玩,需要先把web界面的各个模块先摸索明白
太长不看版
- 文生图:根据描述生成图片
- 图生图:根据你给的图片的基础,生成图片
- Extras :二次加工图片用
- 图片信息:查看别人生成图片的参数
- 模型合并:合并不同的模型,生成新的模型
- 训练: 训练自己的 embedding、hypernetwork 模型
- 扩展:第三方扩展插件
下边开始较为详细的介绍一下各个界面
提示词
用文字描述你想要生成的东西
支持自然语言处理,如:
A girl with long hair, Laurie. She has long hair and a double ponytail design
但更建议逐个关键词用逗号隔开,如:
1girl,loli,long hair,low twintails
反向提示词
用文字描述你不想在图像中出现的东西
一般会直接用通用文本粘贴进去,特殊需求再单独修改
如:
lowres,bad anatomy,bad hands,text,error,missing fingers,
extra digit,fewer digits,cropped,worst quality,
low quality,normal quality,jpeg artifacts,signature,
watermark,username,blurry,missing arms,long neck,
Humpbacked,missing limb,too many fingers,
mutated,poorly drawn,out of frame,bad hands,
unclear eyes,poorly drawn,cloned face,bad face
更详细的 tag 语法后面再展开,这个环节建议以体验为主
采样迭代步数
AI 要用多少步来画成你的图片,步数越多细节越丰富,反之亦然
采样方法
Ai 要用什么算法来画你的图,详细的解释参考:
Ai 绘图日常 篇二:从效果看Stable Diffusion中的采样方法
stable diffusion webui如何工作以及采样方法的对比
我自己比较常用的:
总批次数
一个线程,同一个配置,跑n次
单批数量
单一批次,同时生成n个线程来跑同一个配置
Tips
一般情况下,只调整总批次数,也就是单线程,跑n次,这样最灵活也最不容易爆显存
大模型和 Lora 模型下载
C 站,网址:https://civitai.com/
是目前最大的模型下载网址,目前是免费的
大模型
也叫底模,最大的特点就是大,一般以G为单位
存放位置
stable dffusion 路径 \models\Stable-diffusion
放好后点击左上角的刷新按钮就能使用了
Lora
我习惯叫他小模型,是基于大模型的基础上生成的风格化模型,可以让生成的内容轻松在写实、二次元、古风等内容之间轻松切换,也能在原有基础上换上不同角色的脸or服装,是目前讨论热度最高的模型类型,没有之一
存放位置
stable dffusion 路径 \models\lora
放好后点击红色小格子,选中Lora界面,再点击刷新按钮就能看到了
提示词快速上手
如果你耐心的看完上述内容,到这里的时候你应该具备了一定的提词器编写能力,也清楚的知道各个板块的作用,现在来尝试一下生成你的第一张图片。
用人话写下你的需求,如:
我现在打算生成一张写实风格的照片,照片的内容是一个穿着白色丝状的长袍的金发女生,把双手放在背后,打光得有电影感,还要看着摄像头,背后还要有一束圣光一样的东西勾勒她的轮廓
接着再把人话转换成一个个ai能看懂的提示词,虽然ai已经能处理自然语言,但提示词更方便后期的修改和增加权重等复杂操作
写实,金色头发,穿着白色丝状长袍的女生,完美的身材,把双手放在背后,电影感,看着镜头,背后巨大圣光,柔光
为了让ai生成的质量更高一些,最好再最前面加一些“起手”提示词,提示词越靠前权重越高
8k,最好的质量,细腻的脸庞,写实,金色头发,穿着白色丝状长袍的女生,完美的身材,把双手放在背后,电影感,看着镜头,背后巨大圣光,柔光
再把这些关键词转换成英文,可以是机翻,也可以自己信达雅,也可以让chatgpt翻
8k, the best quality, delicate face, realistic, golden hair, girl wearing a white silk robe, perfect figure, hands behind her back, movie-like feel, looking at the camera, huge holy light behind her, soft light.
同时,我还想用上 taiwanDollLikeness_v10 的 Lora 模型,所以还要把他选上
8k, the best quality, delicate face, realistic, golden hair, girl wearing a white silk robe, perfect figure, hands behind her back, movie-like feel, looking at the camera, huge holy light behind her, soft light.
最后再把这些信息丢进正面框框里
反面提示词没有特别不想看到的,所以丢一个通用的进去就行
((blurry)), animated, cartoon, duplicate, child, childish, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (((pubic hair:2)))
采样方法我习惯用 DPM++SDE Karas
迭代步数我习惯用 30 步
面部修复勾选上
宽度 512,高度 720,生成一张竖屏的图片,这样出现全身的概率比较大
CFG Scale 我习惯用 7.5 or 8
随机种子-1,就是随机的意思
最后,按下生成即可
尾巴
可能你生成的图片非常的奇怪、丑陋甚至惊悚,别着急,相信你可以通过不断地调整你的提示词来慢慢优化,后期我也会在站内更新相关的进阶教程。
以下为目录预览
40 系显卡加速 - 出图 1 秒一张
中文书写提示词 - 告别手动翻译?中文 Tag 使用教程
写懂提示词 - 一篇搞懂提示词
写懂人物姿势 - 一篇搞懂姿势编写
只换衣服&姿势 - 让她摆出你喜欢的姿势
Lora 模型训练 - 你的专属“福利姬”
......
如果本文侵犯到你的利益,请注明身份后联系我删除。
尊重他人劳动成果,转载请务必附上原文链接,我将感激不尽。
请登录后查看评论内容