AI 绘画基础 - 细数 Stable Diffusion 中的各种常用模型

admin1年前笔记121

AI 绘画新手魔导士在刚开始玩 Stable Diffusion 时总会遇到各种新的概念,让人困惑,其中就包括各种模型和他们之间的关系。

safetensors

在了解各种模型之前,有必须先了解下 safetensors,玩过的应该都认识,就是很多模型的后缀。然而各种模型的后缀五花八门,但是总是能看到 safetensors 的影子,让人有些缭乱。

其实主要是因为 safetensors 支持各种 AI 模型,而在 safetensors 出现前,各种 AI 模型都有着自己独特的后缀。这就导致每种模型既可以使用 safetensors 又可以使用自己原有的后缀,所以入门的时候就会让人有点分不清。

其实 safetensors 是由 huggingface 研发的一种开源的模型格式,它有几种优势:

  • 足够安全,可以防止 DOS 攻击

  • 加载迅速

  • 支持懒加载

  • 通用性强

所以现在大部分的开源模型都会提供 safetensors 格式。

开源地址: github.com/huggingface…

模型分类

说完了 safetensors 我们进入正题,聊一聊在 Stable Diffusion 中常见的各种模型。

Checkpoint | Stable Diffusion

Checkpoint 是 Stable Diffusion 中最重要的模型,也是主模型,几乎所有的操作都要依托于主模型进行。而所有的主模型都是基于 Stable Diffusion 模型训练而来,所以有时会被称为 Stable Diffusion 模型。

主模型后缀一般为 .ckpt 或者 .safetensors,并且体积比较庞大,一般在 2G - 7G 之间。而要管理模型我们需要进入 WebUI 目录下的 models/Stable-diffusion 目录下。

在使用 WebUI 时左上角切换的就是主模型了。

image.png

LoRA 和 LyCORIS

LoRA 是除了主模型外最常用的模型。LoRA 和 LyCORIS 都属于微调模型,一般用于控制画风、控制生成的角色、控制角色的姿势等等。

LoRA 和 LyCORIS 的后缀均为 .safetensors,体积较主模型要小得多,一般在 4M - 300M 之间。一般使用 LoRA 模型较多,而 LyCORIS 与 LoRA 相比可调节范围更大,但是需要额外的扩展才可使用。需要管理模型时我们可以进入 WebUI 目录下的 models/LoRA 目录下。

在 WebUI 中使用时,可通过点击左侧的小红灯,然后在 LoRA 菜单中点击使用。也可以直接使用 Prompt 调用。

image.png

Textual Inversion

Textual Inversion 是文本编码器模型,用于改变文字向量。可以将其理解为一组 Prompt。

Textual Inversion 后缀为 .pt 或者 .safetensors,体积非常小,一般只有几 kb。模型所在的目录不在 models 下,而是在 WebUI 中的 embeddings 目录下。

在使用时同样可以使用小红灯中的 Textual Inversion,也可以使用 Prompt 调用。

image.png

Hypernetworks

Hypernetworks 模型用于调整模型神经网络权重,进行风格的微调。

Hypernetworks 的后缀为 .pt 或者 .safetensors,体积一般在 20M - 200M 之间。模型的目录为 WebUI 下的 models/hypernetworks

在使用时同样可以使用小红灯中的 Hypernetworks。

image.png

ControlNet

ControlNet 是一个及其强大的控制模型,它可以做到画面控制、动作控制、色深控制、色彩控制等等。使用时需要安装相应的扩展才可。

ControlNet 类模型的后缀为 .safetensors。模型的目录为 models/ControlNet

使用时我们需要先去 Extensions 页面搜索 ControlNet 扩展,然后 Install 并 Reload UI。然后便可以在 txt2img 和 img2img 菜单下找到:

image.png

ControlNet 功能非常强大,还解决 AI 画手的噩梦问题。

CodeFormer

CodeFormer 模型一般用于图片的修复,比如提高图片的分辨率、将黑白照片修改成彩色照片、人脸修复等等。

CodeFormer 是一个开源项目,在 WebUI 中已经默认被整合,可以在 Extras 菜单中使用。如果需要修改 CodeFormer 版本可以将模型放到 models/codeformer

一览表

模型名称作用后缀名大小在 WebUI 中的文件夹
Checkpoint主模型.ckpt 或 .safetensors2G - 7Gmodels/Stable-diffusion
LoRA 和 LyCORIS微调模型,一般用于控制画风、控制生成的角色、控制角色的姿势等等.safetensors2G - 7Gmodels/LoRA
Textual Inversion文本编码器模型.pt 或 .safetensorsKB 级别embeddings
Hypernetworks调整模型神经网络权重,进行风格的微调.pt 或 .safetensors20M - 200Mmodels/hypernetworks
ControlNet强大的控制模型,可以进行画面控制、动作控制、色深控制、色彩控制等等.safetensorsKB 级别models/ControlNet
VAE图片亮度和饱和度的修正、画面较正和以及补光等.pt 或 .safetensors335M 或 823Mmodels/VAE
CodeFormer修复模型,修复人脸、提高分辨率等--models/codeformer

最后

上面几种模型就是 Stable Diffusion 中最常用的几种,通过 Checkpoint 控制图片的主要风格;通过 VAE 给图片补光、调亮;通过 LoRA | LyCORIS 对模型进行风格、角色控制;通过 Textual Inversion 简化 Prompt;通过 ControlNet 进行姿势、色彩控制,修复手部。



相关文章

简单介绍正则表达式拆分url实例代码

背景做web开发的同学,经常会有从url中获取二级域名或者主域名或者参数等等需求,需要扎实的正则功底。本文提供一个全面的url拆分案例,需要哪个部分用哪个部分。案例将url的各个部分拆开,让我想取哪部...

将Web应用性能提高十倍的10条建议

将Web应用性能提高十倍的10条建议

举一个例子,一份亚马逊十年前做过的研究可以证明,甚至在那个时候,网页加载时间每减少100毫秒,收入就会增加1%。另一个最近的研究特别强调一个事实,即超过一半的网站拥有者在调查中承认它们会因为应用程序性...

云服务器的安全设置常识

云服务器的安全设置常识

1、服务器外置防火墙服务器安全组,有的叫安全组;有的叫防火墙2、外置防火墙和内置防火墙外置防火墙(安全组/防火墙)内置防火墙(iptables/firewalld)3、防火墙作用:防火墙就像一个门,想...

教你实现Vscode的Markdown预览

教你实现Vscode的Markdown预览

vscode 的 markdown 预览是我们整天都在用的功能,有没有想过它是怎么实现的。或许有一天你会接到个定制 markdown 预览的需求,应该怎么做呢?其实整体思路比较简单,就是创建一个 we...

到底什么是AI框架?AI框架有什么用?

到底什么是AI框架?AI框架有什么用?

到底什么是AI算法?什么是神经网络?神经网络有什么用?为什么神经网络需要训练?什么是模型?AI框架有什么用?AI框架能解决什么问题?上面的几个问题其实还挺有挑战的。下面我们来对清楚一些基本概念:深度学...

XML DOM 节点信息概述

XML DOM 节点信息概述

在 XML DOM 中,每个节点都是一个对象。对象拥有方法和属性,并可通过 JavaScript 进行访问和操作。三个重要的节点属性是:nodeNamenodeValuenodeTypenodeNam...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。