軟件介紹
Stable Diffusion全功能本地版是一款非常好用且非常有趣的AI圖像生成軟件,用戶只需在這里導(dǎo)入一張未畫(huà)完的圖片,然后系統(tǒng)便可以自動(dòng)為用戶進(jìn)行繼續(xù)創(chuàng)作并且創(chuàng)作而成的圖片作品堪比專(zhuān)業(yè)級(jí)畫(huà)師。該軟件還能夠?qū)υ鹊膱D片進(jìn)行降噪、美化等一系列瑕疵的修復(fù)操作,這樣就能夠確保了圖片的輸出質(zhì)量。
Stable Diffusion全功能本地版完美支持各種標(biāo)準(zhǔn)型號(hào)的顯卡硬件并且還在Github上開(kāi)源,相關(guān)用戶在這里可以對(duì)軟件功能進(jìn)行優(yōu)化提升處理,從而能夠更好的貼合了用戶的使用習(xí)慣。另外,小編還特別為用戶帶來(lái)詳細(xì)的本地部署教程,使得用戶可以快速習(xí)慣操作方式。
軟件原理
首先,從名字Stable Diffusion就可以看出,這個(gè)主要采用的擴(kuò)散模型(Diffusion Model)。
簡(jiǎn)單來(lái)說(shuō),擴(kuò)散模型就是去噪自編碼器的連續(xù)應(yīng)用,逐步生成圖像的過(guò)程。
一般所言的擴(kuò)散,是反復(fù)在圖像中添加小的、隨機(jī)的噪聲。而擴(kuò)散模型則與這個(gè)過(guò)程相反——將噪聲生成高清圖像。訓(xùn)練的神經(jīng)網(wǎng)絡(luò)通常為U-net。
不過(guò)因?yàn)槟P褪侵苯釉谙袼乜臻g運(yùn)行,導(dǎo)致擴(kuò)散模型的訓(xùn)練、計(jì)算成本十分昂貴。
基于這樣的背景下,Stable Diffusion主要分兩步進(jìn)行。
首先,使用編碼器將圖像x壓縮為較低維的潛在空間表示z(x)。
其中上下文(Context)y,即輸入的文本提示,用來(lái)指導(dǎo)x的去噪。
它與時(shí)間步長(zhǎng)t一起,以簡(jiǎn)單連接和交叉兩種方式,注入到潛在空間表示中去。
隨后在z(x)基礎(chǔ)上進(jìn)行擴(kuò)散與去噪。換言之, 就是模型并不直接在圖像上進(jìn)行計(jì)算,從而減少了訓(xùn)練時(shí)間、效果更好。
值得一提的是,Stable DIffusion的上下文機(jī)制非常靈活,y不光可以是圖像標(biāo)簽,就是蒙版圖像、場(chǎng)景分割、空間布局,也能夠相應(yīng)完成。
Stable Diffusion本地部署教程
建立一個(gè)文件夾,用于存放本地文件。
右鍵頁(yè)面空白處,在終端中打開(kāi)。
執(zhí)行指令 git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git。
執(zhí)行完后就像這樣。
然后我們就可以關(guān)掉這個(gè)頁(yè)面了,回到剛才新建的文件夾,里面出現(xiàn)了我們剛clone的文件。
把我們下載好的模型文件,我這里使用的是stable-diffusion-v1-4(sd-v1-4.ckpt)丟到stable-diffusion-webui\models\Stable-diffusion這個(gè)文件夾下。
像這樣。
然后我們回到stable-diffusion-webui文件夾,找到webui.bat,雙擊打開(kāi)運(yùn)行。
然后就是漫長(zhǎng)的等待,直到它運(yùn)行完成。
中間可能會(huì)因?yàn)榫W(wǎng)絡(luò)問(wèn)題報(bào)錯(cuò),重新運(yùn)行webui.bat多試幾遍,(這段可能會(huì)勸退很多人)實(shí)在懶得折騰就回到上面去用GUI版的。
部署完成后會(huì)是這樣,下面有一個(gè)URL,我們把它復(fù)制到瀏覽器中打開(kāi)。
(這個(gè)窗口不要關(guān))
像這樣。
輸幾個(gè)關(guān)鍵詞試一下。
到此,本地部署就完成了,如果有切換模型的需求,只需把原來(lái)的模型刪掉換上新的模型即可。
Stable Diffusion常見(jiàn)問(wèn)題
Q1:為什么我們要本地部署?
A1:stable diffusion本地部署的運(yùn)行完全基于用戶的本地電腦,給使用者帶來(lái)極大的自由度,比如可以使用不同的微調(diào)模型,同時(shí)也能有效避免你的創(chuàng)作作品泄露。
Q2:本地部署的stable diffusion WEBUI和在線版有什么不同?
A2:stable diffusion WEBUI是典型的開(kāi)源集成,一個(gè)月內(nèi)迭代幾十次,增加一大堆功能。標(biāo)準(zhǔn)化的本地部署能讓你體驗(yàn)到這個(gè)和創(chuàng)新同步的過(guò)程。這是很多懶人版直接解壓版本(無(wú)法用git升級(jí))和網(wǎng)頁(yè)版無(wú)法帶給你的。
重要:在本地部署之前,確保你所使用的電腦滿足所需的依賴(lài)項(xiàng)。
一般來(lái)說(shuō),內(nèi)存不應(yīng)低于16G.硬盤(pán)可用空間不小于50G。
要求一張顯存大于4GB(最好高于6GB,建議8GB以上)的高性能顯卡,我們的建議是GPU不低于Nvidia 10系,因?yàn)镹卡在專(zhuān)業(yè)應(yīng)用生態(tài)上一枝獨(dú)秀,因此我們推薦NVidia卡(強(qiáng)烈推薦)。
如果你使用AMD卡,則需要安裝ROCM(僅能在LINUX環(huán)境安裝,在WIN10環(huán)境無(wú)法使用),可參考的資料很少,會(huì)比較(very)麻煩。因未曾測(cè)試過(guò),本藝術(shù)家暫無(wú)法提供技術(shù)支持。
由于stable-diffusion是開(kāi)源的,為它提供整合的有非常多的版本。選擇好的版本就變得非常重要。
- 精選留言 來(lái)自甘肅隴南移動(dòng)用戶 發(fā)表于: 2023-2-8
- 這個(gè)軟件有點(diǎn)作用,厲害了
- 精選留言 來(lái)自安徽馬鞍山電信用戶 發(fā)表于: 2023-1-1
- 先下載試試,多謝分享。
- 精選留言 來(lái)自湖南湘潭移動(dòng)用戶 發(fā)表于: 2023-12-23
- 總算是下載到可以用的了,之前遇到的問(wèn)題希望已經(jīng)解決了。。
- 精選留言 來(lái)自江西贛州電信用戶 發(fā)表于: 2023-1-20
- 沒(méi)有可比性,效率高了不止一點(diǎn)
- 精選留言 來(lái)自河南三門(mén)峽電信用戶 發(fā)表于: 2023-12-24
- 越更新越好用了,之前有些功能我都找不到,太令我驚喜了