ETH官方钱包

前往
大廳
主題

Stable diffusion 測試 - 採樣次數

獵奇一哥 | 2022-12-08 20:37:42 | 巴幣 106 | 人氣 3166

這篇原本是在場外回答的,是在10月回答,現在Stable diffusion不斷更新後,Step需求越來越短,但是DIMM依舊建議超過80
以下測試採用NovalAI的Model


結論-測試一

其實有些東西因為巴哈姆特的限制上傳不上來,我是很懶得用別的工具,所以昨晚折騰很久就放棄。
從目前測試來看,目前想法以擬人化解釋就是,
Eular a是一個學習不足但想像力完善的傢伙,它的細節極限非常明顯,但是他能從概念(model)中組合最合適的新圖形。
DDIM則呈現不同,他很像一板一眼的人,A型處女座,無中生有似乎不行,但是細節可以,因為他跟Eular a使用共同概念,祖先都dall e2,所以可以在圖像上,用Eular a作品去給DDIM加工通常都不錯。

結論-測試二
還在思考



測試一

測試一下 sampling step、CFG與各種Sampler的影響

Eular a
DDIM txt2img測試 Step 與 CFG關係測試
有開啟Restore faces 與Highres.flx


CFG 8.5
step 10


step 40


step 70


step 100



DDIM
DDIM txt2img測試 Step 與 CFG關係測試

step 10


step 40

step 70


step 100




測試二:

我發現各種修正方法都會影響顏色、景深與線條,雖然人眼可能無法真的看出來,但對於機器卻是很敏感的影響,不過看來這張生成的圖片不夠渣,可能鑑別度不高。

隨機生成一個以彰化吉祥物色塊為主軸的圖

以下修正都是為了讓破損圖片做修正,並增加視覺上的感受,


  1. 未經修正


  2. 經過waifu2x vulkan修正
    https://github.com/nihui/waifu2x-ncnn-vulkan


    CFG: 7


    CFG: 10
  3. srmd ncnn vulkan修正
    https://github.com/nihui/srmd-ncnn-vulkan


    CFG: 7

    CFG: 10
  4. realsr ncnn vulkan 修正
    https://github.com/nihui/realsr-ncnn-vulkan

    CFG: 7


    CFG: 10
  5. RealESRGAN 修正
    https://github.com/xinntao/Real-ESRGAN


    CFG7


    CFG10
  6. CUGAN 修正
    https://github.com/bilibili/ailab/tree/main/Real-CUGAN

    CFG 7


    CFG 10
  7. BSRGAN 修正
    https://github.com/cszn/BSRGAN

    CFG 7


    CFG 10
  8. R-ESRGAN+Anime6B 修正
    https://github.com/xinntao/Real-ESRGAN/blob/master/docs/anime_model.md

    CFG 7


    CFG 10
  9. SwinIR 修正
    https://github.com/JingyunLiang/SwinIR


    CFG 7


    CFG 10



    找機會再拿一些比較複雜又雜訊一堆的圖來測試

創作回應

奶油肉餅
那像這些要怎麼搞出來?
https://www.sopitas.com/cine-y-tv/asi-se-veria-pelicula-avengers-dirigida-wes-anderson-hermanos-russo-ia/
2022-12-29 10:57:06
獵奇一哥
你可能要追看看他的IG才知道,但若我猜測,應該是用Stable diffusion 的官方model,後續再用一些額外的訓練來產生新的角色,並用合適的prompt產生
2022-12-29 11:13:20

更多創作