這是草稿,時間做成影片放到yt
未來幾年的主流是ai-assisted(AI輔助)
當下AI繪圖的優勢
1.人物的姿勢相當正確,具體來說可細分為肌肉的線條、服裝的褶皺、臉與骨架、光影
,許多種手繪很不好畫的角度,現在也訓練得很好了。
範例一:白色有蕾絲洋裝,臀部為焦點,鏡頭由下往上
提示詞 : from below,from side,ass,ass focus,white dress,lace,upper body
範例二:白色有蕾絲洋裝,足部為焦點,鏡頭由下往上
提示詞: from below,stepped on,soles of feet,white dress,lace,full body
範例三:體育倉庫趴著手臂伸出,鏡頭由側面上方往下
提示詞: close to viewer,from above,from side, top-down bottom-up,arms up,sportswear,gym storeroom,upper body
範例四:體育倉庫女孩被男孩抱著,鏡頭由上方往下,聚焦胸部
提示詞: couple,1girl,1boy,faceless male,close to viewer,from above,top view,{{{breasts focus}}},leaning back,sitting on person,hug,eye contact,medium breasts,sportswear,gym storeroom,
範例五:各種視角的"跳躍"
提示詞:利用鏡頭提示詞如from below、from above等等,結合身體部位提示詞(要不要加focus就看個人了),像是ass、thigh、knee、crotch、calf、breasts等等,當然要完全亂數抽卡也是沒差啦
總之作為一個輔助工具,AI很好的解決了許多畫師在骨架方面的問題,專業一點的可能叫做人體的透視與變形,而且,不單單是人體,服裝在各種動作時因為施加的力道導致的變形,還有受環境(刮風、下雨淋濕)產生的變化,AI目前也訓練得很不錯,對了,AI還都幫你上色好了,那麼打光跟陰影自然也不成問題。
很多畫師其實都沒有很硬的素描底子,青少年時期甚至年過二十才開始學畫的人很多,這種半路出家的
畫師,我認為就相當需要AI來輔助,不用AI輔助就是燒錢燒時間,大量去書店或網路找or購買參考資料才能畫出這些比較難畫的角度。
而且,就我個人的經驗,要找到完美吻合心裡想像的參考圖,這其實是極其困難的,好比你想畫個俯瞰+跳躍+人物穿奇幻世界的服裝+20~25八頭身青年女性+長捲髮,要獲得同時滿足這五個條件的參考資料還真是挺困難的,不如用AI大量生成個50張,再從中挑選幾張比較OK來做參考(甚至你骨架放下面圖層照著描也沒人知道)
AI何時能進步到取代多數畫師?
這就不得不提到目前AI比較明顯的缺點了,或者說矛盾的點。
我試著用NAI3輸入
1girl,1boy,1dog,cowboy shot,The boy stands on the left, the woman stands in the middle, and the dog stands on the right
簡單來說就是一個男的站在左邊,女孩站中間,狗站右邊
沒有指定任何姿勢、動作、外表特徵,就是一個簡單的概念而已,我試著跑了10張,
結果只有2張半是合格的(但合格不代表好看啊),AI算有理解語意
這張就是所謂的一半合格的,從背面向前看,符合一個男的站在左邊,女孩站中間,狗站右邊
但是狗變成了狗頭人
其他七張就是像這種莫名其妙的,AI完全無法理解語意,那怕是這麼簡單的句子
可以發現AI只要主角一多就會開始亂了,一兩個主角很穩定,三個以上就常常亂畫了
這也是目前AI矛盾的地方,如果是人類的話,畫動態的且線條密集的圖,
比如一個穿哥德羅莉裝的少女在跑步,鏡頭採俯瞰視角
畫起來絕對相當費工夫,甚至很多畫師可能根本就畫不出來,而AI卻能輕鬆解決
但換成畫三個角色站著,沒有指定動作跟外觀特徵、鏡頭角度,對人類來說是絕對不可能畫錯的(頂多畫得不好看),但AI反倒有高達八成的機率會畫錯,而且是完全文不對題的那種很離譜的錯,明顯比人類糟糕許多,跟前者(畫困難的視角加動作)相比,實在非常矛盾。
這就引出了兩派說法,我們暫且稱為樂觀派與悲觀派好了
樂觀派認為,AI只是訓練還不足而已,2023年時,AI連兩個人牽手這種動作(人與人),甚至
一個人拿筷子吃拉麵(人+物品)都會畫錯,良率可能連5%都不到,而現在,在消耗大量的算力與時間對AI訓練後,現在這些問題都大幅改善了。
這一派的結論就是只要一直丟新素材給AI訓練,AI學會越來越多的東西,漸漸地,人類畫師有可能
會大量被AI取代。
而悲觀派則認為,AI終究是死讀書,死背一些特徵而已,而且特徵有時候還會混淆,像上面有張圖,為什麼狗會變成兩腳站立的呢?因為給AI訓練的圖中,有TAG上standing的訓練素材,絕大多數都是兩腳站立的,而AI無法意識到,狗是不可能兩腳站立的,才會犯這種錯,畫出了兩腳站立還穿人類衣服的狗
,只因為人類當初餵給AI訓練的素材中,訓練standing這個概念的圖,幾乎都是主角為人類的圖。
常常用AI生圖,而且積極挑戰各類題材的人,應該或多或少都有意識到AI這個特徵跟提示詞混淆的問題有多煩人,常常會出現你無法預料的結果(當然有時也會是驚喜就是)
這一派的結論就是,目前的訓練方法有可能到一個階段後開始陷入瓶頸,難以再進步,多半會卡在
這個特徵與提示詞混淆的問題,許多種構圖跟概念,其良率會一直在10%以下怎麼訓練都提升不起來,
此時AI的進步速度就開始放慢了,除非有人能研究出革命性的AI訓練方法