這是草稿,時間做成影片放到yt
未來幾年的主流是ai-assisted(AI輔助)
當下AI繪圖的優勢
1.人物的姿勢相當正確,具體來說可細分為肌肉的線條、服裝的褶皺、臉與骨架、光影
,許多種手繪很不好畫的角度,現在也訓練得很好了。
範例一:白色有蕾絲洋裝,臀部為焦點,鏡頭由下往上
提示詞 : from below,from side,ass,ass focus,white dress,lace,upper body
範例二:白色有蕾絲洋裝,足部為焦點,鏡頭由下往上
提示詞: from below,stepped on,soles of feet,white dress,lace,full body
範例三:體育倉庫趴著手臂伸出,鏡頭由側面上方往下
提示詞: close to viewer,from above,from side, top-down bottom-up,arms up,sportswear,gym storeroom,upper body
範例四:體育倉庫女孩被男孩抱著,鏡頭由上方往下,聚焦胸部
提示詞: couple,1girl,1boy,faceless male,close to viewer,from above,top view,{{{breasts focus}}},leaning back,sitting on person,hug,eye contact,medium breasts,sportswear,gym storeroom,
範例五:各種視角的"跳躍"
提示詞:利用鏡頭提示詞如from below、from above等等,結合身體部位提示詞(要不要加focus就看個人了),像是ass、thigh、knee、crotch、calf、breasts等等,當然要完全亂數抽卡也是沒差啦
總之作為一個輔助工具,AI很好的解決了許多畫師在骨架方面的問題,專業一點的可能叫做人體的透視與變形,而且,不單單是人體,服裝在各種動作時因為施加的力道導致的變形,還有受環境(刮風、下雨淋濕)產生的變化,AI目前也訓練得很不錯,對了,AI還都幫你上色好了,那麼打光跟陰影自然也不成問題。
很多畫師其實都沒有很硬的素描底子,青少年時期甚至年過二十才開始學畫的人很多,這種半路出家的
畫師,我認為就相當需要AI來輔助,不用AI輔助就是燒錢燒時間,大量去書店或網路找or購買參考資料才能畫出這些比較難畫的角度。
而且,就我個人的經驗,要找到完美吻合心裡想像的參考圖,這其實是極其困難的,好比你想畫個俯瞰+跳躍+人物穿奇幻世界的服裝+20~25八頭身青年女性+長捲髮,要獲得同時滿足這五個條件的參考資料還真是挺困難的,不如用AI大量生成個50張,再從中挑選幾張比較OK來做參考(甚至你骨架放下面圖層照著描也沒人知道)
AI何時能進步到取代多數畫師?
這就不得不提到目前AI比較明顯的缺點了,或者說矛盾的點。
我試著用NAI3輸入
1girl,1boy,1dog,cowboy shot,The boy stands on the left, the woman stands in the middle, and the dog stands on the right
簡單來說就是一個男的站在左邊,女孩站中間,狗站右邊
沒有指定任何姿勢、動作、外表特徵,就是一個簡單的概念而已,我試著跑了10張,
結果只有2張半是合格的(但合格不代表好看啊),AI算有理解語意
這張就是所謂的一半合格的,從背面向前看,符合一個男的站在左邊,女孩站中間,狗站右邊
但是狗變成了狗頭人
![](https://truth.bahamut.com.tw/s01/202407/c3f3cc6ec6e960c8307b6da8303e0647.JPG)
其他七張就是像這種莫名其妙的,AI完全無法理解語意,那怕是這麼簡單的句子
可以發現AI只要主角一多就會開始亂了,一兩個主角很穩定,三個以上就常常亂畫了
這也是目前AI矛盾的地方,如果是人類的話,畫動態的且線條密集的圖,
比如一個穿哥德羅莉裝的少女在跑步,鏡頭採俯瞰視角
畫起來絕對相當費工夫,甚至很多畫師可能根本就畫不出來,而AI卻能輕鬆解決
但換成畫三個角色站著,沒有指定動作跟外觀特徵、鏡頭角度,對人類來說是絕對不可能畫錯的(頂多畫得不好看),但AI反倒有高達八成的機率會畫錯,而且是完全文不對題的那種很離譜的錯,明顯比人類糟糕許多,跟前者(畫困難的視角加動作)相比,實在非常矛盾。
這就引出了兩派說法,我們暫且稱為樂觀派與悲觀派好了
樂觀派認為,AI只是訓練還不足而已,2023年時,AI連兩個人牽手這種動作(人與人),甚至
一個人拿筷子吃拉麵(人+物品)都會畫錯,良率可能連5%都不到,而現在,在消耗大量的算力與時間對AI訓練後,現在這些問題都大幅改善了。
這一派的結論就是只要一直丟新素材給AI訓練,AI學會越來越多的東西,漸漸地,人類畫師有可能
會大量被AI取代。
而悲觀派則認為,AI終究是死讀書,死背一些特徵而已,而且特徵有時候還會混淆,像上面有張圖,為什麼狗會變成兩腳站立的呢?因為給AI訓練的圖中,有TAG上standing的訓練素材,絕大多數都是兩腳站立的,而AI無法意識到,狗是不可能兩腳站立的,才會犯這種錯,畫出了兩腳站立還穿人類衣服的狗
,只因為人類當初餵給AI訓練的素材中,訓練standing這個概念的圖,幾乎都是主角為人類的圖。
常常用AI生圖,而且積極挑戰各類題材的人,應該或多或少都有意識到AI這個特徵跟提示詞混淆的問題有多煩人,常常會出現你無法預料的結果(當然有時也會是驚喜就是)
這一派的結論就是,目前的訓練方法有可能到一個階段後開始陷入瓶頸,難以再進步,多半會卡在
這個特徵與提示詞混淆的問題,許多種構圖跟概念,其良率會一直在10%以下怎麼訓練都提升不起來,
此時AI的進步速度就開始放慢了,除非有人能研究出革命性的AI訓練方法