聽說Midjourney發布了新的v6.1模型,新增許多參數設定以及客製化選項可供使用。
於是久違地把先前註冊好的網頁版拿出來測試:
生成的角色 (模特兒) 仍是我們熟悉的阿努比斯,而這回會著重在角色姿勢跟身上配件等細節,看看新版的模型有無改善AI的老毛病。
先前v6.0模型的生成圖 (對照用)
第一張生成圖
跟先前v6.0模型相似,AI試著生成Midjourney獨特的動漫手繪風格圖片。
這張的角色姿勢應該是讓阿努靠在石柱上,不過視覺上仍有小瑕疵。而圖像的連貫性是v6.1模型強調的重點項目,最明顯的地方是手部,AI不擅長處理的手指頭跟肌肉比例,現階段看起來有較正常的人體解剖學概念。
另外,我輸入的指令刻意加了創造果實 (參照三階的描述),原本以為是蘋果等圓形物體,不過這張看起來像是葡萄,至少輪廓是對的(?)。雖然無法呈現寫實的葉片細節,AI試著用模型既有的元素,讓整體畫面具有協調性。
第二張生成圖
把「支配冥界力量」挪到前面,讓AI優先以此關鍵字來生成對應圖片。
就結果來說是成功的構圖,背景的火焰襯托出阿努的神祕性。基於「力量」一詞,肌肉也變得更結實了。雖然線條表現是誇張些,這張跟我預想的阿努比斯貼合度更高。
順帶一提,創造果實的指令仍保留著,只是AI把果實塞在左下角,還被裁切掉大部分。如果把圖片比例修改,也許就能看到了。
第三張生成圖
以第一張圖為基礎,加了Vary "Strong",讓AI自由發揮的產物。
角色仍維持半身圖,不過阿努身上的金色裝飾做了更動,背後的披風跟背景融為一體,有了不同的氛圍。裝飾品跟前兩張圖相比,精緻度提高許多,還表現出金屬薄片 (或者鍍金) 的質感。
至於創造果實,從這張圖看起來是被拿掉了,應該是為了整體性去除相關性較低的元素。
第四張生成圖
順位上應該是第一張圖片,生成指令我刻意加入鮮豔彩色背景 (vibrant colorful background) 跟古代神秘感 (sense of ancient mysticism),並讓Midjourney自由發揮。
以相同指令搭配Leonardo ai的成果 (下圖),雖然也運用了大量顏色繽紛的背景,整體給人的印象像是阿努處在高維度空間世界,沒有古代埃及文明散發出的神祕。
兩張構圖其實都不錯,Leonardo ai的生成圖片較寫實,只是細部的人體結構跟肌肉線條不太協調,變得人物的重心稍微偏移 (大概是使用的模型不合)。Midjourney的阿努,像似從石版畫跑出來,神秘感更加凸顯。
結論嘛
Midjourney當前的v6.1模型,圖片呈現了細微差別和較高的精確度。主要還是圖片看起來更平滑,一些抽象文字跟標誌的呈現看起來不馬虎 (官方說法是整體保真度提升),視覺觀感上吸引力確實不同。
如果Midjourney能再讓角色配件跟物品的連貫性再提升,可以生成更複雜的圖片。希望v6.2模型有更多驚喜 (正面)。
以上