前言、
個(gè)人在這篇之前提到過的:「還有點(diǎn)東西想加、想改,但是不完美才是完美,就這樣吧。個(gè)人一個(gè)不懂樂理、不會(huì)寫歌詞、不會(huì)畫圖的人可以做到這樣...10年前想都不敢想。」
現(xiàn)在把一些當(dāng)時(shí)有過的想法加進(jìn)去,再把音樂做點(diǎn)修改。就成了靠AI製作的MV!如果只是要為了吸引目光,個(gè)人就跟其他YT一樣,用AI生成個(gè)一堆AI漂亮女性,用AI讓他做點(diǎn)擺首弄姿的動(dòng)作,再加上AI生成看似好聽的樂曲,隨便剪一剪當(dāng)成MV就可以拿去騙人了。
這影片不是為了這些,只是為了滿足個(gè)人的無法滿足的表達(dá)欲罷了。
至於為什麼AI創(chuàng)作不鈎?
幹,最好是AI有辦法把個(gè)人腦海裡的文字跟歷程直接Key出來啦!
文字創(chuàng)作不是創(chuàng)作嗎?
正文、
直接上主菜:
信仰的魔法 (信仰の魔法/The magic of faith)
來聊聊這影片怎麼做的吧。不過首先要感謝這些發(fā)展AI工具以及模型的人,對您們的努力,個(gè)人致上12萬分的謝意。沒有這些,個(gè)人根本做不出這首MV。AI發(fā)展到現(xiàn)在,終於因?yàn)閃AN 2.1,讓個(gè)人手邊貧困的電腦配備有機(jī)會(huì)做出這段影片; 之前用過混元,很可惜的是個(gè)人電腦配備真的跑不太起來。
一些前期工作都已經(jīng)在這篇完成,諸如歌詞、音樂的生成等等之類;這邊主要在講述AI影片的部分。其他的部分也有,但是著墨不會(huì)太多。
起點(diǎn)
先前做那首《翠色の檻》的時(shí)候,AI有生成出一首跟「戈培爾宣傳心得」不太搭軋的歡快樂曲。歌詞有一行讓個(gè)人印象深刻:「情感是信仰的魔法直擊心臟」。當(dāng)時(shí)心想,這不就是「相信的心就是你的魔法」嗎?
但是AI怎麼會(huì)生出這種歌詞?個(gè)人也很好奇,因?yàn)榻o他參考的「戈培爾宣傳心得精選16句」僅有提到情感跟信仰而已,AI會(huì)拿去跟魔法還有心臟做連結(jié)還真是沒想到,個(gè)人讓AI作詞的時(shí)候可是沒開Deep Search的。但是仔細(xì)一品,那個(gè)味兒卻是濃厚異常,讓這句話一直懸在個(gè)人心中。
直到WAN2.1出來,讓個(gè)人覺得好像可以用這個(gè)去做個(gè)MV?就把「情感是信仰的魔法直擊心臟」丟給Grok 3讓他以這句為主軸,改造個(gè)人原先哪首:《翠色の檻》的歌詞。輸出完後叫他自己再檢查一遍,做好慣老闆的Cosplay。
有歌詞了,接下來要怎麼構(gòu)思影像內(nèi)容、架構(gòu)呢?當(dāng)然是放棄思考丟給AI啦。小時(shí)候的卡拉OK都會(huì)放一些跟歌曲內(nèi)容完全無關(guān)的影片虛應(yīng)故事,當(dāng)然這個(gè)跟版權(quán)也有關(guān)係,個(gè)人也只是拿來說說嘴罷了。一般來說MV會(huì)有好幾種不同的做法,有的當(dāng)微電影拍、有的當(dāng)宣傳影片拍、有的就乾脆排場演唱會(huì)、等等不一而足。
順便一提,這次連曲風(fēng)都丟給Grok 3決定:
全部丟給SUNO,最後挑一手入個(gè)人耳朵的。
個(gè)人身邊的設(shè)備就官方指南來看,頂多就是5秒的短影片。就只能放棄用故事講述的想法,雖然還是有辦法可以做,但是要花錢,這邊有人做出來了(連結(jié)為YT影片)。個(gè)人一個(gè)免費(fèi)仔,花不起。
過程
個(gè)人Lora練不起(顯卡VRAM不夠),又不想花錢。那就用窮人的作法,讓Grok 3把單句歌詞的意象具體描述出來,個(gè)人把這個(gè)意象改一改丟給ComfyUI生成圖片,再用這個(gè)圖片丟給WAN 2.1去圖片生成影片。聽起來很簡單,過程之麻煩:
●出來的圖片不是每張都能用,要挑;提示詞不要拿AI產(chǎn)出直接用,最後出的圖很難達(dá)標(biāo)。
-這部分要去根據(jù)AI給出的意象具體化描述提示詞,畢竟個(gè)人用的生圖跟產(chǎn)文之AI不是同一個(gè)。
●圖片出來後,也不是單單丟給WAN 2.1生成就好,還要在提示詞裡具體描述出「主體、場景、運(yùn)動(dòng)、鏡頭語言、氛圍詞、風(fēng)格化。」不過這可以寫個(gè)系統(tǒng)提示詞讓AI去處理,倒是還好。不過出來的影片,一樣,要挑。
-把圖片轉(zhuǎn)化成WAN 2.1的提示詞交給AI作後還是要修,可能鏡頭運(yùn)鏡不對勁、或是明明運(yùn)鏡描述是對的,但是AI就是不生成你要的影片,AI轉(zhuǎn)蛋再現(xiàn)...。
●那怕到最後拼裝過程,還是會(huì)有這好像不太搭的感覺,然後上面流程再重複一遍 (昏倒。
●最前面那段歌手會(huì)有怪怪的地方,很簡單,因?yàn)槭?秒短影片,5秒5秒接起來的,雖然前5秒的最後一張圖是後5秒的第一張圖去生成,但是AI不知道,所以一定會(huì)怪怪的,救不了。就算是這位做的一鏡到底長影片,也能感覺得出來銜接點(diǎn)。
就算現(xiàn)在,個(gè)人也還是有想修改的地方;
之後就看看個(gè)人的能力在不花錢下能做到甚麼程度吧。
這篇就到這邊了,謝謝各位的觀看。