最近比較大的事大概就是ai作畫了吧。深度學習這檔事,也不是一天兩天的新鮮事,但隨著這陣子愈來愈多公司開始商品化,也漸漸進入大眾的生活與認知中。
如文章寫作,可以根據(jù)特定的關鍵字、大綱來直接產(chǎn)生一篇文章,可能有人會認為短文產(chǎn)生這種東西不是N年前就有了嗎?使用者面來說或許真是如此,但從原理上來說則大相逕庭。而這個差距從文字變成圖畫的時候就更能感受到差異。
以前的文章產(chǎn)生,是事先人工寫好特定的句子,再將關鍵字代入,加上隨機性來產(chǎn)生文章,能產(chǎn)生的結果是很有限的(因為大部分成分是人工打造);圖畫方面如人物造型產(chǎn)生(如巴哈姆特勇者造型)則是先準備了各個部位的素材,再由拼接的方式產(chǎn)生不同組合的圖案。很明顯地,這些「變化」都被侷限在了「事先的安排」中。然現(xiàn)在的深度學習,可以理解為程式跟人類嬰兒一樣,經(jīng)由不斷不斷的「認知修正」來達到真正的創(chuàng)作。再更高難度一點的領域來說,音樂在不久的未來也可以達到更高審美的弦律水平。
以前的文章產(chǎn)生,是事先人工寫好特定的句子,再將關鍵字代入,加上隨機性來產(chǎn)生文章,能產(chǎn)生的結果是很有限的(因為大部分成分是人工打造);圖畫方面如人物造型產(chǎn)生(如巴哈姆特勇者造型)則是先準備了各個部位的素材,再由拼接的方式產(chǎn)生不同組合的圖案。很明顯地,這些「變化」都被侷限在了「事先的安排」中。然現(xiàn)在的深度學習,可以理解為程式跟人類嬰兒一樣,經(jīng)由不斷不斷的「認知修正」來達到真正的創(chuàng)作。再更高難度一點的領域來說,音樂在不久的未來也可以達到更高審美的弦律水平。
圖一:ai產(chǎn)生的圖畫,可以看出背景有瑕疵不合理
除了這項技術利用的方法導致一些行業(yè)的擔憂與不滿外,訓練過程所使用的資源也是爭議之源之一,因為機器學習需要大量的樣本,往往這些樣本的來源就是最大的問題。如程式方面就利用了github上面大量的開放原始碼;而做畫方面卻被爆出使用未授權的圖片來進行訓練,如此訓練後的模型產(chǎn)生的圖片進行商業(yè)使用,權力問題又該如何維權呢?經(jīng)過良好訓練後的模型產(chǎn)出的圖,不是一般的「PS拼貼縫合」了,而是仿製了人類的審美一般,知道「哪裡該是怎麼樣」而產(chǎn)生的作品。如此一來首先證明他使用了你的圖片進行訓練就相當困難。
圖二:ai產(chǎn)生的圖畫
隨意滑到的相關討論都炸成一片了。有外行的喜聞樂見,也有畫師完全反對這類技術,諸如畫師是否將來會被取代啊之類的討論更是討論得轟轟烈烈。個人認為,隨著文明的進步肯定愈來愈多東西是會被「更輕鬆完成」的,將來是怎樣的市場人才需求不好說,但在那之前換個角度看待這些東西,不必視為競爭對手,就像裁縫機一樣也可以是很好的幫手。程式領域目前還不會完全取代程序員,但可以讓程序員更快速的把想做的事情處理完成;畫畫亦是如此,假設想畫某種姿勢的角色,就能先用ai 做圖快速產(chǎn)生一個骨架出來,再以此為參考自己進行創(chuàng)作來完成真正屬於自己的作品;又如現(xiàn)在3渲2研究較成熟,一些過往很容易崩的動畫場景現(xiàn)在可以用3d來製作精良的動畫(其中hoyoverse 米哈遊也是知名的佼佼者),這樣的話又何嘗不是一種良好的技術發(fā)展呢?
相關資料:
圖片創(chuàng)作:https://novelai.net/
音樂創(chuàng)作:https://play.generative.fm/browse