ETH官方钱包

前往
大廳
主題

紅蓮受身6

夏洛爾 | 2022-05-21 23:38:03 | 巴幣 0 | 人氣 103


和紅蓮受身5完全相同場景採用SAC訓(xùn)練

訓(xùn)練結(jié)果大相逕庭
是一個喜歡靜止站立的紅蓮
另外視線角度會喬得很準(zhǔn)

但基本上不移動,不知道在其成長過程中到底發(fā)生了什麼

由於電腦變好現(xiàn)在訓(xùn)練進(jìn)度飛快,女兒一下就長大了,總是不知不覺錯過女兒的成長過程

但可以得證PPO和SAC可以在同問題有完全不同的發(fā)展傾向與結(jié)果,但由於Obersevation和Action相同,所以根據(jù)情況可以應(yīng)用在Model切換

下個實驗將在紅蓮受身5的成果上進(jìn)行
Force Sharping

更多創(chuàng)作