首先 Init_Path 和 Initialize_from 的使用失敗了
目前已實(shí)驗(yàn)讓訓(xùn)練出來(lái)的模型,馬上被用來(lái)在相同場(chǎng)景的新訓(xùn)練使用
然而新訓(xùn)練起初能模仿,卻會(huì)迅速的失效而且卡在低谷
目前已在論壇發(fā)問(wèn),但感覺(jué)會(huì)得不到答案,目前只有另一個(gè)開(kāi)發(fā)者說(shuō)他有成功使用的經(jīng)驗(yàn)
因此有可能
1.只能應(yīng)用在更複雜或不同的場(chǎng)景
2.紅蓮基於一些理由不適用
1.只能應(yīng)用在更複雜或不同的場(chǎng)景
2.紅蓮基於一些理由不適用
但是進(jìn)行了簡(jiǎn)化的受身研究
紅蓮出生速度會(huì)逐漸增大隨機(jī)範(fàn)圍
紅蓮必須在指定時(shí)間內(nèi)跑出最低限速
實(shí)驗(yàn)結(jié)果如影片,紅蓮是能夠?qū)瓜蜥嵝n力並開(kāi)始奔跑的
但觀測(cè)起來(lái)觸地後允許加速的時(shí)間太短了,導(dǎo)致條件不利的紅蓮煞車完無(wú)法及時(shí)加速
另外受身研究有部份成功的案例
紅蓮在第一組衝力下,能自己站穩(wěn)後開(kāi)始跑動(dòng)
也就是先前失敗的研究可能是紅蓮沒(méi)有足夠的時(shí)間探索
因此下一個(gè)研究將
1.拉長(zhǎng)對(duì)擊打訓(xùn)練的觸地後允許加速時(shí)間
2.最低速限改為10
3.Max Step = 1500
4.life 改為 在0.01與訓(xùn)練最大值隨機(jī)
其他預(yù)想到的研究變因
1.觸地後才開(kāi)始計(jì)分
2.Curiosity