Kobold Sentinel Attack V1
實驗目標:
1.設法用武器用力的打擊目標
實驗設計:
1.任何弱點觸地皆失敗 (尾巴、武器和Calf並非弱點)
2.當武器OnCollisionEnter Player
//enterCoef = 0.05f
agent.AddReward( Mathf.Clamp01(collision.impulse.magnitude * enterCoef) );
實驗時間:
Step: 5e7
Time Elapsed: 172934s (48.04hr)
實驗結果:
實驗結果為不佳
狗頭人只能算是撞飛目標,但是是以武器為主
接下來實驗的可能性有
1.得分加上目標的速度
因此紅蓮被打飛的速度會變成得分
2.改變Layer
將ML的Layer增加,希望製造更複雜的行為
3.改用SAC
PPO有Gait的缺點,相較之下SAC因為不會形成Gait所以在循環動作效果很差,但說不定很適合攻擊這種情境
4.誘導攻擊預備動作
因為當前狗頭人進入Attack時,武器多在胸口,在Gait情況下幾乎不會做蓄力需要的拉引動作
因此可以誘導攻擊預備動作
例如狗頭人會有接近動作,並引導成和道爾一樣張開雙臂,以此誘導出"揮舞"的打擊攻擊
考慮狗頭人有拿個武器黏著目標的傾向,可以認為由於OnCollisionEnter可以大量得分
狗頭人才寧願拿著武器黏著對方,也沒有要大力揮擊的意思
因此OnCollisionEnter的得分應該改為一次性,也就是狗頭人只有一次透過打擊得分的機會
下個實驗是狗頭人攻擊
1.打擊得分變成僅限初擊
2.在打擊後,得分加上目標速度和角速度