Doyle GetUp v14
實驗目標: 扣分制 + 快速進入站立瞬間
實驗設計:
1.lastReward = lookAngle * upAngle * 0.00025f + spineLookAngle * spineUpAngle * 0.00025f + rootLookAngle * rootUpAngle * 0.00025f + (leftThighUpAngle + leftCalfUpAngle + rightThighUpAngle + rightCalfUpAngle) * 0.0000625f - 0.001f;
2.if(doyleBodies[i].isWeakness)AddReward(-0.0001f * doyleBodies[i].damageCoef);
life -= 0.005f * doyleRootBody.damageCoef;
3.if(life <= 0f)float survivedTime = Time.fixedTime - arrivedMoment;AddReward( (survivedTime - judge.episodeLength) * 0.1f );judge.Reset();
4.if(!weaknessOnGround && lookAngle * upAngle > 0.9f && spineLookAngle * spineUpAngle > 0.9f && rootLookAngle * rootUpAngle > 0.9f && doyleLeftFeetBody.isStand && doyleRightFeetBody.isStand && leftThighUpAngle > 0.9f && leftCalfUpAngle > 0.9f && rightThighUpAngle > 0.9f && rightCalfUpAngle > 0.9f)AddReward(1f);judge.Reset();
//大致來說,根據頭胸腹和左右大腿小腿的角度來引導進入站立瞬間,以扣分制引導,弱點肢體觸地會處罰並耗損生命,當生命歸零會根據存活時間反比扣分並結束,進入站立瞬間則會得分並結束,耗損生命的反比係數,大於肢體角度和觸地處罰的最大扣分,藉此來避免快速自盡
實驗結果:
結果顯示為成功,道爾能有效率的受身並進入 "站立瞬間"
研究成果顯示兩個結論
1.扣分制的設計是可行的
2.站立和靜立在模型上分開會更容易實現
下個實驗將開始進行道爾追逐訓練
考量紅蓮追逐的成果有"實在跑得太快"的問題,道爾追逐實驗設計預計為
1.獎勵視線角度
2.獎勵適當速度,不低於最低速,但也不超過最高速