主題

狗頭人哨兵攻擊 6 -- 我家的孩子終於學會用武器了!

夏洛爾 | 2023-02-23 12:12:44 | 巴幣 0 | 人氣 244

Kobold Sentinel Attack V6

實驗目標:

1.設法用武器用力的打擊目標

實驗設計:

1.任何弱點觸地皆失敗 (尾巴、武器和Calf並非弱點)

2.當武器OnCollisionEnter Player

會傳送collision.impulse

//impulseRewardCoef = 0.05f

public void HitWithWeapon(Vector3 impulse){if(!hitTarget){avgVelocity = velocityBuffer.GetSmoothVal();hitOnVelocity = avgVelocity.normalized;float reward = Vector3.ProjectOnPlane(impulse, hitOnVelocity).magnitude * impulseRewardCoef;lastReward += reward;totalReward += reward;AddReward( reward );arrivedMoment = Time.fixedTime;hitTarget = true;}}

3.

//Set: judge.endEpisode = true//Set: judge.episodeLength = 3.3f//Set: weapon, tail not weakness//Set: useClampReward = trueif(weaknessOnGround){if(inferenceMode){brainMode = BrainMode.GetUp;SetModel("KoboldGetUp", getUpBrain);behaviorParameters.BehaviorType = BehaviorType.InferenceOnly;}else{// ===Train Attack===if(!hitTarget){float survivedTime = Time.fixedTime - arrivedMoment;if(survivedTime < judge.episodeLength ){AddReward( (survivedTime - judge.episodeLength) * 0.1f );}}judge.outLife++;judge.Reset();return;//===Train Other===// brainMode = BrainMode.GetUp;// SetModel("KoboldGetUp", getUpBrain);// behaviorParameters.BehaviorType = BehaviorType.InferenceOnly;}}else if(koboldRoot.localPosition.y < -1f){if(inferenceMode){brainMode = BrainMode.GetUp;SetModel("KoboldGetUp", getUpBrain);behaviorParameters.BehaviorType = BehaviorType.InferenceOnly;}else{// ===Train Attack===if(!hitTarget){float survivedTime = Time.fixedTime - arrivedMoment;if(survivedTime < judge.episodeLength ){AddReward( (survivedTime - judge.episodeLength) * 0.3f );}}judge.outY++;judge.Reset();return;// ===Train Other===// brainMode = BrainMode.GetUp;// SetModel("KoboldGetUp", getUpBrain);// behaviorParameters.BehaviorType = BehaviorType.InferenceOnly;}}/*else if( IsCollideWithBody() ){if(inferenceMode){brainMode = BrainMode.GetUp;SetModel("KoboldGetUp", getUpBrain);behaviorParameters.BehaviorType = BehaviorType.InferenceOnly;}else{// ===Train Attack===if(!hitTarget){float survivedTime = Time.fixedTime - arrivedMoment;if(survivedTime < judge.episodeLength ){AddReward( (survivedTime - judge.episodeLength) * 0.1f );}}judge.outLife++;judge.Reset();return;//===Train Other===// brainMode = BrainMode.GetUp;// SetModel("KoboldGetUp", getUpBrain);// behaviorParameters.BehaviorType = BehaviorType.InferenceOnly;}}*/else{if(hitTarget){targetSmoothVelocity = targetVelocityBuffer.GetSmoothVal();lastReward = Vector3.ProjectOnPlane(targetSmoothVelocity, hitOnVelocity).magnitude * 0.01f;totalReward += lastReward;AddReward(lastReward);if(inferenceMode){if(hasArrived && Time.fixedTime - arrivedMoment >= judge.episodeLength){hitTarget = false;brainMode = BrainMode.GetUp;SetModel("KoboldGetUp", getUpBrain);behaviorParameters.BehaviorType = BehaviorType.InferenceOnly;}}}}

//大致來說

在命中目標時紀錄當下自身的移動方向

之後，獎勵和移動方向不一樣的敵人速度值

然後暫時取消不能碰撞敵人的限制

實驗時間:

Step: 5e7

Time Elapsed: 220422s (61.23hr)

實驗結果:

實驗結果為成功，狗頭人很明顯的使用武器將目標打擊至其他方向

實驗證實果然誘導方式合適的情況，ML還是能處理這種問題

但目前有三個缺點

1.打擊的方式感覺沒有很猛