(A1)veRL自定义奖励计算