q2_dagger_ant.csv

train_ep_lens_Average: 1000.0
train_ep_lens_Std: 0.0
train_ep_lens_Median: 1000.0
train_ep_lens_Min: 1000
train_ep_lens_Max: 1000
eval_ep_lens_Average: 1000.0
eval_ep_lens_Std: 0.0
eval_ep_lens_Median: 1000.0
eval_ep_lens_Min: 1000
eval_ep_lens_Max: 1000
train_returns_Average: 4713.6533
train_returns_Std: 12.196533
train_returns_Median: 4713.6533
train_returns_Min: 4701.4565
train_returns_Max: 4725.8496
eval_returns_Average: 2669.5461
eval_returns_Std: 1798.3542
eval_returns_Median: 2669.5461
eval_returns_Min: 871.19196
eval_returns_Max: 4467.9004
Train_EnvstepsSoFar: 0
TimeSinceStart: 5.798490524291992
Training Loss: 0.0016225475
reward_Average: 4.713653
reward_Std: 1.0507793
reward_Median: 4.807543
reward_Min: -1.6958617
reward_Max: 7.336165
eval_reward_Average: 2.6695461
eval_reward_Std: 1.912805
eval_reward_Median: 1.3043379
eval_reward_Min: -1.5003492
eval_reward_Max: 6.852286
Initial_DataCollection_AverageReturn: 4713.6533
train_ep_lens_Average: 1000.0
train_ep_lens_Std: 0.0
train_ep_lens_Median: 1000.0
train_ep_lens_Min: 1000
train_ep_lens_Max: 1000
eval_ep_lens_Average: 1000.0
eval_ep_lens_Std: 0.0
eval_ep_lens_Median: 1000.0
eval_ep_lens_Min: 1000
eval_ep_lens_Max: 1000
train_returns_Average: 4274.328
train_returns_Std: 0.0
train_returns_Median: 4274.328
train_returns_Min: 4274.328
train_returns_Max: 4274.328
eval_returns_Average: 4860.4736
eval_returns_Std: 16.900146
eval_returns_Median: 4860.4736
eval_returns_Min: 4843.573
eval_returns_Max: 4877.3735
Train_EnvstepsSoFar: 1000
TimeSinceStart: 10.007219552993774
Training Loss: 0.0010460976
reward_Average: 4.274328
reward_Std: 0.8239454
reward_Median: 4.2998734
reward_Min: -1.5688443
reward_Max: 6.6594625
eval_reward_Average: 4.8604736
eval_reward_Std: 0.9300238
eval_reward_Median: 4.920723
eval_reward_Min: -1.2025744
eval_reward_Max: 7.205182
Initial_DataCollection_AverageReturn: 4713.6533
train_ep_lens_Average: 1000.0
train_ep_lens_Std: 0.0
train_ep_lens_Median: 1000.0
train_ep_lens_Min: 1000
train_ep_lens_Max: 1000
eval_ep_lens_Average: 1000.0
eval_ep_lens_Std: 0.0
eval_ep_lens_Median: 1000.0
eval_ep_lens_Min: 1000
eval_ep_lens_Max: 1000
train_returns_Average: 4865.9326
train_returns_Std: 0.0
train_returns_Median: 4865.9326
train_returns_Min: 4865.9326
train_returns_Max: 4865.9326
eval_returns_Average: 4854.068
eval_returns_Std: 154.9253
eval_returns_Median: 4854.068
eval_returns_Min: 4699.1426
eval_returns_Max: 5008.993
Train_EnvstepsSoFar: 2000
TimeSinceStart: 14.347546815872192
Training Loss: 0.0005845155
reward_Average: 4.8659325
reward_Std: 0.9096779
reward_Median: 4.927509
reward_Min: -1.2004149
reward_Max: 7.2841744
eval_reward_Average: 4.854068
eval_reward_Std: 0.99549216
eval_reward_Median: 4.9275723
eval_reward_Min: -1.3141468
eval_reward_Max: 7.313232
Initial_DataCollection_AverageReturn: 4713.6533
train_ep_lens_Average: 1000.0
train_ep_lens_Std: 0.0
train_ep_lens_Median: 1000.0
train_ep_lens_Min: 1000
train_ep_lens_Max: 1000
eval_ep_lens_Average: 1000.0
eval_ep_lens_Std: 0.0
eval_ep_lens_Median: 1000.0
eval_ep_lens_Min: 1000
eval_ep_lens_Max: 1000
train_returns_Average: 4588.949
train_returns_Std: 0.0
train_returns_Median: 4588.949
train_returns_Min: 4588.949
train_returns_Max: 4588.949
eval_returns_Average: 4623.982
eval_returns_Std: 118.92041
eval_returns_Median: 4623.982
eval_returns_Min: 4505.0615
eval_returns_Max: 4742.9023
Train_EnvstepsSoFar: 3000
TimeSinceStart: 18.68288516998291
Training Loss: 0.00080293807
reward_Average: 4.588949
reward_Std: 1.0410414
reward_Median: 4.6973133
reward_Min: -1.2978941
reward_Max: 7.020527
eval_reward_Average: 4.623982
eval_reward_Std: 0.9830901
eval_reward_Median: 4.6673098
eval_reward_Min: -0.9474206
eval_reward_Max: 7.558122
Initial_DataCollection_AverageReturn: 4713.6533
train_ep_lens_Average: 1000.0
train_ep_lens_Std: 0.0
train_ep_lens_Median: 1000.0
train_ep_lens_Min: 1000
train_ep_lens_Max: 1000
eval_ep_lens_Average: 1000.0
eval_ep_lens_Std: 0.0
eval_ep_lens_Median: 1000.0
eval_ep_lens_Min: 1000
eval_ep_lens_Max: 1000
train_returns_Average: 4638.1636
train_returns_Std: 0.0
train_returns_Median: 4638.1636
train_returns_Min: 4638.1636
train_returns_Max: 4638.1636
eval_returns_Average: 4715.9062
eval_returns_Std: 75.51245
eval_returns_Median: 4715.9062
eval_returns_Min: 4640.394
eval_returns_Max: 4791.419
Train_EnvstepsSoFar: 4000
TimeSinceStart: 22.875478506088257
Training Loss: 0.000618203
reward_Average: 4.6381636
reward_Std: 0.9515305
reward_Median: 4.698634
reward_Min: -1.0876839
reward_Max: 7.161714
eval_reward_Average: 4.715906
eval_reward_Std: 1.1260725
eval_reward_Median: 4.894759
eval_reward_Min: -1.2903768
eval_reward_Max: 7.5141764
Initial_DataCollection_AverageReturn: 4713.6533