-
Notifications
You must be signed in to change notification settings - Fork 0
/
sra_iql_maze.sh
17 lines (12 loc) · 2.82 KB
/
sra_iql_maze.sh
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
python sra_iql.py --expert-data maze2d-umaze-expert-v1 --offline-data maze2d-umaze-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.7 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 0
python sra_iql.py --expert-data maze2d-umaze-expert-v1 --offline-data maze2d-umaze-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.7 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 1
python sra_iql.py --expert-data maze2d-umaze-expert-v1 --offline-data maze2d-umaze-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.7 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 2
python sra_iql.py --expert-data maze2d-umaze-expert-v1 --offline-data maze2d-umaze-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.7 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 3
python sra_iql.py --expert-data maze2d-medium-expert-v1 --offline-data maze2d-medium-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.5 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 0
python sra_iql.py --expert-data maze2d-medium-expert-v1 --offline-data maze2d-medium-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.5 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 1
python sra_iql.py --expert-data maze2d-medium-expert-v1 --offline-data maze2d-medium-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.5 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 2
python sra_iql.py --expert-data maze2d-medium-expert-v1 --offline-data maze2d-medium-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.5 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 3
python sra_iql.py --expert-data maze2d-large-expert-v1 --offline-data maze2d-large-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.5 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 0
python sra_iql.py --expert-data maze2d-large-expert-v1 --offline-data maze2d-large-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.5 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 1
python sra_iql.py --expert-data maze2d-large-expert-v1 --offline-data maze2d-large-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.5 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 2
python sra_iql.py --expert-data maze2d-large-expert-v1 --offline-data maze2d-large-v1 --expert-num 5 --max_timesteps 200000 --lr 1e-3 --model_ratio 0.5 --is_uniform_rollout True --lr-decay --rollout_length 5 --rollout_freq 20000 --seed 3