Amortizing action

The code for the SAC algorithm was built on top of this curl repo This code can be adapated for pixels, but is currently focused on states

Check standard deviation, it had been changed **Uses weight scheme **

Install

conda environment (curl) taken from the conda_env.yml file
torch has been downgraded conda install pytorch==1.2.0 torchvision==0.4.0 cudatoolkit=10.0 -c pytorch, and tensorboard has been removed

git clone https://github.com/alec-tschantz/mbmf.git
cd mbmf
conda activate curl
python scripts/sac_script.py

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
mbmf		mbmf
LICENSE		LICENSE
README.md		README.md
conda_env.yml		conda_env.yml
generate_prelim_experiments.py		generate_prelim_experiments.py
hybrid_script.py		hybrid_script.py
mpc_script.py		mpc_script.py
nohup.out		nohup.out
run_experiment.sh		run_experiment.sh
sac_script.py		sac_script.py
setup_single_experiment.sh		setup_single_experiment.sh
state_aug_sac_experiments.sh		state_aug_sac_experiments.sh
test_script.py		test_script.py
train_exp.sh		train_exp.sh
train_script.py		train_script.py