多機器人訓練和測試的程式
Agent.py Network.py Training.py
是為了讓訓練上比較統一 但實際上寫得不算完整
不建議直接拿去使用
若要修改網路參數 請調整Network.py
multi_robot_network.py multi_robot_test.py
原先是搭配上面使用 統一的code 但實務應用時有些未排除的bug
使用上要注意一下
For_test 系列程式是為了手動輸入測試各種狀態所使用的程式
後綴VO代表有考慮是否在VO內來調整獎勵;後綴Sat代表有進一步考慮輸出命令的飽和