def parse_args(): parser = base_args() parser.add_argument('--algo', default='MontCarlo', type=str, help='algorithm name') parser.add_argument('--epochs', default=6, type=int, help='epochs of each iteration.') parser.add_argument('--batch_size', default=128, type=int, help='batch size') parser.add_argument('--rep_num', default=1, type=int, help='samples repeat number') parser.add_argument('--learning_rate', default=1e-5, type=float, help='learning rate') parser.add_argument('--gamma', default=1.0, type=float, help='discount rate') parser.add_argument('--c_entropy', default=0.001, type=float, help='entropy coefficient in loss') parser.add_argument('--update_steps', default=4, type=int, help='train times every batch') parser.add_argument('--decay_steps', default=3000, type=int, help='learning rate decay steps') parser.add_argument('--decay_rate', default=1.0, type=float, help='learning rate decay rate') parser.add_argument( '--timestamp', type=str, default=datetime.datetime.now().strftime("%Y%m%d%H%M%S")) parser.add_argument('--evaluator_path', type=str, default='model_eval', help='evaluator ckpt dir') FLAGS, _ = parser.parse_known_args() return FLAGS
def parse_args(): parser = base_args() parser.add_argument( '--algo', default='PointWise', type=str, help='PointWise, PairWise, ListWise, GroupWise, SoftRank') parser.add_argument('--epochs', default=30, type=int, help='epochs of each iteration.') parser.add_argument('--batch_size', default=256, type=int, help='batch size') parser.add_argument('--learning_rate', default=1e-4, type=float, help='learning rate') parser.add_argument('--decay_steps', default=1000, type=int, help='learning rate decay steps') parser.add_argument('--decay_rate', default=0.99, type=float, help='learning rate decay rate') parser.add_argument('--loss', default='mse', type=str, help='loss function') parser.add_argument('--l2_regu', default=0.0001, type=float, help='l2 loss scale') parser.add_argument('--group_size', default=10, type=int, help='GroupWise, group size.') parser.add_argument('--timestamp', type=str, default=datetime.datetime.now().strftime("%Y%m%d%H%M")) parser.add_argument('--evaluator_path', type=str, default='model_eval', help='evaluator ckpt dir') FLAGS, _ = parser.parse_known_args() return FLAGS
def parse_args(): parser = base_args() parser.add_argument('--algo', default='ctr_model', type=str, help='algorithm name') parser.add_argument('--epochs', default=200, type=int, help='epochs of each iteration.') parser.add_argument('--batch_size', default=1024, type=int, help='batch size') parser.add_argument('--learning_rate', default=1e-3, type=float, help='learning rate') parser.add_argument('--decay_steps', default=500, type=int, help='learning rate decay steps') parser.add_argument('--decay_rate', default=0.99, type=float, help='learning rate decay rate') parser.add_argument('--keep_prob', default=0.8, type=float, help='dropout keep_prob') parser.add_argument('--l2_regu', default=0.0, type=float, help='l2 loss scale') parser.add_argument('--timestamp', type=str, default=datetime.datetime.now().strftime("%Y%m%d%H%M")) FLAGS, _ = parser.parse_known_args() return FLAGS
def parse_args(): parser = base_args() parser.add_argument('--algo', default='ppo-gae-rerank', type=str, help='algorithm name') parser.add_argument('--epochs', default=3, type=int, help='epochs of each iteration.') parser.add_argument('--batch_size', default=16, type=int, help='batch size') parser.add_argument('--rep_num', default=32, type=int, help='samples repeat number') parser.add_argument('--learning_rate', default=1e-5, type=float, help='learning rate') parser.add_argument('--c_entropy', default=0.001, type=float, help='entropy coefficient in loss') parser.add_argument('--update_steps', default=10, type=int, help='train times every batch') parser.add_argument('--decay_steps', default=3000, type=int, help='learning rate decay steps') parser.add_argument('--decay_rate', default=1.0, type=float, help='learning rate decay rate') parser.add_argument('--clip_value_vf', default=10, type=float) parser.add_argument('--c_vf', default=0.1, type=float) parser.add_argument('--gamma', default=0.99, type=float, help='discount rate') parser.add_argument('--lam', default=0.98, type=float) parser.add_argument('--vf_share', type=bool, default=True, action='store_false', help='share network') parser.add_argument('--timestamp', type=str, default=datetime.datetime.now().strftime("%Y%m%d%H%M")) parser.add_argument('--evaluator_path', type=str, default='model_eval', help='evaluator ckpt dir') FLAGS, _ = parser.parse_known_args() return FLAGS