Esempio n. 1
0
def parse_args():
    parser = base_args()
    parser.add_argument('--algo',
                        default='MontCarlo',
                        type=str,
                        help='algorithm name')
    parser.add_argument('--epochs',
                        default=6,
                        type=int,
                        help='epochs of each iteration.')
    parser.add_argument('--batch_size',
                        default=128,
                        type=int,
                        help='batch size')
    parser.add_argument('--rep_num',
                        default=1,
                        type=int,
                        help='samples repeat number')
    parser.add_argument('--learning_rate',
                        default=1e-5,
                        type=float,
                        help='learning rate')
    parser.add_argument('--gamma',
                        default=1.0,
                        type=float,
                        help='discount rate')
    parser.add_argument('--c_entropy',
                        default=0.001,
                        type=float,
                        help='entropy coefficient in loss')
    parser.add_argument('--update_steps',
                        default=4,
                        type=int,
                        help='train times every batch')
    parser.add_argument('--decay_steps',
                        default=3000,
                        type=int,
                        help='learning rate decay steps')
    parser.add_argument('--decay_rate',
                        default=1.0,
                        type=float,
                        help='learning rate decay rate')
    parser.add_argument(
        '--timestamp',
        type=str,
        default=datetime.datetime.now().strftime("%Y%m%d%H%M%S"))
    parser.add_argument('--evaluator_path',
                        type=str,
                        default='model_eval',
                        help='evaluator ckpt dir')
    FLAGS, _ = parser.parse_known_args()
    return FLAGS
Esempio n. 2
0
def parse_args():
    parser = base_args()
    parser.add_argument(
        '--algo',
        default='PointWise',
        type=str,
        help='PointWise, PairWise, ListWise, GroupWise, SoftRank')
    parser.add_argument('--epochs',
                        default=30,
                        type=int,
                        help='epochs of each iteration.')
    parser.add_argument('--batch_size',
                        default=256,
                        type=int,
                        help='batch size')
    parser.add_argument('--learning_rate',
                        default=1e-4,
                        type=float,
                        help='learning rate')
    parser.add_argument('--decay_steps',
                        default=1000,
                        type=int,
                        help='learning rate decay steps')
    parser.add_argument('--decay_rate',
                        default=0.99,
                        type=float,
                        help='learning rate decay rate')
    parser.add_argument('--loss',
                        default='mse',
                        type=str,
                        help='loss function')
    parser.add_argument('--l2_regu',
                        default=0.0001,
                        type=float,
                        help='l2 loss scale')
    parser.add_argument('--group_size',
                        default=10,
                        type=int,
                        help='GroupWise, group size.')
    parser.add_argument('--timestamp',
                        type=str,
                        default=datetime.datetime.now().strftime("%Y%m%d%H%M"))
    parser.add_argument('--evaluator_path',
                        type=str,
                        default='model_eval',
                        help='evaluator ckpt dir')
    FLAGS, _ = parser.parse_known_args()
    return FLAGS
Esempio n. 3
0
def parse_args():
    parser = base_args()
    parser.add_argument('--algo',
                        default='ctr_model',
                        type=str,
                        help='algorithm name')
    parser.add_argument('--epochs',
                        default=200,
                        type=int,
                        help='epochs of each iteration.')
    parser.add_argument('--batch_size',
                        default=1024,
                        type=int,
                        help='batch size')
    parser.add_argument('--learning_rate',
                        default=1e-3,
                        type=float,
                        help='learning rate')
    parser.add_argument('--decay_steps',
                        default=500,
                        type=int,
                        help='learning rate decay steps')
    parser.add_argument('--decay_rate',
                        default=0.99,
                        type=float,
                        help='learning rate decay rate')
    parser.add_argument('--keep_prob',
                        default=0.8,
                        type=float,
                        help='dropout keep_prob')
    parser.add_argument('--l2_regu',
                        default=0.0,
                        type=float,
                        help='l2 loss scale')
    parser.add_argument('--timestamp',
                        type=str,
                        default=datetime.datetime.now().strftime("%Y%m%d%H%M"))
    FLAGS, _ = parser.parse_known_args()
    return FLAGS
Esempio n. 4
0
def parse_args():
    parser = base_args()
    parser.add_argument('--algo',
                        default='ppo-gae-rerank',
                        type=str,
                        help='algorithm name')
    parser.add_argument('--epochs',
                        default=3,
                        type=int,
                        help='epochs of each iteration.')
    parser.add_argument('--batch_size',
                        default=16,
                        type=int,
                        help='batch size')
    parser.add_argument('--rep_num',
                        default=32,
                        type=int,
                        help='samples repeat number')
    parser.add_argument('--learning_rate',
                        default=1e-5,
                        type=float,
                        help='learning rate')
    parser.add_argument('--c_entropy',
                        default=0.001,
                        type=float,
                        help='entropy coefficient in loss')
    parser.add_argument('--update_steps',
                        default=10,
                        type=int,
                        help='train times every batch')
    parser.add_argument('--decay_steps',
                        default=3000,
                        type=int,
                        help='learning rate decay steps')
    parser.add_argument('--decay_rate',
                        default=1.0,
                        type=float,
                        help='learning rate decay rate')

    parser.add_argument('--clip_value_vf', default=10, type=float)
    parser.add_argument('--c_vf', default=0.1, type=float)
    parser.add_argument('--gamma',
                        default=0.99,
                        type=float,
                        help='discount rate')
    parser.add_argument('--lam', default=0.98, type=float)
    parser.add_argument('--vf_share',
                        type=bool,
                        default=True,
                        action='store_false',
                        help='share network')

    parser.add_argument('--timestamp',
                        type=str,
                        default=datetime.datetime.now().strftime("%Y%m%d%H%M"))
    parser.add_argument('--evaluator_path',
                        type=str,
                        default='model_eval',
                        help='evaluator ckpt dir')
    FLAGS, _ = parser.parse_known_args()
    return FLAGS