Python Trainer.collect_experiance_and_train示例

编程语言: Python

命名空间/包名称: train

类/类型: Trainer

方法/功能: collect_experiance_and_train

hotexamples.com的示例: 1

Python Trainer.collect_experiance_and_train - 已找到1个示例。这些是从开源项目中提取的最受好评的train.Trainer.collect_experiance_and_train现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Trainer(30)

fit(10)

evaluate(9)

add_subscriber(7)

__init__(3)

find_last(3)

eval(3)

checkpoint(2)

Train(1)

embed_text(1)

ensemble(1)

epoch(1)

evalu(1)

evaluate_xnlu(1)

evaluate_meanIOU(1)

evaluate_pair(1)

detect(1)

extract_tokens(1)

fill_evaluation(1)

fine_tune_encoder(1)

generate(1)

generate_txt(1)

distribute(1)

current_epoch(1)

data_generation(1)

best_test_acc(1)

_init_model(1)

_publish_artifact(1)

_train_gan(1)

adaboost(1)

analyze(1)

begin_training(1)

benchmark(1)

build(1)

current_lr(1)

classify_user(1)

collect_experiance_and_train(1)

collect_experience_and_train(1)

compute_accuracy(1)

configure(1)

create(1)

create_graph(1)

get_transformed_data(1)

示例#1

显示文件

文件： main.py 项目： Justkim/random-network-distillation-pytorch

    flag.LOAD = True
else:
    flag.LOAD = False


if args.env_type == "MR":
    num_action = 18  # number of actions for montezuma revenge
    flag.ENV = "MR"

if flag.TRAIN:
    new_trainer = Trainer(num_training_steps=args.train_steps,
                          num_env=args.num_env, num_game_steps=args.game_steps,
                          num_epoch=args.num_epoch, learning_rate=args.lr,
                          discount_factor=args.gamma,
                          int_discount_factor=args.int_gamma,
                          num_action=num_action, clip_range=args.clip_range,
                          value_coef=args.value_coef,
                          save_interval=args.save_int,
                          entropy_coef=args.ent_coef, lam=args.lambda_gae,
                          mini_batch_num=args.mini_batch,
                          num_action_repeat=args.action_re,
                          load_path=args.path, ext_adv_coef=args.ext_adv_coef,
                          int_adv_coef=args.int_adv_coef,
                          num_pre_norm_steps=args.num_pre_norm_steps,
                          predictor_update_proportion=args.predictor_update_p)
    new_trainer.collect_experiance_and_train()
elif flag.PLAY:

    new_player = Player(load_path=args.path)
    new_player.play()