Python seeds Beispiele, plum2.seeds Python Beispiele

Beispiel #1

0

Datei anzeigen

def main():
    parser = argparse.ArgumentParser(
        "Train Viggo transformer model (ls=inc freq, da=base+phrases)")
    parser.add_argument("output_dir", type=Path, help="save directory")
    parser.add_argument("--seed", type=int, default=234222452)
    parser.add_argument("--layers", default=2, type=int, help="num layers")
    parser.add_argument("--ls", default=0.1, type=float, 
                        help="label smoothing")
    parser.add_argument("--wd", default=0.0, type=float, 
                        help="weight decay")
    parser.add_argument("--opt", choices=["adam", "sgd"], default="sgd",
                        help='optimizer')
    parser.add_argument("--lr", default=0.5, type=float, 
                        help="learning rate")
    parser.add_argument("--tie-embeddings", action="store_true",
                        help="share decoder input/output embeddings")
    parser.add_argument("--attn", choices=['bahdanau', 'luong-general'],
                        default='luong-general', help='attention type')
    parser.add_argument("--max-epochs", default=100, type=int,
                        help="max training epochs")
    parser.add_argument("--gpu", default=-1, type=int)
    parser.add_argument("--n-procs", default=2, type=int, 
                        help="num data loader processes")
    parser.add_argument("--tr-batch-size", default=128, type=int,
                        help="training batch size")
    parser.add_argument("--va-batch-size", default=1, type=int,
                        help="valid batch size")
    args = parser.parse_args()

    seeds(args.seed)
    assert os.getenv("MRT_EVAL_SCRIPT") is not None
    eval_script = os.getenv("MRT_EVAL_SCRIPT")

    dataset = "E2E"
    lin_strat = "inc_freq"
    is_delex = False

    mr_vcb, utt_vcb = setup_vocab(dataset, lin_strat, is_delex)
    tr_ds = setup_training_data(dataset, lin_strat, is_delex, mr_vcb, utt_vcb,
                                include_phrases=True)
    va_ds = setup_validation_data(dataset, lin_strat, is_delex,
                                  mr_vcb, utt_vcb)

    tr_batches = make_batches(tr_ds, args.tr_batch_size, args.n_procs, 
                              lin_strat, is_delex)
    va_batches = make_batches(va_ds, args.va_batch_size, args.n_procs, 
                              lin_strat, is_delex)
    
    model = setup_model("gru", "bi", args.layers, args.attn,
                        args.tie_embeddings, mr_vcb, utt_vcb, beam_size=8)


    trainer = setup_trainer(model, args.opt, args.lr, args.wd, args.ls, 
                            tr_batches, va_batches, args.max_epochs, 
                            utt_vcb, eval_script, mr_utils, 
                            lambda: f"E2E/bi-gru/if/base+phrases/{args.seed}")

    env = {'proj_dir': args.output_dir, "gpu": args.gpu}
    trainer.run(env, verbose=True)

Beispiel #2

0

Datei anzeigen

Datei: viggo.tf.if.bp.py Projekt: kedz/mrt

def main():
    parser = argparse.ArgumentParser(
        "Train Viggo transformer model (ls=inc freq, da=base+phrases)")
    parser.add_argument("output_dir", type=Path, help="save directory")
    parser.add_argument("--seed", type=int, default=234222452)
    parser.add_argument("--layers", default=2, type=int, help="num layers")
    parser.add_argument("--ls", default=0.1, type=float, 
                        help="label smoothing")
    parser.add_argument("--tie-embeddings", action="store_true",
                        help="share decoder input/output embeddings")
    parser.add_argument("--max-epochs", default=100, type=int,
                        help="max training epochs")
    parser.add_argument("--gpu", default=-1, type=int)
    parser.add_argument("--n-procs", default=2, type=int, 
                        help="num data loader processes")
    parser.add_argument("--tr-batch-size", default=128, type=int,
                        help="training batch size")
    parser.add_argument("--va-batch-size", default=1, type=int,
                        help="valid batch size")
    args = parser.parse_args()

    seeds(args.seed)
    assert os.getenv("MRT_EVAL_SCRIPT") is not None
    eval_script = os.getenv("MRT_EVAL_SCRIPT")

    dataset = "Viggo"
    lin_strat = "inc_freq"
    is_delex = True

    mr_vcb, utt_vcb = setup_vocab(dataset, lin_strat, is_delex)
    tr_ds = setup_training_data(dataset, lin_strat, is_delex, mr_vcb, utt_vcb,
                                include_phrases=True)
    va_ds = setup_validation_data(dataset, lin_strat, is_delex,
                                  mr_vcb, utt_vcb)

    tr_batches = make_batches(tr_ds, args.tr_batch_size, args.n_procs, 
                              lin_strat, is_delex)
    va_batches = make_batches(va_ds, args.va_batch_size, args.n_procs, 
                              lin_strat, is_delex)
    
    model = setup_model("transformer", None, args.layers, None,
                        args.tie_embeddings, mr_vcb, utt_vcb, beam_size=8)


    trainer = setup_trainer(model, "adamtri", None, None, args.ls, tr_batches, 
                            va_batches, args.max_epochs, utt_vcb, eval_script, 
                            mr_utils, 
                            lambda: f"Viggo/transformer/if/base+phrases/{args.seed}")

    env = {'proj_dir': args.output_dir, "gpu": args.gpu}
    trainer.run(env, verbose=True)

Beispiel #3

0

Datei anzeigen

Datei: dialog_planner.config.py Projekt: kedz/mrt

    return [SOS] + tokens


def make_decoder_output(example):
    ei_tokens = make_encoder_input(example)
    di_tokens = make_decoder_input(example)

    do_indices = []
    for tok in di_tokens[1:] + [EOS]:
        idx = ei_tokens.index(tok)
        do_indices.append(idx)

    return do_indices


seeds(234222452)
save_dir = Path("experiments", "viggo", "dialog_planner")
work_dir(save_dir)

LR = HP('LR', 0.0001, description='learning rate')
BS = HP('BS', 128, description='batch size')
VBS = HP('VBS',
         32,
         description='validation set batch size (smaller for beam search)')
L = HP('L', 2, description='num layers')

with plum2.dataset("viggo.train") as tr:
    tr.jsonl("data/viggo/viggo.train.jsonl")

    with tr.vocab("mr") as mrs:
        mrs.apply_func(make_encoder_input).pad().start(SOS).stop(EOS)