Python Trainer 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: chaine.crf

메소드/함수: Trainer

hotexamples.com에서의 예제들: 12

Python Trainer - 12개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 chaine.crf.Trainer에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def test_training(tmpdir, dataset):
    trainer = crf.Trainer()
    model_filepath = Path(tmpdir.join("model.crf"))
    assert not model_filepath.exists()

    trainer.train(dataset["sequences"], dataset["labels"], model_filepath)
    assert model_filepath.exists()

예제 #2

파일 보기

def test_data_generator_append(dataset):
    sequences = ((token for token in sequence)
                 for sequence in dataset["sequences"])
    labels = ((label for label in labels) for labels in dataset["labels"])

    trainer = crf.Trainer()
    for sequence, label in zip(sequences, labels):
        trainer._append(sequence, label)

예제 #3

파일 보기

def test_trainer_algorithm_selection():
    for algorithm in {
            "lbfgs",
            "limited-memory-bfgs",
            "l2sgd",
            "stochastic-gradient-descent",
            "ap",
            "averaged-perceptron",
            "pa",
            "passive-aggressive",
            "arow",
    }:
        trainer = crf.Trainer(algorithm)
        assert len(trainer.params) > 0

    with pytest.raises(KeyError):
        crf.Trainer("foo")

예제 #4

파일 보기

def test_ap_params():
    trainer = crf.Trainer("ap")
    for param in {
            "min_freq",
            "all_possible_states",
            "all_possible_transitions",
            "max_iterations",
            "epsilon",
    }:
        assert param in trainer.params.keys()

예제 #5

파일 보기

def test_special_param_values():
    trainer = crf.Trainer(
        "lbfgs",
        min_freq=1000,
        all_possible_states=True,
        all_possible_transitions=True,
        max_iterations=50,
    )

    assert trainer.params["min_freq"] == 1000
    assert trainer.params["all_possible_states"] == True
    assert trainer.params["all_possible_transitions"] == True
    assert trainer.params["max_iterations"] == 50

예제 #6

파일 보기

def test_pa_params():
    trainer = crf.Trainer("pa")
    for param in {
            "min_freq",
            "all_possible_states",
            "all_possible_transitions",
            "max_iterations",
            "epsilon",
            "pa_type",
            "c",
            "error_sensitive",
            "averaging",
    }:
        assert param in trainer.params.keys()

예제 #7

파일 보기

def test_lbfgs_params():
    trainer = crf.Trainer("lbfgs")
    for param in {
            "min_freq",
            "all_possible_states",
            "all_possible_transitions",
            "max_iterations",
            "num_memories",
            "c1",
            "c2",
            "epsilon",
            "period",
            "delta",
            "linesearch",
            "max_linesearch",
    }:
        assert param in trainer.params.keys()

예제 #8

파일 보기

def test_l2sgd_params():
    trainer = crf.Trainer("l2sgd")
    for param in {
            "min_freq",
            "all_possible_states",
            "all_possible_transitions",
            "max_iterations",
            "c2",
            "period",
            "delta",
            "calibration_eta",
            "calibration_rate",
            "calibration_samples",
            "calibration_candidates",
            "calibration_max_trials",
    }:
        assert param in trainer.params.keys()

예제 #9

파일 보기

def test_wrong_dataset_format(dataset):
    trainer = crf.Trainer()
    with pytest.raises(TypeError):
        trainer._append(dataset["sequences"], dataset["labels"])

예제 #10

파일 보기

def test_integer_label_append(dataset):
    labels = [[0 for _ in labels] for labels in dataset["labels"]]

    trainer = crf.Trainer()
    for sequence, label in zip(dataset["sequences"], labels):
        trainer._append(sequence, label)

예제 #11

파일 보기

def test_data_append(dataset):
    trainer = crf.Trainer()
    for sequence, label in zip(dataset["sequences"], dataset["labels"]):
        trainer._append(sequence, label)

예제 #12

파일 보기

def serialized_model(tmpdir, dataset):
    trainer = crf.Trainer()
    model_filepath = Path(tmpdir.join("model.crf"))
    trainer.train(dataset["sequences"], dataset["labels"], model_filepath)
    return model_filepath