Esempi in Python per CharIBMModel1

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: pytorch_translate.research.unsupervised_morphology.char_ibm_model1

Classe/tipologia: CharIBMModel1

Esempi su hotexamples.com: 6

CharIBMModel1 in Python: 6 esempi trovati. Questi sono i migliori esempi reali in Python per pytorch_translate.research.unsupervised_morphology.char_ibm_model1.CharIBMModel1, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

CharIBMModel1(6)

Metodi utilizzati di frequente

CharIBMModel1 (6)

Esempio n. 1

Mostra file

File: test_char_ibm_model.py Progetto: zdavid1995/translate

    def test_morph_init(self):
        tmp_dir, f1, f2 = morph_utils.get_two_different_tmp_files()

        ibm_model = CharIBMModel1()
        ibm_model.initialize_translation_probs(f1, f2)
        assert (
            ibm_model.translation_prob[ibm_model.str2int("5")][
                ibm_model.str2int("d" + ibm_model.eow_symbol)
            ]
            > 0
        )
        assert len(ibm_model.translation_prob) == 80

        ibm_model = Word2CharIBMModel1(max_subword_len=4)
        ibm_model.initialize_translation_probs(f1, f2)
        assert (
            ibm_model.str2int("abcdefghi")
            not in ibm_model.translation_prob[ibm_model.str2int("123456789")]
        )
        assert (
            ibm_model.str2int("cdef")
            in ibm_model.translation_prob[ibm_model.str2int("123456789")]
        )
        assert (
            ibm_model.str2int("cde")
            in ibm_model.translation_prob[ibm_model.str2int("123456789")]
        )
        assert len(ibm_model.translation_prob[ibm_model.str2int("123456789")]) == 34
        assert len(ibm_model.translation_prob) == 10

        shutil.rmtree(tmp_dir)

Esempio n. 2

Mostra file

    def test_morph_init(self):
        ibm_model = CharIBMModel1()

        tmp_dir, f1, f2 = morph_utils.get_two_tmp_files()
        ibm_model.initialize_translation_probs(f1, f2)
        assert ibm_model.translation_prob["5"]["5" + ibm_model.eow_symbol] > 0
        assert len(ibm_model.translation_prob) == 80
        shutil.rmtree(tmp_dir)

Esempio n. 3

Mostra file

File: test_char_ibm_model.py Progetto: wangli7582/translate

    def test_get_subwords_counts_for_line(self):
        char_ibm_model = CharIBMModel1(max_subword_len=4)

        substrs = char_ibm_model.get_subword_counts_for_line("123412345 12345")
        assert len(substrs) == 24
        assert substrs[char_ibm_model.eow_symbol] == 2
        assert substrs["5" + char_ibm_model.eow_symbol] == 2
        assert substrs["123"] == 3
        assert "12345" not in substrs

Esempio n. 4

Mostra file

File: test_char_ibm_model.py Progetto: wangli7582/translate

    def test_get_possible_subwords(self):
        char_ibm_model = CharIBMModel1(max_subword_len=4)

        substrs = char_ibm_model.get_possible_subwords("123412345")
        assert len(substrs) == 24
        assert substrs[char_ibm_model.eow_symbol] == 1
        assert substrs["5" + char_ibm_model.eow_symbol] == 1
        assert substrs["123"] == 2
        assert "12345" not in substrs

Esempio n. 5

Mostra file

File: test_char_ibm_model.py Progetto: zdavid1995/translate

    def test_get_possible_subwords(self):
        char_ibm_model = CharIBMModel1(max_subword_len=4)

        substrs = char_ibm_model.get_possible_subwords("123412345")
        assert len(substrs) == 34
        substr_counter = Counter(substrs)
        assert len(substr_counter) == 24
        assert substr_counter[char_ibm_model.str2int(char_ibm_model.eow_symbol)] == 1
        assert (
            substr_counter[char_ibm_model.str2int("5" + char_ibm_model.eow_symbol)] == 1
        )
        assert substr_counter[char_ibm_model.str2int("123")] == 2
        assert "12345" not in char_ibm_model._str2int

Esempio n. 6

Mostra file

File: test_char_ibm_model.py Progetto: wangli7582/translate

    def test_morph_init(self):
        tmp_dir, f1, f2 = morph_utils.get_two_different_tmp_files()

        ibm_model = CharIBMModel1()
        ibm_model.initialize_translation_probs(f1, f2)
        assert ibm_model.translation_prob["5"]["d" + ibm_model.eow_symbol] > 0
        assert len(ibm_model.translation_prob) == 83
        assert len(ibm_model.training_data) == 4

        ibm_model = Word2CharIBMModel1(max_subword_len=4)
        ibm_model.initialize_translation_probs(f1, f2)
        assert "abcdefghi" not in ibm_model.translation_prob["123456789"]
        assert "cdef" in ibm_model.translation_prob["123456789"]
        assert "cde" in ibm_model.translation_prob["123456789"]
        assert len(ibm_model.translation_prob["123456789"]) == 34
        assert len(ibm_model.translation_prob) == 9
        assert len(ibm_model.training_data) == 4

        shutil.rmtree(tmp_dir)