Python IBMModel1の例

プログラミング言語: Python

名前空間/パッケージ名: pytorch_translate.research.unsupervised_morphology.ibm_model1

クラス/型: IBMModel1

hotexamples.comのコード掲載数: 9

Python IBMModel1 - 9件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのpytorch_translate.research.unsupervised_morphology.ibm_model1.IBMModel1の実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

IBMModel1(9)

よく使われるメソッド

IBMModel1 (9)

コード例 #1

ファイルを表示

    def test_morph_init(self):
        ibm_model = IBMModel1()

        tmp_dir, f1, f2 = get_two_tmp_files()
        ibm_model.initialize_translation_probs(f1, f2)
        assert len(ibm_model.translation_prob) == 10
        assert len(ibm_model.translation_prob[ibm_model.null_str]) == 9
        assert len(ibm_model.translation_prob["345"]) == 6
        assert ibm_model.translation_prob["122"]["123"] == 1.0 / 4
        shutil.rmtree(tmp_dir)

コード例 #2

ファイルを表示

ファイル: test_ibm_model.py プロジェクト: zdavid1995/translate

 def test_str2int(self):
     ibm_model = IBMModel1()
     # Calling multiple times to make sure we get the same value.
     assert ibm_model.str2int("hello") == 1
     assert ibm_model.str2int("bye") == 2
     assert ibm_model.str2int("hello") == 1
     assert ibm_model.str2int("bye") == 2
     assert len(ibm_model._str2int) == 3
     assert len(ibm_model._int2str) == 3
     assert ibm_model._int2str == [ibm_model.null_str, "hello", "bye"]
     assert ibm_model.int2str(2) == "bye"

コード例 #3

ファイルを表示

    def test_ibm_train(self):
        ibm_model = IBMModel1()

        tmp_dir, f1, f2 = morph_utils.get_two_tmp_files()
        ibm_model.learn_ibm_parameters(src_path=f1, dst_path=f2, num_iters=3)

        assert ibm_model.translation_prob["456789"]["345"] == 0
        assert ibm_model.translation_prob["456789"]["456789"] == 0.5
        assert (
            ibm_model.translation_prob[ibm_model.null_str]["124"]
            < ibm_model.translation_prob[ibm_model.null_str]["456789"]
        )

        shutil.rmtree(tmp_dir)

コード例 #4

ファイルを表示

    def test_e_step(self):
        ibm_model = IBMModel1()

        tmp_dir, f1, f2 = morph_utils.get_two_tmp_files()
        ibm_model.initialize_translation_probs(f1, f2)
        translation_counts = defaultdict(lambda: defaultdict(float))

        ibm_model.e_step(
            ["123", "124", "234", "345", ibm_model.null_str],
            ["123", "124", "234", "345"],
            translation_counts,
        )
        assert translation_counts["123"]["345"] == 1.0 / 4
        shutil.rmtree(tmp_dir)

コード例 #5

ファイルを表示

ファイル: test_ibm_model.py プロジェクト: wangli7582/translate

    def test_em_step(self):
        ibm_model = IBMModel1()

        tmp_dir, f1, f2 = morph_utils.get_two_same_tmp_files()
        ibm_model.initialize_translation_probs(f1, f2)

        pool = Pool(3)
        ibm_model.em_step(src_path=f1, dst_path=f2, num_cpus=3, pool=pool)

        assert ibm_model.translation_prob["456789"]["345"] == 0
        assert ibm_model.translation_prob["456789"]["456789"] == 0.5
        assert (ibm_model.translation_prob[ibm_model.null_str]["124"] <
                ibm_model.translation_prob[ibm_model.null_str]["456789"])

        shutil.rmtree(tmp_dir)

コード例 #6

ファイルを表示

    def test_em_step(self):
        ibm_model = IBMModel1()

        tmp_dir, f1, f2 = morph_utils.get_two_tmp_files()
        ibm_model.initialize_translation_probs(f1, f2)

        ibm_model.em_step(f1, f2)

        assert ibm_model.translation_prob["456789"]["345"] == 0
        assert ibm_model.translation_prob["456789"]["456789"] == 0.5
        assert (
            ibm_model.translation_prob[ibm_model.null_str]["124"]
            < ibm_model.translation_prob[ibm_model.null_str]["456789"]
        )

        shutil.rmtree(tmp_dir)

コード例 #7

ファイルを表示

ファイル: test_ibm_model.py プロジェクト: zdavid1995/translate

    def test_morph_init(self):
        ibm_model = IBMModel1()

        tmp_dir, f1, f2 = morph_utils.get_two_same_tmp_files()
        ibm_model.initialize_translation_probs(f1, f2)
        assert len(ibm_model.translation_prob) == 10
        assert (
            len(ibm_model.translation_prob[ibm_model.str2int(ibm_model.null_str)]) == 9
        )
        assert len(ibm_model.translation_prob[ibm_model.str2int("345")]) == 6
        assert (
            ibm_model.translation_prob[ibm_model.str2int("122")][
                ibm_model.str2int("123")
            ]
            == 1.0 / 4
        )
        shutil.rmtree(tmp_dir)

コード例 #8

ファイルを表示

ファイル: test_ibm_model.py プロジェクト: zdavid1995/translate

    def test_ibm_train(self):
        ibm_model = IBMModel1()

        tmp_dir, f1, f2 = morph_utils.get_two_same_tmp_files()
        ibm_model.learn_ibm_parameters(src_path=f1, dst_path=f2, num_iters=3)

        assert (
            ibm_model.translation_prob[ibm_model.str2int("456789")][
                ibm_model.str2int("345")
            ]
            == 0
        )
        assert (
            ibm_model.translation_prob[ibm_model.str2int("456789")][
                ibm_model.str2int("456789")
            ]
            == 0.5
        )
        shutil.rmtree(tmp_dir)

コード例 #9

ファイルを表示

ファイル: test_ibm_model.py プロジェクト: zdavid1995/translate

    def test_expectation_for_one_sentence(self):
        ibm_model = IBMModel1()

        tmp_dir, f1, f2 = morph_utils.get_two_same_tmp_files()
        ibm_model.initialize_translation_probs(f1, f2)
        translation_counts = defaultdict(lambda: defaultdict(float))

        ibm_model.expectation_for_one_sentence(
            Counter(
                ibm_model.str2int(w)
                for w in ["123", "124", "234", "345", ibm_model.null_str]
            ),
            Counter(ibm_model.str2int(w) for w in ["123", "124", "234", "345"]),
            translation_counts,
        )
        assert (
            round(
                translation_counts[ibm_model.str2int("123")][ibm_model.str2int("345")],
                3,
            )
            == 0.176
        )
        shutil.rmtree(tmp_dir)