Python CharacterLanguageModel示例

编程语言: Python

命名空间/包名称: spelling.baseline

hotexamples.com的示例: 3

Python CharacterLanguageModel - 已找到3个示例。这些是从开源项目中提取的最受好评的spelling.baseline.CharacterLanguageModel现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

fit(3)

generate(1)

predict(1)

示例#1

显示文件

文件： test_baselines.py 项目： ndronen/spelling

    def test_train_test_are_files(self):
        lm = CharacterLanguageModel('witten-bell', order=3)
        lm.fit(self.words)
        output = lm.predict(self.words)
        log_probs = output['log_probs']
        ppls = output['ppls']
        ppl1s = output['ppl1s']

        self.assertEquals(len(self.words), len(log_probs))
        self.assertEquals(len(self.words), len(ppls))
        self.assertEquals(len(self.words), len(ppl1s))

示例#2

显示文件

文件： test_baselines.py 项目： ndronen/spelling

    def test_language_model_classifier(self):
        lm_real_words = CharacterLanguageModel('witten-bell', order=3)
        lm_real_words.fit(self.words)

        real_words = self.words
        non_words = lm_real_words.generate(1, len(real_words))

        lm_non_words = CharacterLanguageModel('witten-bell', order=3)
        lm_non_words.fit(non_words)

        clf = LanguageModelClassifier([lm_non_words, lm_real_words])
        real_words_pred = clf.predict(real_words)
        non_words_pred = clf.predict(non_words)

        real_words_bincount = np.bincount(real_words_pred)
        non_words_bincount = np.bincount(non_words_pred)

        self.assertTrue(real_words_bincount[0] < real_words_bincount[1])
        self.assertTrue(non_words_bincount[0] > non_words_bincount[1])

示例#3

显示文件

文件： error_analysis.py 项目： ndronen/dissertation-chapter04

def train_lm(pos_words, neg_words, discount='witten-bell', order=3, debug=False):
    lm_pos = CharacterLanguageModel(discount, order, debug=debug)
    lm_pos.fit(pos_words)
    lm_neg = CharacterLanguageModel(discount, order, debug=debug)
    lm_neg.fit(neg_words)
    return LanguageModelClassifier([lm_pos, lm_neg])