Python NgramEnumerator 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ngram

클래스/타입: NgramEnumerator

hotexamples.com에서의 예제들: 6

Python NgramEnumerator - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ngram.NgramEnumerator에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

NgramEnumerator(4)

ngrams(3)

elide(2)

자주 사용되는 메소드들

NgramEnumerator (4)

ngrams (3)

elide (2)

예제 #1

파일 보기

파일: feature.py 프로젝트: LGizkde/Supervised-Decoding

class MockLM(Feature):
    def __init__(self, m, lmfile):
        Feature.__init__(self)
        self.stateless = False
        self.ngram_enum = NgramEnumerator(m)

    def weight(self, deduction):
        vars = [item.state[self.i] for item in deduction.tail]
        s = tuple(deduction.rule.rewrite(vars))
        return self.ngram_cost(s), self.ngram_enum.elide(s)

    def ngram_cost(self, s):
        cost = 0
        for ngram in self.ngram_enum.ngrams(s):
            cost += 0
        return -cost #LM returns neg logprob

예제 #2

파일 보기

파일: references.py 프로젝트: LGizkde/Supervised-Decoding

 def count(self, line):
     """take record of ngrams in a ref line, when multiple ref lines are
     fed to the counter, the max count of a particular ngram is recorded"""
     line = line.split()
     self.lengths.append(len(line))
     tmp_counter = {}
     for n in range(self.max_n):
         enum = NgramEnumerator(n + 1)
         for ngram in enum.ngrams(line):
             ngram = tuple(ngram)
             if ngram in tmp_counter:
                 tmp_counter[ngram] += 1
             else:
                 tmp_counter[ngram] = 1
     for ngram, c in tmp_counter.items():
         self[ngram] = max(c, self[ngram])

예제 #3

파일 보기

파일: feature.py 프로젝트: LGizkde/Supervised-Decoding

class LM(Feature):
    def __init__(self, m, lmfile):
        Feature.__init__(self)
        self.stateless = False
        self.m = m
        self.lmfile = lmfile
        self.ngram_enum = NgramEnumerator(self.m)

        if FLAGS.use_python_lm:
            from python_lm import LanguageModel
        else:
            from swig_lm import LanguageModel

        logger.writeln('reading LM: %s' % self.lmfile)
        if FLAGS.use_python_lm:
            self.lm = LanguageModel(self.lmfile)
            self.getcost = self.lm.get
        else:
            self.lm = LanguageModel(self.m, self.lmfile)
            self.getcost = self.lm

    def weight(self, deduction):
        vars = [item.state[self.i] for item in deduction.tail]
        s = tuple(deduction.rule.rewrite(vars))
        return self.ngram_cost(s), self.ngram_enum.elide(s)

    def ngram_cost(self, s):
        cost = 0
        for ngram in self.ngram_enum.ngrams(s):
            cost += self.getcost(ngram)
        return -cost #LM returns neg logprob

    def heuristic(self, item):
        s = item.state[self.i]
        if item.i == 0:
            prefix = ('<s>',) * (self.m - 1)
        else:
            prefix = ('<unk>',) * (self.m - 1)
        if item.rightmost:
            suffix = ('</s>',) * (self.m - 1)
        else:
            suffix = ()
        s = prefix + s + suffix
        h = 0
        for ngram in self.ngram_enum.ngrams(s):
            h += self.lm(ngram)
        return -h

예제 #4

파일 보기

파일: feature.py 프로젝트: LGizkde/Supervised-Decoding

    def __init__(self, m, lmfile):
        Feature.__init__(self)
        self.stateless = False
        self.m = m
        self.lmfile = lmfile
        self.ngram_enum = NgramEnumerator(self.m)

        if FLAGS.use_python_lm:
            from python_lm import LanguageModel
        else:
            from swig_lm import LanguageModel

        logger.writeln('reading LM: %s' % self.lmfile)
        if FLAGS.use_python_lm:
            self.lm = LanguageModel(self.lmfile)
            self.getcost = self.lm.get
        else:
            self.lm = LanguageModel(self.m, self.lmfile)
            self.getcost = self.lm

예제 #5

파일 보기

파일: feature.py 프로젝트: LGizkde/Supervised-Decoding

 def __init__(self, m, lmfile):
     Feature.__init__(self)
     self.stateless = False
     self.ngram_enum = NgramEnumerator(m)

예제 #6

파일 보기

파일: consensus_training.py 프로젝트: LGizkde/Supervised-Decoding

 def __init__(self, max_n):
     self.max_n = max_n
     self.enums = [NgramEnumerator(i + 1) for i in range(max_n)]