Exemplos de NGram.generate_token em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: ngram

Classe / Tipo: NGram

Método / Função: generate_token

Exemplos em hotexamples.com: 1

NGram.generate_token em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de ngram.NGram.generate_token em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

NGram(30)

compare(30)

search(14)

add(9)

split(6)

find(5)

ngrams(4)

next_word(3)

clean(2)

train(2)

prob(2)

intersection_update(2)

print_attrib(2)

train_model(1)

trigrams(1)

unigrams(1)

save(1)

remove(1)

pad(1)

items_sharing_ngrams(1)

ngram_similarity(1)

load(1)

_split(1)

intersection(1)

get(1)

generate_token(1)

generate(1)

display_stats(1)

count(1)

classify(1)

bigrams(1)

append(1)

update(1)

Métodos Frequentes

NGram (30)

compare (30)

search (14)

add (9)

split (6)

find (5)

ngrams (4)

next_word (3)

clean (2)

train (2)

Métodos Frequentes

prob (2)

intersection_update (2)

print_attrib (2)

train_model (1)

trigrams (1)

unigrams (1)

save (1)

remove (1)

pad (1)

items_sharing_ngrams (1)

ngram_similarity (1)

load (1)

_split (1)

intersection (1)

get (1)

generate_token (1)

generate (1)

display_stats (1)

count (1)

classify (1)

Métodos Frequentes

ngram_similarity (1)

load (1)

_split (1)

intersection (1)

get (1)

generate_token (1)

generate (1)

display_stats (1)

count (1)

classify (1)

bigrams (1)

append (1)

update (1)

Métodos Frequentes

bigrams (1)

append (1)

update (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: test_ngram.py Projeto: lorumipse/lorumipse

class NGramTestCase(unittest.TestCase): def setUp(self): self.text = ["abraka dabra", "abrak a dobra", "ablak a dubra"] self.trigram = NGram(3, self.text) def test_calc_distr(self): self.assertEqual(self.trigram.ngram_order, 2) ngram_distr = self.trigram.ngram_distr (unigram_distr, bigram_distr, trigram_distr) = ngram_distr self.assertEqual(unigram_distr[('l', )], self.count_ngram('l', self.text)) self.assertEqual(bigram_distr[(',', ' ')], self.count_ngram(', ', self.text)) self.assertEqual(trigram_distr[('b', 'r', 'a')], self.count_ngram('bra', self.text)) def test_calc_trans_prob(self): trans_prob = self.trigram.trans_prob self.assertEqual( trans_prob[0][()]['a'], float(self.count_ngram('a', self.text)) / self.total_seqs_length(self.text)) self.assertEqual(trans_prob[1][('#', )]['a'], 1) self.assertEqual( trans_prob[2][('a', 'b')]['l'], float(self.count_ngram('abl', self.text)) / self.count_ngram('ab', self.text)) def test_generate(self): text = list(itertools.islice(self.trigram.generate_token(), 1000)) self.assertTrue(self.count_ngram("br", ["".join(text)]) > 0) def count_ngram(self, ngram, seqs): n = len(ngram) cnt = 0 for seq in seqs: separated_seq = ["#"] + list(seq) + ["#"] for i in xrange(len(separated_seq) - n + 1): if tuple(separated_seq[i:i + n]) == tuple(ngram): cnt += 1 return cnt def total_seqs_length(self, seqs): s = sum([len(seq) for seq in seqs]) return s def tearDown(self): pass