Python Tokenizer Exemples

Langage de programmation: Python

Espace de nommage/Pack: naive_bayes.tokenizer

Class/Type: Tokenizer

Exemples au hotexamples.com: 9

Python Tokenizer - 9 exemples trouvés. Ce sont les exemples réels les mieux notés de naive_bayes.tokenizer.Tokenizer extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

unique_tokenizer(3)

ngram(2)

tokenize(2)

Méthodes fréquemment utilisées

unique_tokenizer (3)

ngram (2)

tokenize (2)

Associées

user_get

get_osx_version

PostProcessor

makeParser

IntervalMetadata

parse_mailcap_nametemplate

log_erros

PasswordTuple

redirect_to

Picker

Related in langs

ReplicairController (PHP)

System (PHP)

RegularCustomerDiscountStrategy (C#)

StatisticNotifier.DataUpdatedEventArgs (C#)

write_debug_log (C++)

tiz_srv_issue_err_event (C++)

GtkWindowType (Go)

AllowedParams (Go)

DefaultDataDictionaryProvider (Java)

JYTabbedPane (Java)

Exemple #1

0

Afficher le fichier

def test_ngrams(self): expectation = [ [u'\u0000', "quick"], ["quick", "brown"], ["brown", "fox"], ] actual = Tokenizer.ngram("quick brown fox", 2) self.assertEqual(actual, expectation)

Exemple #2

0

Afficher le fichier

def test_ngrams(self): expectation = [ [u'\u0000', 'quick'], ['quick', 'brown'], ['brown', 'fox'] ] actual = Tokenizer.ngram('quick brown fox', 2) self.assertEqual(actual, expectation)

Exemple #3

0

Afficher le fichier

Fichier : tokenizer_test.py Projet : amitbe79/examples-in-python

def test_ngrams(self): expectation = [ [u'\u0000', "quick"], ["quick", "brown"], ["brown", "fox"], ] actual = Tokenizer.ngram("quick brown fox", 2) self.assertEqual(actual, expectation)

Exemple #4

0

Afficher le fichier

Fichier : spam_trainer.py Projet : cmarsa/tmlwp

def train(self): for category, file in self.to_train: email = EmailObject(io.open(file, 'rb')) self.categories.add(category) for token in Tokenizer.unique_tokenizer(email.body()): self.training[category][token] += 1 self.totals['_all'] += 1 self.totals[category] += 1 self.to_train = {}

Exemple #5

0

Afficher le fichier

Fichier : spam_trainer.py Projet : cmarsa/tmlwp

def score(self, email): self.train() cat_totals = self.totals aggregates = { cat: cat_totals[cat] / cat_totals['_all'] for cat in self.categories } for token in Tokenizer.unique_tokenizer(email.body()): for cat in self.categories: value = self.training[cat][token] r = (value + 1) / (cat_totals[cat] + 1) aggregates[cat] *= r return aggregates

Exemple #6

0

Afficher le fichier

Fichier : spam_trainer.py Projet : shravankumar147/examples-in-python

def score(self, email): """ Calculates score :param email: EmailObject :return: float number """ self.train() cat_totals = self.totals aggregates = { cat: cat_totals[cat] / cat_totals['_all'] for cat in self.categories } for token in Tokenizer.unique_tokenizer(email.body()): for cat in self.categories: value = self.training[cat][token] r = (value + 1) / (cat_totals[cat] + 1) aggregates[cat] *= r return aggregates

Exemple #7

0

Afficher le fichier

def test_downcasing(self): expectation = ["this", "is", "all", "caps"] actual = Tokenizer.tokenize("THIS IS ALL CAPS") self.assertEqual(actual, expectation)

Exemple #8

0

Afficher le fichier

def test_cowncasting(self): expectation = ['this', 'is', 'all', 'caps'] actual = Tokenizer.tokenize('THIS IS ALL CAPS') self.assertEqual(actual, expectation)

Exemple #9

0

Afficher le fichier

Fichier : tokenizer_test.py Projet : amitbe79/examples-in-python

def test_downcasing(self): expectation = ["this", "is", "all", "caps"] actual = Tokenizer.tokenize("THIS IS ALL CAPS") self.assertEqual(actual, expectation)