Python Tokenizer.run Exemples

Langage de programmation: Python

Espace de nommage/Pack: tokenizer.tokenizer

Class/Type: Tokenizer

Méthode/Fonction: run

Exemples au hotexamples.com: 3

Python Tokenizer.run - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de tokenizer.tokenizer.Tokenizer.run extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Tokenizer(30)

predict(8)

tokenize(7)

format(4)

txt(4)

analyze(3)

raw_tokenize(3)

run(3)

mr(2)

token_to_id(2)

tokenize_seq_file(1)

tokenize_text_file(1)

tokens_from_sentence(1)

Méthodes fréquemment utilisées

Tokenizer (30)

predict (8)

tokenize (7)

format (4)

txt (4)

analyze (3)

raw_tokenize (3)

run (3)

mr (2)

token_to_id (2)

Méthodes fréquemment utilisées

tokenize_seq_file (1)

tokenize_text_file (1)

tokens_from_sentence (1)

Exemple #1

0

Afficher le fichier

def test_ner(crf, test_sent): from tokenizer.tokenizer import Tokenizer token = Tokenizer() token.run() arr_featurized_sent = [] postaged_sent = ViPosTagger.postagging(token.predict(test_sent)) print postaged_sent test_arr = [] for i in xrange(len(postaged_sent[0])): test_arr.append((postaged_sent[0][i], postaged_sent[1][i])) print test_arr featurized_sent = sent2features(test_arr) arr_featurized_sent.append(featurized_sent) predict = crf.predict(arr_featurized_sent) return zip(test_arr, predict[0])

Exemple #2

0

Afficher le fichier

Fichier : stats_tokens.py Projet : nguyentuc/vnspellingfixer

def first_stats(): tokenizer = Tokenizer() tokenizer.run() question_vocabulary = Vocabulary() questions = load_questions() cc = 0 for question in questions: #print question if cc % 10 == 0: print "\r%s" % cc, cc += 1 sen = tokenizer.predict(question) sen = sen.lower() tokens = question_vocabulary.get_sentence_token_ids(sen) question_list.append(tokens) print "\n Saving..." question_vocabulary.save(Q_VOCAB_NAME) utils.pickle_save(question_list, "question_tokens.dat") print "Done"

Exemple #3

0

Afficher le fichier

Fichier : s_word18.py Projet : trangnt08/question_classification_fptshop

# -*- encoding: utf8 -*- import re import requests import unicodedata from tokenizer.tokenizer import Tokenizer from sklearn.externals import joblib import pandas as pd import os from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.metrics import f1_score from sklearn.svm import SVC from pyvi.pyvi import ViTokenizer from sklearn.metrics import confusion_matrix tokenizer = Tokenizer() tokenizer.run() def load_model(model): print('loading model ...', model) if os.path.isfile(model): return joblib.load(model) else: return None def list_words(mes): words = mes.lower().split() return " ".join(words)