Python WordPunctTokenizer.append Exemples

Langage de programmation: Python

Espace de nommage/Pack: nltk.tokenize

Méthode/Fonction: append

Exemples au hotexamples.com: 1

Python WordPunctTokenizer.append - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de nltk.tokenize.WordPunctTokenizer.append extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

WordPunctTokenizer(30)

tokenize(30)

span_tokenize(5)

lower(2)

append(1)

index(1)

replace(1)

strip(1)

Méthodes fréquemment utilisées

WordPunctTokenizer (30)

tokenize (30)

span_tokenize (5)

lower (2)

append (1)

index (1)

replace (1)

strip (1)

Exemple #1

0

Afficher le fichier

Fichier : utils.py Projet : RaymondTseng/CrossLanguageSimilarity

def word2id(sentences, word2idx, seq_length): idx = [] all_length = [] global word2idx_ word2idx_ = word2idx for sentence in sentences: try: sentence = sentence.strip().decode('utf-8') sentence = re.sub(punc, u' ', sentence).strip() words = WordPunctTokenizer().tokenize(sentence) except: print(sentence) if len(words) < seq_length: all_length.append(len(words)) for _ in range(len(words), seq_length): words.append('<0>') elif len(words) > seq_length: words = words[:seq_length] all_length.append(seq_length) else: all_length.append(seq_length) id = list(map(get_id, words)) idx.append(id) return np.array(idx), np.array(all_length)