Python FileOps.get_stopwords Exemples

Langage de programmation: Python

Espace de nommage/Pack: fileops

Class/Type: FileOps

Méthode/Fonction: get_stopwords

Exemples au hotexamples.com: 2

Python FileOps.get_stopwords - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de fileops.FileOps.get_stopwords extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

FileOps(2)

get_stopwords(2)

get_previews(1)

get_targets(1)

write_plurals_table(1)

write_table(1)

Méthodes fréquemment utilisées

FileOps (2)

get_stopwords (2)

get_previews (1)

get_targets (1)

write_plurals_table (1)

write_table (1)

Exemple #1

0

Afficher le fichier

Fichier : brown.py Projet : seanbethard/plurals-english

def get_corpus_info(categories, **kwargs): corpus_info = [] for category in categories: if not 'stopwords' in kwargs: tokens = [w for w in brown.words(categories=category)] else: if kwargs['stopwords'] == 'english': tokens = [w for w in brown.words(categories=category) if w not in FileOps.get_stopwords('stopwords.txt')] token_count = len(tokens) type_count = len(set(tokens)) diversity = "%.3f" % (type_count/token_count) tmp = category.split('_') category = ' '.join(tmp) category_info = (category, token_count, type_count, diversity) print(category_info) corpus_info.append(category_info) return corpus_info

Exemple #2

0

Afficher le fichier

Fichier : brown.py Projet : seanbethard/plurals-english

if not 'stopwords' in kwargs: tokens = [w for w in brown.words(categories=category)] else: if kwargs['stopwords'] == 'english': tokens = [w for w in brown.words(categories=category) if w not in FileOps.get_stopwords('stopwords.txt')] token_count = len(tokens) type_count = len(set(tokens)) diversity = "%.3f" % (type_count/token_count) tmp = category.split('_') category = ' '.join(tmp) category_info = (category, token_count, type_count, diversity) print(category_info) corpus_info.append(category_info) return corpus_info if __name__ == "__main__": <<<<<<< HEAD ======= plurals_info = get_plurals_info(brown.categories()) FileOps.write_plurals_table(plurals_info) >>>>>>> a4d8d09f16fdcb0d863e6b8683049a38be7be961 corpus_info = get_corpus_info(brown.categories()) stopwords_info = get_corpus_info(brown.categories(), stopwords='english') FileOps.write_table(corpus_info, stopwords_info) print_corpus_info(brown.categories(), FileOps.get_stopwords('stopwords.txt'))