Ejemplos de WordCountAnalyzer en Python

Lenguaje de programación: Python

Namespace/Package Name: zimp.pos.wordcount_analyzer

Clase / Tipo: WordCountAnalyzer

Ejemplos en hotexamples.com: 10

Python WordCountAnalyzer - 10 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de zimp.pos.wordcount_analyzer.WordCountAnalyzer extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

WordCountAnalyzer(10)

to_dict(8)

Métodos usados con frecuencia

WordCountAnalyzer (10)

to_dict (8)

Ejemplo n.º 1

Mostrar archivo

Archivo: test_wordcount_analyzer.py Proyecto: freecraver/zimp

 def test_spacy_word_count_en(self):
     df_res = WordCountAnalyzer(texts, strategy=TokenizerStrategy.SPACY, language='english')\
         .extract_dataset_metric()
     self.assertEqual({
         8: 2,
         10: 1,
         11: 1,
         14: 1
     },
                      df_res.to_dict()['count'])

Ejemplo n.º 2

Mostrar archivo

Archivo: test_wordcount_analyzer.py Proyecto: freecraver/zimp

 def test_nist_word_count(self):
     df_res = WordCountAnalyzer(
         texts,
         strategy=TokenizerStrategy.NLTK_NIST).extract_dataset_metric()
     self.assertEqual({
         8: 1,
         9: 1,
         10: 1,
         12: 1,
         16: 1
     },
                      df_res.to_dict()['count'])

Ejemplo n.º 3

Mostrar archivo

Archivo: test_wordcount_analyzer.py Proyecto: freecraver/zimp

 def test_nltk_regex_word_count(self):
     df_res = WordCountAnalyzer(
         texts,
         strategy=TokenizerStrategy.WORD_PUNKT).extract_dataset_metric()
     self.assertEqual({
         8: 1,
         10: 1,
         11: 1,
         13: 1,
         16: 1
     },
                      df_res.to_dict()['count'])

Ejemplo n.º 4

Mostrar archivo

Archivo: metrics.py Proyecto: freecraver/zimp

 def __init__(self,
              word_count_analyzer=None,
              sentence_count_analyzer=None,
              language='english'):
     self.wca = word_count_analyzer or WordCountAnalyzer([],
                                                         language=language)
     self.sca = sentence_count_analyzer or SentenceCountAnalyzer(
         [], language=language)

Ejemplo n.º 5

Mostrar archivo

Archivo: test_wordcount_analyzer.py Proyecto: freecraver/zimp

 def test_nltk_base_word_count_batch(self):
     bm = WordCountAnalyzer(texts,
                            strategy=TokenizerStrategy.NLTK_BASE,
                            language='english').extract_batch_metrics()
     self.assertEqual([8, 9, 10, 16, 10], bm)

Ejemplo n.º 6

Mostrar archivo

Archivo: test_wordcount_analyzer.py Proyecto: freecraver/zimp

 def test_gensim_word_count(self):
     df_res = WordCountAnalyzer(
         texts, strategy=TokenizerStrategy.GENSIM).extract_dataset_metric()
     self.assertEqual({7: 2, 9: 2, 10: 1}, df_res.to_dict()['count'])

Ejemplo n.º 7

Mostrar archivo

Archivo: test_wordcount_analyzer.py Proyecto: freecraver/zimp

 def test_nltk_base_word_count_de(self):
     # 'U.S.?' is treated differently with german nltk tokenize
     df_res = WordCountAnalyzer(texts, strategy=TokenizerStrategy.NLTK_BASE, language='german')\
         .extract_dataset_metric()
     self.assertEqual({8: 1, 10: 3, 16: 1}, df_res.to_dict()['count'])

Ejemplo n.º 8

Mostrar archivo

Archivo: test_wordcount_analyzer.py Proyecto: freecraver/zimp

 def test_nltk_base_word_count_en(self):
     df_res = WordCountAnalyzer(texts, strategy=TokenizerStrategy.NLTK_BASE, language='english')\
         .extract_dataset_metric()
     self.assertEqual({8: 1, 9: 1, 10: 2, 16: 1}, df_res.to_dict()['count'])

Ejemplo n.º 9

Mostrar archivo

Archivo: test_wordcount_analyzer.py Proyecto: freecraver/zimp

 def test_split_word_count(self):
     df_res = WordCountAnalyzer(
         texts, strategy=TokenizerStrategy.PYTHON).extract_dataset_metric()
     self.assertEqual({5: 1, 7: 1, 8: 2, 9: 1}, df_res.to_dict()['count'])

Ejemplo n.º 10

Mostrar archivo

Archivo: test_wordcount_analyzer.py Proyecto: freecraver/zimp

 def test_regex_word_count(self):
     df_res = WordCountAnalyzer(
         texts, strategy=TokenizerStrategy.REGEX).extract_dataset_metric()
     self.assertEqual({7: 2, 9: 1, 10: 2}, df_res.to_dict()['count'])