Ejemplos de cleanwords en Python

Lenguaje de programación: Python

Namespace/Package Name: semanticfilter

Método / Función: cleanwords

Ejemplos en hotexamples.com: 3

Python cleanwords - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de semanticfilter.cleanwords extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

def log_short_repetitions(maxtokens, minrepetitions):
    import semanticfilter

    numf = lambda num: (
        ("%d" if type(num) is int else "%0.20f") % num).replace(',', '.')
    numl = lambda vl: list(map(numf, list(vl)))

    with open(os.path.join("Output", subdir, "shortterms.csv"),
              'w',
              encoding='utf-8') as csvfile:
        fwtr = csv.writer(csvfile,
                          delimiter=';',
                          quotechar='"',
                          quoting=csv.QUOTE_MINIMAL,
                          lineterminator='\n')

        fwtr.writerow(['Total groups:', numf(len(clones.clonegroups))])
        fwtr.writerow([
            'N tokens', 'Occurs times', 'Common Phrase', 'Words', 'Plain Text',
            'Text'
        ])

        for cg in clones.clonegroups:
            if cg.ntokens <= maxtokens and len(
                    cg.instances) >= minrepetitions and not cg.containsNoWords(
                    ):
                words = ' '.join(
                    semanticfilter.cleanwords(cg.plain_text(), True))
                fwtr.writerow([
                    numf(cg.ntokens),
                    numf(len(cg.instances)),
                    numf(int(cg.containsNoSemantic())), words,
                    cg.plain_text().replace('\r', '').replace('\n', ' '),
                    cg.text().strip().replace('\r', '').replace('\n', ' ')
                ])

Ejemplo n.º 2

Mostrar archivo

Archivo: clones.py Proyecto: spbu-se/pldoctoolkit

 def containsNoWords(self):
     if self.containsNoText():
         return True
     elif len(semanticfilter.cleanwords(self.plain_text())) == 0:
         return True
     else:
         return False

Ejemplo n.º 3

Mostrar archivo

Archivo: clones2html.py Proyecto: spbu-se/pldoctoolkit

def log_short_repetitions(maxtokens, minrepetitions):
    import semanticfilter

    numf = lambda num: (("%d" if type(num) is int else "%0.20f") % num).replace(',', '.')
    numl = lambda vl: list(map(numf, list(vl)))

    with open(os.path.join("Output", subdir, "shortterms.csv"), 'w') as csvfile:
        fwtr = csv.writer(csvfile, delimiter=';', quotechar='"', quoting=csv.QUOTE_MINIMAL, lineterminator='\n')

        fwtr.writerow(['Total groups:', numf(len(clones.clonegroups))])
        fwtr.writerow(['N tokens', 'Occurs times', 'Common Phrase', 'Words', 'Plain Text', 'Text'])

        for cg in clones.clonegroups:
            if cg.ntokens <= maxtokens and len(cg.instances) >= minrepetitions and not cg.containsNoWords():
                words = ' '.join(semanticfilter.cleanwords(cg.plain_text(), True))
                fwtr.writerow([
                    numf(cg.ntokens),
                    numf(len(cg.instances)),
                    numf(int(cg.containsNoSemantic())),
                    words,
                    cg.plain_text().replace('\r', '').replace('\n', ' '),
                    cg.text().strip().replace('\r', '').replace('\n', ' ')
                ])