Python cleanwords示例

编程语言: Python

命名空间/包名称: semanticfilter

方法/功能: cleanwords

hotexamples.com的示例: 3

Python cleanwords - 已找到3个示例。这些是从开源项目中提取的最受好评的semanticfilter.cleanwords现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def log_short_repetitions(maxtokens, minrepetitions):
    import semanticfilter

    numf = lambda num: (
        ("%d" if type(num) is int else "%0.20f") % num).replace(',', '.')
    numl = lambda vl: list(map(numf, list(vl)))

    with open(os.path.join("Output", subdir, "shortterms.csv"),
              'w',
              encoding='utf-8') as csvfile:
        fwtr = csv.writer(csvfile,
                          delimiter=';',
                          quotechar='"',
                          quoting=csv.QUOTE_MINIMAL,
                          lineterminator='\n')

        fwtr.writerow(['Total groups:', numf(len(clones.clonegroups))])
        fwtr.writerow([
            'N tokens', 'Occurs times', 'Common Phrase', 'Words', 'Plain Text',
            'Text'
        ])

        for cg in clones.clonegroups:
            if cg.ntokens <= maxtokens and len(
                    cg.instances) >= minrepetitions and not cg.containsNoWords(
                    ):
                words = ' '.join(
                    semanticfilter.cleanwords(cg.plain_text(), True))
                fwtr.writerow([
                    numf(cg.ntokens),
                    numf(len(cg.instances)),
                    numf(int(cg.containsNoSemantic())), words,
                    cg.plain_text().replace('\r', '').replace('\n', ' '),
                    cg.text().strip().replace('\r', '').replace('\n', ' ')
                ])

示例#2

显示文件

文件： clones.py 项目： spbu-se/pldoctoolkit

 def containsNoWords(self):
     if self.containsNoText():
         return True
     elif len(semanticfilter.cleanwords(self.plain_text())) == 0:
         return True
     else:
         return False

示例#3

显示文件

文件： clones2html.py 项目： spbu-se/pldoctoolkit

def log_short_repetitions(maxtokens, minrepetitions):
    import semanticfilter

    numf = lambda num: (("%d" if type(num) is int else "%0.20f") % num).replace(',', '.')
    numl = lambda vl: list(map(numf, list(vl)))

    with open(os.path.join("Output", subdir, "shortterms.csv"), 'w') as csvfile:
        fwtr = csv.writer(csvfile, delimiter=';', quotechar='"', quoting=csv.QUOTE_MINIMAL, lineterminator='\n')

        fwtr.writerow(['Total groups:', numf(len(clones.clonegroups))])
        fwtr.writerow(['N tokens', 'Occurs times', 'Common Phrase', 'Words', 'Plain Text', 'Text'])

        for cg in clones.clonegroups:
            if cg.ntokens <= maxtokens and len(cg.instances) >= minrepetitions and not cg.containsNoWords():
                words = ' '.join(semanticfilter.cleanwords(cg.plain_text(), True))
                fwtr.writerow([
                    numf(cg.ntokens),
                    numf(len(cg.instances)),
                    numf(int(cg.containsNoSemantic())),
                    words,
                    cg.plain_text().replace('\r', '').replace('\n', ' '),
                    cg.text().strip().replace('\r', '').replace('\n', ' ')
                ])