Python Counts.Counts示例

编程语言: Python

命名空间/包名称: Counts

类/类型: Counts

方法/功能: Counts

hotexamples.com的示例: 1

Python Counts.Counts - 已找到1个示例。这些是从开源项目中提取的最受好评的Counts.Counts.Counts现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Counts(1)

add(1)

fixRanks(1)

incrementWord(1)

mkString(1)

示例#1

显示文件

文件： preprocessSentences.py 项目： sknadig/multi_task_code_switched_language_modeling

langLines = f.readlines()
f.close()
print "Read file"

#CLEAN AND FACTORIZE THE LINES
cleanLines = []
for line, langLine, soundLine in zip(lines, langLines, soundexLines):
    cleanedLine = cleanLine(line)
    cleanedLangLine = cleanLine(langLine)
    cleanedSoundLine = cleanLine(soundLine)
    cleanLines.append(factorize(cleanedLine, cleanedLangLine,
                                cleanedSoundLine))
print "cleaned lines"

#GET THE COUNTS FROM THE SENTENCES
mc = Counts()
mcLang = Counts()
mcSoundex = Counts()
for line in cleanLines:
    for token in line:
        mc.incrementWord(token.getFactor(WORD_FACTOR))
        #mcLang.incrementWord(token.getFactor(LANGAUGE_FACTOR))
        #mcSoundex.incrementWord(token.getFactor(SOUNDEX_FACTOR))
mc.fixRanks()
mcLang.fixRanks()
mcSoundex.fixRanks()
print "Counted the words"
print "Number of words in the dataset: ", len(mc)
print "Number of languages in the dataset: ", len(mcLang)
print "Number of sounds in the dataset: ", len(mcSoundex)