Python get_language_stopwords示例

编程语言: Python

命名空间/包名称: language_helper

方法/功能: get_language_stopwords

hotexamples.com的示例: 3

Python get_language_stopwords - 已找到3个示例。这些是从开源项目中提取的最受好评的language_helper.get_language_stopwords现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： language_extractor.py 项目： luisarthurbv/bibliographic_tool

def get_text_language(text):
    language_rank = {}
    tokens = utils.get_tokens(text)
    for language in language_helper.get_languages():
        c_stopwords = language_helper.get_language_stopwords(language)
        language_rank[language] = reduce(lambda carry, curr: carry + 1 if curr in c_stopwords else carry, tokens, 0)
    sorted_languages = sorted(language_rank.iteritems(), key=lambda x: -x[1])
    return sorted_languages[0][0]

示例#2

显示文件

文件： rake.py 项目： luisarthurbv/bibliographic_tool

def __get_stopwords_regex(language):
    if language in language_stopwords_re:
        return language_stopwords_re[language]
    l_stopwords = language_helper.get_language_stopwords(language)
    re_stopwords = []
    for stopword in l_stopwords:
        stopword_re = r'\b' + stopword + r'(?![\w-])'
        re_stopwords.append(stopword_re)
    language_stopwords_re[language] = re.compile('|'.join(re_stopwords), re.IGNORECASE)
    return language_stopwords_re[language]

示例#3

显示文件

文件： textrank.py 项目： luisarthurbv/bibliographic_tool

def _filter_tagged_tokens(tagged_tokens, language):
    stop_words = language_helper.get_language_stopwords(language)
    filtered_tagged_tokens = filter(lambda t: t[0] not in stop_words and t[1] in valid_pos_tags, tagged_tokens)
    filtered_tokens = map(lambda t: t[0].lower(), filtered_tagged_tokens)
    return filtered_tokens