Ejemplos de get_stoplist en Python

Lenguaje de programación: Python

Namespace/Package Name: msgvis.apps.base.utils

Método / Función: get_stoplist

Ejemplos en hotexamples.com: 4

Python get_stoplist - 4 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de msgvis.apps.base.utils.get_stoplist extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

Archivo: models.py Proyecto: hds-lab/coding-ml

    def filtered_tokens(self):
        # using lemmatized words
        from msgvis.apps.base.utils import get_stoplist
        tokens = map(lambda x: x.tweet_word.text, self.tweetword_connections.all())

        stop_words = set(get_stoplist()+['ive', 'wasnt', 'didnt', 'dont'])
        tokens = filter(lambda x: x not in stop_words, tokens)
        tokens = filter(lambda x: (len(x) > 2) and not (x.startswith('http') and len(x) > 4), tokens)
        return tokens

Ejemplo n.º 2

Mostrar archivo

    def filtered_tokens(self):
        # using lemmatized words
        from msgvis.apps.base.utils import get_stoplist
        tokens = map(lambda x: x.tweet_word.text,
                     self.tweetword_connections.all())

        stop_words = set(get_stoplist() + ['ive', 'wasnt', 'didnt', 'dont'])
        tokens = filter(lambda x: x not in stop_words, tokens)
        tokens = filter(
            lambda x:
            (len(x) > 2) and not (x.startswith('http') and len(x) > 4), tokens)
        return tokens

Ejemplo n.º 3

Mostrar archivo

Archivo: tasks.py Proyecto: hds-lab/coding-ml

def default_feature_context(name, dataset_id):
    dataset = Dataset.objects.get(pk=dataset_id)
    queryset = dataset.message_set.all()#filter(language__code='en')

    filters = [
        set(get_stoplist()),
        ['ive', 'wasnt', 'didnt', 'dont'],
        LambdaWordFilter(lambda word: word == 'rt' or len(word) <= 2),
        LambdaWordFilter(lambda word: word.startswith('http') and len(word) > 4)
    ]

    return FeatureContext(name=name, queryset=queryset,
                        tokenizer=TweetParserTokenizer,
                        lemmatizer=None,#WordNetLemmatizer(),
                        filters=filters,
                        minimum_frequency=4)

Ejemplo n.º 4

Mostrar archivo

def default_feature_context(name, dataset_id):
    dataset = Dataset.objects.get(pk=dataset_id)
    queryset = dataset.message_set.all()  #filter(language__code='en')

    filters = [
        set(get_stoplist()), ['ive', 'wasnt', 'didnt', 'dont'],
        LambdaWordFilter(lambda word: word == 'rt' or len(word) <= 2),
        LambdaWordFilter(
            lambda word: word.startswith('http') and len(word) > 4)
    ]

    return FeatureContext(
        name=name,
        queryset=queryset,
        tokenizer=TweetParserTokenizer,
        lemmatizer=None,  #WordNetLemmatizer(),
        filters=filters,
        minimum_frequency=4)