Esempi in Python per MarisaTfidfVectorizer

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: utils

Esempi su hotexamples.com: 5

{shortObject} in {lang}: {examplesCount,plural,one{1 esempio trovato. Questo è il miglior esempio reale in {lang} per {object}, estratto da progetti open source. Lo} other{{examplesCount} esempi trovati. Questi sono i migliori esempi reali in {lang} per {object}, estratti da progetti open source. Li}} puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

MarisaTfidfVectorizer(3)

fit(2)

fit_transform(1)

Esempio n. 1

Mostra file

def vectorizer(txt):
    vec = MarisaTfidfVectorizer(min_df=2,
                                max_features=1000000,
                                stop_words=None,
                                smooth_idf=True,
                                norm='l2',
                                sublinear_tf=True,
                                use_idf=True,
                                ngram_range=(1, 2))
    vec.fit(txt)
    return vec

Esempio n. 2

Mostra file

def vectorizer(txt):
    vec = MarisaTfidfVectorizer(
        min_df = 2,
        stop_words = None,
        max_features=234567,
        smooth_idf=True,
        norm='l2',
        sublinear_tf=True,
        use_idf=True,
        ngram_range=(1,2))
    X = vec.fit_transform(txt)
    return (vec,X)

Esempio n. 3

Mostra file

File: simple_nn_train.py Progetto: KenHollandWHY/kaggle

def tfidf_vectorizer(txt):
    vec = MarisaTfidfVectorizer(
        min_df = 2,
        max_features = 1000000,
        stop_words = None,
        smooth_idf=True,
        norm='l2',
        sublinear_tf=True,
        use_idf=True,
        ngram_range=(1,2))
    vec.fit(txt)
    return vec

Esempio n. 4

Mostra file

def vectorizer(df):
    # 1M max_features should fit in memory,
    # OvA will be at max 184 classes,
    # so we can fit coef_ =  1M*184*8B ~ 1GB in memory easily
    vec = MarisaTfidfVectorizer(min_df=1,
                                stop_words=None,
                                max_features=1000000,
                                smooth_idf=True,
                                norm='l2',
                                sublinear_tf=True,
                                use_idf=True,
                                ngram_range=(1, 3))
    vec.fit(iterText(df))
    return vec

Esempio n. 5

Mostra file

File: training.py Progetto: KenHollandWHY/kaggle

def vectorizer(df):
    # 1M max_features should fit in memory, 
    # OvA will be at max 184 classes, 
    # so we can fit coef_ =  1M*184*8B ~ 1GB in memory easily
    vec = MarisaTfidfVectorizer(
        min_df = 1,
        stop_words = None,
        max_features=1000000,
        smooth_idf=True,
        norm='l2',
        sublinear_tf=True,
        use_idf=True,
        ngram_range=(1,3))
    vec.fit(iterText(df))
    return vec