Python TfidfVectorizer.encode Beispiele

Programmiersprache: Python

Namespace / Paketname: sklearn.feature_extraction.text

Klasse / Typ: TfidfVectorizer

Methode / Funktion: encode

Beispiele auf hotexamples.com: 1

Python TfidfVectorizer.encode - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die sklearn.feature_extraction.text.TfidfVectorizer.encode, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

fit(30)

get_stop_words(30)

TfidfVectorizer(30)

fit_transform(30)

get_feature_names(30)

inverse_transform(30)

build_analyzer(30)

build_tokenizer(29)

get_params(29)

get_feature_names_out(14)

__init__(12)

idf_(11)

build_preprocessor(8)

max_features(8)

_validate_vocabulary(3)

max_df(3)

fir(2)

N_(2)

fit_on_texts(2)

build_vocab(2)

decode(2)

_tfidf(2)

decode_error(1)

append(1)

_document_frequency(1)

_get_param_names(1)

kneighbors(1)

join(1)

_stop_words_id(1)

inv_vocabulary_(1)

input(1)

infer_vector(1)

idx_target_cache(1)

get_word_net_feature_vecs(1)

bert(1)

get_shape(1)

encode(1)

get_feautre_names(1)

cate_set(1)

get_feature_name(1)

fit_transfrorm(1)

fit_transfrom(1)

count(1)

fit_trainsform(1)

count_args(1)

count_chunks(1)

encoding(1)

mean(1)

Beispiel #1

Datei anzeigen

Datei: streamlit_functions.py Projekt: Gio-Mgm/food-flix

def fit_model(df, method):
    """
        Fitting chosen model

        params:
            df: DataFrame used,
            method: model chosen

        returns:
            generated model,
            transformed datas
    """

    if method == "TF-IDF":
        model = TfidfVectorizer(analyzer='word',
                                ngram_range=(1, 2),
                                min_df=0,
                                stop_words=STOPS)
        X = model.fit_transform(df['content'])
    elif method == "CountVectorizer":
        model = CountVectorizer(analyzer='word',
                                ngram_range=(1, 2),
                                min_df=0,
                                stop_words=STOPS)
        X = model.fit_transform(df['content'])
    elif method == "BERT":
        word_embedding_model = models.Transformer('camembert-base')
        pooling_model = models.Pooling(
            word_embedding_model.get_word_embedding_dimension(),
            pooling_mode_mean_tokens=True,
            pooling_mode_max_tokens=False)
        model = SentenceTransformer(
            modules=[word_embedding_model, pooling_model])
        X = model.encode(df['content'], show_progress_bar=True)
    return model, X