Esempi in Python per TfidfVectorizer.bert

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: sklearn.feature_extraction.text

Classe/tipologia: TfidfVectorizer

Metodo/funzione: bert

Esempi su hotexamples.com: 1

{shortObject} in {lang}: {examplesCount,plural,one{1 esempio trovato. Questo è il miglior esempio reale in {lang} per {object}, estratto da progetti open source. Lo} other{{examplesCount} esempi trovati. Questi sono i migliori esempi reali in {lang} per {object}, estratti da progetti open source. Li}} puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

fit(30)

get_stop_words(30)

TfidfVectorizer(30)

fit_transform(30)

get_feature_names(30)

inverse_transform(30)

build_analyzer(30)

build_tokenizer(29)

get_params(29)

get_feature_names_out(14)

__init__(12)

idf_(11)

build_preprocessor(8)

max_features(8)

_validate_vocabulary(3)

max_df(3)

fir(2)

N_(2)

fit_on_texts(2)

build_vocab(2)

decode(2)

_tfidf(2)

decode_error(1)

append(1)

_document_frequency(1)

_get_param_names(1)

kneighbors(1)

join(1)

_stop_words_id(1)

inv_vocabulary_(1)

input(1)

infer_vector(1)

idx_target_cache(1)

get_word_net_feature_vecs(1)

bert(1)

get_shape(1)

encode(1)

get_feautre_names(1)

cate_set(1)

get_feature_name(1)

fit_transfrorm(1)

fit_transfrom(1)

count(1)

fit_trainsform(1)

count_args(1)

count_chunks(1)

encoding(1)

mean(1)

Esempio n. 1

Mostra file

File: hub.py Progetto: cedsa2/INF8460

def get_embedding(paragraph, question, representation_name, vocab=None):
    paragraphs_vectors = []
    questions_vectors = []

    if representation_name == "tfidf":
        if vocab:
            print("vocab specified")
            vectorizer = TfidfVectorizer(vocabulary=vocab, ngram_range=(1, 3))
        else:
            vectorizer = TfidfVectorizer(max_features=15000,
                                         ngram_range=(1, 3))
        paragraphs_vectors, vectorizer = getTfIdfReprentation(
            paragraph, vectorizer)
        questions_vectors = vectorizer.transform(question)  #.todense()

    elif representation_name == "glove":
        vectorizer = CountVectorizer()
        X = vectorizer.fit(paragraph).vocabulary_

        glove_dict = get_gloves_dict("glove.42B.300d.txt")
        key_set = set(X.keys()) & set(glove_dict.keys())
        glove_dict_vocab_corpus = {key: glove_dict[key] for key in key_set}

        paragraphs_vectors = get_plong_corpus(paragraph,
                                              glove_dict_vocab_corpus)
        questions_vectors = get_plong_corpus(paragraph,
                                             glove_dict_vocab_corpus)

    elif representation_name == "bert":
        vectorizer = Vectorizer()

        vectorizer.bert(paragraph)
        paragraphs_vectors = vectorizer.vectors

        vectorizer.bert(question)
        questions_vectors = vectorizer.vectors

    else:
        print("error representation_name")

    return paragraphs_vectors, questions_vectors