Esempi in Python per TfidfVectorizer.kneighbors

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: sklearn.feature_extraction.text

Classe/tipologia: TfidfVectorizer

Metodo/funzione: kneighbors

Esempi su hotexamples.com: 1

TfidfVectorizer.kneighbors in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per sklearn.feature_extraction.text.TfidfVectorizer.kneighbors, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

fit(30)

get_stop_words(30)

TfidfVectorizer(30)

fit_transform(30)

get_feature_names(30)

inverse_transform(30)

build_analyzer(30)

build_tokenizer(29)

get_params(29)

get_feature_names_out(14)

__init__(12)

idf_(11)

build_preprocessor(8)

max_features(8)

_validate_vocabulary(3)

max_df(3)

fir(2)

N_(2)

fit_on_texts(2)

build_vocab(2)

decode(2)

_tfidf(2)

decode_error(1)

append(1)

_document_frequency(1)

_get_param_names(1)

kneighbors(1)

join(1)

_stop_words_id(1)

inv_vocabulary_(1)

input(1)

infer_vector(1)

idx_target_cache(1)

get_word_net_feature_vecs(1)

bert(1)

get_shape(1)

encode(1)

get_feautre_names(1)

cate_set(1)

get_feature_name(1)

fit_transfrorm(1)

fit_transfrom(1)

count(1)

fit_trainsform(1)

count_args(1)

count_chunks(1)

encoding(1)

mean(1)

Esempio n. 1

Mostra file

File: main.py Progetto: JiekaiJia/kaggle_shopee_competition

    print('#' * 40)
    print('### TOP %i DUPLICATED ITEM:' % (k + 1), groups.index[k])
    print('#' * 40)
    top = ds.df.loc[ds.df.label_group == groups.index[k]]
    displayDF(top, random=False, ROWS=2, COLS=4)

model = TfidfVectorizer(stop_words='english', binary=True)
text_embeddings = model.fit_transform(ds.df.title).toarray()
print('text embeddings shape is', text_embeddings.shape)

from sklearn.neighbors import NearestNeighbors

KNN = 50
model = NearestNeighbors(n_neighbors=KNN)
model.fit(text_embeddings)
distances, indices = model.kneighbors(text_embeddings)

knn_model_folder = "./models/knn"
np.save(os.path.join(knn_model_folder, "distances_50_centroids.npy"),
        distances)
np.save(os.path.join(knn_model_folder, "indices_50_centroids.npy"), indices)

###############  Image training Pytorch

# configs:

torch_train_dataset = ShopeeTorch()

# Number of classes in the dataset
num_classes = torch_train_dataset.n_labels()