Esempi in Python per Vectorizer.vectorize_df

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: vectorizer

Classe/tipologia: Vectorizer

Metodo/funzione: vectorize_df

Esempi su hotexamples.com: 3

Vectorizer.vectorize_df in Python: 3 esempi trovati. Questi sono i migliori esempi reali in Python per vectorizer.Vectorizer.vectorize_df, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Vectorizer(30)

vectorize(7)

transform(6)

fit_transform(6)

get_vector(4)

vectorize_df(3)

get_attribute_vector(3)

close(2)

reset_counters(2)

save(2)

load(2)

format(2)

save_vectorizer(2)

save_IDF(1)

load_vectorizer(1)

subtract_features(1)

save_tfidfs(1)

vectorize_sent(1)

text_to_vec(1)

tf_idf(1)

vectorize_sentences(1)

unvectorize(1)

load_IDF(1)

get_vector_matrix(1)

join_features(1)

feature_dot(1)

add_weights(1)

build_name_list(1)

build_tag_map(1)

build_word_map(1)

calculate_IDF(1)

feature(1)

fit(1)

get_vector_size(1)

from_bert(1)

from_corpus(1)

getMagnitude(1)

get_NSEW_batch_attribute_vectors(1)

get_batch_attribute_vectors(1)

get_cos_sim(1)

add_feature(1)

vectorize_tokens(1)

Esempio n. 1

Mostra file

# initialize objects
print('Initializing objects ...')
print('Initializing word embeddings ...')
t1 = time.time()
word_embeddings = WordEmbeddings(word_embeddings_file_path)
t2 = time.time()
print('\tTook %f seconds' % (t2 - t1))
print('Initializing tokenizer ...')
tokenizer = Tokenizer()
print('Initializing vectorizer ...')
vectorizer = Vectorizer(word_embeddings, tokenizer)

#### testing dataset ####
print('Vectorizing testing dataset ...')
ids, test_a_vectors, test_b_vectors, test_gold = vectorizer.vectorize_df(
    test_df)
test_max_a_length = len(max(test_a_vectors, key=len))
test_max_b_length = len(max(test_b_vectors, key=len))
print('maximum number of tokens per sentence A in testing set is %d' %
      test_max_a_length)
print('maximum number of tokens per sentence B in testing set is %d' %
      test_max_b_length)
max_len = max([test_max_a_length, test_max_b_length])

# padding
print('Padding testing dataset ...')
test_a_vectors = pad_tensor(test_a_vectors, max_len)
test_b_vectors = pad_tensor(test_b_vectors, max_len)

print('Loading the model ...')
siamese = SiameseModel(False)

Esempio n. 2

Mostra file

File: pretrain_semeval.py Progetto: jehrodrigues/siamese-similarity

# initialize objects
print('Initializing objects ...')
print('Initializing word embeddings ...')
t1 = time.time()
word_embeddings = WordEmbeddings(word_embeddings_file_path)
t2 = time.time()
print('\tTook %f seconds' % (t2 - t1))
print('Initializing tokenizer ...')
tokenizer = Tokenizer()
print('Initializing vectorizer ...')
vectorizer = Vectorizer(word_embeddings, tokenizer)

#### training dataset ####
# vectorizing
ids, train_a_vectors, train_b_vectors, train_gold = vectorizer.vectorize_df(df)
train_max_a_length = len(max(train_a_vectors, key=len))
train_max_b_length = len(max(train_b_vectors, key=len))
print('maximum number of tokens per sentence A in training set is %d' %
      train_max_a_length)
print('maximum number of tokens per sentence B in training set is %d' %
      train_max_b_length)
max_len = max([train_max_a_length, train_max_b_length])

# padding
train_a_vectors = pad_tensor(train_a_vectors, max_len)
train_b_vectors = pad_tensor(train_b_vectors, max_len)

print('Training the model ...')
siamese = SiameseModel()
validation_data = None

Esempio n. 3

Mostra file

# initialize objects
print('Initializing objects ...')
print('Initializing word embeddings ...')
t1 = time.time()
word_embeddings = WordEmbeddings(word_embeddings_file_path)
t2 = time.time()
print('\tTook %f seconds' % (t2 - t1))
print('Initializing tokenizer ...')
tokenizer = Tokenizer()
print('Initializing vectorizer ...')
vectorizer = Vectorizer(word_embeddings, tokenizer)

#### training dataset ####
# vectorizing
train_a_vectors, train_b_vectors, train_gold = vectorizer.vectorize_df(train_df)
train_max_a_length = len(max(train_a_vectors, key=len))
train_max_b_length = len(max(train_b_vectors, key=len))
print('maximum number of tokens per sentence A in training set is %d' % train_max_a_length)
print('maximum number of tokens per sentence B in training set is %d' % train_max_b_length)
max_len = max([train_max_a_length, train_max_b_length])

# padding
train_a_vectors = pad_tensor(train_a_vectors, max_len)
train_b_vectors = pad_tensor(train_b_vectors, max_len)


#### development dataset ####
# vectorizing
dev_a_vectors, dev_b_vectors, dev_gold = vectorizer.vectorize_df(dev_df)
dev_max_a_length = len(max(dev_a_vectors, key=len))