Python LoadData.build_vocab Beispiele

Programmiersprache: Python

Namespace / Paketname: load_data

Klasse / Typ: LoadData

Methode / Funktion: build_vocab

Beispiele auf hotexamples.com: 1

Python LoadData.build_vocab - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die load_data.LoadData.build_vocab, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

LoadData(30)

get_data(6)

read_data(5)

get_labels(5)

query_db(4)

load(4)

load_data(4)

load_processed_data(2)

reduce_mem_usage(2)

main(2)

make_dataset(2)

close(2)

query_and_save(2)

run_loadData(2)

build_vocab(1)

save_data(1)

load_train_data(1)

pad_data(1)

open_text(1)

next(1)

negative_sample(1)

transform(1)

update_negative_sample(1)

load_txt(1)

fetch_data(1)

load_several_html(1)

load_test_data(1)

get_temp_web(1)

getInputValues(1)

get_all_frames(1)

extrac_keywords(1)

data_split(1)

get_last_n_frames(1)

get_segments(1)

get_test_batch(1)

fit_transform(1)

get_train_batch(1)

items(1)

iterate_root_web(1)

creat_id_sentences(1)

loadNSplit(1)

_load_data(1)

load_html(1)

values(1)

Beispiel #1

Datei anzeigen

Datei: runner.py Projekt: zhanghk-pku/ICD_10-text-classification

keyword_num = 10  # 关键词（特征词）个数
test_rate = 0.1  # 测试集比例
hidden_dim = 200  # LSTM的隐层神经元个数（输出维度）
word_emb_dim = 100  # 词向量维度
feature_emb_dim = 50  # 特征名称embedding维度
keep_prob = 0.8  # dropout保留比例
num_layers = 1  # LSTM层数
batch_size = 200  # 每个batch的大小
learning_rate = 0.0001  # 学习率
num_epochs = 10  # 训练数据迭代次数
add_feature = False  # 是否加特征名embedding
add_keyword_attention = False  # 是否加关键词attention

print('loading data ...')
text_data = LoadData('diag_code_data.csv', filter_num, add_feature)
word_vocab, feature_vocab = text_data.build_vocab()
vocab_size = len(word_vocab)
print('the vocabulary size is {}'.format(vocab_size))
label = text_data.label

features = text_data.feature_names
num_features = len(features)
num_classes = len(set(label))
print('num_classes = {}, num_features = {}'.format(num_classes, num_features))

sentences = text_data.creat_id_sentences(word_vocab, feature_vocab)
sentences_length = [len(sentence) for sentence in sentences]
mean_seq_length = np.mean(sentences_length)
max_seq_length = np.max(sentences_length)
print('mean_seq_length = {}, max_seq_length = {}'.format(
    mean_seq_length, max_seq_length))