Exemplos de Preprocessor.gen_data_vec em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: preprocess

Classe / Tipo: Preprocessor

Método / Função: gen_data_vec

Exemplos em hotexamples.com: 2

Preprocessor.gen_data_vec em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de preprocess.Preprocessor.gen_data_vec em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Preprocessor(30)

add(4)

execute(3)

load(3)

import_video(3)

get_vocabulary(2)

get_states(2)

get_standard_form(2)

get_representer(2)

gen_data_vec(2)

setNextPitchCorner(2)

count_lines(1)

bgsub(1)

load_data(1)

_line_cleanup(1)

lda(1)

investigate_whitelist(1)

index_list_to_word_list(1)

apply(1)

basic_preprocess(1)

get_values_all(1)

get_training_data(1)

get_train_test_data_tag(1)

get_testing_data(1)

get_target_names(1)

build_vocab(1)

convert_text_to_index(1)

build_vocabulary_and_categories(1)

get_feature_names(1)

get_data(1)

get_all_text(1)

_clean_data(1)

getSentences(1)

generateTrainData(1)

convert_index_to_text(1)

gaussian(1)

format_to_nn(1)

format_to_lines(1)

fit_on_corpus(1)

get_all_tag_idx(1)

Métodos Frequentes

Preprocessor (30)

add (4)

execute (3)

load (3)

import_video (3)

get_vocabulary (2)

get_states (2)

get_standard_form (2)

get_representer (2)

gen_data_vec (2)

Métodos Frequentes

setNextPitchCorner (2)

count_lines (1)

bgsub (1)

load_data (1)

_line_cleanup (1)

lda (1)

investigate_whitelist (1)

index_list_to_word_list (1)

apply (1)

basic_preprocess (1)

get_values_all (1)

get_training_data (1)

get_train_test_data_tag (1)

get_testing_data (1)

get_target_names (1)

build_vocab (1)

convert_text_to_index (1)

build_vocabulary_and_categories (1)

get_feature_names (1)

get_data (1)

Métodos Frequentes

get_values_all (1)

get_training_data (1)

get_train_test_data_tag (1)

get_testing_data (1)

get_target_names (1)

build_vocab (1)

convert_text_to_index (1)

build_vocabulary_and_categories (1)

get_feature_names (1)

get_data (1)

get_all_text (1)

_clean_data (1)

getSentences (1)

generateTrainData (1)

convert_index_to_text (1)

gaussian (1)

format_to_nn (1)

format_to_lines (1)

fit_on_corpus (1)

get_all_tag_idx (1)

Métodos Frequentes

get_all_text (1)

_clean_data (1)

getSentences (1)

generateTrainData (1)

convert_index_to_text (1)

gaussian (1)

format_to_nn (1)

format_to_lines (1)

fit_on_corpus (1)

get_all_tag_idx (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: cluster_model_impl.py Projeto: HawChang/text_utils

def preprocess(self, data_dir, re_seg=True, to_file=False, mid_data_paths=None, split_train_test=True, test_ratio=0.2, vec_method="count", feature_select=True, is_percent=True, feature_keep_percent=90, feature_keep_num=10, min_df=3): """根据指定目录获得数据特征 [out] train_data_vec: matrix, 数据集特征 """ preprocessor = Preprocessor( feature_gen_func=self.feature_label_gen, vec_method=vec_method, feature_keep_percent=feature_keep_percent, feature_keep_num=feature_keep_num, is_percent=is_percent, test_ratio=test_ratio, min_df=min_df) # 根据数据生成特征 _, self.train_data_vec, _, _, _ = preprocessor.gen_data_vec( data_dir, self.feature_id_path, split_train_test=split_train_test, feature_select=feature_select, to_file=to_file, re_seg=re_seg, process_file_path=mid_data_paths)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: lr_model_impl.py Projeto: HawChang/text_utils

def preprocess(self, data_dir, re_seg=True, to_file=False, mid_data_paths=None, split_train_test=True, test_ratio=0.2, vec_method="count", feature_select=True, is_percent=True, feature_keep_percent=90, feature_keep_num=10, min_df=3): """ """ preprocessor = Preprocessor( feature_gen_func=self.feature_label_gen, vec_method=vec_method, feature_keep_percent=feature_keep_percent, feature_keep_num=feature_keep_num, is_percent=is_percent, test_ratio=test_ratio, min_df=min_df) _, train_data, train_label, val_data, val_label = preprocessor.gen_data_vec( data_dir, self.feature_id_path, split_train_test=split_train_test, feature_select=feature_select, to_file=to_file, re_seg=re_seg, process_file_path=mid_data_paths)