Python Preprocessor.fit_transform Exemples

Langage de programmation: Python

Espace de nommage/Pack: preprocessing

Class/Type: Preprocessor

Méthode/Fonction: fit_transform

Exemples au hotexamples.com: 3

Python Preprocessor.fit_transform - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de preprocessing.Preprocessor.fit_transform extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Preprocessor(21)

preprocess(4)

is_null_present(4)

impute_missing_values(4)

get_columns_with_zero_std_deviation(4)

from_json(3)

fit_transform(3)

exposure_equalization(2)

preprocess_image(2)

import_labeled_data(2)

get_version(2)

getDatasetSize(2)

get_rnn_format(2)

triple_intervals(2)

displayImage(2)

apply_pca(2)

encode_labels(2)

preprocess_images(1)

makeW2Vfile(1)

preprocess_raw_data(1)

inverse_transform_lemmas(1)

inverse_transform_morph(1)

inverse_transform_pos(1)

add_branch(1)

lemmatize_all_patterns(1)

loadDataset(1)

load_transformer(1)

merge(1)

_divide_data(1)

mutual_info_select(1)

inverse_transform_labels(1)

poetic_preprocessing(1)

prepare_nn_entries(1)

_preprocess_data(1)

preprocessComment(1)

preprocessComments(1)

preprocess_data(1)

preprocess_file(1)

path(1)

execute(1)

inv_perspective_transform(1)

get_dataset_paths(1)

find_signals(1)

fit(1)

create_data_loaders(1)

generateFixedLength(1)

getBatch(1)

convert_color(1)

getXVectorData(1)

get_classification_data(1)

Méthodes fréquemment utilisées

Preprocessor (21)

preprocess (4)

is_null_present (4)

impute_missing_values (4)

get_columns_with_zero_std_deviation (4)

from_json (3)

fit_transform (3)

exposure_equalization (2)

preprocess_image (2)

import_labeled_data (2)

Méthodes fréquemment utilisées

get_version (2)

getDatasetSize (2)

get_rnn_format (2)

triple_intervals (2)

displayImage (2)

apply_pca (2)

encode_labels (2)

preprocess_images (1)

makeW2Vfile (1)

preprocess_raw_data (1)

inverse_transform_lemmas (1)

inverse_transform_morph (1)

inverse_transform_pos (1)

add_branch (1)

lemmatize_all_patterns (1)

loadDataset (1)

load_transformer (1)

merge (1)

_divide_data (1)

mutual_info_select (1)

Méthodes fréquemment utilisées

inverse_transform_lemmas (1)

inverse_transform_morph (1)

inverse_transform_pos (1)

add_branch (1)

lemmatize_all_patterns (1)

loadDataset (1)

load_transformer (1)

merge (1)

_divide_data (1)

mutual_info_select (1)

inverse_transform_labels (1)

poetic_preprocessing (1)

prepare_nn_entries (1)

_preprocess_data (1)

preprocessComment (1)

preprocessComments (1)

preprocess_data (1)

preprocess_file (1)

path (1)

execute (1)

inv_perspective_transform (1)

get_dataset_paths (1)

find_signals (1)

fit (1)

create_data_loaders (1)

generateFixedLength (1)

getBatch (1)

convert_color (1)

getXVectorData (1)

get_classification_data (1)

Méthodes fréquemment utilisées

inverse_transform_labels (1)

poetic_preprocessing (1)

prepare_nn_entries (1)

_preprocess_data (1)

preprocessComment (1)

preprocessComments (1)

preprocess_data (1)

preprocess_file (1)

path (1)

execute (1)

inv_perspective_transform (1)

get_dataset_paths (1)

find_signals (1)

fit (1)

create_data_loaders (1)

generateFixedLength (1)

getBatch (1)

convert_color (1)

getXVectorData (1)

get_classification_data (1)

compulsory_preprocessing (1)

get_emoji_score (1)

has_proper_noun (1)

get_image (1)

get_log_mel_spectrograms (1)

get_numerical (1)

get_processed_image (1)

_classify_data (1)

get_signals (1)

get_test_generator (1)

get_train_generator (1)

check_audio_length (1)

add_transformer_to_branch (1)

Exemple #1

0

Afficher le fichier

class Pipeline(BaseEstimator, TransformerMixin): """ """ def __init__(self, numeric, id=None, target=None, categorical=None, verbose=0): self.created_features = None self.id = id self.target = target self.categorical = categorical self.numeric = numeric self.verbose = verbose self.feature_generator = None self.preprocessor = None def fit_transform(self, df, y=None, **fit_params): with Timer('pipelines.Pipeline.fit_transform:', self.verbose): self.feature_generator = FeatureGenerator( id=self.id, numeric=self.numeric, categorical=self.categorical, target=self.target, verbose=self.verbose, ) df_features = self.feature_generator.fit_transform(df) self.preprocessor = Preprocessor( id=self.id, numeric=self.numeric, categorical=self.categorical, target=self.target, verbose=self.verbose, ) x = self.preprocessor.fit_transform(df_features) return x def transform(self, df): with Timer('pipelines.Pipeline.transform:', self.verbose): if self.feature_generator is None: raise NotFittedError( f'feature_generator = {self.feature_generator}') if self.preprocessor is None: raise NotFittedError(f'preprocessor = {self.preprocessor}') df_features = self.feature_generator.transform(df) x = self.preprocessor.transform(df_features) return x def fit(self, x, y=None, **fit_params): return self def get_feature_names(self): return self.created_features

Exemple #2

0

Afficher le fichier

Fichier : predict.py Projet : Faruman/NewsClassification

predict_df = predict_df.explode(data_columns) predict_df = predict_df.reset_index(drop=True) predict_df = predict_df.reset_index(drop=False) ## do the preprocessing print("Preprocess") preprocessor = Preprocessor( doLower=args["doLower"], doLemmatization=args["doLemmatization"], removeStopWords=args["removeStopWords"], doSpellingCorrection=args["doSpellingCorrection"], removeNewLine=args["removeNewLine"], removePunctuation=args["removePunctuation"], removeHtmlTags=args["removeHtmlTags"], minTextLength=args["minTextLength"]) predict_df["processed"] = preprocessor.fit_transform( predict_df["text_german"]) predict_df = predict_df.dropna(subset=["processed"], axis=0) print("Tokenize") tokenizer = Tokenizer(tokenizeStr=preperation_technique, ngram=preperation_ngram, fasttextFile=args["fasttext_file"], doLower=args["doLower"]) predict_df["processed"] = tokenizer.fit_transform(predict_df["processed"]) ## for testing purposes #train_df = train_df.sample(100) #val_df = val_df.sample(20) #test_df = test_df.sample(20) ## apply the model

Exemple #3

0

Afficher le fichier

Fichier : main.py Projet : Faruman/ToxicCommentClassification

logging.error("vaidation_split needs to be given.") sys.exit("vaidation_split needs to be given.") ## get data and train columns data_column = list(set(train_df.columns) - set(args["targets"]))[0] ## do the preprocessing print("Preprocess") preprocessor = Preprocessor( doLower=args["doLower"], doLemmatization=args["doLemmatization"], removeStopWords=args["removeStopWords"], doSpellingCorrection=args["doSpellingCorrection"], removeNewLine=args["removeNewLine"], removePunctuation=args["removePunctuation"]) train_df[data_column] = preprocessor.fit_transform( train_df[data_column]) val_df[data_column] = preprocessor.transform(val_df[data_column]) test_df[data_column] = preprocessor.transform(test_df[data_column]) ## save the preprocessed data if not os.path.exists(os.path.join(args["data_path"], "temp")): os.makedirs(os.path.join(args["data_path"], "temp")) train_df.to_pickle(train_pre_path) val_df.to_pickle(val_pre_path) test_df.to_pickle(test_pre_path) else: train_df = pd.read_pickle(train_pre_path) val_df = pd.read_pickle(val_pre_path) test_df = pd.read_pickle(test_pre_path) ## get data and train columns data_column = list(set(train_df.columns) - set(args["targets"]))[0]