Python DataSet.add_sample Exemples

Langage de programmation: Python

Espace de nommage/Pack: data

Class/Type: DataSet

Méthode/Fonction: add_sample

Exemples au hotexamples.com: 1

Python DataSet.add_sample - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de data.DataSet.add_sample extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

DataSet(30)

get_all_sequences_in_memory(24)

frame_generator(23)

get_frames_for_sample(7)

epoch_completed(7)

get_frames_by_filename(5)

batch(4)

get_train_data_set(3)

CVDataset(2)

describe(2)

is_numerized(2)

get_iterator(2)

get_instances_idset(2)

evidence(2)

set_name_attribute(2)

append(2)

MyDataset(2)

build(2)

PILDataset(2)

add_data_to_log_file(2)

add_data_instance(2)

clean_dataset(1)

get_data(1)

get_data_len(1)

get_data_size(1)

get_features_for_sample(1)

get_instance(1)

get_frames_of_sixteen(1)

get_class_one_hot(1)

add(1)

get_products(1)

get_set_from_data(1)

get_top_N_from_prediction(1)

MyAuxDataset(1)

get_classes(1)

get_batch(1)

get_categories(1)

apply_feature_scaling(1)

check_data(1)

drop_feature_by_missed_rate(1)

build_image_sequence(1)

feature_discrete(1)

feature_matrix_labels(1)

fix_na(1)

frame_generator2(1)

create_tasks(1)

frame_generator_test(1)

from_positions_w_context(1)

gen_test(1)

generator(1)

Méthodes fréquemment utilisées

DataSet (30)

get_all_sequences_in_memory (24)

frame_generator (23)

get_frames_for_sample (7)

epoch_completed (7)

get_frames_by_filename (5)

batch (4)

get_train_data_set (3)

CVDataset (2)

describe (2)

Méthodes fréquemment utilisées

is_numerized (2)

get_iterator (2)

get_instances_idset (2)

evidence (2)

set_name_attribute (2)

append (2)

MyDataset (2)

build (2)

PILDataset (2)

add_data_to_log_file (2)

add_data_instance (2)

clean_dataset (1)

get_data (1)

get_data_len (1)

get_data_size (1)

get_features_for_sample (1)

get_instance (1)

get_frames_of_sixteen (1)

get_class_one_hot (1)

add (1)

Méthodes fréquemment utilisées

add_data_instance (2)

clean_dataset (1)

get_data (1)

get_data_len (1)

get_data_size (1)

get_features_for_sample (1)

get_instance (1)

get_frames_of_sixteen (1)

get_class_one_hot (1)

add (1)

get_products (1)

get_set_from_data (1)

get_top_N_from_prediction (1)

MyAuxDataset (1)

get_classes (1)

get_batch (1)

get_categories (1)

apply_feature_scaling (1)

check_data (1)

drop_feature_by_missed_rate (1)

build_image_sequence (1)

feature_discrete (1)

feature_matrix_labels (1)

fix_na (1)

frame_generator2 (1)

create_tasks (1)

frame_generator_test (1)

from_positions_w_context (1)

gen_test (1)

generator (1)

Méthodes fréquemment utilisées

get_products (1)

get_set_from_data (1)

get_top_N_from_prediction (1)

MyAuxDataset (1)

get_classes (1)

get_batch (1)

get_categories (1)

apply_feature_scaling (1)

check_data (1)

drop_feature_by_missed_rate (1)

build_image_sequence (1)

feature_discrete (1)

feature_matrix_labels (1)

fix_na (1)

frame_generator2 (1)

create_tasks (1)

frame_generator_test (1)

from_positions_w_context (1)

gen_test (1)

generator (1)

add_sample (1)

get_all_sequences_in_memory_names (1)

get_all_sequences_in_memory_with_name (1)

frame_generator_train (1)

Exemple #1

0

Afficher le fichier

Fichier : featurize.py Projet : juditacs/noun-verb

class Featurizer: def __init__(self, max_sample_per_class, max_lines=0, skip_duplicates=True, tolower=False, include_none_labels=False, label_extractor=None): self.dataset = DataSet( max_sample_per_class=max_sample_per_class, skip_duplicates=skip_duplicates, ) self.label_extractor = LabelExtractor(label_extractor) self._include_none_labels = include_none_labels self._max_lines = max_lines self._line_cnt = 0 self._tolower = tolower def featurize_stream(self, stream): for line in stream: if self.continue_reading() is False: break try: sample = self.extract_sample_from_line(line) except InvalidInput: continue self.dataset.add_sample(sample) self.featurize_sample(sample) def continue_reading(self): self._line_cnt += 1 if self._max_lines > 0 and self._line_cnt > self._max_lines: return False return not self.dataset.full def extract_sample_from_line(self, line): # TODO this is WebCorpus specific, it should be in a separate class if not line.strip() or 'UNKNOWN' in line or '??' in line: raise InvalidLine() fd = line.strip().split('\t') if len(fd) < 2: raise InvalidLine("Not enough fields.") word, tag = fd[:2] label = self.label_extractor(tag) if label is None: if self._include_none_labels: label = "OTHER" else: raise InvalidTag() if self._tolower: word = word.lower() return Sample(word, label) def featurize_sample(self, sample): sample.features = {'word': sample.sample} def get_samples(self): return self.dataset.samples @property def X(self): return self.dataset.X @property def y(self): return self.dataset.y