Exemplos de get_examples em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: simpletransformers.question_answering.question_answering_utils

Método / Função: get_examples

Exemplos em hotexamples.com: 2

get_examples em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de simpletransformers.question_answering.question_answering_utils.get_examples em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Exemplo n.º 1

0

Exibir arquivo

def load_and_cache_examples(self, examples, evaluate=False, no_cache=False, output_examples=False): """ Converts a list of examples to a TensorDataset containing InputFeatures. Caches the InputFeatures. Utility function for train() and eval() methods. Not intended to be used directly. """ tokenizer = self.tokenizer args = self.args if not no_cache: no_cache = args["no_cache"] os.makedirs(self.args["cache_dir"], exist_ok=True) examples = get_examples(examples, is_training=not evaluate) mode = "dev" if evaluate else "train" cached_features_file = os.path.join( args["cache_dir"], "cached_{}_{}_{}_{}".format(mode, args["model_type"], args["max_seq_length"], len(examples)), ) if os.path.exists(cached_features_file) and ( (not args["reprocess_input_data"] and not no_cache) or (mode == "dev" and args["use_cached_eval_features"])): features = torch.load(cached_features_file) logger.info( f" Features loaded from cache at {cached_features_file}") else: logger.info(f" Converting to features started.") features = convert_examples_to_features( examples=examples, tokenizer=tokenizer, max_seq_length=args["max_seq_length"], doc_stride=args["doc_stride"], max_query_length=args["max_query_length"], is_training=not evaluate, cls_token_segment_id=2 if args["model_type"] in ["xlnet"] else 0, pad_token_segment_id=3 if args["model_type"] in ["xlnet"] else 0, cls_token_at_end=True if args["model_type"] in ["xlnet"] else False, sequence_a_is_doc=True if args["model_type"] in ["xlnet"] else False, silent=args["silent"], ) if not no_cache: torch.save(features, cached_features_file) all_input_ids = torch.tensor([f.input_ids for f in features], dtype=torch.long) all_input_mask = torch.tensor([f.input_mask for f in features], dtype=torch.long) all_segment_ids = torch.tensor([f.segment_ids for f in features], dtype=torch.long) all_cls_index = torch.tensor([f.cls_index for f in features], dtype=torch.long) all_p_mask = torch.tensor([f.p_mask for f in features], dtype=torch.float) all_example_index = torch.arange(all_input_ids.size(0), dtype=torch.long) if evaluate: dataset = TensorDataset( all_input_ids, all_input_mask, all_segment_ids, all_example_index, all_cls_index, all_p_mask, ) else: all_start_positions = torch.tensor( [f.start_position for f in features], dtype=torch.long) all_end_positions = torch.tensor( [f.end_position for f in features], dtype=torch.long) dataset = TensorDataset( all_input_ids, all_input_mask, all_segment_ids, all_start_positions, all_end_positions, all_cls_index, all_p_mask, ) if output_examples: return dataset, examples, features return dataset

Exemplo n.º 2

0

Exibir arquivo

Arquivo: question_answering_model.py Projeto: botelhoa/simpletransformersbotelho

def load_and_cache_examples(self, examples, evaluate=False, no_cache=False, output_examples=False): """ Converts a list of examples to a TensorDataset containing InputFeatures. Caches the InputFeatures. Utility function for train() and eval() methods. Not intended to be used directly. """ tokenizer = self.tokenizer args = self.args if not no_cache: no_cache = args.no_cache os.makedirs(self.args.cache_dir, exist_ok=True) examples = get_examples(examples, is_training=not evaluate) mode = "dev" if evaluate else "train" cached_features_file = os.path.join( args.cache_dir, "cached_{}_{}_{}_{}".format(mode, args.model_type, args.max_seq_length, len(examples)), ) if os.path.exists(cached_features_file) and ( (not args.reprocess_input_data and not no_cache) or (mode == "dev" and args.use_cached_eval_features) ): features = torch.load(cached_features_file) logger.info(f" Features loaded from cache at {cached_features_file}") else: logger.info(" Converting to features started.") features, dataset = squad_convert_examples_to_features( examples=examples, tokenizer=tokenizer, max_seq_length=args.max_seq_length, doc_stride=args.doc_stride, max_query_length=args.max_query_length, is_training=not evaluate, tqdm_enabled=not args.silent, threads=args.process_count, args=args, ) # if not no_cache: # torch.save(features, cached_features_file) # all_input_ids = torch.tensor([f.input_ids for f in features], dtype=torch.long) # all_input_mask = torch.tensor([f.input_mask for f in features], dtype=torch.long) # all_segment_ids = torch.tensor([f.segment_ids for f in features], dtype=torch.long) # all_cls_index = torch.tensor([f.cls_index for f in features], dtype=torch.long) # all_p_mask = torch.tensor([f.p_mask for f in features], dtype=torch.float) # all_example_index = torch.arange(all_input_ids.size(0), dtype=torch.long) # if evaluate: # dataset = TensorDataset( # all_input_ids, all_input_mask, all_segment_ids, all_example_index, all_cls_index, all_p_mask, # ) # else: # all_start_positions = torch.tensor([f.start_position for f in features], dtype=torch.long) # all_end_positions = torch.tensor([f.end_position for f in features], dtype=torch.long) # dataset = TensorDataset( # all_input_ids, # all_input_mask, # all_segment_ids, # all_start_positions, # all_end_positions, # all_cls_index, # all_p_mask, # ) if output_examples: return dataset, examples, features return dataset