Ejemplos de Dataset.get_iterator en Python

Lenguaje de programación: Python

Namespace/Package Name: utils.dataset

Clase / Tipo: Dataset

Método / Función: get_iterator

Ejemplos en hotexamples.com: 2

Python Dataset.get_iterator - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de utils.dataset.Dataset.get_iterator extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Dataset(30)

batch_iterator(7)

get_tf_data(5)

from_raw_file(3)

pop_batch_queue(3)

load_from_df(2)

samples(2)

get(2)

reader(2)

get_batch(2)

prepare_data(2)

get_iterator(2)

ident_num(2)

fdict(2)

events(1)

samples_labels(1)

read_xml(1)

next_batch(1)

load_from_file(1)

iterate_once(1)

load_dataset(1)

load_data(1)

__len__(1)

get_data(1)

get_batches(1)

getData(1)

gen_iter(1)

from_list(1)

set_base_seed(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: sequential_preprocess.py Proyecto: MissGod1/DIRE

def main(args):
    dataset = Dataset(args['TAR_FILES'])
    code_line_file = open(args['OUTPUT_CODE_FILE'], 'w')
    all_preserved_tokens = set()
    for example in dataset.get_iterator(num_workers=5):
        code = example.ast.code
        # code_tokens = tokenize_raw_code(code)
        # preserved_tokens = [token for token in code_tokens if token.startswith('@@') and token.endswith('@@')]
        # all_preserved_tokens.update(preserved_tokens)

        # code_line_file.write(' '.join(code_tokens) + '\n')

    code_line_file.close()

    with open(args['OUTPUT_CODE_FILE'] + '.preserved_tokens.txt', 'w') as f:
        for token in all_preserved_tokens:
            f.write(token + '\n')

Ejemplo n.º 2

Mostrar archivo

Archivo: vocab.py Proyecto: DIRECT-team/DIRECT-nlp4prog

    args = docopt(__doc__)
    vocab_size = int(args['--size'])
    vocab_file = args['VOCAB_FILE']
    train_set = Dataset(args['TRAIN_FILE'])

    src_code_tokens_file = vocab_file + '.src_code_tokens.txt'
    src_preserved_tokens = set()
    f_src_token = open(src_code_tokens_file, 'w')

    # extract vocab and node types
    node_types = set()
    src_words = []
    tgt_words = []
    identifier_names = []
    type_tokens = []
    for example in train_set.get_iterator(progress=True, num_workers=5):
        for node in example.ast:
            node_types.add(node.node_type)

            if node.is_variable_node:
                old_var_name = node.old_name
                new_var_name = node.new_name

                src_words.append(old_var_name)

                if old_var_name != new_var_name:
                    tgt_words.append(new_var_name)

            if node.node_type == 'obj' or node.node_type == 'block' and hasattr(
                    node, 'name'):
                identifier_names.append(node.name)