Python DataHandler.add_entry примеры использования

Язык программирования: Python

Пространство имен/Пакет: data_handler

Класс/Тип: DataHandler

Метод/Функция: add_entry

Примеров на hotexamples.com: 1

Python DataHandler.add_entry - 1 пример найден. Это лучшие примеры Python кода для data_handler.DataHandler.add_entry, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

DataHandler(30)

collect_data(5)

close(2)

df_5(2)

SMA(2)

create_bagged_datasets(2)

convert_to_matrix(2)

connect_data_filler(2)

column(2)

df_30(2)

generate_data(2)

categorical_to_num(2)

SetTimeFrame(2)

extract_inception_model(1)

fill_ring_data(1)

delete_zip(1)

epoch_end(1)

entry_exists(1)

filter_data(1)

dump(1)

download_or_load(1)

load_link(1)

download(1)

load_search(1)

dispatch(1)

extract_data_files(1)

create_train_validation_sets(1)

delete_sample_files(1)

compress_packets(1)

add_entry(1)

add_location(1)

add_search(1)

book_id2matrix_id(1)

build_vocab(1)

calculate_num_images(1)

compute_descriptors(1)

data_stats(1)

connectJobColl(1)

convert_classification_result_to_dataframe(1)

convert_vrc_to_png(1)

create_targets(1)

cross_validation(1)

data_augmentation(1)

data_split(1)

write_to_result(1)

Пример #1

Показать файл

def scrape():
    vprint('working from %s' % getcwd())
    handler = DataHandler(OUTPUT)
    handler.read_data()
    handler.remove_old_entries(DAYS_TO_KEEP)
    added, per_url = 0, 0
    for url in get_file_items(URLS_PATH):
        vprint('requesting feed from %s...' % url)
        feed = parse(url)
        if not feed or 'status' not in feed:
            tsprint('error: unable to reach target url. aborting.')
            exit(-1)
        status = feed['status']
        if status != 200:
            tsprint(
                'error: request from %s responded with error code %s. skipping...'
                % (url, status))
            continue
        vprint('status returned normal. scanning entries...')
        for entry in feed['entries']:
            try:
                id_ = entry['id']
                published = None
                if 'published_parsed' in entry:
                    published = entry['published_parsed']
                elif 'updated_parsed' in entry:
                    published = entry['updated_parsed']
                else:
                    print('entries may not have dates. skipping...')
                    break
                if not is_new(published) or handler.entry_exists(id_):
                    continue
                tags = []
                if 'www.reddit.com' in url or 'tags' not in entry or not entry[
                        'tags']:
                    tags = clean_unique_tags([entry['title']])
                    if per_url == 0:
                        vprint(
                            'no tags for entries, using title instead:\n  %s' %
                            tags)
                else:
                    tags = clean_unique_tags(
                        [tag['term'] for tag in entry['tags']])
                if not tags: continue
                extras = {}
                if 'www.reddit.com' in url and 'summary' in entry:
                    m = search(r'href="(\S+)">\[link\]', entry['summary'])
                    if m: extras = {"dlink": m.group(1)}
                handler.add_entry(url, id_, clean_entry(entry, tags, **extras))
                added += 1
                per_url += 1
            except KeyError as e:
                print('%s\nskipping...' % e)
                per_url = 0
                break
        vprint('got %s entries from %s' % (per_url, url))
        per_url = 0
    handler.write_data()
    tsprint('added %s new entries' % added)
    tsprint('%s entries total' % len(handler.get_all_entries()))