Python get_dataset 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: fbsearch.dataset

메소드/함수: get_dataset

hotexamples.com에서의 예제들: 6

Python get_dataset - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 fbsearch.dataset.get_dataset에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: test_dataset.py 프로젝트: daoudclarke/fbsearch

def test_dataset_loading():
    data = """
        [
          {
            "url": "http://www.freebase.com/view/en/justin_bieber",
            "targetValue": "(list (description \\"Jazmyn Bieber\\") (description \\"Jaxon Bieber\\"))",
            "utterance": "what is the name of justin bieber brother?"
          }
        ]
    """
    
    dataset = get_dataset(StringIO(data))
    assert dataset == [('what is the name of justin bieber brother?',
                        ['Jazmyn Bieber', 'Jaxon Bieber'])]

예제 #2

파일 보기

파일: evaluate.py 프로젝트: daoudclarke/fbsearch

def evaluate_cached_oracle():
    random = Random(1)

    dataset_file = open(settings.DATASET_PATH)
    dataset = get_dataset(dataset_file)
    random.shuffle(dataset)

    system = CachedOracleSystem(dataset)

    dataset = [item for item in dataset if item[0] in system.queries]

    logger.info("Testing on %d items", len(dataset))
    results = get_target_and_predicted_values(dataset, system)
    save(results, settings.RESULTS_PATH)
    analyse()

예제 #3

파일 보기

파일: evaluate.py 프로젝트: daoudclarke/fbsearch

def evaluate_tensor():
    random = Random(1)

    dataset_file = open(settings.DATASET_PATH)
    dataset = get_dataset(dataset_file)
    random.shuffle(dataset)

    logger.info("Training")
    train_set = dataset[:100] #2500]
    system = TensorSystem(CachedOracleSystem)
    system.train(train_set)

    test_set = dataset[2500:2510]
    logger.info("Testing on %d items", len(test_set))
    results = get_target_and_predicted_values(test_set, system)
    save(results, settings.RESULTS_PATH)
    system.connector.save_cache()
    analyse()

예제 #4

파일 보기

파일: evaluate.py 프로젝트: daoudclarke/fbsearch

def evaluate_quickly():
    output_path = 'system-best.json'

    random = Random(2)

    dataset_file = open(settings.DATASET_PATH)
    dataset = get_dataset(dataset_file)
    random.shuffle(dataset)

    logger.info("Training")
    train_set = dataset[:2500]
    #system = TensorSystem(CachedOracleSystem)
    system = NNSystem(CachedOracleSystem)
    system.train(train_set)

    test_set = dataset[2500:2550]
    logger.info("Testing on %d items", len(test_set))
    results = get_system_best(test_set, system)
    with open(output_path, 'w') as output_file:
        pickle.dump(results, output_file)
    system.connector.save_cache()
    print analyse_system_best(output_path)

예제 #5

파일 보기

    i = 0
    for query, target_entities in dataset:
        results, expressions = oracle.get_best_results_and_expressions(query)
        yield {
            'query': query,
            'results': results,
            'expressions': expressions,
            'target': target_entities,
        }
        i += 1
        logger.info("Completed: %d", i)

        if i % 10 == 0:
            logger.info("Saving caches")
            oracle.connector.save_cache()
            logger.info("Saving complete")


def save_oracle_data(oracle_results):
    with open(settings.ORACLE_CACHE_PATH, 'w') as cache_file:
        for result in oracle_results:
            pickle.dump(result, cache_file)
            cache_file.flush()


if __name__ == "__main__":
    dataset_file = open(settings.DATASET_PATH)
    dataset = get_dataset(dataset_file)
    oracle_data = get_cache_oracle_data(dataset)
    save_oracle_data(oracle_data)

예제 #6

파일 보기

파일: cachedoracle.py 프로젝트: daoudclarke/fbsearch

    i = 0
    for query, target_entities in dataset:
        results, expressions = oracle.get_best_results_and_expressions(query)
        yield {
                'query': query,
                'results': results,
                'expressions': expressions,
                'target': target_entities,
                }
        i += 1
        logger.info("Completed: %d", i)

        if i % 10 == 0:
            logger.info("Saving caches")
            oracle.connector.save_cache()
            logger.info("Saving complete")


def save_oracle_data(oracle_results):
    with open(settings.ORACLE_CACHE_PATH, 'w') as cache_file:
        for result in oracle_results:
            pickle.dump(result, cache_file)
            cache_file.flush()

if __name__ == "__main__":
    dataset_file = open(settings.DATASET_PATH)
    dataset = get_dataset(dataset_file)
    oracle_data = get_cache_oracle_data(dataset)
    save_oracle_data(oracle_data)