Python WikipediaDataset.get_wikititle_by_id примеры использования

Язык программирования: Python

Пространство имен/Пакет: sellibrary.wiki.wikipedia_datasets

Класс/Тип: WikipediaDataset

Метод/Функция: get_wikititle_by_id

Примеров на hotexamples.com: 2

Python WikipediaDataset.get_wikititle_by_id - 2 примера найдено. Это лучшие примеры Python кода для sellibrary.wiki.wikipedia_datasets.WikipediaDataset.get_wikititle_by_id, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

WikipediaDataset(13)

get_wikititle_case_insensitive_marisa_trie(5)

get_links_to(3)

get_entity_in_degree(2)

get_entity_out_degree(2)

get_wikititle_by_id(2)

get_wikititle_id_from_id(2)

convert_link_graph_to_csr_and_csc(1)

extract_graph_from_compressed(1)

get_anchor_text_case_insensitive_marisa_trie(1)

get_entity_degree(1)

get_links_from(1)

Пример #1

Показать файл


if __name__ == "__main__":
    fg = FilterGolden()

    dd = DatasetDexter()
    wd = WikipediaDataset()

    dexter_json_doc_list = dd.get_dexter_dataset(
        FileLocations.get_dropbox_dexter_path(), 'saliency-dataset.json')
    golden_saliency_by_entid_by_docid = dd.get_golden_saliency_by_entid_by_docid(
        dexter_json_doc_list, wd)

    #check which are still valid

    wikititle_by_id = wd.get_wikititle_by_id()
    not_found_count = 0
    count = 0
    multiple_wid_count = 0

    for docid in golden_saliency_by_entid_by_docid.keys():
        for entity_id in golden_saliency_by_entid_by_docid[docid].keys():

            n_entity_id = wd.get_wikititle_id_from_id(entity_id)

            wikititle1 = ''
            wikititle2 = ''
            if entity_id in wikititle_by_id:
                wikititle1 = wikititle_by_id[entity_id]
            if n_entity_id in wikititle_by_id:
                wikititle2 = wikititle_by_id[n_entity_id]

Пример #2

Показать файл

Файл: hack_30_show_doc_and_golden_saliency.py Проект: dwanev/SEL

    print('not_salient_list:' + str(not_salient_list))
    print('salient_list:' + str(salient_list))


if __name__ == "__main__":

    filename = FileLocations.get_dropbox_intermediate_path() + 'sel.pickle'
    build_model = False

    #    smb = SelModelBuilder()

    # if build_model:
    #     sentiment_processor = smb.train_and_save_model(filename)
    # else:
    #     sentiment_processor = SentimentProcessor()
    #     sentiment_processor.load_model(filename)

    dd = DatasetDexter()
    wikipediaDataset = WikipediaDataset()
    document_list = dd.get_dexter_dataset(
        path=FileLocations.get_dropbox_dexter_path())
    spotter = GoldenSpotter(document_list, wikipediaDataset)

    golden_saliency_by_entid_by_docid = dd.get_golden_saliency_by_entid_by_docid(
        document_list, wikipediaDataset)

    wikititle_by_id = wikipediaDataset.get_wikititle_by_id()

    show_doc_info(2)