Ejemplos de Dictionary.build_dictionary en Python

Lenguaje de programación: Python

Namespace/Package Name: dictionary

Clase / Tipo: Dictionary

Método / Función: build_dictionary

Ejemplos en hotexamples.com: 3

Python Dictionary.build_dictionary - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de dictionary.Dictionary.build_dictionary extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Dictionary(30)

add_term(12)

add(12)

encode_brief(7)

check(6)

add_word(5)

add_pad_token(5)

add_unk_token(5)

delete(4)

add_all(3)

accept_new(3)

doc_length(3)

build_dictionary(3)

delete_word(2)

add_new_term(2)

add_normalised_doc_length(2)

close(2)

all_docs(2)

add_single_word2dic(2)

add_start_token(2)

all_terms(2)

add_symbol(2)

create_default(2)

database_exists(2)

bos(2)

add_items(2)

add_documents(2)

add_doc_count(2)

encode_line(2)

entries(2)

open(2)

doc_to_bag_of_words(1)

is_in_dict(1)

setup(1)

confirm_multiple_words(1)

contains(1)

correct(1)

search_words(1)

search_anagrams(1)

definition(1)

has_word(1)

init_dict(1)

definitions(1)

doc2bow(1)

getPossibleWords(1)

getIDF(1)

getDefs(1)

getAllTFIDFV(1)

examples(1)

dict_learn(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: build_translate.py Proyecto: Vnicius/tensorflow-sequence-to-sequence

    try:
        print("Carregando dicionários...")
        pickle_src = open(".pickle/" + sys.argv[1] + ".pkl", "rb")
        src_dict = pickle.load(pickle_src)
        pickle_src.close()

        pickle_tgt = open(".pickle/" + sys.argv[2] + ".pkl", "rb")
        tgt_dict = pickle.load(pickle_tgt)
        pickle_tgt.close()

    except:
        print("Erro...")
        print("Criando dicionário da origem")
        src_dict = Dictionary(src_file_path, lambda text: word_tokenize(text))
        src_dict.build_dictionary()
        pickle.dump(src_dict, open(".pickle/" + sys.argv[1] + ".pkl", "wb"))

        print("Criando dicionário do objetivo")
        tgt_dict = Dictionary(tgt_file_path,
                              lambda text: word_tokenize(text, 'portuguese'))
        tgt_dict.build_dictionary()
        pickle.dump(tgt_dict, open(".pickle/" + sys.argv[2] + ".pkl", "wb"))

    batch_src_it = None
    batch_tgt_it = None

    src_it = ReadFileIterator(src_file_path, end=0.8)
    tgt_it = ReadFileIterator(tgt_file_path, end=0.8)

    valid_src_it = ReadFileIterator(src_file_path, start=0.8, end=0.9)

Ejemplo n.º 2

Mostrar archivo

Archivo: simple_index.py Proyecto: LucaCadei/holySearch

 def create_dict(self):
     d = Dictionary(self._dict_set)
     d.build_dictionary()
     self._dictionary = d

Ejemplo n.º 3

Mostrar archivo

Archivo: train.py Proyecto: seanzhang-zhichen/book-classfication

    torch.cuda.manual_seed_all(1)
    torch.backends.cudnn.deterministic = True  # 保证每次结果一样

    start_time = time.time()
    logger.info("Loading data...")

    logger.info('Building dictionary ...')

    data = pd.read_csv(train_file, sep='\t')
    if args.word:
        data = data['text'].values.tolist()
    else:
        data = data['text'].apply(lambda x: " ".join("".join(x.split())))
    if args.dictionary is None:
        dictionary = Dictionary()
        dictionary.build_dictionary(data)
        del data
        joblib.dump(dictionary, root_path + '/model/vocab.bin')
    else:
        dictionary = joblib.load(args.dictionary)

    tokenizer = tokenizer


    logger.info('Making dataset & dataloader...')
    train_dataset = MyDataset(train_file,
                              dictionary,
                              args.max_length,
                              tokenizer=tokenizer,
                              word=args.word)
    train_dataloader = DataLoader(train_dataset,