Exemplos de Dictionary.add_word em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: util

Classe / Tipo: Dictionary

Método / Função: add_word

Exemplos em hotexamples.com: 2

Dictionary.add_word em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de util.Dictionary.add_word em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Dictionary(11)

add_word(2)

isDW(2)

add_sense(1)

add_value(1)

get_dict(1)

word2idx(1)

Métodos Frequentes

Dictionary (11)

add_word (2)

isDW (2)

add_sense (1)

add_value (1)

get_dict (1)

word2idx (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: tokenizer-yelp-mltprc-spell.py Projeto: CenIII/Spot-All-Style-Words-with-Adversarial-Attentions

def sub_process(numIters,pool,id): dictionary = Dictionary() dictionary.add_word('<pad>') # add padding word with open(args.output+str(id), 'w') as fout: qdar = tqdm.tqdm(range(numIters),total= numIters,ascii=True) for i in qdar: # for item in pool: item = pool[i] # words = tokenizer(' '.join(item['text'].split())) words = SymSpellCheck(item['text']) data = { 'label': int(item['stars']) - 1, 'text': list(map(lambda x: proc_token(x), words)) } fout.write(json.dumps(data) + '\n') fout.flush() # for item in data['text']: # dictionary.add_word(item) # qdar.set_postfix(dictSize=str(len(dictionary))) with open(args.dict+str(id), 'w') as fout: # save dictionary for fast next process fout.write(json.dumps(dictionary.idx2word) + '\n')

Exemplo n.º 2

0

Exibir arquivo

Arquivo: tokenizer-vp.py Projeto: aestiff/Structured-Self-Attentive-Sentence-Embedding

from util import Dictionary import spacy if __name__ == '__main__': parser = argparse.ArgumentParser('Tokenizer') parser.add_argument('--input', type=str, default='', help='input file') parser.add_argument('--output', type=str, default='', help='output file') parser.add_argument('--labels', type=str, default='', help='label file') parser.add_argument('--dict', type=str, default='', help='dictionary file') parser.add_argument('--label-data', action='store_true', help='to parse label file into json format') parser.add_argument('--shuffle', action='store_true', help='output shuffled data to file') args = parser.parse_args() tokenizer = spacy.load('en_core_web_md') dictionary = Dictionary() dictionary.add_word('<pad>') # add padding word lab2int = {} int2lab = {} with open(args.labels, 'r') as labfile: for line in labfile: labint, labtext = line.strip().split('\t') labint = int(labint) lab2int[labtext] = labint int2lab[labint] = labtext with open(args.output, 'w') as fout: lines = open(args.input).readlines() if args.shuffle: random.shuffle(lines) for i, line in enumerate(lines): if not line.startswith("#STARTDIALOGUE"): # data: input<tab>label<tab>response<tab>interp<tab>correct<tab>... item = line.strip().split('\t')