Python Vocab.Graphemes 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: vocab

클래스/타입: Vocab

메소드/함수: Graphemes

hotexamples.com에서의 예제들: 3

Python Vocab.Graphemes - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 vocab.Vocab.Graphemes에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Load(5)

Graphemes(3)

from_array(2)

get_window_vec(2)

add_from_sent(1)

from_data(1)

init_vecs(1)

예제 #1

파일 보기

파일: char2vec.py 프로젝트: frankfan007/calm

 def MakeCharVocabMat(self, word_vocab, char_vocab):
   graphemes = [['{'] + Vocab.Graphemes(x) + ['}'] for x in word_vocab.GetWords()]
   self.max_len = max([len(x) for x in graphemes])
   grapheme_ids = []
   lengths = []
   for g in graphemes:
     ids = [char_vocab[c] for c in g]
     lengths.append(len(ids))
     if len(ids) < self.max_len:
       ids += [char_vocab['}']] * (self.max_len - len(ids))
     grapheme_ids.append(ids)
     
   self.word_lens = tf.Variable(trainable=False, initial_value=lengths, name='word_lens')
   self.words_as_chars = tf.Variable(trainable=False, initial_value=grapheme_ids, 
                                     name='words_as_chars')

예제 #2

파일 보기

파일: rnnlm.py 프로젝트: frankfan007/calm

    dataset.ReadData(args.data,
                     params.context_vars + ['text'],
                     splitter=params.splitter,
                     valdata=args.valdata,
                     types=params.context_var_types)

if args.mode == 'train':
    # do the word vocab
    if args.vocab is not None:
        vocab = Vocab.Load(args.vocab)
    else:
        vocab = Vocab.MakeFromData(dataset.GetColumn('text'),
                                   min_count=params.min_vocab_count)

    if params.splitter == 'word':  # do the character vocab
        graphemes = [['{'] + Vocab.Graphemes(x) + ['}']
                     for x in vocab.GetWords()]
        char_vocab = Vocab.MakeFromData(graphemes, min_count=1)
        char_vocab.Save(os.path.join(args.expdir, 'char_vocab.pickle'))
    else:
        char_vocab = None

    context_vocabs = {}  # do the context vocabs
    for i, context_var in enumerate(params.context_vars):
        # skip numerical vocabularies
        if hasattr(params, 'context_var_types'
                   ) and params.context_var_types[i] == 'numerical':
            context_vocabs[context_var] = None
            continue

        v = Vocab.MakeFromData([[u] for u in dataset.GetColumn(context_var)],

예제 #3

파일 보기

파일: rnnlm.py 프로젝트: robspringles/calm

                    preshuffle=args.mode=='train',
                    batch_size=params.batch_size)
  print 'reading data'
  dataset.ReadData(args.data, params.context_vars + ['text'],
                   splitter=params.splitter,
                   valdata=args.valdata, types=params.context_var_types)

if args.mode == 'train':
  # do the word vocab
  if args.vocab is not None:
    vocab = Vocab.Load(args.vocab)
  else:
    vocab = Vocab.MakeFromData(dataset.GetColumn('text'), min_count=params.min_vocab_count)

  if params.splitter == 'word':  # do the character vocab
    graphemes = [['{'] + Vocab.Graphemes(x) + ['}'] for x in vocab.GetWords()]
    char_vocab = Vocab.MakeFromData(graphemes, min_count=1)
    char_vocab.Save(os.path.join(args.expdir, 'char_vocab.pickle'))
  else:
    char_vocab = None

  context_vocabs = {}  # do the context vocabs
  for i, context_var in enumerate(params.context_vars):
    # skip numerical vocabularies
    if hasattr(params, 'context_var_types') and params.context_var_types[i] == 'numerical':
      context_vocabs[context_var] = None
      continue

    v = Vocab.MakeFromData([[u] for u in dataset.GetColumn(context_var)],
                           min_count=50, no_special_syms=True)
    context_vocabs[context_var] = v