예제 #1
0
파일: bov.py 프로젝트: rabeehk/arct2
def vectorize(sent):
    tokens = text.tokenize(sent)
    vocab = data.vocab()
    ixs = [vocab[t] for t in tokens]
    embeddings = data.glove()
    _vectors = [embeddings[ix].reshape(1, -1) for ix in ixs]
    return np.concatenate(_vectors, axis=0).sum(axis=0)
예제 #2
0
파일: bov.py 프로젝트: rabeehk/arct2
 def __init__(self):
     self.vocab = data.vocab()
예제 #3
0
파일: bov.py 프로젝트: rabeehk/arct2
 def __init__(self, args=None):
     self.vocab = data.vocab()
     self.n_training_points = None
예제 #4
0
파일: bilstm.py 프로젝트: scape1989/arct2
 def __init__(self):
     self.vocab = data.vocab()
     self.collate_for_rnn = CollateSentsForRNN()
예제 #5
0
파일: bilstm.py 프로젝트: scape1989/arct2
 def __init__(self):
     self.vocab = data.vocab()
     self.tokenizer = text.tokenize
     self.pad_ix = 0
예제 #6
0
파일: build_glove.py 프로젝트: yyht/arct2
"""Build GloVe vectors for ARCT data."""
import os
import numpy as np
from arct import data
import glovar
from util import text

if __name__ == '__main__':
    print('Creating GloVe embeddings...')
    vocab = data.vocab()
    embeddings = text.create_glove_embeddings(vocab)
    save_path = os.path.join(glovar.ARCT_DIR, 'glove.npy')
    np.save(save_path, embeddings)