Python pad_data 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: neon.data.text_preprocessing

메소드/함수: pad_data

hotexamples.com에서의 예제들: 6

Python pad_data - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 neon.data.text_preprocessing.pad_data에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: text.py 프로젝트: Jokeren/neon

    def gen_iterators(self):
        if self.filepath is None:
            self.load_data()

        data = pad_data(self.filepath, vocab_size=self.vocab_size,
                        sentence_length=self.sentence_length)
        (X_train, y_train), (X_test, y_test), nclass = data

        self._data_dict = {'nclass': nclass}
        self._data_dict['train'] = ArrayIterator(X_train, y_train, nclass=2)
        self._data_dict['test'] = ArrayIterator(X_test, y_test, nclass=2)
        return self._data_dict

예제 #2

파일 보기

파일: text.py 프로젝트: AdityoSanjaya/neon

 def pad_data(path, vocab_size=20000, sentence_length=100, oov=2,
              start=1, index_from=3, seed=113, test_split=0.2):
     logger.error('pad_data in the Text class is deprecated.  This function'
                  'is now in neon.data.text_preprocessing')
     return pad_data(path,
                     vocab_size=vocab_size,
                     sentence_length=sentence_length,
                     oov=oov,
                     start=start,
                     index_from=index_from,
                     seed=seed,
                     test_split=test_split)

예제 #3

파일 보기

파일: text.py 프로젝트: xiaoyeye1117/multimodalSR

    def gen_iterators(self):
        if self.filepath is None:
            self.load_data()

        data = pad_data(self.filepath,
                        vocab_size=self.vocab_size,
                        sentence_length=self.sentence_length)
        (X_train, y_train), (X_test, y_test), nclass = data

        self._data_dict = {'nclass': nclass}
        self._data_dict['train'] = ArrayIterator(X_train, y_train, nclass=2)
        self._data_dict['test'] = ArrayIterator(X_test, y_test, nclass=2)
        return self._data_dict

예제 #4

파일 보기

 def pad_data(path,
              vocab_size=20000,
              sentence_length=100,
              oov=2,
              start=1,
              index_from=3,
              seed=113,
              test_split=0.2):
     logger.error('pad_data in the Text class is deprecated.  This function'
                  'is now in neon.data.text_preprocessing')
     return pad_data(path,
                     vocab_size=vocab_size,
                     sentence_length=sentence_length,
                     oov=oov,
                     start=start,
                     index_from=index_from,
                     seed=seed,
                     test_split=test_split)

예제 #5

파일 보기

args.batch_size = 128
gradient_clip_value = 15
vocab_size = 20000
sentence_length = 128
embedding_dim = 128
hidden_size = 128
reset_cells = True

# setup backend
be = gen_backend(**extract_valid_args(args, gen_backend))

# make dataset
path = load_imdb(path=args.data_dir)
(X_train,
 y_train), (X_test, y_test), nclass = pad_data(path,
                                               vocab_size=vocab_size,
                                               sentence_length=sentence_length)

print "Vocab size - ", vocab_size
print "Sentence Length - ", sentence_length
print "# of train sentences", X_train.shape[0]
print "# of test sentence", X_test.shape[0]

train_set = ArrayIterator(X_train, y_train, nclass=2)
valid_set = ArrayIterator(X_test, y_test, nclass=2)

# weight initialization
uni = Uniform(low=-0.1 / embedding_dim, high=0.1 / embedding_dim)
g_uni = GlorotUniform()

if args.rlayer_type == 'lstm':

예제 #6

파일 보기

파일: imdb_lstm.py 프로젝트: JediKoder/neon

# hyperparameters from the reference
args.batch_size = 128
gradient_clip_value = 15
vocab_size = 20000
sentence_length = 128
embedding_dim = 128
hidden_size = 128
reset_cells = True

# setup backend
be = gen_backend(**extract_valid_args(args, gen_backend))

# make dataset
path = load_imdb(path=args.data_dir)
(X_train, y_train), (X_test, y_test), nclass = pad_data(path,
                                                        vocab_size=vocab_size,
                                                        sentence_length=sentence_length)

neon_logger.display("Vocab size - {}".format(vocab_size))
neon_logger.display("Sentence Length - {}".format(sentence_length))
neon_logger.display("# of train sentences {}".format(X_train.shape[0]))
neon_logger.display("# of test sentence {}".format(X_test.shape[0]))

train_set = ArrayIterator(X_train, y_train, nclass=2)
valid_set = ArrayIterator(X_test, y_test, nclass=2)

# weight initialization
uni = Uniform(low=-0.1 / embedding_dim, high=0.1 / embedding_dim)
g_uni = GlorotUniform()

if args.rlayer_type == 'lstm':