Python WordEmbeddingNN.build_vocab 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: src.word_embedding_nn

클래스/타입: WordEmbeddingNN

메소드/함수: build_vocab

hotexamples.com에서의 예제들: 2

Python WordEmbeddingNN.build_vocab - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 src.word_embedding_nn.WordEmbeddingNN.build_vocab에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

WordEmbeddingNN(1)

build_vocab(1)

load(1)

save(1)

train(1)

예제 #1

파일 보기

import pandas as pd
from neupy import utils

from src.word_embedding_nn import WordEmbeddingNN
from src.preprocessing import TokenizeText
from src.utils import create_logger, REVIEWS_FILE, WORD_EMBEDDING_NN

logger = create_logger(__name__)
utils.reproducible()

if not os.path.exists(REVIEWS_FILE):
    raise EnvironmentError("Cannot find reviews.csv file. Probably you "
                           "haven't run `loadata.py` script yet.")

data = pd.read_csv(REVIEWS_FILE, sep='\t')
train_data = data[data.type == 'train']
documents = train_data.text.values

logger.info("Tokenizing train data")
text_tokenizer = TokenizeText(ignore_stopwords=False)
word2vec = WordEmbeddingNN(size=100, workers=4, min_count=5, window=10)

text = text_tokenizer.transform(documents)

logger.info("Building vocabulary")
word2vec.build_vocab(text)
word2vec.train(text, n_epochs=10)

logger.info("Saving model into the {} file".format(WORD_EMBEDDING_NN))
word2vec.save(WORD_EMBEDDING_NN)

예제 #2

파일 보기

파일: train_word_embedding_nn.py 프로젝트: EdwardBetts/neupy

from neupy import environment

from src.word_embedding_nn import WordEmbeddingNN
from src.preprocessing import TokenizeText
from src.utils import create_logger, REVIEWS_FILE, WORD_EMBEDDING_NN


logger = create_logger(__name__)
environment.reproducible()

if not os.path.exists(REVIEWS_FILE):
    raise EnvironmentError("Cannot find reviews.csv file. Probably you "
                           "haven't run `loadata.py` script yet.")

data = pd.read_csv(REVIEWS_FILE, sep='\t')
train_data = data[data.type == 'train']
documents = train_data.text.values

logger.info("Tokenizing train data")
text_tokenizer = TokenizeText(ignore_stopwords=False)
word2vec = WordEmbeddingNN(size=100, workers=4, min_count=5, window=10)

text = text_tokenizer.transform(documents)

logger.info("Building vocabulary")
word2vec.build_vocab(text)
word2vec.train(text, n_epochs=10)

logger.info("Saving model into the {} file".format(WORD_EMBEDDING_NN))
word2vec.save(WORD_EMBEDDING_NN)