Python load_data 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: datasets.sentiment_140

메소드/함수: load_data

hotexamples.com에서의 예제들: 4

Python load_data - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 datasets.sentiment_140.load_data에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: eval_util.py 프로젝트: ZididadaSunshine/SentimentAnalysis

def test_naive_model(model: MultinomialNB, vocabulary: CountVectorizer):
    # Get data, ignore train and test
    _, _, (x_test, y_test) = sentiment_140.load_data()

    starttime = time.time()
    x_test = vocabulary.transform(x_test)

    acc = model.score(x_test, y_test)
    endtime = time.time()

    return acc, endtime - starttime

예제 #2

파일 보기

파일: eval_util.py 프로젝트: ZididadaSunshine/SentimentAnalysis

def test_keras_model(model: Sequential, tokenizer, arguments):
    """Test model on sentiment140 dataset. Both accuracy and throughput."""

    if arguments["maxlen"]:
        maxlen = arguments["maxlen"]
    else:
        maxlen = 0

    # Get data, ignore train and test
    _, _, (x_test, y_test) = sentiment_140.load_data()

    starttime = time.time()
    x_test = tokenizer.texts_to_sequences(x_test)

    x_test = sequence.pad_sequences(x_test, maxlen=maxlen)

    score, acc = model.evaluate(x_test, y_test)
    endtime = time.time()

    return score, acc, endtime - starttime

예제 #3

파일 보기

파일: sentiment_140_cnn_rnn.py 프로젝트: ZididadaSunshine/SentimentAnalysis

# Convolution
kernel_size = 5
filters = 64
pool_size = 4

# RNN
rnn_output_size = 70

# Training
batch_size = 512
epochs = 5

print('Loading data...')
(x_train, y_train), (x_val, y_val), (x_test,
                                     y_test) = sentiment_140.load_data()

print('Fitting tokenizer...')
tokenizer = Tokenizer()
tokenizer.fit_on_texts(np.concatenate((x_train, x_val, x_test)))

print('Convert text to sequences')
x_train = tokenizer.texts_to_sequences(x_train)
x_val = tokenizer.texts_to_sequences(x_val)
x_test = tokenizer.texts_to_sequences(x_test)

print(len(x_train), 'train sequences')
print(len(x_val), 'validation sequences')
print(len(x_test), 'test sequences')

print('Pad sequences (samples x time)')

예제 #4

파일 보기

# Convolution
kernel_size = 5
filters = 96
pool_size = 4

# RNN
rnn_output_size = 70

# Training
batch_size = 512
epochs = 5


print('Loading data...')
(x_train, y_train), (x_val, y_val), (x_test, y_test) = sentiment_140.load_data()

print('Fitting tokenizer...')
tokenizer = Tokenizer()
tokenizer.fit_on_texts(np.concatenate((x_train, x_val, x_test)))

print('Convert text to sequences')
x_train = tokenizer.texts_to_sequences(x_train)
x_val = tokenizer.texts_to_sequences(x_val)
x_test = tokenizer.texts_to_sequences(x_test)

print('Pad sequences (samples x time)')

x_train = sequence.pad_sequences(x_train, maxlen=maxlen)
x_val = sequence.pad_sequences(x_val, maxlen=maxlen)
x_test = sequence.pad_sequences(x_test, maxlen=maxlen)