Python load_benchmarkの例

プログラミング言語: Python

名前空間/パッケージ名: deepmoji.finetuning

メソッド/関数: load_benchmark

hotexamples.comのコード掲載数: 8

Python load_benchmark - 8件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのdeepmoji.finetuning.load_benchmarkの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

def test_finetune_full():
    """ finetuning using 'full'.
    """
    DATASET_PATH = '../data/SS-Youtube/raw.pickle'
    nb_classes = 2
    min_acc = 0.65

    with open('../model/vocabulary.json', 'r') as f:
        vocab = json.load(f)

    data = load_benchmark(DATASET_PATH, vocab, extend_with=10000)
    model = deepmoji_transfer(nb_classes,
                              data['maxlen'],
                              PRETRAINED_PATH,
                              extend_embedding=data['added'])
    model.summary()
    model, acc = finetune(model,
                          data['texts'],
                          data['labels'],
                          nb_classes,
                          data['batch_size'],
                          method='full',
                          nb_epochs=1)

    print("Finetune full SS-Youtube 1 epoch acc: {}".format(acc))
    assert acc >= min_acc

コード例 #2

ファイルを表示

ファイル: test_finetuning.py プロジェクト: Dobatymo/DeepMoji

def test_finetune_last():
    """ finetuning using 'last'.
    """
    DATASET_PATH = '../data/SS-Youtube/raw.pickle'
    nb_classes = 2
    min_acc = 0.65

    with open('../model/vocabulary.json', 'r') as f:
        vocab = json.load(f)

    data = load_benchmark(DATASET_PATH, vocab)

    model = deepmoji_transfer(nb_classes, data['maxlen'], PRETRAINED_PATH)
    model.summary()
    model, acc = finetune(model, data['texts'], data['labels'], nb_classes,
                          data['batch_size'], method='last', nb_epochs=1)

    print("Finetune last SS-Youtube 1 epoch acc: {}".format(acc))
    assert acc >= min_acc

コード例 #3

ファイルを表示

ファイル: finetune_youtube_last.py プロジェクト: jslow421/DeepMoji-Python3

1) Freeze all layers except for the softmax layer.
2) Train.
"""

from __future__ import print_function
import example_helper
import json
from deepmoji.model_def import deepmoji_transfer
from deepmoji.global_variables import PRETRAINED_PATH
from deepmoji.finetuning import (load_benchmark, finetune)

DATASET_PATH = '../data/SS-Youtube/raw.pickle'
nb_classes = 2

with open('../model/vocabulary.json', 'r') as f:
    vocab = json.load(f)

# Load dataset.
data = load_benchmark(DATASET_PATH, vocab)

# Set up model and finetune
model = deepmoji_transfer(nb_classes, data['maxlen'], PRETRAINED_PATH)
model.summary()
model, acc = finetune(model,
                      data['texts'],
                      data['labels'],
                      nb_classes,
                      data['batch_size'],
                      method='last')
print('Acc: {}'.format(acc))

コード例 #4

ファイルを表示

"""

from __future__ import print_function
import example_helper
import json
from deepmoji.model_def import deepmoji_transfer
from deepmoji.global_variables import PRETRAINED_PATH
from deepmoji.finetuning import (
    load_benchmark,
    finetune)


DATASET_PATH = '../data/kaggle-insults/raw.pickle'
nb_classes = 2

with open('../model/vocabulary.json', 'r') as f:
    vocab = json.load(f)

# Load dataset. Extend the existing vocabulary with up to 10000 tokens from
# the training dataset.
data = load_benchmark(DATASET_PATH, vocab, extend_with=10000)

# Set up model and finetune. Note that we have to extend the embedding layer
# with the number of tokens added to the vocabulary.
model = deepmoji_transfer(nb_classes, data['maxlen'], PRETRAINED_PATH,
                          extend_embedding=data['added'])
model.summary()
model, acc = finetune(model, data['texts'], data['labels'], nb_classes,
                      data['batch_size'], method='chain-thaw', verbose=2)
print('Acc: {}'.format(acc))

コード例 #5

ファイルを表示

ファイル: finetune_semeval_class-avg_f1.py プロジェクト: Dobatymo/DeepMoji

import json
from deepmoji.finetuning import load_benchmark
from deepmoji.class_avg_finetuning import class_avg_finetune
from deepmoji.model_def import deepmoji_transfer
from deepmoji.global_variables import PRETRAINED_PATH

DATASET_PATH = '../data/SE0714/raw.pickle'
nb_classes = 3

with open('../model/vocabulary.json', 'r') as f:
    vocab = json.load(f)


# Load dataset. Extend the existing vocabulary with up to 10000 tokens from
# the training dataset.
data = load_benchmark(DATASET_PATH, vocab, extend_with=10000)

# Set up model and finetune. Note that we have to extend the embedding layer
# with the number of tokens added to the vocabulary.
#
# Also note that when using class average F1 to evaluate, the model has to be
# defined with two classes, since the model will be trained for each class
# separately.
model = deepmoji_transfer(2, data['maxlen'], PRETRAINED_PATH,
                          extend_embedding=data['added'])
model.summary()

# For finetuning however, pass in the actual number of classes.
model, f1 = class_avg_finetune(model, data['texts'], data['labels'],
                               nb_classes, data['batch_size'], method='last')
print('F1: {}'.format(f1))

コード例 #6

ファイルを表示

ファイル: finetune_dataset.py プロジェクト: artintelclass/final-yz2812

        assert len(vocab) == nb_tokens

        dset = p[0]
        path = p[1]
        nb_classes = p[2]
        use_f1_score = p[3]

        if FINETUNE_METHOD == 'last':
            extend_with = 0
        elif FINETUNE_METHOD in ['new', 'full', 'chain-thaw']:
            extend_with = 10000
        else:
            raise ValueError('Finetuning method not recognised!')

        # Load dataset.
        data = load_benchmark(path, vocab, extend_with=extend_with)

        (X_train, y_train) = (data['texts'][0], data['labels'][0])
        (X_val, y_val) = (data['texts'][1], data['labels'][1])
        (X_test, y_test) = (data['texts'][2], data['labels'][2])

        weight_path = PRETRAINED_PATH if FINETUNE_METHOD != 'new' else None
        nb_model_classes = 2 if use_f1_score else nb_classes
        model = deepmoji_transfer(
            nb_model_classes,
            data['maxlen'], weight_path,
            extend_embedding=data['added'])
        model.summary()

        # Training
        print('Training: {}'.format(path))

コード例 #7

ファイルを表示

ファイル: finetune_youtube_last.py プロジェクト: Dobatymo/DeepMoji

0) Load all weights except for the softmax layer. Do not add tokens to the
   vocabulary and do not extend the embedding layer.
1) Freeze all layers except for the softmax layer.
2) Train.
"""

from __future__ import print_function
import example_helper
import json
from deepmoji.model_def import deepmoji_transfer
from deepmoji.global_variables import PRETRAINED_PATH
from deepmoji.finetuning import (
    load_benchmark,
    finetune)

DATASET_PATH = '../data/SS-Youtube/raw.pickle'
nb_classes = 2

with open('../model/vocabulary.json', 'r') as f:
    vocab = json.load(f)

# Load dataset.
data = load_benchmark(DATASET_PATH, vocab)

# Set up model and finetune
model = deepmoji_transfer(nb_classes, data['maxlen'], PRETRAINED_PATH)
model.summary()
model, acc = finetune(model, data['texts'], data['labels'], nb_classes,
                      data['batch_size'], method='last')
print('Acc: {}'.format(acc))

コード例 #8

ファイルを表示

ファイル: fit_stocktwits.py プロジェクト: dballinari/DeepMoji-StockTwits-Classifier

from deepmoji.finetuning import (
    load_benchmark,
    finetune)

dataset_path = '{}/DataDeepMojiStockTwits_finetuning.pickle'.format(RAW_DATA_PATH)
model_path = '{}/DeepMojiStockTwits_model.json'.format(MODEL_DATA_PATH)
specs_path = '{}/DeepMojiStockTwits_specs.json'.format(MODEL_DATA_PATH)
vocab_path = '{}/DeepMojiStockTwits_vocab.json'.format(MODEL_DATA_PATH)
weights_path = '{}/DeepMojiStockTwits_weights.h5'.format(MODEL_DATA_PATH)
nb_classes = 2

with open('../model/vocabulary.json', 'r') as f:
    vocab = json.load(f)

# Load dataset.
data = load_benchmark(dataset_path, vocab, extend_with=10000, save_vocab=True, path_new_vocab=vocab_path)

# Set up model and finetune
model = deepmoji_transfer(nb_classes, data['maxlen'], PRETRAINED_PATH, extend_embedding=data['added'])
model.summary()
model, acc = finetune(model, data['texts'], data['labels'], nb_classes,
                      data['batch_size'], method='chain-thaw', verbose=3, metric='acc')
print('Acc: {}'.format(acc))
# Save model weights:
model.save_weights(weights_path)
# Save model specifications:
model_specs = {'maxlen': data['maxlen'], 'batch_size': data['batch_size']}
with open(specs_path, 'w') as f:
    json.dump(model_specs, f)