Python FeatureTransformer.load_encoded_data 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: preprocessing

클래스/타입: FeatureTransformer

메소드/함수: load_encoded_data

hotexamples.com에서의 예제들: 2

Python FeatureTransformer.load_encoded_data - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 preprocessing.FeatureTransformer.load_encoded_data에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

FeatureTransformer(2)

fit_transform(2)

load_encoded_data(2)

fit(1)

get_tfidf_vocab(1)

save_encoded_data(1)

예제 #1

파일 보기

def precision_micro_score(y_true, y_pred, labels):
    return precision_score(y_true, y_pred, labels, average="micro")


def recall_macro_score(y_true, y_pred, labels):
    return recall_score(y_true, y_pred, labels, average="macro")


def recall_micro_score(y_true, y_pred, labels):
    return recall_score(y_true, y_pred, labels, average="micro")


if __name__ == "__main__":
    # Load trining data
    training_encoded_data_path = "./Dataset/encoded_training_data_4362.json"
    X_train, y_train = FeatureTransformer.load_encoded_data(training_encoded_data_path)

    # Load test data
    test_data_path = "./Dataset/valid_data_1091.json"
    test_data = utils.load_data(test_data_path)
    df = pd.DataFrame(test_data)
    X_test = df.content.values
    y_test = df.label.values

    # Transform test data
    ft = FeatureTransformer()
    X_test = ft.fit_transform(X_test, y_train, vocab_path=VOCAB_PATH)

    # Define models
    mnb = MultinomialNB(alpha=0.004)

예제 #2

파일 보기

import os, time
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import utils
from preprocessing import FeatureTransformer

if __name__ == "__main__":
    # Load data to explore
    training_file_path = "./Dataset/New_Data_v2/encoded_training_data_6751.json"
    # test_file_path = "./Dataset/data_sent.json"

    # training_data = utils.load_data(training_file_path)
    training_data, labels = FeatureTransformer.load_encoded_data(
        training_file_path)
    # training_size = len(training_data)
    # test_data = utils.load_data(test_file_path)
    # test_size = len(test_data)

    # print("Training data size : ", training_size)
    # print("Test data size : ", test_size)

    print("========================================")

    # training_df = utils.convert_original_data_to_df(training_data)

    # print(training_df.info())

    print("\nStatistic")
    # stats_by_label = training_df.label.value_counts().sort_index().reset_index()
    stats_by_label = pd.DataFrame(