Python FeatureExtractor.prepare_features примеры использования

Язык программирования: Python

Пространство имен/Пакет: FeatureExtractor

Класс/Тип: FeatureExtractor

Метод/Функция: prepare_features

Примеров на hotexamples.com: 1

Python FeatureExtractor.prepare_features - 1 пример найден. Это лучшие примеры Python кода для FeatureExtractor.FeatureExtractor.prepare_features, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

FeatureExtractor(24)

get_des(8)

extract_features(7)

get_kp(6)

extract(6)

extractFeatures(4)

computeFeatureVector(3)

iterate_feature(3)

initialize(3)

feature(2)

getSingleFeature(2)

extract_bow(2)

extract_all_features(2)

eval(2)

cuda(2)

setup(2)

getAllFeatures(2)

get_hard_word_cnt(1)

getBoW(1)

getFeatureVector(1)

getLocalCollocations(1)

getRT(1)

prune_features(1)

getSiftFeature(1)

processText(1)

getSurfFeature(1)

getSurroundPoS(1)

prepare_word_sets(1)

get_df(1)

get_frequent_features(1)

get_frequent_features_list(1)

giveWordScores(1)

giveTrigramScores(1)

prepare_simplewiki_corpus(1)

get_labels(1)

prepare_lucene_indexes(1)

get_word2vec(1)

prepare_features(1)

prepare_ck12text_corpus(1)

get_word_dist(1)

get3D(1)

prepare_ck12html_corpus(1)

load(1)

getfeatures(1)

giveBigramScores(1)

init(1)

get_keypoints(1)

AddDevice(1)

generate_X_y(1)

add_features(1)

Пример #1

Показать файл

Файл: main.py Проект: XihuanZeng/kaggle

    # extract relevant text from all Chapters of each book
    fext.prepare_ck12text_corpus(corpus_dir = corpus_dir)

    # prepare simplewiki corpus: this function will go into simplewiki dir, find the simplewiki-20151102-pages-articles.xml
    # extract text from all categories found if the page contains at least some uncommon words from train_b and test_b
    fext.prepare_simplewiki_corpus(corpus_dir, train_b, valid_b)

    # prepare Lucene indexing: this will create Lucene indexing in lucene_idx[1-3] for the corpus created by previous functions
    fext.prepare_lucene_indexes(corpus_dir = corpus_dir)

    # generate features for the train, valid and test/
    # there are 2 types of features:
    # 1. Basic feature that only looks at the dataset
    # 2. Lucene features that returns the score produced by Lucene index
    # prepare basic features
    fext.prepare_features(dataf_q=train_q, dataf_b=train_b, train_df=train_b, cache_dir='funcs_train')
    fext.prepare_features(dataf_q=valid_q, dataf_b=valid_b, train_df=train_b, cache_dir='funcs_valid')
    fext.prepare_features(dataf_q=test_q, dataf_b=test_b, train_df=train_b, cache_dir='funcs_test')

# train the data with Logistic Regression
model = LogisticRegression()
train_cache_dir = os.path.join(base_dir, 'funcs_train')
for file in os.listdir(train_cache_dir):
    if file.endswith('pkl'):
        train_b[file[:-4]] = load_from_pkl(os.path.join(base_dir, 'funcs_train', file))
model.fit(train_b[[x for x in train_b.columns if x not in ['ID', 'answer', 'question', 'correct', 'q_num_words', 'ans_name']]], train_b['correct'])

# predict answer for the test question
test_cache_dir = os.path.join(base_dir, 'funcs_test')
for file in os.listdir(test_cache_dir):
    if file.endswith('pkl'):