Python Queries.load示例

编程语言: Python

命名空间/包名称: rankpy.queries

类/类型: Queries

方法/功能: load

hotexamples.com的示例: 5

Python Queries.load - 已找到5个示例。这些是从开源项目中提取的最受好评的rankpy.queries.Queries.load现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

load_from_text(7)

load(3)

Queries(2)

示例#1

显示文件

文件： gridsearch_lambdarandomforest_example.py 项目： deronnek/rankpy

                    level=logging.INFO)

# Load the query datasets.
training_queries = Queries.load_from_text('data/MQ2007/Fold1/train.txt')
validation_queries = Queries.load_from_text('data/MQ2007/Fold1/vali.txt')
test_queries = Queries.load_from_text('data/MQ2007/Fold1/test.txt')

logging.info('=' * 80)

# Save them to binary format ...
training_queries.save('data/MQ2007/Fold1/training')
validation_queries.save('data/MQ2007/Fold1/validation')
test_queries.save('data/MQ2007/Fold1/test')

# ... because loading them will be then faster.
training_queries = Queries.load('data/MQ2007/Fold1/training')
validation_queries = Queries.load('data/MQ2007/Fold1/validation')
test_queries = Queries.load('data/MQ2007/Fold1/test')

logging.info('=' * 80)

# Set this to True in order to remove queries containing all documents
# of the same relevance score -- these are useless for LambdaMART.
remove_useless_queries = False

# Find constant query-document features.
cfs = find_constant_features(
    [training_queries, validation_queries, test_queries])

# Get rid of constant features and (possibly) remove useless queries.
training_queries.adjust(remove_features=cfs, purge=remove_useless_queries)

示例#2

显示文件

from rankpy.queries import Queries
from rankpy.queries import find_constant_features
from rankpy.models import LambdaMART
from sklearn.grid_search import ParameterGrid

from ndcg import NDCG
from maprec import MAP

# Turn on logging.
logging.basicConfig(format='%(asctime)s : %(message)s', level=logging.INFO)
dcg_folds_scores = []
map_folds_scores = []
# load the data for each fold
for i in xrange(1, 6):
    # load training, validation and testing sets for current
    training_queries = Queries.load('MSLR-WEB10K/Fold' + str(i) + '/training')
    validation_queries = Queries.load('MSLR-WEB10K/Fold' + str(i) +
                                      '/validation')
    test_queries = Queries.load('MSLR-WEB10K/Fold' + str(i) + '/test')

    logging.info(
        '================================================================================'
    )
    # Print basic info about query datasets.
    logging.info('Train queries: %s' % training_queries)
    logging.info('Valid queries: %s' % validation_queries)
    logging.info('Test queries: %s' % test_queries)

    logging.info(
        '================================================================================'
    )

示例#3

显示文件

文件： gridsearch_example.py 项目： dmitru/rankpy

                    '%(message)s', level=logging.INFO)

# Load the query datasets.
training_queries = Queries.load_from_text('data/MQ2007/Fold1/train.txt')
validation_queries = Queries.load_from_text('data/MQ2007/Fold1/vali.txt')
test_queries = Queries.load_from_text('data/MQ2007/Fold1/test.txt')

logging.info('=' * 80)

# Save them to binary format ...
training_queries.save('data/MQ2007/Fold1/training')
validation_queries.save('data/MQ2007/Fold1/validation')
test_queries.save('data/MQ2007/Fold1/test')

# ... because loading them will be then faster.
training_queries = Queries.load('data/MQ2007/Fold1/training')
validation_queries = Queries.load('data/MQ2007/Fold1/validation')
test_queries = Queries.load('data/MQ2007/Fold1/test')

logging.info('=' * 80)

# Set this to True in order to remove queries containing all documents
# of the same relevance score -- these are useless for LambdaMART.
remove_useless_queries = False

# Find constant query-document features.
cfs = find_constant_features([training_queries,
                              validation_queries,
                              test_queries])

# Get rid of constant features and (possibly) remove useless queries.

示例#4

显示文件

文件： rank-py.py 项目： matulma4/esc

logging.basicConfig(format='%(asctime)s : %(message)s', level=logging.INFO)

# Load the query datasets.
train_queries = Queries.load_from_text('data/train.txt')
valid_queries = Queries.load_from_text('data/vali.txt')
test_queries = Queries.load_from_text('data/test.txt')

logging.info('================================================================================')

# Save them to binary format ...
train_queries.save('data/fold2_train')
valid_queries.save('data/fold2_vali')
test_queries.save('data/fold2_test')

# ... because loading them will be then faster.
train_queries = Queries.load('data/fold2_train')
valid_queries = Queries.load('data/fold2_vali')
test_queries = Queries.load('data/fold2_test')

logging.info('================================================================================')

# Print basic info about query datasets.
logging.info('Train queries: %s' % train_queries)
logging.info('Valid queries: %s' % valid_queries)
logging.info('Test queries: %s' %test_queries)

logging.info('================================================================================')
metrics = {}
# Prepare metric for this set of queries.
metrics[0] = NormalizedDiscountedCumulativeGain(10, queries=[train_queries, valid_queries, test_queries])
# metrics[1] = SeznamRank(10, queries=[train_queries, valid_queries, test_queries])

示例#5

显示文件

# Load the query datasets.
train_queries = Queries.load_from_text('data/train.txt')
valid_queries = Queries.load_from_text('data/vali.txt')
test_queries = Queries.load_from_text('data/test.txt')

logging.info(
    '================================================================================'
)

# Save them to binary format ...
train_queries.save('data/fold2_train')
valid_queries.save('data/fold2_vali')
test_queries.save('data/fold2_test')

# ... because loading them will be then faster.
train_queries = Queries.load('data/fold2_train')
valid_queries = Queries.load('data/fold2_vali')
test_queries = Queries.load('data/fold2_test')

logging.info(
    '================================================================================'
)

# Print basic info about query datasets.
logging.info('Train queries: %s' % train_queries)
logging.info('Valid queries: %s' % valid_queries)
logging.info('Test queries: %s' % test_queries)

logging.info(
    '================================================================================'
)