Python rolling_join Exemples

Langage de programmation: Python

Espace de nommage/Pack: avito2_io

Méthode/Fonction: rolling_join

Exemples au hotexamples.com: 4

Python rolling_join - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de avito2_io.rolling_join extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Associées

debug

iter_editors_with_view_of_document

get_deb_version

ApiClient

rekey_dict

is_tenant

computeSpans

ukkonen

InstalledApp

PCCMARCtoRDAConversion

Related in langs

ClassSchema (PHP)

vbseo_tbl_prefix (PHP)

RemoveChannelsFromGroupRequestBuilder (C#)

CoArrowEffect (C#)

initializeInterrupts (C++)

codefile_close (C++)

NumberSymbols (Go)

BuildProcessTree (Go)

SERVICE_EXPOSE_MAP.INSTANCE_ID (Java)

ModelMasterDetailsBlock (Java)

Exemple #1

0

Afficher le fichier

Fichier : val_run0.py Projet : Keesiu/meta-kaggle

from eval import logloss maxlines_val = None start = datetime.now() val_ids = avito2_io.get_artifact('full_val_set.pkl') print 'validation set ids read' train_etl = { 'ad': lambda l: l['AdID'], 'pos': lambda l: l['Position'], 'ctr': lambda l: l['HistCTR'] } search_etl = {'cat': lambda l: l['CategoryID']} # validation run input = avito2_io.rolling_join(True, train_etl, search_etl, do_validation=True, val_ids=val_ids) loss = 0.0 for (k, (x, y)) in enumerate(input): #loss += logloss(float(x['ctr']), y) loss += logloss(0.006, y) if k == maxlines_val: break if (k + 1) % 250000 == 0: print 'processed %d lines on validation pass' % (k + 1) print 'validation set log loss: %.5f' % (loss / (k + 1)) print 'elapsed time: %s' % (datetime.now() - start)

Exemple #2

0

Afficher le fichier

Fichier : run1.py Projet : Keesiu/meta-kaggle

start = datetime.now() train_etl = { 'ad': (lambda l: l['AdID']), 'pos': (lambda l: l['Position']), 'log_ctr': (lambda l: -10 * round(log(float(l['HistCTR'])), 1)) } search_etl = { 'user': (lambda l: l['UserID']), 'category': (lambda l: l['CategoryID']), 'location': (lambda l: l['LocationID']), 'logon': (lambda l: l['IsUserLoggedOn']), 'SPexists': (lambda l: int(len(l['SearchParams']) > 0)), 'SQexists': (lambda l: int(len(l['SearchQuery']) > 0)) } # use_train = True input = rolling_join(True, train_etl, search_etl) model = ftrl_proximal(alpha, beta, L1, L2, D, interaction) for (k, (x, y)) in enumerate(input): f = hash_features(x, D) p = model.predict(f) model.update(f, p, y) if k == maxlines: break if (k + 1) % 1000000 == 0: print 'processed %d lines' % (k + 1) print 'finished training' # testing: use_train=False train_etl['id'] = (lambda l: l['ID']) input = rolling_join(False, train_etl, search_etl) outfile = open(submission, 'w')

Exemple #3

0

Afficher le fichier

Fichier : val_run0.py Projet : davidthaler/Kaggle_Avito-2015

from datetime import datetime from eval import logloss maxlines_val = None start = datetime.now() val_ids = avito2_io.get_artifact('full_val_set.pkl') print 'validation set ids read' train_etl = {'ad' : lambda l : l['AdID'], 'pos' : lambda l : l['Position'], 'ctr' : lambda l : l['HistCTR']} search_etl = {'cat' : lambda l : l['CategoryID']} # validation run input = avito2_io.rolling_join(True, train_etl, search_etl, do_validation=True, val_ids=val_ids) loss = 0.0 for (k, (x, y)) in enumerate(input): #loss += logloss(float(x['ctr']), y) loss += logloss(0.006, y) if k == maxlines_val: break if (k + 1) % 250000 == 0: print 'processed %d lines on validation pass' % (k + 1) print 'validation set log loss: %.5f' % (loss/(k + 1)) print 'elapsed time: %s' % (datetime.now() - start)

Exemple #4

0

Afficher le fichier

Fichier : run1.py Projet : davidthaler/Kaggle_Avito-2015

interaction = False maxlines = None start = datetime.now() train_etl = {'ad' : (lambda l : l['AdID']), 'pos' : (lambda l : l['Position']), 'log_ctr': (lambda l : -10 * round(log(float(l['HistCTR'])), 1))} search_etl = {'user' : (lambda l : l['UserID']), 'category': (lambda l : l['CategoryID']), 'location': (lambda l : l['LocationID']), 'logon' : (lambda l : l['IsUserLoggedOn']), 'SPexists': (lambda l : int(len(l['SearchParams']) > 0)), 'SQexists': (lambda l : int(len(l['SearchQuery']) > 0))} # use_train = True input = rolling_join(True, train_etl, search_etl) model = ftrl_proximal(alpha, beta, L1, L2, D, interaction) for (k, (x, y)) in enumerate(input): f = hash_features(x, D) p = model.predict(f) model.update(f, p, y) if k == maxlines: break if (k + 1) % 1000000 == 0: print 'processed %d lines' % (k + 1) print 'finished training' # testing: use_train=False train_etl['id'] = (lambda l : l['ID']) input = rolling_join(False, train_etl, search_etl) outfile = open(submission, 'w')