Python Dataset.outputIndex Exemples

Langage de programmation: Python

Espace de nommage/Pack: preprocessing.dataset

Class/Type: Dataset

Méthode/Fonction: outputIndex

Exemples au hotexamples.com: 3

Python Dataset.outputIndex - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de preprocessing.dataset.Dataset.outputIndex extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Dataset(21)

branches(8)

filesAdded(8)

setOutputBranches(8)

addFiles(5)

selection(4)

process(4)

sampleSelection(3)

outputIndex(3)

load_questions(3)

addFlatSFtoDataframe(2)

ignoreBranches(2)

_resolveWildcardBranch(2)

rescale_labels(1)

outputBranchesSet(1)

outputBranches(1)

get_validation(1)

index_to_text(1)

cleanBranchList(1)

get_training(1)

get_counters(1)

getSelectedDataframe(1)

getBranchesFromFile(1)

generate_dataset(1)

files(1)

encode_single_question(1)

get_test(1)

Méthodes fréquemment utilisées

Dataset (21)

branches (8)

filesAdded (8)

setOutputBranches (8)

addFiles (5)

selection (4)

process (4)

sampleSelection (3)

outputIndex (3)

load_questions (3)

Méthodes fréquemment utilisées

addFlatSFtoDataframe (2)

ignoreBranches (2)

_resolveWildcardBranch (2)

rescale_labels (1)

outputBranchesSet (1)

outputBranches (1)

get_validation (1)

index_to_text (1)

cleanBranchList (1)

get_training (1)

get_counters (1)

getSelectedDataframe (1)

getBranchesFromFile (1)

generate_dataset (1)

files (1)

encode_single_question (1)

get_test (1)

Méthodes fréquemment utilisées

get_counters (1)

getSelectedDataframe (1)

getBranchesFromFile (1)

generate_dataset (1)

files (1)

encode_single_question (1)

get_test (1)

Exemple #1

0

Afficher le fichier

def convertTree(inputs, outFolder, name, treeName, indexVars): logging.info("Starting conversion") checkNcreateFolder(outFolder) dataset = Dataset(name, outFolder, treeName) files = [] for _input in inputs: with open(_input, "r") as f: data = f.read() for line in data.split("\n"): if ".root" in line: files.append(line) logging.info("Setting files") dataset.addFiles(files) logging.info("Setting output branches") dataset.setOutputBranches("*") logging.debug("Setting indexing branches: %s", indexVars) dataset.outputIndex = indexVars logging.info("Starting processing dataset") dataset.process(999999999999999999999) logging.info("Finished processing")

Exemple #2

0

Afficher le fichier

def convertTree(config, treeName, category): """ Wrapper for the functionality of preprocessing.dataset """ logging.info("Starting conversion") checkNcreateFolder(config.outputFolder) datasetName = config.outputPrefix + "_" + config.sampleName + "_" + config.categories[ category].name dataset = Dataset(datasetName, config.outputFolder, treeName) logging.info("Setting sample selection: %s", config.sampleSelection) dataset.sampleSelection = config.sampleSelection logging.info("Setting category selection: %s", config.categories[category].selection) dataset.selection = config.categories[category].selection if config.excludeBranches is not None: dataset.ignoreBranches = config.excludeBranches logging.info("Setting files") dataset.addFiles(config.files) logging.info("Setting output branches") dataset.setOutputBranches(config.outputVariables) logging.debug("Setting indexing branches: %s", config.indexVariables) dataset.outputIndex = config.indexVariables if config.addRatio: dataset.setSF(config.sampleSF, "sampleRatio") logging.info("Starting processing dataset") dataset.process(config.maxEvents) logging.info("Finished processing")

Exemple #3

0

Afficher le fichier

def convertTreeMulti(config, treeName, category): logging.info("Starting conversion using multi method") checkNcreateFolder(config.outputFolder) #For multi mode, we generate a dataset per sample. In the loop the output is disabled and in the end the #dataframs of the 1:: samples will be added to the first and saved eventsLeft = config.maxEvents dfs = [] baseDataset = None for iSample, sample in enumerate(config.samples): logging.info("Processing sample %s", sample) if iSample == 0: datasetName = config.outputPrefix + "_" + config.sampleName + "_" + config.categories[ category].name else: datasetName = config.outputPrefix + "_" + config.sampleInfo[ sample].name + "_" + config.categories[category].name dataset = Dataset(datasetName, config.outputFolder, treeName) logging.info("Setting sample selection: %s", config.sampleInfo[sample].selection) dataset.sampleSelection = config.sampleInfo[sample].selection logging.info("Setting category selection: %s", config.categories[category].selection) dataset.selection = config.categories[category].selection if config.excludeBranches is not None: dataset.ignoreBranches = config.excludeBranches logging.info("Setting files") dataset.addFiles(config.sampleInfo[sample].files) logging.info("Setting output branches") dataset.setOutputBranches(config.outputVariables) logging.debug("Setting indexing branches: %s", config.indexVariables) dataset.outputIndex = config.indexVariables if config.addRatio: dataset.setSF(config.sampleInfo[sample].addSF, "sampleRatio") logging.info("Starting processing dataset") thisSampleDF = dataset.process(eventsLeft, skipOutput=True) eventsLeft -= len(thisSampleDF) dfs.append(thisSampleDF) if iSample == 0: baseDataset = copy(dataset) baseDataset.makeOutput(pd.concat(dfs)) logging.info("Finished processing")