Exemplos de CompositeQueryEvaluator em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: src.evaluation.CompositeQueryEvaluator

Exemplos em hotexamples.com: 2

CompositeQueryEvaluator em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de src.evaluation.CompositeQueryEvaluator.CompositeQueryEvaluator em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

evaluate(1)

Métodos Frequentes

evaluate (1)

Relacionados

loads

heading

xme2mga

cancelHostMaintenanceCmd

parse

generic_resid_fun

spiralPointDistribution

render_poll_form

create_app

read

Related in langs

AlbumPeer (PHP)

M_get_registrationcompleted_permalink (PHP)

CrystalReportExchangeCheckout (C#)

DeviceChangedEventArgs (C#)

gtk_tree_view_get_model (C++)

BLIP_READER_NEXT_IDX_ (C++)

NewWriter (Go)

Level (Go)

CachedRowSet (Java)

JavaBuilder (Java)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: RetrievalExperiment.py Projeto: jtedesco/EntityQuerier

def __init__(self, entityId, searchInterface, queryBuilder, numberOfResults=50): """ Put the search interface and entity ids on this object, and load entity data """ # The list of ids (corresponding JSON files are expected to be found in 'standard' and 'entities' folders) self.entityId = entityId # The search framework to use self.searchInterface = searchInterface self.numberOfResults = numberOfResults # The query evaluation metric to use self.queryEvaluator = CompositeQueryEvaluator() # The query builder to use self.queryBuilder = queryBuilder # Build the entities and queries for these entities self.buildEntities() self.buildQueries() # Build the 'golden standard', the ideal set of documents to be retrieved self.buildIdealResultURLs()

Exemplo n.º 2

0

Exibir arquivo

Arquivo: RetrievalExperiment.py Projeto: jtedesco/EntityQuerier

class RetrievalExperiment(object): """ A generic experiment to be run """ def __init__(self, entityId, searchInterface, queryBuilder, numberOfResults=50): """ Put the search interface and entity ids on this object, and load entity data """ # The list of ids (corresponding JSON files are expected to be found in 'standard' and 'entities' folders) self.entityId = entityId # The search framework to use self.searchInterface = searchInterface self.numberOfResults = numberOfResults # The query evaluation metric to use self.queryEvaluator = CompositeQueryEvaluator() # The query builder to use self.queryBuilder = queryBuilder # Build the entities and queries for these entities self.buildEntities() self.buildQueries() # Build the 'golden standard', the ideal set of documents to be retrieved self.buildIdealResultURLs() def buildQueries(self): """ Builds the queries to use for each entity """ # Build the queries for this entity self.queries = self.queryBuilder.buildQueries(self.entity) def buildEntities(self): """ Load entity data into this object """ # Find the project root & open the input entity projectRoot = str(os.getcwd()) projectRoot = projectRoot[:projectRoot.find('EntityQuerier') + len('EntityQuerier')] # Get the entity object self.entity = load(open(projectRoot + '/entities/%s.json' % self.entityId)) def buildIdealResultURLs(self): """ Builds the ideal list of retrieved URLs, and the corresponding results. Data structure created will be: self.idealURLs = { <entity id> : [ <url> <url> ... ] } """ # Find the project root & open the input entity projectRoot = str(os.getcwd()) projectRoot = projectRoot[:projectRoot.find('EntityQuerier') + len('EntityQuerier')] idealURLs = load(open(projectRoot + "/entities/relevanceStandard/%s.json" % self.entityId)) self.idealURLs = set(idealURLs) def run(self): """ Actually runs the experiment. Creates results on this object, structured like this: self.results = { <query> : { relevantDocumentsRetrieved : [ ... ] nonRelevantDocumentsRetrieved : [ ... ] relevantDocumentsNotRetrieved : [ ... ] nonRelevantDocumentsNotRetrieved : [ ... ] score : <query score> } ... (same thing for all queries) ... overall : { relevantDocumentsRetrieved : [ ... ] nonRelevantDocumentsRetrieved : [ ... ] relevantDocumentsNotRetrieved : [ ... ] nonRelevantDocumentsNotRetrieved : [ ... ] score : <query score> } ... } Where each entry not specified will be """ # The final results data self.results = {} # The URLs retrieved using all the queries for this entity totalURLs = set([]) otherPrecisions = [] for query in self.queries: queryURLs = [] # Run this query queryResults = self.searchInterface.query(query) # Add the retrieved results if queryResults is not None: for result in queryResults: # Add the new URL to our lists of URLs retrieved try: resultURL = str(result['url']).strip() totalURLs.add(resultURL) queryURLs.append(resultURL) except TypeError: print "Something went very wrong..." except UnicodeDecodeError: pass except UnicodeEncodeError: pass # Score this query queryScore = self.queryEvaluator.evaluate(queryURLs, self.idealURLs) # Get list of relevant documents not retrieved relevantDocumentsNotRetrieved = list(set(self.idealURLs).difference(set(queryURLs))) # Allocate space in the new results data structure self.results[query] = { 'documentsRetrieved' : queryURLs, 'relevantDocumentsRetrieved' : [], 'nonRelevantDocumentsRetrieved' : [], 'relevantDocumentsNotRetrieved' : relevantDocumentsNotRetrieved, 'score' : queryScore } try: otherPrecisions.append(queryScore['precision']) except Exception: pass # Score the query & gather results for url in queryURLs: # Update lists of relevant results if url in self.idealURLs: self.results[query]['relevantDocumentsRetrieved'].append(url) else: self.results[query]['nonRelevantDocumentsRetrieved'].append(url) # Score the set of queries try: queryScore = self.queryEvaluator.evaluate(totalURLs, self.idealURLs, otherPrecisions) except Exception: queryScore = self.queryEvaluator.evaluate(totalURLs, self.idealURLs) # Get list of relevant documents not retrieved relevantDocumentsNotRetrieved = list(set(self.idealURLs).difference(set(totalURLs))) # Allocate space in the new results data structure self.results['overall'] = { 'documentsRetrieved' : list(totalURLs), 'relevantDocumentsRetrieved' : [], 'nonRelevantDocumentsRetrieved' : [], 'relevantDocumentsNotRetrieved' : relevantDocumentsNotRetrieved, 'score' : queryScore } # Score the query & gather results for url in totalURLs: # Update lists of relevant results if url in self.idealURLs: self.results['overall']['relevantDocumentsRetrieved'].append(url) else: self.results['overall']['nonRelevantDocumentsRetrieved'].append(url) return self.results def printResults(self, outputPath = "output", entityId = None): # Summarize the results\ summaryOutput = "Results Summary\n" summaryOutput += "===============\n\n" summaryOutput += '\t' + entityId + ":\n" summaryOutput += '\t' + len(entityId) * '~' + '\n' for metric in self.results['overall']['score']: summaryOutput += '\t' + metric.title() + ": %1.5f\n" % self.results['overall']['score'][metric] summaryOutput += '\t' + (len(entityId) * '~') + '\n' summaryOutput += '\n' # Format the results resultsOutput = dumps(self.results, indent=4) # Write it out if os.path.exists(outputPath): os.remove(outputPath) outputFile = open(outputPath, 'w') outputFile.write(summaryOutput) outputFile.write(resultsOutput) outputFile.close()