Esempi in Python per Reducer

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: pmr.reducer

Classe/tipologia: Reducer

Esempi su hotexamples.com: 2

Reducer in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per pmr.reducer.Reducer, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

emit(2)

finalize(1)

Esempio n. 1

Mostra file

File: kmeans_reducer.py Progetto: saga-project/PilotMapReduce

def parseVector(line):
    return [float(x) for x in line.split(',')]


def average(points):
    numVectors = len(points)
    if numVectors > 0:
        pVectors = np.array(points)
        return list(pVectors.mean(0))
    else:
        return []
        
if __name__ == "__main__":
    # Initialize Reduce job
    reduceJob = Reducer(sys.argv)   
        
    # reduce function
    clusterPoints={}
    centersFile=open(CENTER_FILE_PREFIX + reduceJob.reduce, "w")
    for pName in reduceJob.partitionFiles:
        with open(pName) as infile:
            for line in infile:
                tokens=line.split(",")
                clusterId = tokens[0]
                if clusterPoints.get(clusterId,None) == None:
                    clusterPoints[clusterId] = []
                clusterPoints[clusterId].append(parseVector(",".join(tokens[1:])))
                reduceJob.emit( None,','.join(tokens[1:]) )                

    for clusterId,points in clusterPoints.iteritems():

Esempio n. 2

Mostra file

File: wc_reducer.py Progetto: saga-project/PilotMapReduce

from pmr.reducer import Reducer
import sys


if __name__ == "__main__":
    # Initialize Reduce job
    reduceJob = Reducer(sys.argv)

    # Reduce function
    count = {}
    # split the map emitted to get words count from each partition file
    for pName in reduceJob.partitionFiles:
        with open(pName) as infile:
            for line in infile:
                tokens = line.split(",")

                # Actual word might contain "," and count is last token.
                value = int(tokens[-1])
                word = ",".join(tokens[:-1])

                if count.has_key(word):
                    count[word] = count[word] + value
                else:
                    count[word] = value

    for word, count in count.iteritems():
        reduceJob.emit(word, count)

    # Finalize reduce job
    reduceJob.finalize()