Exemplos de MapReduce_util em Python

Linguagem de programação: Python

Classe / Tipo: MapReduce_util

Exemplos em hotexamples.com: 2

MapReduce_util em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de MapReduce_util em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

load(2)

chunks(1)

sanitize(1)

Métodos Frequentes

load (2)

chunks (1)

sanitize (1)

Relacionados

calculate_dimensions

get_current_quarter

EventNotifier

parse_data

filtering_from_request

unicodify

merge_dicts

load_psf

expire_overdue_runs

delete_keys_from_import_result

Related in langs

UnusedPropertiesQueryPage (PHP)

assessment_evaluations_reset (PHP)

ClientProxy (C#)

Engine.AssetManager (C#)

torture_rmdirs (C++)

HYPRE_BiCGSTABSolve (C++)

Resource (Go)

Cursor (Go)

Grade (Java)

CrimePagerActivity (Java)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: MapReduce_func.py Projeto: qutang/WT2013-MillionSong

def Map_WC(L): results = [] for w in L: # True if w contains non-alphanumeric characters if not w.isalnum(): w = MR_u.sanitize(w) # True if w is a title-cased token if w.istitle(): results.append((w, 1)) return results

Exemplo n.º 2

0

Exibir arquivo

Arquivo: MapReduce_test.py Projeto: qutang/WT2013-MillionSong

# python MapReduce_main.py test.txt import sys import MapReduce_util as MR_u import MapReduce_func as MR_f from multiprocessing import Pool if len(sys.argv) != 2: print "Program requires path to file for reading!" sys.exit(1) num_proc = 1 # Load file, stuff it into a string text = MR_u.load(sys.argv[1]) # Build a pool of 8 processes pool = Pool(processes=num_proc) # Fragment the string data into 8 chunks partitioned_text = list(MR_u.chunks(text, len(text) / num_proc)) # print len(text) / num_proc,len(partitioned_text[0]) # Generate count tuples for title-cased tokens single_count_tuples = pool.map(MR_f.Map_WC, partitioned_text) # single_count_tuples = pool.map(MR_f.Map_WC, partitioned_text) """ map_func = MR_f.Mapper('WordCount') single_count_tuples = map_func.Map(partitioned_text[0]) token_to_tuples = MR_f.Partition([single_count_tuples]) """ # print len(single_count_tuples)# # Organize the count tuples; lists of tuples by token key