Python MapReduce_util.loadの例

プログラミング言語: Python

クラス/型: MapReduce_util

メソッド/関数: load

hotexamples.comのコード掲載数: 2

Python MapReduce_util.load - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのMapReduce_util.loadの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

load(2)

chunks(1)

sanitize(1)

よく使われるメソッド

load (2)

chunks (1)

sanitize (1)

コード例 #1

ファイルを表示

ファイル: MapReduce_test.py プロジェクト: qutang/WT2013-MillionSong

# python MapReduce_main.py test.txt
import sys
import MapReduce_util as MR_u
import MapReduce_func as MR_f
from multiprocessing import Pool

if len(sys.argv) != 2:
    print "Program requires path to file for reading!"
    sys.exit(1)

num_proc = 1
# Load file, stuff it into a string
text = MR_u.load(sys.argv[1])

# Build a pool of 8 processes
pool = Pool(processes=num_proc)

# Fragment the string data into 8 chunks
partitioned_text = list(MR_u.chunks(text, len(text) / num_proc))
# print len(text) / num_proc,len(partitioned_text[0])
# Generate count tuples for title-cased tokens

single_count_tuples = pool.map(MR_f.Map_WC, partitioned_text)
# single_count_tuples = pool.map(MR_f.Map_WC, partitioned_text)
"""
map_func = MR_f.Mapper('WordCount')
single_count_tuples = map_func.Map(partitioned_text[0])
token_to_tuples = MR_f.Partition([single_count_tuples])
"""
# print len(single_count_tuples)#
# Organize the count tuples; lists of tuples by token key

コード例 #2

ファイルを表示

ファイル: MapReduce_main.py プロジェクト: qutang/WT2013-MillionSong

# python MapReduce_main.py test.txt
import sys
import MapReduce_util as MR_u
import MapReduce_func as MR_f
from multiprocessing import Pool
if (len(sys.argv) != 2):
    print "Program requires path to file for reading!"
    sys.exit(1)

num_proc = 1;
# Load file, stuff it into a string
text = MR_u.load(sys.argv[1],'\n')

# Build a pool of 8 processes
pool = Pool(processes=num_proc,)

# Fragment the string data into 8 chunks
partitioned_text = list(MR_u.chunks(text, len(text) / num_proc))

#print len(text) / num_proc,len(partitioned_text[0])
# Generate count tuples for title-cased tokens

single_count_tuples = pool.map(MR_f.Map_SC, partitioned_text)
#single_count_tuples = pool.map(MR_f.Map_WC, partitioned_text)
#print len(single_count_tuples)#
# Organize the count tuples; lists of tuples by token key
token_to_tuples = MR_f.Partition(single_count_tuples)

# Collapse the lists of tuples into total term frequencies
term_frequencies = pool.map(MR_f.Reduce, token_to_tuples.items())