Python Hadoop示例

编程语言: Python

命名空间/包名称: utils

类/类型: Hadoop

hotexamples.com的示例: 2

Python Hadoop - 已找到2个示例。这些是从开源项目中提取的最受好评的utils.Hadoop现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

ls(1)

mkdir(1)

run(1)

setrep(1)

size(1)

示例#1

显示文件

文件： pivbench.py 项目： boogabee/pivbench

def generateData(scale, base, namenode, tableName=""):
    loggerInfo = buildReportLogger("gen")
    reportName = loggerInfo[0]
    report = loggerInfo[1]
    trueScale = scaleConverter(scale)
    uniInfoLog("Creating Dataset for " + str(trueScale), report)
    print str(trueScale)
    if (Hadoop.ls(base))[0] == -1:
        result = Hadoop.mkdir(base)
        if result[0] < 0:
            print result[1]
            exit()
    else:
        print "Base Directory already exists.  Please change and rerun"
        exit()
    buildGen()
    os.chdir(workingDir + "/tpcds-gen")

    for file in glob.glob("target/*.jar"):
        jarFile = file

    uniInfoLog("Data Generation MapRed Job Starting", report)
    # TABLE GEN DOESN"T WORK, SO COMMENTING THIS OUT TO KEEP FROM RUNNING IT
    # if tableName:
    #     result = Hadoop.runTable(jarFile, scale, base, tableName)
    # else:
    #     result = Hadoop.run(jarFile, scale, base)
    result = Hadoop.run(jarFile, str(trueScale), base)
    uniInfoLog("Data Generation MapRed Job Complete", report)
    uniInfoLog("Changing Replication Factor of RawData to 2")
    result = Hadoop.setrep(2, base)

示例#2

显示文件

文件： pivbench.py 项目： boogabee/pivbench

def capacityReport(namenode, hdfsDir):
    results = Hadoop.size(hdfsDir)
    print results[1]