Ejemplos de FileUtil.save_json_file en Python

Lenguaje de programación: Python

Namespace/Package Name: fileUtil

Clase / Tipo: FileUtil

Método / Función: save_json_file

Ejemplos en hotexamples.com: 3

Python FileUtil.save_json_file - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de fileUtil.FileUtil.save_json_file extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

load_json_file(6)

save_json_file(3)

FileUtil(1)

checkFile(1)

get_all_file(1)

is_exists(1)

mkDir(1)

spit_filename(1)

writeFile(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: convertToSeq.py Proyecto: usc-isi-i2/WEDC

#!/usr/bin/env python

from pyspark import SparkContext

from optparse import OptionParser
from fileUtil import FileUtil

if __name__ == "__main__":
    sc = SparkContext(appName="DIG-TEXT-TO-SEQ")

    usage = "usage: %prog [options] inputDataset outputFilename"
    parser = OptionParser()
    parser.add_option("-r", "--separator", dest="separator", type="string",
                      help="field separator", default="\t")

    (c_options, args) = parser.parse_args()
    print "Got options:", c_options
    inputFilename1 = args[0]
    outputFilename = args[1]

    print "Write output to:", outputFilename
    fileUtil = FileUtil(sc)
    input_rdd = fileUtil.load_json_file(inputFilename1, "text", c_options)

    print "Write output to:", outputFilename
    fileUtil.save_json_file(input_rdd, outputFilename, "sequence", c_options)

Ejemplo n.º 2

Mostrar archivo

Archivo: cleaner.py Proyecto: dingyi567/dig-entity-merger

    usage = "usage: %prog [options] inputDataset inputDatasetFormat inputPath" \
            "baseDataset baseDatasetFormat" \
            "outputFilename outoutFileFormat"
    parser = OptionParser()
    parser.add_option("-r", "--separator", dest="separator", type="string",
                      help="field separator", default="\t")
    parser.add_option("-p", "--numPartitions", dest="numPartitions", type="int",
                      help="number of partitions", default=10)

    (c_options, args) = parser.parse_args()
    inputFilename1 = args[0]
    inputFileFormat1 = args[1]
    inputPath = args[2]

    baseFilename = args[3]
    baseFormat = args[4]

    outputFilename = args[5]
    outputFileFormat = args[6]
    print "Got options:", c_options, ", " \
                         "input:", inputFilename1, ",", inputFileFormat1, ",", inputPath, \
                         ", base:", baseFilename, ",", baseFormat
    print "Write output to:", outputFilename
    fileUtil = FileUtil(sc)
    input_rdd1 = fileUtil.load_json_file(inputFilename1, inputFileFormat1, c_options).partitionBy(c_options.numPartitions)
    base_rdd = fileUtil.load_json_file(baseFilename, baseFormat, c_options)

    result_rdd = EntityCleaner.clean_rdds(input_rdd1, inputPath, base_rdd, c_options.numPartitions)

    fileUtil.save_json_file(result_rdd, outputFilename, outputFileFormat, c_options)

Ejemplo n.º 3

Mostrar archivo

Archivo: create_base_file.py Proyecto: dingyi567/dig-entity-merger

if __name__ == "__main__":
    sc = SparkContext(appName="DIG-TEXT-TO-SEQ")

    usage = "usage: %prog [options] inputDataset outputFilename"
    parser = OptionParser()
    parser.add_option("-r", "--separator", dest="separator", type="string",
                      help="field separator", default="\t")

    (c_options, args) = parser.parse_args()
    print "Got options:", c_options
    inputFilename1 = args[0]
    outputFilename = args[1]

    print "Write output to:", outputFilename
    fileUtil = FileUtil(sc)
    def load_input(x, sep):
        parts = x.split(sep)
        if len(parts) >= 2:
            uri = parts[0]
            name = parts[1]
            return uri, {"uri":uri, "name":name}
        else:
            print "\n\n****************** Got non parse line:", x
    input_rdd =sc.textFile(inputFilename1).map(lambda x: load_input(x, c_options.separator)).filter(lambda x: x != None)

    print "Write output to:", outputFilename
    fileUtil.save_json_file(input_rdd, outputFilename, "text", c_options)