Python Workflow.batch_read_csv примеры использования

Язык программирования: Python

Пространство имен/Пакет: workflow

Класс/Тип: Workflow

Метод/Функция: batch_read_csv

Примеров на hotexamples.com: 5

Python Workflow.batch_read_csv - 5 примеров найдено. Это лучшие примеры Python кода для workflow.Workflow.batch_read_csv, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Workflow(30)

add_secondary_sensor(30)

add_primary_sensor(30)

reset(30)

add_item(27)

run(20)

cached_data(19)

send_feedback(12)

cache_data(10)

get_password(9)

datafile(8)

cachefile(8)

add_workflow(7)

set_input_dir(6)

clear_settings(5)

_get_secondary_sensors(4)

clear_data(4)

run_ingestion(4)

_get_primary_sensors(4)

_get_next_period(4)

_get_effective_production_period(4)

_add_inp_preconditions(4)

run_post_processing(3)

batch_read_csv(3)

run_karma(3)

run_matchup(2)

get_samples_per_time_slot(2)

decode(2)

__init__(2)

execute(2)

magic_prefix(2)

print_xml(2)

save_password(2)

print_output(2)

delete_password(2)

_add_obs_preconditions(2)

cache_serializer(2)

add_item_arg(2)

cached_data_fresh(1)

resume(1)

params(1)

pargs(1)

pause(1)

plot(1)

abort(1)

_next_year_start(1)

read_json_file(1)

reduce_rdds(1)

_get_year_day_of_year(1)

_get_primary_sensors_by_period(1)

Пример #1

Показать файл

    java_import(sc._jvm, "edu.isi.karma")

    inputFilename = argv[1]
    outputFilename = argv[2]

    fileUtil = FileUtil(sc)
    workflow = Workflow(sc)
    contextUrl = "https://raw.githubusercontent.com/american-art/aac-alignment/master/karma-context.json"

    #1. Read the input

    #test big file
    # inputRDD = workflow.batch_read_csv(inputFilename).partitionBy(1000)

    #test small file
    inputRDD = workflow.batch_read_csv(inputFilename)

    #2. Apply the karma Model
    outputRDD = workflow.run_karma(
        inputRDD,
        "https://raw.githubusercontent.com/american-art/npg/master/NPGConstituents/NPGConstituents-model.ttl",
        "http://dig.isi.edu/npgConstituents/",
        "http://www.cidoc-crm.org/cidoc-crm/E39_Actor1",
        "https://raw.githubusercontent.com/american-art/aac-alignment/master/karma-context.json",
        data_type="csv",
        additional_settings={"karma.input.delimiter": ","})

    #3. Save the output
    # fileUtil.save_file(outputRDD, outputFilename, "text", "json")

    reducedRDD = workflow.reduce_rdds(outputRDD)

Пример #2

Показать файл

Файл: npgWorkflowCSV.py Проект: american-art/aac-alignment

    sc = SparkContext(appName="TEST")

    java_import(sc._jvm, "edu.isi.karma")

    inputFilename = argv[1]
    outputFilename = argv[2]
    numPartitions = 1000
    numFramerPartitions = max(10, numPartitions / 10)

    fileUtil = FileUtil(sc)
    workflow = Workflow(sc)
    contextUrl = "https://raw.githubusercontent.com/american-art/aac-alignment/master/karma-context.json"

    #1. Read the input
    inputRDD = workflow.batch_read_csv(inputFilename)

    #2. Apply the karma Model
    outputRDD = workflow.run_karma(inputRDD,
                                   "https://raw.githubusercontent.com/american-art/npg/master/NPGConstituents/NPGConstituents-model.ttl",
                                   "http://americanartcollaborative.org/npg/",
                                   "http://www.cidoc-crm.org/cidoc-crm/E39_Actor1",
                                   "https://raw.githubusercontent.com/american-art/aac-alignment/master/karma-context.json",
                                   num_partitions=numPartitions,
                                   data_type="csv",
                                   additional_settings={"karma.input.delimiter":","})

    #3. Save the output
    # fileUtil.save_file(outputRDD, outputFilename, "text", "json")

    #4. Reduce rdds

Пример #3

Показать файл

Файл: npgBatchWorkflowCSV.py Проект: dingyi567/American_Art

            line = line.rstrip()
            params = line.split("\t")
            data_file_URL = str(params[0])
            num_partitions = int(params[1])
            model_file_URL= str(params[2])
            base = str(params[3])
            root = str(params[4])
            context = str(params[5])
            output_folder = str(params[6])
            output_zip_path = str(params[7])

            #0. Download data file
            dataFileName = download_file(data_file_URL)

            #1. Read the input
            inputRDD = workflow.batch_read_csv(dataFileName).partitionBy(num_partitions)

            #2. Apply the karma Model
            outputRDD = workflow.run_karma(inputRDD,
                                            model_file_URL,
                                            base,
                                            root,
                                            context,
                            data_type="csv",
                            additional_settings={"karma.input.delimiter":",", "karma.output.format": "n3"})

            #3. Save the output
            outputPath = outputFilename + "/" + output_folder
            outputRDD.map(lambda x: x[1]).saveAsTextFile(outputPath)
            print "Successfully apply karma!"

Пример #4

Показать файл

Файл: AutryWorkflowCSV.py Проект: dingyi567/American_Art

    sc = SparkContext(appName="TEST")

    java_import(sc._jvm, "edu.isi.karma")

    inputFilename = argv[1]
    outputFilename = argv[2]


    fileUtil = FileUtil(sc)
    workflow = Workflow(sc)
    contextUrl = "https://raw.githubusercontent.com/american-art/aac-alignment/master/karma-context.json"

    #1. Read the input

    #test big file
    inputRDD = workflow.batch_read_csv(inputFilename).partitionBy(1)

    #test small file
    # inputRDD = workflow.batch_read_csv(inputFilename)


    #2. Apply the karma Model
    outputRDD = workflow.run_karma(inputRDD,
                                   "https://raw.githubusercontent.com/american-art/autry/master/AutryMakers/AutryMakers-model.ttl",
                                   "http://dig.isi.edu/AutryMakers/",
                                   "http://www.cidoc-crm.org/cidoc-crm/E22_Man-Made_Object1",
                                   "https://raw.githubusercontent.com/american-art/aac-alignment/master/karma-context.json",
                                   data_type="csv",
                                   additional_settings={"karma.input.delimiter":","})

    #3. Save the output

Пример #5

Показать файл

Файл: AutryWorkflowCSV.py Проект: dingyi567/American_Art

    sc = SparkContext(appName="TEST")

    java_import(sc._jvm, "edu.isi.karma")

    inputFilename = argv[1]
    outputFilename = argv[2]

    fileUtil = FileUtil(sc)
    workflow = Workflow(sc)
    contextUrl = "https://raw.githubusercontent.com/american-art/aac-alignment/master/karma-context.json"

    #1. Read the input

    #test big file
    inputRDD = workflow.batch_read_csv(inputFilename).partitionBy(1)

    #test small file
    # inputRDD = workflow.batch_read_csv(inputFilename)

    #2. Apply the karma Model
    outputRDD = workflow.run_karma(
        inputRDD,
        "https://raw.githubusercontent.com/american-art/autry/master/AutryMakers/AutryMakers-model.ttl",
        "http://dig.isi.edu/AutryMakers/",
        "http://www.cidoc-crm.org/cidoc-crm/E22_Man-Made_Object1",
        "https://raw.githubusercontent.com/american-art/aac-alignment/master/karma-context.json",
        data_type="csv",
        additional_settings={"karma.input.delimiter": ","})

    #3. Save the output