Ejemplos de SparkConf.textFile en Python

Lenguaje de programación: Python

Namespace/Package Name: pyspark

Clase / Tipo: SparkConf

Método / Función: textFile

Ejemplos en hotexamples.com: 2

Python SparkConf.textFile - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de pyspark.SparkConf.textFile extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

SparkConf(30)

set(30)

setAll(30)

setAppName(30)

setMaster(30)

get(20)

getAll(13)

setExecutorEnv(13)

toDebugString(7)

setIfMissing(4)

contains(1)

read(1)

setExectorMemory(1)

setExecutorCores(1)

setSparkHome(1)

textFile(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: SparkES.py Proyecto: Radhika-Goel/PracticeCode

def parse(str):
    s = p.match(str)
    d = {}
    d['ip'] = s.group(1)
    d['date'] = s.group(4)
    d['operation'] = s.group(5)
    d['uri'] = s.group(6)
    return d


regex = '^(\S+) (\S+) (\S+) \[([\w:/]+\s[+\-]\d{4})\] "(\S+)\s?(\S+)?\s?(\S+)?" (\d{3}|-) (\d+|-)\s?"?([^"]*)"?\s?"?([^"]*)?"?$'

p = re.compile(regex)

rdd = sc.textFile("/home/ubuntu/walker/apache_logs")

rdd2 = rdd.map(parse)

rdd3 = rdd2.map(addId())

es_write_conf = {
    "es.nodes": "localhost",
    "es.port": "9200",
    "es.resource": 'walker/apache',
    "es.input.json": "yes",
    "es.mapping.id": "doc_id"
}

rdd3.saveAsNewAPIHadoopFile(
    path='-',

Ejemplo n.º 2

Mostrar archivo

from pyspark import SparkConf, SparkContext

conf = SparkConf().setMaster("local").setAppName("wordCount")
sc = SparkConf(conf=conf)

rdd = sc.textFile('./data/data.txt')

words = rdd.flatMap(lambda x: x.split(" "))

countRdd = words.map(lambda x: (x, 1)).reduceByKey(lambda x, y: x + y)

for count in countRdd.collect():
    print count[0] + " " + str(count[1])