Python KafkaDStream 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pyspark.streaming.kafka

클래스/타입: KafkaDStream

hotexamples.com에서의 예제들: 5

Python KafkaDStream - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pyspark.streaming.kafka.KafkaDStream에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

map(4)

KafkaDStream(1)

자주 사용되는 메소드들

map (4)

KafkaDStream (1)

예제 #1

파일 보기

파일: ss_session.py 프로젝트: UCLA-ECEM202A-2017F/VirtualSensorCode

def process_valid_file(message: KafkaDStream, data_path: str, v_path: str,
                       sensor_id: str, interval: int):
    """
    Read convert gzip file data into json object and publish it on Kafka
    :param message:
    """

    # print("====== Processing in process_valid_file ======")
    records = message.map(lambda r: json.loads(r[1]))  # matadata & filename
    # print(records.collect())
    valid_records = records.filter(lambda rdd: verify_fields(rdd, data_path))
    # print("File Iteration count-valid_records:", valid_records.count())

    # print("====== Processing in verify_sid ======")
    valid_sensors = valid_records.filter(
        lambda rdd: verify_sid(rdd, sensor_id, data_path))
    # print("File Iteration count-valid_sensors:", valid_sensors.count())
    # print(valid_sensors.collect())

    print("====== Processing in extract_info ======")
    results = valid_sensors.map(
        lambda rdd: extract_info(rdd, data_path, v_path))
    # used to be rdd of list [identifier, owner, name, data_descriptor, start_time, end_time, datapoints]
    # now just the file within window
    print("Result is: ")
    print(results.collect())

예제 #2

파일 보기

def kafka_to_db(message: KafkaDStream):
    """

    :param message:
    """
    records = message.map(lambda r: json.loads(r[1]))
    valid_records = records.filter(verify_fields)

    valid_records.foreach(lambda stream_data: store_streams(stream_data))

    storeOffsetRanges(message)

    print("Ready to process stream...")

예제 #3

파일 보기

파일: process_messages.py 프로젝트: MD2Korg/CerebralCortex-KafkaStreamPreprocessor

def kafka_file_to_json_producer(message: KafkaDStream, data_path,
                                config_filepath, CC):
    """
    Read convert gzip file data into json object and publish it on Kafka
    :param message:
    """

    records = message.map(lambda r: json.loads(r[1]))
    valid_records = records.filter(lambda rdd: verify_fields(rdd, data_path))
    results = valid_records.map(
        lambda msg: save_data(msg, data_path, config_filepath))
    print("File Iteration count:", results.count())
    store_offset_ranges(message, CC)

예제 #4

파일 보기

파일: ss_session.py 프로젝트: UCLA-ECEM202A-2017F/VirtualSensorCode

def kafka_file_to_json_producer(message: KafkaDStream, data_path):
    """
    Read convert gzip file data into json object and publish it on Kafka
    :param message:
    """
    records = message.map(lambda r: json.loads(r[1]))
    valid_records = records.filter(lambda rdd: verify_fields(rdd, data_path))
    results = valid_records.map(
        lambda rdd: file_processor(rdd, data_path)).map(store_stream)

    storeOffsetRanges(message)

    print("File Iteration count:", results.count())

예제 #5

파일 보기

def dStreamTokafkadStream( ssc, stream ):
    return KafkaDStream(stream._jdstream, ssc, stream._jrdd_deserializer)