Python get_spark_session示例

编程语言: Python

命名空间/包名称: dbnd._core.commands

方法/功能: get_spark_session

hotexamples.com的示例: 3

Python get_spark_session - 已找到3个示例。这些是从开源项目中提取的最受好评的dbnd._core.commands.get_spark_session现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

    def _task_run(self):
        super(_InlineSparkTask, self)._task_run()

        if self._get_spark_ctrl().stop_spark_session_on_finish:
            session = get_spark_session()
            logger.info("Stopping spark session: %s")
            session.stop()

示例#2

显示文件

文件： spark_tasks_inline.py 项目： turbaszek/dbnd

def word_count_inline(text=parameter.data.txt[spark.DataFrame],
                      counters=output.txt.data):
    # type:  (spark.DataFrame, PathStr) -> spark.DataFrame
    from operator import add
    from dbnd._core.commands import get_spark_session

    lines = text.rdd.map(lambda r: r[0])
    counts = (lines.flatMap(lambda x: x.split(" ")).map(
        lambda x: (x, 1)).reduceByKey(add))
    counts.saveAsTextFile(str(counters))
    df = get_spark_session().createDataFrame(counts)
    output = counts.collect()
    for (word, count) in output:
        print("%s: %i" % (word, count))

    return df

示例#3

显示文件

文件： spark_marshalling.py 项目： lbtanh/dbnd

 def target_to_value(self, target, **kwargs):
     path = _target_to_path(target)
     schema = kwargs["schema"] if "schema" in kwargs else None
     return (get_spark_session().read.format(
         self.file_format).options(**kwargs).load(path, schema=schema))