Python SparkSession.join Examples

Programming Language: Python

Namespace/Package Name: pyspark.sql

Class/Type: SparkSession

Method/Function: join

Examples at hotexamples.com: 1

Python SparkSession.join - 1 examples found. These are the top rated real world Python examples of pyspark.sql.SparkSession.join extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Builder(30)

table(30)

createDataFrame(30)

sql(30)

SparkSession(30)

getActiveSession(25)

range(13)

_getActiveSessionOrCreate(6)

stop(6)

builder(4)

orderBy(2)

show(2)

newSession(2)

_create_shell_session(2)

observe(1)

parallelize(1)

master(1)

rasterframes(1)

join(1)

head(1)

appName(1)

withHiveSupport(1)

Example #1

Show file

def process_rdd(spark_session, rdd):
	gs_df = SparkSession(rdd.context).createDataFrame(rdd.filter(is_not_empty).map(process_group_series), group_series_schema)

	print(gs_df.head())
	se_df = series_entities_df(spark_session)
	gu_df = group_user_df(spark_session)

	df = gs_df.join(gu_df, ["group_id"]).join(se_df, ["series_id"]).select("user_id", "series_id", "module_id")
	write_to_mysql(df, "acl", "append")