Python HiveContext.getOrCreate Exemples

Langage de programmation: Python

Espace de nommage/Pack: pyspark

Class/Type: HiveContext

Méthode/Fonction: getOrCreate

Exemples au hotexamples.com: 3

Python HiveContext.getOrCreate - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de pyspark.HiveContext.getOrCreate extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

HiveContext(30)

sql(30)

createDataFrame(17)

table(10)

setConf(10)

cacheTable(6)

registerDataFrameAsTable(4)

tables(4)

uncacheTable(3)

registerFunction(2)

getOrCreate(2)

_createForTesting(1)

map(1)

show(1)

count(1)

clearCache(1)

cache(1)

refreshTable(1)

Méthodes fréquemment utilisées

HiveContext (30)

sql (30)

createDataFrame (17)

table (10)

setConf (10)

cacheTable (6)

registerDataFrameAsTable (4)

tables (4)

uncacheTable (3)

registerFunction (2)

Méthodes fréquemment utilisées

getOrCreate (2)

_createForTesting (1)

map (1)

show (1)

count (1)

clearCache (1)

cache (1)

refreshTable (1)

Exemple #1

0

Afficher le fichier

Fichier : jsoncount.py Projet : weasellin/pyspark.test

""" wordcount example using the rdd api, we'll write a test for this """ from __future__ import print_function import sys from pyspark import SparkContext from pyspark import HiveContext def do_json_counts(df, target_name): """ count of records where name=target_name in a dataframe with column 'name' """ return df.filter(df.name == target_name).count() if __name__ == "__main__": if len(sys.argv) != 2: sys.exit("Usage: json file}") sc = SparkContext(appName="PythonJsonCount") hc = HiveContext.getOrCreate(sc) df = hc.read.json(sys.argv[1], 1) print("Name vikas found %d times" % do_json_counts(df, 'vikas'))

Exemple #2

0

Afficher le fichier

from valida_data_ref_carga import verifica_data_ref_carga # ## Definições para o contexto do Spark # In[4]: conf = SparkConf().setAppName("Test_movto_validos").setMaster("local[2]") # In[5]: spark = SparkSession.builder.enableHiveSupport().config( conf=conf).getOrCreate() # In[6]: spark_hive = HiveContext.getOrCreate(spark) # In[7]: #retirar quando for implantar #if sc.startTime != 0: sc.stop() # In[8]: sc = SparkContext.getOrCreate() # In[9]: sql_ctx = SQLContext(sc) # In[10]:

Exemple #3

0

Afficher le fichier

Fichier : jsoncount.py Projet : bomboradata/pyspark.test

""" wordcount example using the rdd api, we'll write a test for this """ from __future__ import print_function import sys from pyspark import SparkContext from pyspark import HiveContext def do_json_counts(df, target_name): """ count of records where name=target_name in a dataframe with column 'name' """ return df.filter(df.name == target_name).count() if __name__ == "__main__": if len(sys.argv) != 2: sys.exit("Usage: json file}") sc = SparkContext(appName="PythonJsonCount") hc = HiveContext.getOrCreate(sc) df = hc.read.json(sys.argv[1], 1) print("Name vikas found %d times" % do_json_counts(df, 'vikas'))