Esempi in Python per get_spark_context

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: cis.utils

Metodo/funzione: get_spark_context

Esempi su hotexamples.com: 5

get_spark_context in Python: 5 esempi trovati. Questi sono i migliori esempi reali in Python per cis.utils.get_spark_context, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Esempio n. 1

Mostra file

File: test_threshold.py Progetto: eyalaltshuler/cis

 def reset(self):
     if self._sc:
         self._sc.stop()
     self._sc = utils.get_spark_context()
     self._data_set_rdd = self._get_dataset_rdd()
     self._data_set_rdd.cache()
     self._data_set_size = self._data_set_rdd.count()

Esempio n. 2

Mostra file

File: test_dataset_size.py Progetto: eyalaltshuler/cis

 def reset(self):
     if self._sc:
         self._sc.stop()
     self._sc = utils.get_spark_context()
     self._data_set_rdd = self._get_dataset_rdd()
     self._data_set_rdd.cache()
     self._data_set_size = self._data_set_rdd.count()
     self._threshold = THRESHOLD_RATIO * self._data_set_size

Esempio n. 3

Mostra file

File: test_alpha.py Progetto: eyalaltshuler/cis

 def reset(self):
     if self._sc:
         self._sc.stop()
     self._sc = utils.get_spark_context()
     self._data_set_rdd = self._get_dataset_rdd()
     self._data_set_rdd.cache()
     self._data_set_size = self._data_set_rdd.count()
     print 'num transactions in data - %d' % self._data_set_size
     self._threshold = THRESHOLD_RATIO * self._data_set_size

Esempio n. 4

Mostra file

File: test_dataset_size.py Progetto: eyalaltshuler/cis

 def __init__(self, times):
     self._times = times
     self._data_path = None
     self._num_machines = NUM_MACHINES
     self._sc = utils.get_spark_context()
     self._epsilon = 0.1
     if not os.path.exists("results/%s" % DATA_SET_NAME):
         os.mkdir("results/%s" % DATA_SET_NAME)
     if not os.path.exists(TEST_DIR):
         os.mkdir(TEST_DIR)
     global RES
     if RES is None:
         RES = {'xsmall': self._init_res_dict(),
                'small': self._init_res_dict(),
                'medium': self._init_res_dict(),
                'large': self._init_res_dict(),
                'xlarge': self._init_res_dict()}

Esempio n. 5

Mostra file

 def setUp(self):
     self._data_path = DATA_PATH
     self._num_machines = NUM_MACHINES
     self._sc = utils.get_spark_context()
     self._data_set_rdd = self._get_dataset_rdd()
     self._data_set_rdd.cache()
     self._data_set_size = self._data_set_rdd.count()
     self._threshold = THRESHOLD_RATIO * self._data_set_size
     self._epsilon = 0.1
     if not os.path.exists("results/%s" % DATA_SET_NAME):
         os.mkdir("results/%s" % DATA_SET_NAME)
     if not os.path.exists(TEST_DIR):
         os.mkdir(TEST_DIR)
     global RES
     if RES is None:
         RES = {'xsmall': self._init_res_dict(),
                'small': self._init_res_dict(),
                'medium': self._init_res_dict(),
                'large': self._init_res_dict(),
                'xlarge': self._init_res_dict()}