Python StatCounter.n примеры использования

Язык программирования: Python

Пространство имен/Пакет: pyspark.statcounter

Класс/Тип: StatCounter

Метод/Функция: n

Примеров на hotexamples.com: 4

Python StatCounter.n - 4 примера найдено. Это лучшие примеры Python кода для pyspark.statcounter.StatCounter.n, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

StatCounter(13)

count(3)

max(3)

mean(3)

merge(3)

mergeStats(3)

min(3)

sampleVariance(3)

variance(3)

m2(2)

minValue(2)

mu(2)

n(2)

sampleStdev(2)

stdev(2)

sum(2)

Пример #1

Показать файл

 def merge(self, frame):
     """
     Add another DataFrame to the accumulated stats for each column.
     Parameters
     ----------
     frame: pandas DataFrame we will update our stats counter with.
     """
     for column_name, _ in self._column_stats.items():
         data_arr = frame[[column_name]].values
         count, min_max_tup, mean, _, _, _ = \
             scistats.describe(data_arr)
         stats_counter = StatCounter()
         stats_counter.n = count
         stats_counter.mu = mean
         stats_counter.m2 = np.sum((data_arr - mean)**2)
         stats_counter.minValue, stats_counter.maxValue = min_max_tup
         self._column_stats[column_name] = self._column_stats[
             column_name].mergeStats(stats_counter)
     return self

Пример #2

Показать файл

Файл: pstatcounter.py Проект: Sandy4321/sparklingpandas

 def merge(self, frame):
     """
     Add another DataFrame to the accumulated stats for each column.
     Parameters
     ----------
     frame: pandas DataFrame we will update our stats counter with.
     """
     for column_name, _ in self._column_stats.items():
         data_arr = frame[[column_name]].values
         count, min_max_tup, mean, _, _, _ = \
             scistats.describe(data_arr)
         stats_counter = StatCounter()
         stats_counter.n = count
         stats_counter.mu = mean
         stats_counter.m2 = np.sum((data_arr - mean) ** 2)
         stats_counter.minValue, stats_counter.maxValue = min_max_tup
         self._column_stats[column_name] = self._column_stats[
             column_name].mergeStats(stats_counter)
     return self

Пример #3

Показать файл

Файл: pstatcounter.py Проект: snouhaud/sparklingpandas

 def merge(self, frame):
     """
     Add another DataFrame to the accumulated stats for each column.
     Parameters
     ----------
     frame: pandas DataFrame we will update our stats counter with.
     """
     for column_name, counter in self._column_stats.items():
         data_arr = frame[[column_name]].values
         count, min_max_tup, mean, unbiased_var, skew, kurt = \
             scistats.describe(data_arr)
         stats_counter = StatCounter()
         stats_counter.n = count
         stats_counter.mu = mean
         # TODO(juliet): look up paper they base their streams tat alg on,
         # write docs for statcounter class in spark
         # line below will likely need to be modified to match the alg
         stats_counter.m2 = np.sum((data_arr - mean)**2)
         stats_counter.minValue, stats_counter.maxValue = min_max_tup
         self._column_stats[column_name] = self._column_stats[
             column_name].mergeStats(stats_counter)
     return self

Пример #4

Показать файл

Файл: pstatcounter.py Проект: MLnick/sparklingpandas

 def merge(self, frame):
     """
     Add another DataFrame to the accumulated stats for each column.
     Parameters
     ----------
     frame: pandas DataFrame we will update our stats counter with.
     """
     for column_name, counter in self._column_stats.items():
         data_arr = frame[[column_name]].values
         count, min_max_tup, mean, unbiased_var, skew, kurt = \
             scistats.describe(data_arr)
         stats_counter = StatCounter()
         stats_counter.n = count
         stats_counter.mu = mean
         # TODO(juliet): look up paper they base their streams tat alg on,
         # write docs for statcounter class in spark
         # line below will likely need to be modified to match the alg
         stats_counter.m2 = np.sum((data_arr - mean) ** 2)
         stats_counter.minValue, stats_counter.maxValue = min_max_tup
         self._column_stats[column_name] = self._column_stats[
             column_name].mergeStats(stats_counter)
     return self