Python StatCounter.mu示例

编程语言: Python

命名空间/包名称: pyspark.statcounter

类/类型: StatCounter

方法/功能: mu

hotexamples.com的示例: 4

Python StatCounter.mu - 已找到4个示例。这些是从开源项目中提取的最受好评的pyspark.statcounter.StatCounter.mu现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

StatCounter(13)

count(3)

max(3)

mean(3)

merge(3)

mergeStats(3)

min(3)

sampleVariance(3)

variance(3)

m2(2)

minValue(2)

mu(2)

n(2)

sampleStdev(2)

stdev(2)

sum(2)

示例#1

显示文件

 def merge(self, frame):
     """
     Add another DataFrame to the accumulated stats for each column.
     Parameters
     ----------
     frame: pandas DataFrame we will update our stats counter with.
     """
     for column_name, _ in self._column_stats.items():
         data_arr = frame[[column_name]].values
         count, min_max_tup, mean, _, _, _ = \
             scistats.describe(data_arr)
         stats_counter = StatCounter()
         stats_counter.n = count
         stats_counter.mu = mean
         stats_counter.m2 = np.sum((data_arr - mean)**2)
         stats_counter.minValue, stats_counter.maxValue = min_max_tup
         self._column_stats[column_name] = self._column_stats[
             column_name].mergeStats(stats_counter)
     return self

示例#2

显示文件

文件： pstatcounter.py 项目： Sandy4321/sparklingpandas

 def merge(self, frame):
     """
     Add another DataFrame to the accumulated stats for each column.
     Parameters
     ----------
     frame: pandas DataFrame we will update our stats counter with.
     """
     for column_name, _ in self._column_stats.items():
         data_arr = frame[[column_name]].values
         count, min_max_tup, mean, _, _, _ = \
             scistats.describe(data_arr)
         stats_counter = StatCounter()
         stats_counter.n = count
         stats_counter.mu = mean
         stats_counter.m2 = np.sum((data_arr - mean) ** 2)
         stats_counter.minValue, stats_counter.maxValue = min_max_tup
         self._column_stats[column_name] = self._column_stats[
             column_name].mergeStats(stats_counter)
     return self

示例#3

显示文件

文件： pstatcounter.py 项目： snouhaud/sparklingpandas

 def merge(self, frame):
     """
     Add another DataFrame to the accumulated stats for each column.
     Parameters
     ----------
     frame: pandas DataFrame we will update our stats counter with.
     """
     for column_name, counter in self._column_stats.items():
         data_arr = frame[[column_name]].values
         count, min_max_tup, mean, unbiased_var, skew, kurt = \
             scistats.describe(data_arr)
         stats_counter = StatCounter()
         stats_counter.n = count
         stats_counter.mu = mean
         # TODO(juliet): look up paper they base their streams tat alg on,
         # write docs for statcounter class in spark
         # line below will likely need to be modified to match the alg
         stats_counter.m2 = np.sum((data_arr - mean)**2)
         stats_counter.minValue, stats_counter.maxValue = min_max_tup
         self._column_stats[column_name] = self._column_stats[
             column_name].mergeStats(stats_counter)
     return self

示例#4

显示文件

文件： pstatcounter.py 项目： MLnick/sparklingpandas

 def merge(self, frame):
     """
     Add another DataFrame to the accumulated stats for each column.
     Parameters
     ----------
     frame: pandas DataFrame we will update our stats counter with.
     """
     for column_name, counter in self._column_stats.items():
         data_arr = frame[[column_name]].values
         count, min_max_tup, mean, unbiased_var, skew, kurt = \
             scistats.describe(data_arr)
         stats_counter = StatCounter()
         stats_counter.n = count
         stats_counter.mu = mean
         # TODO(juliet): look up paper they base their streams tat alg on,
         # write docs for statcounter class in spark
         # line below will likely need to be modified to match the alg
         stats_counter.m2 = np.sum((data_arr - mean) ** 2)
         stats_counter.minValue, stats_counter.maxValue = min_max_tup
         self._column_stats[column_name] = self._column_stats[
             column_name].mergeStats(stats_counter)
     return self