Python sql.DataFrame.filterの例

プログラミング言語: Python

名前空間/パッケージ名: pyspark

クラス/型: sql.DataFrame

メソッド/関数: filter

hotexamples.comのコード掲載数: 2

Python sql.DataFrame.filter - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのpyspark.sql.DataFrame.filterの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

count(9)

withColumn(8)

select(6)

repartition(3)

union(2)

filter(2)

toPandas(2)

groupby(2)

where(1)

subtract(1)

sortWithinPartitions(1)

sampleBy(1)

collect(1)

persist(1)

mapInPandas(1)

limit(1)

join(1)

groupBy(1)

drop(1)

crosstab(1)

orderBy(1)

コード例 #1

ファイルを表示

def group_mean(data: pyspark.sql.DataFrame, groups, response, features):
    means = scipy.zeros((len(groups), len(features)))
    for i, target in enumerate(groups):
        df_t = data.filter("{} == {}".format(response, target))
        X_t = df_t.select(features).rdd.map(numpy.array)
        means[i, :] = column_means(X_t)
    return means

コード例 #2

ファイルを表示

def within_group_scatter(data: pyspark.sql.DataFrame, features, response,
                         targets):
    p = len(features)
    sw = numpy.zeros((p, p))
    for target in targets:
        df_t = data.filter("{} == '{}'".format(response, target))
        X_t = RowMatrix(df_t.select(features).rdd.map(numpy.array))
        sw += X_t.computeCovariance().toArray() * (df_t.count() - 1)
    return sw