Esempi in Python per DataFrame.where

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: pyspark.sql.dataframe

Classe/tipologia: DataFrame

Metodo/funzione: where

Esempi su hotexamples.com: 4

DataFrame.where in Python: 4 esempi trovati. Questi sono i migliori esempi reali in Python per pyspark.sql.dataframe.DataFrame.where, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

withColumn(30)

select(30)

DataFrame(24)

filter(20)

createOrReplaceTempView(16)

count(11)

drop(11)

_schema(10)

join(6)

collect(6)

show(5)

groupBy(5)

withColumnRenamed(5)

coalesce(5)

where(4)

toPandas(4)

cache(3)

repartition(3)

limit(3)

alias(3)

selectExpr(3)

unpersist(2)

toDF(2)

fillna(2)

schema(2)

printSchema(2)

persist(2)

_h2o_frame(2)

head(2)

explain(2)

foreach(1)

sortWithinPartitions(1)

take(1)

orderBy(1)

toLocalIterator(1)

transform(1)

agg(1)

mapInPandas(1)

Esempio n. 1

Mostra file

File: aggregate_data.py Progetto: sugitaka64/machine_learning

    def __calc_distribution(
        self,
        df: DataFrame
    ) -> dict:
        """calculate distribution."""
        d = {}
        score_range = [
            0.00, 0.05, 0.10, 0.15, 0.20,
            0.25, 0.30, 0.35, 0.40, 0.45,
            0.50, 0.55, 0.60,
        ]
        for score in score_range:
            lower = '%.2f' % (score)
            if lower == '0.60':
                upper = 1.00
                index = str(lower) + ' - 1.00'
                d[index] = df.where(
                    (df['predicted_score'] >= lower) & (df['predicted_score'] <= upper)
                ).count()
            else:
                upper = '%.2f' % (score + 0.05)
                index = str(lower) + ' - ' + str(upper)
                d[index] = df.where(
                    (df['predicted_score'] >= lower) & (df['predicted_score'] < upper)
                ).count()

        return d

Esempio n. 2

Mostra file

File: word_embedding_service.py Progetto: werit/galytix_assignment

    def embed_vector_to_not_matched_words(self, df: DataFrame,
                                          df_vector_filler: DataFrame):
        not_matched_df = df.where(col('word_vector').isNull()).select(
            self.sentence_col_id, 'word')

        df3 = self.assign_alternative_match_word_based_on_lavenshtein(
            not_matched_df, df_vector_filler)

        return df3.alias('base').join(
            df_vector_filler.alias('filler'),
            df3.match == col('filler' + '.' + self.word_col_name),
            how='left').select(
                self.sentence_col_id,
                col('base' + '.' + 'word').alias('word'),
                col('filler' + '.' + 'word_vector').alias('word_vector'))

Esempio n. 3

Mostra file

File: spark_df_ops.py Progetto: IrisBXT/bds_data_science

def split(df: DataFrame, start: int or None, end: int or None) -> DataFrame:
    day_id_col = 'day_id'

    if not start and not end:
        return df
    else:
        cond1 = f.col(day_id_col) >= start
        cond2 = f.col(day_id_col) <= end

        if start and not end:
            cond = cond1
        elif not start and end:
            cond = cond2
        else:
            cond = cond1 & cond2

        return df.where(cond)

Esempio n. 4

Mostra file

    def getOnlyForm1MktEqOpt(inputDataFrame: DataFrame) -> DataFrame:

        outputDataFrame = inputDataFrame.where(pf.col('_c69') == 'FORM-1')

        return outputDataFrame