Python Size 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pydeequ.analyzers

메소드/함수: Size

hotexamples.com에서의 예제들: 4

Python Size - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pydeequ.analyzers.Size에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: metrics_repo.py 프로젝트: hariprasad-dcube/pydeequ

def main():
     # SparkSession startup
     spark = (SparkSession
               .builder
               .master('local[*]')
               .config('spark.jars.packages',
                       'com.amazon.deequ:deequ:1.0.5')
               .appName('suggestions-example')
               .getOrCreate())
     df = spark.createDataFrame(test_data)
     # Analysis run
     a = (AnalysisRunner(spark)
          .onData(df)
          .addAnalyzer(analyzers.Size())) \
          .run()
     key = ResultKey(spark, 100000, {'key1': 'value1'})
     myrepo = FileSystemMetricsRepository(spark, '../test.json')
     myrepo.save(key, a)

     # Verification run
     key2 = repo.ResultKey(spark, 100000, {'key1': 'value2', 'key2':'value3'})
     

     v = (base.VerificationSuite(spark)
              .onData(df)
              .addCheck(Check(spark, 'error', 'examples')
                        .hasSize(lambda x: x == 8)
                        .isUnique('_2'))
          .useRepository(myrepo)
          .saveOrAppendResult(key2)
          .run()
     )

     myrepo.load().withTagValues({'key1': 'value1'}).after(99000) \
          .getMetricsAsDF().show()

     # SparkSession and Java Gateway teardown
     spark.sparkContext._gateway.close()
     spark.stop()

예제 #2

파일 보기

파일: analyzer_example.py 프로젝트: hariprasad-dcube/pydeequ

def main():
    # SparkSession startup
    spark = (SparkSession.builder.master('local[*]').config(
        'spark.jars.packages', 'com.amazon.deequ:deequ:1.0.5').appName(
            'profiler-example').getOrCreate())
    df = spark.createDataFrame(test_data)

    r = AnalysisRunner(spark) \
     .onData(df) \
        .addAnalyzer(analyzers.Size()) \
        .addAnalyzer(analyzers.Completeness('_3')) \
     .addAnalyzer(analyzers.ApproxCountDistinct('_1')) \
        .addAnalyzer(analyzers.Mean('_2')) \
        .addAnalyzer(analyzers.Compliance('top values', '_2 > 15')) \
        .addAnalyzer(analyzers.Correlation('_2', '_5')) \
     .run()

    df = DataFrame(r, spark)
    df.show(df.count(), False)

    # SparkSession and Java Gateway teardown
    spark.sparkContext._gateway.close()
    spark.stop()

예제 #3

파일 보기

 def test_Size(self):
     out = self.runner.onData(self.df) \
         .addAnalyzer(analyzers.Size()) \
         .run().successMetricsAsDataFrame()
     out = out.select('value').collect()
     self.assertEqual(out, [Row(value=8)])

예제 #4

파일 보기

 def test_Size(self):
     out = self.runner.onData(self.df) \
         .addAnalyzer(analyzers.Size()) \
         .run()
     out = DataFrame(out, self.spark).select('value').collect()
     self.assertEqual(out, [Row(value=8)])