Python AnalyzerContext.successMetricsAsJson 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pydeequ3.analyzers

클래스/타입: AnalyzerContext

메소드/함수: successMetricsAsJson

hotexamples.com에서의 예제들: 5

Python AnalyzerContext.successMetricsAsJson - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pydeequ3.analyzers.AnalyzerContext.successMetricsAsJson에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

successMetricsAsDataFrame(7)

successMetricsAsJson(5)

예제 #1

0

파일 보기

파일: test_analyzers.py 프로젝트: siddhant-deepsource/pydeequ3

 def Correlation(self, column1, column2, where=None):
     result = self.AnalysisRunner.onData(self.df).addAnalyzer(
         Correlation(column1, column2, where)).run()
     result_df = AnalyzerContext.successMetricsAsDataFrame(
         self.spark, result)
     AnalyzerContext.successMetricsAsJson(self.spark, result)
     return result_df.select("value").collect()

예제 #2

0

파일 보기

파일: test_analyzers.py 프로젝트: siddhant-deepsource/pydeequ3

 def Completeness(self, column, where=None):
     result = self.AnalysisRunner.onData(self.df).addAnalyzer(
         Completeness(column, where)).run()
     result_df = AnalyzerContext.successMetricsAsDataFrame(
         self.spark, result)
     result_json = AnalyzerContext.successMetricsAsJson(self.spark, result)
     df_from_json = self.spark.read.json(self.sc.parallelize([result_json]))
     self.assertEqual(
         df_from_json.select("value").collect(),
         result_df.select("value").collect())
     return result_df.select("value").collect()

예제 #3

0

파일 보기

파일: test_analyzers.py 프로젝트: siddhant-deepsource/pydeequ3

 def test_PatternMatch(self):
     result = (self.AnalysisRunner.onData(self.df).addAnalyzer(
         PatternMatch(column="a", pattern_regex="ba(r|z)")).run())
     result_df = AnalyzerContext.successMetricsAsDataFrame(
         self.spark, result)
     result_json = AnalyzerContext.successMetricsAsJson(self.spark, result)
     df_from_json = self.spark.read.json(self.sc.parallelize([result_json]))
     self.assertEqual(
         df_from_json.select("value").collect(),
         result_df.select("value").collect())
     self.assertEqual(result_df.select("value").collect(), [Row(value=0.0)])

예제 #4

0

파일 보기

파일: test_analyzers.py 프로젝트: siddhant-deepsource/pydeequ3

 def ApproxQuantile(self, column, quantile, where=None):
     relativeError: float = 0.01
     result = (self.AnalysisRunner.onData(self.df).addAnalyzer(
         ApproxQuantile(column, quantile, relativeError, where)).run())
     result_df = AnalyzerContext.successMetricsAsDataFrame(
         self.spark, result)
     result_json = AnalyzerContext.successMetricsAsJson(self.spark, result)
     df_from_json = self.spark.read.json(self.sc.parallelize([result_json]))
     self.assertEqual(
         df_from_json.select("value").collect(),
         result_df.select("value").collect())
     return result_df.select("value").collect()

예제 #5

0

파일 보기

파일: test_analyzers.py 프로젝트: siddhant-deepsource/pydeequ3

 def Histogram_maxBins(self,
                       column,
                       binningUdf=None,
                       maxDetailBins: int = None,
                       where: str = None):
     result = (self.AnalysisRunner.onData(self.df).addAnalyzer(
         Histogram(column, binningUdf, maxDetailBins, where)).run())
     result_df = AnalyzerContext.successMetricsAsDataFrame(
         self.spark, result)
     result_json = AnalyzerContext.successMetricsAsJson(self.spark, result)
     df_from_json = self.spark.read.json(self.sc.parallelize([result_json]))
     self.assertEqual(
         df_from_json.select("value").collect(),
         result_df.select("value").collect())
     return result_df.select("value").collect()