Python setup_pyspark 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: tests.conftest

메소드/함수: setup_pyspark

hotexamples.com에서의 예제들: 7

Python setup_pyspark - 7개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 tests.conftest.setup_pyspark에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def setUpClass(cls):
     cls.spark = setup_pyspark().appName(
         "test-profiles-local").getOrCreate()
     cls.sc = cls.spark.sparkContext
     cls.df = cls.sc.parallelize([
         Row(a="foo", b=1, c=5),
         Row(a="bar", b=2, c=6),
         Row(a="baz", b=3, c=None)
     ]).toDF()

예제 #2

파일 보기

파일: test_anomaly_detection.py 프로젝트: siddhant-deepsource/pydeequ3

    def setUpClass(cls):
        cls.spark = setup_pyspark().appName(
            "test-anomalydetection-local").getOrCreate()
        cls.sc = cls.spark.sparkContext

        cls.df_1 = cls.sc.parallelize([
            Row(
                a=3,
                b=0,
                c="colder",
            ),
            Row(
                a=3,
                b=5,
                c="bolder",
            ),
        ]).toDF()

        cls.df_2 = cls.sc.parallelize([
            Row(
                a=3,
                b=0,
                c="foo",
            ),
            Row(
                a=3,
                b=5,
                c="zoo",
            ),
            Row(
                a=100,
                b=5,
                c="who",
            ),
            Row(
                a=2,
                b=30,
                c="email",
            ),
            Row(
                a=10,
                b=5,
                c="cards",
            ),
        ]).toDF()

        cls.df_3 = cls.sc.parallelize([Row(
            a=1,
            b=23,
            c="pool",
        )]).toDF()

        cls.df_4 = cls.sc.parallelize([Row(
            a=1,
            b=23,
            c="pool",
        )]).toDF()

예제 #3

파일 보기

파일: test_analyzers.py 프로젝트: sourcery-ai-bot/pydeequ3

 def setUpClass(cls):
     cls.spark = setup_pyspark().appName("test-analyzers-local").getOrCreate()
     # cls.AnalysisRunner = AnalysisRunner(cls.spark)
     cls.pydeequ_session = PyDeequSession(cls.spark)
     cls.AnalysisRunner = cls.pydeequ_session.createAnalysisRunner()
     cls.sc = cls.spark.sparkContext
     cls.df = cls.sc.parallelize(
         [Row(a="foo", b=1, c=5, d=1), Row(a="bar", b=2, c=6, d=3), Row(a="baz", b=3, c=None, d=1)]
     ).toDF()

예제 #4

파일 보기

 def setUpClass(cls):
     cls.spark = setup_pyspark().appName(
         "test-analyzers-local").getOrCreate()
     cls.ConstraintSuggestionRunner = ConstraintSuggestionRunner(cls.spark)
     cls.sc = cls.spark.sparkContext
     cls.df = cls.sc.parallelize([
         Row(a="foo", b=1, c=5),
         Row(a="bar", b=2, c=6),
         Row(a="baz", b=3, c=None)
     ]).toDF()

예제 #5

파일 보기

 def setUpClass(cls):
     cls.spark = setup_pyspark().appName(
         "test-analyzers-local").getOrCreate()
     cls.AnalysisRunner = AnalysisRunner(cls.spark)
     cls.VerificationSuite = VerificationSuite(cls.spark)
     cls.sc = cls.spark.sparkContext
     cls.df = cls.sc.parallelize([
         Row(a="foo", b=1, c=5),
         Row(a="bar", b=2, c=6),
         Row(a="baz", b=3, c=None)
     ]).toDF()

예제 #6

파일 보기

파일: test_pandas_utils.py 프로젝트: awslabs/python-deequ

 def setUpClass(cls):
     cls.spark = setup_pyspark().appName("test-analyzers-local").getOrCreate()
     cls.pydeequ_session = PyDeequSession(cls.spark)
     cls.AnalysisRunner = cls.pydeequ_session.createAnalysisRunner()
     cls.ColumnProfilerRunner = ColumnProfilerRunner(cls.spark)
     cls.ConstraintSuggestionRunner = ConstraintSuggestionRunner(cls.spark)
     cls.sc = cls.spark.sparkContext
     data = [("foo", 1, True, 1.0, float("nan")), ("bar", 2, False, 2.0, float("nan"))]
     cls.pyspark_df = cls.spark.createDataFrame(data, schema=["strings", "ints", "bools", "floats", "nans"])
     cls.pandas_df = pandasDF(
         {
             "strings": ["foo", "bar"],
             "ints": [1, 2],
             "bools": [True, False],
             "floats": [1.0, 2.0],
             "nans": [np.nan, np.nan],
         }
     )

예제 #7

파일 보기

 def setUpClass(cls):
     cls.spark = setup_pyspark().appName(
         "test-scala-utils-local").getOrCreate()
     cls.sc = cls.spark.sparkContext