Python AutoMapperHelpers.string_after_delimiter示例

编程语言: Python

命名空间/包名称: spark_auto_mapper.helpers.automapper_helpers

方法/功能: string_after_delimiter

hotexamples.com的示例: 2

Python AutoMapperHelpers.string_after_delimiter - 已找到2个示例。这些是从开源项目中提取的最受好评的spark_auto_mapper.helpers.automapper_helpers.AutoMapperHelpers.string_after_delimiter现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

column(30)

complex(12)

number(12)

field(8)

date(6)

if_not_null(4)

expression(3)

map(3)

flatten(2)

transform(2)

struct(2)

string_after_delimiter(2)

split_by_delimiter(2)

regex_replace(2)

nested_array_filter(2)

amount(2)

first_valid_column(2)

concat(2)

boolean(2)

datetime(2)

array(1)

right(1)

trim(1)

array_distinct(1)

text(1)

substring_by_delimiter(1)

if_(1)

string_before_delimiter(1)

coalesce(1)

if_not(1)

current(1)

if_not_null_or_empty(1)

regex_extract(1)

hash(1)

decimal(1)

filter(1)

lpad(1)

left(1)

join_using_delimiter(1)

if_regex(1)

unix_timestamp(1)

示例#1

显示文件

def test_auto_mapper_string_after_delimiter(spark_session: SparkSession) -> None:
    # Arrange
    spark_session.createDataFrame(
        [
            (1, "Qure/hi", "Imran", "1970-01-01"),
            (2, "Vidal", "Michael", "1970-02-02"),
        ],
        ["member_id", "last_name", "first_name", "date_of_birth"],
    ).createOrReplaceTempView("patients")

    source_df: DataFrame = spark_session.table("patients")

    df = source_df.select("member_id")
    df.createOrReplaceTempView("members")

    # Act
    mapper = AutoMapper(
        view="members", source_view="patients", keys=["member_id"]
    ).columns(my_column=A.string_after_delimiter(A.column("last_name"), "/"))

    assert isinstance(mapper, AutoMapper)
    sql_expressions: Dict[str, Column] = mapper.get_column_specs(source_df=source_df)
    for column_name, sql_expression in sql_expressions.items():
        print(f"{column_name}: {sql_expression}")

    assert_compare_expressions(
        sql_expressions["my_column"],
        substring_index(col("b.last_name"), "/", -1).alias("my_column"),
    )

    result_df: DataFrame = mapper.transform(df=df)

    # Assert
    result_df.printSchema()
    result_df.show()

    assert result_df.where("member_id == 1").select("my_column").collect()[0][0] == "hi"
    assert (
        result_df.where("member_id == 2").select("my_column").collect()[0][0] == "Vidal"
    )

示例#2

显示文件

文件： test_period.py 项目： imranq2/SparkAutoMapper.FHIR

def test_auto_mapper_hir_period_uses_date(spark_session: SparkSession) -> None:
    data_dir: Path = Path(__file__).parent.joinpath("./")

    temp_folder = data_dir.joinpath("./temp")
    if path.isdir(temp_folder):
        rmtree(temp_folder)

    encounter_test_folder: Path = data_dir.joinpath("test_files").joinpath(
        "encounter.json")

    minified_json_path: Path = create_jsonl_files(
        src_file=encounter_test_folder,
        dst_folder=temp_folder.joinpath("minified_period"),
        dst_file_name="1.json",
    )

    df = spark_session.read.json(str(minified_json_path))
    df.createOrReplaceTempView("encounters")

    mapper = AutoMapper(
        view="fhir_encounters",
        source_view="encounters",
        copy_all_unmapped_properties=True,
    ).complex(
        Encounter(
            use_date_for=["encounter.period.start", "encounter.period.end"],
            id_=FhirId(A.concat("pat", A.column("id"))),
            status=EncounterStatusCode(A.column("status")),
            class_=Coding(
                system=A.column("class.system"),
                code=ActEncounterCode(A.column("class.code")),
                display=A.column("class.display"),
            ),
            subject=Reference(
                display=A.column("subject.display"),
                reference=FhirReference(
                    resource="Patient",
                    column=A.concat(
                        "pat",
                        A.string_after_delimiter(A.column("subject.reference"),
                                                 "/"),
                    ),
                ),
            ),
            period=Period(start=A.column("period.start"),
                          end=A.column("period.end")),
            participant=FhirList(
                A.column("participant").select(  # type: ignore
                    EncounterParticipant(
                        individual=Reference[Union[Practitioner]]
                        (  # type: ignore
                            display=A.field("individual.display"),
                            reference=FhirReference(
                                resource="Practitioner",
                                column=A.concat(
                                    "pat",
                                    A.string_after_delimiter(
                                        A.field("individual.reference"), "/"),
                                ),
                            ),
                        ),
                        type_=FhirList(
                            A.field("type").select(  # type: ignore
                                CodeableConcept(
                                    coding=FhirList(  # type: ignore
                                        A.field(
                                            "coding").select(  # type: ignore
                                                Coding(
                                                    system=A.field("system"),
                                                    code=ParticipantTypeCode(
                                                        A.field("code")),
                                                    display=A.field("display"),
                                                ))),
                                    text=A.field("text"),
                                ), )),
                        period=Period(start=A.field("period.start"), ),
                    ), ), ),
        ))

    assert isinstance(mapper, AutoMapper)
    result_df: DataFrame = mapper.transform(df=df)
    assert result_df
    fhir_encounters_df = df.sql_ctx.table("fhir_encounters")
    assert isinstance(
        fhir_encounters_df.select(
            fhir_encounters_df.period.start).collect()[0][0],
        datetime.date,
    )
    assert isinstance(
        fhir_encounters_df.select(
            fhir_encounters_df.period.end).collect()[0][0],
        datetime.date,
    )