Python Annotation.dataType 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: sparknlp.annotation

클래스/타입: Annotation

메소드/함수: dataType

hotexamples.com에서의 예제들: 4

Python Annotation.dataType - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 sparknlp.annotation.Annotation.dataType에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

fromRow(6)

toRow(6)

dataType(4)

arrayType(3)

Annotation(1)

예제 #1

파일 보기

파일: functions.py 프로젝트: stjordanis/spark-nlp

def map_annotations_strict(f):
    """Creates a Spark UDF to map over an Annotator's results, for which the
    return type is explicitly defined as a `Annotation.dataType()`.

    Parameters
    ----------
    f : function
        The function to be applied over the results

    Returns
    -------
    :func:`pyspark.sql.functions.udf`
        Spark UserDefinedFunction (udf)

    Examples
    --------
    >>> from sparknlp.pretrained import PretrainedPipeline
    >>> explain_document_pipeline = PretrainedPipeline("explain_document_dl")
    >>> data = spark.createDataFrame([["U.N. official Ekeus heads for Baghdad."]]).toDF("text")
    >>> result = explain_document_pipeline.transform(data)
    >>> def nnp_tokens(annotations):
    ...     return list(
    ...         filter(lambda annotation: annotation.result == 'NNP', annotations)
    ...     )
    >>> result.select(
    ...     map_annotations_strict(nnp_tokens)('pos').alias("nnp")
    ... ).selectExpr("explode(nnp) as nnp").show(truncate=False)
    +-----------------------------------------+
    |nnp                                      |
    +-----------------------------------------+
    |[pos, 0, 2, NNP, [word -> U.N], []]      |
    |[pos, 14, 18, NNP, [word -> Epeus], []]  |
    |[pos, 30, 36, NNP, [word -> Baghdad], []]|
    +-----------------------------------------+
    """
    return udf(
        lambda content: [
            Annotation.toRow(a)
            for a in f([Annotation.fromRow(r) for r in content])
        ], ArrayType(Annotation.dataType()))

예제 #2

파일 보기

파일: functions.py 프로젝트: simonxing/spark-nlp

def map_annotations_strict(f):
    from sparknlp.annotation import Annotation
    sys.modules[
        'sparknlp.annotation'] = sparknlp  # Makes Annotation() pickle serializable in top-level
    return udf(lambda content: f(content), ArrayType(Annotation.dataType()))

예제 #3

파일 보기

파일: functions.py 프로젝트: rpatil524/spark-nlp

def map_annotations_strict(f):
    return udf(
        lambda content: [
            Annotation.toRow(a)
            for a in f([Annotation.fromRow(r) for r in content])
        ], ArrayType(Annotation.dataType()))

예제 #4

파일 보기

파일: functions.py 프로젝트: jeremi-nh/spark-nlp

def map_annotations_strict(f):
    return udf(
        lambda content: f(content),
        ArrayType(Annotation.dataType())
    )