Ejemplos de SparseVector.toArray en Python

Lenguaje de programación: Python

Namespace/Package Name: pyspark.ml.linalg

Clase / Tipo: SparseVector

Método / Función: toArray

Ejemplos en hotexamples.com: 2

Python SparseVector.toArray - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de pyspark.ml.linalg.SparseVector.toArray extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

SparseVector(14)

dot(2)

toArray(2)

numNonzeros(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: similarity.py Proyecto: riomat13/hadoop_playground

def jaccard_score(rates1: SparseVector, rates2: SparseVector) -> Decimal:
    """Compute Jaccard similarity coefficient
        (https://en.wikipedia.org/wiki/Jaccard_index)

    This is comparing rates by each users.

    This will consider the rate value as well s.t. even if bothe are rated,
    it is not regarded as the same if the rate values are not the same.
    """
    r1 = rates1.toArray()
    r2 = rates2.toArray()
    union = int(sum((r1 == r2) * (r1 > 0)))
    intersection = int(sum((r1 + r2) > 0))
    return Decimal(union) / intersection

Ejemplo n.º 2

Mostrar archivo

Archivo: similarity.py Proyecto: riomat13/hadoop_playground

def jaccard_score_binary(rates1: SparseVector,
                         rates2: SparseVector) -> Decimal:
    """Compute Jaccard similarity coefficient
        (https://en.wikipedia.org/wiki/Jaccard_index)

    This is comparing rates by each users.

    This will ignore the actual rate, and this assumes people who watch
    the same movies have similar preference, therefore those
    movies are similar.
    """
    # is there efficient way to handle sparse vector?
    r1 = rates1.toArray()
    r2 = rates2.toArray()
    union = int(sum(((r1 > 0) == (r2 > 0)) * (r1 > 0)))
    intersection = int(sum((r1 + r2) > 0))
    return Decimal(union) / intersection