Python SparseUtils.generateSparseLowRank 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: sandbox.util.SparseUtils

클래스/타입: SparseUtils

메소드/함수: generateSparseLowRank

hotexamples.com에서의 예제들: 19

Python SparseUtils.generateSparseLowRank - 19개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 sandbox.util.SparseUtils.SparseUtils.generateSparseLowRank에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

generateSparseBinaryMatrix(30)

getOmegaListPtr(23)

generateSparseLowRank(9)

getOmegaList(7)

pruneMatrixRowAndCols(6)

svdPropack(5)

submatrix(5)

centerRows(3)

svdArpack(3)

generateLowRank(3)

norm(3)

sparseMatrix(2)

resize(2)

centerCols(2)

nonzeroRowColsProbs(2)

pruneMatrixCols(1)

pruneMatrix(1)

pruneMatrixRows(1)

reconstructLowRank(1)

selectMatrix(1)

hellingerDistances(1)

splitNnz(1)

standardise(1)

generateSparseLowRank2(1)

equals(1)

diag(1)

svdSoft(1)

svdSparseLowRank(1)

uncenter(1)

uncenterRows(1)

예제 #1

파일 보기

파일: SparseUtilsTest.py 프로젝트: rezaarmand/sandbox

    def testCentreCols(self):
        shape = (50, 10)
        r = 5
        k = 100

        X, U, s, V = SparseUtils.generateSparseLowRank(shape,
                                                       r,
                                                       k,
                                                       verbose=True)
        rowInds, colInds = X.nonzero()

        mu2 = numpy.array(X.sum(0)).ravel()
        numNnz = numpy.zeros(X.shape[1])

        for i in range(X.shape[0]):
            for j in range(X.shape[1]):
                if X[i, j] != 0:
                    numNnz[j] += 1

        mu2 /= numNnz
        mu2[numNnz == 0] = 0

        X, mu = SparseUtils.centerCols(X)
        nptst.assert_array_almost_equal(
            numpy.array(X.mean(0)).ravel(), numpy.zeros(X.shape[1]))
        nptst.assert_array_almost_equal(mu, mu2)

예제 #2

파일 보기

파일: SparseUtilsTest.py 프로젝트: charanpald/sandbox

    def testCentreRows(self): 
        shape = (50, 10)
        r = 5 
        k = 100 

        X, U, s, V = SparseUtils.generateSparseLowRank(shape, r, k, verbose=True)   
        rowInds, colInds = X.nonzero()
        
        for i in range(rowInds.shape[0]): 
            self.assertEquals(X[rowInds[i], colInds[i]], numpy.array(X[X.nonzero()]).ravel()[i])
        
        mu2 = numpy.array(X.sum(1)).ravel()
        numNnz = numpy.zeros(X.shape[0])
        
        for i in range(X.shape[0]): 
            for j in range(X.shape[1]):     
                if X[i,j]!=0:                 
                    numNnz[i] += 1
                    
        mu2 /= numNnz 
        mu2[numNnz==0] = 0
        
        X, mu = SparseUtils.centerRows(X)      
        nptst.assert_array_almost_equal(numpy.array(X.mean(1)).ravel(), numpy.zeros(X.shape[0]))
        nptst.assert_array_almost_equal(mu, mu2)

예제 #3

파일 보기

파일: SparseUtilsTest.py 프로젝트: charanpald/sandbox

    def testUncentre(self): 
        shape = (50, 10)
        r = 5 
        k = 100 

        X, U, s, V = SparseUtils.generateSparseLowRank(shape, r, k, verbose=True)   
        rowInds, colInds = X.nonzero()  
        
        Y = X.copy()

        inds = X.nonzero()
        X, mu1 = SparseUtils.centerRows(X)
        X, mu2 = SparseUtils.centerCols(X, inds=inds)   
        
        cX = X.copy()
        
        Y2 = SparseUtils.uncenter(X, mu1, mu2)
        
        nptst.assert_array_almost_equal(Y.todense(), Y2.todense(), 3)
        
        #We try softImpute on a centered matrix and check if the results are the same 
        lmbdas = numpy.array([0.1])
        softImpute = SoftImpute(lmbdas)
        
        Z = softImpute.learnModel(cX, fullMatrices=False)
        Z = softImpute.predict([Z], cX.nonzero())[0]
        
        error1 = MCEvaluator.rootMeanSqError(cX, Z)
        
        X = SparseUtils.uncenter(cX, mu1, mu2)
        Z2 = SparseUtils.uncenter(Z, mu1, mu2)
        
        error2 = MCEvaluator.rootMeanSqError(X, Z2)
        
        self.assertAlmostEquals(error1, error2)

예제 #4

파일 보기

파일: CenterMatrixIteratorTest.py 프로젝트: charanpald/wallhack

 def setUp(self): 
     numpy.set_printoptions(suppress=True, precision=3, linewidth=150)
     numpy.random.seed(21)
     shape = (20, 10)
     r = 5 
     k = 100         
     
     #Create an iterator 
     matrixList = [] 
     matrixList.append(SparseUtils.generateSparseLowRank(shape, r, k))
     matrixList.append(SparseUtils.generateSparseLowRank(shape, r, k))
     matrixList.append(SparseUtils.generateSparseLowRank(shape, r, k))
     
     self.matrixList = matrixList
     self.testMatrixList = []
     
     for X in matrixList: 
         self.testMatrixList.append(X.copy())

예제 #5

파일 보기

파일: SparseUtilsProfile.py 프로젝트: kentwang/sandbox

    def profileSubmatrix(self):
        shape = (100000, 15000)
        r = 50
        k = 5000000

        X = SparseUtils.generateSparseLowRank(shape, r, k)
        print(X.nnz, type(X))

        inds = numpy.random.permutation(X.nnz)[0:1000000]

        ProfileUtils.profile("SparseUtils.submatrix(X, inds)", globals(), locals())

예제 #6

파일 보기

파일: SparseUtilsProfile.py 프로젝트: kentwang/sandbox

    def profileGetOmegaList(self):
        shape = (20000, 15000)
        r = 50
        k = 1000000

        X = SparseUtils.generateSparseLowRank(shape, r, k)
        import sppy

        X = sppy.csarray(X)

        ProfileUtils.profile("SparseUtils.getOmegaList(X)", globals(), locals())

예제 #7

파일 보기

    def profileGetOmegaList(self):
        shape = (20000, 15000)
        r = 50
        k = 1000000

        X = SparseUtils.generateSparseLowRank(shape, r, k)
        import sppy
        X = sppy.csarray(X)

        ProfileUtils.profile('SparseUtils.getOmegaList(X)', globals(),
                             locals())

예제 #8

파일 보기

파일: SoftImputeProfile.py 프로젝트: kentwang/sandbox

    def __init__(self):
        numpy.random.seed(21)

        # Create a low rank matrix
        n = 100000
        m = 100000
        self.r = 50
        k = 5 * 10 ** 6
        # k = 10**5

        self.X = SparseUtils.generateSparseLowRank((n, m), self.r, k)
        print(self.X.nnz)

예제 #9

파일 보기

    def profileSubmatrix(self):
        shape = (100000, 15000)
        r = 50
        k = 5000000

        X = SparseUtils.generateSparseLowRank(shape, r, k)
        print(X.nnz, type(X))

        inds = numpy.random.permutation(X.nnz)[0:1000000]

        ProfileUtils.profile('SparseUtils.submatrix(X, inds)', globals(),
                             locals())

예제 #10

파일 보기

    def __init__(self):
        numpy.random.seed(21)

        #Create a low rank matrix
        n = 100000
        m = 100000
        self.r = 50
        k = 5 * 10**6
        #k = 10**5

        self.X = SparseUtils.generateSparseLowRank((n, m), self.r, k)
        print(self.X.nnz)

예제 #11

파일 보기

파일: SparseUtilsTest.py 프로젝트: charanpald/sandbox

    def testGenerateSparseLowRank(self): 
        shape = (5000, 1000)
        r = 5 
        k = 10 

        X, U, s, V = SparseUtils.generateSparseLowRank(shape, r, k, verbose=True)         
        
        self.assertEquals(U.shape, (shape[0],r))
        self.assertEquals(V.shape, (shape[1], r))
        self.assertTrue(X.nnz <= k)
        
        Y = (U*s).dot(V.T)
        inds = X.nonzero()
        
        for i in range(inds[0].shape[0]):
            self.assertAlmostEquals(X[inds[0][i], inds[1][i]], Y[inds[0][i], inds[1][i]])

예제 #12

파일 보기

파일: MCEvaluatorProfile.py 프로젝트: charanpald/sandbox

 def profilePrecisionAtK(self):
     m = 1000 
     n = 500000 
     r = 30 
     k = m*100
     
     X, U, s, V = SparseUtils.generateSparseLowRank((m,n), r, k, verbose=True)
     mean = X.data.mean()
     X.data[X.data <= mean] = 0
     X.data[X.data > mean] = 1
     
     import sppy 
     X = sppy.csarray(X)
     
     
     ProfileUtils.profile("MCEvaluator.precisionAtK(X, U, V, 10)", globals(), locals())

예제 #13

파일 보기

파일: SparseUtilsTest.py 프로젝트: charanpald/sandbox

    def testSvdArpack(self): 
        shape = (500, 100)
        r = 5 
        k = 1000 

        X, U, s, V = SparseUtils.generateSparseLowRank(shape, r, k, verbose=True)                
        
        k2 = 10 
        U, s, V = SparseUtils.svdArpack(X, k2)

        U2, s2, V2 = numpy.linalg.svd(X.todense())
        V2 = V2.T

        nptst.assert_array_almost_equal(s, s2[0:k2])
        nptst.assert_array_almost_equal(numpy.abs(U), numpy.abs(U2[:, 0:k2]), 3)
        nptst.assert_array_almost_equal(numpy.abs(V), numpy.abs(V2[:, 0:k2]), 3)

예제 #14

파일 보기

    def profilePrecisionAtK(self):
        m = 1000
        n = 500000
        r = 30
        k = m * 100

        X, U, s, V = SparseUtils.generateSparseLowRank((m, n),
                                                       r,
                                                       k,
                                                       verbose=True)
        mean = X.data.mean()
        X.data[X.data <= mean] = 0
        X.data[X.data > mean] = 1

        import sppy
        X = sppy.csarray(X)

        ProfileUtils.profile("MCEvaluator.precisionAtK(X, U, V, 10)",
                             globals(), locals())

예제 #15

파일 보기

파일: SparseUtilsTest.py 프로젝트: rezaarmand/sandbox

    def testGenerateSparseLowRank(self):
        shape = (5000, 1000)
        r = 5
        k = 10

        X, U, s, V = SparseUtils.generateSparseLowRank(shape,
                                                       r,
                                                       k,
                                                       verbose=True)

        self.assertEquals(U.shape, (shape[0], r))
        self.assertEquals(V.shape, (shape[1], r))
        self.assertTrue(X.nnz <= k)

        Y = (U * s).dot(V.T)
        inds = X.nonzero()

        for i in range(inds[0].shape[0]):
            self.assertAlmostEquals(X[inds[0][i], inds[1][i]], Y[inds[0][i],
                                                                 inds[1][i]])

예제 #16

파일 보기

파일: SparseUtilsTest.py 프로젝트: charanpald/sandbox

    def testCentreRows2(self): 
        shape = (50, 10)
        r = 5 
        k = 100 
        
        #Test if centering rows changes the RMSE
        X, U, s, V = SparseUtils.generateSparseLowRank(shape, r, k, verbose=True)   
 
        Y = X.copy() 
        Y.data = numpy.random.rand(X.nnz)
        
        error = ((X.data - Y.data)**2).sum()
        
        X, mu = SparseUtils.centerRows(X)
        Y, mu = SparseUtils.centerRows(Y, mu)
        
        error2 = ((X.data - Y.data)**2).sum()
        self.assertAlmostEquals(error, error2)
        
        error3 = numpy.linalg.norm(X.todense()- Y.todense())**2
        self.assertAlmostEquals(error2, error3)

예제 #17

파일 보기

파일: SparseUtilsTest.py 프로젝트: rezaarmand/sandbox

    def testSvdArpack(self):
        shape = (500, 100)
        r = 5
        k = 1000

        X, U, s, V = SparseUtils.generateSparseLowRank(shape,
                                                       r,
                                                       k,
                                                       verbose=True)

        k2 = 10
        U, s, V = SparseUtils.svdArpack(X, k2)

        U2, s2, V2 = numpy.linalg.svd(X.todense())
        V2 = V2.T

        nptst.assert_array_almost_equal(s, s2[0:k2])
        nptst.assert_array_almost_equal(numpy.abs(U), numpy.abs(U2[:, 0:k2]),
                                        3)
        nptst.assert_array_almost_equal(numpy.abs(V), numpy.abs(V2[:, 0:k2]),
                                        3)

예제 #18

파일 보기

파일: SparseUtilsTest.py 프로젝트: rezaarmand/sandbox

    def testUncentre(self):
        shape = (50, 10)
        r = 5
        k = 100

        X, U, s, V = SparseUtils.generateSparseLowRank(shape,
                                                       r,
                                                       k,
                                                       verbose=True)
        rowInds, colInds = X.nonzero()

        Y = X.copy()

        inds = X.nonzero()
        X, mu1 = SparseUtils.centerRows(X)
        X, mu2 = SparseUtils.centerCols(X, inds=inds)

        cX = X.copy()

        Y2 = SparseUtils.uncenter(X, mu1, mu2)

        nptst.assert_array_almost_equal(Y.todense(), Y2.todense(), 3)

        #We try softImpute on a centered matrix and check if the results are the same
        lmbdas = numpy.array([0.1])
        softImpute = SoftImpute(lmbdas)

        Z = softImpute.learnModel(cX, fullMatrices=False)
        Z = softImpute.predict([Z], cX.nonzero())[0]

        error1 = MCEvaluator.rootMeanSqError(cX, Z)

        X = SparseUtils.uncenter(cX, mu1, mu2)
        Z2 = SparseUtils.uncenter(Z, mu1, mu2)

        error2 = MCEvaluator.rootMeanSqError(X, Z2)

        self.assertAlmostEquals(error1, error2)

예제 #19

파일 보기

파일: SparseUtilsTest.py 프로젝트: rezaarmand/sandbox

    def testCentreRows2(self):
        shape = (50, 10)
        r = 5
        k = 100

        #Test if centering rows changes the RMSE
        X, U, s, V = SparseUtils.generateSparseLowRank(shape,
                                                       r,
                                                       k,
                                                       verbose=True)

        Y = X.copy()
        Y.data = numpy.random.rand(X.nnz)

        error = ((X.data - Y.data)**2).sum()

        X, mu = SparseUtils.centerRows(X)
        Y, mu = SparseUtils.centerRows(Y, mu)

        error2 = ((X.data - Y.data)**2).sum()
        self.assertAlmostEquals(error, error2)

        error3 = numpy.linalg.norm(X.todense() - Y.todense())**2
        self.assertAlmostEquals(error2, error3)