Python cublasCgemmBatched 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: skcuda.cublas

메소드/함수: cublasCgemmBatched

hotexamples.com에서의 예제들: 2

Python cublasCgemmBatched - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 skcuda.cublas.cublasCgemmBatched에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: test_cublas.py 프로젝트: lvaleriu/scikit-cuda

    def test_cublasCgemmBatched(self):
        l, m, k, n = 11, 7, 5, 3
        A = (np.random.rand(l, m, k)+1j*np.random.rand(l, m, k)).astype(np.complex64)
        B = (np.random.rand(l, k, n)+1j*np.random.rand(l, k, n)).astype(np.complex64)

        C_res = np.einsum('nij,njk->nik', A, B)

        a_gpu = gpuarray.to_gpu(A)
        b_gpu = gpuarray.to_gpu(B)
        c_gpu = gpuarray.empty((l, m, n), np.complex64)

        alpha = np.complex64(1.0)
        beta = np.complex64(0.0)

        a_arr = bptrs(a_gpu)
        b_arr = bptrs(b_gpu)
        c_arr = bptrs(c_gpu)

        cublas.cublasCgemmBatched(self.cublas_handle, 'n','n',
                                  n, m, k, alpha,
                                  b_arr.gpudata, n,
                                  a_arr.gpudata, k,
                                  beta, c_arr.gpudata, n, l)

        assert np.allclose(C_res, c_gpu.get())

예제 #2

파일 보기

파일: utils.py 프로젝트: eugenium/pyscatlight

def cgemm(A,  B, transa=False, transb=False, alpha=1,beta=1):
    """This function uses the C-wrapper to use cuBLAS.
        """
    CUBLAS_OP_N = cublas._CUBLAS_OP['n']
    CUBLAS_OP_T = cublas._CUBLAS_OP['t']

    m, n, k = A.size(1),B.size(2),A.size(2)
    batchCount = A.size(0)

    C = A.new(batchCount,m,n)

    lda = m
    ldb = k
    ldc = m


    trans_a_ptr = CUBLAS_OP_N if not transa else CUBLAS_OP_T
    trans_b_ptr = CUBLAS_OP_N if not transb else CUBLAS_OP_T

    alpha_tensor = torch.cuda.tensor([1]).fill_(alpha)
    beta_tensor = torch.cuda.tensor([1]).fill_(beta)

    handle = torch.cuda.current_blas_handle()
    stream = torch.cuda.current_stream()._as_parameter_
    cublas.cublasSetStream(handle, stream)
    cublas.cublasCgemmBatched(handle, trans_a_ptr, trans_b_ptr, m, n, k, alpha_tensor.data_ptr(), A.data_ptr(), lda, B.data_ptr(),ldb, beta_tensor.data_ptr(), C.data_ptr(), ldc, batchCount)
    return C