Python CUDA_Kernels Beispiele

Programmiersprache: Python

Namespace / Paketname: kernels

Klasse / Typ: CUDA_Kernels

Beispiele auf hotexamples.com: 6

Python CUDA_Kernels - 6 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die kernels.CUDA_Kernels, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

get_function(3)

get_functions(1)

Beispiel #1

Datei anzeigen

Datei: cuda_functions.py Projekt: brodyh/dpmix

def gpu_sweep_col_mult(X, y):
    """ X * y = X across the columns """
    if type(X)==GPUArray:
        gX = X
    else:
        gX = to_gpu(np.asarray(X, dtype=np.float32))

    if type(y)==GPUArray:
        gy = y
    else:
        gy = to_gpu(np.asarray(y, dtype=np.float32))

    dims = np.asarray(X.shape, dtype=np.int32)
    if devinfo.max_block_threads >= 1024:
        blocksize = 32
    else:
        blocksize = 16

    gridsize = int(dims[0] / blocksize) + 1
    shared = 4*blocksize

    if gX.flags.c_contiguous:
        func = CUDA_Kernels.get_function("sweep_columns_mult")
    else:
        func = CUDA_Kernels.get_function("sweep_columns_mult_cm")

    func(gX, gy, dims[0], dims[1], block=(blocksize, blocksize,1),
         grid = (gridsize,1), shared = shared)

    if type(y)!=GPUArray:
        X = gX.get()

Beispiel #2

Datei anzeigen

Datei: cuda_functions.py Projekt: brodyh/dpmix

def gpu_apply_row_max(X):
    """ 
    max(X) = y across the rows 

    returns the gpuarray, y
    """
    if type(X)==GPUArray:
        gX = X
    else:
        gX = to_gpu(np.asarray(X, dtype=np.float32))

    dims = np.asarray(X.shape, dtype=np.int32)

    gy = to_gpu(np.zeros(dims[0], dtype=np.float32))
    giy = to_gpu(np.zeros(dims[0], dtype=np.int32))

    if devinfo.max_block_threads >= 1024:
        blocksize = 32
    else:
        blocksize = 16

    gridsize = int(dims[0] / blocksize) + 1

    if gX.flags.c_contiguous:
        func = CUDA_Kernels.get_function("apply_rows_max")
        shared = 4*blocksize*(blocksize+2) # pad for bank conflicts
    else:
        func = CUDA_Kernels.get_function("apply_rows_max_cm")
        shared = 4*blocksize*(blocksize+1)

    func(gX, gy, giy, dims[0], dims[1], block=(blocksize, blocksize,1),
         grid = (gridsize,1), shared = shared)

    return gy, giy

Beispiel #3

Datei anzeigen

Datei: cuda_functions.py Projekt: brodyh/dpmix

def gpu_sweep_row_div(X, y):
    """ X / y = X down the rows """
    if type(X)==GPUArray:
        gX = X
    else:
        gX = to_gpu(np.asarray(X, dtype=np.float32))

    if type(y)==GPUArray:
        gy = y
    else:
        gy = to_gpu(np.asarray(y, dtype=np.float32))

    dims = np.asarray(X.shape, dtype=np.int32)
    if devinfo.max_block_threads >= 1024:
        blocksize = 32
    else:
        blocksize = 16

    gridsize = int(dims[0] / blocksize) + 1
    shared = int(4*dims[1])

    if gX.flags.c_contiguous:
        func = CUDA_Kernels.get_function("sweep_rows_div")
    else:
        func = CUDA_Kernels.get_functions("sweep_rows_div_cm")

    func(gX, gy, dims[0], dims[1], block=(blocksize, blocksize,1),
         grid = (gridsize,1), shared = shared)

    if type(y)!=GPUArray:
        X = gX.get()

Beispiel #4

Datei anzeigen

Datei: cuda_functions.py Projekt: jethrotan/dpmix

def gpu_sweep_row_diff(X, y):
    """ X - y = X down the rows """
    if type(X) == GPUArray:
        gX = X
    else:
        gX = to_gpu(np.asarray(X, dtype=np.float32))

    if type(y) == GPUArray:
        gy = y
    else:
        gy = to_gpu(np.asarray(y, dtype=np.float32))

    dims = np.asarray(X.shape, dtype=np.int32)
    if devinfo.max_block_threads >= 1024:
        blocksize = 32
    else:
        blocksize = 16

    gridsize = int(dims[0] / blocksize) + 1
    shared = int(4 * dims[1])

    if gX.flags.c_contiguous:
        func = CUDA_Kernels.get_function("sweep_rows_diff")
    else:
        func = CUDA_Kernels.get_function("sweep_rows_diff_cm")
    func(gX,
         gy,
         dims[0],
         dims[1],
         block=(blocksize, blocksize, 1),
         grid=(gridsize, 1),
         shared=shared)

    if type(y) != GPUArray:
        X = gX.get()

Beispiel #5

Datei anzeigen

def gpu_sweep_col_mult(X, y):
    """ X * y = X across the columns """
    if type(X) == GPUArray:
        gX = X
    else:
        gX = to_gpu(np.asarray(X, dtype=np.float32))

    if type(y) == GPUArray:
        gy = y
    else:
        gy = to_gpu(np.asarray(y, dtype=np.float32))

    dims = np.asarray(X.shape, dtype=np.int32)
    if devinfo.max_block_threads >= 1024:
        blocksize = 32
    else:
        blocksize = 16

    gridsize = int(dims[0] / blocksize) + 1
    shared = 4*blocksize

    if gX.flags.c_contiguous:
        func = CUDA_Kernels.get_function("sweep_columns_mult")
    else:
        func = CUDA_Kernels.get_function("sweep_columns_mult_cm")

    func(gX, gy, dims[0], dims[1], block=(blocksize, blocksize, 1),
         grid = (gridsize, 1), shared = shared)

    if type(y) != GPUArray:
        X = gX.get()

Beispiel #6

Datei anzeigen

def gpu_apply_row_max(X):
    """ 
    max(X) = y across the rows 

    returns the gpuarray, y
    """
    if type(X) == GPUArray:
        gX = X
    else:
        gX = to_gpu(np.asarray(X, dtype=np.float32))

    dims = np.asarray(X.shape, dtype=np.int32)

    gy = to_gpu(np.zeros(dims[0], dtype=np.float32))
    giy = to_gpu(np.zeros(dims[0], dtype=np.int32))

    if devinfo.max_block_threads >= 1024:
        blocksize = 32
    else:
        blocksize = 16

    gridsize = int(dims[0] / blocksize) + 1

    if gX.flags.c_contiguous:
        func = CUDA_Kernels.get_function("apply_rows_max")
        shared = 4*blocksize*(blocksize+2)  # pad for bank conflicts
    else:
        func = CUDA_Kernels.get_function("apply_rows_max_cm")
        shared = 4*blocksize*(blocksize+1)

    func(gX, gy, giy, dims[0], dims[1], block=(blocksize, blocksize, 1),
         grid = (gridsize, 1), shared = shared)

    return gy, giy