Python check_cuda_status 예제들, quagga.cuda.cudart.check_cuda_status Python 예제들

예제 #1

0

파일 보기

def sliced_rows_batch_scaled_add(stream, embd_rows_indxs, nrows, ncols, alpha,
                                 dense_matrices, embd_nrows, embd_ncols,
                                 embd_matrix):
    status = gpu_matrix_kernels._slicedRowsBatchScaledAdd(
        stream, embd_rows_indxs, nrows, ncols, alpha, dense_matrices,
        embd_nrows, embd_ncols, embd_matrix)
    cudart.check_cuda_status(status)

예제 #2

0

파일 보기

def add_scaled_columns_slice(stream, nrows, ncols, alpha, dense_matrix,
                             embedding_column_indxs, embedding_matrix):
    status = gpu_matrix_kernels._addScaledColumnsSlice(stream, nrows, ncols,
                                                       alpha, dense_matrix,
                                                       embedding_column_indxs,
                                                       embedding_matrix)
    cudart.check_cuda_status(status)

예제 #3

0

파일 보기

def batch_horizontal_split(stream, n, nrows, x_ncols, y_ncols, matrices,
                           x_matrices, y_matrices):
    status = gpu_matrix_kernels._batchHorizontalSplit(stream, n, nrows,
                                                      x_ncols, y_ncols,
                                                      matrices, x_matrices,
                                                      y_matrices)
    cudart.check_cuda_status(status)

예제 #4

0

파일 보기

def softmax_ce_derivative(stream, batchSize, num_classes, probs,
                          target_classes, derivatives):
    status = gpu_matrix_kernels._softmaxCeDerivative(stream, batchSize,
                                                     num_classes, probs,
                                                     target_classes,
                                                     derivatives)
    cudart.check_cuda_status(status)

예제 #5

0

파일 보기

def slice_rows_int(stream, embedding_matrix_nrows, embedding_row_indxs,
                   embedding_matrix, nrows, ncols, dense_matrix):
    status = gpu_matrix_kernels._sliceRowsInt(stream, embedding_matrix_nrows,
                                              embedding_row_indxs,
                                              embedding_matrix, nrows, ncols,
                                              dense_matrix)
    cudart.check_cuda_status(status)

예제 #6

0

파일 보기

파일: nonlinearities.py 프로젝트: yiiwood/quagga

def sigmoid_der(stream, nelems, data, sigmoid_data, derivative):
    status = nonlinearities._sigmoidDer(stream, nelems, data, sigmoid_data,
                                        derivative)
    cudart.check_cuda_status(status)

예제 #7

0

파일 보기

파일: nonlinearities.py 프로젝트: yiiwood/quagga

def tanh_sigm_der(stream, axis, nrows, ncols, data, tanh_sigm_data, derivatve):
    status = nonlinearities._tanhSigmDer(stream, axis, nrows, ncols, data,
                                         tanh_sigm_data, derivatve)
    cudart.check_cuda_status(status)

예제 #8

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_scaled_columns_slice(stream, nrows, ncols, alpha, dense_matrix, embedding_column_indxs, embedding_matrix):
    status = gpu_matrix_kernels._addScaledColumnsSlice(stream, nrows, ncols, alpha, dense_matrix, embedding_column_indxs, embedding_matrix)
    cudart.check_cuda_status(status)

예제 #9

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def assign_sum(stream, nelems, matrices, n, s):
    status = gpu_matrix_kernels._assign_sum(stream, nelems, matrices, n, s)
    cudart.check_cuda_status(status)

예제 #10

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def mask_column_numbers_row_wise(stream, nrows, ncols, numbers, out):
    status = gpu_matrix_kernels._maskColumnNumbersRowWise(stream, nrows, ncols, numbers, out)
    cudart.check_cuda_status(status)

예제 #11

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def assign_masked_addition_column_broadcasted(stream, nrows, ncols, mask, a, b, out):
    status = gpu_matrix_kernels._assignMaskedAdditionColumnBroadcasted(stream, nrows, ncols, mask, a, b, out)
    cudart.check_cuda_status(status)

예제 #12

0

파일 보기

def assign_masked_addition(stream, nelems, mask, a, b, out):
    status = gpu_matrix_kernels._assignMaskedAddition(stream, nelems, mask, a, b, out)
    cudart.check_cuda_status(status)

예제 #13

0

파일 보기

def add_mask_zeros(stream, nelems, a, b, out):
    status = gpu_matrix_kernels._addMaskZeros(stream, nelems, a, b, out)
    cudart.check_cuda_status(status)

예제 #14

0

파일 보기

def dropout(stream, nelems, dropout_prob, data, uniform_data, out):
    status = gpu_matrix_kernels._dropout(stream, nelems, dropout_prob, data, uniform_data, out)
    cudart.check_cuda_status(status)

예제 #15

0

파일 보기

def add_scaled_subtraction(stream, nelems, alpha, a, b, out):
    status = gpu_matrix_kernels._addScaledSubtraction(stream, nelems, alpha, a, b, out)
    cudart.check_cuda_status(status)

예제 #16

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_softmax_ce_derivative(stream, batchSize, num_classes, probs, target_classes, derivatives):
    status = gpu_matrix_kernels._addSoftmaxCeDerivative(stream, batchSize, num_classes, probs, target_classes, derivatives)
    cudart.check_cuda_status(status)

예제 #17

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_mask_zeros(stream, nelems, a, b, out):
    status = gpu_matrix_kernels._addMaskZeros(stream, nelems, a, b, out)
    cudart.check_cuda_status(status)

예제 #18

0

파일 보기

def assign_masked_addition_column_broadcasted(stream, nrows, ncols, mask, a, b, out):
    status = gpu_matrix_kernels._assignMaskedAdditionColumnBroadcasted(stream, nrows, ncols, mask, a, b, out)
    cudart.check_cuda_status(status)

예제 #19

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_hprod_one_minus_mask_column_broadcasted(stream, nrows, ncols, mask, a, out):
    status = gpu_matrix_kernels._addHprodOneMinusMaskColumnBroadcasted(stream, nrows, ncols, mask, a, out)
    cudart.check_cuda_status(status)

예제 #20

0

파일 보기

def add_hprod_one_minus_mask(stream, nelems, mask, a, out):
    status = gpu_matrix_kernels._addHprodOneMinusMask(stream, nelems, mask, a, out)
    cudart.check_cuda_status(status)

예제 #21

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def repeat_along_col(stream, repeats, nrows, ncols, a, out):
    status = gpu_matrix_kernels._repeatAlongCol(stream, repeats, nrows, ncols, a, out)
    cudart.check_cuda_status(status)

예제 #22

0

파일 보기

def add_hprod_one_minus_mask_column_broadcasted(stream, nrows, ncols, mask, a, out):
    status = gpu_matrix_kernels._addHprodOneMinusMaskColumnBroadcasted(stream, nrows, ncols, mask, a, out)
    cudart.check_cuda_status(status)

예제 #23

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def clip(stream, nelems, min_value, max_value, data, out):
    status = gpu_matrix_kernels._clip(stream, nelems, min_value, max_value, data, out)
    cudart.check_cuda_status(status)

예제 #24

0

파일 보기

def matrix_vector_column_hprod(stream, nrows, ncols, matrix, vector, out):
    status = gpu_matrix_kernels._matrixVectorColumnHprod(stream, nrows, ncols, matrix, vector, out)
    cudart.check_cuda_status(status)

예제 #25

0

파일 보기

파일: GpuContext.py 프로젝트: Sandy4321/quagga

 def callback(stream, status, user_data):
     cudart.check_cuda_status(status)
     args, kwargs = ct.cast(user_data, ct_py_object_p).contents.value
     function(*args, **kwargs)
     GpuContext._user_data[ct.cast(stream, ct.c_void_p).value].popleft()

예제 #26

0

파일 보기

def mask_column_numbers_row_wise(stream, nrows, ncols, numbers, out):
    status = gpu_matrix_kernels._maskColumnNumbersRowWise(stream, nrows, ncols, numbers, out)
    cudart.check_cuda_status(status)

예제 #27

0

파일 보기

파일: nonlinearities.py 프로젝트: yiiwood/quagga

def relu_der(stream, nelems, data, relu_data, derivative):
    status = nonlinearities._reluDer(stream, nelems, data, relu_data,
                                     derivative)
    cudart.check_cuda_status(status)

예제 #28

0

파일 보기

def assign_sum(stream, nelems, matrices, n, s):
    status = gpu_matrix_kernels._assign_sum(stream, nelems, matrices, n, s)
    cudart.check_cuda_status(status)

예제 #29

0

파일 보기

파일: nonlinearities.py 프로젝트: yiiwood/quagga

def tanh_der(stream, nelems, data, tanh_data, derivative):
    status = nonlinearities._tanhDer(stream, nelems, data, tanh_data,
                                     derivative)
    cudart.check_cuda_status(status)

예제 #30

0

파일 보기

def repeat_along_col(stream, repeats, nrows, ncols, a, out):
    status = gpu_matrix_kernels._repeatAlongCol(stream, repeats, nrows, ncols, a, out)
    cudart.check_cuda_status(status)

예제 #31

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_scaled_subtraction(stream, nelems, alpha, a, b, out):
    status = gpu_matrix_kernels._addScaledSubtraction(stream, nelems, alpha, a, b, out)
    cudart.check_cuda_status(status)

예제 #32

0

파일 보기

def add_repeat_along_col_derivative(stream, repeats, a, nrows, ncols, derivative):
    status = gpu_matrix_kernels._addRepeatAlongColDerivative(stream, repeats, a, nrows, ncols, derivative)
    cudart.check_cuda_status(status)

예제 #33

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def dropout(stream, nelems, dropout_prob, data, uniform_data, out):
    status = gpu_matrix_kernels._dropout(stream, nelems, dropout_prob, data, uniform_data, out)
    cudart.check_cuda_status(status)

예제 #34

0

파일 보기

def add_scaled_div_sqrt(stream, nelems, alpha, a, b, epsilon, c):
    status = gpu_matrix_kernels._addScaledDivSqrt(stream, nelems, alpha, a, b, epsilon, c)
    cudart.check_cuda_status(status)

예제 #35

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def assign_masked_addition(stream, nelems, mask, a, b, out):
    status = gpu_matrix_kernels._assignMaskedAddition(stream, nelems, mask, a, b, out)
    cudart.check_cuda_status(status)

예제 #36

0

파일 보기

def clip(stream, nelems, min_value, max_value, data, out):
    status = gpu_matrix_kernels._clip(stream, nelems, min_value, max_value, data, out)
    cudart.check_cuda_status(status)

예제 #37

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_hprod_one_minus_mask(stream, nelems, mask, a, out):
    status = gpu_matrix_kernels._addHprodOneMinusMask(stream, nelems, mask, a, out)
    cudart.check_cuda_status(status)

예제 #38

0

파일 보기

def transpose_int(stream, nrows, ncols, in_, out):
    status = gpu_matrix_kernels._transposeInt(stream, nrows, ncols, in_, out)
    cudart.check_cuda_status(status)

예제 #39

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def matrix_vector_column_hprod(stream, nrows, ncols, matrix, vector, out):
    status = gpu_matrix_kernels._matrixVectorColumnHprod(stream, nrows, ncols, matrix, vector, out)
    cudart.check_cuda_status(status)

예제 #40

0

파일 보기

def add_hadamard_product_2(stream, nelems, a, b, alpha, c):
    status = gpu_matrix_kernels._addHadamardProduct2(stream, nelems, a, b, alpha, c)
    cudart.check_cuda_status(status)

예제 #41

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def batch_horizontal_split(stream, n, nrows, x_ncols, y_ncols, matrices, x_matrices, y_matrices):
    status = gpu_matrix_kernels._batchHorizontalSplit(stream, n, nrows, x_ncols, y_ncols, matrices, x_matrices, y_matrices)
    cudart.check_cuda_status(status)

예제 #42

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def assign_sequential_sum_pooling(stream, nrows, ncols, matrices, n, out):
    status = gpu_matrix_kernels._assignSequentialSumPooling(stream, nrows, ncols, matrices, n, out)
    cudart.check_cuda_status(status)

예제 #43

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_repeat_along_col_derivative(stream, repeats, a, nrows, ncols, derivative):
    status = gpu_matrix_kernels._addRepeatAlongColDerivative(stream, repeats, a, nrows, ncols, derivative)
    cudart.check_cuda_status(status)

예제 #44

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def assign_sequential_weighted_sum(stream, nrows, ncols, matrices, weights, n, out):
    status = gpu_matrix_kernels._assignSequentialWeightedSum(stream, nrows, ncols, matrices, weights, n, out)
    cudart.check_cuda_status(status)

예제 #45

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_scaled_div_sqrt(stream, nelems, alpha, a, b, epsilon, c):
    status = gpu_matrix_kernels._addScaledDivSqrt(stream, nelems, alpha, a, b, epsilon, c)
    cudart.check_cuda_status(status)

예제 #46

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def sequentially_tile(stream, nelems, a, matrices, n):
    status = gpu_matrix_kernels._sequentiallyTile(stream, nelems, a, matrices, n)
    cudart.check_cuda_status(status)

예제 #47

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def transpose_int(stream, nrows, ncols, in_, out):
    status = gpu_matrix_kernels._transposeInt(stream, nrows, ncols, in_, out)
    cudart.check_cuda_status(status)

예제 #48

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def assign_dL_dpre_a(stream, nrows, ncols, matrices, derivative, weights, n, out):
    status = gpu_matrix_kernels._assignDLDprea(stream, nrows, ncols, matrices, derivative, weights, n, out)
    cudart.check_cuda_status(status)

예제 #49

0

파일 보기

파일: GpuContext.py 프로젝트: datatalking/quagga

 def callback(stream, status, user_data):
     cudart.check_cuda_status(status)
     args, kwargs = ct.cast(user_data, ct_py_object_p).contents.value
     function(*args, **kwargs)
     GpuContext._user_data[ct.cast(stream, ct.c_void_p).value].popleft()

예제 #50

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_attention_derivative(stream, nrows, ncols, matrices, derivative, n, out):
    status = gpu_matrix_kernels._addAttentionDerivative(stream, nrows, ncols, matrices, derivative, n, out)
    cudart.check_cuda_status(status)

예제 #51

0

파일 보기

파일: nonlinearities.py 프로젝트: yiiwood/quagga

def tanh_sigm(stream, axis, nrows, ncols, data, tanh_sigm_data):
    status = nonlinearities._tanhSigm(stream, axis, nrows, ncols, data,
                                      tanh_sigm_data)
    cudart.check_cuda_status(status)

예제 #52

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def add_attention_tile(stream, nrows, ncols, derivative, a, dL_dpre_a, u, n, matrices_derivs):
    status = gpu_matrix_kernels._addAttentionTile(stream, nrows, ncols, derivative, a, dL_dpre_a, u, n, matrices_derivs)
    cudart.check_cuda_status(status)

예제 #53

0

파일 보기

파일: nonlinearities.py 프로젝트: yiiwood/quagga

def relu(stream, nelems, data, relu_data):
    status = nonlinearities._relu(stream, nelems, data, relu_data)
    cudart.check_cuda_status(status)

예제 #54

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def slice_rows_batch(stream, embd_rows_indxs, nrows, ncols, embd_matrix, embd_nrows, embd_ncols, dense_matrices):
    status = gpu_matrix_kernels._sliceRowsBatch(stream, embd_rows_indxs, nrows, ncols, embd_matrix, embd_nrows, embd_ncols, dense_matrices)
    cudart.check_cuda_status(status)

예제 #55

0

파일 보기

파일: nonlinearities.py 프로젝트: yiiwood/quagga

def sigmoid(stream, nelems, data, sigmoid_data):
    status = nonlinearities._sigmoid(stream, nelems, data, sigmoid_data)
    cudart.check_cuda_status(status)

예제 #56

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def sliced_rows_batch_scaled_add(stream, embd_rows_indxs, nrows, ncols, alpha, dense_matrices, embd_nrows, embd_ncols, embd_matrix):
    status = gpu_matrix_kernels._slicedRowsBatchScaledAdd(stream, embd_rows_indxs, nrows, ncols, alpha, dense_matrices, embd_nrows, embd_ncols, embd_matrix)
    cudart.check_cuda_status(status)

예제 #57

0

파일 보기

파일: nonlinearities.py 프로젝트: yiiwood/quagga

def tanh(stream, nelems, data, tanh_data):
    status = nonlinearities._tanh(stream, nelems, data, tanh_data)
    cudart.check_cuda_status(status)

예제 #58

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def assign_scaled_addition(stream, nelems, alpha, a, b, out):
    status = gpu_matrix_kernels._assignScaledAddition(stream, nelems, alpha, a, b, out)
    cudart.check_cuda_status(status)

예제 #59

0

파일 보기

파일: test_events.py 프로젝트: Sandy4321/quagga

def test_dependencies(cuda_stream, node_id, blocking_nodes, blocking_nodes_num, execution_checklist, test_results):
    status = test_events._testDependencies(cuda_stream, node_id, blocking_nodes, blocking_nodes_num, execution_checklist, test_results)
    cudart.check_cuda_status(status)

예제 #60

0

파일 보기

파일: gpu_matrix_kernels.py 프로젝트: Sandy4321/quagga

def masked_fill(stream, nelems, value, mask_data, true_value, out_data):
    status = gpu_matrix_kernels.\
        _maskedFill(stream, nelems, value, mask_data, true_value, out_data)
    cudart.check_cuda_status(status)