Python barrier 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: numba_dppy

메소드/함수: barrier

hotexamples.com에서의 예제들: 8

Python barrier - 8개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 numba_dppy.barrier에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def sum_reduction_kernel(A, partial_sums):
    """
    The example demonstrates a reduction kernel implemented as a ``kernel``
    function.
    """
    local_id = dppy.get_local_id(0)
    global_id = dppy.get_global_id(0)
    group_size = dppy.get_local_size(0)
    group_id = dppy.get_group_id(0)

    local_sums = dppy.local.array(64, int32)

    # Copy from global to local memory
    local_sums[local_id] = A[global_id]

    # Loop for computing local_sums : divide workgroup into 2 parts
    stride = group_size // 2
    while stride > 0:
        # Waiting for each 2x2 addition into given workgroup
        dppy.barrier(dppy.CLK_LOCAL_MEM_FENCE)

        # Add elements 2 by 2 between local_id and local_id + stride
        if local_id < stride:
            local_sums[local_id] += local_sums[local_id + stride]

        stride >>= 1

    if local_id == 0:
        partial_sums[group_id] = local_sums[0]

예제 #2

파일 보기

 def f(a):
     lm = dppy.local.array(1, dtype)
     lm[0] = a[0]
     dppy.barrier(dppy.CLK_GLOBAL_MEM_FENCE)
     op(lm, 0, 1)
     dppy.barrier(dppy.CLK_GLOBAL_MEM_FENCE)
     a[0] = lm[0]

예제 #3

파일 보기

def sum_reduction_kernel(A, input_size, partial_sums):
    local_id = dppy.get_local_id(0)
    global_id = dppy.get_global_id(0)
    group_size = dppy.get_local_size(0)
    group_id = dppy.get_group_id(0)

    local_sums = dppy.local.array(64, int32)

    local_sums[local_id] = 0

    if global_id < input_size:
        local_sums[local_id] = A[global_id]

    # Loop for computing local_sums : divide workgroup into 2 parts
    stride = group_size // 2
    while stride > 0:
        # Waiting for each 2x2 addition into given workgroup
        dppy.barrier(dppy.CLK_LOCAL_MEM_FENCE)

        # Add elements 2 by 2 between local_id and local_id + stride
        if local_id < stride:
            local_sums[local_id] += local_sums[local_id + stride]

        stride >>= 1

    if local_id == 0:
        partial_sums[group_id] = local_sums[0]

예제 #4

파일 보기

    def reverse_array(A):
        lm = dppy.local.array(shape=10, dtype=np.float32)
        i = dppy.get_global_id(0)

        # preload
        lm[i] = A[i]
        # barrier local or global will both work as we only have one work group
        dppy.barrier(dppy.CLK_LOCAL_MEM_FENCE)  # local mem fence
        # write
        A[i] += lm[blocksize - 1 - i]

예제 #5

파일 보기

파일: kernel_private_memory.py 프로젝트: IntelPython/numba-dppy

    def private_memory_kernel(A):
        memory = numba_dppy.private.array(shape=1, dtype=np.float32)
        i = numba_dppy.get_global_id(0)

        # preload
        memory[0] = i
        numba_dppy.barrier(numba_dppy.CLK_LOCAL_MEM_FENCE)  # local mem fence

        # memory will not hold correct deterministic result if it is not
        # private to each thread.
        A[i] = memory[0] * 2

예제 #6

파일 보기

파일: test_private_memory.py 프로젝트: IntelPython/numba-dppy

 def private_memory_kernel(A):
     i = numba_dppy.get_global_id(0)
     prvt_mem = numba_dppy.private.array(shape=1, dtype=np.float32)
     prvt_mem[0] = i
     numba_dppy.barrier(numba_dppy.CLK_LOCAL_MEM_FENCE)  # local mem fence
     A[i] = prvt_mem[0] * 2

예제 #7

파일 보기

 def twice(A):
     i = dppy.get_global_id(0)
     d = A[i]
     # no argument defaults to global mem fence
     dppy.barrier()
     A[i] = d * 2

예제 #8

파일 보기

 def twice(A):
     i = dppy.get_global_id(0)
     d = A[i]
     dppy.barrier(dppy.CLK_LOCAL_MEM_FENCE)  # local mem fence
     A[i] = d * 2