Python get_code 예제들, tests.codegen.sve.common.get_code Python 예제들

예제 #1

0

파일 보기

파일: ast_test.py 프로젝트: thobauma/dace

def test_assign_pointer():
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[:]
                b >> B[i]
                b = a

    # Assigning a pointer to a vector is bad!
    with pytest.raises(NotSupportedError):
        get_code(program, 'i')

예제 #2

0

파일 보기

파일: ast_test.py 프로젝트: thobauma/dace

def test_compare_scalar_vector():
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B[i]
                b = a if 0.0 < a else a * 2.0

    code = get_code(program, 'i')

    assert 'svcmplt' in code

예제 #3

0

파일 보기

파일: wcr_test.py 프로젝트: sscholbe/dace

def test_wcr_sum():
    @dace.program(dace.float64[N], dace.float64[1])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B(1, lambda x, y: x + y)[0]
                b = a

    code = get_code(program)

    assert 'ReductionType::Sum' in code
    assert 'svaddv' in code

예제 #4

0

파일 보기

파일: wcr_test.py 프로젝트: sscholbe/dace

def test_wcr_max():
    @dace.program(dace.float64[N], dace.float64[1])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B(1, lambda x, y: max(x, y))[0]
                b = a

    code = get_code(program)

    assert 'ReductionType::Max' in code
    assert 'svmaxv' in code

예제 #5

0

파일 보기

파일: map_test.py 프로젝트: sscholbe/dace

def test_map_simple():
    # One dimensional
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B[i]
                b = a

    code = get_code(program)

    assert '__pg_i' in code

예제 #6

0

파일 보기

파일: wcr_test.py 프로젝트: thobauma/dace

def test_wcr_min():
    @dace.program(dace.float64[N], dace.float64[1])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B(1, lambda x, y: min(x, y))[0]
                b = a

    code = get_code(program, 'i')

    assert 'ReductionType::Min' in code
    assert 'svminv(__pg_i, b)' in code

예제 #7

0

파일 보기

파일: memlet_test.py 프로젝트: sscholbe/dace

def test_indirect_load_implicit():
    @dace.program(dace.int64[N], dace.int64[N], dace.int64[N])
    def program(A, B, C):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[B[i]]
                c >> C[i]
                c = a

    code = get_code(program)

    # This is still an indirect load (uses Indirection tasklet)
    assert 'svld1_gather_index' in code

예제 #8

0

파일 보기

파일: memlet_test.py 프로젝트: sscholbe/dace

def test_indirect_load_explicit():
    @dace.program(dace.int64[N], dace.int64[N], dace.int64[N])
    def program(A, B, C):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[:]
                b << B[i]
                c >> C[i]
                c = a[b]

    code = get_code(program)

    assert 'svld1_gather_index' in code

예제 #9

0

파일 보기

파일: memlet_test.py 프로젝트: sscholbe/dace

def test_contiguous_map():
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B[i]
                b = a

    code = get_code(program)

    assert 'svld1(' in code
    assert 'svst1(' in code

예제 #10

0

파일 보기

파일: ast_test.py 프로젝트: thobauma/dace

def test_assign_scalar():
    @dace.program(dace.float32[N], dace.float32[N])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B[i]
                b = 0.0

    code = get_code(program, 'i')

    # Scalar must be duplicated and brought into right type
    assert 'svdup_f32' in code
    assert f'({dace.float32})' in code

예제 #11

0

파일 보기

파일: memlet_test.py 프로젝트: sscholbe/dace

def test_stride_map():
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N:2]:
            with dace.tasklet:
                a << A[i]
                b >> B[i]
                b = a

    code = get_code(program)

    assert 'svld1_gather' in code
    assert 'svst1_scatter' in code
    assert '(0, 2)' in code

예제 #12

0

파일 보기

파일: wcr_test.py 프로젝트: thobauma/dace

def test_wcr_unsupported():
    # Product reduction not supported
    @dace.program(dace.float64[N], dace.float64[N])
    def program_prod(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B(1, lambda x, y: x * y)[i]
                b = a

    with pytest.raises(NotSupportedError):
        get_code(program_prod, 'i')

    # WCR using the SVE param is unvectorizable (no atomic bulk store)
    @dace.program(dace.float64[N], dace.float64[N])
    def program_wcr_sve_param(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B(1, lambda x, y: x + y)[i]
                b = a

    with pytest.raises(NotSupportedError):
        get_code(program_wcr_sve_param, 'i')

예제 #13

0

파일 보기

파일: memlet_test.py 프로젝트: sscholbe/dace

def test_matrix_stride():
    @dace.program(dace.float64[N, M], dace.float64[M, N])
    def program(A, B):
        for i, j in dace.map[0:N, 0:M]:
            with dace.tasklet:
                a << A[i, j]
                b >> B[j, i]
                b = a

    code = get_code(program)

    # Contiguous load of entries
    assert 'svld1' in code
    # Stride N store
    assert 'svst1_scatter' in code
    assert '(0, N)' in code

예제 #14

0

파일 보기

파일: memlet_test.py 프로젝트: sscholbe/dace

def test_fake_stride():
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N:2]:
            with dace.tasklet:
                a << A[i / 2]
                b >> B[i]
                b = a

    code = get_code(program)

    # Load is contiguous even though it doesn't look like it
    assert 'svld1(' in code

    # Store is stride
    assert 'svst1_scatter' in code

예제 #15

0

파일 보기

파일: ast_test.py 프로젝트: thobauma/dace

def test_if_block():
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B[i]
                if a > 0:
                    b = 0
                else:
                    b *= 2

    code = get_code(program, 'i')

    # Accumulator must be used for predicates
    assert '__pg_acc' in code

예제 #16

0

파일 보기

def test_stream_push():
    @dace.program(dace.float32[N], dace.float32[N])
    def program(A, B):
        stream = dace.define_stream(dace.float32, N)
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                s >> stream(-1)
                s = 42.0

        stream >> B

    code = get_code(program, 'i')

    assert 'stream.push' in code
    assert 'svcompact' in code

예제 #17

0

파일 보기

파일: ast_test.py 프로젝트: thobauma/dace

def test_assign_new_variable():
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B[i]
                if a > 0 and a < 1:
                    c = a
                else:
                    c = 0
                b = a

    code = get_code(program, 'i')

    # c will be once defined as vector, once as scalar (locally)
    assert 'svfloat64_t c = ' in code
    assert f'{dace.int64} c = ' in code

예제 #18

0

파일 보기

파일: ast_test.py 프로젝트: thobauma/dace

def test_math_functions():
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B[i]
                b = math.max(42, a)
                b = math.sqrt(a)
                b = math.max(41, 42)

    code = get_code(program, 'i')

    # Vectorized max
    assert 'svmax' in code
    # Vectorized sqrt
    assert 'svsqrt' in code
    # Regular max (on scalars)
    assert 'dace::math::max' in code
    # Assigning scalar max to vector
    assert 'svdup' in code

예제 #19

0

파일 보기

파일: ast_test.py 프로젝트: thobauma/dace

def test_fused_operations():
    @dace.program(dace.float64[N], dace.float64[N])
    def program(A, B):
        for i in dace.map[0:N]:
            with dace.tasklet:
                a << A[i]
                b >> B[i]
                b = a * a + a
                b = a + a * a
                b = a * a - a
                b = a - a * a
                c = 0 * 1 + a

    code = get_code(program, 'i')

    # All fused ops
    assert 'svmad' in code
    assert 'svmla' in code
    assert 'svmls' in code
    assert 'svmsb' in code

    # No fusion if less than 2 vectors
    assert 'svadd' in code

예제 #20

0

파일 보기

파일: map_test.py 프로젝트: sscholbe/dace

def test_map_advanced():
    # Multidimensional + stride
    @dace.program(dace.float64[16 * N], dace.float64[16 * N])
    def program(A, B):
        for i, j, k in dace.map[0:N, 0:N:2, 1:8 * N + 1:N * 2]:
            with dace.tasklet:
                a << A[k]
                b >> B[k]
                b = a

    code = get_code(program)

    # Only innermost should be SVE
    assert '__pg_i' not in code
    assert '__pg_j' not in code

    # Check for stride of N * 2
    assert '(2 * N)' in code

    # Offset initial
    assert 'k = 1' in code

    # Upper bound (minus 1)
    assert '(8 * N)' in code