Python LocalAttention 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: fast_transformers.attention.local_attention

클래스/타입: LocalAttention

hotexamples.com에서의 예제들: 5

Python LocalAttention - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 fast_transformers.attention.local_attention.LocalAttention에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

LocalAttention(5)

자주 사용되는 메소드들

LocalAttention (5)

예제 #1

0

파일 보기

파일: test_local_attention.py 프로젝트: qibinc/fast-transformers-1

    def test_compare_with_full(self):
        local_att = LocalAttention(17, softmax_temp=1).eval()
        full_att = FullAttention(softmax_temp=1).eval()

        q, k, v, m1, m2, m3 = self._get_inputs(N=10, L=128, S=128, D=32)
        m = FullMask(
            torch.abs(torch.arange(128)[:, None] -
                      torch.arange(128)[None]) < 9)
        v_full = full_att(q, k, v, m, m2, m3)
        v_local = local_att(q, k, v, m1, m2, m3)

        self.assertTrue(torch.allclose(v_full, v_local, atol=1e-5, rtol=1e-5))

예제 #2

0

파일 보기

파일: test_local_attention.py 프로젝트: qibinc/fast-transformers-1

    def test_benchmark_cpu(self):
        q, k, v, m1, m2, m3 = self._get_inputs(L=1024, S=1024, E=64, D=64)
        att = LocalAttention(128)

        # warmup the cache
        for i in range(10):
            v_new = att(q, k, v, m1, m2, m3)

        # measure
        start = time.time()
        for i in range(10):
            v_new = att(q, k, v, m1, m2, m3)
        end = time.time()
        print("CPU Time taken:", (end - start) * 1000, "(ms)")

예제 #3

0

파일 보기

파일: test_local_attention.py 프로젝트: qibinc/fast-transformers-1

    def test_benchmark_gpu(self):
        q, k, v, m1, m2, m3 = self._get_inputs(L=1024,
                                               S=1024,
                                               E=64,
                                               D=64,
                                               device="cuda")
        att = LocalAttention(128)

        # warmup the caches
        for i in range(10):
            v_new = att(q, k, v, m1, m2, m3)

        # measure
        start = torch.cuda.Event(enable_timing=True)
        end = torch.cuda.Event(enable_timing=True)
        start.record()
        for i in range(10):
            v_new = att(q, k, v, m1, m2, m3)
        end.record()
        torch.cuda.synchronize()
        print("GPU time taken:", start.elapsed_time(end), "(ms)")

예제 #4

0

파일 보기

파일: test_local_attention.py 프로젝트: qibinc/fast-transformers-1

 def test_masked(self):
     att = LocalAttention(16, softmax_temp=1)
     q, k, v, m1, m2, m3 = self._get_inputs(N=3, L=64, S=64, D=32)
     m2 = m3 = LengthMask(torch.tensor([8, 16, 64], dtype=torch.long))
     v_hat = att(q, k, v, m1, m2, m3)
     self.assertFalse(torch.any(torch.isnan(v_hat)))

예제 #5

0

파일 보기

파일: test_local_attention.py 프로젝트: qibinc/fast-transformers-1

 def test_forward(self):
     att = LocalAttention(3, softmax_temp=1)
     q, k, v, m1, m2, m3 = self._get_inputs()
     v = att(q, k, v, m1, m2, m3)
     self.assertTrue(v.is_contiguous())