Python _NVRTCProgram示例

编程语言: Python

命名空间/包名称: cupy.cuda.compiler

方法/功能: _NVRTCProgram

hotexamples.com的示例: 2

Python _NVRTCProgram - 已找到2个示例。这些是从开源项目中提取的最受好评的cupy.cuda.compiler._NVRTCProgram现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

    def compile(self):
        if self.ptx is None:

            program = _NVRTCProgram(kernel.encode(),
                                    "recurrent_forget_mult.cu".encode())
            GPUForgetMult.ptx = program.compile()

        if torch.cuda.current_device() not in GPUForgetMult.configured_gpus:
            m = function.Module()
            m.load(bytes(self.ptx.encode()))

            self.forget_mult = m.get_function("recurrent_forget_mult")
            self.bwd_forget_mult = m.get_function("bwd_recurrent_forget_mult")

            Stream = namedtuple("Stream", ["ptr"])
            self.stream = Stream(ptr=torch.cuda.current_stream().cuda_stream)

            GPUForgetMult.configured_gpus[torch.cuda.current_device()] = (
                self.forget_mult,
                self.bwd_forget_mult,
                self.stream,
            )

        (
            self.forget_mult,
            self.bwd_forget_mult,
            self.stream,
        ) = GPUForgetMult.configured_gpus[torch.cuda.current_device()]

示例#2

显示文件

文件： forget_mult.py 项目： SiddharthTiwari/fastai

    def compile(self):
        if self.ptx is None:
            
            program = _NVRTCProgram(kernel.encode(), 'recurrent_forget_mult.cu'.encode())
            GPUForgetMult.ptx = program.compile()

        if torch.cuda.current_device() not in GPUForgetMult.configured_gpus:
            m = function.Module()
            m.load(bytes(self.ptx.encode()))

            self.forget_mult = m.get_function('recurrent_forget_mult')
            self.bwd_forget_mult = m.get_function('bwd_recurrent_forget_mult')

            Stream = namedtuple('Stream', ['ptr'])
            self.stream = Stream(ptr=torch.cuda.current_stream().cuda_stream)

            GPUForgetMult.configured_gpus[torch.cuda.current_device()] = (self.forget_mult, self.bwd_forget_mult, self.stream)

        self.forget_mult, self.bwd_forget_mult, self.stream = GPUForgetMult.configured_gpus[torch.cuda.current_device()]