标签 cuda 下的文章

VS2013+CUDA7.5配置


  想要研究GPU编程,很多人都在配置上卡住了,所以我把我的配置过程分享出来,希望能给大家提供参考。

电脑配置:     系统:WIN10 64位     开发平台:VS 2013     显卡:英伟达 GeForce GT 740M     CUDA版本:7.5

1.安装最新版CUDA    CUDA官方下载地址    默认安装在C盘

2.配置环境变量        CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5 CUDA_LIB_PATH = %CUDA_PATH%\lib\x64  CUDA_BIN_PATH = %CUDA_PATH%\bin   CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\x64   CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64     然后,在系统变量 PATH 的末尾添加:

;%CUDA_LIB_PATH%;%CUDA_BIN_PATH%;%CUDA_SDK_LIB_PATH%;%CUDA_SDK_BIN_PATH%;


Python GPU编程之NumbaPro入门


  相信如果你使用过Python Numpy包,一定了解NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。它专为进行严格的数字处理而产生。多为很多大型金融公司使用,以及核心的科学计算组织如:Lawrence Livermore,NASA用其处理一些本来使用C++,Fortran或Matlab等所做的任务。   但是由于复杂的计算,Numpy的计算效率难免受到影响,因此我们对它进行了许多优化,用于优化的包有PyPy、Numba 与 Cython,而NumbaPro就是建立在Numba和cuda基础上的高级优化方法。   下面我们一起来看。   使用NumbaPro,我们可以对Numpy中的方法进行优化,使Python代码可以动态编译为机器码,并在运行中加载,使得GPU充分发挥多线程的优势。针对GPU,Numbapro也可以自动完成工作,并优化GPU体系结构的代码。另外,基于CUDA API编写的Python代码也可以有效地利用硬件。   说了这么多,下面就让我们从简单的示例开始学习。

 from numbapro import vectorize
@vectorize(['float32(float32, float32)'], target='cpu')
def sum(a, b):
    return a + b

  如果需要使用GPU来运行,只需要将第二行改成@vectorize(['float32(float32, float32)'], target='gpu')