首页 > 代码库 > CUDA开发:了解设备属性

CUDA开发:了解设备属性

  原文链接

  今天介绍一下CUDA设备的相关属性,只有熟悉了硬件是相关属性,是怎么工作的,就能写出更适合硬件工作的代码。cudaDeviceProp这个结构体记录了设备的相关属性。

1 struct cudaDeviceProp 2 { 3   char   name[256];                  /**< 设备的ASCII标识 */ 4   size_t totalGlobalMem;             /**< 可用的全局内存量,单位字节 */ 5   size_t sharedMemPerBlock;          /**< 每个block可用的共享内存量,单位字节 */ 6   int    regsPerBlock;               /**< 每个block里可用32位寄存器数量 */ 7   int    warpSize;                   /**< 在线程warp块大小*/ 8   size_t memPitch;                   /**< 允许的内存复制最大修正,单位字节*/ 9   int    maxThreadsPerBlock;         /**< 每个block最大进程数量 */10   int    maxThreadsDim[3];           /**< 一block里每个维度最大线程量 */11   int    maxGridSize[3];             /**< 一格里每个维度最大数量 */12   int    clockRate;                  /**< 时钟频率,单位千赫khz */13   size_t totalConstMem;              /**< 设备上可用的常量内存,单位字节 */14   int    major;                      /**< 计算功能主版本号*/15   int    minor;                      /**< 计算功能次版本号*/16   size_t textureAlignment;           /**< 对齐要求的纹理 */17   int    deviceOverlap;              /**< 判断设备是否可以同时拷贝内存和执行内核。已过时。改用asyncEngineCount */18   int    multiProcessorCount;        /**< 设备上的处理器数量 */19   int    kernelExecTimeoutEnabled;   /**< 内核函数是否运行受时间限制*/20   int    integrated;                 /**< 设备是不是独立的 */21   int    canMapHostMemory;           /**< 设备能否映射主机cudaHostAlloc/cudaHostGetDevicePointer */22   int    computeMode;                /**< 计算模式,有默认,独占,禁止,独占进程(See ::cudaComputeMode) */23   int    maxTexture1D;               /**< 1D纹理最大值 */24   int    maxTexture2D[2];            /**< 2D纹理最大维数*/25   int    maxTexture3D[3];            /**< 3D纹理最大维数 */26   int    maxTexture1DLayered[2];     /**< 最大的1D分层纹理尺寸 */27   int    maxTexture2DLayered[3];     /**< 最大的2D分层纹理尺寸  */28   size_t surfaceAlignment;           /**< 表面的对齐要求*/29   int    concurrentKernels;          /**< 设备是否能同时执行多个内核*/30   int    ECCEnabled;                 /**< 设备是否支持ECC */31   int    pciBusID;                   /**< 设备的PCI总线ID */32   int    pciDeviceID;                /**< PCI设备的设备ID*/33   int    pciDomainID;                /**<PCI设备的域ID*/34   int    tccDriver;                  /**< 1如果设备是使用了TCC驱动的Tesla设备,否则就是0 */35   int    asyncEngineCount;           /**< 异步Engine数量 */36   int    unifiedAddressing;          /**< 设备是否共享统一的地址空间与主机*/37   int    memoryClockRate;            /**<峰值内存时钟频率,单位khz*/38   int    memoryBusWidth;             /**< 全局内存总线宽度,单位bit*/39   int    l2CacheSize;                /**< L2 cache大小,单位字节 */40   int    maxThreadsPerMultiProcessor;/**< 每个多处理器的最大的常驻线程 */41 };

  通过cudaGetDeviceProperties()得到设备属性,cudaGetDeviceCount()来获取设备的个数,通过cudaChooseDevice()选择符合条件的设备,通过cudaGetDevice()可以得到当前的设备,通过cudaSetDevice()设置选择设备,SLI技术支持多个GPU。

  更多内容请点击:

  CUDA专区:http://cuda.it168.com/

  CUDA论坛:http://cudabbs.it168.com/

CUDA开发:了解设备属性