首页 > 代码库 > cuda核函数再调用核函数,多层并行
cuda核函数再调用核函数,多层并行
#include <stdio.h> __global__ void childKernel(int i) { int tid = blockIdx.x*blockDim.x+threadIdx.x; printf("parent:%d,child:%d\n",i,tid); for(int j=i;j<i+10;j++) { printf(",%d",j); } printf("\n"); } __global__ void kernel() { int tid = blockIdx.x*blockDim.x+threadIdx.x; childKernel<<<1,2>>>(tid); } int main() { kernel<<<1,1>>>(); cudaDeviceSynchronize(); return 0; }
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。