首页 > 代码库 > SGE:qsub/qstat/qdel/qhost 任务投递和监控

SGE:qsub/qstat/qdel/qhost 任务投递和监控

参考:

Oracle Grid Engine

qsub命令

SGE - qsub使用范例

SGE作业基本用法

qsub是最为稳定的底层任务投递系统,就是把一个脚本投递到集群的计算节点上运行。

注意,只有登录节点才有资格投递任务,计算节点没有权限投递任务,只能执行,所以千万不要在投递的脚本内嵌套投递,会报错的。

下面是我最为常用的投递命令:

qsub -cwd -l vf=5g -P 任务单元 -q 队列名

先逐条解释:

-cwd: 就是 current working directory,从当前的目录开始执行作业,也就是log文件会写到当前目录;如果不加cwd的话,就会默认输出到用户的 home 目录。如果你想指定输出目录的话,就可以使用wd命令,log会输出到你指定的目录。

-l:resource=value, 表明作业运行所需要的资源。可以看到我们后面指定了预估内存 vf=5g,一般不用指定 CPU 数。注意,实际这个没什么卵用,很少有集群能严格限制用户的内存使用,vf 只会影响你投递的效率,有人就会钻空子,尽量把内存往低了投,尽快排上。这一部分其实就是个道德约束。

-P:大型组织里会分团队,分项目,不同的项目需要制定项目名,主要是为了后期方便统计计算资源的消耗,算钱,其实这个命令没卵用。

-q:指定队列名,这个就非常重要了,队列就是计算机的队列,一个队列只有一些特定的计算节点,你投了哪个节点,你就只能用该节点指定的计算资源。

待续~

SGE:qsub/qstat/qdel/qhost 任务投递和监控