首页 > TAG信息列表 > SGE

qstat -f队列状态是au和s,如何恢复

一、情景状态    二、解决思路 1.au状态是主机和队列连接终端,需要重启相关服务器上的sge服务。先跳到对应的节点,ps -ef | grep sge,发现sge服务掉了,需要重启。    重启之后查看一下sge进程是否正常,然后在qstat -f查看au状态已消除。 2.s状态是暂停队列,使t2队列解暂停即可。用

SGE 节点处于E状态

SGE集群可能出现独列错误状态。此时,使用命令 qstat -f 检测集群队列队列状态。最后一列stats若为空,则表示队列状态正常,可以用于任务提交。其它状态解释如下: a: 负载超限了,开启警报alarm。 A: 超限暂替,开启警报Alarm。 E: 队列有错误,不能提供任务提交服务了。 au:主机和SGE系统连接中断

qsub投递任务到指定节点(sge集群)

有2种方式: 1、投递到指定队列 qsub -q all.q  -cwd -V  cmd.sh 2、投递到指定节点 qsub -l hostname=node-01 -cwd -V cmd.sh   转载:https://my.oschina.net/leopardlinux/blog/807146

queue instance " " dropped because it is full 由于过载或已满而丢弃所有队列

其他类似报错 queue instance " " dropped because it is temporarily not available  queue instance " " dropped because it is disabled 报错显示: $qstat -j queue instance "peteris.q@sge00" dropped because it is full 解释:sge由于过载或已满而丢弃所有队列   解

SGE部署安装

1.关闭防火墙 systemctl stop firewalld.service systemctl disable firewalld.service 2.安装SGE依赖包 # yum install csh java-1.8.0-openjdk java-1.8.0-openjdk-devel gcc ant automake hwloc-devel openssl-devel libdb-devel pam-devel libXt-devel motif-devel ncurses-li