系统相关
首页 > 系统相关> > linux – slurmstepd的可能影响:错误:在某些时候超出了步骤内存限制?

linux – slurmstepd的可能影响:错误:在某些时候超出了步骤内存限制?

作者:互联网

对于那些熟悉调度程序Slurm的人,我有一个问题.有时我得到以下错误消息slurmstepd:错误:在某些时候超过步骤内存限制.

我知道这意味着分配给我的进程的内存是不够的.尽管如此,该过程并未被调度程序杀死,并且通常看起来无害:程序运行完成并且输出文件看起来状态良好.

如果我收到错误消息,我是否应该总是假设输出有问题并重新运行程序?为什么有时可以超出分配的内存,但程序没有被杀死?

解决方法:

除非您收到一条消息称该工作被SLURM杀死且sacct显示已完成状态,否则您应该合理地认为该工作已完成.

标签:slurm,linux
来源: https://codeday.me/bug/20190815/1661771.html