其他分享
首页 > 其他分享> > pytorch训练的时候遇到RuntimeError: CUDA error: device-side assert triggered

pytorch训练的时候遇到RuntimeError: CUDA error: device-side assert triggered

作者:互联网

RuntimeError: CUDA error: device-side assert triggered

       在pytorch训练的时候遇到这个错误,查询一下原因的确是标签越界,这里与Python起始是从0有关。需要对标签进行细心的处理才可以。但是这里要讲解的不是这个,而是我是在预测位置点何来的标签越界??

      下面讲解这个错误处理办法:

RuntimeError: CUDA error: device-side assert triggered
  1. 首先检查自己的标签是否从0开始;
  2. 将模型、损失函数、张量全部转到CPU上面运行或者debug,此时会报错具体的位置。因为cpu比cuda更能够定位自己的错误所在。在debug模式下,我发现的确是因为某个索引越界导致程序异常(但是cuda始终告诉我是标签越界)。

经过上面两部,基本就能解决问题。祝好运!

 我叫谢琛,深度学习探索者一枚!(有意咨询xiec177)
tensorflow/pytorch交流群请加QQ:548368797

 

标签:越界,triggered,标签,RuntimeError,assert,error,side
来源: https://blog.csdn.net/baidu_34172099/article/details/120905878