其他分享
首页 > 其他分享> > c – 为什么英特尔的一些内在函数采用const immediates,而另一些则是非const?

c – 为什么英特尔的一些内在函数采用const immediates,而另一些则是非const?

作者:互联网

Intel’s intrinsic guide似乎与直接的价值观有着神秘的区别.他们将一些标记为const而一些不标记为const.在实践中,两种类型无论是编译时间常数还是编译器都会抱怨.我只是想知道为什么这个区别?我错过了什么?

这是英特尔所说的一个例子:

_mm_blend_epi16 (__m128i a, __m128i b, const int imm8)
_mm_srli_si128 (__m128i a, int imm8)

解决方法:

假设你认为const是一个改进,那么英特尔的旧东西写得不如他们的新东西.

请注意,blend_epi16是SSE4.1,而srli_si128是SSE2.当他们为SSE4.1添加内在函数时,可能他们决定强调论证需要是编译时常量.

256位版本的AVX2内在函数使用const:__ m256i _mm256_srli_si256(__ m256i a,const int imm).这基本上证实了他们还没有想到const,因为他们开始使用const作为相同的指令.

还要注意他们对psrldq instruction的_mm_srli_si128名称非常不满意,他们为它引入了一个新名称:在新代码中应首选_mm_bsrli_si128,以使其更清晰,它是一个字节移位,而不是128位宽的位移.它与_mm_srli_epi64有很大不同.遗憾的是,指令参考手册未提及bsrli名称.

AVX512加载/存储内在函数将使用void *而不是__m128i *,这是另一个不错的变化.

所以英特尔基本上做的事情不同,因为旧的方式是次优的,不是因为他们必须这样做.

标签:c,x86,intel,intrinsics
来源: https://codeday.me/bug/20190828/1757203.html