其他分享
首页 > 其他分享> > c – 检查所有__m128i组件是否为0的最有效方法[使用<= SSE4.1内在函数]

c – 检查所有__m128i组件是否为0的最有效方法[使用<= SSE4.1内在函数]

作者:互联网

我正在使用SSE内在函数来确定矩形(由四个int32值定义)是否已更改:

__m128i oldRect; // contains old left, top, right, bottom packed to 128 bits
__m128i newRect; // contains new left, top, right, bottom packed to 128 bits

__m128i xor = _mm_xor_si128(oldRect, newRect);

此时,如果矩形未更改,则生成的xor值将全为零.那么最有效的方法是什么呢?

目前我这样做:

if (xor.m128i_u64[0] | xor.m128i_u64[1])
{
    // rectangle changed
}

但我认为有一种更聪明的方法(可能使用了一些我还没有找到的SSE指令).

我在x64上定位SSE4.1,我在Visual Studio 2013中编写C代码.

编辑:问题与Is an __m128i variable zero?不完全相同,因为它指定“在SSE-2和更早的处理器上”(尽管安东尼奥确实添加了“完整性”的答案,在发布和回答此问题后的某个时间解决了4.1) .

解决方法:

您可以通过_mm_testz_si128内在函数(SSE4.1)使用PTEST instuction,如下所示:

#include "smmintrin.h" // SSE4.1 header

if (!_mm_testz_si128(xor, xor))
{
    // rectangle has changed
}

请注意,如果两个参数的按位AND为零,_mm_testz_si128将返回1.

标签:c,integer,sse,intrinsics,simd
来源: https://codeday.me/bug/20190927/1824127.html