其他分享
首页 > 其他分享> > c – 为什么即使是16字节对齐的地址也会导致_mm_load_si128导致访问冲突?

c – 为什么即使是16字节对齐的地址也会导致_mm_load_si128导致访问冲突?

作者:互联网

以下编译在MSVC上没有警告.

#include <iostream>
#include <emmintrin.h>

int main() 
{
    __declspec(align(16)) int x = 42;
    std::cout << &x << "\n";  // Print out the address that holds x

    __m128i v = _mm_load_si128((__m128i const*)(x));
}

本质上,代码对齐一个32位整数,并尝试将其加载到__m128i类型中. _mm_load_si128要求输入地址为16字节对齐. _mm_loadu_si128不需要它,但是两者都导致上面的代码在运行时发出访问冲突.为什么,我该如何解决?

解决方法:

你忘了带x的地址:

__m128i v = _mm_load_si128((__m128i const*)(&x));
//                                          ^
//                                          |
//                     Here ----------------+

此外,您没有为数据提供足够的空间,因此_mm_load_si128最终会读取已分配的内存块的末尾.

标签:c,sse,intrinsics
来源: https://codeday.me/bug/20190830/1771568.html