c – 为什么即使是16字节对齐的地址也会导致_mm_load_si128导致访问冲突?
作者:互联网
以下编译在MSVC上没有警告.
#include <iostream>
#include <emmintrin.h>
int main()
{
__declspec(align(16)) int x = 42;
std::cout << &x << "\n"; // Print out the address that holds x
__m128i v = _mm_load_si128((__m128i const*)(x));
}
本质上,代码对齐一个32位整数,并尝试将其加载到__m128i类型中. _mm_load_si128
要求输入地址为16字节对齐. _mm_loadu_si128
不需要它,但是两者都导致上面的代码在运行时发出访问冲突.为什么,我该如何解决?
解决方法:
你忘了带x的地址:
__m128i v = _mm_load_si128((__m128i const*)(&x));
// ^
// |
// Here ----------------+
此外,您没有为数据提供足够的空间,因此_mm_load_si128最终会读取已分配的内存块的末尾.
标签:c,sse,intrinsics 来源: https://codeday.me/bug/20190830/1771568.html