其他分享
首页 > 其他分享> > c – __builtin___clear_cache如何工作?

c – __builtin___clear_cache如何工作?

作者:互联网

通过gcc文档,我偶然发现了内置函数__builtin___clear_cache.

— Built-in Function: void __builtin___clear_cache (char *begin, char
*end) This function is used to flush the processor’s instruction cache for the region of memory between begin inclusive and end exclusive.
Some targets require that the instruction cache be flushed, after
modifying memory containing code, in order to obtain deterministic
behavior.

If the target does not require instruction cache flushes,
__builtin___clear_cache has no effect. Otherwise either instructions are emitted in-line to clear the instruction cache or a call to the
__clear_cache function in libgcc is made.

我发现这很有趣,但令人惊讶.在许多情况下,当前堆栈的大量指令存储在L1高速缓存(指令高速缓存)中.因此,乍一看,这个内置程序可能会显着破坏我们程序的流程,使其消除堆栈中的下一条指令.

此指令是否还重新填充L1缓存中的堆栈部分?

这似乎不太可能.如果没有,那么我认为用户有责任使用正确的开始和结束参数,以免破坏我们的进程.在实践中,如何找到正确的开始和结束使用的东西?

解决方法:

它只是在需要它们的目标处理器上发出一些奇怪的机器指令(x86不需要它).

将__builtin___clear_cache视为“可移植”(以GCC和兼容编译器)方式来刷新指令缓存(例如,在某些JIT库中).

In practice, how could one find what the right begin and end to use?

为了安全起见,我会在某些页面范围内使用它(例如使用sysconf(_SC_PAGESIZE)获得….),因此通常是4Kbyte对齐的内存范围(4Kbyte的倍数).否则,您需要一些特定于目标的技巧来查找缓存行宽…

在Linux上,您可能会读取/ proc / cpuinfo并使用cache_alignment& cache_size行以获得更精确的缓存行大小和对齐方式.

顺便说一句,使用__builtin__clear_cache的代码很可能(由于其他原因)特定于目标机器,因此它具有或知道某些机器参数(并且应该包括高速缓存大小和对齐).

标签:built-in,c,caching
来源: https://codeday.me/bug/20191002/1843877.html