首页 > 系统相关> > linux-从大型malloced数组读取而不是仅存储时,两次页面错误的发生次数是多少？

linux-从大型malloced数组读取而不是仅存储时,两次页面错误的发生次数是多少？

2019-10-25 01:50:30 作者：互联网

我正在使用下面的代码对监视页面错误进行简单的测试,我不知道的是,下面的简单一行代码如何使页面错误计数加倍.
如果我用

 ptr[i+4096] = 'A'

我使用perf工具获得了25,722个页面错误,这是我所期望的,
但是如果我使用

tmp = ptr[i+4096]

相反,页面错误翻了一番,达到51,322
我不怎么解释.以下是完整的代码.谢谢！

void do_something() {
    int i;
    char* ptr;
    char tmp;
    ptr = malloc(100*1024*1024);
    int j = 0;
    int k = 0;

    for (i = 0; i < 100*1024*1024; i+=4096) {

       //ptr[i+4096] = 'A' ;
       tmp = ptr[i+4096];

       for (j = 0 ; j < 4096; j++)
           ptr[i+j] = (char) (i & 0xff); // pagefault
    }
    free(ptr);
}

int main(int argc, char* argv[]) {
    do_something();
    return 0;
}

机器信息：
架构：x86_64
CPU操作模式：32位,64位
字节顺序：小尾数
处理器：40
在线CPU列表：0-39
每个核心线程数：2
每个插槽的核心数：10
插座：2
NUMA个节点：2
供应商ID：正版英特尔
CPU系列：6
型号：63
型号名称：Intel(R)Xeon(R)CPU E5-2687W v3 @ 3.10GHz
步进：2
CPU MHz：3096.188
BogoMIPS：6197.81
虚拟化：VT-x
L1d快取：32K
L1i缓存：32K
L2快取：256K
三级缓存：25600K
NUMA node0 CPU：0-9,20-29
NUMA node1 CPU：10-19,30-39

3.10.0-514.32.3.el7.x86_64#1

解决方法:

malloc()通常会通过向操作系统请求新的页面(例如通过mmap)来满足对内存的请求.此类页面通常是延迟分配的：在首次访问之前不会分配实际的页面.

然后发生什么取决于第一次访问的类型：首先进行读取时,Linux将映射到零的共享只读COW页面中,以满足它；然后,如果稍后再写入,则分配第二个错误私人可写页面.

当您仅先执行写操作时,将跳过第一步.这是通常的情况,因为代码通常不会从新分配的具有未定义内容的内存中读取(至少从malloc中获取时).

请注意,上面是对新分配的页面在Linux中的工作方式的描述-当您使用malloc时,存在另一层：malloc通常将尝试满足对块的请求,该请求较早释放了进程,而不是不断请求新的内存.在重复使用内存的情况下,通常已经将其分页了,以上内容将不适用.当然,对于您最初的1024 MiB大分配,这里没有可重复使用的内存,因此您可以确定分配器是从OS中获取的.

标签：perf,page-fault,linux
来源： https://codeday.me/bug/20191025/1925046.html