其他分享
首页 > 其他分享> > essaySummary(10.4)

essaySummary(10.4)

作者:互联网

1、WET: Write Efficient Loop Tiling for Non-Volatile Main Memory

1.1、本文提出了一种对矩阵乘法运算进行多层次的循环分片来有效地降低NVM主存的写次数

1.2、本文列举了普通的矩阵乘法分片以及分治法的乘法分片,其目的都是为了让子矩阵的大小拟合L1缓存,以追求最大速度,却没有考虑到写次数。文章提出的WET方法使用双层次的分块,外层分块大小用于拟合LLC,内存分块大小拟合L1。

1.3、在结果方面,写次数能有效地降低,并且不影响其原来的性能(甚至还稍微快了一点),写次数降低的比例为普通矩阵乘法分片的 insize/outsize 倍。

1.4、以下列举出普通矩阵乘法的代码,分治法的乘法策略以及作者提出的WET矩阵乘法的代码。

1.5、对论文的思考:

2、A Wear-Leveling-Aware Fine-Grained Allocator for Non-Volatile Memory

2.1、本文提出了一种对页面内部磨损的细粒度磨损均衡分配器。

2.2、均衡器分为三个方面,分配、释放、重置

2.3、分配提出了 Clockwise Best-Fit (CBF) 策略,具体实现是将page分成64个单元,最后一个单元存放元数据。元数据中记录page中空闲内存的信息,例如 单元空闲位映射、空闲单元总数、最大连续空闲单元,使用DRAM存储bucket桶按最大连续空闲内存用双链表连接。当需要分配内存时,按照best-fit算法从链表中按顺序拿出page分配。bucket桶在NVM内存中具有备份。

在这里插入图片描述
在这里插入图片描述

算法实现:

在这里插入图片描述

2.4、释放操作,每次释放操作,就将元数据进行更改即可,并不改变 page在bucket中的位置。

2.5、重置操作,由于释放操作的存在,使得桶内page内的空闲空间变多,需要重置每个桶的page。

在这里插入图片描述

文中当桶内页面的空闲平均值大于该桶的预设值K时重置该桶的page。

2.6、思考与改进

标签:innerTile,i2,j2,j3,k2,outerTile,essaySummary,10.4
来源: https://blog.csdn.net/qq_45421539/article/details/120693642