没有合适的资源?快使用搜索试试~ 我知道了~
基于持久化内存的索引设计重新思考与优化.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 146 浏览量
2022-06-10
08:07:55
上传
评论
收藏 2.03MB DOCX 举报
温馨提示
试读
32页
基于持久化内存的索引设计重新思考与优化.docx
资源推荐
资源详情
资源评论
摘 要 非易失性内存, 是近几年来出现
的一种新型存储介质一方面,同传统的易失性内存一样,它有着低访
问延迟、可字节寻址的特性;另一方面,与易失性内存不同的是,掉
电后它存储的数据不会丢失,此外它还有着更高的密度以及更低的能
耗开销这些特性使得非易失性内存有望被大规模应用在未来的计算机
系统中非易失性内存的出现为构建高效的持久化索引提供了新的思路
由于非易失性硬件还处于研究阶段,因此大多数面向非易失性内存的
索引研究工作基于模拟环境开展在 年 月英特尔发布了基于
技术的非易失性内存硬件 !",这使得研
究人员可以基于真实的硬件环境去进行相关研究工作首先评测了真实
的非易失性内存器件,结果显示 !" 的写延迟接近 #!,而读延迟
是 #! 的 ~ 倍基于对硬件的实际评测结果,研究发现过去很多
工作对非易失性内存的性能假设存在偏差,这使得过去的一些工作大
多只针对写性能进行优化,并没有针对读性能进行优化因此,重新审
视了之前研究工作,针对过去的混合索引工作进行了读优化此外,还
提出了一种基于混合内存的异步缓存方法实验结果表明,经过异步缓
存方法优化后的混合索引读性能是优化前的 $ 倍,此外,经过异步
缓存优化后的持久化索引最多可以降低 %&的读延迟
关键词 非易失性内存;持久化内存;索引;存储系统;键值存储系统
非易失性内存, 是近几年来出现的
一类存储介质的统称,例如'(
)*
,##!
)*
,+,,#!
)*
等一方面,
这些存储介质同 #!-#!一样有着低访问延迟、可字
节寻址的特性;另一方面,与 #! 不同的是,它们具有非易失性、
较低的能耗和较高的存储密度这使得基于 技术的非易失性内存
有着更大的单片存储容量,同时能够作为存储设备保存数据若利用基
于非易失性内存构建存储系统,一方面,相对于传统基于内存的存储
系统而言,可以受益于非易失性内存的非易失、大容量、低能耗特点
)*
;另一方面,相对于传统基于磁盘的存储系统而言,可以受益于更低
的访问延迟以及更细粒度寻址方式因此, 技术有望被大规模的
应用在存储系统的研发与构建中,成为存储系统进一步发展的新机遇
键值存储系统是数据中心中一类重要的基础性存储设施,例如内
存 键 值 存 储 系 统 -
)%*
, #-
).*
和 磁 盘 键 值 存 储 系 统
/0
)1*
,#2 0
)$*
等无论是内存键值存储系统还是磁盘键值存
储系统,索引结构都是这些存储系统中非常重要的基础技术,一直以
来便是存储领域的热点研究问题在之前的研究工作中,索引结构大多
构建在 #! 中随着低访问延迟、可字节寻址、可持久化数据的
的出现,这使得基于 构建持久化的高性能索引成为可能近
年来,很多面向 的索引研究工作
).*
认为 有着同 #! 近
似的读延迟以及高于 #! 数倍的写延迟的特性因此,大部分研究工
作提出通过降低 写开销从而构建不同的高效持久化索引这些工
作基本可以分成 类:一类是针对单一索引结构的设计优化例如:
/3 4
)*
是 面向 设计 的 3 索 引, 它 使 用 层 的
3 表结构以降低表拓展时搬运的数据总量,
)*
是针对 0
5
树
索引的优化,它不对同一叶子节点内的数据进行排序,从而减少了插
入数据时的写开销,此外 , 还将内部节点放在 #! 以降低
树分裂时对 的写开销另一类是面向 #! 混合内存结构
的混合索引,例如,36
)%*
是基于 #! 构建的混合索引键值
存储系统,它对同一份数据同时维护 3 表和 0
5
树 种索引去保证
高效的读性能,为了 36 将写开销较低的 3 表放在的 而将
写开销较高的 0
5
树放在 #! 中,从而降低对 写负担
从 年开始, 便被计算机系统领域广泛研究然而,研究
早期 技术还未成熟,尚未有成熟的 设备可供使用,上述大
部分研究工作都是基于对非易失性内存器件的性能假设并使用模拟器
进行 实验 评测
)%*
年 月,英 特尔 公 司正 式发 布 了 基 于
技术
)1*
的 硬件产品 !"
)$*
,这为研究人员
基于真实的 硬件进行研究提供了基础目前,已有一些针对真实
硬件的评测工作显示,现有的 硬件有着接近 #! 的写延
迟以及高于其数倍的读延迟而之前研究工作所采用了如下性能假设:
有着同 #! 近似的读延迟, 有着高于 #! 数倍
的写延迟这些假设和现有真实 硬件性能评测结果并不完全相符
这使得我们需要重新审视之前基于 性能假设的索引研究工作,并
基于实际的 硬件特性开展有效的优化工作
本文的主要贡献有 个方面:
对最新的 !" 硬件进行了评测,我们评测了 !" 硬件的不同访
问线程、不同访问粒度下的读写延迟、带宽,以及读写混合下 !" 的
性能变化趋势
基于真实 !" 硬件评测结果,我们分别重新审视了之前研究工
作并针对混合索引结构和单一索引结构进行了优化针对混合索引结构,
本文基于 !" 硬件真实性能,重点关注索引放置的优化本文探索了不
同索引放置方式对混合索引结构的影响,当面临读密集的负载时,通
过将主索引放置在 #!,辅助索引放置在 !" 上,从而可以有效提
升索引的读性能本文针对不同应用场景,提出索引放置相应的设计原
则考虑我们针对混合索引37-8-9提出了读优化的改善方案
37-8-9
5
,该方案下 37-8-9 最多可提升 $&的读性能
针对单一索引结构,本文基于 !" 读延迟较高的特性,提出基
于 #! 的异步缓 存方法, 将 位于 中持 久化索引 通过高速
3 索引的方式缓存在 #! 中,从而获得高效的访问性能此外,
本文还针对 :,
)*
、:!+,:!8#
)*
和持久化跳表
)*
实现了异步缓存,
评测结果显示经过我们的优化,最多可以降低持久化索引 &~%&
的读延迟
1 非易失性内存简介
在实际的 硬件投放市场之前,学界对持久化内存的访存特性
具有一些基本假设,比如: 有着数倍于 #! 的写延迟及相近
的读延迟该假设是否成立尚需物理器件的验证此外,非易失性内存的
具体特性尚处于未知,如访问粒度对延迟带宽的影响、多线程对延迟
带宽的影响、混合访存对延迟带宽的影响等对 !" 进行详细的测试可
以为我们揭示一类非易失性内存的物理特性,为研究者和开发者在后
续基于非易失性内存的工作中提供参考,也可为系统工作者构建包含
非易失性内存的新型存储系统提供参考本节主要介绍了非易失性内存
的特性,并对当今最新的 硬件在各个维度进行了详细的评测
1.1 非易失性内存技术
与传统 #! 一样,可以被挂载在 (; 地址总线上按字节
进行寻址如表 所示,目前已有多种可用于生产持久化内存的存储介
质这些介质有着接近 #! 的纳秒级读写延迟以及更高的集成密度
此外,相比 #! 需要频繁的刷新去记录数据,非易失性内存介质不
需要频繁的刷新去保证数据的有效性,这使其能耗相比 #! 更低
,7( < <=+4-
)*
表
不同存储介质的特性对比
)*
需要注意的是,表 仅为不同存储介质的性能对比而非实际的存
储硬件性能 设备的复杂性要求我们进行细致的评测和分析以获
得硬件的实际性能和详细特性
剩余31页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3658
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功