论文研究-基于预测缓存的低功耗TLB快速访问机制.pdf

需积分: 2 122 浏览量 2019-07-22 18:51:39 上传评论收藏 575KB PDF 举报

资源推荐

资源详情

资源评论

　　收稿日期：２０１０唱１２唱１３；修回日期：２０１１唱０３唱０２　　基金项目：国家“８６３” 高科技研究发展计划资助项目（２００４ＡＡ１Ｚ１０２０）

作者简介：武淑丽（１９８７唱），女，河南周口人，硕士，主要研究方向为数字ＩＣ前端设计和验证（ｆａｄｅａｗａｙ１０００＠１６３．ｃｏｍ）；孟建熠（１９８２唱），男，博

士后，主要研究方向为高性能低功耗嵌入式处理器的设计与研究；王荣华（１９８５唱），男，博士研究生，主要研究方向为嵌入式处理器的设计以及验

证；严晓浪（１９４７唱），男，教授，博导，主要研究方向为超大规模集成电路设计、ＶＬＳＩ设计自动化；葛海通（１９７２唱），男，高级工程师，主要研究方向为

嵌入式处理器设计与验证．

基于预测缓存的低功耗ＴＬＢ快速访问机制

倡

武淑丽，孟建熠，王荣华，严晓浪，葛海通

（浙江大学超大规模集成电路设计研究所，杭州３１００２７）

摘　要：基于存储器访问局部性原理，提出了一种基于预测缓存的低功耗转换旁置缓冲器（ＴＬＢ）快速访问机

制。该机制采用单端口静态随机存储器（ＳＲＡＭ）代替传统的内容寻址存储器（ＣＡＭ）结构，通过匹配搜索实现全

相连ＴＬＢ的快速访问，在两级ＴＬＢ之间设计可配置的访问预测缓存，用于动态预测第二级ＴＬＢ访问顺序，减少

第二级ＴＬＢ搜索匹配的延时，并有效降低第二级ＴＬＢ访问功耗。采用该机制明显降低了ＴＬＢ的缺失代价，当第

一级ＴＬＢ缺失时访问第二级ＴＬＢ的平均访问延时接近１个时钟周期，约为原有平均访问延时的２０％，增加的面

积开销仅为原内存管理单元的１畅８１％左右，具有低成本、低功耗的特征。

关键词：内存管理单元；两级转换旁置缓冲器；内容寻址存储器；静态随机存储器；预测缓存；快速访问；低功耗

中图分类号：ＴＰ３９３畅０８　　　文献标志码：Ａ　　　文章编号：１００１唱３６９５（２０１１）０８唱２９６４唱０３

ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１００１唱３６９５．２０１１．０８．０４５

ＦａｓｔａｎｄｌｏｗｐｏｗｅｒＴＬＢａｃｃｅｓｓｍｅｃｈａｎｉｓｍｗｉｔｈｐｒｅｄｉｃｔｉｏｎｂｕｆｆｅｒ

ＷＵＳｈｕ唱ｌｉ，ＭＥＮＧＪｉａｎ唱ｙｉ，ＷＡＮＧＲｏｎｇ唱ｈｕａ，ＹＡＮＸｉａｏ唱ｌａｎｇ，ＧＥＨａｉ唱ｔｏｎｇ

（ＩｎｓｔｉｔｕｔｅｏｆＶＬＳＩＤｅｓｉｇｎ，ＺｈｅｊｉａｎｇＵｎｉｖｅｒｓｉｔｙ，Ｈａｎｇｚｈｏｕ３１００２７，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：ＴｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｄａｆａｓｔａｎｄｌｏｗｐｏｗｅｒＴＬＢａｃｃｅｓｓｍｅｃｈａｎｉｓｍｗｉｔｈｐｒｅｄｉｃｔｉｏｎｂｕｆｆｅｒｂａｓｅｄｏｎｍｅｍｏｒｙａｃｃｅｓｓｌｏ唱

ｃａｌｉｔｙｐｒｉｎｃｉｐｌｅ，ａｎｄｄｅｓｉｇｎｅｄａｔｗｏ唱ｌｅｖｅｌＴＬＢｓｔｒｕｃｔｕｒｅｉｍｐｌｅｍｅｎｔｅｄｂｙＳＡＲＭｉｎｓｔｅａｄｏｆＣＡＭｔｏａｃｈｉｅｖｅｆａｓｔａｃｃｅｓｓｏｆｔｈｅ

ｆｕｌｌａｓｓｏｃｉａｔｅｄＴＬＢ．ＢｅｔｗｅｅｎｔｈｅｔｗｏｌｅｖｅｌｓｏｆｔｈｅｉｎｔｒｏｄｕｃｅｄＴＬＢ，ａｎｉｎｄｅｐｅｎｄｅｎｔａｎｄｈａｒｄｗａｒｅｃｏｎｆｉｇｕｒａｂｌｅｐｒｅｄｉｃｔｉｏｎｂｕｆｆ唱

ｅｒｗａｓｄｅｓｉｇｎｅｄｔｏｄｙｎａｍｉｃａｌｌｙｐｒｅｄｉｃｔｔｈｅａｃｃｅｓｓｓｅｑｕｅｎｃｅｓｏｆｔｈｅｓｅｃｏｎｄｌｅｖｅｌＴＬＢ，ｗｈｉｃｈｃｏｕｌｄｒｅｄｕｃｅｉｔｓａｃｃｅｓｓｐｅｎａｌｔｙ

ｗｈｅｎｔｈｅｆｉｒｓｔｌｅｖｅｌＴＬＢｍｉｓｓｅｄａｎｄｓｉｇｎｉｆｉｃａｎｔｌｙｒｅｄｕｃｅｔｈｅｄｙｎａｍｉｃｐｏｗｅｒｃｏｎｓｕｍｐｔｉｏｎｗｉｔｈｌｉｔｔｌｅｃｏｎｔｒｏｌｌｏｇｉｃ．Ｅｘｐｅｒｉｍｅｎｔ

ｓｈｏｗｓｔｈａｔｃｏｍｐａｒｅｄｗｉｔｈｔｈｅｔｒａｄｉｔｉｏｎａｌｔｗｏ唱ｌｅｖｅｌＴＬＢｓｔｒｕｃｔｕｒｅ，ｔｈｅａｖｅｒａｇｅａｃｃｅｓｓｃｙｃｌｅｓｏｆｔｈｅｓｅｃｏｎｄｌｅｖｅｌＴＬＢａｒｅａｂｏｕｔ

２０％ｏｆｔｈｅｔｒａｄｉｔｉｏｎａｌｏｎｅ，ｗｉｔｈｏｎｌｙ１．８１％ａｒｅａｉｎｃｒｅｍｅｎｔ，ｗｈｉｃｈｓｕｐｐｏｒｔｌｏｗｐｏｗｅｒａｎｄｌｏｗｃｏｓｔｅｍｂｅｄｄｅｄａｐｐｌｉｃａｔｉｏｎ．

Ｋｅｙｗｏｒｄｓ：ＭＭＵ；ｔｗｏ唱ｌｅｖｅｌＴＬＢ；ＣＡＭ；ＳＲＡＭ；ｐｒｅｄｉｃｔｉｏｎｂｕｆｆｅｒ；ｆａｓｔａｃｃｅｓｓ；ｌｏｗ唱ｐｏｗｅｒ

０　引言

当前的高端嵌入式处理器均在片内集成了内存管理单元

（ＭＭＵ），它是支持虚拟处理器的核心部件，实现虚拟地址到物

理地址的映射、存储访问权限的控制以及地址属性的设置等功

能。其中，转换旁置缓冲器（ｔｒａｎｓｌａｔｉｏｎｌｏｏｋ唱ａｓｉｄｅｂｕｆｆｅｒ，ＴＬＢ）

是ＭＭＵ的核心部件，完成虚拟地址到物理地址的实时转换。

目前的ＴＬＢ架构主要基于内容寻址存储器（ｃｏｎｔｅｎｔａｄｄｒｅｓｓａｂｌｅ

ｍｅｍｏｒｙ，ＣＡＭ），其基本原理是对输入内容与存储单元中的每

个表项进行并行比较获得匹配信息，在一定程度上提升了ＴＬＢ

表项匹配速度。ＣＡＭ的缺点是：它是定制的，因此其工艺跃迁

性差，设计和维护的成本高，并且大量数据的并行比较所产生

的功耗是十分明显的。如文献［１］ＴＬＢ耗能约占缓存总功耗

的２０％～２５％，而在ＳｔｒｏｎｇＡＲＭ

［２］

和ＨｉｔａｃｈｉＳＨ唱３这两款嵌入

式处理器中，ＴＬＢ耗能分别占总功耗的１７％和１５％

［３］

之多。

目前常见的措施是在ＣＡＭ结构的前提下，通过优化ＴＬＢ

访问机制，实现性能提升、功耗降低的目的。如Ｂａｎｋｅｄ

ＴＬＢ

［４，５］

提出将整个ＴＬＢ分成几路相联的块，通过部分信息比

较获得当前访问的ＴＬＢ区块，但是该机制的ＴＬＢ页面缺失率

较高，空间使用率低，会引起较大的性能损失。支持多种页面

大小的ＴＬＢ

［６，７］

，通过在硬件上支持两种或多种页面大小来获

得高性能，但是该方法需要额外的硬件资源来创建大页ＴＬＢ，

增加了较大的硬件开销。当前实际工程中，嵌入式处理器常采

用分层结构的ＴＬＢ访问机制，这是因为嵌入式应用具有较强

局部性特征，在面向嵌入式应用的ＭＭＵ设计中可通过挖掘数

据访问局部性的方法，将最频繁访问的页面集中在若干的ＴＬＢ

内，实现了ＴＬＢ性能的提升和ＣＡＭ地址比较转换功耗的降

低，如Ｖｉｃｔｉｍ唱ＴＬＢ

［８］

和Ｆｉｌｔｅｒ唱ＴＬＢ

［９，１０］

等。在两级ＴＬＢ访问机

制中，第一级ＴＬＢ表项较少，查询速度很快，第二级表项多，查

询速度较慢。由于程序访问的空间特性，第一级ＴＬＢ能够完

成绝大部分地址转换工作，避免了对第二级ＴＬＢ存储器的频

繁访问，不仅节约了匹配时间，同时显著降低了第二级ＴＬＢ的

动态功耗

［１１］

。但是当第一级ＴＬＢ发生缺失时，则需多个时钟

周期访问第二级ＴＬＢ，性能和功耗损失严重。第二级ＴＬＢ访

问延时和功耗成为两级ＴＬＢ架构功耗的重要组成部分。

本文提出的低功耗ＴＬＢ快速访问机制是分层结构的，第

二级ＴＬＢ基于普通单端口ＳＲＡＭ，使用ＳＲＡＭ可避免ＣＡＭ的

成本和功耗问题，并且可增加ＴＬＢ工艺跃迁的灵活性。

第２８卷第８期

２０１１年８月　

计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ

Ｖｏｌ畅２８Ｎｏ畅８

Ａｕｇ畅２０１１

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余3页未读，立即下载

评论收藏

内容反馈

weixin_39840515

粉丝: 446
资源: 1万+

论文研究-基于预测缓存的低功耗TLB快速访问机制.pdf

最新资源