在当前的3D集成电路通信技术中,3D网络芯片(NoCs)已经成为一个主要的研究趋势,引起了学术界的广泛关注。3D集成技术基于传统的二维集成电路(ICs),通过垂直堆叠多个晶圆层和介电层,显著缩短了芯片内部线路长度,从而大幅度减少了系统通信延迟和开销。网络芯片(NoC)是3D集成电路(3DICs)中主流且有效的通信技术。
文章介绍的LOFT(Low-Overhead Fault-Tolerant routing scheme)是针对3D Mesh NoC提出的低开销容错路由方案,该方案不需要任何虚拟信道(VCs)。研究针对的是永久性链路故障的场景。永久性链路故障是指由于物理损伤、制造缺陷、老化或其他原因导致的链路无法正常工作的情况。在这些情况下,容错路由方案被看作是保证2D NoCs性能的有效机制。
LOFT采用基于逻辑的路由方法,名为LBDRe2,该方法是通过Turn模型Complete-OE指导的。实验结果表明,LOFT相较于现有的可靠路由方案,具有更好的性能、更高的可靠性以及更低的开销。
LOFT方案的设计关键在于解决了死锁问题。在多跳网络通信中,死锁可能由于路由循环而产生,这会导致网络中的数据包无法继续传输。LOFT通过采用一种特别设计的路由策略来避免死锁。在路由决策中,LBDRe2路由算法确保了没有路由循环的产生,进而保障了数据包传输的顺畅性。这在设计网络芯片的路由协议时是至关重要的。
文章强调了3D Mesh NoC的结构特点。3D Mesh NoC由多个处理元素(PEs)组成,并且每个PE通过网络接口(NIs)与路由器/交换节点(称为node)进行通信。不同的node通过水平或垂直的链路相互连接。在这样的结构中,由于三维空间的增加,网络中的链路数量也会增加,从而提高了出现永久性链路故障的可能性。因此,需要一个有效的容错路由方案来处理这些故障,保证系统的鲁棒性。
文章提到的永久性链路故障是指那些无法通过软件修复或者重配置硬件的方式恢复的故障。对于这类故障,需要硬件层面上的容错机制,例如LOFT所提供的路由方案,可以实现绕过有故障的链路进行数据传输。
在设计3D Mesh NoC时,为了提高容错能力,通常会增加一些冗余路径或使用某些容错算法来实现故障自动检测与隔离,并重新路由。这种设计能够提高整个网络的可靠性,但同时也会带来额外的开销,如硬件资源占用的增加、路由延迟的增加以及功耗的提升。
LOFT路由方案的优点在于其低开销。一般来说,传统的容错路由方案可能会引入较多的虚拟信道来提供多个数据传输的选择路径,虚拟信道的引入会增加路由器的复杂性和网络的通信开销。而LOFT方案不使用虚拟信道,这减少了对硬件资源的需求,同时简化了路由算法,使得在保证性能的同时降低了实现的复杂度和成本。
LOFT方案为3D Mesh NoC提供了一个有吸引力的容错路由选项,它有效地平衡了容错能力和系统开销之间的关系,并且在实际应用中表现出了良好的性能。这对于未来3D集成电路技术的发展和实际应用具有重要的理论和实践意义。