在数字电路系统设计领域,随着系统规模的不断增大和复杂性的提高,系统的可靠性成为了设计和运行中至关重要的问题。特别地,在一些特殊的应用场合,如长期运行且环境恶劣的电子设备,或是技术人员难以及时维护的情况下,对电子系统自适应能力的要求更为迫切。这种情况下,系统在发生故障后能够自我检测错误,并启动自修复机制以修正错误,维持系统的正常运行显得尤为重要。针对这一需求,研究基于FPGA(现场可编程门阵列)的数字电子系统的容错机制显得尤为必要。
FPGA作为一种基于SRAM编程的可编程逻辑设备,它不仅实现了系统的在系统可编程(ISP)和在系统可重新编程(ISR),还确立了动态重构技术。动态重构技术为系统故障,尤其是不可预料故障的动态修复提供了可能。系统可重构是提高系统可靠性的基本方法,它包括故障预防和容错设计。故障预防是指抑制故障的产生,而容错则是指系统出现错误时,能够依靠内部机制继续正常工作。
容错系统的基本设计方法是利用冗余逻辑资源来屏蔽故障的影响。然而,对于不可预料的故障,传统的冗余模块设计无法应对,这要求系统具有自适应和自修复的能力。实时电路重构作为解决随机故障容错的最佳方案,允许在电子系统工作状态下动态改变电路的结构。这种重构通常是通过系统中可编程器件的重新配置来实现,使得硬件信息可以动态地被调用或修改。
在可重构系统中,硬件信息(配置信息)的管理类似软件程序,这使得硬件可以像软件一样被使用,即“硬件软件化”。这种系统兼具硬件的高性能和软件的灵活性,是数字电路设计领域的一个重要进展。可重构系统按照重构方式的不同,可以分为模块级重构和元件级重构。模块级重构涉及子模块的结构改变,可能需要中断系统工作,因此在在线系统自修复场合存在灵活性不足的问题。而元件级重构则只需改变元件的逻辑功能,并在重构时可进行系统工作,这类系统设计较为复杂,但灵活性大,适合在线修复。
按照重新配置方式的不同,可重构系统又可分为动态可重构和静态可重构。静态重构需要中断系统运行,而动态重构则不需要,在工作状态下即可完成重构。动态重构系统能够实时适应内部条件和外部环境的变化,提升系统的可靠性和灵活性。
国外学者尝试将进化算法与可编程器件结合,形成了仿生硬件。其中,进化型仿生硬件可以通过进化过程获得满足特定要求的电路和系统结构,使系统能够自动调整内部结构以适应环境变化。胚胎型仿生硬件则能够像生物一样实现自我繁殖和自修复功能。
在本研究中,作者通过分析FPGA电子器件实现容错的基本原理和方法,并结合国内外的研究成果和研究方向,对未来技术的发展趋势进行了展望。主要内容包括提高系统可靠性的方法、系统可重构的概念、容错系统设计、实时电路重构的技术实现、以及仿生硬件的发展方向。这些研究内容不仅为设计和实施容错的FPGA系统提供了理论基础和实践指导,而且对于推动数字电路设计方法学的发展和提高电子系统整体性能均具有重要意义。