标题中提到的“PMC模型”指的是Preparata、Metz和Chien提出的系统级故障诊断模型,该模型是一种理论框架,用于在多处理器系统中识别有故障的处理器。而“DQcube”则是一个n维的立方体网络,是多处理器系统互联网络的一种拓扑结构。在“故障诊断”这一概念下,文章旨在探讨如何在PMC模型下对DQcube进行故障诊断,并确定其故障诊断能力。
在故障诊断领域,可靠性评估对于多处理器或多计算机系统的构建、维护和改进至关重要。系统级诊断是通过解析测试综合症来识别多处理器系统中故障处理器的主要策略。文章首先建立了n维DQcube的代数结构DQ(m,d,n),然后展示了DQ(m,d,n)的经典诊断能力、强诊断能力、悲观诊断能力和条件诊断能力分别是n+1、n+1、2n和4n-3。此外,文章还建立了DQcube的紧密超连通性和3-额外连通性。
本文中还涉及到一些关键词,包括“经典诊断能力”(Classic diagnosability)、“强诊断能力”(Strong diagnosability)、“悲观诊断能力”(Pessimistic diagnosability)和“条件诊断能力”(Conditional diagnosability)。这些概念分别指出了在不同程度的故障假设下,系统能够识别故障处理器的能力。
文章还提到了“额外连通性”(Extraconnectivity)的概念,它指的是网络拓扑在移除一定数量的节点或链接后,仍然保持连通的能力,这对于故障容错非常重要。
故障诊断算法的设计通常需要考虑到各种因素,例如测试结果的综合分析、相邻处理器的测试执行等。算法的目标是通过有效的分析来找出故障处理器。
文章的介绍部分提到了大规模的多处理器或多计算机系统通常采用互连网络作为基础拓扑结构。近年来,如神威·太湖之光超级计算机和天河二号超级计算机等超级计算机的规模正在迅速扩大。随着网络规模的迅速增长,网络组件的故障是不可避免的,因此迫切需要进行互连网络的故障诊断。
这篇文章是关于如何在PMC模型下对DQcube这种特定的网络拓扑结构进行故障诊断的研究。研究内容包括对DQcube的代数结构建立、不同诊断能力的计算以及额外连通性分析。这些工作对于理解和提高大型多处理器系统的可靠性具有重要的理论和实际意义。通过这些研究,系统设计者可以更好地为大型计算机系统构建有效的故障诊断系统,从而在发生故障时快速识别并处理问题,保障系统的稳定运行。