在天河2号超级计算机上使用Intel Xeon Phi协处理器加速电子层析成像重建算法ICON
电子层析成像(Electron Tomography,ET)是一种研究三维细胞超微结构的重要方法。通过与亚体积平均方法相结合,ET为研究原位大分子复合物在亚纳米分辨率下的新可能性提供了可能。然而,由于采样角度有限,ET重建通常会遇到“缺失楔子”问题。为了恢复验证缺失的信息,迭代压缩感知优化的非均匀快速傅里叶变换重建(Iterative Compressed-sensing Optimized Non-Uniform Fast Fourier Transform Reconstruction,ICON)算法在低信噪比生物ET数据集的恢复方面显示出其强大的能力。但ICON算法巨大的计算需求成为了其应用的瓶颈。 天河2号超级计算机是目前世界上最快的超级计算机之一,其峰值计算能力达到了每秒54.9千万亿次浮点运算(PFlops)。Intel Xeon Phi协处理器是专门为高性能计算设计的多核处理器,具备强大的计算能力与并行处理性能,其架构基于x86指令集并支持广泛的并行计算技术。天河2号超级计算机上使用Intel Xeon Phi协处理器,对 ICON 算法进行加速,对于解决大规模计算问题具有重要的意义。 在这项研究中,研究者们首先开发了NUFFT(Non-Uniform Fast Fourier Transform)和ICON算法的并行化策略,然后在Xeon Phi 31SP协处理器上实现了这些策略,生成了并行程序ICON-MIC。为了进一步提升计算性能,研究者们又提出了混合任务分配策略,并在天河2号超级计算机的多个Xeon Phi卡上扩展了ICON-MIC,生成了程序ICON-MULT-MIC。通过这种方式,他们实现了高准确度下的显著加速效果,与CPU版本相比,ICON-MIC在加速比上可达到13.3倍。同时,ICON-MULT-MIC在天河2号超级计算机上表现出了良好的弱可扩展性和强可扩展性。 在进一步讲解之前,我们先要了解几个关键的专有名词: 1. 迭代压缩感知优化的非均匀快速傅里叶变换重建(ICON)算法:这是一个专为生物电子层析成像设计的算法,它通过迭代过程和压缩感知技术来优化处理非均匀采样下的图像重建。 2. 非均匀快速傅里叶变换(NUFFT):这是一个用于从非均匀采样的数据中进行快速傅里叶变换的算法,用于图像重建过程中信号的频域分析。 3. 天河2号超级计算机:这是一台位于中国国家超级计算机中心的超级计算机,曾经是全球最快的计算机之一。 4. Intel Xeon Phi协处理器:这是英特尔推出的一类基于x86架构的众核处理器,主要面向高性能计算市场,具有高度并行化的计算能力。 在天河2号超级计算机上使用Intel Xeon Phi协处理器加速ICON算法的过程,研究者们面临的主要挑战是算法的并行化设计。由于NUFFT和ICON算法在本质上对数据依赖性较强,必须仔细设计数据的分布和任务的划分,以确保计算效率的最大化。研究者们通过开发了高效的并行策略来解决这一问题,不仅将算法分解为可以并行处理的子任务,还充分考虑到数据传输的开销,从而提高了整体的计算效率。 在这项工作中,研究者们使用混合任务分配策略,即在多个Xeon Phi协处理器上合理分配计算任务。这一策略的提出充分利用了天河2号超级计算机的多核计算资源,通过有效的负载平衡和减少处理器间的通信延迟来提升整体性能。最终,ICON-MULT-MIC在天河2号超级计算机上表现出了优异的加速效率和可扩展性,有效支持了大规模生物电子层析成像数据的快速处理。 整个研究不仅仅是对算法的优化,还涉及到对天河2号超级计算机的并行计算架构的深入理解和应用。研究者们需要对超级计算机的硬件资源、内存带宽、I/O性能等有充分的认识,并基于这些硬件特点设计高效的软件实现。同时,这项工作的成功也反映出中国在高性能计算和生物成像领域的技术进步,体现了天河2号超级计算机强大的计算能力在科学研究中发挥的重要作用。
- 粉丝: 2
- 资源: 871
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助