可扩展和优化的深度学习平台设计的跨软硬件边界探索资源-CSDN文库

98 浏览量 2021-03-09 01:18:42 上传评论收藏 990KB PDF 举报

在信息技术领域，尤其是深度学习平台的构建，设计一个可扩展和优化的系统是一项挑战性工作。这种平台设计需要深入探索硬件和软件之间的边界，以确保系统能够高效地处理数据，优化计算资源的使用，以及适应不断变化的计算需求。深度学习系统通常由多个层次的结构组成，在不同的应用领域中越来越普遍。为了获得良好的性能表现，多核CPU和加速器被广泛应用于现实系统中。本文的作者Baozi Chen, Lei Wang, Qingbo Wu, Yusong Tan和Peng Zou通过在不同硬件平台上运行Caffe，并使用不同的计算设置来训练LeNet-5网络，并在MNIST数据集上测量每个层的前向和后向传递的时间。他们发现，加速效果在不同层中表现不一，并且在处理网络的不同阶段时，多核CPU的可扩展性也有所不同。基于这些观察，作者们提出对于不同的层应用不同的策略，以实现整体的最优性能。此外，他们的基准测试结果可用于开发针对网络的各个层次的专用加速方法。文章标题中提到的“跨软硬件边界探索”，意味着在设计深度学习平台时，需要充分考虑硬件和软件的交互，以及它们各自的优势和限制。软件层面需要有适应性，能够将复杂的深度学习算法映射到硬件上，而硬件则需要有足够的灵活性来满足这些算法的计算需求。这种探索还涉及到对计算模式的合成，即在多跳控制网络中对循环执行模式的共同合成，以及对于近阈值计算中的聚焦诱导故障攻击策略的研究。深度学习平台的设计还需要考虑到人工智能神经网络（Artificial Neural Networks，ANNs）、嵌入式计算、多核系统、多线程等技术。在这些技术的基础上，平台设计者需要考虑如何将深度学习算法有效地部署到具有不同计算能力的硬件平台上。在深度学习系统中，多核CPU和GPU的使用是提升计算性能的关键。GPU在深度神经网络的计算中可以显著加速，但其在多核CPU上的性能可扩展性并不理想。这意味着不同的硬件平台上，深度学习的计算性能会有所不同。此外，当处理不同阶段的网络时，多核CPU的性能也会发生变化。因此，对于深度学习平台的设计，需要针对每个层次分别应用不同的策略，以达到整体优化的性能。这是通过基准测试来实现的，基准测试能够提供开发针对网络中每个层次的专用加速方法的参考。研究论文中还提到了在近阈值计算中的故障攻击策略探索（FIFA），这种研究有助于理解在极限功耗和性能条件下的潜在安全风险，并且对于设计更加安全的深度学习平台具有指导意义。在文章的引言部分，作者强调了近年人工神经网络驱动的学习能力的复兴，特别是由多层神经网络组成的深度学习系统在多样化领域的不断呈现。对于如何构建可扩展和优化的深度学习平台，本文提出了一种跨硬件和软件边界的探索方法，这种方法有助于优化性能，同时降低计算资源的使用。本研究论文强调了深度学习平台设计中的多个核心知识点，包括深度学习系统的性能优化、软硬件协同设计、多核CPU与GPU的性能差异、针对不同层次采取不同加速策略的必要性，以及利用基准测试来指导专用加速方法的开发。这些知识点为研究者和工程师提供了一个全面而深入的视角，以设计、评估和优化复杂的深度学习平台。

资源推荐

资源详情

资源评论

DECEMBER 2018 VOLUME 10 NUMBER 4 ESLMAP (ISSN 1943-0663)

LETTERS

Cross Hardware-Software Boundary Exploration for Scalable and Optimized Deep Learning Platform Design ......

...............................................................B. Chen, L. Wang, Q. Wu, Y. Tan, and P. Zou 107

Co-Synthesis of Loop Execution Patterns for Multihop Control Networks .......S. Ghosh, S. Dey, and P. Dasgupta 111

FIFA: Exploring a Focally Induced Fault Attack Strategy in Near-Threshold Computing ..........................

..........................P. B asu, C. R a ja m an i kk a m, A . B al , P. Pan d ey, T. C ar t er, K. C h ak ra b or t y, a nd S . R oy 115

Sensor Signal Processing Using High-Level Synthesis With a Layered Architecture ..............................

..................................H. Hihara, A. Iwasaki, M. Hashimoto, H. Ochi, Y. Mitsuyama, H. Onodera,

H. Kanbara, K. Wakabayashi, T. Sugibayashi, T. Takenaka, H. Hada, M. Tada, M. Miyamura, and T. Sakamoto 119

2018 INDEX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余4页未读，立即下载

评论收藏

内容反馈