Khronos Groups 2019 年发布的“The OpenVX
TM
Specification 1.3”,是计算
机视觉算法和机器智能加速跨平台规范的最新版本,支持各种现代硬件体系结
构,如移动系统、嵌入式 SOC 系统和桌面系统
[1]
。视觉系统内层次结构通常是
复杂并且不一致的,OpenVX 旨在最大程度地跨不同的硬件平台实现功能和性
能的可移植性,从而提供一种标准化的、对应用程序影响最小的计算机视觉框
架
[1]
,便于硬件厂商选择不同的方式实现硬件加速。这使得高性能处理器和显卡
制造商 AMD、GPU 的发明者和人工智能计算的引领者 NVIDIA、全球最大的
CPU 制造商 Intel 等越来越多的公司采用 OpenVX 开源规范。
在信息时代,计算机视觉扮演着非常重要的角色,将越来越广泛地进入各个
领域,均需要对图像进行高速处理
[2]
,并行计算相比串行计算有更快的求解问题
的速度,可以缩短计算时间
[3]
。并行性主要通过三种方式应用于计算机视觉处理:
(1)数据并行;(2)任务并行;(3)流水线并行
[4]
。
结合以上两方面,本文提出了一种具有并行处理能力的专用指令集处理器
(application specific instruction set processor,ASIP)
[5]
,对 OpenVX 规范 1.3
中 58 个核函数分别构建图执行模型,并映射到该架构上,通过微程序优化其计
算流程,实现最终的硬件加速。结果表明,该架构可以随着处理元件的数量实现
线性加速。
1 OpenVX 并行处理 器架构 介绍
1.1 互 联 网 络 结 构 的提 出
PE(processing element)间的互联网络拓扑结构是并行处理系统的重要
组 成 部 分 ,由 文 献 [6]得 出 ,如 图 1 所 示 的 分 层 交 叉 连 接 网 络 ( hierarchically
cross-connected mesh,HCCM)在各方面性能均优于经典的 2DMesh 拓扑结
构和以 2DMesh 为基础扩展的 Xmesh
[7]
。
图 1
评论0
最新资源