论文研究-基于GPU的并行优化技术.pdf


-
针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法。实验结果表明,并行优化能有效提高算法在GPU上的执行效率,优化后累加和算法的运算速度相比标准并行算法提高了约34倍,相比CPU串行实现提高了约70倍。

-
2019-07-22
362KB
论文研究-基于GPU并行加速的2DPCA人脸识别算法 .pdf
2019-08-24基于GPU并行加速的2DPCA人脸识别算法,李晨昊,蒋砚军,人脸识别技术是一种基于人的脸部特征信息进行身份识别的一种识别技术。如今,人脸识别技术已经成为当今社会不可或缺的一个安全技
1.5MB
论文研究-基于GPU的并行协同过滤算法.pdf
2019-07-22为提高协同过滤算法的可伸缩性, 加快其运行速度, 提出了一种基于GPU(graphic processing unit)的并行协同过滤算法来实现高速并行处理。GPU的运算模式采用单指令多数据流, 适用
689KB
论文研究-基于GPU的高光谱纯净像元指数并行优化算法 .pdf
2019-08-16基于GPU的高光谱纯净像元指数并行优化算法,叶舜,吴泽彬,随着高光谱图像的空间和光谱分辨率逐渐增加,图像数据量越来越大,处理算法的复杂度也随之增加。传统高光谱处理算法的执行效率较
656KB
论文研究-基于GPU的重启PGMRES并行算法研究.pdf
2019-09-13重启的PGMRES算法是求解稀疏线性方程组高效的迭代方法之一,计算过程也比较稳定。为加快大规模稀疏线性方程组的求解速度,对重启PGMRES算法使用GPU并行方式进行并行算法实现。提出了ELL压缩存储格
1.15MB
论文研究-基于CPU与GPU协作的马尔可夫聚类的并行优化实现.pdf
2019-07-22马尔可夫聚类算法(MCL)为网络聚类问题提供了一个有效的方法,尤其是在社区问题和生物信息学方面。然而在MCL中矩阵的expansion是非常耗时的,因为两个大规模矩阵相乘的时间复杂度是n3,每个元素值
830KB
论文研究-GPU并行优化技术在水利计算中的应用综述.pdf
2019-09-08水利计算是水利规划、设计以及运行的基础,提高水利计算的效率对水利信息化和水资源管理具有重要实践意义。通过技术对比发现,GPU(Graphics Processing Unit)并行优化技术是性价比较高
595KB
论文研究-基于GPU-Hadoop的并行计算框架研究与实现.pdf
2019-07-22针对原生的Hadoop云平台处理海洋环境信息可视化效率不高的问题,提出了一种GPU嵌入Hadoop云平台的并行计算框架。该框架以原生Hadoop为基础,GPU并行计算与MapReduce相结合,实现了
815KB
论文研究-基于GPU的并行最小生成树算法的设计与实现.pdf
2019-07-22针对目前并行Prim最小生成树算法效率不高的问题,在分析现有并行Prim算法的基础上,提出了适于GPU架构的压缩邻接表图表示形式,开发了基于GPU的min-reduction数据并行原语,在NVIDI
96KB
论文研究-基于GPU的3D距离变换.pdf
2019-07-22距离变换在图像处理中有着非常广泛的应用。由于3D图像数据的复杂性,传统基于CPU的3D距离变换效率较低。为此,研究了将3D图像数据有效地组织到纹理中存储的方法,设计并实现了基于GPU的3D距离变换并行
527KB
论文研究-基于GPU的加锁并行化非结构网格生成方法研究.pdf
2019-09-11非结构网格的生成在时间和内存上有一定的缺陷,这里提出了一种新的方法,命名为GPU-PDMG,是基于CUDA架构的GPU并行非结构网格生成技术。该技术结合了GPU的高速并行计算能力与Delaunay三角
965KB
论文研究-基于CUDA的2D-3D配准技术的研究.pdf
2019-09-12Nvidia从GeForce8系列开始,在显卡上推出统一计算设备框架技术,使GPU的通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式
947KB
论文研究-基于GPU的PSO-BP神经网络DOA估计.pdf
2019-07-22粒子群优化(PSO)算法与误差反向传播(BP)算法相结合训练神经网络(PSO-BP-NN),可以有效提高网络的泛化能力,但是面临的最大问题就是计算时间过长。为此,提出了基于图形处理单元(GPU)的并行
1.52MB
论文研究-基于GPU的域乘法并行算法的改进研究 .pdf
2019-08-15基于GPU的域乘法并行算法的改进研究,曾庆怡,张明武,本论文介绍了GF(2m)域乘法运用CUDA编程语言在GPU(Graphic Processing Unit)上的并行加速的一般算法,并提出同样运用
1020KB
论文研究-并行群体仿真研究进展.pdf
2019-07-22通过对比分析基于多核CPU、GPU和分布式系统等三种并行群体仿真体系结构, 提出了混合结构的并行群体仿真框架; 对并行环境下的按空间区域分割和按agent分割等多种任务分割关键算法进行了归纳总结; 对
1.72MB
论文研究-基于GPU的复杂网络社区挖掘算法并行计算.pdf
2019-07-22由于复杂网络的规模越来越大, 在大规模的复杂网络中快速、准确地挖掘出隐藏的社区结构是当前该领域研究的热点问题。目前社区结构挖掘常用的基于快速Newman算法的社区结构挖掘算法之一是一般概率框架方法。以
462KB
论文研究-基于GPU的快速三维医学图像刚性配准技术.pdf
2019-07-22自动三维配准将多个图像数据映射到同一坐标系中,在医学影像分析中有广泛的应用。但现有主流三维刚性配准算法(如FLIRT)速度较慢,2563大小数据的刚性配准需要300 s左右,不能满足快速临床应用的需求
1.7MB
论文研究-基于GPU的单幅图像去雾的实现及优化.pdf
2019-07-22基于暗通道先验规律的去雾算法已取得了良好的去雾效果,但算法所需要的计算时间过长,无法达到实时去雾的要求。使用GPU初步并行实现了去雾算法,并确定了算法中需要优化的部分。在优化过程中,一方面将数据存储到
910KB
论文研究-基于GPU加速遗传算法的直接定位研究.pdf
2019-07-22针对大规模数据下遗传直接定位算法执行时间慢、实时性较差的问题,提出了基于GPU加速的并行遗传直接定位算法。根据直接定位代价函数特点,设计了GPU高速并行遗传进化架构,通过对适应度函数并行化计算以及对选
269KB
论文研究-利用GPU并行加速支持向量机的研究与实践 .pdf
2019-08-16利用GPU并行加速支持向量机的研究与实践,王亮,高占春,因为支持向量机预测的精度很高,它是非常著名的解决分类和回归问题的工具之一。然而,在训练过程使用非线性核函数的支持向量机算
910KB
论文研究-基于GPU的大规模人群疏散模拟.pdf
2019-07-22基于中央处理器(CPU)串行的人群疏散传统方法对于人群规模较少的场景,可以得到良好的疏散模拟效果,但在人群密度较高的场景中,难以达到实时模拟的要求。为了克服上述问题,实现了一种基于图形处理器(GPU)
819KB
论文研究-基于GPU的快速色阶映射算子实现.pdf
2019-07-22为了提高色阶映射计算的效率, 设计了基于GPU的快速色阶映射算法。首先结合基本规约算法和GPU的并行运算特征设计了基于两个核函数的最大亮度计算方法, 然后通过区域中间值共享计算以像素为中心的区域平均亮
682KB
论文研究-基于GPU加速的锥束CT重建算法研究.pdf
2019-09-08锥束计算机断层扫描(Cone-Beam Computed Tomography,CBCT)具有采集速度快和空间分辨率高等特点,被生物医学等领域广泛关注。然而通过CPU串行处理CBCT重建中海量投影数据
597KB
论文研究-基于GPU的AC模式匹配改进算法.pdf
2019-09-07字符串匹配算法的应用非常广泛,在信息检索、信息安全等领域都起着关键的作用。近年来,由于GPU通用计算的高速发展,且GPU具有很强的并行计算能力和很高的存储器访问带宽,利用GPU来加速字符串匹配算法吸引
430KB
论文研究-硅基光器件逆设计中基于GPU并行处理的高速FDFD算法 .pdf
2019-08-15硅基光器件逆设计中基于GPU并行处理的高速FDFD算法,郑立,董振理,本文实现了在硅基光器件逆设计中,基于GPU加速来求解电磁场的频域有限差分算法(Finite-Difference Frequenc
382KB
论文研究-基于GPU的血管造影图像增强方法.pdf
2019-07-23血管增强扩散算法遵循多尺度方法,利用非线性各向异性扩散方法进行血管增强,该方法在可视化不同半径的血管和增强血管外观上比现存的大部分方法都要好,但医学图像数据分辨率和灰度级都很高,多尺度选择和求解非线性
679KB
论文研究-遥感图像渐进式传输的GPU并行加速研究.pdf
2019-09-06精确的目标检测是目标跟踪和识别的重要前提。提出了一种基于固定摄像机环境下的运动目标检测方案,利用多高斯和马尔可夫随机场的混合模型对视频序列进行前景分割,以达到对运动目标检测的目的。建立了马尔可夫随机场
296KB
论文研究-基于GPU统一计算架构平台的实时阴影算法研究 .pdf
2019-08-16基于GPU统一计算架构平台的实时阴影算法研究,马晨,,本文改进了shadow map阴影映射算法,使其可以嵌入GPU通用并行计算架构处理。研究了一种用连续函数来逼近离散阴影测试函数的方法,可��
1.24MB
论文研究-基于GPU加速的粒子滤波多说话人跟踪算法及其应用.pdf
2019-07-22为了解决粒子滤波多说话人跟踪过程中粒子易发散导致多目标跟踪精度低的问题,提出了并行粒子滤波和基于GPU的K-均值聚类的多声源定位方法。该方法首先分析了粒子滤波在实现多目标跟踪时进行数据关联的过程产生较
571KB
论文研究-三种GPU并行的自适应邻域模拟退火算法.pdf
2019-09-10提出了三种新的GPU并行的自适应邻域模拟退火算法,分别是GPU并行的遗传-模拟退火算法,多条马尔可夫链并行的退火算法,基于BLOCK分块的GPU并行模拟退火算法,并通过对GPU端的程序采取合并内存访问
1.27MB
论文研究-基于GPU异构平台的实时CT图像重建系统的研究.pdf
2019-07-22针对采用单CPU CT图像重建时间长,采用CPU集群重建成本及能耗高的问题,提出了CPU多线程 GPU的异构重建模型。采用CPU多线程流水线模式,将整个任务分解为若干个处理阶段,相邻的两个阶段之间以循
-
学院
MySQL 高可用工具 heartbeat 实战部署详解
MySQL 高可用工具 heartbeat 实战部署详解
-
下载
SnapGene 3.2.1 Win安装.rar
SnapGene 3.2.1 Win安装.rar
-
学院
项目经理成长之路
项目经理成长之路
-
下载
A movie title explorer.zip
A movie title explorer.zip
-
博客
BTL_TX_7S
BTL_TX_7S
-
博客
第一章 InterSystems SQL简介
第一章 InterSystems SQL简介
-
博客
2021-03-01
2021-03-01
-
下载
计算机常见复试问题.pdf
计算机常见复试问题.pdf
-
学院
龙芯生态应用开发基础:C语言精要
龙芯生态应用开发基础:C语言精要
-
博客
php自动加载机制的实现
php自动加载机制的实现
-
博客
同类分析比较工具 google trend
同类分析比较工具 google trend
-
博客
jquery库是什么意思
jquery库是什么意思
-
博客
Windows/Linux实用工具;
Windows/Linux实用工具;
-
下载
DNAMAN.exe
DNAMAN.exe
-
博客
条件变量实现哲学家就餐
条件变量实现哲学家就餐
-
下载
马士兵老师HashMap学习笔记
马士兵老师HashMap学习笔记
-
下载
网上订餐系统 javaweb项目 (完整源码)
网上订餐系统 javaweb项目 (完整源码)
-
学院
libFuzzer视频教程
libFuzzer视频教程
-
下载
电机+L298Nmain.c
电机+L298Nmain.c
-
学院
MySQL 数据库权限管理(用户高级管理和精确访问控制)
MySQL 数据库权限管理(用户高级管理和精确访问控制)
-
博客
选出一周内出现某天从跌停价开盘到涨停价收盘的股票公式
选出一周内出现某天从跌停价开盘到涨停价收盘的股票公式
-
博客
TVM虚拟机配置
TVM虚拟机配置
-
学院
LVS + Keepalived 实现 MySQL 负载均衡与高可用
LVS + Keepalived 实现 MySQL 负载均衡与高可用
-
学院
MySQL 备份与恢复详解(高低版本 迁移;不同字符集 相互转换;表
MySQL 备份与恢复详解(高低版本 迁移;不同字符集 相互转换;表
-
博客
Vue项目首页-首页父子组件间的传值(7-9)
Vue项目首页-首页父子组件间的传值(7-9)
-
下载
智慧校园建设方案.ppt
智慧校园建设方案.ppt
-
学院
MySQL NDB Cluster 负载均衡和高可用集群
MySQL NDB Cluster 负载均衡和高可用集群
-
学院
项目管理工具与方法
项目管理工具与方法
-
博客
php split() 函数的用法
php split() 函数的用法
-
学院
NFS 网络文件系统
NFS 网络文件系统