• 基于图形处理器(GPU)的通用计算

    伴随着 级微机的崛起和普及,多年来计算机图形的大部分应用发生了从工作站向微机的大转移,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时(中、小规模)应用中这一切的发生从很大程度上源自于图形处理硬件的发展和革新近年来,随着图形处理器( )性能的大幅度提高以及可编程特性的发展,人们首先开始将图形流水线的某些处理阶段以及某些图形算法从 向 转移除了计算机图形学本身的应用,涉及到其他领域的计算,以至于通用计算近 年来成为 的应用之一,并成为研究热点文中从若干图形硬件发展的历史开始,介绍和分析最新 在通用计算方面的应用及其技术原理和发展状况,并结合作者自身的实践讨论和探索其发展前景。

    0
    204
    842KB
    2013-06-08
    10
  • 基于OpenCL的异构系统并行编程

    对异构处理器在传统通用计算中利用率低的问题,提出基于开放计算语言OpenCL(opencomputing language)的新的通用计算技术,它提供了统一的编程模型。介绍了OpenCL的特点、架构及实现原理等,并提出OpenCL性能优化 策略。将OpenCL与计算统一设备架构CUDA(computeunified device architecture)及其它通用计算技术进行对比。对比 结果表明,OpenCL能够充分发挥异构处理平台上各种处理器的性能潜力,充分合理地分配任务,为进行大规模并行计算 提供了新的强有力的工具。

    4
    252
    443KB
    2013-06-08
    10
  • 基于OpenCL的频繁项集挖掘研究

    随着当今信息技术的高速发展,人们日常生产生活中产生的数据量呈现出爆 发式增长。因此,对于海量数据集的处理已成为数据挖掘技术的主要挑战。而如 何能以高性价比的方式挖掘到有价值的信息是目前数据挖掘研究的新课题。 GPu通用计算技术的R益成熟为数据挖掘技术的发展注入了新的动力。 GPU通过与CPu截然不同的发展路线,由当初的专用图形处理器一步步走进今 天的通用计算领域,并且正在向传统架构的超级计算机发起挑战。很显然,数 据挖掘这类计算密集型应用也必将受益于现代GPU所提供的廉价大规模并行计 算能力。 关联规则是数据挖掘的重要技术之一,而其中的频繁项集计算任务又是整 个算法的核心,研究如何利用GPu通用计算技术来加速频繁项集挖掘具有一定 的理论与实际意义。本文通过分析与总结过去关于频繁项集挖掘的研究成果, 设计了一种基于OpencL的CPU+GPU异构执行的挖掘算法,利用OpenCL创 建大规模并发线程来加速计算Apriori算法中的计算密集部分。实验采用OpenCL 的Java绑定接口来具体实现,并选择了同一级别的CPu与GPu用于改进后算 法与原算法的性能对比测试。实验结果表明,改进算法对于稀疏数据集有更好 的加速性能,并且随着支持度的降低,加速比呈现扩大趋势,最高达到约20倍。 另外,本文初步讨论并实验了利用0penCL的LocalMemory机制来对事务数据 的访问作进一步优化。不过,最后的测试结果表明这种改进仅对稠密数据集产 生了约10%的性能提升。本文在最后还指出了一些未来值得进一步研究与改进 的方向。

    0
    90
    7.29MB
    2013-06-08
    10
  • 基于GPU通用计算的分析与研究

    基于GPU通用计算,从几个方面对其进行了探讨与研究,很不错的期刊论文,推荐学习GPU通用计算的同学们学习。

    0
    80
    3.73MB
    2013-06-08
    10
  • 基于GPU的并行支持向量机的设计与实现

    1.在综述了当前高性能计算领域热门技术的基础上,选择GPU作为并行支持向量 机的实现工具。在GPU编程方法方面,选择了OpenCL作为具体的代码实现技术,并搭 建了GPU计算的实验平台和基于VisualStudio2010的OpenCL的开发环境。 2.介绍了支持向量机理论的基本原理及其数学模型,引出了SMO训练算法并对其 进行了详细的说明。研究了LibSVM的使用方法,并在之前搭建的两个平台上做了实验 仿真,以用来作为参照基准。 3.根据SVM训练和预测算法中的并行点,提出了用于多类分类器的并行支持向量 机算法。通过分别对SVM训练算法、预测算法和涉及的矩阵运算分别采用并行运算, 提高了多核计算机的运算效率,加快了SVM分类器的训练过程。对并行算法的性能进 行了详细分析。 4.利用OpenCL编写了并行支持向量机程序,并对程序实现过程中的一些重要步 骤,如数据预处理、设备初始化、程序初始化和缓存、内存分配和命令列队优化等进行 了详细的介绍。对进一步提高GPU的效率进行了深入的探讨。 5.利用LibSVM处理训练样本,编写了基于CPU Timer的时间测量工具,最后给 出了基于GPU的并行支持向量机的仿真实验结果,并与LibSVM的仿真数据进行了对 比,验证了并行算法的有效性。

    4
    283
    2.9MB
    2013-06-08
    12
  • 基于GPGPU的高效AES彩色数字图像加密技术的研究与实现

    由于人们对信息安全的.逐步重视,加解密技术一直是研究的热点。各种加密算法相继问世,但加解密算法的安全性与复杂性始终是两个不可调和的矛盾体,在加解密速度和安全性上无法做到两全其美。因此目前有很多安全的加密算法,但由于其复杂性受个人计算机有限的计算能力限制,无法做到快速的加解密,从无法得到普片的运用。

    0
    49
    3.35MB
    2013-06-08
    0
  • 基于CUDA的矩阵乘法和FFT性能测试

    对NVIDIA公司的CUDA技术用Geforce8800GT在VisualStudi02008环境下进行测试,从程序运行时间比较判断CUBLAS库、CUDA内核程序、CUDA驱动API、C循环程序与Intel MKL库以及FFFW库与CUFFF库运行响应的差异。测试结果表明,在大规模矩 阵乘法和快速傅里叶变换的应用方面,相对于CPU,利用GPU运算性能可提高25倍以上。

    3
    247
    424KB
    2013-06-08
    32
  • 带随机数MD5破解算法的GPU加速与优化

    本文首先分析了传统体系结构上带随机数MD5的破解算法,对算法中任务进行划分以便映射到主机和GPU上;然后使用OpenCL实现了基于GPU的异构平台上的破解算法;最后针对特定的GPU平台对破解程序进行了优化。

    2
    123
    2.5MB
    2013-06-08
    0
  • OpenCL语言及编译技术分析

    OpenCL(Open Compution Language)是一种全新的针对异构系统进行并行编程的应用程序接口(API),有效利用系统中的所有计算资源。OpenCL采用运行时动态编译的方式来执行程序,灵活高效。

    0
    88
    198KB
    2013-06-08
    12
  • GPU通用计算:计算领域的一次革命

    自从NvIDIA公司在1999年发布GeForce 256图形处理芯片时首先提出GPU(Graphic Processing Unit)的概念,GPU 长期以来一直充当着CPU“助手”的角色,大部分的数据处理由 CPU负责计算,而GPU仅仅是根据API指定的函数对这些数据进 行简单的加工,然后送到显示器上。但是,近年来随着大型游 戏和3D技术在计算机领域的蓬勃发展,GPU的性能越来越强大, 逐渐具备了可编程流水线、高密度并行处理等特性,许多GPU 的浮点运算能力已经超越了CPU,以目前最强的i7 975为例, 其浮点运算能力也远远达不到HD 4850的ITF1ops(等效每秒一 万亿次运算),GPU超强的浮点运算能力为其实现通用计算打下 了基础。

    0
    150
    171KB
    2013-06-08
    0
关注 私信
上传资源赚积分or赚钱