没有合适的资源?快使用搜索试试~ 我知道了~
云计算-基于GPU高性能计算的下一代高通量DNA序列比对.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 67 浏览量
2022-06-30
20:02:17
上传
评论
收藏 9.78MB PDF 举报
温馨提示
试读
52页
云计算-基于GPU高性能计算的下一代高通量DNA序列比对.pdf
资源推荐
资源详情
资源评论
第一章绪论
1.1引言
第一章绪论
当前,由于生物学研究中DNA测序技术的革命性突破,使得高通量测序技
术的应用越来越广泛。下一代测序技术的最大特点就是高通量。所谓的测序通量
是指在一定时间内获得的数据输出量,更高的测序通量能够在一定程度上降低测
序成本、提高科研工作的效率。下一代的测序技术与第一代Sanger测序法相比,
在测序原理上并没有本质的飞跃,其之所以能大大降低时间和费用的关键,就在
于采用了高通量测序技术,使测序通量大大提高,从毛细管测序法一次读取96
条序列到目前的一次读取几百万条序列的实现,不得不说是对第一代测序技术的
一次革命性变更。高通量测序技术在提供更加丰富的序列信息同时,也产生了前
所未有的爆炸式的数据量。由此,生物学上的技术变革,也势必对信息学上的处
理技术提出新的要求。其中一个富有挑战性的问题就是如何高效处理伴随高通量
测序技术而产生的海量序列数据。
1.2本文的研究目的、意义及主要内容
本文以高效处理下一代高通量DNA序列的比对问题为目的,主要针对以
下两个问题进行了研究与探索:
第一、GPU高性能计算是否能应用于序列比对中。对于现有的序列比对方法,
要如何重构原有的处理流程,使其适用于GPU计算。
第二、对于当前存在的各种不同比对方法,若用于GPU计算,是否有一种
相对统一的方式进行重构,使用及发布。
这两个目标的实现对于高效处理高通量序列的比对问题,无论在理论上还是
工程应用上都有着积极的意义。
本论文的主要内容简要介绍如下:
第~章为绪论部分,介绍课题的研究背景、目的和意义,并对论文的基本内
容做整体介绍。
基于GPU高性能计算的下一代高通量DNA序列比对
第二章为背景介绍,简要介绍了下一代高通量序列的发展、序列比对技术和
GPU高性能计算技术的发展现状及本文所使用的性能优化方法。
第三章针对本文所要解决的问题介绍了具体的方法步骤,探讨了GPU计算
中序列比对的流程重构,提出了以基础工具框架分离使用和实现,对最终的用户
屏蔽了利用GPU高通量序列比对复杂度的实现方式。并介绍了框架的具体设计
实现。主要分析了框架的主要目标,相应接口的设计实现以及框架正常运行时的
工作流程。
第四章以Smith—Waterman算法为例,具体介绍了比对算法在GPU计算中的
重构,优化,以及在本文所设计框架中的实现。
第五章介绍了本文的实验结果与分析。利用本文设计实现的序列比对框架,
对454高通量测序法测得的某动物基因数据进行比对实验,并对实验结果进行评
估。
第六章总结论文所做的主要工作,分析所使用的方法和思路的不足之处。提
出一些改进建议,为进一步完善利用GPU进行高通量序列处理提供借鉴。。
2
第-二章背景
2.1下一代DNA测序技术
第二章背景
DNA测序技术是现代生物学研究中重要的手段之一。对于每个生物体来说,
基因组包含了整个生物体的遗传信息。测序技术能够真实地反映基因组DNA上
的遗传信息,进而比较全面比解释基因组的复杂性和多样性,因而在生命科学研
究中扮演了十分重要的角色。所谓的下一代测序技术,是相对于1977年问世的
第一代测序技术,其具有低成本,高准确度,高通量的特点,也被称为高通量测
序技术【41。
2.1.1高通量测序
下一代测序技术的最大特点就是高通量。所谓的测序通量是指在一定时间内
获得的数据输出量,更高的测序通量能够在一定程度上降低测序成本、提高科研
工作的效率。下一代的测序技术与第一代Sanger测序法相比,在测序原理上并
没有本质的飞跃,其之所以能大大降低时间和费用的关键,就在于采用了高通量
测序技术,使测序通量大大提高,从毛细管测序法一次读取96条序列到目前的
一次读取几百万条序列的实现,不得不说是对第一代测序技术的一次革命性变更
[41。目前主要的高通量测序技术有:
(1)Polony测序技术【5】
(2)Roche公司的454测序技术【6】
(3)Illumina公司的Solexa技术【7,8】
(4)ABI公司的SOLID技术【9】
2.1.2高通量序列处理
由于高通量测序技术一次可获得上百万条、甚至几百万条的序列信息,在提
供更加丰富的序列信息同时,也将产生前所未有的爆炸式的海量数据。由此,生
物学上的技术变革,也势必对信息学上的处理技术提出新的要求。随着新一代测
序技术的飞速发展,生物信息学面临各种新的问题【1,2'4】。
3
剩余51页未读,继续阅读
资源评论
programxh
- 粉丝: 17
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功