没有合适的资源?快使用搜索试试~ 我知道了~
基于第三代测序数据的基因组结构变异检测方法研究(git)1
需积分: 0 1 下载量 51 浏览量
2022-08-04
15:08:52
上传
评论
收藏 6.77MB PDF 举报
温馨提示
试读
132页
摘要随着测序技术的不断成熟和广泛应用,以测序技术为驱动的基因组、转录组等多组学的研究得到了跨越式发展,推动了基因组科学、遗传学、临床医学等多学科的变革。基因组变
资源详情
资源评论
资源推荐
https://github.com/tjiangHIT
博士学位论文
基于第三代测序数据的基因组结构变异检
测方法研究
DETECTION OF GENOME STRUCTURAL
VARIANTIONS BASED ON THIRD
GENERATION SEQUENCING DATA
姜涛
哈尔滨工业大学
2019 年 7 月
https://github.com/tjiangHIT
国内图书分类号:TP18 学校代码:10213
国际图书分类号:004.89 密级:公开
工学博士学位论文
基于第三代测序数据的基因组结构变异检
测方法研究
博士研究生
:
姜涛
导 师
:
王亚东教授
申 请 学 位
:
工学博士
学科
:
计算机应用技术
所 在 单 位
:
计算机科学与技术学院
答 辩 日 期
:
2019 年 7 月
授予学位单位
:
哈尔滨工业大学
https://github.com/tjiangHIT
Classified Index: TP18
U.D.C: 004.89
Dissertation for the Doctoral Degree in Engineering
DETECTION OF GENOME STRUCTURAL
VARIANTIONS BASED ON THIRD GENERATION
SEQUENCING DATA
Candidate:
Tao Jiang
Supervisor:
Prof. Yadong Wang
Academic Degree Applied for:
Doctor of Engineering
Speciality:
Computer Application Technology
Affiliation:
School of Computer Science and
Technology
Date of Defence:
July, 2019
Degree-Conferring-Institution:
Harbin Institute of Technology
https://github.com/tjiangHIT
摘 要
- I -
摘 要
随着测序技术的不断成熟和广泛应用,以测序技术为驱动的基因组、转录
组等多组学的研究得到了跨越式发展,推动了基因组科学、遗传学、临床医学
等多学科的变革。基因组变异检测作为基因组研究中最为核心和关键的环节,
对于基因组注释、与疾病和表型的关联分析、临床诊断等具有重要的意义。然
而,由于基因组存在大量复杂的结构变异,现有的检测技术和方法在变异检测
的准确性、敏感性、全面性以及性能上已无法满足当前基因组前沿研究的需求,
在日益增长的海量测序数据面前面临着巨大的挑战。
本文全面总结了基因组结构变异识别和检测的基本方法与途径,重点分析
了现阶段结构变异检测面临的难点与问题。本文以提升结构变异检测精度和计
算性能等方面作为切入点,针对性的开展一系列相关的研究与实践,开发了多
款基因组结构变异检测方法以及工具,有效地解决当前基因组研究中多个瓶颈
问题。本文的主要研究内容如下:
(1)针对大规模高相似性的移动元件变异难以准确、敏感检测这一问题,
本文研究了一种基于片段重比对的基因组移动元件变异检测方法 rMETL。该方
法采用创新性的序列重比对方法,将测序片段的异常比对序列部分与已知移动
元件进行重新比对,使复杂多样的局部比对信息转换为具有高度一致性的移动
元件变异证据信息。在国际权威测序数据集上的实验结果表明,rMETL 能有效
提升移动元件变异检测的敏感性,并保持较高的检测准确性。这一方法有助于
移动元件变异的精准发现,挖掘更多与疾病和表型的关联,是一款重要的前沿
科研工具。
(2)针对现有结构变异检测工具无法检测参考基因组之外的 DNA 序列这
一问题,本文研究了一种基于局部序列拼接与聚类的基因组新序列插入变异检
测方法 rCANID。该方法以新序列插入变异形态为出发点,结合局部拼接手段,
通过对异常比对片段和未比对片段的双重聚类和拼接,分别重构靠近插入边界
和远离插入边界的两类新序列插入变异局部序列,并通过启发式算法连接和合
并两类局部序列从而检测完整的新序列插入变异。在国际权威测序数据集上的
实验结果表明,rCNAID 算法较之现有结构变异检测算法,能有效提升新序列插
入变异的检测敏感性,有利于发现样本所特有的 DNA 序列,对一些罕见疾病的
发现和治疗具有重要的生物学意义。
(3)针对当前结构变异检测技术的识别率和敏感性仍然处于较低水平的现
https://github.com/tjiangHIT
哈尔滨工业大学工学博士学位论文
- II -
状,本文研究了一种基于多特征融合的基因组结构变异检测方法 cuteSV。该方
法采用创新性的多重特征融合聚类方法,将异常测序片段中的多重变异信号聚
类,利用多种基因组空间结构信息对结构变异进行进一步整合,在显著提升变
异检测的识别率和敏感性的同时,兼顾发现复杂变异的能力。在国际权威测序
数据集上的实验结果表明,cuteSV 是目前领域内结构变异检测综合性能最好,
计算性能最优的一款工具。该工具将为相关的基因组工程分析带来全新的支持。
(4)针对现阶段结构变异检测的计算瓶颈问题,本文研究了一种基于测序
片段过滤的基因组结构变异检测工作流加速方法 rMFilter。该方法首创区域哈
希表索引和区域种子命中快速统计方法,通过对测序片段的准确、快速分类,
在数据分析源头极大地减少输入数据量,从根本上降低结构变异检测工作流的
计算代价。在国际权威测序数据集上的实验结果表明,rMFilter 与主流结构变异
检测工作流组合使用,使基于第三代测序数据的结构变异检测速度整体提升一
倍以上,并取得了与原始工作流相同的变异检测结果。该工具可以有效提升结
构变异检测分析速度,为大规模基因组分析任务带来曙光。
本文以基因组结构变异检测为重点,以全面提升基因组结构变异检测的准
确性、敏感性、多样性和计算性能为目的,充分发挥第三代测序数据的优势。
通过开发多种类型结构变异检测方法和工具,切实解决现阶段基因组研究中的
瓶颈问题,全面有效地推动以基因组结构变异为导向的相关研究的发展,为基
因组前沿科学研究提供了新的研究思路、技术手段与理论支撑,具有很高的实
际意义。
关键词:第三代测序技术;结构变异检测;局部序列拼接;序列重比对;变异
检测加速
剩余131页未读,继续阅读
我只匆匆而过
- 粉丝: 16
- 资源: 317
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 背景music,用作业网轮地址
- comment_6e56cd5d6e140046ef1cd248910ea5ca.png
- 基于卷积神经网络的自动驾驶系统的设计与实现
- MySQL的执行原理-2.md
- 基于 FCN 网络对无人机俯拍下的生活场景语义分割(12类别)【包含数据集、完整代码、训练好的结果、权重文件等等】
- CISCN2024-re3-rust-baby(Frida多字节程序插桩爆破)
- soft:磁盘清理工具
- .netcore控制台使用Nssm打包windows服务,加winform管理服务界面
- db-college.sql
- wpf-dragdrop-treeview(WPF较好拖拽效果).7z
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0