没有合适的资源?快使用搜索试试~ 我知道了~
生物信息学简明教程-it-ebooks
需积分: 5 1 下载量 102 浏览量
2023-09-20
12:11:19
上传
评论
收藏 493KB PDF 举报
温馨提示


试读
58页
生物信息学简明教程_it-ebooks
资源推荐
资源详情
资源评论

















生物信息学
简明教程

1
第一章 概论.................................................................................................................................. 3
第二章 生物信息数据库与查询................................................................................................... 5
2.1 基因和基因组数据库............................................................................................... 5
1. Genbank .................................................................................................................. 5
2. EMBL 核酸序列数据库......................................................................................... 7
3. DDBJ 数据库.......................................................................................................... 7
4. GDB ........................................................................................................................ 7
2.2 蛋白质数据库........................................................................................................... 8
1. PIR 和 PSD ............................................................................................................. 8
2. SWISS-PROT ......................................................................................................... 8
3. PROSITE ................................................................................................................ 9
4. PDB......................................................................................................................... 9
5. SCOP....................................................................................................................... 9
6. COG........................................................................................................................ 9
2.3 功能数据库............................................................................................................. 10
1. KEGG ................................................................................................................... 10
2. DIP........................................................................................................................ 10
3. ASDB.................................................................................................................... 10
4. TRRD.................................................................................................................... 11
5. TRANSFAC.......................................................................................................... 11
2.4 其它数据库资源..................................................................................................... 11
1. DBCat ................................................................................................................... 11
2. PubMed................................................................................................................. 12
第三章 序列比对和数据库搜索................................................................................................ 12
3.1 序列两两比对......................................................................................................... 12
3.2 多序列比对............................................................................................................. 17
第四章 核酸与蛋白质结构和功能的预测分析......................................................................... 18
4.1 针对核酸序列的预测方法..................................................................................... 18
1. 重复序列分析....................................................................................................... 18
2. 数据库搜索........................................................................................................... 19
3. 编码区统计特性分析........................................................................................... 19
4. 启动子分析........................................................................................................... 19
5. 内含子/外显子剪接位点..................................................................................... 20
6. 翻译起始位点....................................................................................................... 20
7. 翻译终止信号....................................................................................................... 20
8. 其它综合基因预测工具....................................................................................... 20
9. tRNA 基因识别.................................................................................................... 21
4.2 针对蛋白质的预测方法......................................................................................... 21
1. 从氨基酸组成辨识蛋白质................................................................................... 21
2. 预测蛋白质的物理性质....................................................................................... 22
3. 蛋白质二级结构预测........................................................................................... 22

2
4. 其它特殊局部结构............................................................................................... 23
5. 蛋白质的三维结构............................................................................................... 24
第五章 分子进化........................................................................................................................ 24
5.1 分子进化钟与中性理论......................................................................................... 24
5.2 进化树..................................................................................................................... 27
5.3 结构进化树............................................................................................................. 30
1.刚体结构叠合比较............................................................................................. 30
2.多特征结构比较................................................................................................. 31
3.相关软件............................................................................................................. 31
第六章 基因组序列信息分析.................................................................................................... 32
6.1 基因组序列分析工具............................................................................................. 32
1. Wisconsin 软件包(GCG) ................................................................................ 32
2. ACEDB................................................................................................................. 36
3.其它工具............................................................................................................. 36
6.2 人类和鼠类公共物理图谱数据库的使用............................................................. 36
1.物理图谱的类型................................................................................................. 36
2.大型公用数据库中的基因组图谱........................................................................ 38
3.鼠类图谱来源..................................................................................................... 46
6.3 全基因组比较......................................................................................................... 48
6.4 SNP 的发现 ............................................................................................................ 48
第七章 功能基因组相关信息分析............................................................................................ 48
7.1 大规模基因表达谱分析......................................................................................... 49
1.实验室信息管理系统......................................................................................... 49
2.基因表达公共数据库......................................................................................... 51
3.大规模基因表达谱数据分析方法..................................................................... 53
7.2 基因组水平蛋白质功能综合预测......................................................................... 55

3
第一章 概论
当前人类基因组研究已进入一个重要时期,2000 年将获得人类基因组的全部序
列,这是基因组研究的转折点和关键时刻,意味着人类基因组的研究将全面进入信
息提取和数据分析阶段,即生物信息学发挥重要作用的阶段。到 1999 年 12 月 15
日发布的第 115 版为止,GenBank 中的 DNA 碱基数目已达 46 亿 5 千万,DNA 序
列数目达到 535 万;其中 EST 序列超过 339 万条; UniGene 的数目已达到 7 万
个;已有 25 个模式生物的完整基因组被测序完成,另外的 70 个模式生物基因组正
在测序当中;到 2000 年 1 月 28 日为
止,人类基因组已有 16%的序列完成测定,另
外 37.7%的序列已经初步完成;同时功能基因组和蛋白质组的大量数据已开始涌
现。如何分析这些数据,从中获得生物结构、功能的相关信息是基因组研究取得成
果的决定性步骤。
生物信息学是在此背景下发展起来的综合运用生物学、数学、物理学、信息科学
以及计算机科学等诸多学科的理论方法的崭新交叉学科。生物信息学是内涵非常丰
富的学科,其核心是基因组信息学,包括基因组信息的获取、处理、存储、分配和
解释。基因组信息学的关键是“读懂”基因组的核苷酸顺序,即全部基因在染色体上
的确切位置以及各 DNA 片段的功能;同时在发现了新基因信息之后进行蛋白
质空
间结构模拟和预测,然后依据特定蛋白质的功能进行药物设计。了解基因表达的调
控机理也是生物信息学的重要内容,根据生物分子在基因调控中的作用,描述人类
疾病的诊断、治疗内在规律。它的研究目标是揭示"基因组信息结构的复杂性及遗
传语言的根本规律",解释生命的遗传语言。生物信息学已成为整个生命科学发展
的重要组成部分,成为生命科学研究的前沿。
近来的研究表明,基因组不仅是基因的简单排列,它有其特有的组织结构和信息
结构,这种结构是在长期的演化过程中产生的,也是基因发挥其功能所必须的。弄
清楚生物体基因组特有的组织结构和信息结构,解译生命的遗传语言的关键
。
目前在数据库中已经有越来越多的模式生物全基因组序列,第一个人类染色体全
序列--第 22 号染色体的测序工作已经在 1999 年 12 月完成,整个人类基因组计划
工作草图将在最近完成。这无疑给基因组组织结构和信息结构的研究工作提供了大
量的第一手材料,同时也为基因组研究取得突破性进展提供了可能。人类对基因的
认识,将从以往的对单个基因的了解,上升到在整个基因组水平上考察基因的组织
结构和信息结构,考察基因之间在位置、结构和功能上的相互关系。
从目前生物信息学的研究情况来看,国际上公认的生物信息学的研究内容,大致包
括以下几个方面:
1. 生物信息的收集、存储、管理与提供。包括建立国际基本生物信息库和生物
信息
传输的国际联网系统;建立生物信息数据质量的评估与检测系统;生物
信息的在线服务;生物信息可视化和专家系统。

4
2. 基因组序列信息的提取和分析。包括基因的发现与鉴定,如利用国际 EST
数据库 (dbEST) 和各自实验室测定的相应数据,经过大规模 并行计算发现
新基因和新 SNPs 以及各种功能位点;基因组中非编码区的信息结构分析,
提出理论模型,阐明该区域的重要生物学功能;进行模式生物完整基因组的
信息结构分析和比较研究;利用生物信息研究遗传密码起源、基因组结构的
演化、基因组空间结构与 DNA 折叠的关系以及基因组信息与生物进化关系
等生物学的重大问题。
3. 功能基因组相关信息分析。包括与大规模基因表达谱分析相关的算法、
软件
研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结
构的预测和模拟,以及蛋白质功能预测的研究。
4. 生物大分子结构模拟和药物设计。包括 RNA(核糖核酸)的结构模拟和反义
RNA 的分子设计;蛋白质空间结构模拟和分子设计;具有不同功能域的复
合蛋白质以及连接肽的设计;生物活性分子的电子结构计算和设计;纳米生
物材料的模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物
设计;基于 DNA 结构的药物设计等。
5. 生物信息分析的技术与方法研究。包括发展有效的能支持大尺度作图与测序
需要的软件、数据库
以及若干数据库工具,诸如电子网络等远程通讯工具;
改进现有的理论分析方法,如统计方法、模式识别方法、隐马尔科夫过程方
法、分维方法、神经网络方法、复杂性分析方法、密码学方法、多序列比较
方法等;创建一切适用于基因组信息分析的新方法、新技术。包括引入复杂
系统分析技术、信息系统分析技术等;建立严格的多序列比较方法;发展与
应用密码学方法以及其他算法和分析技术,用于解释基因组的信息,探索
DNA 序列及其空间结构信息的新表征;发展研究基因组完整信息结构和信
息网络的研究方法等;发展生物大分子空间结构模拟、电子结构模拟和药物
设计的新方法与新技术。
6. 应用与发展研究。
汇集与疾病相关的人类基因信息,发展患者样品序列信息
检测技术和基于序列信息选择表达载体、引物的技术,建立与动植物良种繁
育相关的数据库以及与大分子设计和药物设计相关的数据库。
利用生物信息学方法进行结构功能预测要注意的是同一问题采用不同算法,可能
产生相同或不同的结果。因此,必要弄清楚某种方法的基本原理,而不是仅把算法
当作一个“黑箱”。因为一种方法可能对特定实例很合适,而对另一个则完全不对。
因此,本章采用原理和实用方法并重的原则进行介绍。因生物信息学覆盖面广,限
于篇幅,本章并未将生物信息学的全部内容详细加以讲述,仅针对与目前分子生物
学实验数据分析密切相关的生物信息学策略及实用工具进行扼要介绍,文中涉及问
题的更详细信息可参考相关网站。生物信息学是新兴发展中的学科,该领域的研究
日新月异,书中的描述可能滞后于生物信息学的最新发展为在所难免,作者期望本
章的介绍对读者的研究工作有所助益。
剩余57页未读,继续阅读
资源评论


qq_24590525
- 粉丝: 1
- 资源: 129
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


安全验证
文档复制为VIP权益,开通VIP直接复制
