bioinformatics databases and algorithm
### 生物信息学数据库与算法概述 #### 一、生物信息学定义与发展 生物信息学是一门新兴学科,它融合了生物学、计算机科学以及信息技术等多个领域。其目标在于通过数据分析来促进生物学研究的新发现,并从整体角度揭示生物学的基本原理。 1. **历史背景**: - 1952年,Frederick Sanger通过对胰岛素蛋白质的测序工作,首次提出了蛋白质具有完美的分子结构,并且其中蕴含着一定的生物学信息。 - 1955年,Sanger及其团队进一步完成了不同动物的胰岛素蛋白质测序,并进行了序列比较分析,这是最早的序列比对尝试。 - 1962年,Linus Pauling提出了分子进化的理论,并推测人类体内可能存在着5万到10万个不同的基因或蛋白质,这为后来的分子进化研究奠定了基础。 - 1965年,Margaret Dayhoff创建了蛋白质序列图谱,并建立了蛋白质信息资源库(Protein Information Resource, PIR)。1978年,她还构建了Dayhoff打分矩阵,用于对蛋白质进行分类,并构建了进化树。 - 1970年,Needleman-Wunsch算法问世,这是一种用于全局序列比对的算法。 - 1981年,Smith-Waterman算法的出现,该算法主要用于局部序列比对。 - 1982年,Walter Goad等人开发了GenBank的第一个版本。同年,欧洲分子生物学实验室(EMBL)成立,1984年,日本遗传研究所(DDBJ)成立。 - 1990年,BLAST(基本局部对齐搜索工具)被开发出来,这是一项用于快速搜索序列相似性的工具。 - 随后,NCBI的Entrez系统也被开发出来,用于提供关键字搜索功能,包括“硬搜索”(精确匹配)和“软搜索”(相关性匹配)。 #### 二、生物信息学数据库介绍 生物信息学中的数据库是存储和管理大量遗传数据的关键工具。这些数据库通常包含了来自不同来源的遗传信息,如基因序列、蛋白质结构和功能注释等。 1. **国际权威核酸序列数据库**: - **GenBank**:由美国国立生物技术信息中心(NCBI)维护,是世界上最大的公开核酸序列数据库之一。 - **EMBL**:由欧洲分子生物学实验室(EMBL)维护,涵盖了来自世界各地的研究成果。 - **DDBJ**:由日本遗传研究所(DDBJ)维护,是亚洲地区的重要核酸序列数据库。 2. **NCBI数据库及站点地图**:NCBI不仅提供了GenBank,还拥有多种其他类型的生物信息学数据库,包括但不限于蛋白质序列数据库(PubMed、PDB等),以及一系列工具和服务,如BLAST、Entrez等。 3. **UCSC Genome Browser**:加州大学圣克鲁兹分校的基因组浏览器提供了一个交互式的平台,用户可以在此浏览、分析和可视化各种基因组数据。这个平台特别适合用于查看特定基因的位置、注释以及其他相关信息。 #### 三、算法在生物信息学中的应用 生物信息学算法对于处理和分析大量的遗传数据至关重要。以下是一些关键的算法类型: 1. **序列比对算法**:如Needleman-Wunsch算法和Smith-Waterman算法,用于比较两个或多个序列之间的相似性。 2. **搜索算法**:如BLAST算法,用于快速查找数据库中与查询序列相似的序列。 3. **基因预测算法**:用于识别基因的位置和边界。 4. **蛋白质结构预测算法**:帮助预测蛋白质的三维结构,这对于理解蛋白质的功能至关重要。 生物信息学不仅是生物学研究的重要组成部分,也是推动现代医学发展的重要力量。随着新技术的不断涌现和数据库的持续扩展,生物信息学将在未来继续发挥重要作用。
剩余333页未读,继续阅读
- 粉丝: 0
- 资源: 1
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 【创新无忧】基于花朵授粉优化算法FPA优化相关向量机RVM实现北半球光伏数据预测附matlab代码.rar
- 【创新无忧】基于花朵授粉优化算法FPA优化极限学习机KELM实现故障诊断附matlab代码.rar
- 【创新无忧】基于蝗虫优化算法GOA优化广义神经网络GRNN实现电机故障诊断附matlab代码.rar
- 【创新无忧】基于蝗虫优化算法GOA优化广义神经网络GRNN实现数据回归预测附matlab代码.rar
- 【创新无忧】基于蝗虫优化算法GOA优化广义神经网络GRNN实现光伏预测附matlab代码.rar
- 【创新无忧】基于蝗虫优化算法GOA优化相关向量机RVM实现北半球光伏数据预测附matlab代码.rar
- 【创新无忧】基于蝗虫优化算法GOA优化极限学习机KELM实现故障诊断附matlab代码.rar
- 【创新无忧】基于蝗虫优化算法GOA优化极限学习机ELM实现乳腺肿瘤诊断附matlab代码.rar
- 【创新无忧】基于灰狼优化算法GWO优化广义神经网络GRNN实现电机故障诊断附matlab代码.rar
- 【创新无忧】基于灰狼优化算法GWO优化广义神经网络GRNN实现光伏预测附matlab代码.rar
- 【创新无忧】基于蝗虫优化算法GOA优化相关向量机RVM实现数据多输入单输出回归预测附matlab代码.rar
- 【创新无忧】基于灰狼优化算法GWO优化广义神经网络GRNN实现数据回归预测附matlab代码.rar
- 【创新无忧】基于灰狼优化算法GWO优化极限学习机ELM实现乳腺肿瘤诊断附matlab代码.rar
- 【创新无忧】基于灰狼优化算法GWO优化极限学习机KELM实现故障诊断附matlab代码.rar
- 【创新无忧】基于灰狼优化算法GWO优化相关向量机RVM实现北半球光伏数据预测附matlab代码.rar
- 【创新无忧】基于灰狼优化算法GWO优化相关向量机RVM实现数据多输入单输出回归预测附matlab代码.rar