生物信息学期末考试答案
生物信息学是一门综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法,以互联网为媒介、数据库为载体、利用数学和计算机科学对生物学数据进行储存、检索和处理分析,并进一步挖掘和解读生物学数据。
1. 名词解释:
* Bioinformatics:生物信息学是一门综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法,以互联网为媒介、数据库为载体、利用数学和计算机科学对生物学数据进行储存、检索和处理分析,并进一步挖掘和解读生物学数据。
* Consensus sequence:共有序列是决定启动序列的转录活性大小的序列,存在于各种原核启动序列特定区域内(通常在转录起始点上游-10 及-35 区域)。
* Data mining:数据挖掘是从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程,通常是利用计算方法分析生物数据,即根据核酸序列预测蛋白质序列、结构、功能的算法等,实现对现有数据库中的数据进行发掘。
* EST:Expressed Sequence Tag,表达序列标签,是某个基因 cDNA 克隆测序所得的部分序列片段,长度大约为 200~600bp。
* Similarity:相似性是直接的连续的数量关系,是指序列比对过程中用来描述检测序列和目标序列之间相同 DNA 碱基或氨基酸残基顺序所占比例的高低。
* Homology:同源性是两个对象间的肯定或者否定的关系,如两个基因在进化上是否曾具有共同祖先,从足够的相似性能够判定二者之间的同源性。
* Alignment:比对是从核酸以及氨基酸的层次去分析序列的相同点和不同点,以期能够推测它们的结构、功能以及进化上的联系。
* BLOSUM:模块替换矩阵是指在对蛋白质数据库搜索时,采用不同的相似性分数矩阵进行检索的相似性矩阵。
* PAM:突变数据矩阵 PAM 是指 1 个 PAM 表示 100 个残基中发生一个残基突变概率的进化距离。
* Contig:叠连群是指一组相互两两头尾拼接的可装配成长片段的 DNA 序列克隆群,也指彼此间可通过重叠序列而连接成连续的、扩展的、不间断的 DNA 序列的交叠片段产物。
* Phylogenetic tree:系统发生树又称为演化树,是表明被认为具有共同祖先的各物种间演化关系的树,是一种亲缘分支分类方法。
* In Silico Cloning:电子克隆是近年来发展起来的一门基于表达序列标签(ESTs)的快速克隆基因的新技术,其利用种子序列从 EST 及 UniGene 数据库中搜索相似性序列,进行拼装、检索、分析等,以此获得目标基因的全长 cDNA,在此基础上也能够实现基因作图定位。
2. 生物信息学发展历程:
生物信息学的产生是生命科学发展的必然。生物大分子数据库相继建立,生物技术与计算机技术并行飞速发展,Internet 的广泛应用,人类基因组计划(HGP)的推动,都是生物信息学发展的重要推动力。
3. 生物信息学的主要应用:
生物信息学的主要应用包括:
* 获取各种生物的全基因组及其他数据
* 新基因发现
* 单核苷酸多态性分析
* 基因组中非编码区域的结构与功能
* 从基因组水平研究生物进化及其他遗传语言的可能
* 全基因组的比较研究
* 基因功能预测
* 遗传疾病的研究以及关键基因鉴定
* 蛋白质组学研究
* 新药设计和定向化酶
* 生物芯片
生物信息学是大规模研究生命科学的利器,它可以帮助我们更好地理解生命科学的复杂性,并且为疾病诊断和治疗提供了有价值的信息。