没有合适的资源?快使用搜索试试~ 我知道了~
非常全面的构建生命之树的方法,综述了生命之树研究的历史和现状, 介绍了生命之树在以下几个方面的应用: (1)通过构建不同尺度的生命之树, 理解生物类群间的系统发育关系; (2)通过时间估算和地理分布区重建,推测现存生物的起源和地理分布格局及其成因; (3)基于时间树, 结合生态、环境因子及关键创新性状, 探讨生物的多样化进程和成因; (4)揭示生物多样性的来源和格局, 预测生物多样性动态变化, 并提出相应的保护策略。最后,本文评估了生命之树在目前海量数据情况下遇到的序列比对困难、基因树冲突、“流浪类群”干扰等建树难题, 并指出了构建“超大树”的发展趋势。
资源推荐
资源详情
资源评论
生物多样性 2014, 22 (1): 3–20 Doi: 10.3724/SP.J.1003.2014.13170
Biodiversity Science http: //www.biodiversity-science.net
——————————————————
收稿日期: 2013-07-22; 接受日期: 2014-01-06
基金项目: 国家自然科学基金国际(地区)合作交流项目(31061160184)和面上项目(31270268)
∗
通讯作者 Author for correspondence. E-mail: zhiduan@ibcas.ac.cn
生命之树及其应用
鲁丽敏
1,2
孙 苗
1,2
张景博
1,2
李洪雷
1,2
林 立
1,2
杨 拓
1,2
陈 闽
1,2
陈之端
1*
1 (中国科学院植物研究所系统与进化植物学国家重点实验室, 北京 100093)
2 (中国科学院大学, 北京 100049)
摘要: 生命之树的概念由达尔文在1859年提出, 用以反映分类群的亲缘关系和进化历史。近30年来, 随着建树性
状种类的多样化、数据量的快速增长以及建树方法的不断发展和完善, 生命之树的规模越来越大, 可信度也越来
越高。分子生物学、生态学、基因组学、生物信息学及计算机科学等的快速发展, 使得生命之树成为开展学科间
交叉研究的桥梁, 其用途日益广泛。本文综述了生命之树研究的历史和现状, 介绍了生命之树在以下几个方面的
应用: (1)通过构建不同尺度的生命之树, 理解生物类群间的系统发育关系; (2)通过时间估算和地理分布区重建,
推测现存生物的起源和地理分布格局及其成因; (3)基于时间树, 结合生态、环境因子及关键创新性状, 探讨生物的
多样化进程和成因; (4)揭示生物多样性的来源和格局, 预测生物多样性动态变化, 并提出相应的保护策略。最后,
本文评估了生命之树在目前海量数据情况下遇到的序列比对困难、基因树冲突、“流浪类群”干扰等建树难题, 并
指出了构建“超大树”的发展趋势。
关键词: 生命之树, 系统发育, 基因树冲突, 生物地理, 生物多样性, 系统发育多样性
Tree of life and its applications
Limin Lu
1,2
, Miao Sun
1,2
, Jingbo Zhang
1,2
, Honglei Li
1,2
, Li Lin
1,2
, Tuo Yang
1,2
, Min Chen
1,2
, Zhiduan Chen
1*
1 State Key Laboratory of Systematic and Evolutionary Botany, Institute of Botany, Chinese Academy of Sciences, Beijing
100093
2 Graduate University of the Chinese Academy of Sciences, Beijing 100049
Abstract: The term “Tree of Life” was first used by Charles Darwin in 1859 as a metaphor for describing
phylogenetic relationships among organisms. Over the past three decades, the recognized tree of life has im-
proved considerably in overall size and reliability due to an increase in diversity of character resources, a
dramatic growth in useable data, and the development of tree-reconstruction methods. As a bridge connecting
phylogeny, evolution and related disciplines, such as molecular biology, ecology, genomics, bioinformatics
and computer science, the tree of life is increasingly widely used. In this paper, we review the history and
progress of tree of life studies and focus on its application in the following fields: (1) the reconstruction of
phylogenetic trees at different taxonomic hierarchies to understand phylogenetic relationships among taxa;
(2) investigation of the origins of taxa and biogeographic patterns based on dating estimation and bio-
geographic reconstruction; (3) examination of species’ diversification and its causes by integrating dated
trees, ecological factors, environmental variation and key innovations; (4) the study of the origin and patterns
of biodiversity, predating biodiversity dynamics, and development of conservation strategies. Finally, we
evaluate the difficulties from matrix alignment, gene tree incongruence and “rogue taxa” distraction in tree
reconstruction due to massive increases of useable data and in the context consider “supertree” building in
the future.
Key words: tree of life, phylogeny, gene tree incongruence, biogeography, biodiversity, phylogenetic diver-
sity
4
生
物
多
样
性
Biodiversity Science 第 22 卷
1 生命之树简介
1.1 生命之树概念的提出和发展历史
生命之树(Tree of Life, 简称TOL)也称系统发
育树(Phylogenetic Tree), 是指地球上的生命经历了
38亿年的演化, 每一种生命形式都有其来源, 物种
之间的关联及其进化历史就像是一棵树, 从单细胞
的微生物到复杂的动物和植物, 每个物种都可以在
这棵树上找到其最近缘物种和最近共同祖先, 或在
根部, 或在主干, 或在某一个枝杈上。生命之树展
现的是所有现存的以及绝灭的生物类群间的亲缘
关系, 可以帮助我们理解生命的起源、各大门类生
物的起源及其亲缘关系、生物进化的形式、现存生
物多样性的存在方式和动态变化以及何种生物正
处于灭绝的边缘。
尽管早在公元前600年的中国和公元前300年
的古希腊, 人类就开始对生物进行分门别类, 且林
奈在250年前就已尝试按照某些形态性状把生物排
列起来(Linnaeus, 1753), 但建立在生物进化论基础
上的生命之树概念则是由Darwin(1859)在其著作
《物种起源》中首次明确提出的。生物进化论打破
了“神创论”的束缚, 认为物种不是上帝创造的, 也
不是固定不变的, 地球上的所有生命形式都是由其
共同祖先逐渐进化而来的。如果所有的生命最终都
可以追溯到同一个“根”上, 那么就不难想象整个生
命世界就像一棵“树”, 每个物种都可以根据其最近
的祖先找到它在这棵树上的位置。生命之树是《物
种起源》中唯一的一幅插图, 达尔文结合该图对“物
种”、“共同祖先”、“起源”、“竞争”、“自然选择”等
概念进行了形象的阐述。最后他总结道: 枝桠上生
长出新芽, 如果新芽足够健壮, 就会再分生出其他
枝条遮盖四周较弱枝条, 巨大的“生命之树”随着时
间不断进化出新的物种, 其中有的绝灭了, 有的存
留至今。
既然生命之树的概念在150年前就已经提出了,
那么为何在最近的几十年才受到极大的关注?这
和系统与进化生物学的发展历史有关。在达尔文及
其后很长的时期内, 人们一直利用形态性状来研究
生物的分类、系统关系和进化过程,
并且从最初利
用单个形态性状发展到后来采用多种性状进行研
究。为了使分类学工作更为客观, 在20世纪50年代,
以 Michener和Sokal为代表的学者提出了表征学
(phenetics)或数量分类学(numerical taxonomy)的概
念(Michener & Sokal, 1957; Wiley et al., 1991; Doo-
little & Bapteste, 2007), 这些学者因此被称为表征
学派。该学派采用数值方法对所研究类群的形态性
状进行统计, 再借助统计学方法(如聚类分析)对这
些数值进行客观的分析, 从而得出被研究类群之间
的关系。这一方法为分类学提出了一个相对客观的
理论框架, 但在性状的选择和描述过程中, 依旧无
法避免主观因素的影响。更为重要的是, 该方法过分
强调形态性状的相似性, 不能对性状在物种间的演
化进行有效的分析(De Queiroz & Gauthier, 1992)。
基于Dobzhansky(1937)的思想, Hennig(1950)建
立了分支分类学(Cladistics), Hennig及其追随者被
称为分支学派。该学派强调研究类群的单系性
(monophyly)和性状的同源性(homology), 对性状进
行祖征(plesiomorphy)和衍征(apomorphy)的区分,
旨在重建一个单系类群的系统发育关系(也称谱系
关系, phylogenetic relationship), 并通过分支图
(cladogram)对类群关系进行展示(Richter & Meier,
1994; Doolittle & Bapteste, 2007)。区别于数量分类
学, 分支分类学依赖实证法并严格遵循演化准则重
建研究类群之间的关系, 而非根据形态相似性进行
分门别类(De Queiroz & Gauthier, 1992)。可见, 具有
演化思想的分支分类学为构建达尔文提出的生命
之树提供了有效的研究手段。
20世纪60年代,
随着Sanger的蛋白质测序技术
的成熟, 人们开始利用蛋白质序列差异来构建生物
类群的系统发育关系, 如, 通过凝血纤维蛋白肽
(blood-clotting fibrinopeptides)的氨基酸序列差异构
建了脊椎动物的系统发育关系(转引自Doolittle,
1999), 利用线粒体细胞色素C蛋白研究了动物及真
菌的系统发育关系(Fitch & Margoliash, 1967)。
1977年, Woese和Fox(1977)开创性地采用16S
小亚基核糖体RNA的碱基序列构建了包括动物、植
物和微生物的生命之树(Universal Tree of Life)。通
过这棵树他们发现了古细菌域(Archaea), 并提出了
对地球生命世界的三域划分, 即真细菌、古细菌、
真核生物。与蛋白质和RNA序列相比, DNA序列具
有更多的变异信息位点, 可以应用到更广泛的类群
中。而后随着DNA测序和计算机技术的更新和发展,
重建生命之树的各种算法和软件不断涌现。在用于
构建生命之树的分子数据选择上, 已经历了从单个
第 1 期 鲁丽敏等: 生命之树及其应用 5
DNA片段、多DNA片段、质体或线粒体基因组到核
基因组的发展。与形态性状相比, 分子性状的变异
在大尺度上(如界、门、纲、目、科)的同源性更易
于区别, 根据所研究的分类阶元的不同来选择相应
的具有不同进化速率的分子片段, 为准确构建包括
更大范围类群的生命之树提供了可能, 这使得生物
分类、系统和进化领域进行大规模或大尺度的研究
成为现实(Hillis et al., 1994)。
目前, 测序成本大幅度降低, 序列数据海量增
加。据统计, 在GenBank数据库中, 存储了上亿条
DNA或蛋白序列, 且这些序列每2–3年就会翻倍
(Benson et al., 2011)。因 此 , 生命之树重建和基于生
命之树而开展的研究正呈现出以下发展趋势: (1)大
量的物种取样和更多的基因或DNA片段取样, 并开
始利用核基因组数据来构建大尺度的系统发育树
(Bininda-Emonds, 2004; Cracraft & Donoghue, 2004;
Hodkinson & Parnell, 2006); (2)利用基因组数据研究
杂交/渐渗(hybridization/ introgression)、基因水平转
移(horizontal gene transfer)和谱系筛选(lineage sort-
ing)等因素对建树结果的影响, 探讨基因树之间以及
基因树与物种树之间的冲突(如Okuyama et al., 2005;
Sanderson & McMahon, 2007; Maureira-Butler et al.,
2008; Eaton & Ree, 2013); (3)分子生物学、生态学、基
因组学、生物信息学、计算机科学等学科的快速发展
及交叉综合, 为构建全球范围的生命之树并深入挖掘
其中的生命信息提供了前所未有的机遇和挑战。全球
的科学家合作将能够建立一棵将所有现存的和灭绝
的生物类群联系在一起的系统发育树。
总之, 生命之树不仅能揭示生命的起源和生物
类群间的亲缘关系, 还可以阐明生物的地理分布式
样、多样化进程、关键创新性状的演化等科学问题
,
从而为物种保护、生物多样性维持、环境改善等人
类当前面临的严重问题提供科学依据和解决方案。
1.2 生命之树的类型
生命之树有很多分类方法。(1)根据拓扑结构是
否置根可分为有根树(rooted tree)和无根树(unrooted
tree)。有根树具有方向性, 可以反映物种的共同祖
先和性状的演化方向; 无根树没有方向性(Yang,
2006) 。 (2) 根据是否显示枝长可以用分支图
(cladogram)和谱系图(phylogram)的形式来呈现。前
者只表示亲缘关系而不表明分支长度, 后者既表示
亲缘关系, 又显示分支长度。(3)根据建树所采用的
数据类型可分为形态树、分子树、分子形态联合树
等。形态树是指根据类群形态性状构建的系统发育
树, 也是生命之树早期的划分形式(Sokal & Sneath,
1963; Sneath, 1995); 分子树是近20–30年来生物学
家根据DNA和蛋白质序列等分子数据所构建的系
统发育树(Clegg, 1993; Williams et al., 2012)。由于
灭绝事件隐去了许多重要的进化痕迹, 近年来有些
科学家开始尝试结合化石证据构建分子形态联合
树以探究特定类群甚至整个生物界完整的进化历
史(Gatesy et al., 2013)。(4)基于建树方法不同, 有邻
接(Neighbor Joining, NJ)树、最大简约树(Maximum
Parsimony Trees, MPTs)、严格一致树(strict con-
sensus tree)和多数一致树(majority consensus tree)
等。这些树各有优缺点, 应用时应根据类群和数据
特点选择最优树或采用多种结果相互比较验证
(Hall, 2005; Yang & Rannala, 2012)。(5)根据类群的
分类阶元, 可建立科、属、种水平以及居群水平的
生命之树。(6)根据所反映的是物种间真实的进化关
系还是某个基因的进化历史, 又有物种树(species
tree)和基因树(gene tree)之分。利用某一基因或者若
干基因所承载的系统发育信息重建的系统发育树
,
称之为基因树, 它代表了基因或者基因家族的进化
历史; 而反映物种间真实进化关系的系统发育树,
称之为物种树, 它代表了物种水平上的进化历史
(Maddison, 1997)。由于物种的进化历史难以再现,
因此我们很难获取绝对的物种树, 只能利用现有的
数据最大限度地缩小基因树与物种树间的差异。
随着测序技术的进步和越来越多的分子片段
应用于系统发育重建, 随之产生的基因组间、基因
间的建树冲突成为系统发育研究中日益突出的问
题(邹新慧和葛颂, 2008)。为此, 生物学家们提出许
多理论来解释这些冲突, 如杂交/渐渗、基因水平转
移和谱系筛选等, 并创建了许多新的方法和模型以
重建较为真实、可靠的系统发育关系(Liu, 2008;
Burleigh et al., 2011; Song et al., 2012)。当然这并不
说明物种树比基因树更重要, 因为在研究多基因家
族的进化时, 基因树更有助于了解成员基因的进化
历史和基因重复过程(Nei & Kumar, 2000)。
2 生命之树的应用
2.1 研究类群之间的亲缘关系
研究生物类群之间的亲缘关系一直以来都是
剩余17页未读,继续阅读
资源评论
baidu_33739078
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功