Gene Ontology (GO) 简介
目的: 为了查找某个研究领域的相关信息,
生物学家往往要花费大量的时间,更糟糕
的是,不同的生物学数据库可能会使用不
同的术语,好比是一些方言一样,这让信
息查找更加麻烦,尤其是使得机器查找无
章可循。 Gene Ontology 就是为了解决这
种问题而发起的一个项目。
•
Gene Ontology 中最基本的概念是 term 。
•
GO 里面的每一个 entry 都有一个唯一的数
字标记,形如 GO:nnnnnnn ,还有一个 te
rm 名,比如“ cell”, “fibroblast (纤维组
织母细胞 ) growth factor receptor (受
体) binding” ,或者“ signal transducti
on” 。
•
每个 term 都属于一个 ontology ,总共有
三个 ontology ,它们分别是 molecular fu
nction, cellular component 和 biological
process 。
•
一个基因 product 可能会出现在不止一个 cellula
r component 里面,也可能会在很多 biological
process 里面起作用,并且在其中发挥不同的 m
olecular function 。
•
比如,基因 product “cytochrome (细胞色素)
c” 用 molecular function term 描述是“ oxidore
ductase activity (氧化还原酶活性)”,而用 bi
ological process term 描述就是“ oxidative pho
sphorylation (氧化磷酸化)”和“ induction of c
ell death” ,
•
最后,它的 celluar component term 是“ mitoch
ondrial matrix (线粒体)”和“ mitochondrial in
ner membrane” (线粒体内部膜)。
•
Ontology 中的 term 有两种相互关系,它
们分别是 is_a 关系和 part_of 关系。
•
is_a 关系是一种简单的包含关系,比如 A i
s_a B 表示 A 是 B 的一个子集。比如 nucl
ear chromosome is_a chromosome 。
•
part_of 关系要稍微复杂一点, C part_of_
D 意味着如果 C 出现,那么它就肯定是 D
的一部分,但 C 不一定总会出现。比如 nu
cleus part_of cell ,核肯定是细胞的一部
分,但有的细胞没有核。
•
Ontology 的结构是一个有向无环图,有点
类似于分类树,不同点在于 Ontology 的结
构中一个 term 可以有不止一个 parent 。
•
比如 biological process term "hexose b
iosynthesis" 有两个 parents ,它们分别
是 "hexose metabolism" 和 "monosacc
haride biosynthesis" ,这是因为生物合
成是代谢的一种,而己糖又是单糖的一种。