GEO 数据库使用 PPT 课件
GEO(Gene Expression Omnibus)是一种公共的基因表达数据仓库,由美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)维护。它提供了一个平台,允许研究人员共享、存储和检索基因表达数据。GEO 数据库中包含了大量的基因表达数据,包括微阵列、RNA-seq、ChIP-seq 等数据类型。
GEO 数据库的主要组件包括:
* GSM(Sample):样本信息,包括样本的描述、处理方法和实验设计等信息。
* GLP(Platform):检测平台信息,包括检测平台的描述、检测方法和检测结果等信息。
* GSE(Series):基因表达数据结果,包括基因表达 profiles、微阵列检测结果和 RNA-seq 数据等信息。
在 GEO 数据库中,研究人员可以根据需要下载相应的数据,并对其进行分析和研究。例如,要分析某个基因的表达差异,可以下载该基因对应的基因芯片号,然后在 GEO 数据库中搜索该基因对应的所有样本的荧光信号值,即基因表达值。
GEO 数据库的使用可以分为以下几个步骤:
1. 确定要分析的基因,列出该基因 mRNA 的 NCBI 标记号。
2. 在下载的 GEO 数据库 family.soft 表中搜索该基因的标记号,确定该基因对应的基因芯片号。
3. 用该基因芯片号在 GEO 数据库 series_matix 表中搜索该芯片号对应的所有样本的荧光信号值,即基因表达值。
4. 分析不同样本中该基因的表达差异。
5. 根据样本数据确定该基因的高表达组和低表达组,进行相应的数据分析。
6. 进行多个基因的表达相关性分析。
GEO 数据库的使用可以帮助研究人员快速获取大量的基因表达数据,并对其进行分析和研究,为基因表达研究和生物信息学研究提供了强大的支持。