genbank-submit
GenBank 是一个由国家生物技术信息中心(NCBI)维护的全球公共核酸序列数据库,科研人员可以在这里存储、检索和分析各种生物序列信息。"genbank-submit" 是一个教程,旨在指导用户如何将序列数据提交到 GenBank。在这个教程中,主要涉及了使用主电子表格、R 语言以及 "tbl2asn" 程序这三个关键步骤。 1. **主电子表格**:在提交序列到 GenBank 之前,通常需要创建一个包含序列信息的电子表格。这个表格通常包括序列的元数据,如序列名称、作者、物种信息、功能注释等。确保所有信息准确无误是至关重要的,因为这些信息会被用于生成正式的序列记录。 2. **R 语言**:R 是一种广泛用于统计计算和图形表示的编程语言,它在生物信息学领域也有广泛应用。在这个教程中,R 可能被用来处理和格式化电子表格数据,使其符合 GenBank 的提交要求。可能涉及到的数据处理步骤包括清洗数据、生成必要的文件格式,以及可能的序列分析。 3. **tbl2asn** 程序:这是 NCBI 提供的一个工具,用于将用户准备的序列信息转换为ASN.1(抽象语法标记1)格式,这是GenBank接受的提交格式。"tbl2asn" 接受用户提供的输入文件,如包含序列和注释的表格文件,然后生成一个包含所有必要信息的ASN.1文件,该文件可以直接提交给GenBank。 在进行提交过程时,以下是一些关键步骤: 1. **准备输入文件**:创建一个包含序列数据和元数据的表格文件,通常命名为 `gbk_template.txt` 或类似名称。 2. **编写或修改GBK模板**:根据NCBI的指南,确保所有的序列特征和注释都已正确填写。 3. **使用R处理数据**:如果需要,使用R来处理数据,例如从其他格式转换,或者自动填充某些信息。 4. **运行tbl2asn**:使用命令行运行 `tbl2asn` 命令,指定输入的表格文件和输出的ASN.1文件。 5. **生成提交文件**:"tbl2asn" 执行后,会生成一个asn.1格式的文件,例如 `submission.asn`。 6. **在线提交**:登录到NCBI的GenBank提交系统,上传asn.1文件,并完成提交过程。 7. **审核与发布**:NCBI的工作人员会审核提交的序列,确认无误后,新的序列将会被添加到GenBank数据库中。 通过这个教程,用户不仅可以学习如何提交序列,还能理解序列提交背后的数据处理和格式要求,这对于生物信息学研究者来说是非常有价值的技能。如果你打算向GenBank提交序列,理解并跟随这个教程将有助于确保过程的顺利进行。
- 1
- 粉丝: 32
- 资源: 4579
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 技术资料分享uCOS-II信号量集很好的技术资料.zip
- 技术资料分享ucOS-II入门教程(任哲)很好的技术资料.zip
- 技术资料分享UCOSII 2.90 ReleaseNotes很好的技术资料.zip
- 技术资料分享Ucos-II-中文注释版很好的技术资料.zip
- 技术资料分享uCGUI的性能与资源占用很好的技术资料.zip
- 技术资料分享uCGUI 简介很好的技术资料.zip
- 技术资料分享TJA1050很好的技术资料.zip
- 技术资料分享TF应用很好的技术资料.zip
- CourseDesign_Graph-数据结构课程设计
- AndroidStudio Demo-android studio计算器