PDB数据格式详解-201810161

preview
需积分: 0 0 下载量 153 浏览量 更新于2022-08-03 收藏 877KB PDF 举报
PDB(Protein Data Bank)数据格式是一种标准的文件格式,用于存储蛋白质、核酸以及其他生物大分子的三维结构信息。这种格式由RCSB(Research Collaboratory for Structural Bioinformatics)维护,是科研人员进行结构生物学研究的重要工具。下面将详细解释PDB文件中的主要记录类型及其内容。 1. **标题部分**: - **HEADER**:记录分子的类别、发布日期和ID号,用于标识结构的基本信息。 - **OBSLTE**:当旧的ID号被新的ID号取代时,此记录会注明旧ID已被废弃。 - **TITLE**:提供实验方法的简要说明,帮助理解数据是如何获取的。 - **CAVEAT**:可能会包含对数据错误或不足的警告。 - **COMPND**:描述化合物的分子组成,包括其成分和修饰。 - **SOURCE**:说明化合物的来源,如生物体或人工合成。 - **KEYWDS**:关键词用于搜索和分类结构。 - **EXPDTA**:记录实验技术,如X射线晶体学或核磁共振。 - **AUTHOR**:列出结构的测定者。 - **REVDAT**:修订日期及相关细节,记录结构数据的更新。 - **SPRSDE**:关于已撤销或更改记录的信息。 - **JRNL**:记录结构发表的期刊详情。 - **REMARK**:提供额外的注释和信息,如文献引用、结构参数等。 2. **一级结构**: - **DBREF**:链接到其他序列数据库的记录。 - **SEQADV**:PDB与其他记录的比较。 - **SEQRES**:列出分子的氨基酸或核苷酸序列。 - **MODRES**:描述对标准残基的修改或替代。 3. **杂因子**: - **HET**:非标准残基的标识。 - **HETATM**:非标准残基的原子信息。 - **HETSYN**:非标准残基的别名。 - **FORMUL**:非标准残基的化学式。 4. **二级结构**: - **HELIX**:定义螺旋的位置、类型和长度。 - **SHEET**:描述片层结构,包括片层的方向和连接。 - **TURN**:记录转角结构。 5. **连接注释**: - **SSBOND**:记录二硫键的连接。 - **LINK**:表示残基间的化学键。 - **HYDBND**:氢键信息。 - **SLTBRG**:盐桥。 - **CISPEP**:顺式连接的氨基酸。 6. **晶胞特征及坐标变换**: - **CRYST1**:提供晶体结构参数,如晶胞尺寸和空间群。 - **ORIGXn**:直角PDB坐标系统的原点。 - **SCALEn**:描述如何将直角坐标转换为晶体分数坐标。 - **MTRIXn**:非晶体对称操作矩阵。 - **TVECT**:平移向量。 7. **坐标部分**: - **MODEL**:在多模型文件中标识不同的结构模型。 - **ATOM**:描述标准残基的原子坐标、占有率和温度因子。 - **SIGATM**:原子坐标的标准偏差。 - **ANISOU**:各向异性热运动信息。 - **SIGUIJ**:由各种温度因素导致的坐标标准差。 - **TER**:标记残基链的结束。 PDB文件格式的详细信息有助于研究人员理解和处理结构数据,它不仅包含了分子的几何信息,还包括了实验方法、作者信息和潜在的结构问题。对于分析和模拟生物大分子结构的研究工作,掌握PDB文件格式至关重要。