没有合适的资源?快使用搜索试试~ 我知道了~
【格子模型】是生物学和计算化学中用来简化蛋白质结构模拟的一种抽象模型。在这个模型中,蛋白质的结构被表示为二维或三维格子中的自回避行走路径,每个氨基酸占据一个格点,不允许重叠。蛋白质的结构特性主要由疏水性和亲水性决定,因此在格子模型中通常将氨基酸简化为两种类型:疏水氨基酸H和亲水氨基酸P。 【快速序列搜索算法】是针对格子模型中蛋白质构像搜索的一种优化方法,尤其适用于处理HP序列。HP序列是通过将所有20种氨基酸简化为H和P来表示蛋白质序列,其中H代表疏水氨基酸,P代表亲水氨基酸。这个算法利用二分技术将HP序列分解,通过保存分解过程中产生的中间结果,有效减少重复计算,进而大幅降低搜索算法的计算量。 在算法中,蛋白质折叠的能量计算可以通过氨基酸在结构中的埋藏度分布来表示,简化为两个向量的内积取负值。通过这种方法,能量计算被转化为更高效的数学操作。在穷举搜索过程中,算法通过二分技术在每一步之后保存中间结果,形成一棵完全二叉树结构,以此减少后续计算的需要。此外,通过链表连接每层节点,确保在计算能量值时可以顺序进行,避免了搜索中间结果的时间消耗。 这个快速序列搜索算法对于长HP序列的搜索具有显著的加速效果,根据描述,加速因子可以达到2的N次方,极大地提高了蛋白质结构预测的效率。这种方法不仅减少了计算复杂性,而且对于理解和预测蛋白质结构与序列之间的关系提供了有力的工具。 格子模型的快速序列搜索算法是一种高效的蛋白质构像搜索策略,它通过简化氨基酸类型和利用二分技术,实现了对蛋白质结构空间的快速穷举搜索,有助于在大规模计算中降低资源需求,进一步推动了蛋白质结构预测领域的研究和发展。
资源推荐
资源详情
资源评论
格子模型的快速序列搜索算法格子模型的快速序列搜索算法
一种快速序列穷举搜索蛋白质构像空间的算法。该算法利用二分技术将HP序列逐次分解,保存分解过程的中间
结果,使搜索算法中所需的计算量大大减少。
摘摘 要:要: 一种快速序列穷举搜索蛋白质构像空间的算法。该算法利用二分技术将HP序列逐次分解,保存分解过程的中间
结果,使搜索算法中所需的计算量大大减少。
关键词:关键词:
蛋白质是通过共价键将各种氨基酸的基本原子连接在一起的大分子。蛋白质的结构决定了其性能,因此理解蛋白质的结
构和性能的关系至关重要。1973 年Anfinsen通过试验得出蛋白质的氨基酸序列在失性后可自发恢复其天然构像,并通过该试
验得到二个结论:(1)对大部分单域蛋白质而言,编码蛋白质的氨基酸序列就可以决定它的空间构像;(2)蛋白质的天然构像选
择的是能量最低的结构。
基于这一理论,人们提出了用全原子模型来进行蛋白质折叠模拟。该模拟涉及大量原子以及复杂的原子力场模型,所需的
计算量庞大,目前的计算能力无法达到。格子模型是一种极为简化的蛋白质结构模型。在格子模型中,一个蛋白质的结构是由
多个结点组成的连在二维或三维的正方格子空间的自回避行走所得的路径来表示。格子模型必须满足二个限制条件:(1)氨基
酸序列中的共价键不能打断;(2)每个氨基酸占据一个格点,但一个格点不能被两个氨基酸同时占用。
由于组成蛋白质的氨基酸共有20种,所以长为N的蛋白质即有20N种序列,进行序列的穷尽搜索不现实。虽然氨基酸有不
同的理化性质,但最重要的差异在于疏水性能。因此可以把氨基酸分成疏水氨基酸H和亲水氨基酸P二种。这样,格子模型在
结构空间和序列空间都作了最大的简化,同时保留了蛋白质最基本的结构特性。天然蛋白质,特别是球蛋白,采用的都是致密
的结构。所以,利用格子模型进行穷举搜索时,一般只搜索其致密结构。致密结构数与格子模型的格点多少、位置关系以及模
型的维数有关。利用此模型可以对序列空间2N进行完备的描述及穷举化搜索,从而可以对天然蛋白质结构与序列的关系进行
理论分析。很显然,穷举搜索会随着格点和维数的增加使计算量变得非常大。因此,本文构造一种有效的快速结构穷举搜索算
法,大大降低了其计算量。经实验验证,该快速二叉连接树算法对长为N的HP序列的搜索,加速因子可达到2N。
1 快速序列搜索算法快速序列搜索算法
HP序列是由疏水和亲水二种氨基酸组成。很明显,对长为N的HP序列可以用“0”(亲水残基)和“1”(疏水残基)字串表
示:
其中:A表示长为N的序列,ai表示第i个残基的疏水特性值。
HP序列折叠为某一结构的能量可采用氨基酸类型在结构中的埋藏度分布和表示:
其中:si表示结构中第i个残基在格子模型中的埋藏度,如图1所示。结构格点可以分为四类:心点(图中用黑色表示)、面点(图
中用黑灰色表示)、边点(图中用亮灰色表示)和角点(图中用白色表示),分别用四种不同的参数值来表示。为了简化能量计算,
也可将心点和面点归为一类,边点和角点归为一类,用二个参数值表示。对本算法而言,使用何种表示方式对算法的计算量都
不会有影响。通过这种表示,把能量的计算变成了二个向量的内积取负值。其表示公式为:
E=-A·S
在序列的穷尽搜索中包含大量的重复计算,如二个长为32的HP序列00000000111111111111111100000000和
00000000111111110000000011111111。当针对同一结构序列进行计算时,前面16位的计算结果为重复计算。这时,可以把
资源评论
weixin_38639089
- 粉丝: 3
- 资源: 885
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 根据网易云生成lrc,支持双语言.zip
- 实验箱介绍,具体的等我介绍就好,先看了解个大概
- 根据OC版本借贷类型APP、使用swift语言重写一套部分功能简易类型APP.zip
- 新能源汽车+电气规范和测试标准+B级电压系统和零部件+ISO 21498-2-2021
- 极简 go Language ctp 交易引擎.zip
- 本项目是用GO语言实现的网易云信的服务端API封装.zip
- 本项目是三大自然语言处理课程项目,基于seq2seq模型,实现简单的对话机器人效果 .zip
- C#毕业设计-基于ASP.NET的教师公寓管理系统源码.zip
- 本库将会整理我在学习go语言过程中在阅读好文,博客,开源项目代码时遇到的好的易于复用的并发模式代码.zip
- 完全原创,百分百能用 用于下载深度学习医学数据集MedShapeNet的数据集,不依赖openssl,如果你openssl下载不了可以用我这个
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功