琥珀酰化是蛋白质翻译后修饰(PTM)的一种广泛类型,在调节蛋白质构象,功能和理化性质方面起着重要作用。 与劳动密集和费时的实验方法相比,琥珀酰化位点的计算预测由于其方便快捷的速度而非常可取。 当前,已经开发了许多计算模型以通过各种类型的两类机器学习算法来识别PTM站点。 这些方法需要正样本和负样本进行训练。 但是,很难指定PTM的负样本,如果不能正确完成,会极大地影响计算模型的性能。 因此,在这项工作中,我们将正样本仅学习(PSoL)算法首次应用于琥珀酰化位点预测问题,这是一类特殊的半监督机器学习,它使用正样本和未标记样本来训练模型。 同时,我们通过使用多种特征编码方案,提出了一种新颖的琥珀酰位点计算预测子,称为SucPred(琥珀酰位点预测子)。 通过使用SucPred预测变量,在训练数据集上进行5倍交叉验证并在独立测试数据集上进行了5倍交叉验证,其准确性为88.65%,这表明此处介绍的仅用于学习算法的阳性样本特别有用用于鉴定蛋白质琥珀酰化位点。 此外,仅用于正样本的学习算法可以轻松地为其他类型的PTM网站建立预测器。 开发了用于预测琥珀酰化位点的Web服务器,该服务器可从http: ### 使用迭代半监督学习技术准确地计算机识别蛋白琥珀酰化位点 #### 琥珀酰化:蛋白质翻译后修饰的重要类型 琥珀酰化作为蛋白质翻译后修饰(Post-translational modifications, PTMs)的一种广泛类型,在调节蛋白质构象、功能以及理化性质方面发挥着至关重要的作用。它涉及将琥珀酰基(C4H4O4)添加到蛋白质上的特定氨基酸残基,从而改变蛋白质的功能和活性。这一过程在细胞代谢调控、信号转导、基因表达等生命过程中扮演着重要角色。 #### 实验方法与计算预测的比较 传统的实验方法虽然能够准确地确定蛋白质琥珀酰化位点,但这些方法往往耗时且劳动密集度高。相比之下,基于计算的方法不仅速度更快,而且成本更低。近年来,随着生物信息学的发展,许多计算模型被开发出来,用于通过不同类型的二类机器学习算法来识别PTM位点。 #### 半监督学习:解决负样本指定难题 这些现有的计算模型通常需要正样本和负样本来进行训练。然而,在实际应用中,指定PTM的负样本是一项极具挑战性的任务。如果不正确处理,可能会严重影响计算模型的性能。为了解决这一问题,本研究首次将正样本仅学习(Positive Samples Only Learning, PSoL)算法应用于琥珀酰化位点的预测问题中。这是一种特殊的半监督机器学习方法,仅使用正样本和未标记样本来训练模型。 #### 特征编码的重要性 为了提高预测的准确性,研究人员还采用了多种特征编码方案。特征编码是机器学习中的一个关键步骤,它将原始数据转换为可用于训练机器学习模型的形式。在本研究中,提出的琥珀酰位点计算预测器(SucPred)利用了这些不同的特征编码方案,包括但不限于氨基酸组成、位置特异性得分矩阵(Position Specific Scoring Matrix, PSSM)、氨基酸物理化学属性等。 #### 实验结果与评估 通过使用SucPred预测变量,在训练数据集上进行5倍交叉验证,并在独立测试数据集上进行了5倍交叉验证,得到了令人鼓舞的结果。预测的准确性达到了88.65%,这表明此处介绍的仅用于学习算法的阳性样本对于鉴定蛋白质琥珀酰化位点特别有用。此外,这种方法还可以轻松地应用于其他类型的PTM位点预测问题。 #### 应用前景 这项研究不仅提高了琥珀酰化位点预测的准确性,而且还提供了一种新的半监督学习框架,可以应用于其他类型的PTM位点预测问题。这种技术的发展对于深入理解蛋白质功能及其在疾病发展中的作用具有重要意义。此外,研究团队还开发了一个用于预测琥珀酰化位点的Web服务器,使得该技术更加易于访问和使用。 本研究通过结合迭代半监督学习技术和多种特征编码方案,成功地提高了蛋白质琥珀酰化位点预测的准确性。这一成果不仅为生物医学研究提供了有力工具,也为未来蛋白质组学的研究开辟了新的方向。
![pdf](https://img-home.csdnimg.cn/images/20210720083646.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![application/pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![7z](https://img-home.csdnimg.cn/images/20210720083312.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rplib](https://img-home.csdnimg.cn/images/20210720083646.png)
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/default.jpg!1)
- 粉丝: 6
- 资源: 907
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
最新资源
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)