第 33卷 第 11期 控 制 与 决 策 Vol.33 No.11
2018年 11月 Control and Decision Nov. 2018
文章编号: 1001-0920(2018)11-1990-07 DOI: 10.13195/j.kzyjc.2017.0788
基于多策略人工蜂群的多序列比对算法
匡芳君
1,2†
, 张思扬
1
, 刘传才
2
(1. 温州商学院 信息工程学院,浙江 温州 325035;2. 南京理工大学 计算机科学与工程学院,南京 210094)
摘 要: 多序列比对是生物信息学中最重要和最具挑战性的任务之一. 基于多序列比对是NP 完全组合优化问题,
引入Tent 混沌初始化种群策略、不同蜂种的邻域搜索策略和锦标赛选择策略等,提出一种基于多策略人工蜂群的
多序列比对算法. 该算法应用 Tent混沌初始化种群策略以使初始个体多样化并获取较好初始解; 针对不同蜂种的
特性设计不同的邻域搜索策略以平衡算法的全局探索和局部开发能力. 同时引入序列比对的蜜源编码方法以适
应多序列比对的离散性. 实验结果表明,所提出算法的鲁棒性较强,能获取较好的比对性能和生物特性.
关键词: 人工蜂群算法;多策略;Tent混沌初始化;邻域搜索;多序列比对
中图分类号: TP18 文献标志码: A
Multiple sequence alignment algorithm based on multi-strategy artificial
bee colony
KUANG Fang-jun
1,2†
, ZHANG Si-yang
1
, LIU Chuan-cai
2
(1. School of Information Engineering,Wenzhou Business College,Wenzhou 325035,China;2. School of Computer
Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094,China)
Abstract: Multiple sequence alignment(MSA), known as NP-complete combinatorial optimization problem, is one of
the most important and challenging tasks in bioinformatics. A multi-strategy artificial bee colony(MS-ABC) algorithm is
proposed for MSA, which is composed of multiple strategies, such as the Tent chaotic initialization population strategy,
different neighborhood search strategies and tournament selection strategy. In the MSA-ABC algorithm, the Tent chaotic
initialization population strategy is presented to diversify the initial individuals and to obtain good initial solutions. Then,
the different neighborhood search strategies for different bee species are designed to balance the global exploration and the
local exploitation. Moreover, the food source encoding method is used to adapt discreteness of MSA. The experimental
results demonstrate that the proposed algorithm is more robust and can obtain better alignment quality and biological
characteristics.
Keywords: artificial bee colony;multi-strategy;Tent chaotic initialization;neighborhood search;multiple sequence
alignment
0 引 言
多序列比对 (Multiple sequence alignment, MSA)
是生物信息学研究的热点之一,通过多序列比对可以
挖掘生物序列中的结构、进化和功能等信息, MSA也
是一个 NP完全组合优化难题
[1]
. 自然启发式算法作
为一类适用于求解 NP难题的优化算法,具有精度高、
对度量标准不敏感等优势, 吸引着大量研究人员,其
研究成果颇丰. 如 Gupta等
[2]
提出了一种基于遗传算
法的多序列比对方法 (MSA-GA); Gao
[3]
提出了一种
基于惯性权重粒子群优化算法 (MS-PSO); Tsvetanov
等
[4]
提出了一种基于改进蚁群算法的多序列比对方
法 (MS-ACO); Öztürk等
[5]
提出了一种新的人工蜂群
算法的多序列比对方法(ABC-Aligner); Zhu等
[6]
提出
了一种基于分解的多目标进化算法 (MOMSA) 以解
决多序列比对问题, 初始种群通过使用空位插入操
作生成,进化操作利用遗传操作的交叉和变异算子实
现; Liu等
[7]
提出了一种基于隐马尔可夫模型和后验
概率分配函数的多序列比对算法 (MSAProbs); Rani
等
[8]
提出了基于遗传和人工蜂群的混合算法 (GA-
ABC) 和多目标细菌觅食优化算法 (MO-BFO), 并应
收稿日期: 2017-06-20;修回日期: 2017-08-22.
基金项目: 国家自然科学基金项目(61373063, 61233011, 61402227).
责任编委: 巩敦卫.
作者简介: 匡芳君 (1976−), 女, 教授, 博士, 从事群智能与多目标优化、模式识别、生物信息学及其应用等研究;刘
传才 (1963−), 男, 教授, 博士生导师, 从事智能计算、计算机视觉、图像处理及应用等研究.
†
通讯作者. E-mail: kfjztb@126.com